Função Excel CORREL - Calcular correlação estatística

Baixar exemplo de pasta de trabalho

Baixe a apostila de exemplo

Este tutorial demonstra como usar o Função Excel CORREL no Excel para calcular a correlação.

Visão geral da função CORREL

A função CORREL Calcula a correlação de duas séries de números.

Para usar a função de planilha do Excel CORREL, selecione uma célula e digite:

(Observe como as entradas da fórmula aparecem)

Sintaxe da função CORREL e entradas:

1 = CORREL (matriz1, matriz2)

array1 - Matrizes de números.

O que é a função CORREL?

A função CORREL do Excel retorna o coeficiente de correlação (Pearson’s r) de dois intervalos de dados.

Qual é o coeficiente de correlação?

O coeficiente de correlação, geralmente conhecido como Pearson’s r (em homenagem a Karl Pearson, a pessoa que o desenvolveu), é uma estatística que mostra a intensidade com que duas variáveis ​​estão relacionadas.

Pearson's r é um valor entre -1 e 1, o que pode levar a três interpretações possíveis: uma correlação positiva, uma correlação negativa e nenhuma correlação.

Correlação positiva

Uma correlação positiva (r > 0) significa que quando as duas variáveis ​​estão em tandem - quando você observa uma pontuação alta em uma variável, tende a também observar uma pontuação alta na outra. Da mesma forma, quando uma variável é baixa, a outra tende a ser baixa também.

Por exemplo, altura e peso têm uma correlação positiva. Veja o gráfico abaixo, que mostra a altura e o peso de uma pequena amostra de jogadores de beisebol:

o r desta pequena amostra é 0,73 - uma correlação positiva muito forte. Isso faz sentido logicamente - pessoas mais altas tendem a ser mais pesadas, em média, uma vez que essa altura extra é composta de ossos e músculos e outros tecidos que pesam algo.

Mas a correlação não é perfeita (em uma correlação perfeita com um r de 1, todas as pontuações cairiam na linha de tendência). Algumas pessoas mais baixas podem ser mais pesadas - talvez carreguem um pouco de gordura a mais ou façam exercícios na academia. Da mesma forma, algumas pessoas altas podem ser muito magras e, na verdade, pesar menos do que muitas pessoas mais baixas.

A correlação aqui é provavelmente tão alta porque estamos lidando com atletas que seria menor na população geral. Lembre-se de manter isso em mente ao usar CORREL - o r você obtém não é definitivo - você precisa pensar sobre quais são seus dados e como você os obteve ao fazer suas interpretações.

Correlação negativa

Uma correlação negativa (r <0) significa que quando você observa uma pontuação alta em uma variável, tende a observar uma pontuação baixa na outra variável e vice-versa.

Por exemplo, as pontuações dos alunos nos testes e o número de faltas que eles tiveram na escola estão negativamente correlacionados. Ou seja, quanto mais dias perdem, menor a tendência de sua pontuação. Quanto menos dias eles perdem, mais altas as pontuações tendem a ser:

Novamente, a correlação não é perfeita (como quase nunca é). Temos um aluno aqui que faltou 5 dias, mas ainda assim conseguiu marcar 85%. Também temos um que pontuou 52%, apesar de ter falhado apenas dois dias.

Ainda temos uma tendência negativa clara. Mas ainda há muita variação nos resultados do teste que não pode ser explicada apenas pela ausência. Isso pode ser devido a outras variáveis, como aptidão, motivação, saúde e muitos outros fatores potenciais.

Portanto, ao usar CORREL, lembre-se de que há uma visão mais ampla que seus dados podem não explicar totalmente.

Nenhuma correlação

Nenhuma correlação (r = 0 ou está próximo de 0) significa que você não pode prever a pontuação de uma variável com base em outra. Se você plotar os dados, não verá nenhuma tendência perceptível e a linha de tendência será plana ou quase plana.

Aqui estão alguns dados sobre o comprimento do dedo anelar e IQ:

Como você pode ver, não há conexão entre essas duas variáveis ​​neste exemplo, então podemos supor que elas não estão relacionadas.

Na prática, é improvável que você obtenha um r de exatamente 0. Lembre-se de que, ao coletar dados, geralmente há alguma variação devido a erro, talvez na medição ou no relatório. Então, só porque o seu r não é exatamente 0, não significa que você encontrou algo.

Correlação não é causa

É crucial ter em mente que CORREL não pode dizer qual variável está influenciando a outra - ou mesmo se existe alguma relação causal entre as variáveis. Por exemplo, foi encontrada uma correlação entre as seguintes variáveis:

  • A quantidade de sorvete vendido e a quantidade de crimes violentos
  • Quão feliz você é e quão bem sucedido você é em sua carreira
  • O número de pessoas que se afogaram em uma piscina e o número de filmes em que Nicolas Cage apareceu por ano

O primeiro exemplo é o problema da terceira variável. Claro, sorvete não torna as pessoas violentas, nem o envolvimento em violência desencadeia um desejo por leite congelado e açúcar. A terceira variável é o clima. Em clima quente, as pessoas simplesmente saem mais - há mais contato entre as pessoas e, portanto, mais chance de um conflito se formando. No calor, as pessoas também compram mais sorvete. Portanto, as vendas de sorvete e o crime violento só se correlacionam porque estão ambos ligados a uma terceira variável.

O segundo poderia ser um exemplo de causalidade dupla. Ter sucesso no trabalho pode ser bom para sua felicidade - você ganhará mais dinheiro e geralmente terá mais controle sobre o trabalho que faz e com quem o faz. Mas a felicidade pode ser benéfica para o sucesso também, talvez seja mais fácil conviver com pessoas mais felizes e desenvolver relacionamentos de trabalho mais fortes, ou talvez sejam mais resistentes mentalmente a contratempos. Nesse caso, as duas variáveis ​​estão influenciando uma à outra.

O terceiro é simplesmente um correlação espúria. Só porque duas variáveis ​​se correlacionam em seus dados, não significa que elas interagem de alguma forma na vida real.

O resultado final é que uma correlação não pode dizer se duas variáveis ​​estão causalmente conectadas.

Como usar CORREL

Use a função CORREL do Excel como esta:

1 = CORREL (B3: B15, C3: C15)

Com CORREL, você define dois argumentos - os dois intervalos de dados que deseja correlacionar.

Aqui estão alguns pontos-chave para manter em mente com CORREL:

  • Células de texto, booleanas (TRUE / FALSE) e vazias são ignoradas.
  • Ambos os intervalos de dados devem ter um número igual de pontos de dados, caso contrário, você receberá um erro # N / A
  • Se um dos intervalos de dados estiver vazio, ou se não houver nenhuma variação nos dados (ou seja, se todos os pontos de dados forem o mesmo número), você receberá um # DIV / 0! Erro

Função CORREL no Planilhas Google

A função CORREL funciona exatamente da mesma forma no Planilhas Google e no Excel:

Notas Adicionais

Exemplos CORREL em VBA

Você também pode usar a função CORREL no VBA. Modelo:
application.worksheetfunction.correl (matriz1, matriz2)
Para os argumentos da função (array1, etc.), você pode inseri-los diretamente na função ou definir as variáveis ​​a serem usadas.

Voltar para a lista de todas as funções no Excel

Você vai ajudar o desenvolvimento do site, compartilhando a página com seus amigos

wave wave wave wave wave