Sondagens e Estudos de Opinião

Início » Estatística » Correlação

Correlação

*

Um dos objectivos mais frequentes nos estudos de opinião é o de saber se duas ou mais variáveis estão relacionadas entre si, ou seja, se quando uma se modifica a outra também se altera.

Quando analisamos duas séries de dados (por exemplo, as notas das disciplinas A e B), dispomos de várias medidas estatísticas que podem ser usadas para verificar como é que essas duas séries se relacionam entre si. Quando o nosso objetivo não é estabelecer uma relação de causalidade (ou seja, saber se as variações numa variável resultam das variações na outra) as medidas mais utilizadas são a covariância, a correlação e a regressão.

Para duas séries de dados – notas da disciplina A (A1, A2,…) e notas da disciplina B (B1, B2,…) – , a covariância fornece uma medida não padronizada do grau em que elas se movem juntas, ou seja, quando uma varia num sentido a outra varia também no mesmo sentido ou em sentido oposto.

O sinal na covariância indica o tipo de relação que as duas variáveis têm. Um sinal positivo indica que elas se movem na mesma direcção (por exemplo, quando a nota da disciplina A é mais alta a da disciplina B também é) e um sinal negativo indica que elas se movem em direcções opostas (por exemplo, quando a nota de A é mais alta a de B é mais baixa).

Embora o valor da covariância cresça com o poder do relacionamento entre as variáveis (quanto maior o valor da covariância mais forte é a relação entre as variáveis), é relativamente difícil fazer julgamentos sobre o poder do relacionamento entre as duas variáveis observando apenas a covariância, pois ela não é uma medida padronizada.

É aqui que entra a correlação, que é uma medida padronizada da relação entre duas variáveis e é calculada a partir da covariância.

[Nota: A padronização é uma operação que transforma os dados de modo a torná-los comparáveis independentemente da sua natureza. No caso da correlação a padronização dos dados é feita subtraindo a cada valor a média do grupo e dividindo o resultado pelo desvio padrão (Ao valor obtido – dados padronizados -, chama-se  Z-score). Aquilo que o Z-score mede é a distância, em unidades de desvio padrão, a que o valor X está da média]

O valor de uma correlação pode variar entre 1 e -1 (esta é a vantagem da padronização dos dados. Quaisquer que sejam os valores das nossas variáveis a medida da correlação será sempre situada entre -1 e 1). Um valor de correlação próximo de zero indica que as duas variáveis não estão relacionadas. Uma correlação positiva indica que as duas variáveis se movem na mesma direcção (se uma aumenta a outra também aumenta e se uma diminui a outra também diminui), e a relação é forte quanto mais a correlação se aproxima do valor 1. Uma correlação negativa indica que as duas variáveis movem-se em direcções opostas (se uma aumenta a outra diminui e vice versa), e que a relação também é mais forte quanto mais próxima for de -1.

Vejamos agora como é que se calcula a correlação entre duas variáveis. No quadro abaixo apresentam-se as notas obtidas por 20 estudantes nas disciplinas A e B:

A primeira operação consiste em padronizar as notas obtidas pelos estudantes nas duas disciplinas. A padronização destes valores faz-se subtraindo a cada uma das notas (A1, A2, A3 …  e B1, B2, B3…) a média dessa disciplina e dividindo depois o resultado pelo respectivo desvio padrão.

Para obter o valor da correlação, multiplicam-se a notas padronizadas de cada sujeito nas duas disciplinas e somam-se estes valores, dividindo o resultado por n-1 (19). O valor obtido é o valor da correlação (r).

O valor da correlação (r) entre as notas das disciplinas A e B é de .103.

Para Cohen (1988), os valores de correlação situados entre 0,10 e 0,29 indicam uma correlação inexistente ou pequena; valores entre 0,30 e 0,49 indicam que existe uma correlação média e valores entre 0,50 e 1 podem ser interpretados como sinais de grande correlação. Dancey e Reidy (2005) apontam para uma classificação ligeiramente diferente: r = 0,10 até 0,30 (fraco); r = 0,40 até 0,6 (moderado); r = 0,70 até 1 (forte).

Para interpretar uma correlação é importante fazer uma observação da representação gráfica da relação entre as variáveis. Na figura abaixo apresenta-se um exemplo, criado por Francis Ascombe, de 4 situações em que o valor da média, do desvio padrão e da correlação é o mesmo (M= 7.5; DP = 4.12 e r=.816) mas em que a distribuição das variáveis é muito diferente. A situação representada na parte superior esquerda, corresponde ao que seria de esperar nos casos em que duas variável se correlacionam e se verificam as premissa de uma distribuição normal. Na situação representada do lado direito da parte superior, existe uma relação entre as duas variáveis mas não se verifica o pressuposto de linearidade (neste tipo de situações não deve ser utilizado o coeficiente de correlação de Pearson (r)). No exemplo apresentado na parte inferior esquerda existe uma correlação que só não é perfeita (isto é, de valor igual a 1) porque está a ser afectada por um valor extremo (outlier). No último caso vemos que embora não haja relação linear entre as variáveis,  um valor extremo (outlier) influencia de tal maneira o cálculo do coeficiente de correlação que este obtém um valor que indica a existência de correlação.

No caso do nosso exemplo relativo à correlação da notas das disciplinas A e B (r=.103) o gráfico obtido é o seguinte:

No SPSS  o coeficiente de correlação é obtido da seguinte forma:

A utilização destas medidas pressupõe que se verifiquem algumas condições prévias:

1- As variáveis devem ser quantitativas (contínuas ou discretas). Não é possível utilizar estes tipo de medida com variáveis para as quais não se possa calcular o desvio padrão (variáveis categoriais ou nominais);

2- Os dados devem estar distribuídos de acordo com a distribuição normal (Cf. Estatística Descritiva);

3- As observações devem ser independentes, ou seja, a ocorrência do valor X1 não deve afectar a probabilidade de ocorrência do valor X2.

4- Não existam outliers (valores extremos atípicos).


Deixe uma Resposta

Preencha os seus detalhes abaixo ou clique num ícone para iniciar sessão:

Logótipo da WordPress.com

Está a comentar usando a sua conta WordPress.com Terminar Sessão / Alterar )

Imagem do Twitter

Está a comentar usando a sua conta Twitter Terminar Sessão / Alterar )

Facebook photo

Está a comentar usando a sua conta Facebook Terminar Sessão / Alterar )

Google+ photo

Está a comentar usando a sua conta Google+ Terminar Sessão / Alterar )

Connecting to %s

Blog Stats

  • 384,462 hits
%d bloggers like this: