📄 Definições de Estatística
📄 Coleta de dados
📄 População e amostra
📄 Amostragem
📄 Amostra não probabilística
📄 Amostra probabilística
📄 Dimensionamento da amostra
📄 Tipos de dados
📄 Tipos de variáveis escalares
📄 Distribuição de frequências
📄 Regras para a distribuição de frequências
📄 Medidas de tendência central
📄 Variabilidade
📄 Teste de hipótese
📄 Estatística não paramétrica
📄 Teste do qui quadrado
📄 Teste do qui quadrado para duas amostras
📄 Teste T para duas amostras não relacionadas
📄 Análise de variância
📄 Regressão simples (RLS)
📄 Regressão linear múltipla (RLM)
📄 Exercícios e bibliografia
Teste do qui quadrado para independência (duas amostras)
A utilização do presente teste em pesquisa visa verificar se as distribuições de duas ou mais amostras não relacionadas diferem significativamente em relação à determinada variável.
Condições para a execução do teste
Exclusivamente para variáveis nominais e ordinais;
Preferencialmente para amostras grandes, <30;
Observações independentes;
Não se aplica se 20% das observações forem inferiores a 5
Não pode haver frequências inferiores a 1;
Nos dois últimos casos, se houver incidências desta ordem, aconselha-se agrupar os dados segundo um critério em específico.
Procedimento para a execução do teste
Determinar H0. As variáveis são independentes, ou as variáveis não estão associadas;
Estabelecer o nível de significância (µ );
Determinar a região de rejeição de H0. Determinar o valor dos graus de liberdade (φ), sendo φ = (L – 1) (C – 1), onde L = números de linhas da tabela e C = ao número de colunas.. Encontrar portanto, o valor do Qui-quadrado tabelado;
Calcular o Qui Quadrado, através da fórmula:
Para encontrar o valor esperado (E), utilizar a fórmula a seguir:
Sendo o Qui Quadrado calculado, maior do que o tabelado, rejeita-se H0 em prol de H1.
Há dependência ou as variáveis não estão associadas.
Exemplo
Um pesquisador deseja identificar se há dependência no consumo de seus chocolates e as cidades de sua região.
|
Cidades do Vale do Taquari |
|
|||
Sabor do chocolate |
Lajeado |
Santa Cruz |
Estrela |
Taquari |
∑ |
Chocolate com caju |
60 |
30 |
20 |
40 |
150 |
Chocolate com amendoim |
45 |
35 |
20 |
10 |
110 |
Chocolate com flocos |
55 |
25 |
47 |
13 |
140 |
Chocolate com passas |
70 |
35 |
25 |
20 |
150 |
∑ |
230 |
125 |
112 |
83 |
550 |
H0: A preferência pelos sabores independe da cidade
H1: A preferência pelos sabores depende da cidade.
µ = 0,05
φ = (4 – 1) (3 – 1) = 6, onde Qui quadrado tabelado é igual a 12,6.
Calculo dos valores esperados (E). |
Cidades do Vale do Taquari |
|||
Sabor do chocolate |
Lajeado |
Santa Cruz |
Estrela |
Taquari |
Chocolate com caju |
62,7 |
34,1 |
30,5 |
22,6 |
Chocolate com amendoim |
46,0 |
25,0 |
22,4 |
16,6 |
Chocolate com flocos |
58,5 |
31,8 |
28,5 |
21,1 |
Chocolate com passas |
62,7 |
34,1 |
30,5 |
22,6 |
Χ2 = (60 – 62,7)2/62,7 + [(30 – 34,1) 2/34,1 ...[(20 – 22,6) 2/22,6 =
0,11+0,49+3,61+13,39+0,02+4+0,25+2,62+0,21+1,45+12+3,11+0,85+0,32+0,99+0,29 = 43,72
Conclui-se que o Qui quadrado calculado (43,72) é maior do que o tabelado (12,6), rejeita-se H0 em prol de H1.
Portanto há diferença significativa, ao nível de 0,05, para as cidades.Coeficiente de contingência (CC)
O CC é um indicador do grau de associação entre duas variáveis analisadas pelo Qui quadrado.
Quanto mais próximo de 1, melhor o coeficiente de contingência, que varia de 0 a 1.
No exemplo dado acima o coeficiente seria 0,3442.