📄 Definições de Estatística
📄 Coleta de dados
📄 População e amostra
📄 Amostragem
📄 Amostra não probabilística
📄 Amostra probabilística
📄 Dimensionamento da amostra
📄 Tipos de dados
📄 Tipos de variáveis escalares
📄 Distribuição de frequências
📄 Regras para a distribuição de frequências
📄 Medidas de tendência central
📄 Variabilidade
📄 Teste de hipótese
📄 Estatística não paramétrica
📄 Teste do qui quadrado
📄 Teste do qui quadrado para duas amostras
📄 Teste T para duas amostras não relacionadas
📄 Análise de variância
📄 Regressão simples (RLS)
📄 Regressão linear múltipla (RLM)
📄 Exercícios e bibliografia
Regressão simples (RLS)
Em inúmeras problemáticas, o pesquisador depara-se com duas varáveis que proporcionam previsão de comportamentos futuros.
Esta previsão pode ser alcançada através de um estudo que envolve a equação da reta de regressão, concebida através das variáveis critério (y, dependente ou de resposta) e a independente (x, também conhecida como prognóstico).
Trata-se de uma realidade comum no universo da pesquisa, envolvendo variáveis como renda, idade, gastos, entre muitas outras.
Equação da reta
Y = a1 + a2.x
Onde, y é a variável dependente e x a independente.
a1 é o valore de y para x e a2.é valor médio de y por unidade x.
A relação linear entre as duas variáveis é medida pelo coeficiente de correlação (R).
R varia de –1 a 1, onde 1 é a correlação perfeita e o oposto indica forte correlação negativa. Valores próximos de zero indicam fraca correlação.
No exemplo abaixo, se existisse um R elevado poderia-se prever y para eventos futuros.
Y |
X |
Gastos com combustível |
Km rodados |
Renda Pessoal |
Anos de estudo |
Números de defeitos de peças |
Horas de treinamentos em qualidade |
O cálculo de R é uma operação bastante simples para softwares com funções estatísticas, sendo desnecessário o aprofundamento dos procedimentos de calculo.
Neste tipo de análise é importante determinar o quanto a linha de regressão representa os dados. Neste caso, se faz necessário calcular o R2 de Pearson ou coeficiente de determinação.
Um R2 igual a 0,80, tem-se que 80% da variabilidade decorre de x. Inversamente, pode-se dizer que 20% da variância de Y não é atribuível às diferenças em x.
Para obter-se o teste de hipótese, formula-se H0 e H1 da seguinte forma:
H0 :p = 0
H1: p ≠ 0
O cálculo de t é realizado através da formula,
Sendo t calculado maior do que t tabelado, rejeita-se a hipótese nula.
Exemplo
Um motorista deseja prever seus gastos com seu automóvel em função dos quilômetros que roda por mês.
QUILÔMETROS |
GASTOS (R$) |
3203 |
400 |
3203 |
400 |
2603 |
340 |
3105 |
400 |
1305 |
150 |
804 |
100 |
1604 |
200 |
2706 |
300 |
805 |
100 |
1903 |
200 |
3203 |
400 |
3702 |
450 |
3203 |
400 |
3203 |
400 |
803 |
100 |
803 |
100 |
1102 |
130 |
3202 |
400 |
1604 |
150 |
1603 |
200 |
3203 |
400 |
3702 |
450 |
3403 |
440 |
Estatística de regressão |
|
R múltiplo |
0,993064678 |
R-Quadrado |
0,986177454 |
R-quadrado ajustado |
0,985519237 |
Erro padrão |
127,508336 |
Observações |
23 |
Observando a tabela acima, percebe-se uma forte correlação entre as variáveis, onde R está muito próximo de 1.
Quilômetros rodados explica 98% da variância de gastos.