Metodologia Quantitativa Avançada: SEM, Análise Fatorial e Regressão Múltipla na Dissertação
A metodologia quantitativa em dissertações de mestrado e teses de doutoramento vai muito além de calcular médias e percentagens. Júris de dissertações em universidades portuguesas esperam, cada vez mais, que os estudantes dominem técnicas como a análise fatorial confirmatória, a regressão múltipla com moderação/mediação e, em contextos mais avançados, os Modelos de Equações Estruturais (SEM). Este artigo apresenta estas técnicas avançadas com aplicação prática, incluindo os pressupostos a verificar, os outputs relevantes do SPSS e do R, e como reportar os resultados segundo as normas APA.
Se ainda está a definir a sua abordagem metodológica, leia primeiro o nosso artigo sobre metodologia quantitativa na dissertação. Este artigo destina-se a estudantes que já escolheram a abordagem quantitativa e querem aprofundar técnicas específicas.
Regressão múltipla: pressupostos e interpretação
A regressão linear múltipla é a técnica quantitativa mais usada em dissertações nas áreas de gestão, psicologia, ciências da saúde e ciências sociais. Permite analisar a relação entre uma variável dependente contínua e duas ou mais variáveis independentes.
Pressupostos obrigatórios
Antes de executar a regressão, verifique obrigatoriamente:
| Pressuposto | Como Verificar (SPSS) | Critério de Aceitação |
|---|---|---|
| Linearidade | Scatterplot Y vs. Ŷ | Distribuição aleatória em torno de 0 |
| Normalidade dos resíduos | Kolmogorov-Smirnov, P-P plot | p > .05 ou N > 30 (TLC) |
| Homocedasticidade | Scatterplot resíduos vs. valores ajustados | Sem padrão de funil |
| Ausência de multicolinearidade | VIF (Variance Inflation Factor) | VIF < 5 (conservador: < 3) |
| Independência dos resíduos | Durbin-Watson | Entre 1,5 e 2,5 |
Como reportar a regressão em APA
Exemplo de texto para a dissertação: “A regressão múltipla hierárquica revelou que as variáveis preditoras explicaram uma proporção significativa da variância na satisfação no trabalho, F(3, 246) = 28,74, p < .001, R² = .26. O compromisso organizacional foi o preditor mais forte (β = .41, p < .001), seguido do suporte do supervisor (β = .22, p = .003).”
Sempre reporte: F, graus de liberdade, p, R², e β (coeficientes padronizados) para cada preditor.
Moderação e mediação (Process SPSS)
A análise de moderação e mediação é cada vez mais exigida em dissertações nas áreas de gestão e psicologia. O macro PROCESS (Andrew Hayes), instalável no SPSS, é a ferramenta de referência.
Moderação (variável moderadora)
A moderação analisa quando ou para quem uma relação é mais forte. Exemplo: “O género modera a relação entre o stress e o burnout?” No PROCESS, use o Modelo 1. O moderador é significativo se o coeficiente de interação (X × M) for significativo.
Mediação (variável mediadora)
A mediação analisa como ou por que razão uma variável causa outra — identificando o mecanismo. Exemplo: “O compromisso organizacional medeia a relação entre a liderança transformacional e o desempenho?” No PROCESS, use o Modelo 4. O efeito indireto é significativo se o intervalo de confiança bootstrap (geralmente 10.000 amostras) não incluir zero.
Análise Fatorial: exploratória vs. confirmatória
Análise Fatorial Exploratória (AFE)
A AFE é usada quando o investigador não tem hipóteses sobre a estrutura fatorial de um instrumento. É comum em dissertações que desenvolvem ou adaptam escalas de medida. No SPSS: Analyze → Dimension Reduction → Factor.
Critérios de extração de fatores: regra de Kaiser (eigenvalues > 1), scree plot, variância explicada total ≥ 50 %. Rotação oblíqua (Promax ou Direct Oblimin) quando os fatores se correlacionam; rotação ortogonal (Varimax) quando são independentes.
Análise Fatorial Confirmatória (AFC)
A AFC testa se uma estrutura fatorial hipotética (definida previamente na literatura) se ajusta adequadamente aos dados. Requer software de SEM: AMOS (integrado com SPSS), R lavaan, ou Mplus.
Índices de ajustamento a reportar:
| Índice | Critério de Bom Ajustamento |
|---|---|
| χ²/df (CMIN/DF) | < 3 (liberal: < 5) |
| CFI (Comparative Fit Index) | ≥ .90 (ótimo: ≥ .95) |
| RMSEA | ≤ .08 (ótimo: ≤ .06) |
| SRMR | ≤ .08 |
| TLI (Tucker-Lewis Index) | ≥ .90 |
Modelos de Equações Estruturais (SEM)
O SEM combina AFC e análise de caminhos (path analysis) numa única análise, permitindo testar modelos complexos com múltiplas relações simultâneas entre construtos latentes. É a técnica quantitativa mais avançada usada em teses de doutoramento nas áreas de gestão, psicologia e ciências sociais.
Quando usar SEM
- Quando o modelo teórico tem múltiplas relações simultâneas entre construtos
- Quando os construtos são medidos por múltiplos indicadores (itens de escalas)
- Quando quer testar mediação com variáveis latentes (mais rigoroso do que com o PROCESS)
Software para SEM em Portugal
O R lavaan é gratuito e cada vez mais usado. O AMOS (pago, integrado com SPSS) é o mais comum em universidades portuguesas. O SmartPLS usa PLS-SEM (Partial Least Squares), adequado para amostras pequenas e modelos exploratórios — muito usado em Gestão.
Tamanho da amostra: regras práticas
O tamanho mínimo da amostra é uma das perguntas mais frequentes em dissertações quantitativas.
| Técnica | N Mínimo | Regra Prática |
|---|---|---|
| Regressão múltipla | 50 (por preditor: ≥ 10) | 10–20 casos por variável preditora |
| Análise Fatorial Exploratória | 100 (mínimo) | 5–10 casos por variável |
| AFC | 200 | ≥ 200 para ML; ≤ 100 com estimação robusta |
| SEM | 200–400 | Depende da complexidade do modelo |
| PLS-SEM | 30–100 | Adequado para amostras pequenas |
A forma mais rigorosa de determinar o tamanho da amostra é a análise de potência a priori (G*Power software, gratuito) — garante poder estatístico suficiente para detetar efeitos de tamanho esperado.
Como reportar resultados quantitativos em APA
Regras fundamentais de reporte quantitativo em APA 7:
- Valores de p: não escrever “p = .000” — use “p < .001”
- Valores de teste (t, F, χ²): com graus de liberdade: t(248) = 3.42, p = .001
- Tamanhos de efeito: sempre reporte (η², d de Cohen, r, f²) — p apenas informa sobre a significância, não a magnitude
- Intervalos de confiança: 95 % CI [x.xx, x.xx] para estimativas pontuais relevantes
- Coeficientes: β (padronizados) para comparação entre preditores; B (não padronizados) com SE para replicação
Para a estrutura do capítulo de metodologia, incluindo como descrever estes procedimentos em texto, consulte o nosso artigo sobre como fazer questionários para tese e o guia de análise de dados com SPSS e Python.
SPSS vs. R vs. AMOS: qual usar
| Software | Pontos Fortes | Quando Usar |
|---|---|---|
| SPSS (IBM) | Interface gráfica, amplamente aceite em PT, boa documentação em PT | Mestrados em Gestão, Psicologia, Saúde; análises standard |
| R (lavaan, psych, lm) | Gratuito, reprodutível, mais técnicas disponíveis, publicável | Doutoramentos, análises avançadas, quando SPSS não está disponível |
| AMOS | Interface visual para SEM, integrado com SPSS | SEM e AFC em universidades com licença SPSS |
| SmartPLS | PLS-SEM, amostras pequenas, modelos exploratórios | Gestão, Marketing, TI — quando N é pequeno |
Perguntas frequentes
Qual a diferença entre regressão linear e regressão logística?
A regressão linear é usada quando a variável dependente é contínua (ex.: satisfação numa escala de 1 a 7). A regressão logística binária é usada quando a variável dependente é dicotómica (ex.: sim/não, comprou/não comprou). A regressão logística multinomial é usada com variáveis dependentes com mais de duas categorias nominais. A escolha depende da natureza da variável dependente, não da preferência do investigador.
O que é o alfa de Cronbach e quando devo calculá-lo?
O alfa de Cronbach mede a consistência interna de uma escala — isto é, se os itens que pretendem medir o mesmo construto estão correlacionados entre si. Deve ser calculado para cada subescala/dimensão do instrumento. O critério mínimo aceite é α ≥ .70; valores acima de .80 são considerados bons. Se alguma escala tiver α < .70, analise a coluna “Alpha if item deleted” no SPSS para identificar os itens problemáticos.
Devo usar uma escala de Likert de 5 ou 7 pontos?
Ambas são válidas. A escala de 7 pontos oferece maior variabilidade e discriminação — útil quando se espera que os respondentes se diferenciem em graus subtis. A escala de 5 pontos é mais simples e adequada para populações com menor familiaridade com escalas de avaliação. O mais importante é a consistência: use a mesma escala em todo o instrumento e justifique a sua escolha com base na literatura da área.
Como tratar os dados em falta (missing data) na análise quantitativa?
O tratamento depende do padrão de missing data: Missing Completely at Random (MCAR), Missing at Random (MAR) ou Not Missing at Random (NMAR). Para MCAR com menos de 5 % de missing data, a exclusão de casos (listwise deletion) é aceitável. Para MAR, a imputação múltipla (Multiple Imputation no SPSS) é o método mais rigoroso. Nunca substitua os missing por zero ou pela média sem justificar — pode introduzir viés significativo.
Apoio na estrutura do capítulo de metodologia
O Tesify Editor IA inclui templates para capítulos de metodologia quantitativa — com secções validadas para regressão, análise fatorial e SEM, adaptados às normas das universidades portuguesas.