Metodologia Quantitativa Avançada: SEM, Análise Fatorial e Regressão Múltipla na Dissertação

Metodologia Quantitativa Avançada: SEM, Análise Fatorial e Regressão Múltipla na Dissertação

A metodologia quantitativa em dissertações de mestrado e teses de doutoramento vai muito além de calcular médias e percentagens. Júris de dissertações em universidades portuguesas esperam, cada vez mais, que os estudantes dominem técnicas como a análise fatorial confirmatória, a regressão múltipla com moderação/mediação e, em contextos mais avançados, os Modelos de Equações Estruturais (SEM). Este artigo apresenta estas técnicas avançadas com aplicação prática, incluindo os pressupostos a verificar, os outputs relevantes do SPSS e do R, e como reportar os resultados segundo as normas APA.

Se ainda está a definir a sua abordagem metodológica, leia primeiro o nosso artigo sobre metodologia quantitativa na dissertação. Este artigo destina-se a estudantes que já escolheram a abordagem quantitativa e querem aprofundar técnicas específicas.

Resumo rápido: Para dissertações de mestrado, a regressão múltipla e a análise fatorial exploratória são as técnicas mais adequadas. A Análise Fatorial Confirmatória (AFC) e o SEM são mais exigentes e adequados para doutoramentos. Em qualquer técnica, verifique sempre os pressupostos antes de aplicar — um pressuposto violado invalida toda a análise.

Regressão múltipla: pressupostos e interpretação

A regressão linear múltipla é a técnica quantitativa mais usada em dissertações nas áreas de gestão, psicologia, ciências da saúde e ciências sociais. Permite analisar a relação entre uma variável dependente contínua e duas ou mais variáveis independentes.

Pressupostos obrigatórios

Antes de executar a regressão, verifique obrigatoriamente:

Pressuposto Como Verificar (SPSS) Critério de Aceitação
Linearidade Scatterplot Y vs. Ŷ Distribuição aleatória em torno de 0
Normalidade dos resíduos Kolmogorov-Smirnov, P-P plot p > .05 ou N > 30 (TLC)
Homocedasticidade Scatterplot resíduos vs. valores ajustados Sem padrão de funil
Ausência de multicolinearidade VIF (Variance Inflation Factor) VIF < 5 (conservador: < 3)
Independência dos resíduos Durbin-Watson Entre 1,5 e 2,5

Como reportar a regressão em APA

Exemplo de texto para a dissertação: “A regressão múltipla hierárquica revelou que as variáveis preditoras explicaram uma proporção significativa da variância na satisfação no trabalho, F(3, 246) = 28,74, p < .001, R² = .26. O compromisso organizacional foi o preditor mais forte (β = .41, p < .001), seguido do suporte do supervisor (β = .22, p = .003).”

Sempre reporte: F, graus de liberdade, p, R², e β (coeficientes padronizados) para cada preditor.

Moderação e mediação (Process SPSS)

A análise de moderação e mediação é cada vez mais exigida em dissertações nas áreas de gestão e psicologia. O macro PROCESS (Andrew Hayes), instalável no SPSS, é a ferramenta de referência.

Moderação (variável moderadora)

A moderação analisa quando ou para quem uma relação é mais forte. Exemplo: “O género modera a relação entre o stress e o burnout?” No PROCESS, use o Modelo 1. O moderador é significativo se o coeficiente de interação (X × M) for significativo.

Mediação (variável mediadora)

A mediação analisa como ou por que razão uma variável causa outra — identificando o mecanismo. Exemplo: “O compromisso organizacional medeia a relação entre a liderança transformacional e o desempenho?” No PROCESS, use o Modelo 4. O efeito indireto é significativo se o intervalo de confiança bootstrap (geralmente 10.000 amostras) não incluir zero.

Análise Fatorial: exploratória vs. confirmatória

Análise Fatorial Exploratória (AFE)

A AFE é usada quando o investigador não tem hipóteses sobre a estrutura fatorial de um instrumento. É comum em dissertações que desenvolvem ou adaptam escalas de medida. No SPSS: Analyze → Dimension Reduction → Factor.

Critérios de extração de fatores: regra de Kaiser (eigenvalues > 1), scree plot, variância explicada total ≥ 50 %. Rotação oblíqua (Promax ou Direct Oblimin) quando os fatores se correlacionam; rotação ortogonal (Varimax) quando são independentes.

Análise Fatorial Confirmatória (AFC)

A AFC testa se uma estrutura fatorial hipotética (definida previamente na literatura) se ajusta adequadamente aos dados. Requer software de SEM: AMOS (integrado com SPSS), R lavaan, ou Mplus.

Índices de ajustamento a reportar:

Índice Critério de Bom Ajustamento
χ²/df (CMIN/DF) < 3 (liberal: < 5)
CFI (Comparative Fit Index) ≥ .90 (ótimo: ≥ .95)
RMSEA ≤ .08 (ótimo: ≤ .06)
SRMR ≤ .08
TLI (Tucker-Lewis Index) ≥ .90

Modelos de Equações Estruturais (SEM)

O SEM combina AFC e análise de caminhos (path analysis) numa única análise, permitindo testar modelos complexos com múltiplas relações simultâneas entre construtos latentes. É a técnica quantitativa mais avançada usada em teses de doutoramento nas áreas de gestão, psicologia e ciências sociais.

Quando usar SEM

  • Quando o modelo teórico tem múltiplas relações simultâneas entre construtos
  • Quando os construtos são medidos por múltiplos indicadores (itens de escalas)
  • Quando quer testar mediação com variáveis latentes (mais rigoroso do que com o PROCESS)

Software para SEM em Portugal

O R lavaan é gratuito e cada vez mais usado. O AMOS (pago, integrado com SPSS) é o mais comum em universidades portuguesas. O SmartPLS usa PLS-SEM (Partial Least Squares), adequado para amostras pequenas e modelos exploratórios — muito usado em Gestão.

Tamanho da amostra: regras práticas

O tamanho mínimo da amostra é uma das perguntas mais frequentes em dissertações quantitativas.

Técnica N Mínimo Regra Prática
Regressão múltipla 50 (por preditor: ≥ 10) 10–20 casos por variável preditora
Análise Fatorial Exploratória 100 (mínimo) 5–10 casos por variável
AFC 200 ≥ 200 para ML; ≤ 100 com estimação robusta
SEM 200–400 Depende da complexidade do modelo
PLS-SEM 30–100 Adequado para amostras pequenas

A forma mais rigorosa de determinar o tamanho da amostra é a análise de potência a priori (G*Power software, gratuito) — garante poder estatístico suficiente para detetar efeitos de tamanho esperado.

Como reportar resultados quantitativos em APA

Regras fundamentais de reporte quantitativo em APA 7:

  • Valores de p: não escrever “p = .000” — use “p < .001”
  • Valores de teste (t, F, χ²): com graus de liberdade: t(248) = 3.42, p = .001
  • Tamanhos de efeito: sempre reporte (η², d de Cohen, r, f²) — p apenas informa sobre a significância, não a magnitude
  • Intervalos de confiança: 95 % CI [x.xx, x.xx] para estimativas pontuais relevantes
  • Coeficientes: β (padronizados) para comparação entre preditores; B (não padronizados) com SE para replicação

Para a estrutura do capítulo de metodologia, incluindo como descrever estes procedimentos em texto, consulte o nosso artigo sobre como fazer questionários para tese e o guia de análise de dados com SPSS e Python.

SPSS vs. R vs. AMOS: qual usar

Software Pontos Fortes Quando Usar
SPSS (IBM) Interface gráfica, amplamente aceite em PT, boa documentação em PT Mestrados em Gestão, Psicologia, Saúde; análises standard
R (lavaan, psych, lm) Gratuito, reprodutível, mais técnicas disponíveis, publicável Doutoramentos, análises avançadas, quando SPSS não está disponível
AMOS Interface visual para SEM, integrado com SPSS SEM e AFC em universidades com licença SPSS
SmartPLS PLS-SEM, amostras pequenas, modelos exploratórios Gestão, Marketing, TI — quando N é pequeno

Perguntas frequentes

Qual a diferença entre regressão linear e regressão logística?

A regressão linear é usada quando a variável dependente é contínua (ex.: satisfação numa escala de 1 a 7). A regressão logística binária é usada quando a variável dependente é dicotómica (ex.: sim/não, comprou/não comprou). A regressão logística multinomial é usada com variáveis dependentes com mais de duas categorias nominais. A escolha depende da natureza da variável dependente, não da preferência do investigador.

O que é o alfa de Cronbach e quando devo calculá-lo?

O alfa de Cronbach mede a consistência interna de uma escala — isto é, se os itens que pretendem medir o mesmo construto estão correlacionados entre si. Deve ser calculado para cada subescala/dimensão do instrumento. O critério mínimo aceite é α ≥ .70; valores acima de .80 são considerados bons. Se alguma escala tiver α < .70, analise a coluna “Alpha if item deleted” no SPSS para identificar os itens problemáticos.

Devo usar uma escala de Likert de 5 ou 7 pontos?

Ambas são válidas. A escala de 7 pontos oferece maior variabilidade e discriminação — útil quando se espera que os respondentes se diferenciem em graus subtis. A escala de 5 pontos é mais simples e adequada para populações com menor familiaridade com escalas de avaliação. O mais importante é a consistência: use a mesma escala em todo o instrumento e justifique a sua escolha com base na literatura da área.

Como tratar os dados em falta (missing data) na análise quantitativa?

O tratamento depende do padrão de missing data: Missing Completely at Random (MCAR), Missing at Random (MAR) ou Not Missing at Random (NMAR). Para MCAR com menos de 5 % de missing data, a exclusão de casos (listwise deletion) é aceitável. Para MAR, a imputação múltipla (Multiple Imputation no SPSS) é o método mais rigoroso. Nunca substitua os missing por zero ou pela média sem justificar — pode introduzir viés significativo.

Apoio na estrutura do capítulo de metodologia

O Tesify Editor IA inclui templates para capítulos de metodologia quantitativa — com secções validadas para regressão, análise fatorial e SEM, adaptados às normas das universidades portuguesas.

Experimentar o Tesify →