Modelagem de Equações Estruturais (SEM) na Tese 2026: AMOS vs lavaan
A Modelagem de Equações Estruturais (SEM) é atualmente a técnica quantitativa mais poderosa para testar teorias que envolvem variáveis latentes, efeitos mediadores e estruturas causais complexas em ciências sociais, psicologia, gestão e educação. Em 2026, qualquer tese de doutoramento que inclua construtos como “satisfação”, “engagement”, “atitude” ou “motivação” — e que queira ir além de uma simples regressão múltipla — precisa de justificar por que razão escolheu ou rejeitou o SEM. Este guia responde às questões centrais: o que é SEM, quando usá-lo, qual software escolher entre AMOS, lavaan R, Mplus e SmartPLS, e como reportar os índices de ajuste com rigor metodológico.
A escolha entre AMOS e lavaan é também uma decisão prática: o AMOS (IBM) custa €100+/licença estudante e usa interface gráfica; o lavaan é gratuito, corre em R e é cada vez mais exigido pelas revistas metodológicas de referência. Saber usar as duas opções diferencia investigadores sérios de utilizadores instrumentais das técnicas.
O que é SEM e quando usar
O SEM (Structural Equation Modeling, ou Modelagem de Equações Estruturais em PT-BR, Modelação de Equações Estruturais em PT-PT) é uma família de técnicas estatísticas multivariadas que combina análise fatorial com modelos de regressão, permitindo testar simultaneamente:
- O modelo de medida (measurement model / CFA): como os indicadores observáveis (itens de um questionário) se relacionam com as variáveis latentes (construtos não observáveis diretamente);
- O modelo estrutural (path model): as relações hipotéticas causais entre as variáveis latentes.
Quando o SEM é a escolha certa para a tua tese
Usa SEM quando:
- Tens construtos latentes (satisfação, engagement, perceção de qualidade, intenção) medidos por múltiplos indicadores;
- Queres testar mediação formal (o construto A afeta B que afeta C) com rigor além do Baron-Kenny;
- O teu modelo teórico tem múltiplas variáveis dependentes simultâneas;
- Precisas de modelar o erro de medida explicitamente;
- Tens dados de questionário com escala Likert de 5-7 pontos (tratados como contínuos com precaução).
Quando NÃO usar SEM
- Amostra < 100 observações (preferir PLS-SEM ou regressão);
- Construtos com menos de 3 indicadores cada (sub-identificação);
- Dados puramente exploratórios sem teoria prévia (usa EFA em vez de CFA);
- Variáveis dependentes binárias (usa SEM com estimador WLSMV no Mplus).
CB-SEM vs PLS-SEM: qual escolher
| Critério | CB-SEM (AMOS, lavaan, Mplus) | PLS-SEM (SmartPLS, PLS-PM R) |
|---|---|---|
| Base | Covariância (confirmatório) | Variância (preditivo/exploratório) |
| Amostra mínima | ≥100-200 (regra: 5-10 obs/parâmetro) | ≥30-50 (mais permissivo) |
| Normalidade | Assume (ML); robusto com MLR | Não paramétrico (bootstrap) |
| Índices de ajuste global | Sim (CFI, RMSEA, SRMR) | Não (usa AVE, CR, HTMT) |
| Adequado para | Teoria estabelecida, teste confirmatório | Exploração, predição, amostras pequenas |
| Software | lavaan (R, grátis), AMOS (IBM, pago), Mplus | SmartPLS (pago/freemium), plspm R |
| Preferência metodológica 2026 | Jornais de metodologia (Psych Methods, MBR) | Gestão/marketing (MIS Quarterly, IJIM) |
5 etapas do SEM: da especificação ao reporte
Etapa 1 — Especificação do modelo
Define o modelo teórico antes de ver os dados. Inclui:
- Variáveis latentes (construtos): ex. “Intenção de Uso”, “Utilidade Percebida”;
- Indicadores (itens): cada construto deve ter ≥3 itens (ideal ≥4);
- Setas do path diagram: setas simples (→) para relações hipotetizadas; setas duplas (↔) para covariâncias;
- Graus de liberdade: df = p(p+1)/2 − q, onde p = indicadores e q = parâmetros estimados. Modelo identificado quando df > 0.
Etapa 2 — CFA (Análise Fatorial Confirmatória)
Antes de testar o modelo estrutural, testa o modelo de medida via CFA:
- Validade convergente: Cargas fatoriais standardizadas ≥0.70; AVE ≥0.50;
- Fiabilidade: Composite Reliability (CR) ≥0.70; α de Cronbach ≥0.70;
- Validade discriminante: raiz quadrada de AVE de cada construto > correlação com outros construtos (Fornell-Larcker); ou HTMT < 0.85 (mais robusto, Gold et al. 2017).
Etapa 3 — Estimação
O estimador padrão para dados contínuos com distribuição normal multivariada é o Maximum Likelihood (ML). Para dados não-normais ou amostras <200, usa MLR (ML robusto, Satorra-Bentler) no Mplus ou o estimador MLM no lavaan. Para variáveis ordinais (Likert 5 ou menos pontos), considera WLSMV (Mplus) ou o estimador DWLS no lavaan.
Etapa 4 — Avaliação do ajuste
Ver secção detalhada de índices de ajuste abaixo.
Etapa 5 — Modificação e reporte
Os índices de modificação (MI) sugerem onde o modelo pode ser melhorado (ex.: correlacionar erros de dois itens semanticamente similares). Atenção: modificações post-hoc devem ser teoricamente justificadas e a análise de exploração/confirmação deve ser separada (split sample ou replicação em amostra independente) para evitar overfitting.
Índices de ajuste: guia completo 2026
Reportar índices de ajuste adequados é uma exigência de qualquer artigo ou tese com SEM. Os critérios baseiam-se em Hu & Bentler (1999) mas têm sido refinados por simulações mais recentes. Em 2026, os critérios standard são:
| Índice | Critério ajuste aceitável | Critério bom ajuste | Sensível ao N? | Observações |
|---|---|---|---|---|
| χ² / df | < 5 | < 3 | Sim (muito) | χ² puro rejeitado com N>400; usar ratio |
| CFI | > 0.90 | > 0.95 | Sim (moderado) | Mais robusto que NFI; preferido sobre TLI em amostras pequenas |
| RMSEA | < 0.08 | < 0.06 | Sim (favorece N grande) | Reportar sempre IC 90%; teste p(close fit) > 0.05 |
| SRMR | < 0.10 | < 0.08 | Não | Mais sensível ao modelo de medida; útil para CFA |
| TLI (NNFI) | > 0.90 | > 0.95 | Sim | Penaliza complexidade; bom complemento ao CFI |
AMOS vs lavaan vs Mplus vs SmartPLS: comparação detalhada
| Software | Custo | Interface | Estimadores | Pontos fortes | Limitações |
|---|---|---|---|---|---|
| AMOS (IBM) | ~€100-200/estudante; licença instit. | GUI (drag & drop) | ML, ALS, GLS, SLS | Intuitivo; path diagram visual; integração SPSS | Caro; sem MLR; menos flexível que lavaan; Windows only |
| lavaan (R) | Gratuito (open-source, CRAN) | Sintaxe R (código) | ML, MLR, MLM, DWLS, WLS, ULS | Gratuito; reprodutível; publicável; cross-platform; ecossistema R (semPlot, semTools) | Curva de aprendizagem; sem GUI nativa |
| Mplus | USD 595 base; USD 195 estudante | Sintaxe própria | ML, MLR, WLSMV, Bayes, MH, etc. | Gold-standard; SEM com dados categóricos; mixture models; LCA; MSEM | Custo elevado; sintaxe proprietária |
| SmartPLS 4 | Freemium (básico grátis) | GUI | PLS (variância) | Amostras pequenas; exploratório; predição | Não é CB-SEM; sem índices de ajuste global; menos aceite em psicologia |
Recomendação 2026: para teses de doutoramento com objetivo de publicação em jornais Q1 de psicologia, educação ou saúde, usa lavaan por reproducibility e custo zero. Se a IES tem licença AMOS/SPSS (verificável na biblioteca), o AMOS é aceitável. Mplus é obrigatório para dados categóricos ou modelos multinível (MSEM).
Script lavaan R: CFA + SEM completo comentado
Exemplo de análise completa para um modelo TAM (Technology Acceptance Model) com 3 construtos latentes e 12 indicadores, com n=250, usando lavaan 0.6-17+:
library(lavaan)
library(semPlot)
modelo_cfa <- '
UP =~ up1 + up2 + up3 + up4
FU =~ fu1 + fu2 + fu3 + fu4
IU =~ iu1 + iu2 + iu3 + iu4
'
fit_cfa <- cfa(modelo_cfa,
data = dados_tam,
estimator = "MLR",
std.lv = TRUE)
summary(fit_cfa, fit.measures = TRUE, standardized = TRUE)
fitMeasures(fit_cfa, c("cfi", "rmsea", "rmsea.ci.lower",
"rmsea.ci.upper", "srmr", "tli",
"chisq", "df", "pvalue"))
modelo_sem <- '
UP =~ up1 + up2 + up3 + up4
FU =~ fu1 + fu2 + fu3 + fu4
IU =~ iu1 + iu2 + iu3 + iu4
IU ~ UP + FU
UP ~ FU
'
fit_sem <- sem(modelo_sem,
data = dados_tam,
estimator = "MLR",
std.lv = TRUE)
summary(fit_sem, fit.measures = TRUE, standardized = TRUE, rsquare = TRUE)
Tabela de reporte para a tese
Na secção “Resultados” da tese, inclui obrigatoriamente estas tabelas:
Tabela 1 — Cargas fatoriais e fiabilidade
| Construto | Item | Carga standardizada (λ) | AVE | CR | α Cronbach |
|---|---|---|---|---|---|
| Preenche com os teus valores. Cargas ≥0.70, AVE ≥0.50, CR ≥0.70. | |||||
Tabela 2 — Índices de ajuste do modelo
| Modelo | χ² | df | CFI | TLI | RMSEA [IC 90%] | SRMR |
|---|---|---|---|---|---|---|
| CFA Modelo de medida + Modelo estrutural (SEM completo) | ||||||
Casos de uso por área em 2026
Psicologia — Big Five e Bem-estar
O modelo Big Five de personalidade é um dos mais testados em SEM. Em 2026, teses de psicologia positiva testam frequentemente o efeito de Neuroticismo (N) e Extroversão (E) sobre Bem-estar Subjetivo, com Autoeficácia como mediadora, usando amostras de doutorandos em Portugal. Este é um caso clássico de CB-SEM com mediação.
Educação — UTAUT2 e tecnologias educativas
O UTAUT2 (Venkatesh et al., 2012) é amplamente usado em teses de tecnologia educativa para testar a intenção de uso de ferramentas como plataformas LMS, IA generativa ou apps de aprendizagem móvel. Em 2026, várias teses brasileiras testam o UTAUT2 para adoção de IA em contexto universitário, com variáveis moderadoras (experiência, género, ano curricular).
Gestão — TAM e SERVQUAL
O modelo TAM (Davis, 1989) e as suas extensões são os mais usados em teses de gestão. Para preparar os dados e a análise SEM com suporte integrado na escrita da tese, a secção de análise de dados SPSS/R/Python deste blog tem tutoriais complementares. A bibliometria para a tese 2026 pode ainda ajudar a identificar os jornais mais adequados para publicar os teus resultados SEM.
Ciências Agrárias, Farmácia e Biologia — Desenho experimental
Em áreas experimentais como Agronomia, Ciências Farmacêuticas e Biologia, o SEM complementa análises de variância e modelos mistos quando há construtos latentes (ex.: “eficácia do tratamento” medida por múltiplos biomarcadores). Para doutorandos em mobilidade ou cotutela com universidades italianas nestas áreas, os requisitos metodológicos e de apresentação de dados experimentais têm especificidades próprias — o guia sobre as teses experimentais em Agrária, Farmácia e Biologia nas universidades italianas em 2026 documenta as normas de reporte e os protocolos experimentais exigidos pelas principais IES italianas, útil como referência comparativa para programas de cotutela PT-IT nestas áreas.
Erros metodológicos mais frequentes em SEM nas teses
- Não realizar CFA antes do SEM: testar o modelo estrutural diretamente sem validar o modelo de medida invalida os resultados.
- Usar chi-quadrado puro com N>300: o χ² é quase sempre significativo com amostras grandes, mesmo com modelos com bom ajuste. Usa sempre o ratio χ²/df.
- Correlacionar erros sem justificação teórica: os modification indices sugerem modificações que melhoram estatisticamente o ajuste mas podem ser espúrias. Cada modificação precisa de justificação substantiva.
- Não reportar o estimador: ML, MLR e WLSMV dão resultados diferentes. Sempre especifica o estimador e justifica a escolha.
- Misturar CB-SEM e PLS-SEM: são paradigmas diferentes com interpretações diferentes dos coeficientes. Não compares resultados entre os dois.
- Submissão de dados sem escala Likert adequada: Likert de 5 pontos com distribuições muito assimétricas deve ser tratado como ordinal (estimador WLSMV), não contínuo (ML).
Perguntas frequentes (FAQ)
Qual o tamanho de amostra mínimo para SEM na tese?
A regra empírica mais citada é 10 observações por parâmetro estimado (Hair et al., 2019). Para um modelo com 30 parâmetros, precisas de n≥300. Uma alternativa mais conservadora é a análise de potência com o software G*Power ou a função semPower do pacote R semPower. O PLS-SEM (SmartPLS) pode funcionar com n≥50-100, mas com limitações de generalização.
O que significa CFI = 0.93 no meu modelo? É aceitável?
CFI de 0.93 está abaixo do limiar “bom ajuste” (≥0.95) mas acima do “ajuste aceitável” (≥0.90). Depende dos outros índices: se RMSEA < 0.07 e SRMR < 0.08, o modelo pode ser considerado adequado. Na discussão da tese, refere os valores obtidos, compara com os limiares publicados (Hu & Bentler, 1999; McNeish & Wolf, 2023) e discute as potenciais fontes de misfit através dos índices de modificação. Um CFI de 0.93 não invalida automaticamente a tese — mas requer discussão metodológica honesta.
Posso usar lavaan na minha tese sem saber R de forma avançada?
Sim. A sintaxe do lavaan é desenhada para ser legível mesmo com R básico. O script mínimo para CFA tem menos de 10 linhas. Recomenda-se o tutoriel UCLA OARC (stats.oarc.ucla.edu/r/seminars/rsem) e o livro “Structural Equation Modeling with lavaan” de Rosseel (2025, disponível online gratuito). Uma semana de aprendizagem dirigida é suficiente para conduzir uma CFA + SEM básico.
Quando devo usar Mplus em vez de lavaan?
Usa Mplus quando: (1) tens variáveis dependentes ordinais (Likert ≤5 pontos com assimetria) e precisas do estimador WLSMV; (2) o teu modelo inclui variáveis de classe latente (LCA, mixture SEM); (3) precisas de SEM multinível (MSEM) com dados aninhados (alunos dentro de escolas); (4) o orientador ou jornal-alvo exige Mplus especificamente. Em todos os outros casos, lavaan é igualmente robusto e tem a vantagem de ser gratuito e reprodutível.
O que é a invariância de medida e preciso de a testar na minha tese?
A invariância de medida (measurement invariance) verifica se um instrumento mede o mesmo construto da mesma forma em diferentes grupos (ex.: géneros, países, versões linguísticas). Se vais comparar médias latentes entre grupos (ex.: Portugal vs Brasil), é metodologicamente obrigatório testar invariância configural, métrica e escalar antes da comparação. No lavaan, usa a função measurementInvariance() do pacote semTools. A omissão deste teste é um erro apontado em revisões de jornais de metodologia em 2026.
Analisa os teus dados SEM com suporte especializado
A Tesify oferece templates de tese com secções de SEM pré-formatadas para AMOS e lavaan, incluindo tabelas de cargas fatoriais, índices de ajuste e path coefficients prontas a preencher. Compatível com APA 7, ABNT e NP 405.
