Modelagem de Equações Estruturais (SEM) na Tese 2026: AMOS vs lavaan

Modelagem de Equações Estruturais (SEM) na Tese 2026: AMOS vs lavaan

A Modelagem de Equações Estruturais (SEM) é atualmente a técnica quantitativa mais poderosa para testar teorias que envolvem variáveis latentes, efeitos mediadores e estruturas causais complexas em ciências sociais, psicologia, gestão e educação. Em 2026, qualquer tese de doutoramento que inclua construtos como “satisfação”, “engagement”, “atitude” ou “motivação” — e que queira ir além de uma simples regressão múltipla — precisa de justificar por que razão escolheu ou rejeitou o SEM. Este guia responde às questões centrais: o que é SEM, quando usá-lo, qual software escolher entre AMOS, lavaan R, Mplus e SmartPLS, e como reportar os índices de ajuste com rigor metodológico.

A escolha entre AMOS e lavaan é também uma decisão prática: o AMOS (IBM) custa €100+/licença estudante e usa interface gráfica; o lavaan é gratuito, corre em R e é cada vez mais exigido pelas revistas metodológicas de referência. Saber usar as duas opções diferencia investigadores sérios de utilizadores instrumentais das técnicas.

Resposta rápida: O SEM combina Análise Fatorial Confirmatória (CFA) + Path Analysis para testar modelos com variáveis latentes e estruturas causais. Os índices de ajuste essenciais a reportar são: χ²/df (<5 aceitável), CFI (>0.95), RMSEA (<0.06, IC 90%), SRMR (<0.08). O lavaan (R, gratuito) rivaliza com o AMOS (IBM, pago) em funcionalidades e é preferido em publicações internacionais de metodologia em 2026. O Mplus é o gold-standard para SEM com dados não-normais e modelos complexos. O SmartPLS usa PLS-SEM (variância-baseado), adequado para exploratory research ou amostras pequenas.

O que é SEM e quando usar

O SEM (Structural Equation Modeling, ou Modelagem de Equações Estruturais em PT-BR, Modelação de Equações Estruturais em PT-PT) é uma família de técnicas estatísticas multivariadas que combina análise fatorial com modelos de regressão, permitindo testar simultaneamente:

  • O modelo de medida (measurement model / CFA): como os indicadores observáveis (itens de um questionário) se relacionam com as variáveis latentes (construtos não observáveis diretamente);
  • O modelo estrutural (path model): as relações hipotéticas causais entre as variáveis latentes.

Quando o SEM é a escolha certa para a tua tese

Usa SEM quando:

  • Tens construtos latentes (satisfação, engagement, perceção de qualidade, intenção) medidos por múltiplos indicadores;
  • Queres testar mediação formal (o construto A afeta B que afeta C) com rigor além do Baron-Kenny;
  • O teu modelo teórico tem múltiplas variáveis dependentes simultâneas;
  • Precisas de modelar o erro de medida explicitamente;
  • Tens dados de questionário com escala Likert de 5-7 pontos (tratados como contínuos com precaução).

Quando NÃO usar SEM

  • Amostra < 100 observações (preferir PLS-SEM ou regressão);
  • Construtos com menos de 3 indicadores cada (sub-identificação);
  • Dados puramente exploratórios sem teoria prévia (usa EFA em vez de CFA);
  • Variáveis dependentes binárias (usa SEM com estimador WLSMV no Mplus).

CB-SEM vs PLS-SEM: qual escolher

Critério CB-SEM (AMOS, lavaan, Mplus) PLS-SEM (SmartPLS, PLS-PM R)
Base Covariância (confirmatório) Variância (preditivo/exploratório)
Amostra mínima ≥100-200 (regra: 5-10 obs/parâmetro) ≥30-50 (mais permissivo)
Normalidade Assume (ML); robusto com MLR Não paramétrico (bootstrap)
Índices de ajuste global Sim (CFI, RMSEA, SRMR) Não (usa AVE, CR, HTMT)
Adequado para Teoria estabelecida, teste confirmatório Exploração, predição, amostras pequenas
Software lavaan (R, grátis), AMOS (IBM, pago), Mplus SmartPLS (pago/freemium), plspm R
Preferência metodológica 2026 Jornais de metodologia (Psych Methods, MBR) Gestão/marketing (MIS Quarterly, IJIM)

5 etapas do SEM: da especificação ao reporte

Etapa 1 — Especificação do modelo

Define o modelo teórico antes de ver os dados. Inclui:

  • Variáveis latentes (construtos): ex. “Intenção de Uso”, “Utilidade Percebida”;
  • Indicadores (itens): cada construto deve ter ≥3 itens (ideal ≥4);
  • Setas do path diagram: setas simples (→) para relações hipotetizadas; setas duplas (↔) para covariâncias;
  • Graus de liberdade: df = p(p+1)/2 − q, onde p = indicadores e q = parâmetros estimados. Modelo identificado quando df > 0.

Etapa 2 — CFA (Análise Fatorial Confirmatória)

Antes de testar o modelo estrutural, testa o modelo de medida via CFA:

  • Validade convergente: Cargas fatoriais standardizadas ≥0.70; AVE ≥0.50;
  • Fiabilidade: Composite Reliability (CR) ≥0.70; α de Cronbach ≥0.70;
  • Validade discriminante: raiz quadrada de AVE de cada construto > correlação com outros construtos (Fornell-Larcker); ou HTMT < 0.85 (mais robusto, Gold et al. 2017).

Etapa 3 — Estimação

O estimador padrão para dados contínuos com distribuição normal multivariada é o Maximum Likelihood (ML). Para dados não-normais ou amostras <200, usa MLR (ML robusto, Satorra-Bentler) no Mplus ou o estimador MLM no lavaan. Para variáveis ordinais (Likert 5 ou menos pontos), considera WLSMV (Mplus) ou o estimador DWLS no lavaan.

Etapa 4 — Avaliação do ajuste

Ver secção detalhada de índices de ajuste abaixo.

Etapa 5 — Modificação e reporte

Os índices de modificação (MI) sugerem onde o modelo pode ser melhorado (ex.: correlacionar erros de dois itens semanticamente similares). Atenção: modificações post-hoc devem ser teoricamente justificadas e a análise de exploração/confirmação deve ser separada (split sample ou replicação em amostra independente) para evitar overfitting.

Índices de ajuste: guia completo 2026

Reportar índices de ajuste adequados é uma exigência de qualquer artigo ou tese com SEM. Os critérios baseiam-se em Hu & Bentler (1999) mas têm sido refinados por simulações mais recentes. Em 2026, os critérios standard são:

Índice Critério ajuste aceitável Critério bom ajuste Sensível ao N? Observações
χ² / df < 5 < 3 Sim (muito) χ² puro rejeitado com N>400; usar ratio
CFI > 0.90 > 0.95 Sim (moderado) Mais robusto que NFI; preferido sobre TLI em amostras pequenas
RMSEA < 0.08 < 0.06 Sim (favorece N grande) Reportar sempre IC 90%; teste p(close fit) > 0.05
SRMR < 0.10 < 0.08 Não Mais sensível ao modelo de medida; útil para CFA
TLI (NNFI) > 0.90 > 0.95 Sim Penaliza complexidade; bom complemento ao CFI
Aviso metodológico 2026: Novas simulações (McNeish & Wolf, 2023; Shi et al., 2020) mostram que os limiares Hu & Bentler de 1999 são sensíveis ao número de fatores, tamanho de amostra e estimador. Reporta sempre múltiplos índices e discute o ajuste de forma holística, não como critério binário pass/fail.

AMOS vs lavaan vs Mplus vs SmartPLS: comparação detalhada

Software Custo Interface Estimadores Pontos fortes Limitações
AMOS (IBM) ~€100-200/estudante; licença instit. GUI (drag & drop) ML, ALS, GLS, SLS Intuitivo; path diagram visual; integração SPSS Caro; sem MLR; menos flexível que lavaan; Windows only
lavaan (R) Gratuito (open-source, CRAN) Sintaxe R (código) ML, MLR, MLM, DWLS, WLS, ULS Gratuito; reprodutível; publicável; cross-platform; ecossistema R (semPlot, semTools) Curva de aprendizagem; sem GUI nativa
Mplus USD 595 base; USD 195 estudante Sintaxe própria ML, MLR, WLSMV, Bayes, MH, etc. Gold-standard; SEM com dados categóricos; mixture models; LCA; MSEM Custo elevado; sintaxe proprietária
SmartPLS 4 Freemium (básico grátis) GUI PLS (variância) Amostras pequenas; exploratório; predição Não é CB-SEM; sem índices de ajuste global; menos aceite em psicologia

Recomendação 2026: para teses de doutoramento com objetivo de publicação em jornais Q1 de psicologia, educação ou saúde, usa lavaan por reproducibility e custo zero. Se a IES tem licença AMOS/SPSS (verificável na biblioteca), o AMOS é aceitável. Mplus é obrigatório para dados categóricos ou modelos multinível (MSEM).

Script lavaan R: CFA + SEM completo comentado

Exemplo de análise completa para um modelo TAM (Technology Acceptance Model) com 3 construtos latentes e 12 indicadores, com n=250, usando lavaan 0.6-17+:

library(lavaan)
library(semPlot)

modelo_cfa <- '
  UP =~ up1 + up2 + up3 + up4
  FU =~ fu1 + fu2 + fu3 + fu4
  IU =~ iu1 + iu2 + iu3 + iu4
'

fit_cfa <- cfa(modelo_cfa,
               data = dados_tam,
               estimator = "MLR",
               std.lv = TRUE)

summary(fit_cfa, fit.measures = TRUE, standardized = TRUE)

fitMeasures(fit_cfa, c("cfi", "rmsea", "rmsea.ci.lower",
                        "rmsea.ci.upper", "srmr", "tli",
                        "chisq", "df", "pvalue"))

modelo_sem <- '
  UP =~ up1 + up2 + up3 + up4
  FU =~ fu1 + fu2 + fu3 + fu4
  IU =~ iu1 + iu2 + iu3 + iu4
  IU ~ UP + FU
  UP ~ FU
'

fit_sem <- sem(modelo_sem,
               data = dados_tam,
               estimator = "MLR",
               std.lv = TRUE)

summary(fit_sem, fit.measures = TRUE, standardized = TRUE, rsquare = TRUE)

Tabela de reporte para a tese

Na secção “Resultados” da tese, inclui obrigatoriamente estas tabelas:

Tabela 1 — Cargas fatoriais e fiabilidade

Construto Item Carga standardizada (λ) AVE CR α Cronbach
Preenche com os teus valores. Cargas ≥0.70, AVE ≥0.50, CR ≥0.70.

Tabela 2 — Índices de ajuste do modelo

Modelo χ² df CFI TLI RMSEA [IC 90%] SRMR
CFA Modelo de medida + Modelo estrutural (SEM completo)

Casos de uso por área em 2026

Psicologia — Big Five e Bem-estar

O modelo Big Five de personalidade é um dos mais testados em SEM. Em 2026, teses de psicologia positiva testam frequentemente o efeito de Neuroticismo (N) e Extroversão (E) sobre Bem-estar Subjetivo, com Autoeficácia como mediadora, usando amostras de doutorandos em Portugal. Este é um caso clássico de CB-SEM com mediação.

Educação — UTAUT2 e tecnologias educativas

O UTAUT2 (Venkatesh et al., 2012) é amplamente usado em teses de tecnologia educativa para testar a intenção de uso de ferramentas como plataformas LMS, IA generativa ou apps de aprendizagem móvel. Em 2026, várias teses brasileiras testam o UTAUT2 para adoção de IA em contexto universitário, com variáveis moderadoras (experiência, género, ano curricular).

Gestão — TAM e SERVQUAL

O modelo TAM (Davis, 1989) e as suas extensões são os mais usados em teses de gestão. Para preparar os dados e a análise SEM com suporte integrado na escrita da tese, a secção de análise de dados SPSS/R/Python deste blog tem tutoriais complementares. A bibliometria para a tese 2026 pode ainda ajudar a identificar os jornais mais adequados para publicar os teus resultados SEM.

Ciências Agrárias, Farmácia e Biologia — Desenho experimental

Em áreas experimentais como Agronomia, Ciências Farmacêuticas e Biologia, o SEM complementa análises de variância e modelos mistos quando há construtos latentes (ex.: “eficácia do tratamento” medida por múltiplos biomarcadores). Para doutorandos em mobilidade ou cotutela com universidades italianas nestas áreas, os requisitos metodológicos e de apresentação de dados experimentais têm especificidades próprias — o guia sobre as teses experimentais em Agrária, Farmácia e Biologia nas universidades italianas em 2026 documenta as normas de reporte e os protocolos experimentais exigidos pelas principais IES italianas, útil como referência comparativa para programas de cotutela PT-IT nestas áreas.

Erros metodológicos mais frequentes em SEM nas teses

  1. Não realizar CFA antes do SEM: testar o modelo estrutural diretamente sem validar o modelo de medida invalida os resultados.
  2. Usar chi-quadrado puro com N>300: o χ² é quase sempre significativo com amostras grandes, mesmo com modelos com bom ajuste. Usa sempre o ratio χ²/df.
  3. Correlacionar erros sem justificação teórica: os modification indices sugerem modificações que melhoram estatisticamente o ajuste mas podem ser espúrias. Cada modificação precisa de justificação substantiva.
  4. Não reportar o estimador: ML, MLR e WLSMV dão resultados diferentes. Sempre especifica o estimador e justifica a escolha.
  5. Misturar CB-SEM e PLS-SEM: são paradigmas diferentes com interpretações diferentes dos coeficientes. Não compares resultados entre os dois.
  6. Submissão de dados sem escala Likert adequada: Likert de 5 pontos com distribuições muito assimétricas deve ser tratado como ordinal (estimador WLSMV), não contínuo (ML).

Perguntas frequentes (FAQ)

Qual o tamanho de amostra mínimo para SEM na tese?

A regra empírica mais citada é 10 observações por parâmetro estimado (Hair et al., 2019). Para um modelo com 30 parâmetros, precisas de n≥300. Uma alternativa mais conservadora é a análise de potência com o software G*Power ou a função semPower do pacote R semPower. O PLS-SEM (SmartPLS) pode funcionar com n≥50-100, mas com limitações de generalização.

O que significa CFI = 0.93 no meu modelo? É aceitável?

CFI de 0.93 está abaixo do limiar “bom ajuste” (≥0.95) mas acima do “ajuste aceitável” (≥0.90). Depende dos outros índices: se RMSEA < 0.07 e SRMR < 0.08, o modelo pode ser considerado adequado. Na discussão da tese, refere os valores obtidos, compara com os limiares publicados (Hu & Bentler, 1999; McNeish & Wolf, 2023) e discute as potenciais fontes de misfit através dos índices de modificação. Um CFI de 0.93 não invalida automaticamente a tese — mas requer discussão metodológica honesta.

Posso usar lavaan na minha tese sem saber R de forma avançada?

Sim. A sintaxe do lavaan é desenhada para ser legível mesmo com R básico. O script mínimo para CFA tem menos de 10 linhas. Recomenda-se o tutoriel UCLA OARC (stats.oarc.ucla.edu/r/seminars/rsem) e o livro “Structural Equation Modeling with lavaan” de Rosseel (2025, disponível online gratuito). Uma semana de aprendizagem dirigida é suficiente para conduzir uma CFA + SEM básico.

Quando devo usar Mplus em vez de lavaan?

Usa Mplus quando: (1) tens variáveis dependentes ordinais (Likert ≤5 pontos com assimetria) e precisas do estimador WLSMV; (2) o teu modelo inclui variáveis de classe latente (LCA, mixture SEM); (3) precisas de SEM multinível (MSEM) com dados aninhados (alunos dentro de escolas); (4) o orientador ou jornal-alvo exige Mplus especificamente. Em todos os outros casos, lavaan é igualmente robusto e tem a vantagem de ser gratuito e reprodutível.

O que é a invariância de medida e preciso de a testar na minha tese?

A invariância de medida (measurement invariance) verifica se um instrumento mede o mesmo construto da mesma forma em diferentes grupos (ex.: géneros, países, versões linguísticas). Se vais comparar médias latentes entre grupos (ex.: Portugal vs Brasil), é metodologicamente obrigatório testar invariância configural, métrica e escalar antes da comparação. No lavaan, usa a função measurementInvariance() do pacote semTools. A omissão deste teste é um erro apontado em revisões de jornais de metodologia em 2026.

Analisa os teus dados SEM com suporte especializado

A Tesify oferece templates de tese com secções de SEM pré-formatadas para AMOS e lavaan, incluindo tabelas de cargas fatoriais, índices de ajuste e path coefficients prontas a preencher. Compatível com APA 7, ABNT e NP 405.

Experimentar a Tesify gratuitamente