SPSS para Análise de Dados de Tese 2026: Tutorial com Dataset Demo Descarregável
A análise de dados com SPSS é, para muitos estudantes de mestrado e doutoramento, o momento de maior ansiedade em todo o processo de investigação. A metodologia está definida, os dados estão recolhidos, e agora é preciso transformá-los em resultados interpretáveis — com o software correcto, os testes adequados e a apresentação exigida pela academia. O IBM SPSS Statistics (versão 29, 2024) continua a ser o software de análise estatística de referência em ciências sociais, saúde, educação e gestão em Portugal e no Brasil, usado nas principais universidades e exigido ou recomendado pela maioria dos orientadores de teses quantitativas e mistas.
Este tutorial foi concebido para estudantes de pós-graduação que já têm os seus dados recolhidos e precisam de realizar as análises mais comuns numa tese com metodologia quantitativa. Inclui um dataset demo em formato .sav descarregável e sintaxe SPSS executável para ANOVA, regressão linear múltipla e análise factorial exploratória — os três conjuntos de análises mais frequentes em dissertações de mestrado portuguesas. Todo o processo é explicado passo a passo, com interpretação dos outputs e exemplos de como reportar os resultados em formato APA 7 no texto da tese.
O SPSS em 2026: Versões, Licenças e Alternativas
O IBM SPSS Statistics está na versão 29 (lançada em Setembro de 2023), com actualizações menores em 2024. As funcionalidades core para dissertações de mestrado — incluindo ANOVA, regressão, análise factorial e testes não paramétricos — estão disponíveis na versão Base desde a versão 26. O módulo SPSS Advanced Statistics adiciona MANOVA, ANCOVA e modelos mistos; o módulo Regression adiciona regressão logística ordinal e multinomial.
Acesso ao SPSS em Portugal
A maioria das universidades públicas portuguesas (ULisboa, UPorto, UCoimbra, UMinho, entre outras) tem licenças institucionais IBM SPSS para utilização académica. O acesso é geralmente feito através das redes da universidade (WiFi campus ou VPN). O serviço de informática da sua instituição pode fornecer as instruções de instalação. Fora da universidade, acede-se via VPN institucional.
A IBM oferece uma versão de avaliação gratuita de 30 dias em ibm.com/spss. Após esse período, existem alternativas gratuitas que reproduzem as mesmas análises com outputs equivalentes:
| Software | Custo | Interface | Diferencial |
|---|---|---|---|
| IBM SPSS 29 | Licença institucional / pago | GUI + sintaxe | Referência padrão; mais reconhecido por orientadores |
| JASP | Gratuito (open-source) | GUI | Relatórios APA automáticos; análise Bayesiana integrada |
| jamovi | Gratuito (open-source) | GUI | Interface mais intuitiva; actualização em tempo real |
| R + RStudio | Gratuito (open-source) | Código | Máxima flexibilidade; curva de aprendizagem mais íngreme |
Para a maioria das dissertações de mestrado em Portugal, o SPSS ou o JASP são a escolha mais adequada. Mencione sempre na secção de metodologia qual o software utilizado e a versão — esta informação é exigida pela maioria dos orientadores e faz parte das boas práticas de reprodutibilidade.
O Dataset Demo: Estrutura e Download
O dataset demo criado para este tutorial simula um estudo típico de dissertação de mestrado em psicologia organizacional, com variáveis que permitem ilustrar todos os tipos de análise abordados. O ficheiro .sav está estruturado da seguinte forma:
- N = 120 participantes (simulação de questionário a colaboradores de três organizações)
- Grupo — variável categórica com 3 condições (org_A, org_B, org_C) — para ANOVA
- Satisfacao_geral — variável contínua (escala 1–7) — variável dependente principal
- Autonomia, Apoio_chefe, Formacao, Remuneracao — variáveis contínuas (escalas 1–7) — preditores para regressão
- Item_1 a Item_10 — 10 itens de escala de satisfação — para análise factorial exploratória
- Idade, Genero, Anos_empresa — variáveis de controlo
Download do dataset demo: O ficheiro SPSS_Demo_Tese_2026.sav e a sintaxe completa SPSS_Sintaxe_Tese_2026.sps estão disponíveis para download na secção de recursos do Tesify. O dataset foi criado com dados simulados (não inclui dados pessoais reais) e pode ser usado livremente para fins académicos e de aprendizagem.
Fase 1: Preparação e Limpeza de Dados
Antes de qualquer análise, é necessário verificar e preparar os dados. Esta fase é frequentemente subestimada e é a fonte de muitos erros nos capítulos de resultados das dissertações.
1.1 Verificação de Valores em Falta (Missing Values)
No SPSS: Analisar > Relatórios > Análise de Valores Omissos. Identifique a percentagem de valores omissos por variável. Como regra geral:
- Menos de 5% de missing values: substituição por média ou mediana aceitável
- 5–15%: use imputação múltipla (Analisar > Imputar Valores Omissos > Imputação Múltipla)
- Mais de 15%: considere excluir a variável ou reportar a limitação explicitamente
1.2 Detecção de Outliers
Use boxplots (Analisar > Estatísticas Descritivas > Explorar > Gráficos > Boxplots) para identificar outliers. Valores assinalados com asterisco (*) no boxplot estão a mais de 3 desvios interquartílicos da mediana — são outliers extremos que merecem atenção. Decida, com base no seu conhecimento do fenómeno estudado, se os exclui, transforma ou mantém, e justifique a decisão na metodologia.
1.3 Inversão de Itens em Escalas
Quando a escala inclui itens formulados negativamente (ex.: “Sinto-me desmotivado no trabalho”), esses itens devem ser invertidos antes do cálculo de scores compostos. No SPSS: Transformar > Recodificar em Diferentes Variáveis. Para uma escala de 7 pontos, o valor 1 torna-se 7, o 2 torna-se 6, etc. (fórmula: valor_invertido = 8 – valor_original).
Fase 2: Estatísticas Descritivas e Verificação de Pressupostos
Antes de qualquer teste inferencial, calcule as estatísticas descritivas e verifique os pressupostos dos testes que vai utilizar.
Estatísticas Descritivas
Caminho SPSS: Analisar > Estatísticas Descritivas > Descritivas. Seleccione as variáveis contínuas e peça: Média, Desvio-Padrão, Mínimo, Máximo, Assimetria, Curtose.
Teste de Normalidade (Shapiro-Wilk)
Caminho SPSS: Analisar > Estatísticas Descritivas > Explorar > Testes de Normalidade. O SPSS apresenta os resultados do teste de Shapiro-Wilk (recomendado para n < 50) e do Kolmogorov-Smirnov com correcção de Lilliefors (para n ≥ 50).
Interpretação: Se p > 0,05, não se rejeita a normalidade (os dados são consistentes com uma distribuição normal). Se p < 0,05, a distribuição difere significativamente da normal — considere testes não-paramétricos ou verificar a robustez do teste paramétrico com o tamanho da amostra (amostras maiores são mais robustas a violações de normalidade).
Teste de Homogeneidade de Variâncias (Levene)
Para a ANOVA, o pressuposto de homogeneidade de variâncias é verificado automaticamente quando corre a ANOVA no SPSS — o teste de Levene aparece na tabela de output. Se p(Levene) < 0,05, as variâncias são heterogéneas e deve usar a correcção de Welch ou o teste de Brown-Forsythe (disponíveis em Analisar > Comparar Médias > ANOVA de Uma Via > Opções).
Fase 3: ANOVA de Uma Via — Passo a Passo
A ANOVA de Uma Via (One-Way ANOVA) compara as médias de uma variável dependente contínua entre três ou mais grupos independentes. No dataset demo, vamos comparar a satisfação geral (Satisfacao_geral) entre as três organizações (Grupo).
Caminho SPSS (Interface Gráfica)
- Analisar > Comparar Médias > ANOVA de Uma Via
- Mova Satisfacao_geral para “Variáveis Dependentes”
- Mova Grupo para “Factor”
- Clique em “Opções” e seleccione: Estatísticas descritivas, Teste de homogeneidade de variâncias, Welch
- Clique em “Post Hoc” e seleccione: Tukey (se Levene p>0,05) ou Games-Howell (se Levene p<0,05)
- OK
Sintaxe SPSS (Executável)
ONEWAY Satisfacao_geral BY Grupo
/STATISTICS DESCRIPTIVES HOMOGENEITY WELCH BROWNFORSYTHE
/POSTHOC TUKEY GAMES-HOWELL ALPHA(0.05)
/PLOT MEANS
/MISSING ANALYSIS.
Interpretação do Output
O output da ANOVA inclui: (1) tabela de descritivos por grupo (M, DP, n, IC 95%), (2) teste de Levene, (3) tabela ANOVA com F, gl e Sig., e (4) comparações post-hoc.
Exemplo de reporte em formato APA 7:
“Realizou-se uma ANOVA de uma via para avaliar o efeito da organização na satisfação geral dos colaboradores. Os resultados indicaram uma diferença estatisticamente significativa entre os três grupos, F(2, 117) = 8,43, p = 0,001, η² = 0,13. As comparações post-hoc de Tukey revelaram que os colaboradores da Organização A (M = 5,2, DP = 0,9) apresentaram satisfação significativamente superior à da Organização C (M = 4,4, DP = 1,1), p = 0,002. Não se verificaram diferenças significativas entre os demais pares (p > 0,05).”
O tamanho de efeito eta² (η²) não é calculado automaticamente pelo SPSS — calcule manualmente: η² = SS_entre / SS_total. Valores de referência: pequeno (0,01), médio (0,06), grande (0,14). Para calcular tamanhos de efeito para a tese, o guia de análise de dados na tese: métodos, ferramentas e resultados cobre este processo em detalhe.
Fase 4: Regressão Linear Múltipla — Passo a Passo
A regressão linear múltipla permite modelar o efeito de múltiplos preditores sobre uma variável dependente contínua. No dataset demo, vamos prever a satisfação geral com base em quatro preditores: Autonomia, Apoio_chefe, Formacao e Remuneracao.
Pressupostos da Regressão Linear
- Linearidade: A relação entre cada preditor e a VD deve ser linear (verifique com gráficos de dispersão)
- Normalidade dos resíduos: Os resíduos devem seguir distribuição normal (verifique com P-P plot ou teste de normalidade dos resíduos)
- Homocedasticidade: A variância dos resíduos deve ser constante (verifique com gráfico de resíduos padronizados vs. valores preditos)
- Ausência de multicolinearidade: Os preditores não devem ser altamente correlacionados entre si (VIF < 10, Tolerância > 0,10)
- Independência dos resíduos: Teste de Durbin-Watson (valor próximo de 2 indica independência)
Sintaxe SPSS (Executável)
REGRESSION
/MISSING LISTWISE
/STATISTICS COEFF OUTS R ANOVA COLLIN TOL CHANGE ZPP
/CRITERIA=PIN(.05) POUT(.10)
/NOORIGIN
/DEPENDENT Satisfacao_geral
/METHOD=ENTER Autonomia Apoio_chefe Formacao Remuneracao
/SCATTERPLOT=(*ZRESID ,*ZPRED)
/RESIDUALS DURBIN HISTOGRAM(ZRESID) NORMPROB(ZRESID)
/CASEWISE PLOT(ZRESID) THRESHOLD(3).
Interpretação dos Coeficientes
O output da regressão inclui: R² (variância explicada), R² ajustado, F e p do modelo global, coeficientes B (não standardizados) e β (standardizados) para cada preditor, e valores de VIF para multicolinearidade.
Exemplo de reporte em formato APA 7:
“Realizou-se uma regressão linear múltipla para avaliar os preditores da satisfação geral dos colaboradores. O modelo explicou uma proporção significativa da variância da satisfação, R² = 0,48, R²ajustado = 0,46, F(4, 115) = 26,7, p < 0,001. A autonomia (β = 0,42, t = 5,8, p < 0,001) e o apoio do chefe (β = 0,31, t = 4,2, p < 0,001) emergiram como preditores significativos. A formação (β = 0,11, t = 1,4, p = 0,17) e a remuneração (β = 0,09, t = 1,2, p = 0,24) não atingiram significância estatística. Os valores VIF variaram entre 1,2 e 2,3, não indicando multicolinearidade problemática.”
Fase 5: Análise Factorial Exploratória
A análise factorial exploratória (AFE) é usada para identificar a estrutura latente de um conjunto de itens — tipicamente os itens de uma escala de questionário. No dataset demo, os 10 itens (Item_1 a Item_10) representam uma escala de satisfação no trabalho com estrutura bifactorial hipotética.
Sintaxe SPSS
FACTOR
/VARIABLES Item_1 Item_2 Item_3 Item_4 Item_5 Item_6 Item_7 Item_8 Item_9 Item_10
/MISSING LISTWISE
/ANALYSIS Item_1 Item_2 Item_3 Item_4 Item_5 Item_6 Item_7 Item_8 Item_9 Item_10
/PRINT INITIAL KMO EXTRACTION ROTATION
/FORMAT SORT BLANK(.30)
/PLOT EIGEN
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/METHOD=CORRELATION.
Interpretação dos Resultados da AFE
Verifique: (1) KMO > 0,70 (adequação da amostra para factorização); (2) Teste de Bartlett com p < 0,05 (correlações são significativas); (3) Comunalidades > 0,40 para cada item; (4) Eigenvalues > 1 para identificar número de factores; (5) variância total explicada pelos factores retidos (>50% é aceitável, >60% é bom).
A sintaxe executável completa, incluindo o cálculo de consistência interna (Alpha de Cronbach), análise de componentes principais confirmatória e testes robustos, está disponível no ficheiro SPSS_Sintaxe_Tese_2026.sps descarregável nos recursos do Tesify. Para a interpretação dos resultados da análise factorial em contexto de validação de instrumentos, o guia de metodologia quantitativa na dissertação: guia com exemplos cobre este processo.
Como Reportar os Resultados em Formato APA 7
Reportar resultados estatísticos correctamente é tão importante quanto obter os resultados correctos. As normas APA 7.ª edição estabelecem convenções específicas para cada tipo de teste.
Regras Gerais de Reporte Estatístico (APA 7)
- Use maiúsculas e itálico para todas as estatísticas: M, DP, F, t, p, r, n
- Reporte sempre os graus de liberdade entre parênteses: F(2, 117) = 8,43
- Para p < 0,001, escreva exactamente “p < 0,001” (não “p = 0,000”)
- Reporte sempre o tamanho de efeito além do valor p: d de Cohen (para t-tests), η² ou ηp² (para ANOVA), R² (para regressão)
- Use vírgula como separador decimal em textos em português (não ponto)
- Arredonde para 2 casas decimais, excepto p que usa 3 casas (p = 0,043)
Para informação completa sobre as normas APA 7 em português, incluindo a formatação de tabelas de resultados estatísticos, consulte o guia de normas APA: guia completo 2026 em português.
Erros Mais Comuns na Análise SPSS para Teses
- Não verificar os pressupostos dos testes: Aplicar uma ANOVA sem verificar normalidade e homogeneidade de variâncias é o erro mais frequente e pode invalidar as conclusões.
- Confundir significância estatística com relevância prática: Um p < 0,05 com n=500 pode ser estatisticamente significativo mas praticamente irrelevante. Reporte sempre o tamanho de efeito.
- Reportar R² em vez de R² ajustado na regressão múltipla: O R² ajustado penaliza a adição de preditores pouco informativos e é a medida correcta para regressão múltipla.
- Não verificar multicolinearidade na regressão: VIF > 10 ou Tolerância < 0,10 indicam multicolinearidade grave que invalida a interpretação dos coeficientes individuais.
- Ignorar missing values: O SPSS usa por omissão exclusão de casos (listwise deletion), o que pode reduzir substancialmente a amostra efectiva sem aviso explícito.
- Confundir o número de factores pelo critério de Kaiser (eigenvalue > 1): Este critério tende a sobrestimar o número de factores. Complemente sempre com a análise paralela ou o scree plot.
Para contextualizar a análise SPSS na metodologia mais ampla da tese, incluindo a relação com a análise qualitativa quando se usa abordagem mista, consulte o artigo sobre métodos mistos de investigação: quando e como combinar qualitativo e quantitativo. Para a estrutura completa da tese em que estes resultados se inserem, o guia de metodologia de investigação 2026: guia completo é o recurso de referência.
FAQ — Perguntas Frequentes sobre SPSS para Teses
O que é o SPSS e para que serve numa tese?
O IBM SPSS Statistics é um software de análise estatística amplamente utilizado em ciências sociais, saúde, educação e gestão. Numa tese com metodologia quantitativa ou mista, o SPSS é usado para importar e limpar dados, calcular estatísticas descritivas, testar hipóteses (t-test, ANOVA, qui-quadrado), realizar análises de regressão (linear, logística) e análise factorial. A versão actual é o IBM SPSS Statistics 29 (2024), com licenças institucionais disponíveis na maioria das universidades portuguesas.
O SPSS é gratuito para estudantes em Portugal?
O IBM SPSS não é gratuito, mas a maioria das universidades portuguesas tem licenças institucionais acessíveis a estudantes via rede da universidade ou VPN. Verifique com os serviços de informática da sua instituição. Alternativas gratuitas e open-source equivalentes incluem o JASP (com relatórios APA automáticos) e o jamovi. O R é a alternativa mais poderosa mas com curva de aprendizagem mais íngreme.
Qual a diferença entre ANOVA e teste t no SPSS?
O teste t compara médias entre dois grupos. A ANOVA compara médias entre três ou mais grupos. Quando se comparam apenas dois grupos, ambos produzem resultados equivalentes (F = t²). Use o teste t quando tem 2 grupos; ANOVA quando tem 3 ou mais. Para comparações em dois momentos com os mesmos participantes, use o teste t de amostras emparelhadas; para 3+ momentos, ANOVA de medidas repetidas.
O que é o teste de Shapiro-Wilk no SPSS?
O teste de Shapiro-Wilk testa se uma distribuição de dados segue a distribuição normal — pressuposto de testes paramétricos como o teste t e a ANOVA. Se p maior que 0,05, não se rejeita a normalidade. Para amostras grandes (n maior que 50), o Kolmogorov-Smirnov com correcção de Lilliefors é mais adequado. Quando os dados não são normais, use alternativas não-paramétricas: Mann-Whitney em vez de t, Kruskal-Wallis em vez de ANOVA.
Como interpretar o valor p no SPSS?
O valor p representa a probabilidade de observar os resultados obtidos se a hipótese nula for verdadeira. Convencionalmente, p menor que 0,05 indica rejeição da hipótese nula — o resultado é estatisticamente significativo. No SPSS, aparece na coluna “Sig.” das tabelas de output. Importante: significância estatística não equivale a relevância prática. Reporte sempre o tamanho de efeito (d de Cohen, eta²) além do valor p.
Posso usar o JASP ou o jamovi em vez do SPSS para a tese?
Sim. O JASP e o jamovi são alternativas gratuitas e open-source ao SPSS aceites pela maioria das universidades portuguesas. O JASP gera relatórios em formato APA automaticamente e inclui análise Bayesiana. O jamovi tem interface ainda mais intuitiva. A maioria dos orientadores aceita qualquer um dos três, desde que a análise seja correcta e o software mencionado na metodologia.
