, ,

Diretório de Fontes de Dados Abertos para a Tese 2026: Onde Encontrar Dados Secundários (INE, PORDATA, Eurostat, DGEEC, World Bank, OCDE)

Diretório de Fontes de Dados Abertos para a Tese 2026: Onde Encontrar Dados Secundários (INE, PORDATA, Eurostat, DGEEC, World Bank, OCDE)

Encontrar fontes de dados abertos para a tese é um dos momentos mais frustrantes da investigação: sabe que os dados existem algures, mas navegar entre portais governamentais, bases europeias e repositórios internacionais sem um mapa claro custa horas preciosas. Este diretório reúne, numa única página, as principais fontes de dados secundários disponíveis para investigadores e mestrandos em Portugal em 2026 — organizadas por âmbito geográfico e tipo de acesso.

Dados secundários são conjuntos de dados já recolhidos por terceiros (institutos estatísticos, organizações internacionais ou outros investigadores) que pode reutilizar na sua tese sem ter de conduzir trabalho de campo de raiz. A qualidade e a credibilidade da fonte são determinantes para o rigor da análise — daí a importância de saber exatamente onde procurar e como aceder.

Resposta rápida: As principais fontes de dados abertos para a tese em Portugal são o INE (dados nacionais, API livre), a PORDATA (indicadores estruturados, interface simples), a DGEEC (educação e ciência), o Eurostat (dados da UE comparáveis) e o World Bank Open Data (desenvolvimento global). A maioria tem acesso completamente livre; os microdados do INE/DGEEC exigem credenciação via protocolo FCT.

O que são dados secundários e quando usá-los na tese

A investigação por dados secundários — também chamada de análise documental quantitativa ou reanálise de dados — consiste em trabalhar com dados recolhidos por outros organismos para fins que podem diferir dos da sua tese. A diferença face à pesquisa bibliográfica é importante: não está a citar artigos científicos, mas a reutilizar conjuntos de dados brutos ou tratados para responder à sua questão de investigação.

Recorrer a fontes de dados abertos para a tese faz sentido quando a recolha de dados primários não é viável — por custos elevados, acesso a populações restritas ou necessidade de cobrir séries temporais longas — ou quando quer comparar Portugal com outros países usando indicadores padronizados e metodologias homogéneas. A validade desta abordagem depende de duas condições: a fonte ser credível e a metodologia de recolha original estar documentada e adequar-se à sua questão de investigação. Para enquadrar este tipo de abordagem no capítulo metodológico da dissertação, o Guia Completo de Metodologia de Investigação para a Tese explica como justificar a escolha de dados secundários face a dados primários e como situar essa decisão no paradigma da investigação.

Para saber como tratar estes dados depois de os descarregar, consulte o artigo Análise de Dados em Tese: Métodos e Ferramentas 2026. Quanto à partilha dos seus próprios dados de investigação no final da tese, o guia sobre Partilha de Dados de Investigação (Data Availability) explica as obrigações atuais em Portugal e no Brasil.

Fontes oficiais portuguesas

INE — Instituto Nacional de Estatística

Campo Detalhe
URL ine.pt
Tipo de dados Censos, estatísticas demográficas, económicas, sociais e regionais de Portugal
Acesso Livre (portal e API REST em JSON/XML); microdados confidenciais via protocolo INE-DGEEC-FCT
Dica de citação (APA 7) INE. (ano). Nome do indicador [Dataset]. Instituto Nacional de Estatística. https://www.ine.pt

O INE é a fonte de referência para qualquer indicador nacional: população, habitação, mercado de trabalho, salários, contas nacionais, preços e comércio externo. O portal permite descarregar séries temporais em Excel ou CSV. Para dados desagregados ao nível do município ou da NUTS, a Base de Dados do INE é o ponto de partida obrigatório. A API REST do INE possibilita ainda a consulta programática de indicadores diretamente para R, Python ou Stata, o que facilita a reprodutibilidade da análise.

PORDATA — Base de Dados de Portugal Contemporâneo

Campo Detalhe
URL pordata.pt
Tipo de dados Indicadores estruturais sobre Portugal e Europa, agregados de mais de 60 fontes oficiais (INE, Eurostat, OCDE, etc.)
Acesso Completamente livre, sem registo obrigatório
Dica de citação (APA 7) PORDATA. (ano). Nome do indicador. Fundação Francisco Manuel dos Santos. https://www.pordata.pt

Mantida pela Fundação Francisco Manuel dos Santos, a PORDATA distingue-se do INE pela interface simplificada com gráficos interativos prontos a incorporar em apresentações. Agrega dados de mais de 60 entidades nacionais e internacionais, com séries longas sobre educação, saúde, economia e demografia. É particularmente útil para comparar Portugal com outros países europeus sem ter de aceder diretamente ao Eurostat. Na citação académica, identifique sempre a fonte primária dos dados além da PORDATA.

DGEEC — Direção-Geral de Estatísticas da Educação e Ciência

Campo Detalhe
URL dgeec.medu.pt
Tipo de dados Ensino básico, secundário e superior em Portugal; ciência, tecnologia e inovação
Acesso Estatísticas agregadas: livre. Microdados individuais: restrito (credenciação obrigatória via Plataforma de Acreditação — protocolo INE-DGEEC-FCT)
Dica de citação (APA 7) DGEEC. (ano). Nome da publicação/dataset. Ministério da Educação. https://www.dgeec.medu.pt

Para teses em ciências da educação, políticas públicas ou sociologia do ensino superior, a DGEEC é insubstituível. Publica dados sobre inscritos, diplomados, pessoal docente e financiamento por instituição de ensino superior. Os microdados individuais anonimizados estão disponíveis através do protocolo entre o INE, a DGEEC e a FCT: doutorandos com tese registada no registo nacional e mestrandos em determinadas condições podem solicitar credenciação na plataforma acreditacao.dgeec.medu.pt. O acesso é feito num ambiente seguro — os dados não podem ser exportados.

dados.gov.pt — Catálogo Nacional de Dados Abertos

Campo Detalhe
URL dados.gov.pt
Tipo de dados Datasets de organismos públicos portugueses: transportes, ambiente, saúde, urbanismo, administração pública
Acesso Livre, sem registo obrigatório
Dica de citação (APA 7) Nome do organismo produtor. (ano). Nome do dataset [Dataset]. dados.gov.pt. https://dados.gov.pt/pt/datasets/[ID]/

O dados.gov.pt é o catálogo central de dados abertos do Estado português, agregando datasets de dezenas de organismos — desde a ANSR (acidentes rodoviários) ao SNS (internamentos hospitalares) e à APA (qualidade do ar). Os ficheiros estão disponíveis em formatos abertos como CSV, JSON e GeoJSON. É especialmente útil para teses sobre políticas públicas, urbanismo ou ciências do ambiente, onde os dados são produzidos por entidades sectoriais dispersas.

BPStat — Banco de Portugal

Campo Detalhe
URL bpstat.bportugal.pt
Tipo de dados Séries macroeconómicas e financeiras: contas nacionais, balança de pagamentos, taxas de juro, crédito, câmbios, zona euro
Acesso Livre, com API REST documentada
Dica de citação (APA 7) Banco de Portugal. (ano). Nome da série [Dataset]. BPStat. https://bpstat.bportugal.pt

O BPStat disponibiliza centenas de milhar de séries temporais sobre a economia portuguesa e a zona euro. Para teses em economia, finanças ou gestão que precisem de dados sobre taxas de juro, crédito bancário, balança corrente ou PIB, esta é a fonte de referência nacional. A API documentada em bpstat.bportugal.pt/data/docs permite integrar os dados diretamente em Python ou R sem exportações manuais, o que melhora a reprodutibilidade da metodologia.

Investigador a aceder a portais de dados abertos nacionais e internacionais para a recolha de dados secundários da tese
Aceder e combinar dados de múltiplos portais oficiais é uma prática corrente em teses com componente quantitativa

Fontes europeias

Eurostat

Campo Detalhe
URL ec.europa.eu/eurostat/databrowser
Tipo de dados Indicadores comparáveis dos 27 Estados-Membros da UE: economia, emprego, ambiente, saúde, energia, educação
Acesso Livre, sem registo; download em CSV, SDMX-CSV, JSON ou TSV
Dica de citação (APA 7) Eurostat. (ano). Nome do dataset [código do dataset]. Comissão Europeia. https://ec.europa.eu/eurostat/databrowser/product/page/[código]

O Eurostat é o gabinete estatístico da União Europeia e a fonte de eleição quando a tese exige comparações entre países europeus. Abrange temas desde a taxa de desemprego desagregada por género e grupo etário até às emissões de gases com efeito de estufa por setor económico. Os dados podem ser personalizados no Data Browser e descarregados em múltiplos formatos. O código único de cada dataset (por exemplo, une_rt_m para o desemprego mensal) facilita a referenciação precisa e a reprodutibilidade da análise.

data.europa.eu — Portal Europeu de Dados

Campo Detalhe
URL data.europa.eu
Tipo de dados Datasets de todas as instituições e agências da UE: Parlamento, BCE, EMA, ECHA, ESMA, fundos estruturais
Acesso Livre, sem registo
Dica de citação (APA 7) Nome da instituição. (ano). Nome do dataset [Dataset]. data.europa.eu. https://data.europa.eu/data/datasets/[ID]

O data.europa.eu complementa o Eurostat ao agregar dados de todas as instituições europeias, não apenas do gabinete estatístico. É útil para teses sobre regulação (ECHA), medicamentos e ensaios clínicos (EMA), mercados financeiros (ESMA) ou utilização de fundos estruturais. A pesquisa pode ser filtrada por tema, país, formato de ficheiro e tipo de licença de reutilização, o que facilita encontrar datasets específicos para áreas de política europeia.

Fontes internacionais

World Bank Open Data

Campo Detalhe
URL data.worldbank.org
Tipo de dados Indicadores de desenvolvimento para mais de 200 países; séries temporais desde os anos 1960; Microdata Library com inquéritos a famílias
Acesso Livre com API; Microdata Library com registo gratuito
Dica de citação (APA 7) World Bank. (ano). Nome do indicador [Dataset]. https://data.worldbank.org/indicator/[código]

O World Bank Open Data disponibiliza milhares de indicadores sobre crescimento económico, pobreza, saúde, educação e ambiente à escala global. A ferramenta DataBank (databank.worldbank.org) permite criar tabelas personalizadas, gráficos e mapas sem sair do navegador. Para microdados de inquéritos a famílias de países em desenvolvimento — muito usados em teses de economia do desenvolvimento ou saúde pública — a Microdata Library disponibiliza datasets com acesso gratuito mediante registo simples.

OCDE — OECD Data Explorer

Campo Detalhe
URL data-explorer.oecd.org
Tipo de dados Indicadores económicos, educação (PISA, TALIS, Education at a Glance), saúde, emprego, tributação e inovação nos países membros da OCDE
Acesso Dados via OECD Data Explorer: livre. Publicações da OECD iLibrary: acessíveis via b-on nas instituições portuguesas
Dica de citação (APA 7) OECD. (ano). Nome do indicador/dataset. OECD Publishing. https://doi.org/[DOI] ou https://data-explorer.oecd.org

A OCDE é a referência para estudos de educação comparada (PISA, TALIS), políticas fiscais, mercados de trabalho e saúde nos países desenvolvidos. O OECD Data Explorer substitui o antigo OECD.Stat com uma interface mais moderna e exportação em CSV ou SDMX. As publicações detalhadas — Education at a Glance, Health at a Glance, relatórios Economic Outlook — estão disponíveis na b-on para estudantes de instituições de ensino superior portuguesas. Para saber como pesquisar na b-on, consulte o guia Tesify para Encontrar Fontes na b-on e RCAAP.

FMI — IMF Data

Campo Detalhe
URL imf.org/en/Data
Tipo de dados IFS (International Financial Statistics), World Economic Outlook, Balança de Pagamentos, Dívida Global
Acesso Livre
Dica de citação (APA 7) International Monetary Fund. (ano). Nome da base de dados [Dataset]. https://www.imf.org/en/Data

O Fundo Monetário Internacional disponibiliza dados macroeconómicos globais com especial profundidade nas variáveis monetárias e financeiras. O World Economic Outlook Database, publicado duas vezes por ano, contém projeções e dados históricos de crescimento do PIB, inflação, taxa de desemprego e balança de pagamentos para quase todos os países do mundo. Indispensável para teses em economia internacional, finanças públicas ou estudos de convergência.

UN Data — Nações Unidas

Campo Detalhe
URL data.un.org
Tipo de dados Dados de agências ONU: FAO (alimentação e agricultura), OMS (saúde), OIT (trabalho), UNICEF (infância), UNESCO (educação), PNUD (IDH)
Acesso Livre, sem registo
Dica de citação (APA 7) Nome da agência ONU. (ano). Nome do indicador [Dataset]. UNdata. https://data.un.org

O UNdata agrega dados de múltiplas agências especializadas das Nações Unidas num único ponto de acesso. Permite pesquisar indicadores de nutrição (FAO), esperança de vida (OMS), emprego informal (OIT) ou Índice de Desenvolvimento Humano (PNUD). Cada série identifica a agência de origem, o que facilita a citação correta. Útil para teses com comparações internacionais fora do espaço europeu ou para indicadores de desenvolvimento sustentável (ODS).

Mapa conceptual do ecossistema internacional de fontes de dados abertos para investigação: repositórios nacionais, europeus e mundiais
O ecossistema de fontes de dados abertos abrange repositórios nacionais, europeus e organismos internacionais como a ONU, o Banco Mundial e a OCDE

Repositórios de datasets e microdados de investigação

Zenodo

Campo Detalhe
URL zenodo.org
Tipo de dados Datasets de investigação de todas as áreas, depositados por investigadores (incluindo outputs de projetos Horizon Europe)
Acesso Maioritariamente livre (acesso aberto); alguns datasets com acesso condicionado ao pedido do autor
Dica de citação (APA 7) Apelido, I. (ano). Título do dataset (Versão X) [Dataset]. Zenodo. https://doi.org/10.5281/zenodo.[ID]

O Zenodo é o repositório de investigação do CERN, financiado pela Comissão Europeia no âmbito do OpenAIRE. Qualquer investigador pode depositar aqui datasets associados a publicações científicas, e cada depósito recebe um DOI permanente. É a opção mais utilizada para encontrar e citar dados de estudos publicados quando os autores não usaram um repositório institucional. A pesquisa por palavra-chave, área temática ou comunidade (ex.: comunidade OpenAIRE-EU) permite filtrar resultados relevantes para a sua área.

European Social Survey (ESS)

Campo Detalhe
URL europeansocialsurvey.org/data
Tipo de dados Microdados de inquérito bianual de atitudes sociais, valores, comportamentos e bem-estar em mais de 30 países europeus, incluindo Portugal
Acesso Livre com registo gratuito
Dica de citação (APA 7) ESS ERIC. (ano). ESS Round [N] — European Social Survey Round [N] Data [Dataset]. Sikt — Norwegian Agency for Shared Services in Education and Research. Consulte europeansocialsurvey.org para o DOI específico de cada ronda.

O ESS é um inquérito comparativo realizado em ciclos bianuais em mais de 30 países europeus, incluindo Portugal. Os dados cobrem confiança institucional, imigração, bem-estar subjetivo, religião e saúde mental. São microdados individuais representativos da população adulta, disponíveis para download gratuito após registo simples. Amplamente utilizados em teses de ciências sociais, psicologia social e ciência política. É uma das fontes de dados secundários de inquérito mais citadas na literatura europeia.

Microdados estatísticos confidenciais: Protocolo INE-DGEEC-FCT

Para investigação que exige dados individuais anonimizados não disponíveis publicamente — como registos de emprego desagregados, dados censitários individuais ou micro-ficheiros do ensino superior — o protocolo entre o INE, a DGEEC e a FCT prevê acesso mediante credenciação. São elegíveis:

  • Investigadores ativos em unidades de I&D, laboratórios colaborativos e infraestruturas de ciência e tecnologia nacionais
  • Doutorandos com tese em curso registada no registo nacional
  • Outros estudantes em casos justificados e com parecer do orientador

O pedido é feito exclusivamente pela plataforma de acreditação da DGEEC (acreditacao.dgeec.medu.pt). A análise realiza-se num ambiente seguro — os microdados não podem ser exportados nem partilhados. O acesso é restrito e sujeito a aprovação caso a caso.

Como citar fontes de dados abertos na tese

Citar corretamente dados secundários exige identificar o produtor dos dados (não apenas o portal de acesso), o ano de publicação ou de extração, a versão ou edição do dataset quando aplicável, e o DOI ou URL permanente. O formato APA 7.ª edição para datasets é:

Autor/Organização. (Ano). Título do dataset (Versão X) [Dataset]. Nome do repositório. https://doi.org/xxxxx

Quando não existe DOI, use o URL da página de destino do dataset — não o URL de download direto do ficheiro, que pode mudar com o tempo. No texto, mencione a organização produtora e o ano: “de acordo com os dados do INE (2024)” ou “segundo o Eurostat (2025, código une_rt_m)”. Quando usou a PORDATA como interface mas os dados originam do INE, a fórmula académica mais correta é indicar ambos: “Fonte: PORDATA (com base em dados do INE)”.

Para um guia completo sobre a apresentação dos dados em gráficos e tabelas conformes com as normas APA, consulte o artigo Como Criar Gráficos e Tabelas em Normas APA para a Tese Passo a Passo 2026. Se a sua tese usa software estatístico para tratar os dados descarregados, o guia Stata vs SAS vs jamovi 2026 ajuda a escolher a ferramenta certa conforme o tipo de análise e o nível de experiência.

Perguntas frequentes

Qual é a diferença entre dados abertos e acesso aberto na investigação?

Acesso aberto refere-se a artigos e publicações científicas disponíveis gratuitamente — o domínio da b-on e do RCAAP. Dados abertos são conjuntos de dados brutos ou processados disponibilizados por organismos públicos ou investigadores para reutilização — o domínio deste diretório. Uma tese pode usar ambos: artigos em acesso aberto como literatura de revisão, e dados abertos como base empírica da análise quantitativa.

Posso citar a PORDATA em vez do INE na tese de mestrado?

Sim, mas com atenção à cadeia de origem. A PORDATA agrega dados do INE e de outras fontes; na citação académica, recomenda-se identificar também a fonte primária: “Fonte: PORDATA, com base em dados do INE”. Para análises que requerem desagregação geográfica fina ou séries temporais mais extensas, a Base de Dados do INE é mais completa que a PORDATA e é geralmente preferida em dissertações quantitativas.

Como aceder a microdados do INE para uma tese de mestrado?

O acesso a microdados confidenciais do INE faz-se exclusivamente via protocolo INE-DGEEC-FCT. Mestrandos podem ser elegíveis se a tese estiver em curso. O pedido é submetido na plataforma de acreditação da DGEEC (acreditacao.dgeec.medu.pt). A análise realiza-se num ambiente seguro e os dados não podem sair da plataforma. Recomenda-se confirmar com o orientador se a instituição de acolhimento está credenciada antes de iniciar o processo.

O Eurostat é gratuito para estudantes portugueses?

Sim. Todos os dados do Eurostat são de acesso completamente livre e gratuito, sem necessidade de registo. Qualquer pessoa pode descarregar datasets em CSV, SDMX ou JSON diretamente no Data Browser. O Eurostat é financiado pela União Europeia e a sua política de dados permite a reutilização livre, incluindo fins académicos e comerciais, desde que a fonte seja identificada.

Como encontrar datasets específicos da minha área temática?

A abordagem mais eficaz é começar pela fonte temática mais relevante (DGEEC para educação, BPStat para finanças, Eurostat para comparações UE, FAO para alimentação) e depois verificar se existem datasets específicos no Zenodo ou no dados.gov.pt. Nos artigos científicos publicados na sua área, a secção “Dados” ou “Fontes de Dados” indica com frequência os repositórios usados pelos autores — é uma forma rápida de descobrir fontes que outros investigadores já validaram.

Preciso de pedir autorização para usar dados do World Bank ou da OCDE na tese?

Não, para fins académicos não comerciais. Tanto o World Bank Open Data como o OECD Data Explorer disponibilizam os seus dados sob licenças de reutilização abertas (Creative Commons Attribution ou equivalente). A única obrigação é citar corretamente a fonte, identificando a organização, o ano e o URL ou DOI do dataset — exatamente como faria para qualquer outra fonte académica.

Estruture o capítulo de dados da tese com o Tesify

Depois de identificar as fontes certas, o desafio seguinte é integrar os dados no argumento da tese: selecionar variáveis, justificar a fonte, descrever o procedimento de extração e apresentar os resultados em tabelas e gráficos conformes com as normas da sua instituição. O Tesify ajuda a redigir e estruturar a secção metodológica e o capítulo de análise, com sugestões adaptadas às normas APA e NP 405 e ao contexto da sua área de investigação.

Experimentar o Tesify gratuitamente