,

Partilha de Dados de Investigação (Data Availability): Taxas de Adoção PT/BR 2026

Partilha de Dados de Investigação (Data Availability): Taxas de Adoção PT/BR 2026

Menos de 15% dos artigos científicos publicados por investigadores portugueses e brasileiros incluem um conjunto de dados abertamente acessível numa plataforma de repositório. Esta lacuna — entre o que os mandatos dos financiadores exigem e o que os investigadores efetivamente depositam — continua a ser um dos maiores pontos cegos da partilha de dados de investigação em 2026. Para quem conclui uma tese de mestrado ou doutoramento, perceber este panorama é essencial: cada vez mais júris avaliam a reprodutibilidade dos dados e a presença de uma data availability statement (DAS) na dissertação.

Este artigo apresenta os números reais sobre a adoção de declarações de disponibilidade de dados, o uso de repositórios abertos e os mandatos dos principais financiadores — FCT em Portugal e FAPESP/CNPq no Brasil — com fontes verificadas. Os dados são apresentados por ordem de relevância para estudantes de pós-graduação e investigadores lusófonos.

Resposta rápida: A nível global, cerca de 52% dos investigadores incluem uma declaração de disponibilidade de dados nos seus artigos (Taylor & Francis, 2023, n = 8 000+ artigos), mas apenas uma minoria liga essa declaração a dados efetivamente depositados num repositório aberto. Em Portugal, o RCAAP agrega o repositório-piloto nacional de dados científicos; no Brasil, a RNP e o IBICT lançaram o Núcleo de Dados de Pesquisa (NDP) em 2024. A partilha plena permanece abaixo de 25% na maioria dos países, incluindo Portugal e Brasil.

Declarações de disponibilidade de dados: panorama global

Uma data availability statement (DAS) é uma secção curta — habitualmente um parágrafo — na qual os autores declaram onde os dados que suportam as conclusões do artigo podem ser encontrados, ou explicam por que razão não estão disponíveis. A sua adoção generalizou-se depois de grandes editoras — PLOS, BioMed Central, Springer Nature e Taylor & Francis — a tornarem obrigatória.

Diagrama dos princípios FAIR: Findable (encontrável), Accessible (acessível), Interoperable (interoperável) e Reusable (reutilizável) para gestão de dados de investigação
Os princípios FAIR orientam a partilha de dados científicos em repositórios abertos. Fonte: Wikimedia Commons (CC BY-SA 4.0, SangyaPundir)
Contexto Taxa de DAS Fonte
PLOS ONE (após mandato) 93,7% Revista Ciência da Informação / análise PLOS
BMC (BioMed Central, após mandato) 88,2% Análise DAS BioMed Central
Taylor & Francis (amostra 2023) 52% State of Open Data 2024, Springer Nature / Figshare
Revistas saúde pública e ambiental (202 revistas) 66,3% exigem DAS PMC 11845885 (2024)
Artigos com ligação a dados abertos (global) < 15% State of Open Data 2024, Springer Nature

O relatório State of Open Data 2024 — produzido pela Springer Nature, Figshare e Digital Science com análise de três bases de dados (Dimensions, DAS da Springer Nature e o corpus DataCite) — confirma que a publicação de conjuntos de dados abertos atingiu cerca de 2 milhões por ano, um volume equivalente ao total de artigos científicos publicados anualmente em todo o mundo. Contudo, mais de 85% dos artigos continuam a não estar ligados a dados acessíveis num repositório (Springer Nature, 2024).

A discrepância explica-se pela natureza das próprias DAS: ter uma declaração não garante que os dados existam num repositório. Muitas limitam-se a afirmar que “os dados estão disponíveis mediante pedido ao autor correspondente” — uma formulação que, na prática, resulta frequentemente em dados não partilhados.

Dado-chave: Um estudo publicado na Nature Scientific Data sobre práticas de partilha por disciplina encontrou que, nas ciências da vida, 57% dos artigos disponibilizaram dados de suporte num repositório — contra apenas 20% nas ciências físicas (Scientific Data, 2021). A variação entre áreas é, portanto, superior à variação entre países.

Portugal: FCT, RCAAP e mandatos de dados abertos

Em Portugal, a Fundação para a Ciência e a Tecnologia (FCT) é o principal financiador nacional e tem vindo a integrar progressivamente a gestão de dados científicos nas suas exigências. Desde 2019, os projetos financiados pela FCT devem elaborar um Plano de Gestão de Dados (PGD/DMP), redigido através da plataforma ARGOS — baseada nas diretrizes da Science Europe. A FCT publicou igualmente, em fevereiro de 2025, o primeiro relatório nacional sobre a implementação da Recomendação da UNESCO sobre Ciência Aberta (FCT, 2025).

No plano da infraestrutura, o RCAAP (Repositórios Científicos de Acesso Aberto de Portugal) constitui o ponto de agregação central da produção científica nacional. O RCAAP mantém ainda um repositório-piloto de dados científicos (dados.rcaap.pt) destinado a conjuntos de dados resultantes de investigação de instituições portuguesas. A gestão é assegurada pela FCCN (unidade da FCT para os serviços digitais) com apoio da Universidade do Minho.

Iniciativa PT Estado em 2026 Âmbito
DMP obrigatório (FCT) Ativo desde 2019 Todos os projetos FCT
RCAAP dados.rcaap.pt (piloto) Operacional Dados de instituições portuguesas
Centros de Gestão de Dados (FCT) Contratos até Dez 2025 (PRR) Até 10 centros contratados
Fórum GDI (RCAAP) 12.ª edição — Nov 2025, Bragança Comunidade nacional de GDI
Relatório UNESCO Ciência Aberta Publicado Fev 2025 Primeiro relatório nacional PT

O relatório da FCT à UNESCO reconhece que Portugal não dispõe ainda de uma estratégia nacional unificada de ciência aberta, mas que a FCT integrou os valores da ciência aberta no seu plano estratégico anual. A rede ReData — financiada através do Plano de Recuperação e Resiliência (PRR, investimento “Ciência Mais Digital”) — trabalha para criar uma comunidade de prática nacional dedicada à gestão de dados de investigação.

Para o mestrando ou doutorando, o impacto prático é duplo: a dissertação depositada no repositório institucional integra automaticamente o RCAAP, e qualquer projeto de doutoramento financiado pela FCT exige a elaboração de um DMP. Compreender as diferenças entre validade e confiabilidade na investigação é o passo anterior a decidir que dados abrir e em que repositório depositar.

Brasil: RNP, IBICT e a maturidade dos repositórios

No Brasil, o cenário de dados de investigação evoluiu significativamente em 2024. A Rede Nacional de Ensino e Pesquisa (RNP) e o Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) lançaram, em julho de 2024, o Núcleo de Dados de Pesquisa (NDP) — integrado na Rede Brasileira de Repositórios Digitais (RBRD). O NDP apresenta um modelo de governança para impulsionar repositórios de dados científicos nas instituições de ensino e investigação brasileiras.

O programa Dados de Pesquisa Abertos (dadosdepesquisa.rnp.br) visa promover e incentivar a partilha de dados entre investigadores, conferindo maior eficiência na produção de conhecimento científico. A investigação mapeou 15 repositórios de dados distribuídos por múltiplas disciplinas científicas — ciências sociais, agricultura, ciências exatas, ciências biológicas e engenharia.

Perspetiva regional: O relatório State of Open Data 2024 (Springer Nature / Figshare) identifica o Brasil entre os países com taxa de partilha direta de dados significativamente abaixo de 25%, a par da Etiópia e da Índia, referindo como causas as disparidades de infraestrutura de internet e de suporte institucional. Os EUA e a Europa Central registam as taxas mais elevadas — cerca de 25% de partilha efetiva em repositórios, excluindo declarações “available on request”.

O SciELO — rede de periódicos científicos de referência para Portugal, Brasil e demais países lusófonos — lançou o SciELO Data em agosto de 2020 e entrou em operação regular em janeiro de 2022. O repositório usa a plataforma de código aberto Dataverse (Harvard IQSS) e indexa conteúdos no Google Dataset Search, Re3Data e FAIRSharing. Cada periódico SciELO mantém o seu próprio dataverse, com datasets ligados aos artigos publicados (SciELO em Perspetiva, 2022).

Repositórios mais utilizados por investigadores lusófonos

A escolha do repositório certo é, para muitos investigadores, a barreira principal à partilha. O Acesso Aberto USP publicou um guia comparativo de plataformas de dados — com base na revisão de Ithaka S+R — que analisa sete repositórios generalistas segundo disciplina, curadoria, prazo de processamento e modelo de acesso (Acesso Aberto USP, 2022).

Repositório Disciplina Custo depósito Acesso
Zenodo (CERN) Generalista Gratuito Aberto
Figshare Generalista Gratuito (plano básico) Aberto
Harvard Dataverse Ciências sociais / generalista Gratuito Aberto / restrito
Dryad Ciências da vida / biologia Taxa de curadoria (pode ser coberta pelo editor) Aberto
SciELO Data Multidisciplinar (rede SciELO) Gratuito Aberto
RCAAP dados.rcaap.pt Generalista PT Gratuito Aberto
Mendeley Data Generalista Gratuito (plano base) Aberto / restrito

O critério mais relevante para a maioria dos mestrandos e doutorandos é a compatibilidade com os requisitos do financiador e do periódico de destino. Zenodo e Figshare são as escolhas mais neutras por não imporem restrições disciplinares. Para projetos financiados pela FCT com mandato de dados abertos, o RCAAP é a opção institucional de referência nacional.

Para quem está a organizar a sua estratégia de investigação, perceber como funciona a ciência aberta, o pré-registo e os preprints (OSF, arXiv, SciELO Preprints) ajuda a identificar que repositórios e práticas de partilha são mais valorizados na sua área.

O que leva (e o que impede) a partilha de dados

O relatório State of Open Data 2024 e a análise de Taylor & Francis sobre mais de 8 000 artigos publicados em 2023 revelam um padrão consistente: os investigadores adotam práticas abertas a taxas superiores ao mínimo exigido pelos mandatos, mas as motivações variam fortemente por país.

  • EUA: a principal motivação declarada são os requisitos dos financiadores (10,2% dos respondentes citam este fator em primeiro lugar), com menor peso da vantagem de citação (4,9%).
  • Japão e Etiópia: a expectativa de ganho de citação é a motivação dominante (14,8% e 9,3%, respetivamente), com os mandatos dos financiadores em segundo plano.
  • Portugal e Brasil: não são desagregados separadamente no relatório global, mas enquadram-se no grupo de países com menor pressão normativa explícita e maior ênfase na visibilidade como incentivo.

As principais barreiras identificadas incluem:

  • Falta de tempo para preparar e documentar os dados (o obstáculo mais citado em todas as regiões);
  • Preocupações com a interpretação incorreta dos dados fora do contexto original;
  • Ausência de formação em gestão de dados e princípios FAIR (Findability, Accessibility, Interoperability, Reusability);
  • Infraestrutura institucional insuficiente, particularmente no Brasil (acesso à internet, servidores de repositório).

O guia Gestão e Divulgação de Dados de Pesquisa 2024 publicado pelo programa Acesso Aberto da USP — tradução livre do Passeport pour la Science Ouverte do Ministério Francês do Ensino Superior — cita que artigos com dados abertamente partilhados recebem aproximadamente 25% mais citações (com base em análise PLOS ONE), e que a Comissão Europeia estimou em 2019 que uma má gestão de dados custa à França cerca de 3 mil milhões de euros por ano em investigação duplicada e licenciamento desnecessário (Acesso Aberto USP, 2024).

Estruturar corretamente os capítulos de resultados e discussão da tese é o primeiro passo concreto para definir que dados serão recolhidos, em que formato e com que plano de preservação — decisões que determinam se os dados poderão ser, no futuro, efetivamente partilhados.

O que isto significa para a sua tese em 2026

A adoção crescente de mandatos e a pressão para a reprodutibilidade têm implicações diretas para qualquer dissertação de mestrado ou tese de doutoramento produzida em 2026:

1. Inclua uma DAS mesmo que não seja obrigatória

Mesmo quando o regulamento da instituição não exige explicitamente uma data availability statement, incluí-la demonstra rigor metodológico. O formato mínimo aceite é: “Os dados que suportam as conclusões desta dissertação estão disponíveis em [URL do repositório/nome] sob a referência [DOI ou identificador]. Os dados sensíveis estão disponíveis mediante pedido fundamentado ao orientador.”

2. Deposite os dados antes da defesa

Em repositórios como o Zenodo, o depósito pode ser feito com acesso restrito (embargo), tornando-se público numa data futura definida pelo investigador. Esta opção permite cumprir os mandatos do financiador sem expor dados antes da publicação do artigo derivado da dissertação.

3. Conheça os requisitos específicos da FCT ou da sua bolsa

Se a tese está associada a um projeto financiado pela FCT, o DMP é obrigatório. A FCT usa o ARGOS (plataforma integrada com OpenAIRE) para a submissão e atualização dos planos. O template baseia-se nas diretrizes da Science Europe (OpenAIRE / FCT).

4. Documente a proveniência dos dados que utilizou

Se a dissertação usa dados de terceiros (inquéritos públicos, bases de dados administrativas como INE ou IBGE, datasets do Zenodo), a referência bibliográfica do dataset é obrigatória. As normas APA 7 e ABNT indicam formatos específicos para citar datasets — incluindo o DOI do repositório — distintos dos formatos para artigos e livros.

Para investigadores portugueses: o Blog do Sistema de Bibliotecas da UCS (Universidade de Caxias do Sul) mantém uma lista de fontes nacionais de acesso livre à informação científica brasileira — incluindo BDTD, SciELO e o Portal de Periódicos da CAPES — útil para identificar datasets já disponíveis que podem ser reutilizados em dissertações de ciências sociais, saúde e educação.

A plataforma Tesify ajuda a estruturar o capítulo de metodologia e a documentar as decisões de recolha e tratamento de dados, gerando automaticamente a secção de ética e gestão de dados que cada vez mais orientadores e júris esperam encontrar numa tese produzida em 2026.

FAQ — Partilha de Dados de Investigação

O que é uma data availability statement (DAS) e é obrigatória na tese?

Uma DAS é uma declaração curta que indica onde os dados de suporte à dissertação podem ser encontrados (ou justifica a sua indisponibilidade). Não é universalmente obrigatória nas teses de mestrado em Portugal e Brasil, mas é cada vez mais exigida pelos regulamentos de doutoramento de universidades de investigação intensiva e por todos os projetos financiados pela FCT. Incluí-la voluntariamente é considerado boa prática científica em 2026.

Que repositório devo usar para depositar os dados da minha tese em Portugal?

Para projetos associados à FCT, o repositório-piloto nacional é o dados.rcaap.pt. Para teses sem financiamento específico, o Zenodo (CERN) é a opção mais utilizada: é gratuito, atribui DOI, aceita qualquer disciplina e permite embargo temporário. O Figshare e o Harvard Dataverse são alternativas igualmente reconhecidas internacionalmente.

A partilha de dados aumenta as citações do meu trabalho?

Sim, a evidência publicada aponta nessa direção. A análise referenciada no guia Acesso Aberto USP (2024), com base num estudo PLOS ONE, indica um aumento de aproximadamente 25% nas citações para artigos com dados abertamente disponíveis, face a artigos comparáveis sem dados partilhados. O efeito é mais pronunciado em disciplinas com maior cultura de reutilização de dados, como a biologia, a saúde e as ciências sociais quantitativas.

O que são os princípios FAIR e como se aplicam à tese?

FAIR significa Findable (encontrável), Accessible (acessível), Interoperable (interoperável) e Reusable (reutilizável). Na prática, aplicar os princípios FAIR à tese implica: depositar os dados num repositório com DOI permanente, usar formatos abertos (CSV, JSON, TIFF) em vez de formatos proprietários, documentar os dados com metadados claros (o que cada variável significa, como foram recolhidos), e escolher uma licença Creative Commons adequada (CC BY ou CC0 para dados científicos).

Posso partilhar dados de inquéritos com dados pessoais dos participantes?

Não diretamente. Dados com identificadores pessoais requerem anonimização antes do depósito num repositório aberto, em conformidade com o RGPD (na Europa) e a LGPD (no Brasil). As técnicas mais comuns são a pseudonimização (substituição de nomes por códigos), a agregação (publicar apenas médias e distribuições, não respostas individuais) e o depósito com acesso restrito mediante protocolo de partilha de dados. O comité de ética da instituição deve ser consultado antes da partilha.

O SciELO Data aceita dados de investigadores portugueses?

Sim. O SciELO Data aceita datasets ligados a artigos publicados em qualquer periódico da rede SciELO, incluindo revistas portuguesas indexadas no SciELO Portugal. O repositório entrou em operação regular em janeiro de 2022, usa a plataforma Dataverse e indexa conteúdos no Google Dataset Search e Re3Data. O acesso ao depósito é gratuito através do endereço data@scielo.org.