Partilha de Dados de Investigação (Data Availability): Taxas de Adoção PT/BR 2026
Menos de 15% dos artigos científicos publicados por investigadores portugueses e brasileiros incluem um conjunto de dados abertamente acessível numa plataforma de repositório. Esta lacuna — entre o que os mandatos dos financiadores exigem e o que os investigadores efetivamente depositam — continua a ser um dos maiores pontos cegos da partilha de dados de investigação em 2026. Para quem conclui uma tese de mestrado ou doutoramento, perceber este panorama é essencial: cada vez mais júris avaliam a reprodutibilidade dos dados e a presença de uma data availability statement (DAS) na dissertação.
Este artigo apresenta os números reais sobre a adoção de declarações de disponibilidade de dados, o uso de repositórios abertos e os mandatos dos principais financiadores — FCT em Portugal e FAPESP/CNPq no Brasil — com fontes verificadas. Os dados são apresentados por ordem de relevância para estudantes de pós-graduação e investigadores lusófonos.
Declarações de disponibilidade de dados: panorama global
Uma data availability statement (DAS) é uma secção curta — habitualmente um parágrafo — na qual os autores declaram onde os dados que suportam as conclusões do artigo podem ser encontrados, ou explicam por que razão não estão disponíveis. A sua adoção generalizou-se depois de grandes editoras — PLOS, BioMed Central, Springer Nature e Taylor & Francis — a tornarem obrigatória.
| Contexto | Taxa de DAS | Fonte |
|---|---|---|
| PLOS ONE (após mandato) | 93,7% | Revista Ciência da Informação / análise PLOS |
| BMC (BioMed Central, após mandato) | 88,2% | Análise DAS BioMed Central |
| Taylor & Francis (amostra 2023) | 52% | State of Open Data 2024, Springer Nature / Figshare |
| Revistas saúde pública e ambiental (202 revistas) | 66,3% exigem DAS | PMC 11845885 (2024) |
| Artigos com ligação a dados abertos (global) | < 15% | State of Open Data 2024, Springer Nature |
O relatório State of Open Data 2024 — produzido pela Springer Nature, Figshare e Digital Science com análise de três bases de dados (Dimensions, DAS da Springer Nature e o corpus DataCite) — confirma que a publicação de conjuntos de dados abertos atingiu cerca de 2 milhões por ano, um volume equivalente ao total de artigos científicos publicados anualmente em todo o mundo. Contudo, mais de 85% dos artigos continuam a não estar ligados a dados acessíveis num repositório (Springer Nature, 2024).
A discrepância explica-se pela natureza das próprias DAS: ter uma declaração não garante que os dados existam num repositório. Muitas limitam-se a afirmar que “os dados estão disponíveis mediante pedido ao autor correspondente” — uma formulação que, na prática, resulta frequentemente em dados não partilhados.
Portugal: FCT, RCAAP e mandatos de dados abertos
Em Portugal, a Fundação para a Ciência e a Tecnologia (FCT) é o principal financiador nacional e tem vindo a integrar progressivamente a gestão de dados científicos nas suas exigências. Desde 2019, os projetos financiados pela FCT devem elaborar um Plano de Gestão de Dados (PGD/DMP), redigido através da plataforma ARGOS — baseada nas diretrizes da Science Europe. A FCT publicou igualmente, em fevereiro de 2025, o primeiro relatório nacional sobre a implementação da Recomendação da UNESCO sobre Ciência Aberta (FCT, 2025).
No plano da infraestrutura, o RCAAP (Repositórios Científicos de Acesso Aberto de Portugal) constitui o ponto de agregação central da produção científica nacional. O RCAAP mantém ainda um repositório-piloto de dados científicos (dados.rcaap.pt) destinado a conjuntos de dados resultantes de investigação de instituições portuguesas. A gestão é assegurada pela FCCN (unidade da FCT para os serviços digitais) com apoio da Universidade do Minho.
| Iniciativa PT | Estado em 2026 | Âmbito |
|---|---|---|
| DMP obrigatório (FCT) | Ativo desde 2019 | Todos os projetos FCT |
| RCAAP dados.rcaap.pt (piloto) | Operacional | Dados de instituições portuguesas |
| Centros de Gestão de Dados (FCT) | Contratos até Dez 2025 (PRR) | Até 10 centros contratados |
| Fórum GDI (RCAAP) | 12.ª edição — Nov 2025, Bragança | Comunidade nacional de GDI |
| Relatório UNESCO Ciência Aberta | Publicado Fev 2025 | Primeiro relatório nacional PT |
O relatório da FCT à UNESCO reconhece que Portugal não dispõe ainda de uma estratégia nacional unificada de ciência aberta, mas que a FCT integrou os valores da ciência aberta no seu plano estratégico anual. A rede ReData — financiada através do Plano de Recuperação e Resiliência (PRR, investimento “Ciência Mais Digital”) — trabalha para criar uma comunidade de prática nacional dedicada à gestão de dados de investigação.
Para o mestrando ou doutorando, o impacto prático é duplo: a dissertação depositada no repositório institucional integra automaticamente o RCAAP, e qualquer projeto de doutoramento financiado pela FCT exige a elaboração de um DMP. Compreender as diferenças entre validade e confiabilidade na investigação é o passo anterior a decidir que dados abrir e em que repositório depositar.
Brasil: RNP, IBICT e a maturidade dos repositórios
No Brasil, o cenário de dados de investigação evoluiu significativamente em 2024. A Rede Nacional de Ensino e Pesquisa (RNP) e o Instituto Brasileiro de Informação em Ciência e Tecnologia (IBICT) lançaram, em julho de 2024, o Núcleo de Dados de Pesquisa (NDP) — integrado na Rede Brasileira de Repositórios Digitais (RBRD). O NDP apresenta um modelo de governança para impulsionar repositórios de dados científicos nas instituições de ensino e investigação brasileiras.
O programa Dados de Pesquisa Abertos (dadosdepesquisa.rnp.br) visa promover e incentivar a partilha de dados entre investigadores, conferindo maior eficiência na produção de conhecimento científico. A investigação mapeou 15 repositórios de dados distribuídos por múltiplas disciplinas científicas — ciências sociais, agricultura, ciências exatas, ciências biológicas e engenharia.
O SciELO — rede de periódicos científicos de referência para Portugal, Brasil e demais países lusófonos — lançou o SciELO Data em agosto de 2020 e entrou em operação regular em janeiro de 2022. O repositório usa a plataforma de código aberto Dataverse (Harvard IQSS) e indexa conteúdos no Google Dataset Search, Re3Data e FAIRSharing. Cada periódico SciELO mantém o seu próprio dataverse, com datasets ligados aos artigos publicados (SciELO em Perspetiva, 2022).
Repositórios mais utilizados por investigadores lusófonos
A escolha do repositório certo é, para muitos investigadores, a barreira principal à partilha. O Acesso Aberto USP publicou um guia comparativo de plataformas de dados — com base na revisão de Ithaka S+R — que analisa sete repositórios generalistas segundo disciplina, curadoria, prazo de processamento e modelo de acesso (Acesso Aberto USP, 2022).
| Repositório | Disciplina | Custo depósito | Acesso |
|---|---|---|---|
| Zenodo (CERN) | Generalista | Gratuito | Aberto |
| Figshare | Generalista | Gratuito (plano básico) | Aberto |
| Harvard Dataverse | Ciências sociais / generalista | Gratuito | Aberto / restrito |
| Dryad | Ciências da vida / biologia | Taxa de curadoria (pode ser coberta pelo editor) | Aberto |
| SciELO Data | Multidisciplinar (rede SciELO) | Gratuito | Aberto |
| RCAAP dados.rcaap.pt | Generalista PT | Gratuito | Aberto |
| Mendeley Data | Generalista | Gratuito (plano base) | Aberto / restrito |
O critério mais relevante para a maioria dos mestrandos e doutorandos é a compatibilidade com os requisitos do financiador e do periódico de destino. Zenodo e Figshare são as escolhas mais neutras por não imporem restrições disciplinares. Para projetos financiados pela FCT com mandato de dados abertos, o RCAAP é a opção institucional de referência nacional.
Para quem está a organizar a sua estratégia de investigação, perceber como funciona a ciência aberta, o pré-registo e os preprints (OSF, arXiv, SciELO Preprints) ajuda a identificar que repositórios e práticas de partilha são mais valorizados na sua área.
O que leva (e o que impede) a partilha de dados
O relatório State of Open Data 2024 e a análise de Taylor & Francis sobre mais de 8 000 artigos publicados em 2023 revelam um padrão consistente: os investigadores adotam práticas abertas a taxas superiores ao mínimo exigido pelos mandatos, mas as motivações variam fortemente por país.
- EUA: a principal motivação declarada são os requisitos dos financiadores (10,2% dos respondentes citam este fator em primeiro lugar), com menor peso da vantagem de citação (4,9%).
- Japão e Etiópia: a expectativa de ganho de citação é a motivação dominante (14,8% e 9,3%, respetivamente), com os mandatos dos financiadores em segundo plano.
- Portugal e Brasil: não são desagregados separadamente no relatório global, mas enquadram-se no grupo de países com menor pressão normativa explícita e maior ênfase na visibilidade como incentivo.
As principais barreiras identificadas incluem:
- Falta de tempo para preparar e documentar os dados (o obstáculo mais citado em todas as regiões);
- Preocupações com a interpretação incorreta dos dados fora do contexto original;
- Ausência de formação em gestão de dados e princípios FAIR (Findability, Accessibility, Interoperability, Reusability);
- Infraestrutura institucional insuficiente, particularmente no Brasil (acesso à internet, servidores de repositório).
O guia Gestão e Divulgação de Dados de Pesquisa 2024 publicado pelo programa Acesso Aberto da USP — tradução livre do Passeport pour la Science Ouverte do Ministério Francês do Ensino Superior — cita que artigos com dados abertamente partilhados recebem aproximadamente 25% mais citações (com base em análise PLOS ONE), e que a Comissão Europeia estimou em 2019 que uma má gestão de dados custa à França cerca de 3 mil milhões de euros por ano em investigação duplicada e licenciamento desnecessário (Acesso Aberto USP, 2024).
Estruturar corretamente os capítulos de resultados e discussão da tese é o primeiro passo concreto para definir que dados serão recolhidos, em que formato e com que plano de preservação — decisões que determinam se os dados poderão ser, no futuro, efetivamente partilhados.
O que isto significa para a sua tese em 2026
A adoção crescente de mandatos e a pressão para a reprodutibilidade têm implicações diretas para qualquer dissertação de mestrado ou tese de doutoramento produzida em 2026:
1. Inclua uma DAS mesmo que não seja obrigatória
Mesmo quando o regulamento da instituição não exige explicitamente uma data availability statement, incluí-la demonstra rigor metodológico. O formato mínimo aceite é: “Os dados que suportam as conclusões desta dissertação estão disponíveis em [URL do repositório/nome] sob a referência [DOI ou identificador]. Os dados sensíveis estão disponíveis mediante pedido fundamentado ao orientador.”
2. Deposite os dados antes da defesa
Em repositórios como o Zenodo, o depósito pode ser feito com acesso restrito (embargo), tornando-se público numa data futura definida pelo investigador. Esta opção permite cumprir os mandatos do financiador sem expor dados antes da publicação do artigo derivado da dissertação.
3. Conheça os requisitos específicos da FCT ou da sua bolsa
Se a tese está associada a um projeto financiado pela FCT, o DMP é obrigatório. A FCT usa o ARGOS (plataforma integrada com OpenAIRE) para a submissão e atualização dos planos. O template baseia-se nas diretrizes da Science Europe (OpenAIRE / FCT).
4. Documente a proveniência dos dados que utilizou
Se a dissertação usa dados de terceiros (inquéritos públicos, bases de dados administrativas como INE ou IBGE, datasets do Zenodo), a referência bibliográfica do dataset é obrigatória. As normas APA 7 e ABNT indicam formatos específicos para citar datasets — incluindo o DOI do repositório — distintos dos formatos para artigos e livros.
A plataforma Tesify ajuda a estruturar o capítulo de metodologia e a documentar as decisões de recolha e tratamento de dados, gerando automaticamente a secção de ética e gestão de dados que cada vez mais orientadores e júris esperam encontrar numa tese produzida em 2026.
FAQ — Partilha de Dados de Investigação
O que é uma data availability statement (DAS) e é obrigatória na tese?
Uma DAS é uma declaração curta que indica onde os dados de suporte à dissertação podem ser encontrados (ou justifica a sua indisponibilidade). Não é universalmente obrigatória nas teses de mestrado em Portugal e Brasil, mas é cada vez mais exigida pelos regulamentos de doutoramento de universidades de investigação intensiva e por todos os projetos financiados pela FCT. Incluí-la voluntariamente é considerado boa prática científica em 2026.
Que repositório devo usar para depositar os dados da minha tese em Portugal?
Para projetos associados à FCT, o repositório-piloto nacional é o dados.rcaap.pt. Para teses sem financiamento específico, o Zenodo (CERN) é a opção mais utilizada: é gratuito, atribui DOI, aceita qualquer disciplina e permite embargo temporário. O Figshare e o Harvard Dataverse são alternativas igualmente reconhecidas internacionalmente.
A partilha de dados aumenta as citações do meu trabalho?
Sim, a evidência publicada aponta nessa direção. A análise referenciada no guia Acesso Aberto USP (2024), com base num estudo PLOS ONE, indica um aumento de aproximadamente 25% nas citações para artigos com dados abertamente disponíveis, face a artigos comparáveis sem dados partilhados. O efeito é mais pronunciado em disciplinas com maior cultura de reutilização de dados, como a biologia, a saúde e as ciências sociais quantitativas.
O que são os princípios FAIR e como se aplicam à tese?
FAIR significa Findable (encontrável), Accessible (acessível), Interoperable (interoperável) e Reusable (reutilizável). Na prática, aplicar os princípios FAIR à tese implica: depositar os dados num repositório com DOI permanente, usar formatos abertos (CSV, JSON, TIFF) em vez de formatos proprietários, documentar os dados com metadados claros (o que cada variável significa, como foram recolhidos), e escolher uma licença Creative Commons adequada (CC BY ou CC0 para dados científicos).
Posso partilhar dados de inquéritos com dados pessoais dos participantes?
Não diretamente. Dados com identificadores pessoais requerem anonimização antes do depósito num repositório aberto, em conformidade com o RGPD (na Europa) e a LGPD (no Brasil). As técnicas mais comuns são a pseudonimização (substituição de nomes por códigos), a agregação (publicar apenas médias e distribuições, não respostas individuais) e o depósito com acesso restrito mediante protocolo de partilha de dados. O comité de ética da instituição deve ser consultado antes da partilha.
O SciELO Data aceita dados de investigadores portugueses?
Sim. O SciELO Data aceita datasets ligados a artigos publicados em qualquer periódico da rede SciELO, incluindo revistas portuguesas indexadas no SciELO Portugal. O repositório entrou em operação regular em janeiro de 2022, usa a plataforma Dataverse e indexa conteúdos no Google Dataset Search e Re3Data. O acesso ao depósito é gratuito através do endereço data@scielo.org.
