Posso Usar Dados de Terceiros na Tese? FAQ Ética 2026

Posso Usar Dados de Terceiros na Tese? FAQ Ética 2026

Usar dados de terceiros na tese é uma das metodologias mais comuns e legítimas na investigação académica — e também uma das que levanta mais dúvidas éticas e legais. Em 2026, com o RGPD plenamente em vigor na Europa, a LGPD consolidada no Brasil, e os comités de ética universitários cada vez mais atentos, os mestrandos e doutorandos precisam de responder a estas questões antes de submeter o projeto à comissão científica ou de começar a recolher dados.

Este FAQ aborda as questões mais frequentes: quando é legal usar dados de terceiros, que licenças verificar, quando é obrigatório consentimento informado, e o que exigem os comités de ética em Portugal e no Brasil.

Resposta direta: Usar dados de terceiros é legítimo quando os dados são públicos (com licença adequada), cedidos por protocolo institucional, ou recolhidos com consentimento que cubra o uso pretendido. O RGPD (PT) e a LGPD (BR) exigem base legal adequada para qualquer tratamento de dados pessoais, mesmo para fins de investigação. Dados verdadeiramente anonimizados estão fora do âmbito da regulação de proteção de dados. Para dados sensíveis, consulte o comité de ética da sua universidade antes de avançar.

Posso usar dados recolhidos por terceiros na minha tese?

Sim. O uso de dados secundários — dados originalmente recolhidos por outra pessoa, entidade ou estudo, agora utilizados para um novo propósito de investigação — é uma metodologia científica totalmente legítima e amplamente utilizada em ciências sociais, saúde, economia, e muitas outras áreas.

O que muda é a abordagem metodológica: em vez de descrever como recolheu os dados, descreve como os obteve, de que fonte, com que condições de uso, e quais as limitações conhecidas dessa fonte. O blog “Sobrevivendo na Ciência” de Marco Mello explica claramente que uma tese não precisa de ser necessariamente baseada em dados novos recolhidos no campo ou laboratório — dados compilados de literatura ou bases de dados são plenamente válidos para produzir conhecimento original.

As fontes mais comuns de dados de terceiros em teses académicas incluem:

  • Bases de dados governamentais (INE, IBGE, PORDATA, OCDE, Eurostat)
  • Repositórios de dados abertos (Zenodo, Figshare, Harvard Dataverse, OSF)
  • Dados cedidos por empresas ou organizações parceiras através de protocolo
  • Dados de estudos anteriores disponibilizados pelos autores
  • Registos administrativos (saúde, educação, justiça) com autorização formal

É necessário consentimento informado para usar dados de terceiros?

Depende do tipo de dados e da sua origem:

Tipo de dados Consentimento necessário? Notas
Dados públicos anonimizados (INE, IBGE) Não Citar a fonte conforme a licença
Dados pessoais com consentimento original abrangente Verificar cobertura do consentimento O consentimento original deve cobrir o uso secundário
Dados de saúde (mesmo anonimizados) Parecer de comité de ética recomendado Categoria especial RGPD/LGPD
Dados de menores Sim (do representante legal) Mesmo para dados secundários em muitos contextos
Dados cedidos por empresa parceira Protocolo de cedência formal Consentimento incluído no protocolo institucional

O RGPD afeta o uso de dados de terceiros na tese em Portugal?

O RGPD aplica-se sempre que estão em causa dados pessoais de residentes na UE — e “pessoais” significa qualquer informação que permita, direta ou indiretamente, identificar uma pessoa singular. O facto de os dados terem sido recolhidos por terceiros não elimina as obrigações do investigador que os reutiliza.

Para a investigação académica em Portugal, as bases legais mais usadas são:

  • Interesse público (art. 6.º, n.º 1, al. e) e art. 9.º, n.º 2, al. j)): Aplicável a investigação científica de interesse geral, com as salvaguardas técnicas e organizativas adequadas.
  • Consentimento (art. 6.º, n.º 1, al. a)): Quando a investigação não se enquadra no interesse público ou os dados não são cobertos pelo consentimento original.
  • Obrigação legal (art. 6.º, n.º 1, al. c)): Em investigação mandatada por lei.

Dados verdadeiramente anonimizados (onde a re-identificação é impossível mesmo combinando com outras fontes) estão fora do âmbito do RGPD. A pseudonimização — onde a re-identificação é possível com uma chave separada — continua sujeita ao RGPD. Para questões específicas de LGPD e investigação no contexto brasileiro, consulte o artigo sobre LGPD e pesquisa universitária em 2026.


A minha investigação precisa de aprovação do Comité de Ética? — Consulte o guia de dúvidas frequentes da UFSCar (Resolução CNS 510/2016) →
Fonte: ProPq UFSCar — Pró-Reitoria de Pesquisa da Universidade Federal de São Carlos

Que cuidados devo ter ao usar bases de dados abertas na tese?

As bases de dados abertas são um recurso valioso, mas requerem verificação sistemática antes de usar:

  1. Licença de uso: Verifique se a licença permite uso académico e se exige atribuição. As licenças Creative Commons mais comuns em dados abertos são CC-BY (permite uso com atribuição) e CC0 (domínio público).
  2. Atualidade dos dados: Muitas bases de dados abertas não são atualizadas regularmente. Verifique a data da última atualização e declare-a na metodologia.
  3. Limitações e vieses: Documente na metodologia as limitações conhecidas da base (cobertura geográfica, período temporal, critérios de inclusão) — é parte integrante da avaliação da qualidade metodológica.
  4. Citação correta: Bases de dados têm DOI próprio na maioria dos repositórios de dados abertos (Zenodo, Harvard Dataverse). Cite o DOI do dataset, não apenas a publicação associada.

O Ciência Prática tem um guia útil sobre o que escrever na secção de metodologia de um trabalho científico, incluindo a descrição de dados secundários.

Preciso de aprovação do CEP/CEUC para usar dados secundários?

A necessidade de aprovação de um comité de ética para investigação com dados secundários varia por país, instituição, e tipo de dados:

Em Portugal: Os CEUC (Comité de Ética da Universidade de Coimbra) e comités equivalentes noutras universidades têm políticas distintas. Em geral, exige-se parecer quando:

  • Os dados incluem informação de saúde, mesmo anonimizada
  • Os dados envolvem populações vulneráveis (menores, reclusos, pacientes)
  • Existe risco de re-identificação dos sujeitos
  • Os dados foram cedidos por entidade externa sob acordo

Para confirmar a necessidade de submissão, consulte sempre o regulamento do seu programa de doutoramento ou mestrado e o comité de ética da sua universidade antes de avançar com a recolha ou uso dos dados. O artigo sobre ética na investigação, CEUC, CEP e consentimento em 2026 detalha os procedimentos específicos.

No Brasil: A Resolução CNS 510/2016 isenta da submissão ao CEP pesquisas que utilizam informações de domínio público ou bases de dados cujas informações são agregadas (sem possibilidade de identificação individual). Para dados individuais de saúde — mesmo secundários — a submissão ao CEP/CONEP pode ser obrigatória.

Como citar dados cedidos por empresa ou instituição parceira?

Quando os dados são fornecidos por um parceiro externo (empresa, hospital, câmara municipal, ONG), o protocolo recomendado é:

  1. Formalizar a cedência: Elabore um protocolo de cooperação ou carta de cedência que especifique os dados cedidos, os fins de uso, as condições de confidencialidade, e a titularidade dos resultados.
  2. Citar na tese: Na secção de metodologia, indique que os dados foram cedidos por [Nome da entidade] nos termos de [protocolo/acordo] de [data], e descreva as condições de acesso.
  3. Confidencialidade: Se os dados são confidenciais, mencione que “os dados foram cedidos mediante acordo de confidencialidade” sem os divulgar em detalhe. Discuta com o orientador e com a entidade parceira se a publicação em acesso aberto é compatível com essas condições — pode ser necessário solicitar embargo.
  4. Anonimização ou pseudonimização: Mesmo com acordo de confidencialidade, implemente anonimização ou pseudonimização dos dados ao nível adequado antes de os incluir na tese publicada.

Posso usar dados de redes sociais sem consentimento?

A resposta legal é nuançada, e a resposta ética é frequentemente mais restritiva. Dados publicamente visíveis em redes sociais (tweets, posts públicos, perfis abertos) são tecnicamente acessíveis sem consentimento, mas:

  • Os termos de serviço das plataformas podem proibir o scraping para investigação sem acordo específico
  • A expectativa razoável de privacidade dos utilizadores é relevante mesmo para conteúdo público
  • A maioria dos comités de ética recomenda anonimização dos perfis individuais nos resultados publicados
  • Para dados de redes sociais de menores, as cautelas são redobradas

Como boa prática, defenda metodologicamente a legitimidade do uso de dados de redes sociais na secção de ética da sua tese, identifique a base legal (RGPD/LGPD), e descreva as medidas de proteção implementadas (anonimização, agregação).

O que é a pseudonimização e quando devo aplicá-la?

Pseudonimização é o processo de substituição de identificadores diretos (nome, número de identificação, morada) por um código que não permite identificação direta — mas que pode ser revertido com acesso a uma chave separada mantida em segurança. Distingue-se da anonimização, onde a re-identificação é tecnicamente impossível.

Aplique pseudonimização quando:

  • Trabalha com dados pessoais que precisa de manter linkados entre si (por exemplo, dados longitudinais)
  • Necessita de poder corrigir erros ou retirar um participante a seu pedido
  • Os dados ainda não podem ser totalmente anonimizados durante a fase de análise

A pseudonimização é uma exigência técnica explícita do RGPD (art. 25.º, proteção de dados por design) para dados pessoais em investigação. Implemente-a desde o início da recolha — retroativamente é muito mais difícil.

Quando devo construir o meu próprio questionário em vez de usar dados de terceiros?

A escolha entre dados primários (recolhidos por si) e dados secundários (de terceiros) depende fundamentalmente dos seus objetivos de investigação. Escolha dados primários quando:

  • Não existe base de dados que responda à sua pergunta de investigação específica
  • Precisa de variáveis ou escalas específicas não disponíveis noutras fontes
  • A atualidade dos dados é crítica (dados de 2024 não servem para fenómenos de 2026)
  • O seu estudo envolve uma população ou contexto específico não coberto por bases existentes

Se avançar para recolha primária, o artigo sobre como construir um questionário válido para a tese em 2026 guia-o pelas questões de validade, fidelidade e procedimentos de aprovação ética.

Tem dúvidas sobre a ética da investigação na sua tese?
O Tesify inclui revisão da secção metodológica e de ética por especialistas académicos. Saiba como o Tesify pode ajudar a garantir que a sua investigação está eticamente fundamentada.

Mais perguntas frequentes sobre dados de terceiros na tese

Posso usar dados de uma dissertação de outro investigador?

Pode usar os dados se estiverem publicados num repositório de dados abertos (com a licença adequada) ou se o investigador os disponibilizou explicitamente. Citar apenas a dissertação não é suficiente — precisa de acesso autorizado aos dados brutos. Contacte o investigador diretamente e formalize o acordo por email ou protocolo.

Os dados do IBGE ou INE precisam de ser citados?

Sim, obrigatoriamente. Dados de fontes oficiais como o IBGE (Brasil) ou INE (Portugal) devem ser citados com indicação da fonte, do indicador específico, e do ano de referência. As bases de dados do IBGE e INE têm DOI ou URL persistente que deve constar nas referências bibliográficas.

O que acontece se usar dados de terceiros sem autorização?

Para dados com licença restritiva ou direitos de autor, pode incorrer em violação de copyright e as consequências académicas são sérias: reprovação da tese, exigência de correção, ou processo disciplinar. Para dados pessoais sem base legal adequada, pode haver infração ao RGPD ou LGPD com consequências legais para si e para a sua instituição.