,

Análise Bibliométrica para Tese com Bibliometrix em R: Tutorial Completo 2026

Análise Bibliométrica para Tese com Bibliometrix em R: Tutorial Completo 2026

A análise bibliométrica para tese com Bibliometrix em R deixou de ser um privilégio de investigadores avançados e tornou-se uma metodologia acessível a qualquer mestrando disposto a dedicar uma tarde ao RStudio. Em Portugal e no Brasil, as teses de Ciências Sociais, Educação, Gestão e Saúde que incluem um mapa científico do campo de estudo estão a ser cada vez melhor avaliadas — não porque a bibliometria seja obrigatória, mas porque demonstra rigor metodológico e domínio do estado da arte de forma que uma revisão narrativa simplesmente não consegue.

O Bibliometrix é um pacote de R criado por Massimo Aria (Universidade de Nápoles Federico II) e Corrado Cuccurullo (Universidade Luigi Vanvitelli), publicado originalmente em 2017 no Journal of Informetrics e actualmente na versão 4.x com mais de 30.000 utilizadores académicos em todo o mundo. A sua interface gráfica — o Biblioshiny — eliminou praticamente a barreira técnica para quem não programa em R.

Este tutorial cobre o fluxo de trabalho completo: descarga de dados do Scopus ou Web of Science (WoS), instalação do pacote, as análises mais relevantes para uma tese de mestrado, e a interpretação dos resultados para incluir no capítulo de metodologia.

Fluxo de trabalho em 5 passos: (1) Definir a query de pesquisa e descarregar os resultados do Scopus ou WoS em formato BibTeX/CSV; (2) Instalar R, RStudio e o pacote Bibliometrix; (3) Importar os dados com bibliometrix::convert2df(); (4) Executar as análises estatísticas e gerar os mapas visuais; (5) Exportar os gráficos e integrá-los na tese com a interpretação correcta. Tempo estimado: 4-6 horas para um iniciante com 200 artigos.

Por que a Bibliometria é Relevante para a Tese?

A revisão narrativa de literatura — «li 50 artigos e resumo aqui o que dizem» — tem limitações reconhecidas: é susceptível a viés de selecção, não é reprodutível e raramente mapeia o campo de forma sistemática. A análise bibliométrica resolve exactamente estes problemas.

Concretamente, o que a bibliometria permite que uma revisão narrativa não permite:

  • Identificar as obras fundadoras de um campo de forma objectiva (não pelo que o orientador recomendou, mas pelo que a comunidade científica cita).
  • Mapear a evolução temática — perceber como as questões de investigação de um campo evoluíram ao longo de décadas.
  • Identificar grupos de investigadores que colaboram entre si (redes de co-autoria).
  • Detetar clusters temáticos — subtemas emergentes que podem ser a sua lacuna de investigação.
  • Justificar a relevância do seu tema com dados quantitativos sobre a produção científica.

Para teses de Ciências Sociais e Educação nas universidades portuguesas, a análise bibliométrica é especialmente valiosa quando o campo de estudo é interdisciplinar ou relativamente novo. Para uma discussão mais aprofundada sobre metodologia de investigação e como integrar a bibliometria, consulte o nosso guia sobre metodologia de investigação em 2026.

Instalar R, RStudio e o Pacote Bibliometrix

O pré-requisito é ter R e RStudio instalados. Ambos são gratuitos e open source:

  1. Descarregar R em https://cran.r-project.org/ (versão 4.3 ou superior).
  2. Descarregar RStudio Desktop em https://posit.co/ (versão gratuita).
  3. Instalar o Bibliometrix com o seguinte código na consola do RStudio:
install.packages(“bibliometrix”, dependencies = TRUE)
library(bibliometrix)

Dependências importantes que são instaladas automaticamente: ggplot2, igraph, Matrix, reshape2. A instalação completa demora 5-10 minutos dependendo da velocidade da ligação. Em caso de erro, o mais comum é ausência de dependências — execute install.packages("igraph") manualmente.

Para verificar que a instalação foi bem-sucedida:

packageVersion(“bibliometrix”)

Descarregar Dados do Scopus e Web of Science

A qualidade da análise bibliométrica depende directamente da qualidade dos dados de entrada. O Bibliometrix suporta vários formatos de exportação:

Do Scopus

  1. Aceda ao Scopus via b-on (Portugal) ou CAPES (Brasil).
  2. Execute a sua query de pesquisa (ex.: TITLE-ABS-KEY(“digital literacy” AND “higher education”) AND PUBYEAR > 2014).
  3. Seleccione todos os resultados (ou os mais relevantes).
  4. Clique em «Export» → seleccione «CSV» → marque todos os campos de citação e referências.
  5. Guarde o ficheiro como scopus_dataset.csv.

Do Web of Science

  1. Aceda ao WoS via b-on ou CAPES.
  2. Execute a query e seleccione os resultados.
  3. Clique em «Export» → «BibTeX» ou «Formato Simples» → seleccione todos os campos.
  4. O WoS tem um limite de 500 registos por exportação — para corpora maiores, divida em múltiplas exportações.

Dica de qualidade: documente na sua tese exactamente a query utilizada, a base de dados, a data da pesquisa e o número de resultados. Este nível de detalhe é o que distingue uma análise bibliométrica metodologicamente sólida de uma revisão de literatura comum.

Para orientação sobre como aceder às bases de dados através das bibliotecas universitárias, consulte o nosso guia sobre Scopus, Web of Science e DOI.

Importar e Converter os Dados em R

Com os dados exportados, o passo seguinte é importá-los para o R e convertê-los no formato de trabalho do Bibliometrix:

# Para dados do Scopus em CSV
D <- convert2df(file = “scopus_dataset.csv”, dbsource = “scopus”, format = “csv”)

# Para dados do Web of Science em BibTeX
D <- convert2df(file = “wos_dataset.bib”, dbsource = “wos”, format = “bibtex”)

# Verificar a estrutura do dataframe
dim(D) # número de linhas (artigos) x colunas (campos)
colnames(D) # ver os campos disponíveis

O objecto D é um dataframe onde cada linha é um artigo e cada coluna é um campo bibliográfico (autores, título, revista, ano, palavras-chave, referências citadas, etc.).

Análise Descritiva: Produção, Autores, Revistas

A análise descritiva é o ponto de partida e produz as estatísticas básicas do corpus:

results <- biblioAnalysis(D, sep = “;”)
summary(results, k = 10, pause = FALSE)

Outputs gerados:

  • Produção científica anual — evolução do número de publicações por ano.
  • Autores mais produtivos — top 10 autores por número de artigos.
  • Fontes mais relevantes — as revistas onde o campo publica mais.
  • Países com maior produção — mapa geográfico da produção científica.
  • Palavras-chave mais frequentes — nuvem de palavras e tabela de frequências.
  • Artigos mais citados — os 10 mais citados no corpus.

Para a tese, estes dados traduzem-se em afirmações do tipo: «A produção científica sobre literacia digital no ensino superior cresceu 340% entre 2015 e 2024 (n=252 artigos, Scopus), com Portugal e Brasil representando 8% e 12% da produção lusófona, respectivamente.»

Mapa de Co-citação: Identificar as Obras Fundadoras

A análise de co-citação é provavelmente o output mais valioso para a fundamentação teórica da tese. Obras co-citadas frequentemente partilham relevância temática — são os «clássicos» que toda a gente no campo cita.

# Análise de co-citação de referências
NetMatrix <- biblioNetwork(D, analysis = “co-citation”, network = “references”, sep = “;”)

# Visualizar o mapa de co-citação
net <- networkPlot(NetMatrix, n = 50, Title = “Mapa de Co-citação”,
type = “fruchterman”, size.cex = TRUE, size = 20,
remove.multiple = FALSE, labelsize = 1, alpha = 0.5)

O mapa resultante mostra os artigos e livros mais centrais no campo, agrupados em clusters por proximidade temática. Para a tese, isto responde directamente à questão «Quais são as obras incontornáveis do meu campo?» — com evidência bibliométrica em vez de julgamento subjectivo.

Redes de Colaboração entre Autores

# Rede de colaboração entre autores
NetMatrix_authors <- biblioNetwork(D, analysis = “collaboration”,
network = “authors”, sep = “;”)

net_authors <- networkPlot(NetMatrix_authors, n = 30,
Title = “Redes de Colaboração”, type = “kamada”, size = 10)

Este gráfico revela os investigadores mais centrais na rede de colaboração do campo. Para a tese, é útil para identificar os grupos de investigação mais activos e as instituições que lideram o campo — informação relevante para a justificação da escolha das fontes e para a identificação de potenciais orientadores ou colaboradores.

Evolução Temática do Campo

# Análise temática com K-means
res.thematic <- thematicMap(D, field = “DE”, n = 250,
minfreq = 5, stemming = FALSE, size = 0.5, n.labels = 2)
plot(res.thematic$map)

O mapa temático classifica os temas em quatro quadrantes:

  • Motor (alta centralidade, alta densidade) — temas centrais e bem desenvolvidos do campo.
  • Nicho (baixa centralidade, alta densidade) — temas especializados com comunidade consolidada.
  • Emergente (alta centralidade, baixa densidade) — temas novos e com potencial de crescimento.
  • Periférico (baixa centralidade, baixa densidade) — temas marginais ou em declínio.

Para a tese, posicionar o seu tema num dos quadrantes é um argumento metodológico poderoso: se estiver no quadrante «Emergente», está a investigar uma fronteira do conhecimento.

Biblioshiny: A Interface sem Código

Para quem prefere não escrever código R, o Biblioshiny oferece todas as funcionalidades numa interface web interactiva:

library(bibliometrix)
biblioshiny()

Este comando abre um browser com a interface do Biblioshiny. A partir daí, pode:

  • Importar o ficheiro CSV/BibTeX arrastando e largando.
  • Navegar pelas secções de análise descritiva, redes e mapas temáticos.
  • Exportar gráficos em PNG ou PDF prontos para inserir na tese.
  • Descarregar os resultados em tabelas Excel.

O livro de referência é o Science Mapping Analysis: A Primer with Biblioshiny (Aria & Cuccurullo, McGraw-Hill, 2024), que cobre o fluxo SAAS (Science As An Art of Synthesis) com exemplos passo a passo.

Como Interpretar e Escrever os Resultados na Tese

Os gráficos do Bibliometrix são o ponto de partida — a interpretação académica é o que transforma outputs estatísticos em argumentos teóricos.

Estrutura típica da secção de análise bibliométrica numa tese de mestrado (800-1200 palavras):

  1. Protocolo de pesquisa (150w): Base de dados, query, filtros, período, número de resultados.
  2. Análise descritiva (200w): Produção anual, países, revistas — com interpretação do crescimento do campo.
  3. Co-citação (200w): Obras fundadoras identificadas, agrupamento em clusters teóricos.
  4. Mapa temático (200w): Posicionamento do seu tema — motor, nicho, emergente ou periférico.
  5. Implicações para a investigação (200w): O que estes resultados indicam sobre a lacuna que a sua tese preenche.

Para integrar a análise bibliométrica com os métodos de investigação que vai aplicar, leia também o nosso artigo sobre revisão de literatura com IA em 2026 e a análise dos métodos mistos segundo a tipologia de Creswell.

Alternativa Gratuita: OpenAlex com Bibliometrix

Para quem não tem acesso ao Scopus ou WoS através da sua universidade, o OpenAlex é uma alternativa gratuita, aberta e com cobertura comparável:

# Pesquisa directa via OpenAlex API
install.packages(“openalexR”)
library(openalexR)

works <- oa_fetch(
entity = “works”,
title.search = “digital literacy higher education”,
from_publication_date = “2015-01-01”
)
D_oa <- oa2bibliometrix(works)

O OpenAlex cobre mais de 250 milhões de publicações e é actualizado diariamente — tornando-o a alternativa mais robusta para investigadores sem acesso institucional a bases de dados pagas.

FAQ: Análise Bibliométrica com Bibliometrix em R

O que é o Bibliometrix e para que serve na tese?

Bibliometrix é um pacote de R criado por Massimo Aria e Corrado Cuccurullo para análise bibliométrica e mapeamento científico. Permite importar dados do Scopus, Web of Science, PubMed e OpenAlex, analisar a produção científica de um campo e gerar mapas de co-citação, redes de autores e evolução temática — metodologias crescentemente requeridas em revisões de literatura de teses de Ciências Sociais, Educação e Saúde.

Preciso de saber programar em R para usar o Bibliometrix?

Não necessariamente. O Biblioshiny é a interface web interactiva do Bibliometrix que permite executar análises bibliométricas sem escrever código. No entanto, para análises avançadas e para documentar o processo na tese com reprodutibilidade, o script em R é mais indicado.

Posso usar o Bibliometrix sem acesso ao Scopus ou Web of Science?

Sim. O Bibliometrix suporta o OpenAlex, que é gratuito e cobre mais de 250 milhões de publicações. As universidades portuguesas têm acesso à b-on (que inclui Scopus e WoS) e as brasileiras à CAPES. Para quem não tem acesso institucional, o OpenAlex é a alternativa mais robusta.

Quantos artigos preciso para uma análise bibliométrica válida?

A literatura metodológica recomenda pelo menos 50-100 artigos para análises de co-citação e redes de autores significativas. Para análises de evolução temática, 200+ artigos produzem resultados mais robustos. Documente sempre o número exacto de artigos no protocolo de pesquisa da tese.

A análise bibliométrica é aceite como metodologia em teses portuguesas?

Sim, crescentemente. É uma metodologia reconhecida em teses de Ciências Sociais, Educação, Gestão e Saúde nas universidades portuguesas (ULisboa, UPorto, UA) e brasileiras (USP, UNICAMP, UFMG). Deve ser descrita na secção de metodologia com o software, a base de dados, os termos de pesquisa e o período coberto.

Como citar o Bibliometrix na tese em APA 7?

Em APA 7: Aria, M., & Cuccurullo, C. (2017). bibliometrix: An R-tool for comprehensive science mapping analysis. Journal of Informetrics, 11(4), 959–975. https://doi.org/10.1016/j.joi.2017.08.007. Em ABNT: ARIA, M.; CUCCURULLO, C. bibliometrix: an R-tool for comprehensive science mapping analysis. Journal of Informetrics, v. 11, n. 4, p. 959-975, 2017.


Fontes externas consultadas: Bibliometrix — Site Oficial; Bibliometrix — GitHub; Aria & Cuccurullo (2017) — Journal of Informetrics; CRAN — Pacote bibliometrix.