, ,

Estratégia de Pesquisa Bibliográfica 2026: Operadores Booleanos, PICO e Strings de Busca Reprodutíveis

Estratégia de Pesquisa Bibliográfica 2026: Operadores Booleanos, PICO e Strings de Busca Reprodutíveis

A maioria das teses rejeitadas por erros metodológicos não falha na análise de dados — falha muito antes, na pesquisa bibliográfica. Uma estratégia de pesquisa bibliográfica operadores booleanos 2026 mal construída produz resultados enviesados, omite literatura relevante e, no contexto de uma revisão sistemática, invalida toda a metodologia. A diferença entre uma pesquisa reprodutível e uma pesquisa impressionista reside na forma como se constroem, registam e justificam as strings de busca antes de abrir qualquer base de dados.

Este guia cobre o processo completo: desde a decomposição da questão de investigação com PICO/PICo até à combinação de descritores controlados (MeSH, DeCS) com termos livres, passando pela sintaxe específica de Scopus, PubMed e Web of Science, e terminando na documentação exigida pelo protocolo PRISMA 2020. O objetivo é que qualquer investigador seja capaz de replicar exatamente a sua pesquisa seis meses depois — ou que um revisor externo o consiga fazer por si.

Resposta rápida: Uma string de busca reprodutível combina (1) termos derivados do framework PICO/PICo ligados por OR dentro de cada conceito, (2) os quatro conceitos ligados entre si por AND, (3) descritores MeSH ou DeCS em paralelo com termos livres truncados, e (4) filtros de campo explícitos. A string completa deve ser registada no protocolo PROSPERO ou em apêndice da tese, com data de execução, base de dados, versão de plataforma e número de resultados obtidos.

Porque a Estratégia de Pesquisa Define a Qualidade da Revisão

A pesquisa bibliográfica não é uma etapa preliminar — é o núcleo metodológico de qualquer revisão de literatura. Numa revisão narrativa, uma estratégia pobre resulta em análise parcial. Numa revisão sistemática, resulta em viés de seleção documentado, o que equivale a uma falha científica grave. As diretrizes PRISMA 2020 exigem que a string de busca completa seja reprodutível: qualquer investigador independente deve obter o mesmo conjunto de resultados ao executar a mesma pesquisa na mesma base de dados e na mesma data.

Esta exigência tem consequências práticas. Não basta listar palavras-chave na secção de metodologia. É necessário apresentar: a string exata, a lógica de combinação, os filtros aplicados (data, idioma, tipo de documento), e o número de registos devolvidos por cada base de dados. Só assim é possível distinguir a sua decisão metodológica — “optei por não incluir literatura cinzenta” — de uma omissão involuntária.

Para aprofundar a estrutura global de uma revisão sistemática e perceber onde a pesquisa bibliográfica se encaixa no protocolo completo, consulte o guia Revisão Sistemática PRISMA 2020 na Tese: Protocolo Completo + Templates.

PICO e PICo: Decompor a Questão em Conceitos Pesquisáveis

Antes de escrever uma única palavra na caixa de pesquisa, é necessário decompor a questão de investigação em conceitos independentes. Os dois frameworks mais utilizados são PICO (para estudos quantitativos e ensaios clínicos) e PICo (para estudos qualitativos e de fenómenos).

Framework PICO

Componente Definição Exemplo
P — Population Quem são os participantes ou a população de estudo? Adultos com diabetes tipo 2
I — Intervention Qual a intervenção, exposição ou fator de interesse? Exercício aeróbio de moderada intensidade
C — Comparison Com o que se compara? (pode ser ausente) Sem intervenção estruturada / cuidados habituais
O — Outcome Qual o resultado medido? Controlo glicémico (HbA1c)

Framework PICo (para investigação qualitativa)

Componente Definição Exemplo
P — Population Grupo ou comunidade de interesse Estudantes universitários de primeiro ano
I — phenomenon of Interest Fenómeno, experiência ou evento estudado Experiências de transição para o ensino superior
Co — Context Contexto cultural, geográfico ou institucional Universidades públicas portuguesas pós-Bolonha

Para cada componente PICO/PICo, deve listar todos os sinónimos, variantes terminológicas e traduções relevantes. Esta lista torna-se o vocabulário base da sua string de busca. Identificar os descritores controlados correspondentes (ver secção MeSH/DeCS) é o passo seguinte.

Operadores Booleanos: AND, OR e NOT na Prática

Os operadores booleanos são os conectores lógicos que determinam a relação entre os termos de pesquisa. A sua utilização correta é o fator que mais influencia a abrangência e a precisão dos resultados obtidos.

AND — interseção (restringe)

O operador AND recupera apenas os registos que contêm todos os termos ligados. Utiliza-se para combinar os conceitos PICO entre si: cada conceito PICO deve estar ligado ao seguinte por AND. Quanto mais termos se ligam por AND, mais restrita é a pesquisa.

(“diabetes tipo 2” OR “diabetes mellitus tipo 2” OR “T2DM”) AND (“exercício aeróbio” OR “atividade física” OR “aerobic exercise”) AND (“HbA1c” OR “hemoglobina glicada” OR “controlo glicémico”)

OR — união (alarga)

O operador OR recupera registos que contêm qualquer um dos termos ligados. Utiliza-se para agrupar sinónimos, variantes ortográficas e traduções dentro do mesmo conceito PICO. Ao ampliar cada conceito com OR, garante-se que a pesquisa não omite literatura relevante por diferença terminológica entre autores ou tradições disciplinares.

NOT — exclusão (elimina)

O operador NOT exclui registos que contêm um determinado termo. Deve ser utilizado com cautela, pois pode eliminar artigos relevantes que mencionam o termo excluído num contexto diferente do pretendido. Exemplo de uso legítimo: NOT animals[MeSH] em PubMed para restringir a estudos humanos.

Regra de ouro: OR dentro de cada bloco PICO (para alargar sinónimos) e AND entre blocos PICO (para impor todos os conceitos obrigatórios). NOT apenas quando estritamente necessário e justificado no protocolo.

Truncatura, Wildcards e Operadores de Proximidade

Para além dos operadores booleanos, as bases de dados científicas suportam caracteres especiais que aumentam a recuperação sem a necessidade de listar todas as variantes manualmente.

Diagrama explicativo dos operadores booleanos AND, OR e NOT com diagramas de Venn: AND mostra a interseção, OR mostra a união, NOT mostra a exclusão do segundo conjunto
Operadores booleanos em pesquisa bibliográfica: AND (interseção), OR (união) e NOT (exclusão). Fonte: Wikimedia Commons — Concordia University Library / Cvet24, CC BY-SA 4.0

Truncatura (asterisco *)

O asterisco substitui zero ou mais caracteres no final de uma raiz. Permite recuperar simultaneamente o singular, o plural e outras flexões. Por exemplo, enfermei* recupera “enfermeiro”, “enfermeira”, “enfermeiros”, “enfermeiras” e “enfermagem” numa única instrução. Em inglês, nurs* recupera “nurse”, “nurses”, “nursing” e “nursed”.

Wildcard (ponto de interrogação ?)

O ponto de interrogação substitui exatamente um caractere. É especialmente útil para variantes ortográficas entre o inglês britânico e americano: behavio?r recupera “behavior” e “behaviour”. Nem todas as bases de dados suportam este caractere — verifique a documentação da plataforma antes de o usar.

Operadores de proximidade (NEAR, W)

Os operadores de proximidade recuperam registos onde dois termos aparecem a uma distância máxima de N palavras entre si, independentemente da ordem. Em Scopus usa-se W/N (e.g., cognitive W/3 decline) e em PubMed não existe equivalente nativo (usa-se ADJ apenas em algumas bases EBSCO). Em Web of Science usa-se NEAR/N. Estes operadores são particularmente úteis quando o conceito de interesse é frequentemente expresso por colocações variáveis.

Recurso Sintaxe PubMed Sintaxe Scopus Sintaxe WoS
Truncatura nurs* nurs* nurs*
Wildcard wom?n não suportado wom?n
Proximidade não nativo term1 W/3 term2 term1 NEAR/3 term2
Frase exata “exact phrase” “exact phrase” “exact phrase”

Descritores Controlados: MeSH, DeCS e Emtree

Termos livres dependem do vocabulário de cada autor. O mesmo conceito pode ser designado de formas distintas em artigos diferentes, e uma pesquisa baseada exclusivamente em termos livres inevitavelmente omitirá uma parcela da literatura indexada. Os tesauros de vocabulário controlado resolvem este problema ao atribuir um descritor normalizado a todos os artigos que tratam do mesmo conceito, independentemente da terminologia usada pelos autores.

MeSH (Medical Subject Headings)

O MeSH é o vocabulário controlado hierárquico da National Library of Medicine dos Estados Unidos, utilizado para indexar os artigos da PubMed/MEDLINE. Cada conceito tem um termo preferido, sinónimos reconhecidos (entry terms) e uma estrutura em árvore que permite pesquisar o conceito e todos os seus subconceitos com a instrução [MeSH Terms]. Por exemplo, "Diabetes Mellitus, Type 2"[MeSH Terms] recupera todos os artigos indexados com este descritor, incluindo os que usam “non-insulin-dependent diabetes” ou “NIDDM” no texto.

Para identificar os descritores MeSH relevantes, aceda ao MeSH Browser em meshb.nlm.nih.gov e pesquise os conceitos PICO. O PubMed também sugere automaticamente descritores MeSH quando se introduzem termos no campo de pesquisa.

DeCS (Descritores em Ciências da Saúde)

O DeCS é o vocabulário controlado multilingue da BIREME/OPAS/OMS, utilizado para indexar a literatura da BVS (Biblioteca Virtual em Saúde) e do SciELO. É particularmente relevante para investigadores lusófonos, pois inclui descritores em português. Acessível em decs.bvsalud.org, o DeCS é compatível com MeSH mas acrescenta entradas específicas para contextos ibero-americanos.

Emtree (Scopus/Embase)

A base de dados Embase (acessível via Scopus em algumas instituições) utiliza o tesauro Emtree, que é mais abrangente que o MeSH para farmacologia e dispositivos médicos. Para revisões na área das ciências da saúde, combinar MeSH (PubMed) com Emtree (Embase) maximiza a cobertura.

Boas práticas: Combine sempre descritores controlados com termos livres, ligados por OR dentro do mesmo bloco PICO. Os descritores cobrem artigos bem indexados; os termos livres cobrem artigos recentes ainda não indexados com o descritor atualizado ou publicações em bases com indexação menos rigorosa.

Sintaxe por Base de Dados: PubMed, Scopus e Web of Science

Cada base de dados tem uma sintaxe própria para filtros de campo, operadores e qualificadores. Adaptar a mesma string conceptual a cada plataforma é uma competência essencial — copiar a string do PubMed diretamente para o Scopus produz resultados incorretos ou um erro de sintaxe.

PubMed

O PubMed usa colchetes para especificar o campo de pesquisa. Os campos mais utilizados são [Title/Abstract], [MeSH Terms], [MeSH Major Topic] e [Author]. O operador NOT é escrito em maiúsculas. A função “Advanced Search Builder” permite construir a string por blocos e guarda o histórico de pesquisa.

(“Diabetes Mellitus, Type 2″[MeSH Terms] OR “type 2 diabetes”[Title/Abstract] OR “T2DM”[Title/Abstract])
AND
(“Exercise”[MeSH Terms] OR “aerobic exercise”[Title/Abstract] OR “physical activity”[Title/Abstract])
AND
(“Glycated Hemoglobin”[MeSH Terms] OR “HbA1c”[Title/Abstract] OR “glycemic control”[Title/Abstract])
NOT animals[MeSH]

Scopus

O Scopus usa prefixos de campo como TITLE-ABS-KEY() para pesquisar simultaneamente no título, resumo e palavras-chave dos autores. Os operadores booleanos são escritos em maiúsculas e o operador de proximidade é W/N. A função “Advanced Search” aceita strings multi-linha. O Scopus não tem um tesauro próprio comparável ao MeSH, pelo que a pesquisa se baseia predominantemente em termos livres.

TITLE-ABS-KEY(
(“type 2 diabetes” OR “diabetes mellitus type 2” OR “T2DM”)
AND
(“aerobic exercise” OR “physical activity” OR “exercise intervention”)
AND
(“HbA1c” OR “glycated haemoglobin” OR “glycemic control”)
)

Web of Science

O Web of Science (WoS) utiliza prefixos de campo como TS= (Topic — título, resumo, palavras-chave e KeyWords Plus) e TI= (Title). O operador de proximidade é NEAR/N. A pesquisa avançada aceita combinações com números de linha (#1 AND #2 AND #3), o que facilita a construção incremental e a auditoria da estratégia.

#1 TS=(“type 2 diabetes” OR “diabetes mellitus type 2” OR “T2DM”)
#2 TS=(“aerobic exercise” OR “physical activity” OR “exercise intervention”)
#3 TS=(“HbA1c” OR “glycated haemoglobin” OR “glycemic control”)
#1 AND #2 AND #3

Para uma introdução detalhada à estrutura metodológica que enquadra esta pesquisa, consulte o artigo Revisão de Literatura e Metodologia de Investigação PRISMA 2026.

Documentar a Pesquisa segundo PRISMA 2020

O item 7 do checklist PRISMA 2020 exige a apresentação completa das estratégias de pesquisa para pelo menos uma base de dados, com todos os filtros aplicados. O item 8 exige a identificação de todas as bases de dados e fontes pesquisadas, com as datas de execução. Estes requisitos têm implicações práticas diretas na forma como deve registar a sua pesquisa.

O que deve registar obrigatoriamente

  • Nome completo e URL da base de dados (e.g., MEDLINE via PubMed, disponível em pubmed.ncbi.nlm.nih.gov)
  • Data de execução da pesquisa (dia, mês, ano)
  • String de busca completa, exatamente como foi introduzida na plataforma
  • Filtros aplicados (período temporal, idioma, tipo de documento, espécie)
  • Número total de registos devolvidos antes e após a aplicação de filtros
  • Versão da plataforma ou interface, se relevante

Modelo de registo para apêndice de tese

Base de Dados Data Registos Filtros
PubMed/MEDLINE 15 jan. 2026 n = 847 2015–2026; Humans; English/Portuguese
Scopus 15 jan. 2026 n = 1.203 2015–2026; Article/Review
Web of Science 15 jan. 2026 n = 692 2015–2026; Article/Review; English/Portuguese

Este registo deve ser incluído como apêndice da tese e, se a revisão for submetida a publicação, como material suplementar. Para revisões pré-registadas no PROSPERO, a string de busca deve ser incluída no protocolo antes do início da pesquisa. Atualizar a string após a leitura dos primeiros resultados — sem o registar como uma alteração de protocolo — constitui uma prática de HARKing (Hypothesizing After Results are Known) aplicada à pesquisa bibliográfica.

Para um guia detalhado sobre como conduzir revisões de literatura a partir do primeiro passo até à escrita do capítulo, consulte Como Fazer Revisão de Literatura para Teses 2026.

Erros Frequentes e Como Evitá-los

A análise de protocolos de revisão sistemática submetidos a repositórios académicos revela padrões recorrentes de erros na estratégia de pesquisa. Os mais críticos são:

1. Usar apenas termos em português em bases internacionais

A grande maioria da literatura científica indexada em Scopus, PubMed e Web of Science está em inglês. Uma string construída exclusivamente com termos em português recupera uma fração mínima da literatura disponível. A solução é incluir sempre a versão em inglês de cada termo, ligada por OR aos equivalentes em português e espanhol quando relevante.

2. Confundir OR e AND

O erro mais comum é inverter a função dos operadores: usar AND para ligar sinónimos (o que restringe demais a pesquisa a registos que contêm todas as variantes simultaneamente) e OR para ligar conceitos PICO distintos (o que produz conjuntos irrelevantemente amplos). A regra OR-dentro / AND-entre é invariável.

3. Não usar descritores controlados em paralelo com termos livres

Uma pesquisa baseada unicamente em termos livres perde todos os artigos indexados com o descritor padrão mas com terminologia diferente no texto. Uma pesquisa baseada unicamente em MeSH perde artigos recentes ainda não indexados. A combinação dos dois, ligada por OR dentro do bloco PICO correspondente, é a prática recomendada.

4. Não registar a data de execução

As bases de dados são atualizadas diariamente. A mesma string executada em datas diferentes produz resultados diferentes. Sem a data de execução, a pesquisa não é reprodutível. Este erro é tão simples quanto crítico.

5. Aplicar filtros de data antes de validar a string

Aplicar imediatamente um filtro “últimos 5 anos” pode esconder que a string está mal construída — o número de resultados parece razoável mas só porque foi artificialmente limitado. Valide a string sem filtros temporais primeiro, analise os primeiros 20 resultados para confirmar a pertinência, e só então aplique os filtros justificados no protocolo.

Marco Armello, investigador e autor do blog Sobrevivendo na Ciência, documenta com detalhe esta abordagem de combinação de palavras-chave e operadores booleanos em bases especializadas no artigo Como encontrar literatura científica — um recurso de referência para investigadores lusófonos que permanece atual na sua lógica fundamental.

Para uma perspetiva complementar sobre documentação e recursos biblioteconómicos, a Biblioteca da ECA (USP) publicou uma curadoria de obras fundamentais em Biblioteconomia, Bibliografia e Documentação disponível em bibliotecadaeca.wordpress.com.

Perguntas Frequentes

Quantas bases de dados devo pesquisar numa revisão sistemática?

As diretrizes PRISMA 2020 e Cochrane recomendam um mínimo de duas bases de dados abrangentes (e.g., PubMed/MEDLINE + Scopus ou Web of Science), complementadas por bases especializadas na área disciplinar e, se aplicável, pesquisa em literatura cinzenta (repositórios institucionais, registos de ensaios clínicos como ClinicalTrials.gov ou WHO ICTRP). O número adequado depende da disciplina: em ciências da saúde, três a cinco bases é o padrão; em ciências sociais, a inclusão de PsycINFO (via APA) e ERIC é habitual.

Posso usar o mesmo PICO para pesquisas em diferentes bases de dados?

O framework PICO mantém-se constante entre bases de dados, mas a string de busca deve ser adaptada à sintaxe de cada plataforma. O mesmo conjunto de conceitos e termos é traduzido para a sintaxe específica de cada base: colchetes e qualificadores em PubMed, TITLE-ABS-KEY() em Scopus, TS= e operadores NEAR em Web of Science. A comparação dos resultados entre bases é um indicador da cobertura da pesquisa.

O que é uma string de busca sensível versus específica?

Uma string sensível (ou abrangente) prioriza a recuperação de todos os artigos potencialmente relevantes, aceitando um número elevado de resultados irrelevantes que serão depois eliminados na triagem. É a abordagem padrão em revisões sistemáticas. Uma string específica prioriza a precisão, recuperando menos resultados mas com maior pertinência — adequada para revisões de âmbito restrito ou quando o tempo de triagem é limitado. Em revisões sistemáticas formais, a sensibilidade tem precedência sobre a especificidade, com a triagem a fazer o trabalho de filtragem subsequente.

Como verifico se a minha string não omite artigos importantes?

A técnica de validação mais robusta é a “seed article validation”: selecione 5 a 10 artigos reconhecidamente relevantes para o seu tema (obtidos por recomendação de especialistas, citados na literatura de enquadramento, ou de revisões anteriores sobre o mesmo tema) e verifique se a sua string os recupera. Se um artigo-semente não é devolvido pela string, identifique os termos que o descrevem e que estão ausentes da sua estratégia e adicione-os. Repita até que todos os artigos-semente sejam recuperados.

Devo incluir filtros de idioma na string de busca?

Os filtros de idioma devem ser explicitamente justificados no protocolo. Restringir a literatura ao inglês e ao português é metodologicamente aceitável se a justificação for explícita — por exemplo, “limitámos a revisão a artigos em inglês e português por razões de capacidade de triagem”. O que não é aceitável é aplicar o filtro sem o mencionar, pois isso introduz um viés de idioma não documentado. Alguns estudos sobre terapias tradicionais, política de saúde regional ou educação têm volumes significativos de publicação noutras línguas (espanhol, chinês, alemão) que a restrição ao inglês excluiria sistematicamente.

Onde devo colocar a string de busca completa na tese?

A prática recomendada é incluir no corpo da tese (capítulo de metodologia) uma versão sintetizada da estratégia de pesquisa, com a string de pelo menos uma base de dados como exemplo, e remeter para um apêndice com as strings completas de todas as bases pesquisadas. O apêndice deve incluir: nome da base, URL de acesso, data de pesquisa, string completa, filtros aplicados e número de resultados. Esta estrutura satisfaz os requisitos PRISMA 2020 e permite ao júri de avaliação verificar a robustez da pesquisa sem sobrecarregar o texto principal.