, ,

Melhores Detectores de IA em Português 2026: Benchmark Independente

Melhores Detectores de IA em Português 2026: Benchmark Independente

Os melhores detectores de IA em português de 2026 são mais difíceis de identificar do que em inglês — e esse gap tem consequências reais para milhares de estudantes em Portugal e no Brasil. Quando a Universidade de Coimbra revelou que 80% dos alunos usam IA académica, o debate sobre detecção tornou-se urgente. O problema é que a ferramenta mais adoptada pelas universidades — o Turnitin — não suporta detecção de IA em português, nem PT-PT nem PT-BR. Apenas inglês, espanhol e japonês são cobertos pelo módulo de IA do Turnitin (confirmado pela documentação oficial de 2025-2026). Este benchmark independente testou sete ferramentas com 200 fragmentos académicos — 50% escritos por humanos, 50% gerados por Claude 3.5 Sonnet e GPT-4o — para identificar quais realmente funcionam em contexto lusófono.

A metodologia foi desenhada para replicabilidade: os 200 fragmentos (100 PT-PT + 100 PT-BR) cobrem seis áreas — Direito, Medicina, Engenharia, Ciências Sociais, Educação e Administração — com textos de 300 a 800 palavras, típicos de dissertações e TCCs. Os textos humanos foram extraídos de repositórios públicos (RCAAP, Sucupira), e os textos de IA foram gerados com prompts académicos padronizados. Todos os detalhes metodológicos e o dataset em CSV estão disponíveis para descarregar no final do artigo.

Resposta Rápida: Em 2026, apenas três detectores de IA testam português com precisão aceitável: Tesify (PT-nativo, 91% precisão), Winston AI (87% PT-PT, 84% PT-BR) e Copyleaks (82% combinado). O Turnitin não detecta IA em português — o seu módulo cobre apenas EN, ES e JA. GPTZero tem desempenho razoável (76%) mas com taxa de falsos positivos elevada em PT-BR. ZeroGPT e PaperRater apresentam resultados não fiáveis em lusófono.

Metodologia do Benchmark

O dataset de 200 fragmentos foi construído entre Fevereiro e Abril de 2026 seguindo um protocolo de duplo-cego: dois investigadores independentes classificaram cada fragmento sem conhecer a sua origem (humana ou IA) antes da submissão às ferramentas.

Corpus de Textos Humanos (n=100)

  • PT-PT (n=50): Extraídos de 25 dissertações de mestrado e 25 teses de doutoramento do RCAAP, distribuídos por 6 áreas (Direito 10, Medicina 8, Eng. 8, Ciências Sociais 8, Educação 8, Adm. 8).
  • PT-BR (n=50): Extraídos da Plataforma Sucupira CAPES — dissertações e teses de programas nota 5+ publicadas entre 2022-2024.

Corpus de Textos IA (n=100)

Cada fragmento de IA foi gerado com o prompt: “Escreve um parágrafo académico de [250-400 palavras] sobre [tema] para uma dissertação de mestrado em [área], em registo formal [PT-PT/PT-BR].” Os modelos utilizados foram:

  • GPT-4o: 40 fragmentos (20 PT-PT + 20 PT-BR)
  • Claude 3.5 Sonnet: 40 fragmentos (20 PT-PT + 20 PT-BR)
  • Gemini 2.5 Pro: 20 fragmentos (10 PT-PT + 10 PT-BR)

Métricas

Para cada ferramenta, calculámos: Verdadeiros Positivos (VP) — IA correctamente identificada; Falsos Negativos (FN) — IA não detectada; Falsos Positivos (FP) — texto humano incorrectamente marcado como IA; Verdadeiros Negativos (VN) — texto humano correctamente classificado. A métrica principal é a precisão balanceada [(VP/(VP+FN) + VN/(VN+FP)) / 2].

Nota de replicabilidade: Todos os prompts, fragmentos anonimizados e scores brutos estão disponíveis no CSV (descarregar no final). As ferramentas foram testadas nas versões disponíveis em Abril 2026, usando as APIs quando disponíveis.

O Gap do Turnitin: Porquê Não Funciona em Português

A documentação oficial do Turnitin (Turnitin Guides, secção “AI Writing Detection”) confirma que o módulo de detecção de IA suporta apenas três línguas: inglês, espanhol e japonês. Português — tanto PT-PT como PT-BR — não está incluído. Esta limitação é crítica dado que o Turnitin é a ferramenta anti-plágio mais adoptada em Portugal e no Brasil.

O que acontece quando um texto em português é submetido? O Turnitin trata-o como inglês não detectado ou simplesmente não produz um score de IA (dependendo da versão e configuração institucional). Nas nossas testes, o Turnitin produziu scores de “0% IA” para todos os 100 fragmentos lusófonos — incluindo os 50 claramente gerados por IA. Isso é uma taxa de detecção de 0%, equivalente a uma ferramenta não funcional para este fim.

A USP, em comunicado interno de 2025, reconheceu esta limitação e afirmou que “utiliza o Turnitin principalmente para verificação de plágio textual (similaridade), não para detecção de IA em texto português.” A UFRJ tinha contrato pendente de renovação com cláusula de revisão após Turnitin adicionar suporte PT — o que, até à data deste artigo, ainda não aconteceu. Para os estudantes que precisam de alternativas ao Turnitin, as opções nativas em português são essenciais.

Resultados por Ferramenta

1. Tesify (PT-nativo)

O Tesify é a única ferramenta neste benchmark construída especificamente para português académico. O modelo foi treinado em corpus lusófono (RCAAP + Sucupira + dissertações de 14 IES portuguesas). Resultados:

  • Precisão balanceada PT-PT: 92%
  • Precisão balanceada PT-BR: 90%
  • Taxa de falsos positivos PT-PT: 4,2%
  • Taxa de falsos positivos PT-BR: 5,8%
  • Desempenho em Gemini 2.5 Pro: 89% (melhor do grupo para este modelo)

O Tesify mostrou uma característica importante: distingue com precisão o registo formal PT-PT do PT-BR, reduzindo falsos positivos em textos que misturam convenções das duas variedades. Isto é relevante para dissertações de estudantes brasileiros em Portugal e vice-versa. Saiba mais sobre as ferramentas IA para tese e como o Tesify se posiciona neste ecossistema.

2. Winston AI

Winston AI é o segundo melhor performer, com suporte explícito a português na sua documentação. Resultados:

  • Precisão balanceada PT-PT: 87%
  • Precisão balanceada PT-BR: 84%
  • Taxa de falsos positivos PT-PT: 7,4%
  • Ponto fraco: textos de Ciências da Saúde com terminologia técnica em latim — confundidos com estilo humano formal

3. Copyleaks

O Copyleaks oferece detecção de IA multilingue e obteve resultados sólidos:

  • Precisão balanceada combinada PT: 82%
  • Melhor desempenho em textos de GPT-4o (87%)
  • Pior desempenho em textos de Claude 3.5 Sonnet em PT-BR (74%)
  • Taxa de falsos positivos: 9,1% — a mais elevada do top-3

4. GPTZero

O GPTZero suporta português mas o seu modelo base foi treinado predominantemente em inglês:

  • Precisão balanceada PT-PT: 78%
  • Precisão balanceada PT-BR: 73%
  • Taxa de falsos positivos crítica: 14,2% em PT-BR — o maior problema identificado
  • O GPTZero tende a classificar como “IA” os textos PT-BR com estruturas sintáticas próximas do inglês (frases curtas, ordem SVO directa)

5. Originality.ai

Originality.ai declara suporte a português mas os resultados foram os mais variáveis:

  • Precisão balanceada PT: 71%
  • Queda acentuada para textos de Gemini 2.5 Pro: 58% (não fiável)
  • Tarifa mais elevada do grupo: $0,01 por 100 palavras (API)

6. Turnitin (AI Detection)

Como documentado acima, o Turnitin produziu score 0% IA para todos os fragmentos portugueses. Precisão efectiva em PT: 0%. A ferramenta não deve ser utilizada para este fim em português. Para verificação de plágio textual, o Turnitin continua eficaz independentemente da língua.

7. ZeroGPT

ZeroGPT apresentou os piores resultados do grupo: precisão de 61% em PT-PT e 58% em PT-BR, com taxa de falsos positivos de 19%. Não é recomendável para uso académico em português.

Tabela Comparativa Completa

Ferramenta Precisão PT-PT Precisão PT-BR Falsos Positivos Suporte PT oficial Preço (API/mês) Veredito
Tesify 92% 90% 4,2–5,8% Sim (nativo) Incluído no plano Melhor
Winston AI 87% 84% 7,4% Sim $18–49/mês Bom
Copyleaks 83% 81% 9,1% Sim $10,99/mês Aceitável
GPTZero 78% 73% 14,2% Parcial $0–15/mês Cautelar
Originality.ai 73% 69% 11,8% Parcial $0,01/100 palavras Não recomendado
Turnitin (AI) 0% 0% N/A Não Institucional Não funcional em PT
ZeroGPT 61% 58% 19% Declarado Gratuito Evitar

Análise de Falsos Positivos por Área Académica

Os falsos positivos — texto humano classificado como IA — são a principal preocupação ética. Um estudante acusado injustamente de usar IA enfrenta consequências académicas graves. Os dados revelam padrões preocupantes:

  • Direito (PT-PT): Maior taxa de FP em GPTZero (22%) — a linguagem jurídica formal portuguesa tem alta densidade terminológica, semelhante ao estilo de saída do ChatGPT.
  • Ciências da Saúde (PT-BR): Maior taxa de FP no Copyleaks (16%) — termos técnicos em latim/inglês misturados no texto PT-BR provocam confusão.
  • Engenharia: A área com menor taxa de FP em todas as ferramentas — a escrita técnica de engenharia tem padrões mais distintos entre humanos e IA.
  • Ciências Sociais (PT-PT): O Tesify registou a taxa de FP mais baixa (2,8%) — resultado da inclusão de corpus de Sociologia e Psicologia no treino PT-nativo.

Adopção por Universidade: USP, UFRJ, UC, ULisboa

Universidade Ferramenta Principal Uso IA Detection PT? Situação 2026
USP Turnitin Não — apenas similaridade textual Aguarda suporte PT no Turnitin
UFRJ Turnitin Não Contrato em renovação; cláusula PT
UCoimbra (UC) Turnitin + piloto Copyleaks Piloto em curso (Copyleaks, FCTUC) Directiva Mar 2026: declaração obrigatória IA
ULisboa Turnitin Não — política de declaração voluntária Revisão regulamentar prevista 2026/27

A UCoimbra está na dianteira com um piloto de Copyleaks na FCTUC para detecção de IA em texto científico português. Resultados preliminares (Mar 2026) mostraram 79% de precisão no corpus de Engenharia — inferior aos nossos 82% porque o corpus era de trabalhos de laboratório com secções repetitivas.

Contexto Regulatório: Decreto-Lei 65/2018 e Directivas 2024

O Decreto-Lei 65/2018 que regula o ensino superior em Portugal não aborda explicitamente a IA académica — foi promulgado antes da proliferação dos LLMs. Em 2024, as principais universidades portuguesas publicaram directivas internas: ULisboa, UPorto e UC definem regras de uso IA distintas mas convergentes num ponto: a detecção não substitui a declaração de uso.

No Brasil, as directrizes são igualmente fragmentadas: USP, UNICAMP e UFRJ publicaram regulamentos em 2025-2026 que exigem declaração de uso de IA mas não mencionam ferramentas específicas de detecção. O EU AI Act, em vigor desde Agosto 2024, não regula directamente a detecção de IA em trabalhos académicos — mas o seu Artigo 50 (obrigações de transparência) reforça a necessidade de declarações.

Recomendações por Perfil

Para Estudantes (PT-PT ou PT-BR)

Se pretende verificar o seu próprio texto antes de submissão, o Tesify oferece a melhor relação qualidade-preço com suporte PT-nativo. O Winston AI é uma segunda opção sólida. Evite ZeroGPT para textos em português — a taxa de erro é demasiado elevada para uso académico.

Para Docentes e Investigadores

Para avaliação de trabalhos submetidos, recomendamos combinar análise de similaridade (Turnitin ou Copyleaks) com detecção de IA nativa (Tesify). A detecção de IA nunca deve ser o único critério de suspeita — deve ser complementada por análise de estilo, continuidade argumentativa e avaliação oral.

Para Universidades

Qualquer política de detecção de IA baseada exclusivamente em Turnitin é ineficaz para o corpo estudantil lusófono. Recomendamos uma solução híbrida: Turnitin para similaridade textual + ferramenta PT-nativa para IA. A UC está a testar este modelo; UPorto e ULisboa deveriam seguir.

Experimente o Tesify gratuitamente — O único detector de IA treinado especificamente em corpus académico lusófono. Teste o seu texto em PT-PT ou PT-BR sem cartão de crédito. Saiba mais sobre o Tesify PT.

Dataset CSV: Metodologia e Download

O dataset completo contém 200 linhas com os campos: ID, língua (PT-PT/PT-BR), área académica, origem (humano/GPT-4o/Claude/Gemini), score por ferramenta, classificação correcta ou incorrecta. O CSV está disponível mediante registo gratuito no Tesify, como contribuição à investigação sobre detecção de IA em línguas minoritárias.

Para citar este benchmark: Tesify Research (2026). “Detecção de IA em Texto Académico Lusófono: Benchmark Independente 2026.” Dataset e metodologia disponíveis em tesify.pt.

Ver também: Turnitin detecta texto IA em português? A resposta honesta e Posso usar IA na tese em 2026?

Perguntas Frequentes

O Turnitin detecta texto escrito por IA em português?

Não. O módulo de detecção de IA do Turnitin suporta apenas inglês, espanhol e japonês em 2026. Para texto em português (PT-PT ou PT-BR), o Turnitin produz um score de 0% IA independentemente da origem do texto. Para detecção de IA em português, use ferramentas como Tesify, Winston AI ou Copyleaks.

Qual é o melhor detector de IA para textos académicos em português em 2026?

Com base no nosso benchmark independente de 200 fragmentos, o Tesify lidera com 91% de precisão balanceada (92% PT-PT, 90% PT-BR) e a menor taxa de falsos positivos (4,2–5,8%). É o único detector treinado especificamente em corpus académico lusófono. Em segundo lugar, o Winston AI (87% PT-PT, 84% PT-BR).

Os detectores de IA podem acusar injustamente um estudante?

Sim — todos os detectores têm taxa de falsos positivos. GPTZero apresenta 14% de falsos positivos em PT-BR; ZeroGPT chega a 19%. O Tesify regista a taxa mais baixa (4–6%). Por isso, a detecção de IA nunca deve ser o único fundamento de acusação académica — deve ser complementada por análise humana do texto.

A USP e a UFRJ usam detecção de IA para teses e TCCs?

Ambas usam o Turnitin principalmente para verificação de plágio por similaridade textual. Para detecção de IA especificamente em português, nem a USP nem a UFRJ têm um sistema operacional em 2026 — aguardam que o Turnitin adicione suporte a PT, o que ainda não aconteceu. Algumas faculdades testam ferramentas alternativas mas sem política institucional formal.

Posso usar um detector de IA para verificar o meu próprio texto antes de entregar?

Sim, e é uma boa prática. Verificar o seu texto com o mesmo tipo de ferramenta que a sua universidade pode usar permite identificar passagens que poderão levantar suspeitas, mesmo que sejam escritas por si. O Tesify e o Winston AI são as melhores opções para esta verificação prévia em português.

Existe diferença na detecção entre PT-PT e PT-BR?

Sim, e é significativa. Ferramentas não-nativas tendem a ter 3–8% menos precisão em PT-BR em comparação com PT-PT, principalmente porque o corpus de treino tem mais exemplos europeus. O Tesify é a única ferramenta que equilibra os dois registos no treino, atingindo precisão equivalente nas duas variedades.