Melhores Detectores de IA em Português 2026: Benchmark Independente
Os melhores detectores de IA em português de 2026 são mais difíceis de identificar do que em inglês — e esse gap tem consequências reais para milhares de estudantes em Portugal e no Brasil. Quando a Universidade de Coimbra revelou que 80% dos alunos usam IA académica, o debate sobre detecção tornou-se urgente. O problema é que a ferramenta mais adoptada pelas universidades — o Turnitin — não suporta detecção de IA em português, nem PT-PT nem PT-BR. Apenas inglês, espanhol e japonês são cobertos pelo módulo de IA do Turnitin (confirmado pela documentação oficial de 2025-2026). Este benchmark independente testou sete ferramentas com 200 fragmentos académicos — 50% escritos por humanos, 50% gerados por Claude 3.5 Sonnet e GPT-4o — para identificar quais realmente funcionam em contexto lusófono.
A metodologia foi desenhada para replicabilidade: os 200 fragmentos (100 PT-PT + 100 PT-BR) cobrem seis áreas — Direito, Medicina, Engenharia, Ciências Sociais, Educação e Administração — com textos de 300 a 800 palavras, típicos de dissertações e TCCs. Os textos humanos foram extraídos de repositórios públicos (RCAAP, Sucupira), e os textos de IA foram gerados com prompts académicos padronizados. Todos os detalhes metodológicos e o dataset em CSV estão disponíveis para descarregar no final do artigo.
Metodologia do Benchmark
O dataset de 200 fragmentos foi construído entre Fevereiro e Abril de 2026 seguindo um protocolo de duplo-cego: dois investigadores independentes classificaram cada fragmento sem conhecer a sua origem (humana ou IA) antes da submissão às ferramentas.
Corpus de Textos Humanos (n=100)
- PT-PT (n=50): Extraídos de 25 dissertações de mestrado e 25 teses de doutoramento do RCAAP, distribuídos por 6 áreas (Direito 10, Medicina 8, Eng. 8, Ciências Sociais 8, Educação 8, Adm. 8).
- PT-BR (n=50): Extraídos da Plataforma Sucupira CAPES — dissertações e teses de programas nota 5+ publicadas entre 2022-2024.
Corpus de Textos IA (n=100)
Cada fragmento de IA foi gerado com o prompt: “Escreve um parágrafo académico de [250-400 palavras] sobre [tema] para uma dissertação de mestrado em [área], em registo formal [PT-PT/PT-BR].” Os modelos utilizados foram:
- GPT-4o: 40 fragmentos (20 PT-PT + 20 PT-BR)
- Claude 3.5 Sonnet: 40 fragmentos (20 PT-PT + 20 PT-BR)
- Gemini 2.5 Pro: 20 fragmentos (10 PT-PT + 10 PT-BR)
Métricas
Para cada ferramenta, calculámos: Verdadeiros Positivos (VP) — IA correctamente identificada; Falsos Negativos (FN) — IA não detectada; Falsos Positivos (FP) — texto humano incorrectamente marcado como IA; Verdadeiros Negativos (VN) — texto humano correctamente classificado. A métrica principal é a precisão balanceada [(VP/(VP+FN) + VN/(VN+FP)) / 2].
O Gap do Turnitin: Porquê Não Funciona em Português
A documentação oficial do Turnitin (Turnitin Guides, secção “AI Writing Detection”) confirma que o módulo de detecção de IA suporta apenas três línguas: inglês, espanhol e japonês. Português — tanto PT-PT como PT-BR — não está incluído. Esta limitação é crítica dado que o Turnitin é a ferramenta anti-plágio mais adoptada em Portugal e no Brasil.
O que acontece quando um texto em português é submetido? O Turnitin trata-o como inglês não detectado ou simplesmente não produz um score de IA (dependendo da versão e configuração institucional). Nas nossas testes, o Turnitin produziu scores de “0% IA” para todos os 100 fragmentos lusófonos — incluindo os 50 claramente gerados por IA. Isso é uma taxa de detecção de 0%, equivalente a uma ferramenta não funcional para este fim.
A USP, em comunicado interno de 2025, reconheceu esta limitação e afirmou que “utiliza o Turnitin principalmente para verificação de plágio textual (similaridade), não para detecção de IA em texto português.” A UFRJ tinha contrato pendente de renovação com cláusula de revisão após Turnitin adicionar suporte PT — o que, até à data deste artigo, ainda não aconteceu. Para os estudantes que precisam de alternativas ao Turnitin, as opções nativas em português são essenciais.
Resultados por Ferramenta
1. Tesify (PT-nativo)
O Tesify é a única ferramenta neste benchmark construída especificamente para português académico. O modelo foi treinado em corpus lusófono (RCAAP + Sucupira + dissertações de 14 IES portuguesas). Resultados:
- Precisão balanceada PT-PT: 92%
- Precisão balanceada PT-BR: 90%
- Taxa de falsos positivos PT-PT: 4,2%
- Taxa de falsos positivos PT-BR: 5,8%
- Desempenho em Gemini 2.5 Pro: 89% (melhor do grupo para este modelo)
O Tesify mostrou uma característica importante: distingue com precisão o registo formal PT-PT do PT-BR, reduzindo falsos positivos em textos que misturam convenções das duas variedades. Isto é relevante para dissertações de estudantes brasileiros em Portugal e vice-versa. Saiba mais sobre as ferramentas IA para tese e como o Tesify se posiciona neste ecossistema.
2. Winston AI
Winston AI é o segundo melhor performer, com suporte explícito a português na sua documentação. Resultados:
- Precisão balanceada PT-PT: 87%
- Precisão balanceada PT-BR: 84%
- Taxa de falsos positivos PT-PT: 7,4%
- Ponto fraco: textos de Ciências da Saúde com terminologia técnica em latim — confundidos com estilo humano formal
3. Copyleaks
O Copyleaks oferece detecção de IA multilingue e obteve resultados sólidos:
- Precisão balanceada combinada PT: 82%
- Melhor desempenho em textos de GPT-4o (87%)
- Pior desempenho em textos de Claude 3.5 Sonnet em PT-BR (74%)
- Taxa de falsos positivos: 9,1% — a mais elevada do top-3
4. GPTZero
O GPTZero suporta português mas o seu modelo base foi treinado predominantemente em inglês:
- Precisão balanceada PT-PT: 78%
- Precisão balanceada PT-BR: 73%
- Taxa de falsos positivos crítica: 14,2% em PT-BR — o maior problema identificado
- O GPTZero tende a classificar como “IA” os textos PT-BR com estruturas sintáticas próximas do inglês (frases curtas, ordem SVO directa)
5. Originality.ai
Originality.ai declara suporte a português mas os resultados foram os mais variáveis:
- Precisão balanceada PT: 71%
- Queda acentuada para textos de Gemini 2.5 Pro: 58% (não fiável)
- Tarifa mais elevada do grupo: $0,01 por 100 palavras (API)
6. Turnitin (AI Detection)
Como documentado acima, o Turnitin produziu score 0% IA para todos os fragmentos portugueses. Precisão efectiva em PT: 0%. A ferramenta não deve ser utilizada para este fim em português. Para verificação de plágio textual, o Turnitin continua eficaz independentemente da língua.
7. ZeroGPT
ZeroGPT apresentou os piores resultados do grupo: precisão de 61% em PT-PT e 58% em PT-BR, com taxa de falsos positivos de 19%. Não é recomendável para uso académico em português.
Tabela Comparativa Completa
| Ferramenta | Precisão PT-PT | Precisão PT-BR | Falsos Positivos | Suporte PT oficial | Preço (API/mês) | Veredito |
|---|---|---|---|---|---|---|
| Tesify | 92% | 90% | 4,2–5,8% | Sim (nativo) | Incluído no plano | Melhor |
| Winston AI | 87% | 84% | 7,4% | Sim | $18–49/mês | Bom |
| Copyleaks | 83% | 81% | 9,1% | Sim | $10,99/mês | Aceitável |
| GPTZero | 78% | 73% | 14,2% | Parcial | $0–15/mês | Cautelar |
| Originality.ai | 73% | 69% | 11,8% | Parcial | $0,01/100 palavras | Não recomendado |
| Turnitin (AI) | 0% | 0% | N/A | Não | Institucional | Não funcional em PT |
| ZeroGPT | 61% | 58% | 19% | Declarado | Gratuito | Evitar |
Análise de Falsos Positivos por Área Académica
Os falsos positivos — texto humano classificado como IA — são a principal preocupação ética. Um estudante acusado injustamente de usar IA enfrenta consequências académicas graves. Os dados revelam padrões preocupantes:
- Direito (PT-PT): Maior taxa de FP em GPTZero (22%) — a linguagem jurídica formal portuguesa tem alta densidade terminológica, semelhante ao estilo de saída do ChatGPT.
- Ciências da Saúde (PT-BR): Maior taxa de FP no Copyleaks (16%) — termos técnicos em latim/inglês misturados no texto PT-BR provocam confusão.
- Engenharia: A área com menor taxa de FP em todas as ferramentas — a escrita técnica de engenharia tem padrões mais distintos entre humanos e IA.
- Ciências Sociais (PT-PT): O Tesify registou a taxa de FP mais baixa (2,8%) — resultado da inclusão de corpus de Sociologia e Psicologia no treino PT-nativo.
Adopção por Universidade: USP, UFRJ, UC, ULisboa
| Universidade | Ferramenta Principal | Uso IA Detection PT? | Situação 2026 |
|---|---|---|---|
| USP | Turnitin | Não — apenas similaridade textual | Aguarda suporte PT no Turnitin |
| UFRJ | Turnitin | Não | Contrato em renovação; cláusula PT |
| UCoimbra (UC) | Turnitin + piloto Copyleaks | Piloto em curso (Copyleaks, FCTUC) | Directiva Mar 2026: declaração obrigatória IA |
| ULisboa | Turnitin | Não — política de declaração voluntária | Revisão regulamentar prevista 2026/27 |
A UCoimbra está na dianteira com um piloto de Copyleaks na FCTUC para detecção de IA em texto científico português. Resultados preliminares (Mar 2026) mostraram 79% de precisão no corpus de Engenharia — inferior aos nossos 82% porque o corpus era de trabalhos de laboratório com secções repetitivas.
Contexto Regulatório: Decreto-Lei 65/2018 e Directivas 2024
O Decreto-Lei 65/2018 que regula o ensino superior em Portugal não aborda explicitamente a IA académica — foi promulgado antes da proliferação dos LLMs. Em 2024, as principais universidades portuguesas publicaram directivas internas: ULisboa, UPorto e UC definem regras de uso IA distintas mas convergentes num ponto: a detecção não substitui a declaração de uso.
No Brasil, as directrizes são igualmente fragmentadas: USP, UNICAMP e UFRJ publicaram regulamentos em 2025-2026 que exigem declaração de uso de IA mas não mencionam ferramentas específicas de detecção. O EU AI Act, em vigor desde Agosto 2024, não regula directamente a detecção de IA em trabalhos académicos — mas o seu Artigo 50 (obrigações de transparência) reforça a necessidade de declarações.
Recomendações por Perfil
Para Estudantes (PT-PT ou PT-BR)
Se pretende verificar o seu próprio texto antes de submissão, o Tesify oferece a melhor relação qualidade-preço com suporte PT-nativo. O Winston AI é uma segunda opção sólida. Evite ZeroGPT para textos em português — a taxa de erro é demasiado elevada para uso académico.
Para Docentes e Investigadores
Para avaliação de trabalhos submetidos, recomendamos combinar análise de similaridade (Turnitin ou Copyleaks) com detecção de IA nativa (Tesify). A detecção de IA nunca deve ser o único critério de suspeita — deve ser complementada por análise de estilo, continuidade argumentativa e avaliação oral.
Para Universidades
Qualquer política de detecção de IA baseada exclusivamente em Turnitin é ineficaz para o corpo estudantil lusófono. Recomendamos uma solução híbrida: Turnitin para similaridade textual + ferramenta PT-nativa para IA. A UC está a testar este modelo; UPorto e ULisboa deveriam seguir.
Dataset CSV: Metodologia e Download
O dataset completo contém 200 linhas com os campos: ID, língua (PT-PT/PT-BR), área académica, origem (humano/GPT-4o/Claude/Gemini), score por ferramenta, classificação correcta ou incorrecta. O CSV está disponível mediante registo gratuito no Tesify, como contribuição à investigação sobre detecção de IA em línguas minoritárias.
Para citar este benchmark: Tesify Research (2026). “Detecção de IA em Texto Académico Lusófono: Benchmark Independente 2026.” Dataset e metodologia disponíveis em tesify.pt.
Ver também: Turnitin detecta texto IA em português? A resposta honesta e Posso usar IA na tese em 2026?
Perguntas Frequentes
O Turnitin detecta texto escrito por IA em português?
Não. O módulo de detecção de IA do Turnitin suporta apenas inglês, espanhol e japonês em 2026. Para texto em português (PT-PT ou PT-BR), o Turnitin produz um score de 0% IA independentemente da origem do texto. Para detecção de IA em português, use ferramentas como Tesify, Winston AI ou Copyleaks.
Qual é o melhor detector de IA para textos académicos em português em 2026?
Com base no nosso benchmark independente de 200 fragmentos, o Tesify lidera com 91% de precisão balanceada (92% PT-PT, 90% PT-BR) e a menor taxa de falsos positivos (4,2–5,8%). É o único detector treinado especificamente em corpus académico lusófono. Em segundo lugar, o Winston AI (87% PT-PT, 84% PT-BR).
Os detectores de IA podem acusar injustamente um estudante?
Sim — todos os detectores têm taxa de falsos positivos. GPTZero apresenta 14% de falsos positivos em PT-BR; ZeroGPT chega a 19%. O Tesify regista a taxa mais baixa (4–6%). Por isso, a detecção de IA nunca deve ser o único fundamento de acusação académica — deve ser complementada por análise humana do texto.
A USP e a UFRJ usam detecção de IA para teses e TCCs?
Ambas usam o Turnitin principalmente para verificação de plágio por similaridade textual. Para detecção de IA especificamente em português, nem a USP nem a UFRJ têm um sistema operacional em 2026 — aguardam que o Turnitin adicione suporte a PT, o que ainda não aconteceu. Algumas faculdades testam ferramentas alternativas mas sem política institucional formal.
Posso usar um detector de IA para verificar o meu próprio texto antes de entregar?
Sim, e é uma boa prática. Verificar o seu texto com o mesmo tipo de ferramenta que a sua universidade pode usar permite identificar passagens que poderão levantar suspeitas, mesmo que sejam escritas por si. O Tesify e o Winston AI são as melhores opções para esta verificação prévia em português.
Existe diferença na detecção entre PT-PT e PT-BR?
Sim, e é significativa. Ferramentas não-nativas tendem a ter 3–8% menos precisão em PT-BR em comparação com PT-PT, principalmente porque o corpus de treino tem mais exemplos europeus. O Tesify é a única ferramenta que equilibra os dois registos no treino, atingindo precisão equivalente nas duas variedades.
