Diretório de Software de Transcrição Académica 2026: PT/BR Comparado
Transcrever horas de entrevistas é uma das tarefas mais demoradas da investigação qualitativa. Para um estudo de mestrado com seis participantes e entrevistas de 60 minutos cada, a transcrição manual pode consumir entre 30 a 60 horas — semanas de trabalho que o software de transcrição de entrevistas académica comprime para menos de uma tarde. O problema é que as ferramentas disponíveis variam enormemente: algumas confundem sotaques do Porto com os de São Paulo; outras guardam os seus dados em servidores sem certificação RGPD; e muitas cobram por minuto de áudio sem deixar claro o que acontece quando a qualidade da gravação é baixa.
Este diretório compara 12 ferramentas de transcrição com foco explícito no contexto académico lusófono — português europeu (PT-PT) e português do Brasil (PT-BR). Cada ferramenta foi avaliada por precisão reportada, preço real em 2026, existência de plano gratuito ou académico, e conformidade com o Regulamento Geral de Proteção de Dados (RGPD) da União Europeia. Se está a redigir a secção de metodologia da sua tese e precisa justificar a ferramenta que usou, este guia dá-lhe os dados que precisa.
Porque a escolha do software importa na investigação qualitativa
A transcrição não é apenas uma questão de conveniência — é uma decisão metodológica. Quando submete uma tese com entrevistas semiestruturadas, o júri pode questionar a fidedignidade das transcrições. Uma ferramenta que introduz erros sistemáticos em termos técnicos da sua área (por exemplo, confundir “epistemologia” com “estemologia”) compromete a qualidade dos dados que servirão de base à análise. Por isso, o critério de precisão deve ser avaliado não apenas em percentagem geral, mas também para a variedade do português que utiliza e para o vocabulário especializado da sua disciplina.
Há ainda a dimensão ética. Se as suas entrevistas contêm dados pessoais identificáveis — e a esmagadora maioria das entrevistas de investigação social contém —, o envio desses áudios para servidores nos EUA sem base legal adequada viola o RGPD. Antes de carregar qualquer ficheiro, verifique onde os dados são processados, por quanto tempo são retidos e se existe um Acordo de Processamento de Dados (Data Processing Agreement) disponível. Para um guia de transcrição com metodologia detalhada, consulte o artigo como transcrever entrevistas de tese com IA em 2026, que aborda também as boas práticas de verificação e correção manual.
Por fim, pense na integração com o resto do seu fluxo de trabalho. Se vai usar NVivo, ATLAS.ti ou MAXQDA para codificação, precisa confirmar que o software de transcrição exporta nos formatos (.txt, .docx, .vtt, .srt) que esses programas aceitam. Para um panorama completo das ferramentas de codificação, veja o nosso artigo sobre software de análise qualitativa para teses em 2026.
Critérios de avaliação: o que comparamos
Cada ferramenta foi avaliada segundo cinco dimensões:
- Precisão PT-PT / PT-BR: percentagem de palavras corretamente transcritas em áudio com qualidade razoável (gravação em ambiente interior sem ruído excessivo). Os valores reportados vêm das próprias plataformas ou de comparativos independentes; estão indicados como “reportada” quando provêm do fabricante.
- Preço 2026: custo por hora de áudio ou custo mensal do plano mais económico com suporte a português. Todos os preços em EUR sempre que disponíveis, em USD caso contrário.
- Plano gratuito: existência e limites reais do nível gratuito.
- Conformidade RGPD: localização dos servidores, certificações (ISO 27001, SOC 2), disponibilidade de DPA.
- Exportação: formatos suportados para posterior análise qualitativa.
Tabela comparativa: 12 ferramentas de transcrição PT/BR 2026
| Ferramenta | PT-PT | PT-BR | Precisão (reportada) | Preço base 2026 | Gratuito? | RGPD / Servidores | Exportação |
|---|---|---|---|---|---|---|---|
| Whisper (local) | Sim | Sim | 92–96% | Gratuito | Sim (ilimitado) | Offline total — sem envio de dados | .txt, .vtt, .srt, .tsv, .json |
| Amberscript | Sim | Sim | 90% (IA) / 99%+ (humano) | €0,25/min (IA); €1,85/min (humano) | Não | UE; ISO 27001 + ISO 9001; RGPD | .docx, .txt, .srt, .vtt, .xml |
| Sonix | Sim | Sim | 99% (reportada) | $10/hora (pay-as-you-go); $22/mês + $5/hora (premium) | 30 min grátis | EUA; SOC 2; RGPD com DPA | .docx, .txt, .srt, .vtt, .pdf |
| Happy Scribe | Sim | Sim | 95% (IA); 99% (humano) | ~$17/hora (básico); plano subscrição mensal | 10 min (com marca de água) | UE; SOC 2 Type II; RGPD | .docx, .txt, .srt, .vtt, .pdf |
| Notta | Sim | Sim | ~90–95% (estimada) | $8,17/mês (anual); $13,49/mês (1800 min) | 120 min/mês | EUA/Japão; RGPD com DPA | .docx, .txt, .pdf, .srt |
| Transkriptor | Sim | Sim | ~90–95% (estimada) | $8,33/utilizador/mês (anual); $19,99/mês (mensal) | Período de teste | EUA; RGPD referenciado | .docx, .txt, .srt, .pdf |
| Temi | Não | Sim (limitado) | até 95% | $0,25/min (~$15/hora) | Não | EUA; política de privacidade básica | .docx, .txt, .pdf, .srt |
| NovaScribe | Sim | Sim | 94% (áudio limpo); 88% (ruidoso) | $0,20–0,60/hora | Créditos iniciais | EUA; política de privacidade básica | .txt, .docx |
| Descript | Sim | Sim | ~95% (estimada) | ~$2,40/hora (estimativa por utilização) | Plano gratuito limitado | EUA; SOC 2; RGPD com DPA | .txt, .docx, .mp3 (podcast-oriented) |
| Otter.ai | Não | Não | 85% (apenas EN) | $16,99/mês | 300 min/mês (EN apenas) | EUA; SOC 2 | .docx, .txt, .pdf, .srt |
| Google Speech-to-Text API | Sim | Sim | Varia (modelo Chirp: alta) | $0,016/min (modelo padrão); gratuito até 60 min/mês | 60 min/mês | EUA (Google Cloud); RGPD com DPA | JSON (requer pós-processamento) |
| NVivo Transcription | Sim | Sim | ~85–90% (estimada) | Incluído no NVivo (subscrição académica) | Não (requer NVivo) | Microsoft Azure; RGPD com DPA | Integração direta com NVivo |
Nota: os valores de precisão marcados como “estimada” baseiam-se em comparativos independentes publicados; os marcados como “reportada” provêm dos fabricantes e devem ser interpretados com prudência. A precisão real varia com a qualidade do áudio, sotaque e vocabulário técnico.
Fichas detalhadas de cada ferramenta
1. Whisper (OpenAI) — versão local
O Whisper é um modelo de reconhecimento automático de fala treinado pela OpenAI em 680 000 horas de dados áudio multilíngues. A versão que mais interessa a investigadores é a versão local (executada no próprio computador), que não envia qualquer dado para servidores externos — o que o torna na escolha mais segura para entrevistas com dados sensíveis. A precisão em português europeu situa-se entre 92% e 96% com áudio de qualidade razoável, segundo guias publicados por instituições académicas brasileiras. A instalação requer alguma familiaridade com a linha de comandos (Python), mas existem tutoriais detalhados como o publicado pela UFPel. Uma limitação importante documentada pela OpenAI: o modelo pode alucinar — inserir palavras que não foram ditas — especialmente em silêncios longos ou áudio de baixa qualidade. A revisão manual é sempre necessária.
Ideal para: investigadores com dados sensíveis, sem orçamento para ferramentas pagas, confortáveis com instalação técnica básica.
2. Amberscript
O Amberscript é a opção com a conformidade RGPD mais robusta deste diretório: dados processados exclusivamente na UE, certificação ISO 27001 e ISO 9001, e um modelo de transcrição humana disponível para quando a precisão máxima é crítica. O preço da IA parte de €0,25/minuto; a transcrição humana começa em €1,85/minuto. A plataforma suporta 39 línguas, incluindo PT-PT e PT-BR, e exige um compromisso mínimo de três meses nos planos de subscrição. Para investigadores de saúde, ciências sociais ou direito — áreas com dados particularmente sensíveis —, o Amberscript é frequentemente a escolha mais defensável perante comités de ética.
Ideal para: investigadores em Portugal que necessitam de conformidade RGPD documentada e certificada.
3. Sonix
O Sonix apresenta uma precisão reportada de 99% e suporta 53 línguas, incluindo PT-PT e PT-BR. Universidades como Princeton, Stanford e Yale são referenciadas como utilizadoras. O modelo de preços divide-se entre pay-as-you-go ($10/hora) e subscrição premium ($22/mês + $5/hora). Existe um período gratuito de 30 minutos de transcrição — suficiente para testar com uma entrevista curta. O editor online é considerado dos mais polidos do mercado, com sincronização áudio-texto que facilita a revisão. Os dados são processados nos EUA, com um DPA disponível para conformidade RGPD. Para um comparativo detalhado entre o Sonix e alternativas como Whisper e outras plataformas, consulte o artigo comparativo detalhado entre Otter, Whisper e Sonix para transcrição em português.
Ideal para: investigadores que valorizam interface polida, velocidade e boa precisão em PT/BR.
4. Happy Scribe
O Happy Scribe é uma das poucas plataformas com opção de transcrição humana para PT-PT e certificação SOC 2 Type II, com processamento RGPD documentado. A precisão da IA é reportada em 95%; com revisão humana, sobe para 99%. O plano básico custa cerca de $17/hora; existe um plano de subscrição mensal. O plano gratuito oferece 10 minutos mas com marca de água nas exportações — o que o torna inútil para uso académico sério. A interface é simples e o editor de transcrição tem boas ferramentas de formatação para entrevistas com múltiplos interlocutores.
Ideal para: investigadores que precisam de opção humana para PT-PT com garantias RGPD documentadas.
5. Notta
O Notta destaca-se pelo plano gratuito mais generoso deste diretório: 120 minutos de transcrição por mês sem custos. Suporta 104 línguas com tradução em 43, o que é útil para investigação com participantes multilingues. O plano pago parte de $8,17/mês (faturado anualmente) para 1 800 minutos. A plataforma inclui funcionalidades de colaboração em equipa, úteis para projetos com múltiplos investigadores. A localização dos servidores (EUA/Japão) e o DPA disponível permitem conformidade RGPD com as devidas salvaguardas contratuais.
Ideal para: investigadores com orçamento limitado que precisam de transcrever volumes moderados mensalmente.
6. Transkriptor
O Transkriptor tem recebido avaliações positivas de utilizadores que transcrevem em português, com o plano Pro a oferecer 2 400 minutos por mês a $8,33/utilizador/mês (faturado anualmente). A interface é simples e o suporte a múltiplos formatos de exportação é adequado para integração com software de análise qualitativa. Não tem plano gratuito permanente, mas oferece período de teste. Para investigações com grupos de discussão ou entrevistas em par, a identificação de múltiplos oradores (diarização) está disponível nos planos pagos.
Ideal para: investigadores que precisam de volume elevado de transcrição a preço controlado.
7. Temi
O Temi é uma opção acessível ($0,25/minuto, cerca de $15/hora) com boa precisão para inglês. O suporte ao português brasileiro é limitado e ao português europeu é praticamente inexistente — confirmado por utilizadores em fóruns académicos. Para investigação lusófona, não é recomendado como ferramenta principal; pode ser útil para investigadores bilingues que entrevistam participantes anglófonos.
Ideal para: investigadores que entrevistam principalmente em inglês, com orçamento limitado.
8. NovaScribe
O NovaScribe baseia-se no modelo Whisper da OpenAI e adiciona uma interface web. Os testes independentes reportam 94% de precisão com áudio limpo em PT-BR e 88% com áudio ruidoso — os resultados para PT-PT não estão amplamente documentados. O preço por hora ($0,20–0,60) é dos mais baixos do mercado para uma plataforma com interface gráfica. Adequado como alternativa ao Whisper local para quem não quer instalar software.
Ideal para: investigadores que querem a tecnologia Whisper sem instalação, a baixo custo.
9. Descript
O Descript é orientado para produção de podcast e vídeo, mas a sua funcionalidade de transcrição é robusta e suporta PT/BR. A abordagem de edição — em que editar o texto edita o áudio/vídeo — é inovadora mas pode ser superflua para investigação académica pura. O plano gratuito tem limitações significativas; os planos pagos são calculados por créditos de transcrição. Certificação SOC 2 e DPA para RGPD disponíveis.
Ideal para: investigadores que também produzem conteúdo multimédia a partir das suas entrevistas.
10. Otter.ai
O Otter.ai é frequentemente citado em listas genéricas de software de transcrição, mas não suporta português — nem PT-PT nem PT-BR. A precisão máxima de 85% aplica-se apenas ao inglês. Incluímos esta entrada precisamente para alertar investigadores lusófonos que encontram o Otter em listas internacionais: não utilize esta ferramenta para transcrever entrevistas em português.
11. Google Speech-to-Text API
A API do Google Speech-to-Text suporta PT-PT e PT-BR com o modelo Chirp de nova geração. O custo é de $0,016/minuto no modelo padrão, com 60 minutos gratuitos por mês. A grande desvantagem é que requer integração técnica (API) — não existe uma interface de utilizador pronta. Para investigadores com conhecimentos de Python ou R, é uma opção poderosa e económica. Os dados são processados nos servidores do Google Cloud; existe DPA para RGPD.
Ideal para: investigadores com competências técnicas que querem integrar transcrição num pipeline automatizado.
12. NVivo Transcription
O NVivo (Lumivero) inclui funcionalidade de transcrição automática integrada para utilizadores com subscrição ativa. A precisão estimada situa-se entre 85–90% para português. A grande vantagem é a integração direta com o ambiente de codificação — as transcrições ficam imediatamente disponíveis para criar nós e codificar excertos. Se já tem licença NVivo académica, é a opção mais fluida do ponto de vista do fluxo de trabalho. Os dados são processados via Microsoft Azure, com conformidade RGPD e DPA disponíveis.
Ideal para: investigadores que já utilizam NVivo e querem eliminar passos de importação.
Conformidade RGPD e privacidade de dados de investigação
A conformidade RGPD no contexto da transcrição de entrevistas académicas é uma obrigação legal, não uma opção. Se os seus participantes são residentes na União Europeia e as entrevistas contêm dados pessoais identificáveis — nome, emprego, opiniões políticas, dados de saúde —, o envio desses áudios para servidores fora da UE requer uma base legal adequada (Cláusulas Contratuais Tipo ou decisão de adequação do país de destino).
Segundo o blog Ferramentas para Doutorando, a gestão de dados de investigação está a tornar-se um critério crescente na avaliação de projetos de doutoramento — uma tendência que se aplica igualmente ao mestrado.
Resumindo as categorias de risco RGPD para este diretório:
- Risco mínimo (dados nunca saem do seu dispositivo): Whisper local, whisper.cpp
- Risco baixo (dados processados na UE com certificação): Amberscript, Happy Scribe (UE)
- Risco médio (dados nos EUA com DPA disponível): Sonix, Notta, Transkriptor, Descript, Google Cloud (com DPA ativo), NVivo/Azure
- Risco elevado para investigação lusófona (sem suporte a PT ou sem DPA claro): Otter.ai, Temi
📄 10 Razões para Depositar Dados de Investigação em Repositórios — Infografia (PDF, CC BY 4.0)
Antes de escolher uma ferramenta, consulte o comité de ética ou a direção de proteção de dados da sua instituição. Muitas universidades portuguesas têm protocolos específicos para o tratamento de dados áudio de participantes.
Fluxo de trabalho recomendado para teses com entrevistas
Independentemente da ferramenta escolhida, um fluxo de trabalho consistente protege a qualidade dos seus dados:
- Gravação: Use um gravador dedicado ou aplicação de alta qualidade (Otter só se entrevistar em inglês; para PT prefira Notta ou a aplicação nativa do seu telemóvel com boa qualidade de captação). Certifique-se de que o consentimento informado do participante cobre explicitamente o uso de ferramentas de IA para transcrição.
- Pré-processamento: Reduza o ruído de fundo com Audacity (gratuito) antes de carregar o áudio. Ficheiros de maior qualidade = maior precisão.
- Transcrição automática: Carregue o áudio na ferramenta escolhida. Para PT-PT, prefira Amberscript, Whisper local, ou Happy Scribe. Para PT-BR, o Sonix e o Notta são opções sólidas.
- Revisão manual: Toda a transcrição automática requer revisão. Reserve pelo menos 1 hora de revisão para cada hora de áudio transcrito. Verifique especialmente: termos técnicos da sua área, nomes próprios, siglas, e pronúncias regionais.
- Anonimização: Antes de importar para software de análise, substitua nomes e identificadores. Ferramentas como o Find & Replace do Word ou scripts Python simples facilitam este passo.
- Importação para análise: Exporte em .docx ou .txt e importe para NVivo, ATLAS.ti ou MAXQDA. Se usou Whisper, o formato .vtt é compatível com a maioria dos programas de análise qualitativa.
Para um plano detalhado de como estruturar a análise de dados qualitativos após a transcrição, o artigo do Ciência Prática sobre o que escrever na metodologia é um recurso claro para contextualizar as suas escolhas técnicas na secção metodológica. Complementarmente, o blog Marco Armello tem reflexões práticas sobre investigação qualitativa e escrita académica em português do Brasil que ajudam a enquadrar a transcrição no processo mais amplo de produção de conhecimento.
Integração com software de análise qualitativa
A transcrição é apenas o primeiro passo. A integração entre a ferramenta de transcrição e o software de codificação determina em grande medida a fluidez do seu fluxo de trabalho. Para um panorama completo das opções de software de análise qualitativa, incluindo NVivo, ATLAS.ti e MAXQDA, consulte o artigo dedicado. Aqui resumimos as compatibilidades mais relevantes:
| Software de transcrição | NVivo | ATLAS.ti | MAXQDA | Observações |
|---|---|---|---|---|
| Whisper (local) | .vtt / .txt | .txt / .vtt | .txt / .rtf | Exportação via linha de comandos; requer passo extra |
| Amberscript | .docx / .txt | .txt | .docx / .txt | Exportação direta; boa compatibilidade |
| Sonix | .docx / .txt | .txt / .vtt | .docx / .txt | Editor online com timestamps exportáveis |
| Happy Scribe | .docx / .txt | .txt | .docx | Exportação clara; boa integração prática |
| NVivo Transcription | Direto | Via exportação .txt | Via exportação .txt | Integração nativa com NVivo elimina passo de importação |
Para consultar outros recursos académicos digitais que podem complementar o seu processo de investigação — incluindo bases de dados de teses, repositórios e ferramentas de referenciação — veja também a lista de outros recursos gratuitos para académicos em 2026. Se estiver a construir o glossário da sua dissertação, o artigo glossário de termos académicos Portugal-Brasil pode ser um complemento útil para padronizar a terminologia nas suas transcrições.
Perguntas frequentes sobre software de transcrição académica
Qual é o melhor software de transcrição para entrevistas de tese em português europeu?
Para PT-PT, as melhores opções em 2026 são o Whisper local (gratuito, offline, sem envio de dados), o Amberscript (conformidade RGPD rigorosa, dados na UE) e o Happy Scribe (com opção de revisão humana para PT-PT). O Sonix também suporta PT-PT com boa precisão reportada. O Otter.ai não suporta português e deve ser evitado.
O Whisper da OpenAI é legal para transcrever entrevistas académicas com dados pessoais?
A versão local do Whisper (executada no seu próprio computador) é totalmente compatível com o RGPD: os dados nunca saem do seu dispositivo. A API da OpenAI (versão online) requer um Acordo de Processamento de Dados e análise da base legal, tal como qualquer serviço cloud. Para dados sensíveis, recomenda-se sempre a versão local ou o Amberscript.
Existe software de transcrição gratuito para português universitário?
Sim. O Whisper (OpenAI, versão local) é completamente gratuito e sem limites de utilização. O Notta oferece 120 minutos gratuitos por mês. A Google Speech-to-Text API tem 60 minutos gratuitos por mês. O Sonix oferece 30 minutos de teste. Para volumes mais elevados sem custo, o Whisper local é a única opção verdadeiramente ilimitada.
Preciso de incluir referência ao software de transcrição na metodologia da minha tese?
Sim. As normas de investigação qualitativa exigem transparência sobre todos os instrumentos utilizados no processo de recolha e análise de dados. Deve mencionar: nome da ferramenta, versão ou data de acesso, percentagem de revisão manual aplicada, e — se relevante para o comité de ética — a base legal de processamento de dados áudio.
Qual software transcreveu melhor sotaques do interior de Portugal e do Nordeste do Brasil?
O Whisper (OpenAI) foi treinado com uma diversidade ampla de dados áudio em português, incluindo variantes regionais, o que lhe confere robustez para sotaques não-padrão. O Amberscript e o Happy Scribe têm modelos específicos para PT-PT e PT-BR mas são menos transparentes quanto ao desempenho em variantes regionais. Em qualquer caso, a revisão manual é sempre necessária para sotaques muito marcados.
Quanto tempo leva a transcrever 1 hora de entrevista com software de IA?
A transcrição automática de 1 hora de áudio demora tipicamente entre 5 e 15 minutos, dependendo da ferramenta e da velocidade de processamento. A revisão manual subsequente — necessária em qualquer caso — demora entre 1 e 3 horas, conforme a qualidade do áudio e a densidade do vocabulário técnico. No total, o processo com IA é 5 a 10 vezes mais rápido do que a transcrição manual integral.
O Tesify pode ajudar com a análise das entrevistas transcritas?
Sim. Depois de transcrever e rever as entrevistas, o Tesify pode apoiar a redação da secção de análise e discussão da sua tese, ajudando a estruturar os temas emergentes das entrevistas num argumento académico coerente.
Pronto para começar a escrever a sua tese?
Depois de transcrever e analisar as suas entrevistas, o passo seguinte é transformar esses dados numa argumentação académica sólida. O Tesify Editor IA ajuda-o a estruturar a secção de resultados, a redigir a discussão e a formatar as referências — tudo em conformidade com as normas da sua universidade.
