O Azure AI Translator batch document translation agora aceita arquivos de imagem como um tipo de entrada disponível em disponibilidade geral (GA). Essa atualização, anunciada no Azure Updates, permite que times de engenharia e gestores de TI utilizem OCR integrado para extrair e traduzir textos contidos em imagens nos formatos .jpeg, .png, .bmp e .webp.
TL;DR: A Microsoft disponibilizou em GA a capacidade de traduzir imagens em lote no Azure AI Translator, utilizando OCR para extrair textos de formatos como JPEG, PNG, BMP e WebP e traduzi-los automaticamente. Para empresas brasileiras que lidam com documentos digitalizados, placas ou faturas em múltiplos idiomas, isso reduz drasticamente o esforço manual e acelera processos de localização — desde que a qualidade da imagem e a complexidade do layout sejam consideradas.
O que muda para o fluxo de localização de conteúdo?
Até então, a tradução em lote do Azure AI Translator era focada em arquivos de texto estruturados ou documentos como PDF e Word. Com a inclusão de imagens, o pipeline ganha uma camada extra de flexibilidade: qualquer documento cujo conteúdo esteja acessível apenas visualmente (digitalizações de contratos, notas fiscais, cartazes) pode ser processado automaticamente. Na prática, a etapa de OCR ocorre de forma transparente para o usuário — o serviço extrai o texto, traduz e retorna o resultado, mantendo a estrutura original da imagem.
Para empresas brasileiras, os ganhos operacionais são evidentes
Muitas organizações no Brasil lidam com documentos híbridos — contratos com assinaturas escaneadas, faturas de fornecedores internacionais, relatórios técnicos com diagramas. Antes, cada imagem precisava ser submetida a OCR individual e depois alimentar um sistema de tradução separado. Agora, o Azure AI Translator consolida essas etapas em um único batch job, eliminando ferramentas intermediárias e reduzindo o risco de erros de conversão.
Ponto de atenção: a qualidade do OCR depende diretamente da resolução e nitidez da imagem. Imagens com baixa definição, fontes não padronizadas ou layouts complexos (tabelas, colunas) podem impactar a taxa de acerto da extração. É recomendado testar com amostras representativas do seu acervo antes de colocar em produção.
Integração com o ecossistema Azure
A funcionalidade roda sobre o Azure AI Services (anteriormente Cognitive Services) e pode ser acionada via APIs REST ou pelo SDK do Translator. O armazenamento das imagens de entrada e dos resultados de tradução é feito no Azure Storage, o que facilita a orquestração com outras ferramentas como Azure Logic Apps, Data Factory ou até mesmo funções serverless. Permite também o uso de identidades gerenciadas e políticas de rede para manter a segurança dos dados — aspecto crítico para empresas sujeitas à LGPD.
Quando vale a pena usar?
O caso de uso clássico é a localização de materiais de marketing ou documentação técnica que existem apenas em formato impresso e foram digitalizados. Mas também se aplica a processos de compliance: tradução de documentos regulatórios de matrizes estrangeiras, análise de concorrência a partir de catálogos escaneados ou até mesmo extração e tradução de textos de imagens em plataformas de e-commerce.
A desvantagem potencial é o custo: cada imagem processada consome operações de OCR e de tradução. Para grandes volumes, vale simular o custo mensal usando a calculadora do Azure — especialmente se o volume de imagens for alto e o texto extraído for curto (o preço do OCR é por página, independentemente da quantidade de caracteres).
Perguntas Frequentes
Quais formatos de imagem são suportados na tradução em lote?
Os formatos oficialmente suportados como entrada são JPEG, PNG, BMP e WebP. A funcionalidade está em disponibilidade geral (GA) e pode ser usada diretamente no serviço de tradução em lote do Azure AI Translator.
Como o OCR é aplicado às imagens antes da tradução?
O serviço executa OCR (reconhecimento óptico de caracteres) em cada imagem para extrair os textos presentes. Em seguida, o texto reconhecido é traduzido para o idioma de destino configurado no batch, sem necessidade de pré-processamento manual.
Essa funcionalidade substitui a tradução tradicional de documentos textuais?
Não. Ela complementa o pipeline de tradução em lote para cenários onde a fonte original é uma imagem digitalizada. Para documentos nativamente textuais (PDF, DOCX, etc.), o Azure AI Translator já oferece suporte direto sem etapa OCR. A escolha depende do formato de entrada real.
Quais cuidados uma empresa brasileira deve ter ao adotar essa funcionalidade?
É fundamental garantir que as imagens tenham resolução suficiente para OCR preciso — textos borrados, fontes muito pequenas ou layouts complexos podem reduzir a acurácia. Além disso, verifique a política de conformidade do Azure AI Services em relação a dados regionais, especialmente se os documentos contêm informações sensíveis.
Artigo originalmente publicado em Azure Updates - Latest from Azure Charts.