3 de junho de 20269 min de leitura

Expansão da Tradução de Documentos: Novos Recursos Anunciados no Microsoft Build 2026

Swetha Machanavajhala

Azure

Banner - Expansão da Tradução de Documentos: Novos Recursos Anunciados no Microsoft Build 2026

Expansão da Tradução de Documentos: Novos Recursos Anunciados no Microsoft Build 2026

TL;DR: O Document Translation do Azure Translator ganhou suporte a tradução síncrona e em batch de imagens, melhor fidelidade em PDFs com Azure AI Document Intelligence, compatibilidade nativa com XML DITA e XLIFF 2.0, e tradução de imagens dentro de documentos Office. Além disso, virá integração com LLMs (GPT-5.x). Para empresas brasileiras, isso significa redução de retrabalho em pipelines de localização e maior velocidade na entrega de conteúdo multilíngue, com custos adicionais por imagem e por uso de LLM.

No Microsoft Build 2026, a Microsoft deu mais um passo significativo na comunicação multilíngue empresarial. O Azure Translator — agora parte do Foundry Tools — expandiu o Document Translation com capacidades que atendem a formatos, modalidades e idiomas onde o conteúdo realmente está. De tradução de imagens a suporte a linguagens de marcação estruturada, estas atualizações ajudam organizações a traduzir mais do que produzem, com maior fidelidade e menos fricção.

Para o mercado brasileiro, onde a localização de produtos, documentação técnica e materiais de marketing é constante, essas novidades podem reduzir drasticamente o tempo de pipeline e o retrabalho — desde que os times estejam preparados para gerenciar os custos incrementais de processamento de imagem e futuros usos de LLM.

Como a tradução síncrona de imagens funciona e quando usar?

Com a nova capacidade síncrona de tradução de imagens, o Document Translation agora aceita diretamente um arquivo de imagem e retorna a imagem traduzida em tempo real, com o layout preservado.

Como funciona: O serviço usa o Azure AI Vision para detectar e extrair texto da imagem, traduz com o Azure Translator e renderiza o texto traduzido de volta na imagem, em uma única chamada síncrona. Ideal para cenários interativos como workflows de suporte ao cliente, pré-visualizações ao vivo e localização sob demanda.

Primeiros passos: Envie uma imagem para o endpoint síncrono de Document Translation, especificando os idiomas de origem e destino.

import os
from pathlib import Path

import requests

endpoint = "DOCUMENT_TRANSLATION_ENDPOINT"
key = "DOCUMENT_TRANSLATION_KEY"
imagefile_path = Path("./image_file.jpg")

response = requests.post(
    f"{endpoint}/translator/document:translate",
    params={
        "api-version": "2026-03-01",
        "sourceLanguage": "en",
        "targetLanguage": "de",
    },
    headers={"Ocp-Apim-Subscription-Key": key},
    files={
        "document": (
            imagefile_path.name,
            imagefile_path.open("rb"),
            "application/json",
        )
    },
    timeout=120,
)
response.raise_for_status()

Path("./image_file_de.jpg").write_bytes(response.content)

Uso e custo: Esta funcionalidade usa o recurso Azure Translator, e a tradução de imagens incorre em cobranças adicionais. Consulte os preços do Azure Translator.

Por que a tradução em batch de imagens é essencial para catálogos e arquivos?

Para organizações que processam imagens em escala — arquivos de scan, catálogos de produtos, datasets de treinamento — a tradução em batch traz a mesma vazão empresarial do Document Translation para conteúdo visual.

Como funciona: Envie um lote de imagens no Azure Blob Storage. O serviço processa cada imagem de forma assíncrona, traduz o texto embutido usando Azure AI Vision e Azure Translator, e escreve as imagens traduzidas de volta no container de destino.

Primeiros passos: Use a REST API de batch do Document Translation, apontando o container de origem para uma coleção de arquivos de imagem suportados. Os resultados são entregues no container de destino ao final.

import os

import requests

endpoint = "DOCUMENT_TRANSLATION_ENDPOINT"
key = "DOCUMENT_TRANSLATION_KEY"

payload = {
    "inputs": [
        {
            "source": {
                "sourceUrl": "SOURCE_CONTAINER_SAS_URL_OR_MANAGED_IDENTITY",
                "storageSource": "AzureBlob",
                "language": "en",
            },
            "targets": [
                {
                    "targetUrl": "TARGET_CONTAINER_SAS_URL_OR_MANAGED_IDENTITY",
                    "storageSource": "AzureBlob",
                    "language": "fr",
                }
            ],
        }
    ]
}

response = requests.post(
    f"{endpoint}/translator/document/batches",
    params={"api-version": "2026-03-01"},
    headers={
        "Ocp-Apim-Subscription-Key": key,
        "Content-Type": "application/json",
    },
    json=payload,
    timeout=60,
)
response.raise_for_status()

print("Batch operation:", response.headers["Operation-Location"])

Uso e custo: Esta funcionalidade usa o recurso Azure Translator, e a tradução de imagens incorre em cobranças adicionais. Consulte os preços do Azure Translator.

O que muda para PDFs com o Azure AI Document Intelligence?

PDF continua sendo o formato mais comum para documentos empresariais. A Microsoft aprimorou a tradução em batch de PDFs ao integrar o Azure AI Document Intelligence, trazendo melhor retenção de layout, tratamento mais preciso de estruturas complexas de múltiplas colunas e maior fidelidade para elementos como tabelas e notas de rodapé.

Como funciona: Aprimoramentos no pipeline de processamento de PDF produzem saídas traduzidas que se aproximam mais do original — documentos que parecem originais, não aproximações.

Primeiros passos: Envie PDFs pelo mesmo endpoint de batch que você já usa para outros formatos. Coloque os PDFs de origem em um container do Azure Blob Storage com permissão de leitura, forneça um container de destino com permissão de escrita e inicie a operação em batch.

import os

import requests

endpoint = "DOCUMENT_TRANSLATION_ENDPOINT"
key = "DOCUMENT_TRANSLATION_KEY"

payload = {
    "inputs": [
        {
            "source": {
                "sourceUrl": "PDF_SOURCE_CONTAINER_SAS_URL_OR_MANAGED_IDENTITY",
                "storageSource": "AzureBlob",
                "language": "en",
            },
            "targets": [
                {
                    "targetUrl": "PDF_TARGET_CONTAINER_SAS_URL_OR_MANAGED_IDENTITY",
                    "storageSource": "AzureBlob",
                    "language": "es",
                }
            ],
        }
    ]
}

response = requests.post(
    f"{endpoint}/translator/document/batches",
    params={"api-version": "2026-03-01"},
    headers={
        "Ocp-Apim-Subscription-Key": key,
        "Content-Type": "application/json",
    },
    json=payload,
    timeout=60,
)
response.raise_for_status()

print("PDF batch operation:", response.headers["Operation-Location"])

Uso e custo: Esta funcionalidade usa o recurso Azure Translator. Consulte os preços do Azure Translator.

Como o suporte a XML DITA e XLIFF 2.0 simplifica a localização técnica?

Equipes de documentação técnica, localização e plataformas de conteúdo empresarial dependem cada vez mais de formatos de autoria estruturada. O Document Translation agora suporta nativamente XML DITA e XLIFF 2.0, tanto em modo síncrono quanto assíncrono.

Como funciona: O serviço preserva a marcação semântica, a estrutura de elementos e as unidades de tradução definidas por cada formato — permitindo que a saída traduzida seja inserida diretamente em seu CMS, CAT tool ou pipeline de publicação, sem pré-processamento ou pós-limpeza.

Primeiros passos: Envie arquivos DITA ou XLIFF 2.0 para o endpoint síncrono ou assíncrono do Document Translation. As extensões de arquivo e detalhes do schema estão listados na documentação.

import os
from pathlib import Path

import requests

endpoint = "DOCUMENT_TRANSLATION_ENDPOINT"
key = "DOCUMENT_TRANSLATION_KEY"
xliff_path = Path("./messages.xlf")

response = requests.post(
    f"{endpoint}/translator/document:translate",
    params={
        "api-version": "2026-03-01",
        "sourceLanguage": "en",
        "targetLanguage": "de",
    },
    headers={"Ocp-Apim-Subscription-Key": key},
    files={
        "document": (
            xliff_path.name,
            xliff_path.open("rb"),
            "application/xliff+xml",
        )
    },
    timeout=120,
)
response.raise_for_status()

Path("./messages.de.xlf").write_bytes(response.content)

Uso e custo: Esta funcionalidade usa o recurso Azure Translator. Consulte os preços do Azure Translator.

Por que traduzir imagens dentro de documentos Office é um diferencial competitivo?

Documentos Word e PowerPoint raramente contêm apenas texto. Gráficos, diagramas, screenshots e imagens embutidas geralmente carregam as informações mais críticas. Com esta atualização, o texto dentro dessas imagens agora é traduzido junto com o texto do documento em batch.

Como funciona: O Document Translation usa o Azure AI Document Intelligence para detectar, extrair e traduzir texto embutido em imagens dentro de arquivos Office. As imagens traduzidas são reinseridas no documento, produzindo uma saída totalmente localizada — slides, relatórios e fichas técnicas que falam todos os idiomas dos seus clientes.

Primeiros passos: Esta capacidade se baseia no parâmetro translateTextWithinImage, introduzido anteriormente. Defina o parâmetro como true nas opções da requisição batch para ativar a tradução de texto em imagens em documentos Word e PowerPoint.

import os

import requests

endpoint = "DOCUMENT_TRANSLATION_ENDPOINT"
key = "DOCUMENT_TRANSLATION_KEY"n
payload = {
    "inputs": [
        {
            "source": {
                "sourceUrl": "OFFICE_SOURCE_CONTAINER_SAS_URL_OR_MANAGED_IDENTITY",
                "storageSource": "AzureBlob",
                "language": "en",
            },
            "targets": [
                {
                    "targetUrl": "OFFICE_TARGET_CONTAINER_SAS_URL_OR_MANAGED_IDENTITY",
                    "storageSource": "AzureBlob",
                    "language": "ja",
                }
            ],
        }
    ],
    "options": {
        "translateTextWithinImage": True,
    },
}

response = requests.post(
    f"{endpoint}/translator/document/batches",
    params={"api-version": "2026-03-01"},
    headers={
        "Ocp-Apim-Subscription-Key": key,
        "Content-Type": "application/json",
    },
    json=payload,
    timeout=60,
)
response.raise_for_status()

print("Office batch operation:", response.headers["Operation-Location"])

Uso e custo: Esta funcionalidade usa o Azure Translator no Foundry Tools, e a tradução de imagens incorre em cobranças adicionais. Consulte os preços do Azure Translator.

Quando o suporte a LLM chega e como ele muda o jogo?

Construindo sobre a confiabilidade comprovada do Azure Translator no Foundry Tools, o Document Translation em breve oferecerá traduções alimentadas por grandes modelos de linguagem (LLMs) em workflows de documentos. Essa capacidade traz compreensão contextual mais profunda para conteúdo empresarial — sem exigir alterações na forma como você integra com o serviço. Disponível em breve.

Como funciona: Quando a tradução LLM estiver habilitada, o Document Translation roteia seu conteúdo através de LLMs (GPT-5.x) otimizados para documentos longos e ricos em contexto. Você mantém controle total — escolha tradução LLM quando qualidade e nuances forem mais importantes, ou mantenha os modelos NMT clássicos quando throughput e eficiência de custo forem prioridades.

Uso e custo: Esta funcionalidade exige um recurso Microsoft Foundry e uma implantação de LLM no Foundry Models. Usa o Azure Translator no Foundry Tools para Document Translation, e o uso de LLM incorre em cobranças adicionais. Consulte os preços do Microsoft Foundry.

Essas novidades refletem o compromisso da Microsoft em expandir os limites do Document Translation, capacitando empresas a se conectar, colaborar e se comunicar de forma mais eficaz, independentemente do idioma ou formato.

Perguntas Frequentes

  • Quais são os novos formatos de arquivo suportados pela Document Translation?
    Agora são suportados arquivos de imagem (JPEG, PNG, etc.), XML DITA, XLIFF 2.0, e a tradução de imagens embutidas em documentos Office (Word e PowerPoint) em modo batch. O suporte a PDF foi aprimorado com o Azure AI Document Intelligence para melhor retenção de layout.

  • Como funciona a tradução de imagens em tempo real?
    O serviço recebe uma imagem, usa o Azure AI Vision para detectar e extrair o texto, traduz com o Azure Translator e renderiza o texto traduzido de volta na imagem, mantendo o layout. Tudo em uma única chamada síncrona, ideal para suporte ao cliente e pré-visualização ao vivo.

  • O que muda para PDFs com o Azure AI Document Intelligence?
    A integração com o Azure AI Document Intelligence melhora a retenção de layout, o tratamento de estruturas complexas de múltiplas colunas e a fidelidade de elementos como tabelas e notas de rodapé. O resultado são PDFs traduzidos que se aproximam visualmente do original.

  • Quando o suporte a LLM estará disponível e como ele difere da tradução NMT atual?
    A funcionalidade com LLM (GPT-5.x) será lançada em breve, sem exigir alterações na integração. Permite escolher entre LLM para maior qualidade em documentos longos e ricos em contexto, ou NMT clássico para maior throughput e menor custo. Exige recursos adicionais do Microsoft Foundry.

  • Quais são os custos adicionais para tradução de imagens?
    A tradução de imagens gera cobranças adicionais sobre o recurso Azure Translator, além do custo base. Para o futuro uso de LLM, haverá cobranças separadas pelo uso do modelo no Foundry. É importante revisar a página de preços do Azure Translator e do Microsoft Foundry.


Artigo originalmente publicado por Swetha Machanavajhala em Azure Updates - Latest from Azure Charts.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset