A Microsoft anunciou no Microsoft Build novas capacidades para o Azure Language in Foundry Tools, com foco em detecção e anonimização de dados sensíveis (PII). A versão GA da API Text PII chega com opções avançadas de customização, enquanto previews ampliam o suporte a entidades como senhas e códigos postais. Para empresas brasileiras que precisam de automação de compliance com a LGPD, esse conjunto de APIs oferece um caminho prático para reduzir riscos e escalar a proteção de dados sem sacrificar a eficiência operacional.
Todo dia, suas aplicações processam milhares de e-mails, transcrições e documentos contendo informações sensíveis — nomes, telefones, dados médicos. Identificar e proteger esses dados manualmente não escala. É aqui que as novas capacidades de detecção de PII (Personally Identifiable Information) no Azure Language in Foundry Tools entram em cena, automatizando a proteção de privacidade em textos, conversas e cenários de saúde.
No Microsoft Build, anunciamos novas capacidades no Azure Language in Foundry Tools, projetadas para ajudar desenvolvedores a trabalhar com informações sensíveis em textos, conversas, documentos e textos de saúde.
Em resumo, as novidades incluem:
- API Text PII GA com opções adicionais de redação e atualizações no comportamento de detecção
- Novas previews para Text PII e Conversational PII
- Novos playgrounds no Microsoft Foundry para explorar e avaliar as APIs antes da integração
- Suporte expandido para uma gama maior de cenários de texto e conversação
Com o Azure Language in Foundry Tools, organizações podem identificar e gerenciar informações sensíveis em conteúdo textual, transcrições e documentos, além de analisar textos de saúde para casos de uso como workflows de privacidade, processamento de dados e aplicações downstream.
| Azure Language in Foundry Tools Capability | Best for | Example inputs |
|---|---|---|
| Text PII | Detecting and redacting sensitive information in written text | Emails, forms, support tickets, notes |
| Conversational PII | Redacting sensitive information in multi-speaker or spoken-language transcripts | Call transcripts, meetings, chat-style dialog |
| Text Analytics for Health | Extracting and structuring medical information from healthcare text | Clinical notes, patient summaries, medical reports |
Novos playgrounds do Microsoft Foundry para teste facilitado
Estamos lançando várias experiências de playground no Microsoft Foundry que permitem às equipes explorar as capacidades de linguagem, revisar os outputs e avaliar como as APIs se encaixam em seus workflows antes do uso em produção.
- Text PII redaction Playground
- Conversational PII redaction Playground
- Text Analytics for Health Playground
Esses playgrounds são destinados a experimentação prática e avaliação em ambiente controlado.
Image 1: Screenshot of Text Analytics for Health Playground in action.
API Text PII atualizada (GA – 2026-05-01)
A API Text PII GA inclui atualizações em novos tipos de entidade suportados e opções de configuração adicionais que permitem aos desenvolvedores adaptar o processamento de informações sensíveis.
Funcionalidades de customização agora disponíveis em GA:
- Anonymization: Suporte à política de redação
syntheticReplacementque mascara entidades PII detectadas com valores sintéticos. Por exemplo, "João Silva recebeu uma ligação de (11) 98765-4321" pode ser transformado em "Carlos Souza recebeu uma ligação de (21) 1234-5678". - Optional type validation controls: Possibilidade de desabilitar a validação estrita de tipo de entidade quando a eficiência operacional é priorizada sobre a verificação de integridade.
- Confidence threshold configuration: Definir um threshold mínimo de confiança para controlar quais entidades aparecem no output.
- Specify values to exclude from PII output: Excluir valores específicos da detecção.
- Use entity synonyms for tailored PII detection: Adaptar a detecção com sinônimos de entidade.
Essas opções trazem mais flexibilidade para adequar o processamento de PII aos requisitos específicos da aplicação.
Preview releases
Text PII (Preview)
A preview mais recente introduz suporte a categorias de entidade adicionais e cobertura ampliada. Novas entidades incluem Password, PIN code, Zip code e Airport code. Para a lista completa, consulte a documentação oficial.
Conversational PII (Preview)
Para casos de uso baseados em transcrições e diálogos, o serviço de redação Conversational PII é otimizado para padrões de fala como interrupções, palavras de preenchimento, troca de falantes e frases incompletas — comuns em transcrições de chamadas. As atualizações da preview estendem o suporte a padrões de fala.
Atualizações incluem:
- Novo modelo Conversational PII (2026-04-15-preview)
- Nova API Conversational PII (2026-11-15-preview), expandindo as capacidades do modelo
Entidades adicionais suportadas incluem identificadores de conta GitHub, datas de validade de cartão de crédito e códigos postais. Lista completa na documentação.
Essas previews ampliam o leque de inputs e cenários suportados para processamento de dados conversacionais.
Sumário de atualizações de API e modelo
| Azure Language in Foundry Tools Capability | Release | Status | What’s new |
|---|---|---|---|
| Text PII | 2026-05-01 | GA | Additional configuration options and updates across supported entities |
| Text PII | 2026-04-15-preview | Preview | Expanded entity support |
| Conversational PII | 2026-04-15-preview | Preview | Updates to conversational handling and entity coverage |
| Conversational PII | 2026-11-15-preview | Preview | API updates building on model changes |
Comece agora
- Explore os language playgrounds no Microsoft Foundry
- Teste as APIs GA e preview mais recentes para Text PII e Conversational PII
- Revise a documentação para listas de entidades, versionamento e orientações de uso
Como em todas as previews, as capacidades estão sujeitas a alterações. Outputs gerados por sistemas de IA devem ser avaliados e validados para seus casos de uso específicos.
Perguntas Frequentes
-
O que muda na API Text PII com a versão GA (2026-05-01)?
A API GA traz suporte a customização como anonymization com substituição sintética, validação de tipo opcional, threshold de confiança, exclusão de valores e uso de sinônimos. Isso permite adaptar a detecção a cenários específicos, como LGPD, sem engessar a pipeline. -
Quais novas entidades foram adicionadas nas previews de PII?
No Text PII preview foram adicionadas Password, PIN code, Zip code e Airport code. No Conversational PII, as novas entidades incluem GitHub account identifiers, credit card expiration dates e zip codes. A lista completa está na documentação oficial. -
Como testar as capacidades antes de integrar em produção?
A Microsoft disponibilizou três playgrounds no Foundry: Text PII Redaction, Conversational PII Redaction e Text Analytics for Health. Eles permitem avaliar outputs, testar com dados reais e verificar o comportamento da API sem custo inicial. -
O Conversational PII é adequado para transcrições de chamadas em português?
A API é otimizada para padrões de fala como interrupções, pausas e turnos de fala, comuns em transcrições. Embora o anúncio foque em inglês, o modelo pode ser usado com textos em português, mas recomenda-se validar a acurácia para o seu domínio e idioma. -
Essas APIs ajudam na conformidade com a LGPD?
Sim. A detecção automatizada de PII (nomes, telefones, dados de saúde) reduz o risco de exposição acidental. Recursos como exclusão de valores e anonimização permitem implementar privacy by design, essencial para atender aos artigos da LGPD sobre tratamento de dados sensíveis.
Artigo originalmente publicado por renaliu em Azure Updates - Latest from Azure Charts.