3 de junho de 20264 min de leitura

Ferramenta de Automação de Navegador com Toolboxes no Foundry: O que muda para agentes de IA?

NandiniMuralidharan

Azure

Banner - Ferramenta de Automação de Navegador com Toolboxes no Foundry: O que muda para agentes de IA?

TL;DR: A Microsoft disponibilizou o Browser Automation Tool (Public Preview) como um MCP tool integrado aos Toolboxes do Foundry Agent Service, baseado em Playwright workspaces. Com Live View para depuração em tempo real, Take Control para intervenção humana em edge cases e suporte a sites privados (Private Preview), a ferramenta preenche a lacuna entre agentes de IA e workflows que exigem interação com interfaces web, sem APIs. Para empresas brasileiras, isso significa automatizar formulários, pesquisas e portais internos com rastreabilidade e controle.

Por que esta release é relevante para times de engenharia no Brasil?

Agentes de IA são excelentes em raciocínio, mas travam quando precisam clicar em botões, preencher formulários ou navegar em interfaces web. A realidade corporativa é que sistemas críticos vivem atrás de interfaces web, não de APIs; workflows exigem navegação, tomada de decisão e interação multi-etapas; e a automação frequentemente quebra na última milha. Sites privados e internos são difíceis de validar em escala. O Browser Automation Tool com Toolboxes no Foundry foi desenhado para fechar essas lacunas com um fluxo prático e operacional.

O que há de novo?

  1. MCP-native Browser Automation Tool nos Toolboxes (Public Preview): Agora disponível como um MCP tool nos Toolboxes, integrado aos hosted agents do Foundry Agent Service. Adota tarefas padronizadas de navegador com autenticação via Microsoft Entra ID.
  2. Playwright workspaces como camada de infraestrutura: O modelo de execução é baseado em Playwright workspaces (GA), garantindo automação robusta e comportamento confiável para aplicações web modernas.
  3. Live View para detecção de problemas (Public Preview): Permite observar ações do navegador em tempo real e identificar selector drift, timing issues, falhas de navegação e estados inesperados, acelerando o debugging.
  4. Take Control para edge cases (Public Preview): Quando a automação encontra caminhos não determinísticos (como CAPTCHAs ou conteúdo dinâmico), o operador pode intervir manualmente e orientar a execução.

Diagrama da ferramenta

  1. Suporte a navegação em sites privados (Private Preview): Clientes podem navegar e automatizar sites privados em ambientes hospedados, permitindo workflows realistas como portais internos, caminhos autenticados e fluxos seguros.
  2. Observabilidade integrada: Logs e avaliações no Foundry Control Plane com rastreabilidade total.
  3. Escolha da camada de orquestração: Times podem selecionar entre diversas camadas de raciocínio open-source ao escrever hosted agents.

Como as equipes podem usar na prática?

  • Defina o workflow desejado no seu Hosted Agent.
  • Execute o Browser Automation Tool com Live View habilitado.
  • Detecte e resolva problemas rapidamente.
  • Use Take Control em branches complexos ou inesperados.
  • Continue a automação e capture resultados para iteração.

Cenários de exemplo: preenchimento de formulários (automatizar interações repetitivas e de alto volume com rastreabilidade) e pesquisa web (escalar fluxos de pesquisa baseados em navegador em múltiplas fontes, com opção de intervenção manual).

O que isso desbloqueia?

Com hosted agents e Browser Automation Tool, é possível construir:

  • ✅ Agentes de ponta a ponta que completam workflows reais com automação confiável.
  • ✅ Sistemas corporativos com identidade, conformidade e observabilidade.
  • ✅ Experiências human-in-the-loop quando a precisão importa.

Isso abre uma nova classe de aplicações em finanças, back office, automação de testes e workflows baseados em dados web, onde as equipes querem automatizar com confiança – não apenas velocidade.

Perguntas Frequentes

  • O Browser Automation Tool substitui o Selenium ou outras ferramentas de automação de navegador?
    Não. Ele é um MCP tool que orquestra navegadores headless via Playwright workspaces, oferecendo uma camada de automação com observabilidade e controle humano. Pode ser usado em conjunto com frameworks como CDP ou reasoning SDKs.

  • Como o Live View ajuda na depuração de automações?
    O Live View permite observar as ações do navegador em tempo real, identificando problemas como selector drift (quando elementos de UI mudam), timing issues, falhas de navegação e estados inesperados – acelerando o debugging.

  • É possível automatizar sites internos de empresas brasileiras com essa ferramenta?
    Sim, o recurso de Private Website Browsing (Private Preview) permite navegar e automatizar sites privados em ambientes hospedados, habilitando workflows como portais internos, caminhos de pesquisa autenticados e fluxos de formulários seguros.

  • Que tipo de intervenção humana o Take Control oferece?
    Quando a automação encontra caminhos não determinísticos (como CAPTCHAs ou conteúdo dinâmico), o Take Control permite que um operador interfira manualmente e oriente a execução, mesclando escala automatizada com julgamento humano.

  • O Browser Automation Tool exige conhecimento de Playwright para ser usado?
    Não necessariamente. Ele é exposto como um MCP tool nos Toolboxes, funcionando com hosted agents. A infraestrutura subjacente é Playwright workspaces, mas a configuração é abstraída. Times podem usar qualquer camada de orquestração open-source.


Artigo originalmente publicado por NandiniMuralidharan em Azure Updates - Latest from Azure Charts.

Gostou? Compartilhe:
Precisa de ajuda?Fale com nossos especialistas 👋
Avatar Walcew - Headset