Otimizando custos: Como usar o relatório de tamanho de itens no OneLake
O novo relatório de tamanho de itens (em preview) no Microsoft Fabric resolve a dificuldade histórica de identificar o que está ocupando espaço no OneLake. Esta funcionalidade permite que administradores de workspace visualizem o consumo desagregado por item, incluindo dados de sistema e versões soft-deleted. A conclusão principal é que essa visibilidade é vital para times que buscam eficiência operacional e redução de desperdícios, permitindo decisões baseadas em dados sobre a retenção de dados e custos de storage.
O desafio da opacidade no storage em nuvem
À medida que o volume de dados cresce, a complexidade para auditar o que realmente compõe a fatura de cloud dispara. No ecossistema Microsoft Fabric, o OneLake é central, mas até então, a visibilidade sobre o custo por item era limitada. Enquanto o Capacity Metrics app oferece uma visão global de consumo, ele falha em granularidade, e ferramentas como Azure Storage Explorer não agregam os dados de sistema corretamente. Esse cenário cria pontos cegos que dificultam a gestão de custos (FinOps) eficiente.
O que muda com o report de item-size?
O novo recurso de relatório de tamanho de item, disponível nas configurações do seu workspace, atua como uma camada de visibilidade direta. A funcionalidade oferece:
- Visão unificada: Consolida dados de storage para cada item dentro do workspace.
- Granularidade: Separa storage visível de dados ocultos (system folders) e itens marcados para deleção (soft-deleted).
- Acesso simplificado: Permite que qualquer administrador de workspace identifique os maiores consumidores de espaço sem a necessidade de scripts complexos ou varreduras manuais.
Como operacionalizar essa análise?
Para times de engenharia e gestores de TI, o processo é direto, mas exige atenção ao consumo de recursos durante a atualização:
- Acesse as configurações: Entre no portal do Fabric, selecione o workspace e navegue até
Workspace settings > OneLake > Storage report. - Inicie o Refresh: O OneLake realizará a varredura do storage. Ponto de atenção: O custo de processamento (CU) e o tempo de execução variam conforme o volume de dados e a topologia do seu data estate.
- Cache Inteligente: Uma vez processado, o resultado é cacheado. Isso evita varreduras repetitivas e permite que qualquer membro da equipe com privilégios de administrador consulte o relatório sem consumir CU adicional.
Implementar essa rotina de verificação no seu ciclo DevOps permite identificar ineficiências quase em tempo real, garantindo que o crescimento da plataforma não resulte em um overspend descontrolado.
Perguntas Frequentes
- Como o relatório de tamanho de itens ajuda no FinOps?
Ele permite identificar exatamente quais itens (data products) estão consumindo mais storage, incluindo arquivos ocultos e dados 'soft-deleted', facilitando a limpeza proativa e a otimização de custos. - A funcionalidade consegue rastrear dados de sistema no OneLake?
Sim, o relatório de OneLake contabiliza o armazenamento de pastas de sistema, arquivos temporários e outros artefatos de metadados gerados pelas cargas de trabalho, que antes eram invisíveis em outras ferramentas. - É necessário disparar um scan toda vez que precisar da informação?
Não. O OneLake possui um mecanismo de cache. Após a primeira atualização (refresh) iniciada pelo administrador, os resultados ficam disponíveis para consulta rápida até que uma nova atualização seja solicitada.
Artigo originalmente publicado em Azure Updates - Latest from Azure Charts.