Agente: Screener

agente inventario discovery colliers data-lake

Codinome: Screener Papel: Rastreador de pastas e arquivos do OneDrive da Colliers Escopo: inventário read-only de estrutura, formatos e metadata para alimentar dicionário de dados e arquitetura do lake Status: Concepção (pronto para go-live assim que Michael liberar acesso ao OneDrive)


Resumo

Screener é o agente responsável pelo trabalho de inventário de dados do OneDrive da Colliers. Quando o Michael (TI Colliers) liberar nosso acesso, Pedro e Rafael Rossetto vão usar o Screener para mapear como cada área da Colliers organiza seu trabalho, em quais formatos os dados vivem e o que existe pasta a pasta.

O Screener não substitui especialistas de domínio. Ele gera insumos estruturados em .md para que o time da Anouk possa pensar com clareza sobre como evoluir a arquitetura e a engenharia de dados (lake, dicionário, ondas de agentes, integração com PowerBI/Sienge/etc).

O Screener é radicalmente read-only. Não modifica, não apaga, não copia conteúdo sensível para fora do contexto de trabalho.


Objetivo

  1. Mapear a estrutura completa de pastas do OneDrive da Colliers (top-down, recursivo).
  2. Catalogar arquivos por formato (xlsx, pptx, docx, pdf, png, etc), tamanho, data de modificação e profundidade.
  3. Produzir um relatório .md por pasta de primeiro nível, com perfil quantitativo, padrões de nomenclatura observados e hipóteses de uso.
  4. Identificar arquivos-candidatos para virar fonte do dicionário de dados (ex: planilhas que servem de base após o PowerBI).
  5. Permitir que o time evolua a arquitetura do lake com velocidade, em cima de evidência e não de achismo.

Modos do agente

  1. Scanner — varredura inicial de uma pasta-raiz, gera inventário bruto em JSON + relatório .md
  2. Curador — relê o inventário e propõe agrupamentos, hipóteses de uso por área e candidatos para dicionário de dados
  3. Diff — compara duas execuções para detectar o que mudou (útil quando rodarmos de novo após semanas)
  4. Dictionary-prep — para uma pasta aprovada, gera ficha de candidatos para o dicionário de dados (sem ler conteúdo sensível)

Arquivos principais

ArquivoFunção
system-prompt.mdPrompt principal do Screener
operating-model.mdModelo operacional (como conduzir uma varredura)
security-guardrails.mdPolítica dura de read-only, anti-exfiltração e anti-modificação
runbook.mdGuia passo-a-passo para Pedro/Rafael rodarem o Screener no terminal com Claude Code
checklists/pre-scan.mdChecklist antes de iniciar uma varredura
checklists/post-scan.mdChecklist após gerar o inventário
skills/folder-inventory/SKILL.mdSkill principal: varredura e relatório por pasta
skills/data-dictionary-prep/SKILL.mdSkill secundária: preparação de fichas para dicionário
scripts/inventory.pyScript Python read-only que faz a varredura
scripts/render_md.pyConverte o JSON de inventário em relatórios .md
scripts/manifest.example.yamlManifest de exemplo (escolha de profundidade por pasta)
memory/MEMORY.mdÍndice da memória do agente

Outputs vivos

Cada execução do Screener gera arquivos em outputs/<data>_<pasta-raiz>/:

ArquivoUso
00_sumario.mdVisão geral da varredura: contagens, formatos, top pastas, top extensões
01_estrutura.mdÁrvore de pastas com profundidade, contagem de arquivos e bytes por nó
02_formatos.mdDistribuição por extensão, com tamanhos médios e exemplos
03_areas/<area>.mdUm relatório por pasta de primeiro nível (área provável)
04_candidatos-dicionario.mdLista de planilhas/arquivos candidatos para dicionário de dados
05_anomalias.mdArquivos sem extensão, duplicados aparentes, nomes problemáticos
06_glossario-observado.mdTermos recorrentes nos nomes de pastas/arquivos (insumo de glossário)
inventory.jsonInventário cru (machine-readable) — input das próximas execuções
inventory.csvMesmo inventário em CSV para análise no R/Python/Excel

Regras essenciais

  • O Screener é read-only. Nunca abre, modifica, renomeia, move ou deleta arquivos.
  • Nunca copia conteúdo de arquivos para fora do projeto — apenas metadata (caminho, tamanho, data, extensão).
  • Nunca extrai dados pessoais, financeiros ou estratégicos da Colliers durante o inventário.
  • Em modo padrão, o Screener não abre arquivos — só usa os.stat e listing.
  • A profundidade “metadata + headers” só pode ser ativada por pasta específica via manifest, com aprovação explícita de Pedro.
  • O OneDrive sincronizado pode ter arquivos online-only (placeholders). O Screener detecta e lista mas nunca força download.

Ver também