Toda inferência abaixo é hipótese e precisa ser validada com a Colliers.
Padrão de organização observado
[hipótese] A biblioteca Research é estruturada em uma única pasta-raiz General/ com subpastas numeradas por verticais e funções: 1.ESCRITÓRIOS, 2.INDUSTRIAL, 3.ESTACIONAMENTOS, 4.MAILING, 5.DEMANDAS, 6.PASTAS PESSOAIS, 7.DASHBOARD, 11.GIS, 13.MARKET REPORT, 14.Siila, 22.DATA LAKE. A numeração não é sequencial — indica evolução orgânica ao longo dos anos.
[hipótese] Research = repositório de Inteligência de Mercado (IM): não há projetos de obras, contratos de cliente ou RDOs. Todo o conteúdo é analítico: relatórios setoriais, bases de dados de mercado, mapas GIS e apresentações de pitch. É o oposto estrutural da biblioteca Cloud Colliers.
Hipóteses de organização
[hipótese] Concentração em PDFs (34.847 arq, 58,6 GB = 50% do volume): provável produção acumulada de relatórios de mercado trimestrais e apresentações para clientes desde 2018 — arquivo histórico de produto Research.
[hipótese] Stack GIS completo: mxd (1.640), gdbtable/gdbtablx (1.660), Shapefiles (275), kmz (149), QGIS (52) — indica equipe GIS dedicada com ArcGIS + QGIS, produzindo mapas de absorción, vacancia e localização de ativos logísticos e de escritórios.
[hipótese] Stack analítico híbrido: Power BI (104 .pbix), Access (517 .mdb + 9 .accdb), R (288 .rda), Python (5 .py) — indica pipeline de dados não-documentado e não-centralizado. Risco: dependência de ferramentas individuais sem governança.
[hipótese] General/22.DATA LAKE é um sinal de que a equipe já reconhece a necessidade de centralização — mas a existência de um folder chamado DATA LAKE dentro de um SharePoint não-estruturado indica que pode ser mais aspiração que realidade.
[hipótese] Arquivo modificado em 2026-05-07 (Pesquisa_Escritórios CorporativosII.xlsx, 57 MB) confirma que a base de dados de apresentação de mercado está ativamente em uso — este arquivo é o candidato #1 para o dicionário de dados desta biblioteca.
[hipótese] Pastas pessoais não-governadas: General/6.PASTAS PESSOAIS/Heriberto e General/18.Daniel contêm arquivos de trabalho individual (planilha de vendas 51 MB, 2021) sem controle de versão ou nomenclatura padrão.
[hipótese] General/21.Revisão Fitas Backup Colliers é sinal de migração de mídia física (fitas LTO?) para SharePoint — conteúdo provavelmente não triado.
Anomalias técnicas
0 erros de leitura após correção long_path — todos os 57.793 arquivos foram inventariados sem falha.
Extensões numéricas (33, 01, 00, 40, 35 etc.) são artefatos de arquivos cujo nome é um número sem extensão real — possívelmente exports de sistemas externos.
emprecsv (6 arquivos, 2,1 GB) é formato proprietário não-identificado — possível export de sistema de cadastro de empreendimentos (SiiLa, Buildings, Sipen?).
msi (2 arquivos, 1 GB) e exe (1 arquivo, 5,8 MB) são instaladores de software armazenados no SharePoint — anomalia de governança.
ldb (73 arquivos) são lockfiles de Access em uso — indica que .mdb eram acessados ativamente; lockfiles não deveriam estar no SharePoint.
Perguntas para a Colliers
O que está em General/22.DATA LAKE? É uma consolidação estruturada de todas as bases ou apenas mais uma pasta?
Quem manteve o Base_IM_Unificada.xlsx (73 MB) e o Pesquisa_Escritórios CorporativosII.xlsx (57 MB, atualizado ontem)? Eles alimentam algum Power BI publicado?
A equipe GIS usa ArcGIS licenciado (.mxd) ou migrou para QGIS (.qgz)? As .mxd mais antigas ainda são acessíveis?
O formato .emprecsv é um export de qual sistema? SiiLa? Buildings? Como ele é processado?
General/4.MAILING e General/5.DEMANDAS/MARKETING contêm mailings de proprietários (São Paulo.xls 229 MB, Rio de Janeiro.xls 176 MB) — esses dados de contato são ativos? Há controle de LGPD sobre eles?
Os scripts Python em General/ são de autoria interna? Há documentação de como rodar?
Top candidatos a fonte do dicionário de dados
General/7.DASHBOARD/Pesquisa_Escritórios CorporativosII.xlsx (57 MB, mod 2026-05-07) — prioridade 1
General/7.DASHBOARD/Base_IM_Unificada.xlsx (73 MB, mod 2023-06-19)
General/2.INDUSTRIAL/ANÁLISES/Pesquisa/ — série Market Stats Geral QX YYYY (2018–2021)
(ver 04_candidatos-dicionario.md para lista completa)