O Diretor de TI de uma Secretaria da Fazenda precisa modernizar a arquitetura de dados da fiscalização, que atualmente lida com cadastros de contribuintes armazenados em tabelas relacionais, Notas Fiscais Eletrônicas em formato XML e relatórios de fiscalização em PDF e texto livre (linguagem natural), em geral tratados como dados não estruturados para fins arquiteturais e analíticos, podendo demandar técnicas de extração e processamento para uso sistemático. Para garantir que a estratégia de armazenamento e análise seja eficiente e compatível com as características desses diferentes tipos de dados, o analista responsável deve classificá-los e tratá-los considerando que