A geração e o acúmulo contínuo de dados dos últimos anos
impulsionaram o desenvolvimento de diversas tecnologias Big
Data.
Uma das principais características de um banco de dados Big Data é:
Uma das etapas mais importantes do processo de Mineração de
Dados é o pré-processamento dos dados das fontes que,
normalmente, apresentam diversos tipos de heterogeneidade. A
operação de pré-processamento que transforma dados
quantitativos (contínuos) em dados qualitativos, ou seja,
atributos numéricos em atributos discretos ou nominais com um
número finito de intervalos, obtendo uma partição não
sobreposta de um domínio contínuo, é a:
O Data Warehouse do TJSE armazena um grande cubo de dados
contendo diversas métricas e dimensões, como: DIM_TEMPO,
DIM_LOCAL e DIM_PROCESSO. A analista Julia precisa extrair um
subconjunto deste cubo de dados contendo apenas os fatos do
primeiro trimestre de 2023 e processos com a situação
“arquivado”.
Para obter esse subconjunto de dados, Julia utilizou uma
ferramenta OLAP e executou a seguinte operação:
Observe o profile das seguintes fontes de dados do Data Warehouse JusDW.
FONTE DE DADOS 1: Tabela TB_PROC
Atributo: ID_P
Descrição: Identificador único da tabela TB_PROC
Quantidade de Registros: 3.250
Valor Inicial: 1
Valor Final: 3.250
Valores Nulos: 0
FONTE DE DADOS 2: Tabela TAB_P
Atributo: ID_PROC
Descrição: Identificador único da tabela TAB_P
Quantidade de Registros: 250
Valor Inicial: 1
Valor Final: 250
Valores Nulos: 0
Para integrar e armazenar os 3.500 registros das Fontes de Dados 1 e 2 na Dimensão DIM_PROC do JusDW, identificando unicamente cada novo registro criado da DIM_PROC, é necessário criar uma:
Durante a Mineração dos Dados sobre a tramitação dos
processos eletrônicos do TJSE, o analista Pedro não estava
chegando a resultados compreensíveis e resolveu verificar se
havia anomalias nos dados.
O analista de infraestrutura Jair recebeu a demanda de preparar
um ambiente para armazenar dados massivos oriundos do
Sistema de Tramitação Eletrônica de Processos, do Correio
eletrônico e do log do tráfego de rede.
Para isso, a característica de banco de dados massivos (Big Data)
sobre os tipos de dados e heterogeneidade das fontes de dados
que Jair deve considerar é:
O TJSE está construindo um ambiente analítico de dados por
meio do desenvolvimento de um Data Warehouse. Para isso,
solicitou ao analista de infraestrutura Juca a disponibilização de
um banco de dados, acessível apenas pelos desenvolvedores,
para armazenar temporariamente os dados que estão sendo
extraídos das fontes e transformados para serem carregados no
ambiente de consultas analíticas.
Pierre, analista judiciário, recebeu a tarefa de elaborar um
relatório no PowerBI com os seguintes requisitos:
1. Conter três visuais para cada uma das seguintes métricas:
quantidade de processos recebidos, quantidade de processos
julgados e quantidade de processos arquivados no Tribunal ao
longo do tempo.
2. Exibir uma filtragem para que os três visuais apresentem as
métricas por Magistrado selecionado.
No PowerBI, o visual implementado por Pierre, usado para filtrar
os outros visuais em uma página, é:
João precisa analisar um conjunto de dados oriundo de diversas
fontes. Para começar, João precisa preparar os dados executando
ações de limpeza e integração com o objetivo de carregar em um
banco de dados analítico.
Para isso, João usou a ferramenta de Business Intelligence:
Richard era o engenheiro responsável pela construção de um
prédio em Aracaju. Em determinado momento, quando o prazo
para entrega da obra estava prestes a se concluir, foi informado
pela equipe de que havia uma dificuldade em encontrar, no
mercado, material de suficiente resistência para a finalização da
estrutura das vigas de sustentação. Determinou, então, que se
prosseguisse com um material mais barato e substancialmente
menos resistente. Perguntado se estava ciente dos riscos,
inclusive de desabamento, disse:
“É melhor correr esse risco do que atrasar a entrega”.
Meses depois, em razão da falta de resistência das vigas, o prédio
desabou, com dezenas de vítimas fatais.