Foram encontradas 4.977 questões.
No contexto de bancos de dados multidimensionais, assinale a alternativa que apresenta corretamente a operação de navegação que permite ao usuário descer em uma hierarquia de dados, passando de
um nível agregado para um mais detalhado, como de
vendas anuais para vendas mensais, ou de uma região
para seus estados individuais, aumentando a granularidade e o detalhamento das informações analisadas.
Provas
Questão presente nas seguintes provas
Sobre a rede neural do tipo perceptron de camada única, assinale a alternativa correta.
Provas
Questão presente nas seguintes provas
Com relação ao uso de ferramentas de inteligência artificial,
um dos tipos de modelos de deep learning é treinado em imensas
quantidades de dados, tornando-o capaz de entender e gerar
linguagem natural e outros tipos de conteúdo para executar uma
grande variedade de tarefas. Esse tipo e sua respectiva sigla, em
inglês, são chamados de:
Provas
Questão presente nas seguintes provas
A Secretaria da Fazenda de determinado Estado implementou uma solução corporativa para centralizar dados fiscais provenientes
de múltiplas fontes heterogêneas: declarações de contribuintes, notas fiscais eletrônicas, dados cadastrais e informações de fiscalizações. A equipe técnica precisava garantir escalabilidade, processamento de grandes volumes e capacidade analítica para identificar irregularidades tributárias. Após análise, optou-se por uma arquitetura que permite armazenar dados brutos em formato nativo, aplicar transformações sob demanda mediante ferramentas de processamento distribuído e disponibilizar estruturas otimizadas
para consultas analíticas pelos auditores fiscais, mantendo a governança através de controles transacionais sobre os metadados.
A arquitetura implementada
A arquitetura implementada
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda Estadual recebeu uma base de dados contendo 2,3 milhões de registros de declarações fiscais para
análise de conformidade tributária. Durante a fase de exploração inicial, a equipe técnica identificou diversos problemas: campos de
CNPJ com formatações inconsistentes (alguns com pontuação, outros sem), valores monetários registrados com separadores
decimais divergentes (vírgula e ponto), datas em formatos distintos (DD/MM/AÄAA, AAAA-MM-DD), campos obrigatórios vazios em
aproximadamente 12% dos registros, e a presença de valores extremos de receita bruta (outliers) que distorciam as análises
estatísticas. Além disso, a variável "regime tributário" apresentava categorias redundantes devidoa erros de digitação (ex:
"Simples Nacional", "SIMPLES NACIONAL", "Simples nacional"). Para viabilizar a análise de risco fiscal e a construção de modelos
preditivos, tornou-se necessário aplicar técnicas sistemáticas de preparação dos dados antes do processamento analítico.
Considerando as melhores práticas de pré-processamento de dados, o tratamento correto e adequado para essa situação é
Provas
Questão presente nas seguintes provas
No desenvolvimento de um modelo de detecção de contribuintes com alto risco de simulação de operações, após definir claramente com a área de fiscalização quais tipos de fraude serão priorizados, quais indicadores de negócio serão acompanhados
(como aumento de autos de infração qualificados e redução de fiscalizações improdutivas) e quais restrições legais e
operacionais existem para uso do modelo, a equipe de uma Secretaria da Fazenda registra esses critérios e alinha expectativas
com a alta gestão. Com base na metodologia CRISP-DM, essa descrição se encaixa principalmente na fase de
Provas
Questão presente nas seguintes provas
Uma equipe de auditoria possui uma tabela de NF-e com mais de 1 bilhão de registros em um pyspark.sgl.DataFrame
chamado df. A auditora deseja inspecionar apenas 1.000 registros localmente em seu notebook, usando funcionalidades
avangadas de pandas para buscar inconsisténcias. Nesse cenário, a abordagem em PySpark mais apropriada para gerar esses
registros em um pandas. DataFrame, minimizando o risco de estouro de memória no ambiente local é:
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda pretende, ao mesmo tempo:
I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.
Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:
I. prever o valor de arrecadação mensal de ICMS para os próximos meses;
II. classificar cada declaração de contribuinte em “alto risco” ou “baixo risco” para fins de seleção de auditoria.
Considerando os tipos de modelos de aprendizado de maquina, a combinação de tarefas que está conceitualmente alinhada com esses objetivos é:
Provas
Questão presente nas seguintes provas
Uma base tributaria de uma SEFAZ é analisada por meio de um cubo OLAP de arrecadação de ISS, com as seguintes
dimensões: Ano, Município, Atividade econômica, Regime tributário e Contribuinte. Em uma reunido, um
analista parte de uma visão agregada da arrecadação anual por município, em seguida, navega para uma visão mensal e depois
para uma visão por contribuinte dentro de um município especifico, mantendo as demais dimensões fixas. Do ponto de vista
conceitual em OLAP, essa sequência de operações é um exemplo de
Provas
Questão presente nas seguintes provas
Uma Secretaria da Fazenda projeta um Data Lake para suportar fiscalização eletrônica, com ingestão diária de notas fiscais
eletrônicas, conhecimentos eletrônicos de transporte de cargas, registros fiscais digitais entregues ao fisco, declarações do
SIMPLES Nacional e recolhimentos. A equipe adota uma arquitetura em zonas (raw/bronze, refined/silver, curated/gold), com
processos de ELT. Para o uso por auditores fiscais e cientistas de dados, a descrição mais adequada é que a zona raw/bronze
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container