Magna Concursos

Foram encontradas 5.009 questões.

No contexto de auditoria e compliance, a pilha ELK Stack (Elasticsearch, Logstash e Kibana) é amplamente usada para analisar e monitorar atividades nos sistemas, especialmente no que se refere à integridade e à segurança de dados.

Sobre as funcionalidades dessa pilha, assinale a afirmativa correta.

 

Provas

Questão presente nas seguintes provas
3555875 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

As Redes Neurais Convolucionais (Convolutional Neural Network - CNNs) são amplamente utilizadas em tarefas de reconhecimento de imagens.

Sobre as características e as arquiteturas das CNNs, avalie as afirmativas a seguir.

I. Uma camada que compõe uma CNN é a camada convolucional. Nela ocorre a subamostragem da imagem, com o objetivo de se diminuir a carga computacional, o uso de memória e o número de parâmetros necessários.

II. LeNet-5, AlexNet e ResNet são exemplos de arquiteturas CNN.

III. A arquitetura de uma CNN é composta exclusivamente por camadas convolucionais e camadas de pooling.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3555873 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Marcelo, auditor especializado em Análise de Dados, está estudando o uso de algoritmos de aprendizado de máquina (Machine Learning) para a detecção de fraudes em contas públicas. Como parte de seus experimentos, ele dividiu seu conjunto de dados em treinamento e teste. Após treinar um modelo, percebeu que os resultados apresentavam indícios de underfitting.

O underfitting ocorre

 

Provas

Questão presente nas seguintes provas
3555872 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Algoritmos de Aprendizado de Máquina (Machine Learning) podem ser classificados quanto ao tipo de aprendizado. Em relação ao tema, avalie as afirmações a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) Tarefas de classificação e regressão são exemplos típicos de aprendizado supervisionado.

( ) No aprendizado não supervisionado, os dados de treinamento não estão rotulados.

( ) SVM, árvores de decisão e regressão logística são exemplos de algoritmos de aprendizado supervisionado.

As afirmativas são, respectivamente,

 

Provas

Questão presente nas seguintes provas
3555871 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo.

Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre.

A sequência de ações OLAP será:

 

Provas

Questão presente nas seguintes provas
3555870 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com diversas aplicações em ciência de dados, machine learning e processamento de gráficos.

Considerando essa ferramenta, julgue as afirmativas a seguir.

I. O Spark pode ser executado no Apache Hadoop, Kubernetes, por conta própria, na nuvem, em máquinas isoladas ou em clusters.

II. DataFrames, SQL e Structured Streaming são exemplos de APIs do Spark.

III. Uma diferença entre o Spark e o MapReduce é que o Spark processa e mantém os dados na memória para as etapas subsequentes, sem gravar ou ler do disco, gerando maior velocidade de processamento.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3555869 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Sobre algoritmos de mineração de dados, avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.

( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.

( ) Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.

( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.

As afirmativas são, respectivamente,

 

Provas

Questão presente nas seguintes provas
3555866 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

Sobre o processo de ETL (Extract, Transform, and Load), analise as afirmativas a seguir.

I. A etapa de extração pode impactar negativamente o desempenho do sistema de origem, caso não seja planejada adequadamente, principalmente quando se trata de um grande volume de dados em tempo real.

II. O Apache NiFi é uma plataforma de orquestração de fluxos de trabalho de código aberto, frequentemente utilizado para criação de pipelines ETL complexos, em que o usuário deve utilizar a linguagem de programação Python.

III. A etapa de transformação compreende tarefas como a limpeza, padronização e formatação dos dados, além de conversões de tipos de dados e agregações.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3555863 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: TCE-RR

No contexto de ferramentas para análise e exploração de dados (Excel avançado, SQL e Business Intelligence - BI), avalie as afirmativas a seguir.

I. Ferramentas de BI permitem a criação de dashboards interativos e visualizações em tempo real.

II. O SQL é ideal para consultas e manipulação direta de dados armazenados em grandes bancos de dados.

III. O MS Excel oferece maior flexibilidade em análises locais com fórmulas personalizadas.

Está correto o que se afirma em

 

Provas

Questão presente nas seguintes provas
3555753 Ano: 2025
Disciplina: TI - Ciência de Dados e BI
Banca: Unesc
Orgão: Fesporte
Provas:

Uma empresa de varejo online deseja analisar grandes volumes de dados sobre o comportamento dos clientes, incluindo dados de navegação no site, histórico de compras, interações em redes sociais e avaliações de produtos. O objetivo é identificar padrões de consumo, personalizar ofertas e melhorar a experiência do cliente.

Com base nesse cenário, analise as seguintes afirmações sobre Data Warehouse e Data Lake:

I.Um Data Warehouse seria a solução ideal para armazenar e analisar esses dados, pois ele é otimizado para armazenar dados estruturados em tabelas, como dados de vendas e cadastro de clientes.

II.Um Data Lake seria mais adequado para esse caso, pois permite armazenar dados de diferentes fontes e formatos, como dados estruturados, semiestruturados e não estruturados.

III.No Data Lake, os dados são armazenados em seu formato original, sem necessidade de serem transformados antes de serem armazenados. A transformação dos dados ocorre apenas quando necessário, durante a análise.

IV.O Data Warehouse é mais indicado para análises em tempo real, enquanto o Data Lake é mais adequado para análises complexas que exigem processamento de grandes volumes de dados.

Quais afirmações estão corretas?

 

Provas

Questão presente nas seguintes provas