Magna Concursos

Foram encontradas 5.012 questões.

2610312 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

1. linhas = sc.textFile("dados.txt")
2. linhasComprimento = linhas.map(lambda s: len(s))
3. totalComprimento = linhasComprimento.reduce(lambda a, b: a + b)

Em relação ao código pyspark acima, assinale a afirmativa incorreta.

 

Provas

Questão presente nas seguintes provas
2610311 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

O principal objetivo do Hadoop YARN foi dividir as funcionalidades de gerenciamento de recursos e agendamento/monitoramento de tarefas em daemons separados.

Assinale a opção que não figura como uma característica da arquitetura de Hadoop YARN.

 

Provas

Questão presente nas seguintes provas
2610309 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

Considere a consulta de streaming que conta os cliques dos usuários por país para uma campanha publicitária na web a cada 30 minutos. Ao aplicar o modelo de processamento de micro batch a esta consulta, o fluxo de dados é dividido em duas fases: batching e processing, como mostra a figura a seguir.

Enunciado 3539822-1

O processamento stream é obtido repetindo as fases de batching e processing para as novas tuplas de dados.

Em relação ao processamento stream em micro-batches, assinale a opção incorreta.

 

Provas

Questão presente nas seguintes provas
2610308 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

O Apache Spark é um framework para processamento paralelo e oferece suporte ao processamento na memória para aumentar o desempenho de aplicações de big data.

Em relação aos RDDs e a suas operações, assinale a afirmativa incorreta.

 

Provas

Questão presente nas seguintes provas
2610307 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

Matei Zaharia et al. propuseram o framework Spark como alternativa para processar workloads que reutilizam dados através de múltiplas operações paralelas.

As opções a seguir apresentam características do framework Spark, à exceção de uma. Assinale-a.

 

Provas

Questão presente nas seguintes provas
2610293 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

Sobre o conceito de Governança de Dados (DAMA), assinale a afirmativa correta.

 

Provas

Questão presente nas seguintes provas
2610286 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

Kimball elenca uma série de conceitos fundamentais para a elaboração de um modelo dimensional.

Em relação a esses conceitos, assinale a afirmativa incorreta.

 

Provas

Questão presente nas seguintes provas
2610285 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: SEF-MG

O HDFS foi projetado para armazenar arquivos grandes como uma sequência de blocos.

Em relação à replicação dos dados, assinale a afirmativa incorreta.

 

Provas

Questão presente nas seguintes provas
2610141 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: CGE-SC

Sobre as redes neurais convolucionais (CNNs) é correto afirmar que

 

Provas

Questão presente nas seguintes provas
2610140 Ano: 2023
Disciplina: TI - Ciência de Dados e BI
Banca: FGV
Orgão: CGE-SC

No processamento de linguagem natural, é preciso realizar transformações de textos em números, geralmente vetores ou matrizes, de forma que sirvam de entrada para os algoritmos computacionais de aprendizado de máquina.

Sobre esses algoritmos de extração de características de textos, assinale a afirmativa incorreta.

 

Provas

Questão presente nas seguintes provas