Foram encontradas 100 questões.
Algoritmos de Aprendizado de Máquina (Machine Learning) podem ser classificados quanto ao tipo de aprendizado. Em relação ao tema, avalie as afirmações a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) Tarefas de classificação e regressão são exemplos típicos de aprendizado supervisionado.
( ) No aprendizado não supervisionado, os dados de treinamento não estão rotulados.
( ) SVM, árvores de decisão e regressão logística são exemplos de algoritmos de aprendizado supervisionado.
As afirmativas são, respectivamente,
Provas
Você, como analista de dados do TCE-RR, pode ser incumbido de utilizar um cubo OLAP para avaliar as auditorias do tribunal pelas dimensões cidade, tempo e custo.
Considere que a análise possua a seguinte cadeia de ações: filtro para apenas considerar o último ano, detalhamento de ano para mês e agregação de mês para trimestre.
A sequência de ações OLAP será:
Provas
O Apache Spark é um mecanismo de análise unificado para processamento de dados em grande escala com diversas aplicações em ciência de dados, machine learning e processamento de gráficos.
Considerando essa ferramenta, julgue as afirmativas a seguir.
I. O Spark pode ser executado no Apache Hadoop, Kubernetes, por conta própria, na nuvem, em máquinas isoladas ou em clusters.
II. DataFrames, SQL e Structured Streaming são exemplos de APIs do Spark.
III. Uma diferença entre o Spark e o MapReduce é que o Spark processa e mantém os dados na memória para as etapas subsequentes, sem gravar ou ler do disco, gerando maior velocidade de processamento.
Está correto o que se afirma em
Provas
Sobre algoritmos de mineração de dados, avalie as afirmativas a seguir e assinale (V) para a verdadeira e (F) para a falsa.
( ) K-means, também conhecido como K-NN, é um algoritmo baseado na ideia de que objetos semelhantes estão próximos uns dos outros.
( ) Árvore de decisão é uma estrutura hierárquica constituída por nós. Nela, o coeficiente de Gini de um nó é sempre maior do que o do seu nó pai.
( ) O algoritmo SVM, utilizado apenas para a tarefa de classificação, emprega classificadores lineares que separam o conjunto de dados por meio de hiperplanos, não sendo possível seu uso com problemas não linearmente separáveis.
As afirmativas são, respectivamente,
Provas
Acerca dos algoritmos de mineração de dados, analise as afirmativas a seguir, e assinale (V) para a verdadeira e (F) para a falsa.
( ) Uma árvore de decisão é um grafo cíclico direcionado em que cada nó é um nó de divisão.
( ) Em uma rede neural artificial multicamadas os neurônios estão conectados a todos os neurônios da camada anterior.
( ) As máquinas de vetores de suporte (SVM - Support Vector Machine) são aplicadas em problemas de classificação nos quais busca-se dividir os dados por meio de um hiperplano.
As afirmativas são, respectivamente,
Provas
Considere o código abaixo escrito na linguagem Python (versão 3.10.12) com uso das bibliotecas numpy (versão 1.26.4) e pandas (versão 2.2.2).
<1> import numpy as np
<2> import pandas as pd
<3> x = np.array([('gama', 9), ('alfa',
3),('delta', 5),('epsilon', 7),('beta', 1)],
dtype=[('a', 'U10'), ('b', 'i4')])
<4> y = pd.DataFrame(x)
<5> z = y.sort_values(by="a")
<6> print(z.iloc[2,1])
Com a execução do código acima, após o comando da linha <6> será escrito na tela
Provas
Sobre o processo de ETL (Extract, Transform, and Load), analise as afirmativas a seguir.
I. A etapa de extração pode impactar negativamente o desempenho do sistema de origem, caso não seja planejada adequadamente, principalmente quando se trata de um grande volume de dados em tempo real.
II. O Apache NiFi é uma plataforma de orquestração de fluxos de trabalho de código aberto, frequentemente utilizado para criação de pipelines ETL complexos, em que o usuário deve utilizar a linguagem de programação Python.
III. A etapa de transformação compreende tarefas como a limpeza, padronização e formatação dos dados, além de conversões de tipos de dados e agregações.
Está correto o que se afirma em
Provas
Inicialmente, o conceito de Big Data era amplamente descrito pelos chamados ‘3 Vs’. Com o avanço da área, novos ‘Vs’ foram incorporados para ampliar essa definição. Um desses novos ‘Vs’ é a veracidade.
Assinale a opção que melhor define o conceito de veracidade.
Provas
Durante uma análise de dados, o Auditor Carlos constatou que os registros de pagamentos feitos a uma determinada empresa estavam organizados de forma mensal. No entanto, para realizar sua análise, ele precisava consolidar os dados em uma perspectiva anual.
Para isso, ele utilizou uma estratégia de transformação de dados conhecida como
Provas
No contexto de ferramentas para análise e exploração de dados (Excel avançado, SQL e Business Intelligence - BI), avalie as afirmativas a seguir.
I. Ferramentas de BI permitem a criação de dashboards interativos e visualizações em tempo real.
II. O SQL é ideal para consultas e manipulação direta de dados armazenados em grandes bancos de dados.
III. O MS Excel oferece maior flexibilidade em análises locais com fórmulas personalizadas.
Está correto o que se afirma em
Provas
Caderno Container