Foram encontradas 5.012 questões.
Entre os modelos de aprendizado de máquina mais comuns, estão as árvores de decisão. Elas são métodos de aprendizado de máquinas muito utilizados em tarefas de classificação e regressão. Em problemas de classificação, os modelos em árvore são designados de árvore de decisão. Para resolver um problema de decisão, esse tipo de método utiliza a estratégia de dividir para conquistar. Uma proposta natural é rotular cada conjunto da divisão por sua classe mais frequente e escolher a divisão que tem menores erros. O conceito fundamental nessa proposta é denominado de entropia. Considerando as árvores de decisão, assinale a alternativa que define corretamente o conceito de entropia.
Provas
Machine Learning, ou aprendizado de máquina, é um subcampo da inteligência artificial baseada na ideia de que os sistemas podem aprender a identificar padrões e tomar decisões, por meio da análise de dados. De acordo com o tipo de técnica utilizada no processo de aprendizagem, existem vários algoritmos que podem ser aplicados para gerar o modelo de aprendizado. Os parâmetros desse modelo podem ser atualizados por meio de técnicas de otimização. Com base nessas informações, assinale a alternativa correta.
Provas
Você recebeu um chamado para colaborar no desenvolvimento de um dos módulos do software acadêmico. O referido módulo deve apresentar um gráfico estatístico para simplificar a interpretação dos dados e facilitar a tomada de decisões. Anexo ao chamado, consta um exemplo de uma matriz de dados extraída do Sistema Gerenciador de Banco de Dados oficial da instituição, possuindo dados relacionados à altura, peso, idade, renda familiar e número de reprovações. Assinale a alternativa que representa o tipo de gráfico mais adequado para análise dos referidos dados.
Provas
from scipy import stats
…
Y, Z = stats.normaltest(X)
Considerando o trecho do algoritmo acima, assinale a alternativa que corresponde ao significado do valor de Z.
Provas
A variedade de recursos para a visualização de dados é um dos diferenciais que atraem o interesse sobre a linguagem de programação Python. Para isso, existem diferentes bibliotecas disponíveis na Internet, com destaque a biblioteca Matplotlib. Dentre os inúmeros recursos dessa biblioteca, o método plot disponibiliza recursos para a visualização bidimensional de dados, como o do gráfico a seguir.

Considerando esse gráfico gerado utilizando programação Python, selecione a opção que possibilita gerá-lo corretamente de acordo com a visualização apresentada nesta imagem. Para isso, considerar que a curva é uma senoide gerada pelo trecho de código a seguir:
import numpy as np
import matplotlib.pyplot as plt
x = np.linspace(-10, 10, 100)
y = np.sin(x)Provas
A biblioteca Matplotlib é usada para plotagem de gráficos 2D em Python. A função subplot dessa biblioteca é usada para criação de uma figura com subplotagens.

Considerando a imagem apresentada, assinale a alternativa que representa qual das sequências deveria ser usada na função subplot nas linhas 7 e 13, respectivamente, para geração dos gráficos apresentados ao lado do código.
Provas
Uma tarefa muito comum durante a etapa de pré-processamento de dados é o tratamento de valores ausentes. A linguagem Python possui uma biblioteca muito utilizada pelos cientistas de dados, denominada Pandas, que permite realizar o processo de transformação dos dados de maneira bem prática. Considere os dados exibidos pela figura abaixo:

Pela figura, é possível observar que existem diversos valores ausentes, identificados por NaN. Ao analisar essas informações, o cientista de dados decide substituir os valores ausentes em cada coluna, da seguinte forma:
• Gravidez: substituir NaN pelo valor 0;
• Pressão Sanguínea: substituir NaN pela média dos valores da coluna;
• Espessura da Pele: substituir NaN pela moda dos valores da coluna;
• IMC: substituir NaN pela mediana dos valores da coluna;
• Resultado: substituir NaN pelo valor 0.
O cientista de dados armazenou os valores dentro de um dataframe do Pandas, chamado df. Para realizar a substituição dos valores ausentes, ele decide executar o seguinte comando:
df.fillna(value=valores, inplace=True)
Observe que o argumento “value” recebe um dicionário do Python. Esse dicionário contém as instruções para atualizar os valores das colunas, tal como o cientista de dados deseja. Assinale a alternativa correta, que indica o trecho de código relacionado a esse dicionário de dados.
Provas
Quando se inicia os trabalhos de aprendizado em bases de dados é comum identificar problemas na base de dados. Por isso, na etapa de pré-processamento, os dados passam por recursos de limpeza, integração de bases de dados, redução na quantidade de atributos ou dados, transformação nos formatos dos dados ou discretização de alguns. Considerando esses recursos, indique a alternativa incorreta que os define.
Provas
ETL (Extract, Transform and Load) consiste num conjunto de técnicas com o objetivo de integração a fim de combinar dados de diversas fontes. Por meio do ETL, é possível definir a qualidade dos dados e a forma como eles são manipulados, a fim de transformá-los em uma informação inteligível e confiável. Nesse contexto, associe a técnica de ETL com a caracterização mais adequada.
- SQL (Standard Query Language)
- Web Services
- Processamento em lote
- Mapeamento de dados
- Fornece instruções detalhadas para uma aplicação sobre como obter os dados necessários para processar. Ele também descreve qual campo de origem é correspondente ao campo de destino. Por exemplo, associar um atributo de uma tabela do banco de dados com outro atributo de outra tabela de outro banco de dados.
- É o método mais comum de acessar e transformar os dados de um banco de dados relacional.
- Refere-se a uma operação que envolve a movimentação de grandes volumes de dados entre dois sistemas durante o que é chamado de “janela”. Nesse período determinado, nenhuma ação pode ocorrer com o sistema-fonte, enquanto os dados são sincronizados.
- É um método baseado na internet para fornecer dados ou funcionalidades a várias aplicações em tempo quase real. Esse método simplifica os processos de integração de dados e pode entregar, rapidamente, mais valor a partir dos dados.
Provas
I - A morfologia matemática é fundamentada na teoria dos conjuntos e tem como exemplos de operadores morfológicos a erosão, a dilatação, a abertura e o fechamento. II - As operações morfológicas em imagens binárias ocorrem de forma diferente das operações morfológicas em imagens tons de cinza. III - A dilatação e a erosão morfológica em imagens tons de cinza podem ser usadas em conjunto com a subtração de imagens para obter o gradiente morfológico da imagem.
Está(ão) correta(s)
Provas
Caderno Container