Foram encontradas 2.250 questões.
Um professor do IFPE é coordenador do projeto de monitoramento do rio Capibaribe em Recife-PE, ele utiliza
séries temporais que incluem as variáveis nível_chuva (medido em mm), cota_rio (medido em cm) e
turbidez_agua (medido de 1 a 4000 NTUs). Durante a fase de exploração, a equipe de análise de dados
constatou que:
● Todas as três variáveis possuem valores ausentes de forma esparsa.
● Existe uma forte correlação multivariada (não necessariamente linear) entre as variáveis. Por exemplo, a cota e a turbidez aumentam significativamente após chuvas intensas.
● A distribuição da variável cota_rio é assimétrica, com a presença de outliers significativos que representam eventos de cheias extremas.
Considerando esse cenário, a equipe decidiu usar uma técnica de imputação. A técnica mais robusta e apropriada para preservar a estrutura e as relações intrínsecas dos dados é:
● Todas as três variáveis possuem valores ausentes de forma esparsa.
● Existe uma forte correlação multivariada (não necessariamente linear) entre as variáveis. Por exemplo, a cota e a turbidez aumentam significativamente após chuvas intensas.
● A distribuição da variável cota_rio é assimétrica, com a presença de outliers significativos que representam eventos de cheias extremas.
Considerando esse cenário, a equipe decidiu usar uma técnica de imputação. A técnica mais robusta e apropriada para preservar a estrutura e as relações intrínsecas dos dados é:
Provas
Questão presente nas seguintes provas
Suponha que você participa de um projeto de mineração de dados e está treinando um modelo de árvore de
decisão para um problema de classificação com três categorias: Frutas Cítricas, Frutas Doces e Frutas
Oleaginosas. Em um determinado nó da árvore, a distribuição das 80 amostras de treinamento é a seguinte:
Frutas Cítricas: 40 amostras
Frutas Doces: 20 amostras
Frutas Oleaginosas: 20 amostras
Com base nessa distribuição, os valores do Índice de Gini e da Entropia, em bits, são dados, respectivamente, por:
Frutas Cítricas: 40 amostras
Frutas Doces: 20 amostras
Frutas Oleaginosas: 20 amostras
Com base nessa distribuição, os valores do Índice de Gini e da Entropia, em bits, são dados, respectivamente, por:
Provas
Questão presente nas seguintes provas
Em sistemas de informação distribuídos, podem ser executadas as RPC (Remote Procedure Call)
Transacionais. No contexto de sistemas distribuídos, as propriedades das transações são
Provas
Questão presente nas seguintes provas
Em sistemas de Computação em Nuvem, as APIs desempenham um papel crucial na gestão e
provisionamento de recursos. No contexto de um ambiente IaaS, onde o provedor disponibiliza recursos de
hardware virtualizados, as APIs têm o papel de
Provas
Questão presente nas seguintes provas
Uma empresa que atua na área de Internet das Coisas (IoT) está projetando um sistema de monitoramento
agrícola, utilizando múltiplos sensores de temperatura. A arquitetura de comunicação deve seguir o paradigma
RESTful, tratando cada sensor como um recurso que pode ser diretamente consultado e atualizado por meio
de métodos de requisição e resposta (como GET e PUT). Além disso, o sistema precisa suportar notificações
assíncronas para múltiplas aplicações na nuvem (análise, alertas, irrigação) sempre que o estado de um
recurso (a leitura do sensor) for alterado, utilizando um mecanismo de observação nativo do protocolo. Para
garantir a máxima eficiência energética em dispositivos com recursos limitados, a comunicação deve
obrigatoriamente utilizar o protocolo UDP na camada de transporte. Diante desse contexto, assinale a opção
em que o protocolo de comunicação atende a todos os requisitos.
Provas
Questão presente nas seguintes provas
O chefe de uma empresa pediu ao analista de dados um relatório que apresentasse todos os empregados que
ganham um salário maior que a média salarial de toda a empresa. Ao analista é informado que deve usar a
tabela chamada EMPREGADOS, que possui os seguintes campos: EMPREGADO_ID (inteiro), NOME (texto),
SALARIO (numérico), e DEPARTAMENTO (texto). O analista deve executar o comando SQL:
Provas
Questão presente nas seguintes provas
A respeito da modelagem centrada em dados (Data-Centric Artificial Intelligence), analise as opções a seguir e
marque a correta.
Provas
Questão presente nas seguintes provas
O SHAP (SHapley Additive exPlanations) é uma abordagem baseada em teoria dos jogos, para explicar os
resultados apresentados por modelos de aprendizagem de máquina. A respeito do SHAP, analise as opções a
seguir e marque a correta.
Provas
Questão presente nas seguintes provas
Um professor do IFPE coordena um projeto de machine learning para classificar pacientes quanto à presença
de câncer de pele. Ele recebeu um conjunto de dados com 35.000 instâncias, contendo 500 exemplos de
diagnósticos para câncer de pele. A equipe desse professor dividiu o dataset em 70% de treinamento e 30% de
teste, utilizando Decision Tree (algoritmo c4.5) para a tarefa de classificação. Durante a fase de treinamento, o
modelo alcançou uma acurácia de 98%, mas, na fase de teste, anotou uma acurácia de 61%. Para o fato
descrito, é provável que tenha ocorrido um problema clássico em aprendizagem de máquina. Marque a opção
que melhor descreve o problema e uma possível solução, respectivamente.
Provas
Questão presente nas seguintes provas
A área do Big Data destaca muitas oportunidades potenciais ao revisitar os conjuntos de dados coletados ou
arquivados, tendo em vista o desenvolvimento de vários frameworks como Hadoop e Apache Spark. A respeito
do Hadoop, é correto afirmar que
Provas
Questão presente nas seguintes provas
Cadernos
Caderno Container