Foram encontradas 5.012 questões.
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Os algoritmos de aprendizado supervisionado partem de um conjunto de dados rotulados para fazer previsões sobre novos dados não rotulados. O Python scikit-learn é uma biblioteca de código aberto utilizada para codificações de rotinas em aprendizado de máquina supervisionado; ela oferece ainda uma série de ferramentas utilizadas no ajuste de modelos e no pré-processamento de dados, para a seleção e avaliação de modelos.
Tendo como referência essas informações, julgue o item a seguir.
SVC, NuSCV e LinearSVC são classes do scikit-learn capazes de realizar classificação binária e multiclasse em um conjunto de dados.
Provas

Considerando o código mostrado na figura apresentada, julgue o próximo item.
A figura que se segue é obtida mediante aplicação do seguinte código R:
ggplot(data=graf,mapping=aes(factor(z)))+
geom_bar(aes(fill=factor(z)))+
scale_fill_manual(“legenda”, values= c(“a” =
“black”, “b” = “gray”))+
xlab(“z”)+
ylab(“contagem”)

Provas
O alto volume de dados produzidos pela humanidade nos levou ao fenômeno do Big Data; assim, é cada vez mais comum investimentos em data warehouse, KDD (Knowledge Discovery in Databases) e BI (Business Intelligence). Diante do exposto, analise as afirmativas a seguir.
I. Data Warehouse: diferentemente de bancos transacionais é projetado para armazenamento de grandes volumes de dados voltados para apoio à tomada de decisão; assim, enfatiza a capacidade de recuperação de informação e o armazenamento não volátil.
II. ETL (Extract, Transform, Load): é um algoritmo de mineração de dados para clusterização (agrupamentos) que extrai dados de fontes e cria subgrupos de dados baseados no reconhecimento de padrões.
III. BI (Business Intelligence): não é uma tecnologia em si; trata-se de um processo empresarial que denota a capacidade da empresa de coletar dados, transformá-los em informação (BI) e tomar decisões de maneira rápida e eficiente; para isso, são utilizadas várias ferramentas, tecnologias e técnicas computacionais.
Está correto o que se afirma apenas em
Provas
A imagem representa a arquitetura geral de um data warehouse:

Assinale a alternativa correspondente.
Provas
Provas
Provas
Provas
Provas
Provas
Provas
Caderno Container