Foram encontradas 5.012 questões.
A respeito de análise de dados, business intelligence (BI), OLAP e data warehouse (DW), julgue o item subsequente.
Tecnologias como o IBM Watson tornam possível a geração de valor a partir de coleções de informações relativas a operações da organização, seus clientes, procedimentos internos e interações com funcionários.
Provas
Quanto aos conceitos relativos à arquitetura de dados, julgue o item a seguir.
O ETL (Extract Transform Load) possui uma área de preparação de dados localizada entre as fontes de dados e os destinos de dados, que geralmente são data warehouses, data marts ou outros repositórios de dados; uma staging area é usada para o processamento de dados durante o processo de ETL.
Provas
Quanto aos conceitos relativos à arquitetura de dados, julgue o item a seguir.
Modelagem multidimensional de banco de dados é uma técnica usada para o auxílio às consultas do data warehouse, nas mais diferentes perspectivas. A visão multidimensional permite o uso mais intuitivo para o processamento analítico pelas ferramentas OLAP (on-line analytical processing).
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Um usuário deseja importar para o Python, por meio do módulo Pandas, o arquivo no formato csv de nome pesquisa.csv, cujo conteúdo é mostrado a seguir. Esse arquivo se encontra no diretório (ou pasta ou caminho) D:/.
|
05/06/2008,16:00,2.5788,2.5813,,, |
|
05/06/2008,16:15,2.5768,2.5793,,, |
|
05/06/2008,16:30,2.5744,2.5769,,, |
|
05/06/2008,16:45,2.574,2.5765,,, |
|
05/06/2008,17:00,2.571,2.5735,,, |
|
05/06/2008,17:15,2.5733,2.5758,,, |
|
05/06/2008,17:30,2.5728,2.5753,,, |
|
05/06/2008,17:45,2.5727,2.5752,,, |
|
05/06/2008,18:00,2.5788,2.5813,,, |
|
05/06/2008,18:15,2.5731,2.5756,,, |
|
05/06/2008,18:30,2.5743,2.5768,,, |
Considerando essas informações, julgue o próximo item.
O código abaixo permite importar apenas a última linha das duas primeiras colunas do arquivo pesquisa.csv.
import os
os.chdir('D:/')
import pandas
dados=pandas.read_csv('pesquisa.csv',
header=None,usecols=[1,2],
skiprows = range(1,9))
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a métodos para imputação de dados, julgue o seguinte item.
O método de imputação K-NN (k-nearest neighbours) leva em consideração os padrões de similaridade presentes no conjunto de dados para predizer os valores faltantes. No entanto, a escolha da função de distância para a aplicação desse método, como, por exemplo, HEOM (heterogeneous euclidean-overlap metric) ou HVDM (heterogeneous value difference metric), pode influenciar significativamente nos resultados da imputação.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a machine learning aplicado, julgue o próximo item.
Suponha que a palavra amor ocorra 1.000 vezes no último livro escrito por certo autor, que escreveu, no total, 10 livros. Nesse caso, se a palavra amor for encontrada em todos os livros desse autor, então o valor do TF-IDF (term frequencyinverse document frequency) referente à palavra amor no último livro escrito será igual a 1/1.000.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a machine learning aplicado, julgue o próximo item.
Stop-words constituem um conjunto de palavras que proporcionam pouca informação para o significado de uma frase.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
O algoritmo de backpropagation consiste das fases de propagação e de retro propagação: na primeira, as entradas são passadas através da rede e as previsões de saída são obtidas; na segunda, se calcula o termo de correção dos pesos e, por conseguinte, a atualização dos pesos.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Julgue o próximo item, relativo a redes neurais artificiais (RNA).
As funções de ativação são elementos importantes nas redes neurais artificiais; essas funções introduzem componente não linear nas redes neurais, fazendo que elas possam aprender mais do que relações lineares entre as variáveis dependentes e independentes, tornando-as capazes de modelar também relações não lineares.
Provas
Disciplina: TI - Ciência de Dados e BI
Banca: CESPE / CEBRASPE
Orgão: Petrobrás
Com respeito a análise de componentes principais, mistura de gaussianas e agrupamento k-means, julgue o item que se segue.
Considere a tabela abaixo que mostra as distâncias entre cada observação de um conjunto de dados hipotético e os vetores médios (centroides) do cluster correspondente ao final da aplicação do algoritmo de agrupamento k-means. Com base nessa tabela, infere-se que o cluster 1 é constituído pelas observações 2, 5 e 10.
| cluster | ||||
| observação | 1 | 2 | 3 | 4 |
| 1 | 3 | 8 | 7 | 12 |
| 2 | 12 | 7 | 5 | 10 |
| 3 | 7 | 3 | 8 | 10 |
| 4 | 4 | 8 | 12 | 8 |
| 5 | 12 | 5 | 7 | 7 |
| 6 | 2 | 7 | 6 | 10 |
| 7 | 7 | 12 | 9 | 1 |
| 8 | 8 | 10 | 4 | 9 |
| 9 | 5 | 2 | 6 | 6 |
| 10 | 9 | 8 | 5 | 2 |
Provas
Caderno Container