Questões do Concurso IPLANFOR - IDECAN

3324535 Ano: 2024
Disciplina: TI - Segurança da Informação
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

CriptografiaCriptografia de HashSHA
Proteção de DadosAnonimização e Pseudonimização

A manipulação de informações em ciência de dados é fundamental para o uso de algoritmos de aprendizado de máquinas. Assinale a alternativa que descreve o objetivo do seguinte código em Python.

import hashlib

email ='john.smith@dagster.com'

hashed_email = hashlib.sha256(email.encode( )).hexdigest( )

print(hasged_email)

Provas

Questão presente nas seguintes provas

3324534 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

No seguinte código em Python temos um DataFrame básico basic_df com IDs e nomes, e um DataFrame adicional additional_df com IDs, idades e cidades. Usamos o método merge() do pandas para combinar os dois DataFrames com base no ID, adicionando as colunas de idade e cidade ao DataFrame básico para enriquecimento. O resultado é um novo DataFrame enriched_df com dados adicionais integrados.

Enunciado 3742971-1

É correto afirmar que para que o código funcione conforme relatado neste enunciado, a função QUESTAO() deve ser substituída por:

Provas

Questão presente nas seguintes provas

3324533 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

Avalie o seguinte código em Python e assinale a resposta referente ao processo de data cleansing executado:

import pandas as pd

df = pd. read_csv('data.csv')

df["Calories"].fillna(130, inplace = True)

Provas

Questão presente nas seguintes provas

3324532 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

LinguagensPython

O seguinte código em Python conta com dados duplicado (ID no valor de 3 e Name no valor de Charlie).

import pandas as pd

data = {'ID': [1,2,3,3,4,5],

'Name': ['Alice', 'Bob', 'Charlie' Charlie', 'David', "Emily'}

df = pd.DataFrame(data)

deduplicated_df = df. drop_duplicates( )

O código que implementa deduplicação é:

Provas

Questão presente nas seguintes provas

3324531 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

LinguagensPython

Encontrar informações indesejadas é necessário no tratamento de dados, principalmente em strings. Analise o seguinte código e assinale a alternativa que contém a saída da última linha.

import re

text = "Hello, world! This is an example string with some numbers:

1234567890"

clean_text = re.sub(r'\d+', ", text)

print(clean_text)

Provas

Questão presente nas seguintes provas

3324530 Ano: 2024
Disciplina: TI - Ciência de Dados e BI
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

ProgramaçãoPythonNumPy
ProgramaçãoPythonPandas
ProgramaçãoPythonScipy

Os outliers geralmente representam dados com valores absurdos que representam erro nos dados coletados. Analise o seguinte código em Python:

import numpy as np
import pandas as pd
from scipy import stats

data = {'A':[1,2,3,4,5,6,7,8,9,10,1000]}
df = pd.DataFrame(data)
z_scores = np.abs(stats.zscore(df['A']))
threshold = 3
outlier_indices = np.where(z_scores) > threshold) [0]
clean_df = df.drop(outlier_indices)

É correto afirmar que a variável “clean_df” armazena

Provas

Questão presente nas seguintes provas

3324529 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

LinguagensPython

Valores ausentes geralmente requerem tratamento de dados em ciência de dados. Analise o seguinte código em Python e assinale a alternativa que apresenta o que é executado pela última linha:

from numpy import nan

from pandas import read_csv

dataset = read_csv('pima_indians-diabetes.csv'.header=Nome)

dataset[[1,2,3,4,5]] = dataset[[1,2,3,4,5]]. replace (0, nan)

dataset.dropna(inplace= True)

Provas

Questão presente nas seguintes provas

3324528 Ano: 2024
Disciplina: TI - Desenvolvimento de Sistemas
Banca: IDECAN
Orgão: IPLANFOR

Provas:

Analista de Planejamento - Gestão de Dados (Área 12)
Provas ×

O desempenho de muitos algoritmos de aprendizado de máquina degrada para variáveis que têm distribuições de probabilidade não padrão. Uma abordagem é usar a transformação da variável numérica para ter uma distribuição de probabilidade discreta, onde cada valor numérico é atribuído a um rótulo e os rótulos têm uma relação ordenada (ordinal). Assinale a alternativa que apresenta a função da biblioteca sklearn para discretização de dados.