Foram encontradas 110 questões.
Acerca de técnicas utilizadas na ciência de dados, julgue os itens a seguir.
O algoritmo Apriori gera primeiro todos os itemsets individuais (itens) e, em seguida, combina-os para gerar itemsets de tamanho maior. Já o algoritmo FP-growth constrói uma estrutura de dados compacta denominada FP-tree, permitindo a mineração de itemsets frequentes sem gerar candidatos. Quanto à eficiência, o Apriori é mais rápido que o FP-growth devido à simplicidade de sua abordagem.
Provas
Acerca de técnicas utilizadas na ciência de dados, julgue os itens a seguir.
A PCA (análise de componentes principais) é uma técnica que transforma variáveis correlacionadas em componentes principais ortogonais, o que permite a redução da dimensionalidade dos dados; a seleção dos componentes principais é realizada com base na variância explicada por cada componente.
Provas
Em relação a BI (Business Intelligence) e visualização de dados, julgue os itens que se seguem.
Em uma arquitetura de BI típica, o data warehouse integra dados de várias fontes externas, realizando extração, transformação e carga (ETL) antes de eles serem disponibilizados para análise.
Provas
Em relação a BI (Business Intelligence) e visualização de dados, julgue os itens que se seguem.
Para um data warehouse com grande volume de dados históricos e consultas frequentes, o esquema estrela geralmente apresenta melhor desempenho que o esquema snowflake, pois minimiza a complexidade das junções entre tabelas.
Provas
Em relação a BI (Business Intelligence) e visualização de dados, julgue os itens que se seguem.
O gráfico de dispersão pode ser uma ferramenta útil para explorar a relação entre as variáveis, possibilitando uma análise visual inicial; no entanto, técnicas adicionais, como suavização por regressão local, transformação de variáveis ou o uso de gráficos alternativos (como histogramas bivariados), podem ser necessárias para revelar padrões mais claramente.
Provas
Julgue os próximos itens, a respeito de bancos de dados relacionais e não relacionais.
O modelo relacional, embora seja eficiente para operações de leitura e escrita simples, pode se tornar ineficiente em situações que exijam processamento de grandes volumes de dados semiestruturados, como logs ou eventos. Já o modelo orientado a documentos é mais flexível para consultas complexas que envolvam múltiplas junções entre documentos, oferecendo melhor desempenho em comparação ao modelo relacional.
Provas
Julgue os próximos itens, a respeito de bancos de dados relacionais e não relacionais.
Em algumas implementações de bancos de dados relacionais, como PostgreSQL, é possível criar atributos do tipo array, o que permite armazenar múltiplos valores em uma única coluna, contradizendo o princípio original do modelo relacional de não permitir atributos multivalorados, pois cada coluna de uma tabela deve armazenar apenas um valor por atributo.
Provas
- Banco de Dados RelacionalCardinalidade de Relacionamentos
- Modelagem de DadosEntidades
- Modelagem de DadosModelo Entidade-Relacionamento
- Modelagem de DadosRelacionamentos
O esquema lógico para a criação de um banco de dados no modelo relacional de um sistema de beneficiamento de produção de café tem as seguintes entidades: Fazenda, Funcionario, Supervisor, Plantacao, Lote_de_Cafe, Analista_de_qualidade, Etapa_de_Beneficiamento. Nesse esquema, tem-se que:
• uma fazenda pode ter várias plantações;
• um funcionário pode ser um supervisor ou um analista de qualidade;
• uma plantação pode produzir vários lotes de café;
• um lote de café pode passar por várias etapas de beneficiamento;
• cada etapa de beneficiamento tem um supervisor responsável;
• um lote de café pode ser analisado quanto à qualidade por vários analistas.
Com base no cenário apresentado, julgue os itens a seguir.
Para a correta implementação do projeto físico do banco de dados, serão necessárias duas tabelas de associação.
Provas
- Banco de Dados RelacionalRestrições de IntegridadeIntegridade Referencial
- Banco de Dados RelacionalTipos de ChavesChave Estrangeira
O esquema lógico para a criação de um banco de dados no modelo relacional de um sistema de beneficiamento de produção de café tem as seguintes entidades: Fazenda, Funcionario, Supervisor, Plantacao, Lote_de_Cafe, Analista_de_qualidade, Etapa_de_Beneficiamento. Nesse esquema, tem-se que:
• uma fazenda pode ter várias plantações;
• um funcionário pode ser um supervisor ou um analista de qualidade;
• uma plantação pode produzir vários lotes de café;
• um lote de café pode passar por várias etapas de beneficiamento;
• cada etapa de beneficiamento tem um supervisor responsável;
• um lote de café pode ser analisado quanto à qualidade por vários analistas.
Com base no cenário apresentado, julgue os itens a seguir.
Para garantir a integridade referencial e a restrição de que somente supervisores sejam responsáveis pelo processo de beneficiamento, a tabela Etapa_de_Beneficiamento deve ter uma chave estrangeira referenciando a tabela Supervisor, que deve conter uma chave estrangeira referenciando a tabela Funcionario.
Provas
Considerando que a durabilidade ( Y) de certo produto depende da temperatura ( T) e da umidade ( U) do local de armazenamento, um pesquisador obteve as estimativas de mínimos quadrados ordinários para os coeficientes de um modelo de regressão linear múltipla na forma
\(Y = \beta_0 + \beta_1T + \beta_2U + \epsilon,\)
no qual β0, β 1 , β 2 representam os coeficientes do modelo e ∈ denota o erro aleatório, que segue distribuição normal com média zero e desvio padrão σ . As tabelas a seguir mostram os resultados obtidos pelo pesquisador.
| coeficiente | estimativa | razão t | p-valor |
|---|---|---|---|
| β0 | 2,5 | 2 | 0,050 |
| β1 | -0,01 | -3 | 0,002 |
| β2 | -0,02 | -2,5 | 0,010 |
| fonte de variação |
soma de quadrados |
graus de liberdade |
|---|---|---|
| modelo | 5.000 | 2 |
| erro | 1.250 | 50 |
| total | 6.250 | 52 |
Com base nas informações apresentadas, julgue os itens a seguir.
A estimativa do desvio padrão \( σ \) é igual ou superior a 6.
Provas
Caderno Container