Foram encontradas 140 questões.
Com relação às características dos componentes do ecossistema Hadoop, analise as afirmativas a seguir.
I. Kafka é um gerenciador de armazenamento de dados do tipo colunar de código aberto de fácil integração com MapReduce e Spark, que utiliza o modelo de consistência forte, permite que o desenvolvedor escolha requisitos de consistência por solicitação, incluindo a opção de consistência estritamente serializável.
II. Impala, que tem forte integração com o Kudu, permite que o desenvolvedor de aplicações o utilize para inserir, consultar, atualizar e excluir dados no Kudu usando a sintaxe SQL do Impala. Adicionalmente, permite usar JDBC ou ODBC para conectar aplicativos novos ou pré-existentes escritos em qualquer linguagem, estrutura ou ferramenta de inteligência de negócios.
III. Kudu permite integrar seu próprio catálogo com o Hive Metastore (HMS). O HMS é o provedor de metadados e catálogo padrão no ecossistema Hadoop. Quando a integração está habilitada, as tabelas Kudu podem ser descobertas e usadas por ferramentas externas com reconhecimento de HMS, mesmo que elas não estejam integradas ao Kudu.
Está correto o que se afirma em
Provas
Leia o fragmento a seguir.
“Atualmente, no contexto do Big Data e Data Analytics, faz-se referência às características enunciadas por pesquisadores e produtores de soluções como sendo um conjunto de cinco Vs. Originalmente, a definição clássica de Big Data fez referência a três Vs fundamentais: _____, _____ e _____ de dados que demandam formas inovadoras e rentáveis de processamento da informação, para melhor percepção e tomada de decisão.”
Assinale a opção cujos itens completam corretamente as lacunas do fragmento acima, na ordem apresentada.
Provas
CRISP-DM é um modelo de referência não proprietário e tecnologicamente neutro que pode ser usado por iniciantes ou especialistas para descrever o ciclo de vida de projetos de Mineração de Dados em seis fases distintas.
A terceira fase do modelo corresponde
Provas
Com relação às características de dados semiestruturados, analise as afirmativas a seguir.
I. Os esquemas de dados semiestruturados são usualmente definidos após a existência dos dados, tendo como base uma investigação de suas estruturas particulares e da análise de diferenças e similaridades. No entanto, isto não significa que sempre existirá um esquema associado a um dado semiestruturado.
II. Devido à natureza evolucionária e regular dos dados semiestruturados, as estruturas de representação implícitas ou explícitas restringem-se a descrever o estado corrente de poucas ocorrências de dados similares. Dessa forma, é possível prescrever esquemas completos existindo poucas restrições de integridade com relação à semântica dos atributos.
III. Como a estrutura está embutida na descrição dos dados, muitas vezes não é clara a distinção lógica entre a estrutura e o conteúdo. Por exemplo, um endereço representado como um valor atômico em uma ocorrência de dado ou como um tipo pré-definido pelo usuário (com atributos rua, número e complemento) em outra ocorrência. Esta característica dificulta o projeto de banco de dados relacional para tais dados.
Está correto o que se afirma em
Provas
Dados conectados referem-se a um conjunto de boas práticas para publicação e conexão de dados na Web, usando padrões recomendados pelo W3C. Eles são guiados por princípios conhecidos como “sistema de 5 estrelas”, que classificam, por meio de estrelas, o grau de abertura dos dados.
Dados conectados classificados com “3 estrelas” são dados abertos já disponíveis na Internet de maneira
Provas
Suponha a entrega de um laboratório (SaaS) como microsserviços na nuvem, onde cada aluno terá um espaço dedicado de memória, processamento, e poderá abrir uma interface Web e rodar códigos em Python. O espaço individual de cada aluno será criado a partir de uma mesma imagem.
Assinale a opção que apresenta a plataforma de entrega na nuvem para atender a essa demanda.
Provas
O desenvolvimento e a disponibilização de serviços na nuvem é uma prática muito comum.
Sobre uma plataforma de streaming de filmes que cobra por assinatura, assinale a opção que indica o modelo de serviço recebido do provedor de nuvem e o que é entregue pelo desenvolvedor ao usuário final.
Provas
Assinale a opção que denota apenas elementos que tornaram possível a evolução de serviços em nuvem.
Provas
As nuvens públicas possuem diversos serviços de armazenamento.
Sobre uma demanda, em que é necessário guardar um grande volume de arquivos por um longo tempo, assinale a afirmativa que apresenta a opção mais eficiente.
Provas
Existem alguns benefícios na adoção de nuvens privadas em relação às nuvens públicas.
Assinale a opção que descreve apenas benefícios de uma nuvem privada.
Provas
Caderno Container