No que se refere a Big Data e analytics, julgue os itens a seguir.
Em Big Data, um pipeline de dados visa refinar e limpar os dados brutos, facilitando a utilização desses dados pelos usuários finais.
Os bancos de dados massivos (Big Data) se caracterizam por armazenar grande volume de dados heterogêneos que crescem rapidamente ao longo do tempo.
Para implementar esse tipo de banco de dados, é necessário:
No que se refere a Big Data e analytics, julgue os itens a seguir.
Um dos Vs de Big Data corresponde a velocidade, à qual é aplicada a característica ACID, que garante, entre outras coisas, a atomicidade das transações no banco de dados.
A análise de dados prescritiva é uma técnica de análise de dados que
Assinale a opção que melhor descreve a diferença entre os frameworks Apache Spark e Apache Hadoop, no contexto do processamento de Big Data.
As principais plataformas de computação em nuvem, como Amazon Web Services (AWS), Microsoft Azure e Google Cloud Platform (GCP), oferecem soluções de Big Data para ajudar as empresas a coletar, armazenar, processar e analisar grandes quantidades de dados.
As opções a seguir apresentam conjuntos de serviços que estão diretamente relacionados a soluções de Big Data oferecidas pelas plataformas de computação em nuvem elencadas acima, à exceção de uma. Assinale-a.
O big data, inicialmente caracterizado por três Vs, em 2001, atualmente inclui mais dois Vs. Um dos Vs que caracteriza o big data é
Uma empresa precisa implementar um sistema Big Data para controlar a movimentação dos produtos que a empresa oferece. Esse sistema precisa estar com a configuração de dados como sendo um fato, que seria um evento de ocorrência, como, por exemplo: as compras de um determinado insumo, em um determinado fornecedor e em um determinado instante.
Para tal finalidade, esse sistema a ser implementado deverá estar organizado segundo a configuração de
Na etapa de preparação de dados em um ambiente de Big Data, pode ocorrer o aparecimento de dados ruidosos, que são dados fora de sentido no ambiente do Big Data e que não podem ser interpretados pelo sistema. Uma forma de reduzir esse efeito, e até eliminá-lo, é utilizar um método de suavização de dados, que minimiza os efeitos causados pelos dados ruidosos.
Esse método consiste em
Para o processamento de grandes massas de dados, no contexto de Big Data, é muito utilizada uma plataforma de software em Java, de computação distribuída, voltada para clusters, inspirada no MapReduce e no GoogleFS. Esta plataforma é o(a)