Questões de Concurso – Aprova Concursos

1)

Q867737 - Cebraspe (Cespe) - 2024 - SEPLAG - CE - Analista de Gestão Pública - Ciência da Computação

No que se refere a Big Data e analytics, julgue os itens a seguir.

Em Big Data, um pipeline de dados visa refinar e limpar os dados brutos, facilitando a utilização desses dados pelos usuários finais.

Errado
Certo

2)

Q870611 - FGV - 2024 - TJ-MS - Analista de suporte T.I

Os bancos de dados massivos (Big Data) se caracterizam por armazenar grande volume de dados heterogêneos que crescem rapidamente ao longo do tempo.

Para implementar esse tipo de banco de dados, é necessário:

a) esquema pré-definido;
b) armazenamento de dados estruturados;
c) processamento orientado a transações atômicas e isoladas;
d) infraestrutura computacional escalável;
e) linguagem de consulta estruturada.

3)

Q867740 - Cebraspe (Cespe) - 2024 - SEPLAG - CE - Analista de Gestão Pública - Ciência da Computação

No que se refere a Big Data e analytics, julgue os itens a seguir.

Um dos Vs de Big Data corresponde a velocidade, à qual é aplicada a característica ACID, que garante, entre outras coisas, a atomicidade das transações no banco de dados.

Errado
Certo

4)

Q853040 - FGV - 2023 - Receita Federal - Analista Tributário da Receita Federal

A análise de dados prescritiva é uma técnica de análise de dados que

a) se concentra na descrição de dados passados e presentes, com o objetivo de encontrar tendências e padrões que possam ser usados para prever eventos futuros.
b) usa modelos matemáticos e estatísticos para identificar a melhor solução possível para um determinado problema.
c) se concentra em identificar as causas subjacentes de um problema e em encontrar maneiras de corrigi-las.
d) usa algoritmos de aprendizado de máquina para identificar padrões e tendências em grandes conjuntos de dados.
e) usa modelos de aprendizado profundo para identificar padrões em dados não estruturados.

5)

Q853044 - FGV - 2023 - Receita Federal - Analista Tributário da Receita Federal

Assinale a opção que melhor descreve a diferença entre os frameworks Apache Spark e Apache Hadoop, no contexto do processamento de Big Data.

a) O processamento de dados no Spark é mais rápido do que no Hadoop, pois ele é baseado em memória e utiliza RDDs, enquanto o Hadoop é baseado em disco e utiliza MapReduce.
b) O processamento de dados no Hadoop é mais rápido do que no Spark, pois o Hadoop é mais escalável e utiliza clusters maiores, enquanto o Spark é limitado pelo tamanho do cluster.
c) O Spark é mais adequado para cargas de trabalho mais pesadas, enquanto o Hadoop é melhor para cargas de trabalho mais leves e interativas.
d) O Spark e o Hadoop utilizam as mesmas técnicas de processamento de dados, mas o Spark é mais adequado para casos de uso em que a latência é um fator crítico, enquanto o Hadoop é mais adequado para casos de uso em que a capacidade de processamento em lote é mais importante.
e) O Hadoop é uma tecnologia mais recente que oferece melhorias, em relação ao Spark, em termos de desempenho e velocidade de processamento.

6)

Q852975 - FGV - 2023 - Receita Federal - Auditor Fiscal da Receita Federal

As principais plataformas de computação em nuvem, como Amazon Web Services (AWS), Microsoft Azure e Google Cloud Platform (GCP), oferecem soluções de Big Data para ajudar as empresas a coletar, armazenar, processar e analisar grandes quantidades de dados.

As opções a seguir apresentam conjuntos de serviços que estão diretamente relacionados a soluções de Big Data oferecidas pelas plataformas de computação em nuvem elencadas acima, à exceção de uma. Assinale-a.

a) Armazenamento de dados: AWS S3, Azure Blob Storage e Google Cloud Storage.
b) Processamento de dados: AWS EMR, Azure HDInsight e Google Cloud DataProc.
c) Análise de Dados: AWS Athena, Azure Data Lake Analytics e Google BigQuery.
d) Streaming de Dados: AWS Kinesis, Azure Stream Analytics e Google Cloud Pub/Sub.
e) Aplicações: AWS Elastic Beanstalk, Azure App Service e Google App Engine.

7)

Q830476 - Cebraspe (Cespe) - 2022 - DPE-RO - Analista - Administração

O big data, inicialmente caracterizado por três Vs, em 2001, atualmente inclui mais dois Vs. Um dos Vs que caracteriza o big data é

a) vulnerabilidade.
b) varonil.
c) variedade.
d) vetor.
e) volátil.

8)

Q818696 - CESGRANRIO - 2021 - Banco do Brasil - Escriturário - Agente de Tecnologia

Uma empresa precisa implementar um sistema Big Data para controlar a movimentação dos produtos que a empresa oferece. Esse sistema precisa estar com a configuração de dados como sendo um fato, que seria um evento de ocorrência, como, por exemplo: as compras de um determinado insumo, em um determinado fornecedor e em um determinado instante.
Para tal finalidade, esse sistema a ser implementado deverá estar organizado segundo a configuração de

a) Cubo de dados
b) Tuplas estáticas
c) Matriz de ocorrência
d) Documentos lineares
e) Subconjunto de atributos

9)

Q818686 - CESGRANRIO - 2021 - Banco do Brasil - Escriturário - Agente de Tecnologia

Na etapa de preparação de dados em um ambiente de Big Data, pode ocorrer o aparecimento de dados ruidosos, que são dados fora de sentido no ambiente do Big Data e que não podem ser interpretados pelo sistema. Uma forma de reduzir esse efeito, e até eliminá-lo, é utilizar um método de suavização de dados, que minimiza os efeitos causados pelos dados ruidosos.

Esse método consiste em

a) agrupar dados semelhantes em clusters, verificar os dados que se apresentam como ruidosos e não os inserir no ambiente de Big Data, substituindo cada um desses dados ruidosos pelo valor NULL.
b) criar um cubo de dados multidimensional para acelerar a identificação e a eliminação dos dados ruidosos encontrados, e, neste caso, os dados assumem valores predefinidos no momento do pré-processamento.
c) dividir os valores dos dados originais em pequenos intervalos, denominados compartimentos, e, em seguida, substituí-los por um valor geral, ou genérico, calculado para cada compartimento específico.
d) executar uma fusão de dados, tendo como base dados vizinhos, e obter novas variáveis que irão preencher os espaços incoerentes dentro do Big Data, eliminando o ruído.
e) realizar uma ação de Data Mining com atributos que se pareçam com dados ruidosos, gerando novos atributos, classificados como atributos “fantasmas”, sem valor para o tratamento do Big Data.

10)

Q468701 - ESAF - 2016 - ANAC - Analista Administrativo - Área 2

Para o processamento de grandes massas de dados, no contexto de Big Data, é muito utilizada uma plataforma de software em Java, de computação distribuída, voltada para clusters, inspirada no MapReduce e no GoogleFS. Esta plataforma é o(a)

a) Yam Common.
b) GoogleCrush.
c) EMRx.
d) Hadoop.
e) MapFix.

Questões de Concurso – Aprova Concursos

Milhares de questões com o conteúdo atualizado para você praticar e chegar ao dia da prova preparado!