Questões de Concurso – Aprova Concursos

1)

Q833566 - FGV - 2022 - TCU - Auditor Federal de Controle Externo

A tabela presente no código em R abaixo apresenta a quantidade de processos analisados por três analistas (denotados por A1, A2 e A3) em diferentes anos.
dados = tibble::tibble(Analista=c(“A1”, “A1”, “A1”, “A2”, “A2”, “A3”, “A3”, “A3”),
Ano=c(2018,2019,2020,2019,2020,2018,2019,2020), Processos=c(10,15,20,25,20,8,7,12))
Um programador roda o código abaixo em R.
tidyr::pivot_wider(data=dados, names_from=”Analista”, values_from=”Processos”)

Os valores esperados na primeira linha do objeto resultante do comando acima são:

a)
2018, 10, NA, 8;
b)
A1, 10, 15, 20;
c)
A1, 2018, 10;
d)
2018, 18;
e)
A2, 2019, 25.

2)

Q833565 - FGV - 2022 - TCU - Auditor Federal de Controle Externo

Um analista do TCU gostaria de aplicar um modelo de Latent Dirichlet Allocation (LDA) em um conjunto de textos. A alternativa que melhor descreve o resultado do modelo é:

a)
uma lista de tópicos, cada um com um título diferente;
b)
uma lista das palavras mais importantes no conjunto de documentos;
c)
cada documento é classificado em somente um tópico, onde cada tópico é formado por uma lista de palavras;
d)
cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde cada tópico é formado por uma lista de palavras e cada palavra pertence a somente um tópico;
e)
cada documento possui uma distribuição de probabilidade de pertencer a algum dos tópicos, onde cada tópico é formado por uma distribuição de probabilidade sobre todas as palavras presentes nos documentos.

3)

Q833571 - FGV - 2022 - TCU - Auditor Federal de Controle Externo

Durante o treinamento de uma rede neural artificial para classificação de imagens, foi observado o comportamento descrito pelo gráfico abaixo, que mostra a evolução do erro conforme o número de iterações.

Imagem associada para resolução da questão

O classificador em questão foi treinado em um conjunto de dados particionado (holdout) em 60%/30%/10% (treinamento/validação/ teste). Entretanto, os especialistas envolvidos consideraram o modelo obtido insatisfatório após analisarem o gráfico.
Considerando essas informações, duas técnicas que poderiam ser utilizadas para contornar o problema encontrado são:

a) Parada precoce, Minimização de Entropia Cruzada;
b) Validação cruzada, Dropout;
c) Sobreamostragem, Gradiente Descendente Estocástico;
d) Dropout, Parada em convergência;
e) Minimização de Entropia Cruzada, Validação cruzada.

4)

Q833570 - FGV - 2022 - TCU - Auditor Federal de Controle Externo

Uma organização está implementando um sistema de busca de informações interno, e a equipe de desenvolvimento resolveu avaliar diferentes modelos de linguagem vetoriais que ajudariam a conectar melhor documentos e consultas em departamentos que usam terminologias distintas em áreas de negócio que se sobrepõem. Um dos analistas ressaltou que seria interessante guardar os vetores de todo o vocabulário do modelo em um cache, de forma a aumentar a eficiência de acesso e reduzir certos custos de implantação.
Das alternativas abaixo, aquela que lista apenas os modelos compatíveis com essa estratégia de caching é:

a)
TF-IDF, BERT;
b)

Word2Vec, BERT, GPT-2;
c)
GloVe, GPT-2;
d)
Word2Vec, GloVe;
e)
GPT-2, BERT.

Questões de Concurso – Aprova Concursos

Milhares de questões com o conteúdo atualizado para você praticar e chegar ao dia da prova preparado!