O histograma a seguir mostra a quantidade de refeições para cada faixa de preço, em uma determinada área do Rio de Janeiro.

O conjunto de dados consistente com o histograma é:
ATENÇÃO!
Na próxima questão, considere as tabelas de banco de dados T, TX e DUAL, exibidas com suas respectivas instâncias a seguir.
T




Em um problema de classificação é entregue ao cientista de dados um par de covariáveis, (x1 , x2 ), para cada uma das quatro observações a seguir: (6,4), (2,8), (10,6) e (5,2). A variável resposta observada nessa amostra foi “Sim”, “Não”, “Sim”, “Não”, respectivamente.
A partição que apresenta o menor erro de classificação quando feita na raiz (primeiro nível) de uma árvore de decisão é:
Considere os documentos A e B a seguir.
A = “Há pessoas que choram por saber que as rosas têm espinho” B = “Há outras que sorriem por saber que os espinhos têm rosas”
A submatriz da matriz de TF-IDF desses dois documentos correspondente aos termos “Rosas”, “Choram” e “Sorriem”, nessa ordem, é:
Durante um trabalho de auditoria, um dos procedimentos previstos na matriz de planejamento era um teste de conformidade (para controle de qualidade) em uma população finita superior a 500 elementos. Para que a população testada fosse aprovada, foi definido como critério que a proporção máxima de erros admitidos seria de 3%. Foi considerado ainda um nível de confiança de 95% e que a amostra conteria no máximo um único erro.
Considere ainda a tabela a seguir, que contém índices calculados de confiabilidade para quantidades previstas de erros e níveis de confiança.
A partir dos dados apresentados e para cumprir os critérios previamente definidos, o tamanho da amostra para o teste na população indicada dev