Um analista dispõe dos valores da média aritmética
simples, da mediana e do desvio-padrão da idade de dois
grupos de 100 eleitores, um do sexo feminino e outro do
sexo masculino. Para o grupo feminino, os valores são:
média igual a 56 anos, mediana igual a 52 anos e desviopadrão
igual a 5 anos. Para o grupo do sexo masculino, os
valores são: média igual a 60 anos, mediana igual a 58
anos e desvio-padrão igual a 7 anos. O analista gostaria de
conhecer as estatísticas descritivas para a idade no grupo
total de 200 eleitores, mas só dispõe das estatísticas
separadas por sexo, cujos valores são os mencionados
anteriormente. Sobre o problema citado anteriormente,
analise as afirmativas.
I.A média da idade do grupo total de eleitores pode ser
obtida a partir das médias de idades dos grupos separados
por sexo e o seu valor é 58 anos.
II.O desvio-padrão da idade do grupo total de eleitores
pode ser obtido a partir dos desvios-padrão das idades
dos grupos separados por sexo e o seu valor é 6 anos.
III.A mediana da idade do grupo total de eleitores pode
ser obtida a partir das medianas das idades dos grupos
separados por sexo e o seu valor é 55 anos.
Está(ão ) correta(s ) a(s ) afirmativa(s )
A equipe de controle de qualidade de uma indústria metalúrgica
suspeita que a produção de peças defeituosas esteja
relacionada ao sistema de trabalho dos funcionários: com
ou sem troca de turno (trabalho noturno ou diurno). Para
um grupo de 180 funcionários com experiência similar na
função, mas com sistemas de trabalho diferentes, cada
funcionário teve registrado o percentual de peças defeituosas
produzidas durante uma semana, sendo classificado
como “aceitável", se esse percentual fosse menor ou igual a
5%, e como “não aceitável", caso contrário. Entre os 60
funcionários que não trocam turno e trabalham durante o
dia, o número de funcionários classificados como “aceitá-
vel" foi 47.Entre os 60 funcionários que não trocam turno e
trabalham durante a noite, o número de funcionários
classificados como “aceitável" foi 40 e, para o grupo de 60
funcionários que trocam turnos, esse número foi 33. A
estatística do teste apropriado foi calculada e o seu valor é
7.35. O quadro abaixo apresenta os valores dos percentis
de ordem 95 e 97.5 para as distribuições de probabilidade
gaussiana, t-Student e Qui-quadrado.
Considerando a descrição do problema e dos dados apresentados,
analise.
I. A hipótese nula do teste é a de que as proporções de
funcionários classificados como “aceitáveis" são homogêneas
nos três grupos.
II. Se a hipótese nula for verdadeira, o número esperado
de funcionários classificados como “aceitáveis" seria
40 em cada um dos três grupos.
III. A hipótese nula do teste pode ser rejeitada no nível de
significância de 5%.
Está(ão) correta(s) a(s) afirmativa(s)
O modelo de componentes principais é utilizado para
representar a estrutura de variância-covariância em função
de um número reduzido de combinações lineares das
variáveis originais, com o objetivo de se ter uma redução
de dados e uma melhor interpretação destes. Para o vetor
aleatório X´ = [X1, X2, ∙∙∙, Xp] com matriz de covariância Σ e
autovalores iguais a λ1 ≥ λ1 ≥ ∙∙∙ ≥ λp ≥ 0, e as combinações
lineares:
Estão corretas apenas as afirmativas
A tabela a seguir apresenta algumas estatísticas descritivas
do “peso" e do “comprimento" de 20 sapos.
É correto afirmar que os sapos têm
Uma cidade tem 12.000 domicílios divididos em três bairros (denotados por B1, B2 e B3), que pagam IPTU em três faixas
de valores (denotadas por I1, I2 e I3). Sabe-se que um pesquisador deseja estimar a média da renda mensal destes
domicílios via Amostragem Estraficada ou Amostragem por Conglomerados de 1.200 domicílios. O quadro a seguir
mostra o número de domicílios e a variância da renda mensal em cada faixa de IPTU e em cada bairro. A variância da
renda mensal entre todos os domicílios da região é igual a 3.400 (variância global).
Com o objetivo de aumentar a precisão do estimador da média da renda mensal, é correto afirmar que
indústria de confecções suspeita que as peças de tecido recebidas de uma fábrica, ao longo dos cinco dias da semana,
não são homogêneas quanto à resistência das fibras à tensão depois da tintura. Para verificar essa suspeita, uma amostra
de 9 peças de tecido de cada um dos cinco dias da semana foi avaliada quanto à resistência das fibras à tensão depois da
tintura. Os resultados da análise apropriada e aplicada a esses dados estão resumidos na tabela a seguir.
Considerando que μi
é a média da resistência à tensão do lote do dia i, i = 1, 2, 3, 4, 5, analise.
I.A hipótese nula do teste envolvido na análise desses dados é a de que μ1 = μ2 = μ3 = μ4 = μ5.
II.A hipótese alternativa do teste envolvido na análise desses dados é a de que μ1 ≠ μ2 ≠ μ3 ≠ μ4 ≠ μ5.
III.A hipótese alternativa do teste envolvido na análise desses dados é a de que pelo menos um dia da semana tem lote
com resistência média diferente da resistência média dos lotes dos demais dias da semana.
IV.A probabilidade de concluir erroneamente pela existência de diferença na resistência média à tensão dos lotes em ao
menos um dos dias da semana é de 0,058.
Está( ão) correta( s) apenas a( s) afirmativa( s)
O efeito de uma campanha publicitária para promoção
do voluntariado nas eleições será avaliado por meio do
seguinte experimento: antes do início da campanha, um
grupo de 200 eleitores responderá à seguinte questão:
“você gostaria de ser voluntário nas próximas eleições?
(sim ou não)". A campanha será lançada e, após três meses
de veiculação em rádio e TV, o mesmo grupo de eleitores
responderá à mesma questão. A campanha será reforçada
com publicidade em outdoors nos próximos três meses e,
após esse período, o mesmo grupo de eleitores responderá
novamente à mesma questão. A equipe responsável
pelo estudo deseja comparar o percentual de eleitores que
desejam ser voluntários nas próximas eleições em cada
etapa. Considerando o planejamento do experimento e o
tipo de variável a ser observada, o teste estatístico mais
adequado para avaliar a hipótese de estudo é o
“A análise de resíduos de um modelo de regressão linear
múltipla pode ser utilizada para verificar se o modelo se
adequa aos dados. Nesse sentido, gráficos e testes ajudam
a identificar discrepâncias entre os valores observados da
variável resposta e os valores preditos pelo modelo." De
acordo com o trecho anterior, marque V para as afirmativas
verdadeiras e F para as falsas.
( ) Quando os pontos do diagrama de dispersão do resí-
duo padronizado versus variável explicativa apresentar
uma tendência, a inclusão do logaritmo da variável
explicativa pode melhorar o modelo.
( ) Quando os pontos do diagrama de dispersão do resí-
duo versus variável omitida no modelo apresentar
uma tendência linear, a inclusão da variável omitida
pode melhorar o modelo.
( ) Quando o desenho esquemático (boxplot) dos resí-
duos padronizados apresentar observações além dos
limites superior ou inferior, existe uma forte indicação
da presença de outliers que devem ser investigados.
( ) Quando o desenho esquemático dos resíduos tem a
distância entre a mediana e o primeiro quartil e a
distância entre a mediana e o terceiro quartil bem distintas,
existe uma forte indicação de que a distribuição
das observações são assimétricas e o componente
aleatório do modelo pode não ter distribuição normal.
( ) A suposição de homocedasticidade dos resíduos pode
ser avaliada através de: teste de Levéne; teste de
Brown & Forsythe; gráfico de resíduos versus valores
preditos pelo modelo; gráfico do resíduo versus cada
uma das variáveis incluídas no modelo.
A sequência está correta em
Uma variável aleatória Gama é definida para valores reais
e positivos e sua função densidade é dada por
Diante do exposto, analise as afirmativas.
Estão corretas apenas as afirmativas
Em relação à Amostragem Aleatória Simples, é INCORRETO
afirmar que
Desejando estimar o salário médio dos gerentes de
agências bancárias, certo pesquisador tomou uma amostra
aleatória simples sem reposição de gerentes, na qual
os salários apresentaram média igual a 3,6 mil reais e
desvio-padrão igual a 0,5 mil reais. O pesquisador sabe
que, na sua população de gerentes, o tempo médio de
experiência no cargo é igual a 12 anos, enquanto que, na
sua amostra, o tempo médio de experiência no cargo
encontrado foi de 8 anos. Sabendo-se da forte relação
linear entre o salário e o tempo de experiência no cargo, o
pesquisador decidiu usar um estimador de regressão para
o salário médio. Para tanto, ajustou nos dados da amostra
um modelo de regressão linear do salário (Y, em mil reais)
em função do tempo de experiência no cargo (x, em anos),
obtendo a equação estimada
A estimativa de regressão para o salário médio é
Uma indústria mineradora produz minério de ferro e tem
um contrato com uma siderúrgica, especificando que o
teor médio de ferro nos lotes de minério entregue a ela
deve ser de, no mínimo, 60%. Caso contrário, os lotes são
devolvidos e a mineradora deve pagar uma multa. Para
certificar-se de que está enviando minério de ferro dentro
do que foi especificado no contrato, a mineradora toma
amostras de minério de cada lote a ser embarcado. Em
seguida, determina o teor médio de ferro do minério de
cada lote. A mineradora gostaria que a probabilidade de
concluir o lote a ser enviado cumprisse as especificações
estabelecidas pela siderúrgica quando, na verdade, não
as cumpre, seja, no máximo, 0,025. Considere as quatro
hipóteses a seguir:
Hipótese 1: o teor médio de minério de ferro do lote é
maior do que 60%.
Hipótese 2: o teor médio de minério de ferro do lote é
maior ou igual a 60%.
Hipótese 3: o teor médio de minério de ferro do lote é
menor do que 60%.
Hipótese 4: o teor médio de minério de ferro do lote é
menor ou igual a 60%.
Considerando as informações apresentadas, as hipóteses
nulas e a alternativa do teste a ser realizada antes do
embarque do lote são, respectivamente, as hipóteses
Para um conjunto de dados, utilizou-se um programa de
computador para calcular o valor das médias aritméticas
simples, harmônica e geométrica. No entanto, os valores
resultantes dos cálculos foram impressos sem qualquer
identificação sobre a qual medida-resumo eles se referiam.
Os valores impressos foram 2.63, 2.46 e 2.25. Conhecendo
as propriedades dessas medidas-resumo, é correto afirmar
que os valores da média aritmética simples, harmônica e
geométrica são, respectivamente,
O modelo de regressão logística é um caso particular de
um modelo linear generalizado em que o componente
aleatório tem distribuição Bernoulli e a função de ligação é
a logito. Diante do exposto, marque V para as afirmativas
verdadeiras e F para as falsas.
( ) Para uma variável explicativa numérica, o modelo
logístico tem uma forma linear para o logito da
probabilidade:
ou seja, π(x ) aumenta ou diminui como uma função
linear de x.
( ) A chance ou odds é a razão entre as probabilidades
de sucesso e fracasso e pode ser expressa como
e α(eβ)x. Quando a variável explicativa aumenta em uma unidade, a chance é aumentada multiplicativamente
por β.
( ) Para a avaliação do modelo de regressão com variáveis
explicativas numéricas pode-se utilizar a estatística X²
de Pearson ou a estatística G² do teste da razão de
verossimilhança dadas, respectivamente, por:
( ) Para a análise de resíduos de um modelo de regressão
logística com variáveis explicativas numéricas pode-se
utilizar o resíduo de Pearson ou o resíduo ajustado de
Pearson, dados, respectivamente, por:
imaegm
( ) O modelo de regressão logística multicategorizada é
uma generalização do modelo de regressão logística,
onde a variável resposta assume mais de duas categorias.
Quando as categorias são nominais, escolhe-se
uma como sendo a base para se construir as chances e
fazer as análises necessárias. No caso de categorias
ordinais, a ordenação pode ser incorporada ao modelo
na forma de probabilidades acumuladas, obtendo-se,
então, o modelo logito acumulativo.
A sequência está correta em