Skip to content

Commit 66edea1

Browse files
committed
A2 2022
1 parent 9ea6c5b commit 66edea1

5 files changed

Lines changed: 294 additions & 0 deletions

File tree

provas/PDF/A22022_solucoes.pdf

282 KB
Binary file not shown.

provas/src/A2_2022_sol1.tex

Lines changed: 28 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,28 @@
1+
\textcolor{red}{\textbf{Conceitos trabalhados}: função poder; tamanho.}
2+
\textcolor{purple}{\textbf{Nível de dificuldade}: fácil.}\\
3+
\textcolor{blue}{
4+
\textbf{Resolução:}
5+
Para responder a), vamos lembrar que a função poder $\pi(\theta \mid \delta_c) = P_\theta\left(\textrm{Rejeitar}\: H_0\right)$.
6+
Sendo assim, temos
7+
\begin{align*}
8+
\pi(\theta \mid \delta_c) &= P_\theta\left(S \geq c\right),\\
9+
&= 1 - P_\theta(S < c),\\
10+
&= 1 - F_S\left(c; n, \theta \right),
11+
\end{align*}
12+
onde $F_S\left(x; a, b\right)$ é a f.d.a. de uma distribuição Gama com forma $a$ e taxa $b$ avaliada em $x \in \mathbb{R}$.
13+
Agora precisamos mostrar que $\pi(\theta \mid \delta_c)$ é não descrescente em $\theta$ de modo a responder b).
14+
Usando a dica, sabemos que
15+
\begin{equation*}
16+
\pi(\theta \mid \delta_c) = 1 - e^{-c/\theta}\sum_{j = k}^\infty \frac{1}{j!}\left(\frac{c}{\theta}\right)^j,
17+
\end{equation*}
18+
de modo que $\frac{\partial}{\partial \theta}\pi(\theta \mid \delta_c) \geq 0$.
19+
Outro bom argumento é esboçar o gráfico da função poder e mostrar que ela não pode decrescer.
20+
O tamanho de $\delta_c$ é dado por
21+
\begin{equation*}
22+
\alpha_0 := \sup_{\theta \in \Theta_0} \pi(\theta \mid \delta_c).
23+
\end{equation*}
24+
Como a função poder é não descrescente, temos que $\alpha_0 = \pi(\theta_0 \mid \delta_c)$, respondendo c).
25+
Em d), temos que o teste de fato é não-viesado, pois a função poder é não descrescente em $\theta$, de modo que para todo par $\theta \in \Theta \setminus \Theta_0$ e $\theta^\prime \in \Theta_0$ temos que $\pi(\theta^\prime \mid \theta) \leq \pi(\theta \mid \theta)$.
26+
$\blacksquare$\\
27+
\textbf{Comentário:} Esta é uma questão parecida com a Q1 da A2 de 2020, mas neste caso Ivo mede os tempos entre as quedas dos poemas. Uma questão simples e conceitual para esquentar os músculos.
28+
}

provas/src/A2_2022_sol2.tex

Lines changed: 65 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,65 @@
1+
\textcolor{red}{\textbf{Conceitos trabalhados}: quantidade pivotal; intervalo de confiança; equivalência entre ICs e testes.}
2+
\textcolor{purple}{\textbf{Nível de dificuldade}: fácil.}\\
3+
\textcolor{blue}{
4+
\textbf{Resolução:}
5+
Existem várias respostas possíveis para a), algumas mais úteis (para os itens subsequentes) que outras.
6+
Por exemplo,
7+
\begin{equation*}
8+
W_n := \bar{X}_n - \theta
9+
\end{equation*}
10+
é pivotal, com distribuição Normal com média $0$ e variância $\sigma^2/n$.
11+
Uma escolha um pouco mais sábia é
12+
\begin{equation*}
13+
Z_n := \sqrt{n}\frac{\left(\bar{X}_n - \theta\right)}{\sigma},
14+
\end{equation*}
15+
que tem distribuição normal-padrão.
16+
Para responder b), temos, mais uma vez, algumas opções: podemos construir intervalos unilaterais ou bilaterais.
17+
A partir de $Z_n$, podemos construir um intervalo de confiança conseguimos construir intervalos usando a normal-padrão.
18+
Para um intervalo unilateral, podemos escolher $c_U = \Phi^{-1}(0.05)$ e fazer
19+
\begin{equation*}
20+
I_1(\bX_n) = \left(-\infty, \bar{X}_n + |c_U|\frac{\sigma}{\sqrt{n}}\right),
21+
\end{equation*}
22+
ou
23+
\begin{equation*}
24+
I_2(\bX_n) = \left(\bar{X}_n - |c_U|\frac{\sigma}{\sqrt{n}}, \infty\right).
25+
\end{equation*}
26+
Para construir um intervalo bilateral, fazemos $c_B = \Phi^{-1}(0.025)$ e então
27+
\begin{equation*}
28+
I_3(\bX_n) = \left(\bar{X}_n - |c_B|\frac{\sigma}{\sqrt{n}}, \bar{X}_n + |c_B|\frac{\sigma}{\sqrt{n}}\right),
29+
\end{equation*}
30+
é um intervalo com a cobertura desejada.
31+
A resposta de c) é sim: podemos, por exemplo, usar $I_2(\bX_n)$ e desenhar um teste da forma
32+
\begin{equation*}
33+
\delta_2 =
34+
\begin{cases}
35+
\textrm{Rejeitar}\: H_0, \: \textrm{se}\: \theta_0 \in I_2(\bX_n),\\
36+
\textrm{Falhar em rejeitar}\: H_0 \: \textrm{caso contrário}.
37+
\end{cases}
38+
\end{equation*}
39+
Este teste tem tamanho $\alpha$ e é não-viesado.
40+
Se não soubéssemos o valor de $\sigma^2$, poderíamos construir a quantidade pivotal
41+
\begin{equation*}
42+
Q_n = \sqrt{n}\frac{\bar{X}_n - \theta_0}{\sqrt{\frac{\sum_{i=1}^n (X_i-\bar{X}_n)^2}{n-1}}},
43+
\end{equation*}
44+
que tem distribuição t de Student com $n-1$ graus de liberdade.
45+
Isso nos leva a um novo intervalo da forma
46+
\begin{equation*}
47+
I_4(\bX_n) = \left(\bar{X}_n - |t_U|\frac{\sqrt{\frac{\sum_{i=1}^n (X_i-\bar{X}_n)^2}{n-1}}}{\sqrt{n}}, \infty\right),
48+
\end{equation*}
49+
onde $t_U$ é o quantil $\alpha$ de uma t de Student com $n-1$ graus liberdade.
50+
Com $I_4$ em mãos, desenhamos um teste como anteriormente:
51+
\begin{equation*}
52+
\delta_4 =
53+
\begin{cases}
54+
\textrm{Rejeitar}\: H_0, \: \textrm{se}\: \theta_0 \in I_4(\bX_n),\\
55+
\textrm{Falhar em rejeitar}\: H_0 \: \textrm{caso contrário}.
56+
\end{cases}
57+
\end{equation*}
58+
A resposta de e) tem a ver com aceitar $H_0$ quando ela é falsa, isto é, quando $\theta > \theta_0$.
59+
Este é um erro do tipo II e acontece com probabilidade $1-\pi(\theta \mid \delta_4) = 0.975$.
60+
No mesmo ímpeto, poderiámos responder f) dizendo que é possível construir testes onde o erro do tipo II fica controlado.
61+
A consequência é, em geral, que a taxa de erro do tipo I (falsos positivos) tende a aumentar.
62+
$\blacksquare$\\
63+
\textbf{Comentário:} Esta questão é bem conceitual e procura testar os conhecimentos sobre testes no caso normal.
64+
Havia várias maneiras de responder corretamente às questões.
65+
}

provas/src/A2_2022_sol3.tex

Lines changed: 45 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,45 @@
1+
\textcolor{red}{\textbf{Conceitos trabalhados}: Regressão linear; desenho experimental; quantidades derivadas.}\\ \textcolor{purple}{\textbf{Nível de dificuldade}: médio.}\\
2+
\textcolor{blue}{
3+
\textbf{Resolução:}
4+
Para resolver a) vamos perceber que quando substituímos a covariável original $X$ por $X^\prime = X-\bar{x}$ temos $\bar{x}^\prime = 0$ e portanto $\operatorname{Cov}\left(\hat{\beta_0}, \hat{\beta_1} \right) = -\frac{\bar{x}^\prime \sigma^2}{s_x^2} = 0$.
5+
Para afirmarmos que $\hat{\beta_0}$ e $\hat{\beta_1}$ são independentes é preciso lembrar que estes estimadores têm distribuição conjunta Normal bivariada; quando a covariância é zero, sabemos que são independentes.
6+
A resposta de b) pode ser deduzida ao lembrar que no caso centrado, a variância de $\hat{\beta_0}$ é $\sigma^2/n$.
7+
Desta forma, precisamos apenas encontrar $n$ tal que $\sigma^2/n < v$, isto é $n > \sigma^2/v$.
8+
Como sabemos que os estimadores dos coeficientes são não-viesados, podemos encontrar $\hat{\theta} = a\hat{\beta_0} + b\hat{\beta_1} +c$ como nosso estimador não-viesado de $\theta$.
9+
O EQM de tal estimador é a sua variância:
10+
\begin{align*}
11+
E[(\hat{\theta}-\theta)^2] &= \vr(\hat{\theta}) = a^2 \vr(\hat{\beta_0}) + b^2\vr(\hat{\beta_1}) -ab \operatorname{Cov}(\hat{\beta_0}, \hat{\beta_1}),\\
12+
&= a^2 \sigma^2 \left( \frac{1}{n} + \frac{\bar{x}^2}{s_x^2} \right) + b^2\frac{\sigma^2}{s_x^2} + ab \frac{\bar{x}\sigma^2}{s_x^2},\\
13+
&= \sigma^2 \left(\frac{a^2}{n} + \frac{a^2\bar{x}^2}{s_x^2} + \frac{b^2}{s_x^2} + \frac{ab\bar{x}}{s_x^2}\right).
14+
\end{align*}
15+
Por fim, vamos responder d).
16+
Note que a expressão necessária aqui é a do intervalo de predição:
17+
\begin{equation*}
18+
\hat{Y} \pm c(n, \alpha_0)\cdot\hat{\sigma}_r^\prime \cdot \sqrt{\left[ 1+ \frac{1}{n} + \frac{\left(x_{\text{pred}}-\bar{x}\right)^2}{s_x^2} \right]},
19+
\end{equation*}
20+
onde
21+
\begin{equation*}
22+
c(n, \alpha_0) := T^{-1}\left(1-\frac{\alpha_0}{2}; n-2\right),
23+
\end{equation*}
24+
e
25+
\begin{equation*}
26+
\hat{\sigma}_r^\prime := \sqrt{\frac{\sum_{i=1}^n \left(Y_i - \hat{\beta_0} - \hat{\beta_1}x_i \right)^2}{n-2}}.
27+
\end{equation*}
28+
Quando $x_{\text{pred}} = \bar{x}$ a expressão se reduz um pouco e podemos deduzir que a largura do intervalo é
29+
\begin{equation*}
30+
\hat{l} = 2 \cdot c(n, \alpha_0) \cdot \hat{\sigma}_r^\prime \sqrt{\left[ 1+ \frac{1}{n}\right]}.
31+
\end{equation*}
32+
Desejamos, portanto, encontrar $n$ tal que
33+
\begin{align*}
34+
\pr\left(\hat{l} < l\right) &\geq \gamma,\\
35+
\pr\left( \hat{\sigma}_r^\prime < \frac{l}{2 \cdot c(n, \alpha_0) \cdot \sqrt{\left[ 1+ \frac{1}{n}\right]} }\right) &\geq \gamma,\\
36+
\end{align*}
37+
isto é conseguimos reduzir nossa afirmação probabilística a uma afirmação com respeito à f.d.a. (ou CDF) de $\hat{\sigma}_r^\prime$.
38+
Para completar nossos cálculos só precisamos nos lembrar que $n \hat{\sigma}_r^\prime/\sigma^2$ tem distribuição qui-quadrado com $n-2$ graus de liberdade (De Groot, Teorema 11.3.2) e, portanto,
39+
\begin{equation*}
40+
\pr\left(\hat{\sigma}_r^\prime \leq a \right) = F_\chi\left(\frac{\sigma^2}{n}a; n- 2\right).
41+
\end{equation*}
42+
$\blacksquare$\\
43+
\textbf{Comentário:} Nesta questão, retirada \textit{ipsis litteris} da A2 2021, trabalhamos os efeitos de centrar a variável independente na distribuição dos estimadores dos coefficientes.
44+
Além disso, trabalhamos ideias de desenho experimental, determinando o tamanho amostral necessário para que a banda de predição na média da variável independente tenha uma certa largura com alta probabilidade.
45+
}
Lines changed: 156 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,156 @@
1+
\documentclass[a4paper,10pt, notitlepage]{report}
2+
\usepackage[utf8]{inputenc}
3+
\usepackage{natbib}
4+
\usepackage{amssymb}
5+
\usepackage{amsmath}
6+
\usepackage{enumitem}
7+
\usepackage{xcolor}
8+
\usepackage{url}
9+
\usepackage{cancel}
10+
\usepackage{mathtools}
11+
\usepackage[portuguese]{babel}
12+
\usepackage{newclude}
13+
14+
%%%%%%%%%%%%%%%%%%%% Notation stuff
15+
\newcommand{\pr}{\operatorname{Pr}} %% probability
16+
\newcommand{\vr}{\operatorname{Var}} %% variance
17+
\newcommand{\rs}{X_1, X_2, \ldots, X_n} %% random sample
18+
\newcommand{\irs}{X_1, X_2, \ldots} %% infinite random sample
19+
\newcommand{\rsd}{x_1, x_2, \ldots, x_n} %% random sample, realised
20+
\newcommand{\bX}{\boldsymbol{X}} %% random sample, contracted form (bold)
21+
\newcommand{\bx}{\boldsymbol{x}} %% random sample, realised, contracted form (bold)
22+
\newcommand{\bT}{\boldsymbol{T}} %% Statistic, vector form (bold)
23+
\newcommand{\bt}{\boldsymbol{t}} %% Statistic, realised, vector form (bold)
24+
\newcommand{\emv}{\hat{\theta}}
25+
\DeclarePairedDelimiter\ceil{\lceil}{\rceil}
26+
\DeclarePairedDelimiter\floor{\lfloor}{\rfloor}
27+
\DeclareMathOperator*{\argmax}{arg\,max}
28+
\DeclareMathOperator*{\argmin}{arg\,min}
29+
%%%%
30+
\newif\ifanswers
31+
\answerstrue % comment out to hide answers
32+
33+
% Title Page
34+
\title{Segunda avaliação (A2)}
35+
\author{Disciplina: Inferência Estatística \\ Instrutor: Luiz Max Carvalho \\ Monitores: Jairon Nóia \& Tiago Silva}
36+
\date{26 de Novembro de 2022}
37+
38+
\begin{document}
39+
\maketitle
40+
41+
\begin{center}
42+
\fbox{\fbox{\parbox{1.0\textwidth}{\textsf{
43+
\begin{itemize}
44+
\item O tempo para realização da prova é de 3 horas;
45+
\item Leia a prova toda com calma antes de começar a responder;
46+
\item Responda todas as questões sucintamente;
47+
\item Marque a resposta final claramente com um quadrado, círculo ou figura geométrica de sua preferência;
48+
\item A prova vale 80 pontos. A pontuação restante é contada como bônus;
49+
\item Apenas tente resolver a questão bônus quando tiver resolvido todo o resto;
50+
\item Você tem direito a trazer \textbf{\underline{uma} folha de ``cola''} tamanho A4 frente e verso, que deverá ser entregue junto com as respostas da prova.
51+
\end{itemize}}
52+
}}}
53+
\end{center}
54+
55+
\newpage
56+
57+
\section*{1. O estatístico e o poeta.}
58+
59+
\begin{center}\textit{
60+
Eu te vejo sumir por aí\\
61+
Te avisei que a cidade era um vão\\
62+
Dá tua mão, olha pra mim\\
63+
Não faz assim, não vai lá, não\\
64+
Os letreiros a te colorir\\
65+
Embaraçam a minha visão\\
66+
Eu te vi suspirar de aflição\\
67+
E sair da sessão frouxa de rir\\
68+
Já te vejo brincando gostando de ser\\
69+
Tua sombra a se multiplicar\\
70+
Nos teus olhos também posso ver\\
71+
As vitrines te vendo passar\\
72+
Na galeria, cada clarão\\
73+
É como um dia depois de outro dia\\
74+
Abrindo um salão\\
75+
Passas em exposição\\
76+
Passas sem ver teu vigia\\
77+
Catando a poesia\\
78+
Que entornas no chão\\
79+
}
80+
\end{center}
81+
\textit{As Vitrines (Almanaque, 1981)} de Chico Buarque (1944-).\\
82+
83+
O eu-lírico da canção, que vamos chamar aqui de Ivo, pensa em seu amado, Adão.
84+
Adão é poeta, e tem a estranha mania de deixar cair seus poemas ao passear pelo shopping.
85+
Ivo, muito solícito e perdidamente apaixonado, corre atrás do companheiro catando os papéis que
86+
o desastrado deixa cair.
87+
Sendo estatístico, Ivo sabe que pode modelar o tempo entre a queda dos poemas como uma variável aleatória exponencial com taxa $\theta$.
88+
Ivo quer saber se será capaz de acompanhar Adão na sua jornada sem perder nenhum poema.
89+
Para isso, julga que se $\theta \leq \theta_0$, ele será capaz de catar toda a poesia deixada por Adão antes de ser carregada pelo vento.
90+
91+
Suponha que Ivo observa o processo de queda de $n$ poemas e anota o tempo entre cada queda, formando a amostra $Y_1, Y_2, \ldots, Y_n$.
92+
Ivo considera a estatística de teste $S = \sum_{i=1}^n Y_i$ e constrói o teste $\delta_c$ de modo que, se $S \geq c$, ele rejeita a hipótese $H_0: \theta \leq \theta_0$.
93+
94+
\begin{enumerate}[label=\alph*)]
95+
\item (10 pontos) Encontre a função poder do teste de Ivo.
96+
\item (10 pontos) Mostre que a função poder do item anterior é~\textbf{não-decrescente} em $\theta$;
97+
98+
\textbf{Dica:} Se $X$ tem distribuição Gama com parâmetros $k \in \mathbb{N}$ e $\theta$, então
99+
\begin{equation*}
100+
P_\theta \left(X \leq x \right) = e^{-x/\theta}\sum_{j = k}^\infty \frac{1}{j!}\left(\frac{x}{\theta}\right)^j.
101+
\end{equation*}
102+
\item (10 pontos) Encontre uma expressão para o tamanho $\alpha_0$ do teste $\delta_c$;
103+
\item (10 pontos) O teste em questão é não-viesado? Justifique;
104+
\end{enumerate}
105+
\ifanswers
106+
\include*{A2_2022_sol1}
107+
\fi
108+
109+
\section*{2. PO-KÉ-MON!}
110+
111+
Suponha que a Liga Internacional de Pokemon (LIP) tenha um sistema de \textit{pokescores} que podem assumir qualquer valor real.
112+
Quanto maior o \textit{pokescore} de uma jogadora, mais alto no ranking mundial ela está.
113+
A liga se organiza em times de $n$ jogadores.
114+
115+
Para entrar na liga, um time precisa ter um \textit{pokescore} médio superior a $\theta_0$, isto é, a média dos pokescores de seus jogadores precisa ser maior que $\theta_0$.
116+
Suponha que os \textit{pokescores} dentro de um time são distribuídos de acordo com uma distribuição Normal com média $\theta$ e variância $\sigma^2$, conhecida.
117+
Queremos desenvolver um método para incluir times num torneio automaticamente, baseado nos \textit{pokescores} dos seus integrantes.
118+
119+
\begin{enumerate}[label=\alph*)]
120+
\item (5 pontos) Encontre uma quantidade pivotal para $\theta$;
121+
\item (5 pontos) Utilizando a quantidade do item anterior, construa um intervalo de confiança de $95\%$ para $\theta$;
122+
\item (10 pontos) A partir do intervalo encontrado, é possível testar $H_0: \theta \leq \theta_0$? Como?
123+
\item (10 pontos) Se $\sigma^2$ fosse desconhecida, como você modificaria o teste do item anterior?
124+
\item (5 pontos) Se aplicarmos os testes em (c) e (d) para selecionar times automaticamente, seremos injustos com alguns times, isto é, vamos deixar de incluir times que de fato se encaixam na condição de seleção.
125+
Com que probabilidade isso acontece?
126+
\item (5 pontos) Se quisermos diminuir a probabilidade do item anterior, o que podemos fazer? Que consequências isso tem?
127+
\end{enumerate}
128+
\ifanswers
129+
\include*{A2_2022_sol2}
130+
\fi
131+
132+
\section*{3. Run, Joey, run!\footnote{Linear regression is a war horse of Statistics. The horse in `War Horse' (2011) is named Joey.}}
133+
134+
O modelo linear (de regressão) é um dos cavalos de batalha da Estatística, sendo aplicado em problemas de Finanças, Medicina e Engenharia.
135+
Vamos agora estudar como utilizar as propriedades deste modelo para desenhar experimentos com garantias matemáticas de desempenho e obter estimadores de quantidades de interesse.
136+
137+
\begin{enumerate}[label=\alph*)]
138+
\item (10 pontos) Uma prática comum em regressão é a de \textbf{centrar} a variável independente (covariável), isto é subtrair a média; isto facilita a interpretação do intercepto e também simplifica alguns cálculos importantes.
139+
Mostre que no caso com a covariável centrada, $\hat{\beta_0}$ e $\hat{\beta_1}$ são independentes;
140+
\item (10 pontos) Mais uma vez considerando o caso centrado, mostre
141+
como obter o número de observações $n$ que faz com que a variância do estimador de máxima verossimilhança do intercepto seja menor que $v > 0$;
142+
\item (10 pontos) Mostre como obter um estimador não-viesado da quantidade $\theta = a\beta_0 + b\beta_1 + c$, com $a, b, c \neq 0$, e encontre o seu erro quadrático médio.
143+
\item (10 pontos) Quando $x_{\text{pred}} = \bar{x}$, mostre como obter o número de observações $n$ necessário para que o intervalo de predição de $100(1-\alpha_0)\%$ para a variável-resposta ($Y$) tenha largura menor ou igual a $l>0$ com probabilidade pelo menos $\gamma$.
144+
145+
\textit{Dicas}:(i) A expressão dependerá~\textit{também} da variância dos resíduos, $\sigma^2$ e (ii) Você não precisa calcular $n$, apenas mostrar o procedimento para obtê-lo.
146+
\end{enumerate}
147+
148+
149+
\ifanswers
150+
\include*{A2_2022_sol3}
151+
\fi
152+
153+
% \bibliographystyle{apalike}
154+
% \bibliography{refs}
155+
156+
\end{document}

0 commit comments

Comments
 (0)