Advertisement
Guest User

Untitled

a guest
May 20th, 2018
143
0
Never
Not a member of Pastebin yet? Sign Up, it unlocks many cool features!
Latex 12.03 KB | None | 0 0
  1. \documentclass{article}
  2. \usepackage[utf8]{inputenc}
  3. \usepackage[utf8]{inputenc}
  4. \usepackage[scale=0.75]{geometry}
  5. \usepackage[T1,T2A]{fontenc}
  6. \usepackage[utf8]{inputenc}
  7. \usepackage[english,russian]{babel}
  8.  
  9. \usepackage[pdftex]{graphicx}
  10. \usepackage[colorinlistoftodos]{todonotes}
  11. \usepackage{cancel}
  12. \usepackage{amsmath}
  13. \usepackage{natbib}
  14. \usepackage{graphicx}
  15.  
  16. \begin{document}
  17.  
  18.  
  19. \begin{titlepage}
  20. \begin{center}
  21.  
  22. \textbf{Правительство Российской Федерации}
  23. \vspace{0.5cm}
  24.  
  25. Федеральное государственное автономное\\образовательное учреждение\\высшего профессионального образования
  26. \vspace{2mm}
  27. \\"Национальный исследовательский университет -\\Высшая школа экономики"
  28. \vspace{0.25cm}
  29.  
  30. Факультет математики
  31.  
  32. \vfill
  33.  
  34. \Huge Двухвыборочная задача о рассеивании (масштабе). Ранговый критерий (Ансари-Брэдли).
  35.  
  36. \bigskip
  37.  
  38. \end{center}
  39.  
  40. \vfill
  41.  
  42. \begin{flushright}
  43.  
  44. \textbf{Студент группы №3.11.2:}\\
  45. Нестеров Роман Эдуардович
  46.  
  47. \hfill
  48.  
  49. \textbf{Научный руководитель:}\\
  50. Профессор-исследователь факультета социальных наук
  51. \\Шмерлинг Дмитрий Семенович
  52.  
  53.  
  54. \end{flushright}
  55. \vfill
  56.  
  57. \begin{center}
  58. Москва, 2018 г.
  59. \end{center}
  60. \end{titlepage}
  61. \newpage
  62.  
  63.  
  64. \section{Теория. Свободный от распределения ранговый критерий (Ансари-Брэдли)}
  65.  
  66. \textit{Данные:} Мы получаем $N = m + n$ наблюдений $X_1, \ldots , X_n$ и $Y_1, \ldots , Y_n$.
  67.  
  68. В решении задачи нам помогут 3 допущения:
  69. \begin{enumerate}
  70. \item Берем модель $X_1 = \sigma e_i + \mu$ , $i = 1, \ldots , m$ , и $Y_j = \sigma_2 e_{m+j} + \mu$ , $j = 1, \ldots , n$,
  71. где $e_1, \ldots , e_{m+n}$ -- ненаблюдаемые случайные величины; $\mu$ -- неизвестный мешающий параметр (общая медиана совокупностей X и Y), нас интересует параметр $ \gamma = \sigma_2 / \sigma_1 $ .
  72. \item Все N случайных величин $e$ взаимно независимы.
  73. \item Все $e$ извлечены из одной и той же непрерывной совокупности, медиана которой равна нулю.
  74. \end{enumerate}
  75.  
  76. \textit{Метод:} Для проверки $$H_0 : \gamma^2 = 1$$ необходимо проделать следущее.
  77. \begin{enumerate}
  78. \item Упорядочить N наблюдений от меньшего к большему.
  79. \item Наименьшему и наибольшему из наблюдений в объединенной выборке присвоить ранг 1, следующим среди наименьших и наибольших присвоить ранг 1, следующим среди наименьших и наибольших присвоить ранг 2 и продолжить ранжирование тем же способом. Если N - четно, то расположение рангов будет $1,2,3 \ldots, N/2, N/2, \ldots , 3,2,1$ ; если же N - нечетно, то расположение рангов будет $1,2,3 \ldots , (N-1)/2,(N+1)/2,(N-1)/2, \ldots , 3,2,1$ .
  80. \item Обозначим ранг $X_i$ в упомянутой ранжировке через $R_i$ и положим $$\widetilde{W} = \sum_{i=1}^m R_i$$
  81. Статистика $\widetilde{W}$ есть сумма рангов, относящихся к X.
  82. \item Для одностороннего критерия $H_0 (H_0 : \gamma = 1) $ против альтернативы $\gamma^2 > 1$ на уровне значимости $\alpha$ нужно:
  83. \begin{center}
  84. \begin{equation*}
  85.    
  86.  \begin{cases}
  87.    \text{Отклонить} & $H_0$, если $\widetilde{W} \ge \omega_2 (\alpha , m , n)$,  
  88.    \\
  89.    \text{Принять} & $H_0$ , если $\widetilde{W} < \omega_2 (\alpha , m , n)$
  90.  \end{cases}
  91. \end{equation*}
  92. \end{center}
  93. где константа $\omega_2 (\alpha , m , n)$ удовлетворяет уравнению $P_0 [ \widetilde{W} \ge \omega_2 (\alpha , m , n) ] = \alpha$. Значения $\omega_2 (\alpha , m , n)$ приведены в таблице вероятности верхнего хвоста распределения статистики $\widetilde{W}$, когда выполняется нулевая гипотеза.
  94. Для одностороннего критерия $H_0$ против альтернативы $\gamma^2 < 1$ на уровне значимости \alpha следует:
  95. \begin{center}
  96. \begin{equation*}
  97.    
  98.  \begin{cases}
  99.    \text{Отклонить} & $H_0$, если $\widetilde{W} \le \omega_1 (\alpha , m , n)$,  
  100.    \\
  101.    \text{Принять} & $H_0$ , если $\widetilde{W} > \omega_1 (\alpha , m , n)$
  102.  \end{cases}
  103. \end{equation*}
  104. \end{center}
  105. где константа $\omega_2 (\alpha , m , n)$ удовлетворяет уравнению $P_0 [ \widetilde{W} \ge \omega_1 (\alpha , m , n) ] = \alpha$. Значения $\omega_1 (\alpha , m , n)$ приведены в таблице вероятности верхнего хвоста распределения статистики $\widetilde{W}$, когда выполняется нулевая гипотеза.
  106. Для двустороннего критерия $H_0$ против альтернативы $\gamma^2 \ne 1$ на уровне значимости \alpha следует:
  107. \begin{center}
  108. \begin{equation*}
  109.    
  110.  \begin{cases}
  111.    \text{Отклонить} & $H_0$, если $\widetilde{W} \ge \omega_2 (\alpha , m , n)$ или $\widetilde{W} \le \omega_1 (\alpha , m , n)$,  
  112.    \\
  113.    \text{Принять} & $H_0$ , если $\omega_1 (\alpha , m , n) < \widetilde{W} < \omega_2 (\alpha , m , n)$
  114.  \end{cases}
  115. \end{equation*}
  116. \end{center}
  117. где $\alpha = \alpha_1+\alpha_2$.
  118. \end{enumerate}
  119. \textit{Приближение для большой выборки}. Положим $$ \widetilde{W}^{*} = \frac{\widetilde{W} - E_0(\widetilde{W})}{\{var_0(\widetilde{W}^{*})\}^{1/2}} =$$
  120. \begin{center}
  121. \begin{equation*}
  122.    =
  123.    \begin{cases}
  124.    $ & \frac{\widetilde{W} - [m(m+n+2)/4]}{((mn(m+n+2)(m+n-2)/[48(m+n-1)])^{1/2}} $ , если $m+n$ -- четное
  125.    \\
  126.    $ & \frac{\widetilde{W} - (m(m+n+1)^2/[4(m+n)]}{(mn(m+n+1)[3+(m+n)^2]/48(m+n)^2]^{1/2}}$ , если $m+n$ -- нечетное.
  127.    \end{cases}
  128. \end{equation*}
  129. \end{center}
  130. Если $H_0$ верна, то статистика $\widetilde{W}^{*}$ асимптотически ( при min $(m,n) \to \inf ) $ распределена как $N(0,1)$
  131. Нормальное приближение для метода (4) таково:
  132. \begin{center}
  133. \begin{equation*}
  134.    \begin{cases}
  135.    \text{отклонить} & $H_0$ , если $\widetilde{W} \ge z_{(\alpha)}$
  136.    \\
  137.    \text{принять} & $H_0$ , если $\widetilde{W} < z_{(\alpha)}$
  138.    \end{cases}
  139. \end{equation*}
  140. \end{center}
  141. \textit{Связи}. Если среди N наблюдений есть одинаковые, то для вычисления $\widetilde{W}$ следует использовать связанные ранги и действовать так же, как в пункте (4) при применении критерия для малых выборок. Применяя приближение для большой выборки, следует вычислять $\widetilde{W}$ по средним рангам и заменить $var_0 (\widetilde{W})$ в формуле приближения для большой выборки на $$ var_0 ( \widetilde{W}) = \frac{mn[16 \sum_{j=1}^g t_j r_j^2 - (m+n)(m+n+2)^2]}{16(m+n)(m+n+1)}$$
  142. если $m+n$ -- четное. Если же $m+n$ -- нечетное, то $$ var_0 ( \widetilde{W}) = \frac{mn[16(m+n) \sum_{j=1}^g t_j t_j^2 - (m+n+1)^4]}{16(m+n)^2(m+n-1)} $$
  143. где g -- число связанных групп среди N наблюдений, $t_j$ -- объем связанной группы с номером j, $r_j$ -- средний ранг наблюдений в связанной группе j.
  144. \section{Пример}
  145. Пусть у нас есть известный метод исследования (1) и предложенный метод (2). Вначале проделаем 20 пар анализов обоими методами. И пусть реальное значении величины, метод для определения которой мы хотим исследовать, равно 100. Хотим узнать, какой метод имеет большую точность. Проверим альтернативу о том, что рассеивание предложенного метода (2) больше чем у известного метода (1). Следовательно, обозначая через $X$ результаты, полученные по методу (1), а через $Y$ -- по методу (2), надо проверять $H_0$ против альтернативы $\gamma^2 > 1$. На уровне около $\alpha = .05$ получаем $z_{(0.05)} = 1.645$
  146. \begin{figure}[h!]
  147. \centering
  148. \includegraphics[scale=1]{pic2.png}
  149. \caption{Результаты исследований методами (1) и (2)}
  150. \label{fig:universe}
  151. \end{figure}
  152. Далее я, используя excel,  проранжировал все измерения, и получил $\widetilde{W} = \sum^m_{i=1} R_i = 106$. Теперь для получения $\widetilde{W}^{*}$ остается найти $var_0(\widetilde{W})$. Поскольку $m+n=40$ -- пользуемся формулой для четного числа. Также надо посчитать $\sum^g_{j=1} t_j r_j^2$. Выясняем, что оно равно 232. Теперь у нас есть все данные для расчета $\widetilde{W}^{*}$ :
  153. $$\widetilde{W}^{*} =\frac{(106-(20*42/4))}{((400*(41*(3+40^2)/(48*40^2))^{1/2}} = -0.281,$$
  154. что нас приводит к принятию $H_0$ на уровне $\alpha = 0.5$, поскольку $\widetilde{W}^{*} = -0.281 < 1.635 = z_{(.05)}$ Следовательно, нет достаточных оснований считать, что предложенный метод связан с потерей точности по сравнению с методом (1).
  155.  
  156. \section{Вывод}
  157.  
  158. Непараметрические аналоги критериев проверки однородности дисперсий предназначены для проверки гипотез о принадлежности двух выборок
  159. общей генеральной совокупности с одинаковыми характеристиками рассеяния. При этом, как правило, предполагается равенство средних.
  160.  
  161.  
  162. Рассмотренный мной пример помогает исследовать новые методы измерений, узнавать их точность, когда мы можем знать значение медианы распеределения.
  163.  
  164. Также я смог провести исследование на своих данных, используя ранговый критерий Ансари-Брэдли.
  165.  
  166.  
  167. %\bibliographystyle{plain}
  168. \bibliography{references}
  169.  
  170. \begin{thebibliography}{4}
  171. \bibitem{ }
  172. Hollander M., Wolfe D., Chicken E. Nonparametric Statistical Methods. – Hoboken, Ns: Wiley Series in Probability and Statistics. Third Edition John Wiley and Sons., 2013 – XVIII
  173.  
  174. \end{thebibliography}
  175.  
  176. \end{document}
Advertisement
Add Comment
Please, Sign In to add comment
Advertisement