Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Пн авг 03, 2020 6:37 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 44 ]  На страницу Пред.  1, 2
Автор Сообщение
 Заголовок сообщения:
СообщениеДобавлено: Пн фев 11, 2008 6:34 pm 
Не в сети

Зарегистрирован: Вс фев 03, 2008 7:29 pm
Сообщений: 4
Откуда: Ханты-Мансийск
vfomenko писал(а):
В последнее время обратил внимание на т.н. бутстреп-метод.
Но, несмотря на многие публикации (в основном на Западе), его оценки разные - и превосходные, и "жульничество"....

В поисках решения задачи построения доверительных интервалов для результирующей переменной нелинейной регрессионной модели ознакомился с трудом В.М. Куприянова, С.М. Образцова и А.Л. Шимкевича "ОЦЕНИВАНИЕ НЕЛИНЕЙНЫХ МОДЕЛЕЙ (Современное состояние проблемы)" (М.: ЦНИИатоминформ, 1999). В данной работе особое внимание уделяется Бутстреп-анализу и применение его для решения регрессионных задач. Показано, что бутстреп метод дает тот же асимптотический результат, что и классические методы. Следовательно, допускается применение его для анализа статистических свойств оценок параметров.
В главе посвященной Бутстреп-анализу заключается что "Бутстреп-моделирование актуально при изучении технологических процессов, для которых характерны экспериментальные данные ограниченной выборки с большой неоднородностью и плохой воспроизводимостью. Вместе с тем, технологические параметры таких процессов изменчивы, а проведение подобных экспериментов в идентичных условиях не реально. В этой связи исследователь, идентифицируя модель по единственной выборке ограниченного объема, не имеет возможности оценить ее надежность...".
Такая характеристика бутстреп метода вызвала интерес, поскольку в своей работе имею построение и оценивание моделей регрессионного (и/или ковариационного) анализа по выборкам малого объема, которые получены экспериментальным образом и повторение эксперимента затруднено.

Однако С.А. Айвазян и В.С. Мхитарян в работе "ПРИКЛАДНАЯ СТАТИСТИКА И ОСНОВЫ ЭКОНОМЕТРИКИ. Учбеник для вузов" (М.: ЮНИТИ, 1998) пишут что "заложенная в его (бутстреп методе) основание идея внешне выглядит несколько странной: метод предлагает тиражировать уже имеющиеся в нашем распоряжении наблюдения, генерирую их, как и в методе Монте-Карло, с помощью специальных компьютерных датчиков случайных чисел. Однако в методе Монте-Карло эти датчики "настраиваются" на экзогенно заданные параметры модели (там мы "на старте" не имели никаких наблюдений), в то время как в бутстреп-процедурах "настройка" датчиком определяется структурой и спецификой уже имеющейся в нашем распоряжении выборки".

В Вашей широко известной работе "Точки роста" вы выделяете Бутстреп как отдельное направление прикладной статистики, вкладывая в него понятие "Размножения выборки". Сам же метод Эфрона вы так же не считаете самым удачным, но, тем не менее, формулируете практическую рекомендацию на его основе.

Различные мнения о Бутстреп методе (Эфрона) и пробуждают интерес к его освоению и отталкивают, советуя применять другие методы размножения выборки...

Уважаемый профессор Орлов Александр Иванович, можно ли с Вашей профессиональной точки зрения получить ответы на следующие вопросы:
1. Какой метод размножения выборок Вы можете посоветовать для оценивания регрессионных/ковариационных (в частности многофакторных
(множественных) линейных) моделей по выборкам малого объема?
2. В каких работах можно найти подробное описание сущности этого метода (рекомендованного Вами) и применения его к построению и оцениванию
регрессионных/ковариационных моделей?

в продолжение обсуждения Бутстреп метода
аспирант Кударов Руслан


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пн фев 11, 2008 10:37 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8983
См. "Эконометрика" http://orlovs.pp.ru/econ.php#ek1
Глава 11.4.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт мар 19, 2009 11:17 am 
Не в сети

Зарегистрирован: Ср мар 18, 2009 6:14 pm
Сообщений: 1
Александр Иванович, прошу вашего совета по применению бутстреп-метода в прикладной задаче (сам я далек от статистики).

Есть набор случайных величин S(i,j), при этом замечено, что, как правило, оценка var[S(i,j)] при фиксированном j растет пропорционально оценке E[С(i,j)]^a , где обычно 0>=а>=2, С(i,j) = S(0,j)+...+S(i,j), а при фиксированном i экспоненциально убывает по b*j, где обычно 0>=b>=2.

Требуется найти 99.9% персентиль величины R=f[S(0,0),...,S(I,J)]. Корректно ли будет размножить выборку бутстреп-методом: добавляя к E[S(i,j)] случайным образом выбранные остатки e(n,m)*k(a,b,i,j,n,m) с возвращением, где e(n,m)=S(n,m) - оц.E[S(n,m)], k - коэффициент нормирования:

k=(E[C(i,j)]/E[C(n,m)])^(a/2) * exp[(b*m-b*j)/2],

если a и b найти МНК из уравнения:

e(i,j)^2 = V * E[C(i,j)]^a / exp (b*j) * exp[u(i,j)]

или, приведя к линейному виду:

ln[e(i,j)^2] = ln(V) + a*ln(E[С(i,j)]) - b*j + u(i,j).

Вот результаты для конкретного набора случайных величин (a - получился незначимым):

ln[e(i,j)^2] = 24.8 - 1.0*j, R^2=63.9%,
P-value (t-статистика) для ln(v) = 5.6E-59
P-value (t-статистика) для b = 4.8E-18


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт мар 20, 2009 2:17 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8983
Нет адекватного описания модели порождения данных. Плюс явные нелепости. Например:
Цитата:
0>=а>=2

Ведь 0 < 2, не так ли?
Термин "размножение выборки", предполагает, что имеется выборка (реальные данные) и строятся псевдовыборки, на нее похожие.
У Вас же, судя по
Цитата:
добавляя к E[S(i,j)] случайным образом выбранные остатки e(n,m)*k(a,b,i,j,n,m) с возвращением, где e(n,m)=S(n,m) - оц.E[S(n,m)], k - коэффициент нормирования:

k=(E[C(i,j)]/E[C(n,m)])^(a/2) * exp[(b*m-b*j)/2],

проводится обычное статистическое моделирование.

Непонятно, как можно найти два параметра из одного уравнения:
Цитата:
если a и b найти МНК из уравнения:

e(i,j)^2 = V * E[C(i,j)]^a / exp (b*j) * exp[u(i,j)]

Термин
Цитата:
персентиль
в моих книгах не встречается.
Судя по упоминанию статистики Стьюдента:
Цитата:
P-value (t-статистика) для ln(v) = 5.6E-59
P-value (t-статистика) для b = 4.8E-18

без каких-либо оснований принята гипотеза нормальности.

При столь впечатляющем наборе ляпов обсуждение невозможно.
Советую познакомиться с учебником "Прикладная статистика" http://orlovs.pp.ru/stat.php http://www.ibm.bmstu.ru/nil/biblio.html ... 9-prikstat


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 44 ]  На страницу Пред.  1, 2

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 2


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB