Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Вс ноя 18, 2018 9:47 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 12 ] 
Автор Сообщение
 Заголовок сообщения: Выбор непараметрического метода проверки однородности
СообщениеДобавлено: Ср авг 06, 2008 1:39 pm 
Не в сети

Зарегистрирован: Чт сен 06, 2007 2:28 pm
Сообщений: 12
Здравствуйте, уважаемый Александр Иванович!

Не могли бы Вы мне помочь с выбором метода проверки однородности непараметрической двух выборок? Имеется набор значений фактический и имеется теоритические значения, построенные по методу МНК на основе фактических значений. Стоит задача проверки на достоверность теоритеческой функции распределения с фактическими значениями. Функция распределения фактических значений неизвестна и предположение о нормальности сделать нельзя. В связи с этим я обратился к книге "Таблицы математической статистике" Большева Л.Н. в частности к главе "Напараметрические таблицы". Возникли сл. вопросы:

1. Состоятельно применение критерия Колмогорова в моем случае? Меня смущает фраза про теоритеческое распределение "заданная функция распределения F(x), не содержащая неизвестных параметров". Значения теоритеческого закона распределения у меня есть, а самой функции и ее параметров нет.

2. Возможно ли использовать критерий проверки однородности двух выборок, а не как в 1ом вопросе проверки гипотезы равенства закона распределения теоритического и эмпирического?

3. Возможно ли использование критерия омега квадрат?

4. В условиях малого объема данных, какой из методов наиболее состоятелен?

С уважением, Олег

Благодарю


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Ср авг 06, 2008 5:12 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7915
Начинать обсуждение надо с описания вероятностно-статистической модели. Сейчас модель не описана, и потому совершенно непонятно, что понимается под МНК. Однако можно кое-что сказать и сейчас.
1. Классические критерии согласия Колмогорова и омега-квадрат применять нельзя, поскольку теоретическое распределение не задано однозначно. Обсуждение неправильного применения указанных критериев и ссылки на литературу см. в теме "Профессора-невежды готовят себе на смену новых невежд "Профессора-невежды готовят себе на смену новых невежд" http://forum.orlovs.pp.ru/viewtopic.php?t=548 См. также:
Орлов А.И. О критериях согласия с параметрическим семейством. - Журнал "Заводская лаборатория". 1997. Т.63. No.5. С. 49-50. http://orlovs.pp.ru/stat.php#s1p5

2. Критерии проверки однородности двух выборок использовать нельзя, поскольку нет второй выборки.

Цитата:
3. Возможно ли использование критерия омега квадрат?
Классический критерий омега-квадрат применять нельзя. Возможно, кто-нибудь напишет кандидатскую диссертацию по специальности "теория вероятностей и математическая статистика", в которой предложит для Вашей задачи критерий типа омега-квадрат и найдет его распределение, подобно тому, как Кац, Кифер и Вольфовиц предложили такой критерий для проверки согласия с нормальным семейством распределения, когда параметры нормального распределения оцениваются с помощью выборочного сренднего арифметического и выборочной дисперсии.


Цитата:
4. В условиях малого объема данных, какой из методов наиболее состоятелен?

Ответ нельзя дать, поскольку нет вероятностно-статистической модели.
Непонятно даже, зачем и кому понадобился описанный Вами столь странный способ обработки данных.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт авг 07, 2008 9:13 am 
Не в сети

Зарегистрирован: Чт сен 06, 2007 2:28 pm
Сообщений: 12
Попробую задать вероятностную модель. Имеются значения накопленные за определенный интервал по определенному параметру. Была поставлена задача прогнозирования на основе данных за накопленный период по данному параметру. Было построено несколько моделей на основе метода МНК (линейная зависимость, полиномиальная). Сейчас стоит задача определения какая из моделей прогноза наиболее приближена к эмпирической модели.

Какие методы для в данном контектсте можно применить для оценки эмпиричекой модели и прогнозной в терминах статистики?

Спасибо


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт авг 07, 2008 10:24 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7915
Вероятностно-статистическая модель не описана. Даже нет ни ни слова о случайных величинах.
Вопрос о том, какая зависимость лучше подходит для описания данных, относится к регрессионному анализу. См. на сайте учебник "Эконометрика", пп.5.1, 5.2. Показатель - остаточная сумма квадратов, деленная на (объем выборки минус число оцененных параметров). Чем меньше, тем лучше.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Ср авг 27, 2008 2:41 pm 
Не в сети

Зарегистрирован: Чт сен 06, 2007 2:28 pm
Сообщений: 12
Спасибо, Александр Иванович!

Изучаю книгу "Эконометрика", которую Вы рекомендовали выше.

Возник вопрос: для чего в самом начале пп. 5.1. вводиться Хк, а время используется (Tк-Tср)? Почему не просто Tк момент времени?

Благодарю


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт авг 28, 2008 10:37 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7915
Цитата:
для чего в самом начале пп. 5.1. вводиться Хк, а время используется (Tк-Tср)? Почему не просто Tк момент времени?

1) При использовании (Tк-Tср) оценка свободного члена проще - среднее арифметическое Хк.
2) При использовании (Tк-Tср) оценки параметров некоррелированы и асимптотически независимы, что облегчает вычисление дисперсии точечного прогноза и получение формул для интервального прогноза.

Если излагать МНК упрощенно, а формулы для интервального прогноза давать без обоснования, то можно не вводить Tк-Tср, использовать Tк. Тогда оценка МНК для коэффициента в линейном члене - та же, а для свободного члена - иная. Получаем их, минимизируя сумму квадратов.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт сен 19, 2008 10:06 am 
Не в сети

Зарегистрирован: Чт сен 06, 2007 2:28 pm
Сообщений: 12
Спасибо, Александр Иванович! Я разобрался.

Изучая Вашу книгу "Эконометрика", в частности гл. 5 "Многомерный статистический анализ", хотел бы проконсультироваться по нескольким вопросам:

1. Как получить погрешность для полинома n-ой степени (построение верхней и нижней границ прогностической функции), полученного с помощью МНК? Величина сигма(t) такая же, что и для линейной зависимости или все-таки нет?

2. Очень заинтересовали методы оценивания степени многочлена полинома. Не могли бы, Вы порекомендовать, метод или литературу? Хотелось бы прочитать Вашу статью по этому поводу "Оценка размерности модели в регрессии", к сожалению пока не могу найти.

Благодарю


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт сен 19, 2008 5:28 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7915
1. В моем учебнике рассмотрена непараметрическая модель - распределение отклонений от теоретической зависимости произвольно. Такой подход противопоставлен (не в учебнике, а по существу) устаревшему подходу, в котором распределение отклонений от теоретической зависимости предполагается нормальным. Почти все реальные распределения не нормальны. Платой за отказ от нормальности является необходимость использования предельных теорем (т.е. рассмотрения ситуации при большом объеме данных).

Ясно, что можно получить погрешность для полинома n-ой степени (построение верхней и нижней границ прогностической функции), полученного с помощью МНК, в рамках непараметрической модели. Но я это не делал. Хорошая тема для исследования.

2. Если возможные подмножества признаков образуют расширяющееся семейство, например, оценивается степень полинома, то естественно ввести термин «размерность модели» (используется также в многомерном шкалировании). Нам принадлежит ряд работ по оцениванию размерности модели.
Первая такая работа была выполнена во время командировки во Францию в 1976 г. В ней была изучена одна оценка размерности модели в регрессии, например, степени полинома в предположении, что зависимость описывается полиномом. Эта оценка была известна в литературе, но позже ее стали ошибочно приписывать мне, в то время как я лишь изучил ее свойства, в частности, установил, что она не является состоятельной, и нашел ее предельное геометрическое распределение:

122. Орлов А.И. Предельное распределение одной оценки числа базисных функций в регрессии. – В сб.: Прикладной многомерный статистический анализ. Ученые записки по статистике, т.33. - М.: Наука, 1978. С.380-381.

Другие, уже состоятельные оценки размерности регрессионной модели были предложены и изучены в статье:

144. Орлов А.И. Оценка размерности модели в регрессии. – В сб.: Алгоритмическое и программное обеспечение прикладного статистического анализа. Ученые записки по статистике, т.36. - М.: Наука, 1980. С.92-99.

Этот цикл завершила содержащая ряд уточнений работа:

173. Орлов А.И. Асимптотика некоторых оценок размерности модели в регрессии. – В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. С.260-265.

Последняя публикация на эту тему включает в себя обсуждение результатов изучения скорости сходимости в полученных мною предельных теоремах методом Монте-Карло:

326. Орлов А.И. Об оценивании регрессионного полинома. – Журнал «Заводская лаборатория», 1994. Т.60. No.5. С.43-47.

Аналогичные по методологии оценки размерности модели в задаче расщепления смесей (часть теории классификации) рассмотрены в статье:

172. Орлов А.И. Некоторые вероятностные вопросы теории классификации. – В сб.: Прикладная статистика. Ученые записки по статистике, т.45. - М.: Наука, 1983. С.166-179.

Оценки размерности модели в многомерном шкалировании изучаются в работах:

187. Орлов А.И. Общий взгляд на статистику объектов нечисловой природы. - В сб.: Анализ нечисловой информации в социологических исследованиях. - М.: Наука, 1985. С.58-92.
316. Orlov A.I. On the Development of the Statistics of Nonnumerical Objects. – В сб.: Design of Experiments and Data Analysis: New Trends and Results. - M.: ANTAL, 1993. Р.52-90.
614. Орлов А.И. Методы снижения размерности. – Приложение 1 к книге: Толстова Ю.Н. Основы многомерного шкалирования: Учебное пособие для вузов. – М.: Издательство КДУ, 2006. - 160 с.

В этих же работах установлено предельное поведение характеристик метода главных компонент (с помощью асимптотической теории поведения решений экстремальных статистических задач).

К сожалению, все эти работы доступны лишь в бумажном варианте (за исключением последней, не содержащей доказательств).


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Ср сен 24, 2008 3:36 pm 
Не в сети

Зарегистрирован: Чт сен 06, 2007 2:28 pm
Сообщений: 12
В продолжение обсуждения вопросов оценки погрешности полинома произвольной степени и оценки степени многочлена полинома:

1. Александр Иванович, по поводу оценки непараметрической полинома, возникла идея. Не могли бы Вы, оценить возможность использования такого подхода: разбить полином на несколько частей(элементраных для которых разработать методику оценки погрешности или использовать вашу методику) и в конечном итоге получить комбинацию элементарных частей с возможностью расчета погрешности для каждой части и в конечном счете оценить их суммарную составляющую. На счет вида элементарной части пока идеи конкретной нет, но есть пример в книге Андерсона Т. "Статистический анализ временных рядов", правда степень там уменьшается постепенно.

Или для построения оценки асимптототической для произвольной степени полинома придеться оценивать по отдельности каждый член полинома и лучше исследовать матричные способы решения полиномов произвольной степени?

2. Для оценки степени полинома можно ли использовать метод предложенный в http://masters.donntu.edu.ua/2006/kita/ ... /art02.htm , а именно метод Тинтнера?

Спасибо большое, Александр Иванович


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс сен 28, 2008 11:59 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7915
1. Не понимаю, о чем речь.
2. Описание в указанном источнике - поверхностное. Автор не понимает важности соблюдения исходных предпосылок тех или иных методов. Если исходные случайные отклонения от тренда - независимые одинаково распределенные случайные величины, то разности уже не будут независимыми.
Возможно, разработчики методов всё это учитывали. Тогда надо приводить результаты строго, в виде теорем со ссылками на исходные публикации.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пн сен 29, 2008 10:03 pm 
Не в сети

Зарегистрирован: Чт сен 06, 2007 2:28 pm
Сообщений: 12
Цитата:
1. Не понимаю, о чем речь.


Попытаюсь объяснить, Александр Иванович. Можно ли попытаться получить универсальную формулу для определения погрешности полинома n-ой степени (непараметрическую, асимптотическую)? Я хотел бы посоветоваться по поводу методики для выводы универсальной формулы. Можно ли получить оценки при помощи матричных преобразований или можно попробовать преобразовать формулу полинома в более простой вид? Как Вы считаете, возможно ли это и по возможности укажите направление, которое будет наиболее оптимальным, с Вашей точки зрения.

Прошу прощение, если нечетко излагаю мысль

Благодарю за Вашу помощь и советы, Александр Иванович


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт сен 30, 2008 9:06 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7915
Цитата:
Можно ли попытаться получить универсальную формулу для определения погрешности полинома n-ой степени (непараметрическую, асимптотическую)?

Не только можно, но и нужно. Речь идет о распределении значения полинома, как следствие, о построении прогноза в виде интервала, т.е. нижней и верхней доверительной границ.
Цитата:
Я хотел бы посоветоваться по поводу методики для выводы универсальной формулы. Можно ли получить оценки при помощи матричных преобразований

Оценка МНК вектора неизвестных параметров (коэффициентов многочлена) в матричной форме хорошо известна (приведена, например, в моей "Прикладной статистике" в главе про статистику интервальных данных в параграфе про регрессию). Из общих соображений ясна (многомерная) асимптотическая нормальность этой оценки. Надо взять ковариционную матрицу этой оценки и от нее перейти к дисперсии линейной функции от неизвестных параметров - дисперсии точечной оценки.
Возможно, всё это есть в литературе по регрессионному анализу. Новизна состоит в отказе от предположения нормальности, вместо которого применяется центральная предельная теорема.
У меня руки не дошли до осуществления этого плана.
Хорошо бы, чтобы кто-либо сделал такую работу. Получилась бы хорошщая статья (для ЗЛ), диссертация и т.п.
Цитата:
или можно попробовать преобразовать формулу полинома в более простой вид?

Какой может быть более простой вид?


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 12 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB