Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Пт мар 29, 2024 4:51 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 13 ] 
Автор Сообщение
 Заголовок сообщения: Метод пересчета на модель линейного дискриминантного анализа
СообщениеДобавлено: Вт мар 18, 2008 12:04 pm 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
В разделе 3.2.5 "Статистические методы классификации" Вашего учебника "Прикладная статистика" приведен метод пересчета на модель линейного дискриминантного анализа. Возникли вопросы:
1. Надо ли проверять обоснованность пересчета на модель линейного дискриминантного анализа в случае в целях расчета статистической оценки прогностической "силы" для модели классического линейного дискриминантного анализа?
2. Если прогностический индекс задан нелинейной функцией вида (логистическая регрессия):
p=1/(1+1/exp(a+b*x1+c*x2)), и используется бинарная классификация, то можно ли применять метод пересчета на модель линейного дискриминантного анализа в целях расчета статистической оценки прогностической "силы"?
3. Относится ли классификация на основе логистической регрессии к подобласти "дискриминантный анализ"?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт мар 18, 2008 4:26 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
1. Модель - теоретический объект. Возможность ее применения надо проверять. В частности, при обработке реальных данных
Цитата:
надо проверять обоснованность пересчета на модель линейного дискриминантного анализа

2. Да. См. тему "Математические теории рейтингов" http://forum.orlovs.pp.ru/viewtopic.php?t=627 .
3. Да.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт мар 18, 2008 6:24 pm 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
При практических расчетах возникли трудности
1. Рассчитал статистическую оценку прогностической "силы", при применяемых согласно модели двух значениях порога. Однако, при проверке обоснованности пересчета на модель линейного дискриминантного анализа при расчете одной из оценок расстояния Махаланобиса значение функции обратной функции стандартного нормального распределения стремится к плюс бесконечности, поскольку сумма долей (k1+k2)=1 (100%). Как тут быть?
2. В Вашем учебнике приведен метод проверки обоснованности пересчета на модель линейного дискриминантного анализа при двух значениях порога (с1 и с2). А как рассчитывать доли объектов (k1,k2 и т.д.), если в модели логистической регрессии используется 1 значение порога отсечения, которое классифицирует на 2 класса?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт мар 20, 2008 9:56 am 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
Уважаемый Александр Иванович, можете ли вы дать какие-то рекомендации по вышеуказанным вопросам?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт мар 20, 2008 1:42 pm 
Не в сети

Зарегистрирован: Чт мар 20, 2008 1:25 pm
Сообщений: 191
Откуда: Солнечная система
1. Вы явно что-то перепутали. Внимательно смотрите, что означает каждый символ.
2. Если у Вас есть только один порог, то рассчитать обоснованность
Цитата:
пересчета на модель линейного дискриминантного анализа
невозможно.
Но кто Вам мешает взять второй порог в модели логистической регрессии?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт мар 20, 2008 5:27 pm 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
1. Прочитал внимательно. "k1 - доля объектов первого класса, для которых y<=c1" (в моем случае эта доля=0,947 при используемом для классификаци в этой модели пороге c1) . "k2 - доля объектов первого класса, для которых c1<y<=c2" (в моем случае эта доля=0,053 при используемом для классификации в этой модели порогах с1 и с2). То есть ни один объект первого класса не имеет значение рейтингового показателя, выше, чем с2. Очевидно, что в моем случае сумма долей k1+k2=1. При расчете d*(c2) по указанной Вами формуле используется функция обратная функции стандартного нормального распределения от (k1+k2). В программе "Excel", используя для ее нахождения функцию НОРМСТОБР(1), так как k1+k2=1, мы получим некорректное значение. По этой причине у меня не получается проверить обоснованность пересчета на модель линейного дискриминантного анализа (не могу рассчитать значение T(k1;k2) и d*(c2). как быть?
2. То есть для проверки обоснованности пересчета на модель линейного дискриминантного анализа я могу вообще взять произвольные пороговые значения (с1 и с2)? Но для расчета статистической оценки прогностической "силы" модели логистической регрессии мне надо использовать тот единственный порог, который я использую для классификации? И еще вопрос: как рассчитать статистическую оценку прогностической "силы", если один из двух классов в модели логистической регрессии при используемом пороге полностью классифицируется верно, то есть доля k=1? В этом случае опять возникает проблема, описанная в моем вопросе №1 - НОРМСТОБР(1) и я не могу рассчитать d*


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт мар 20, 2008 7:38 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
1. Надо брать пороги так, чтобы все три частоты были положительны.
2. Хотите проверить возможность пересчета - берите два порога.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт мар 21, 2008 6:11 am 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
Уважаемый Александр Иванович! Значит я буду брать для проверки обоснованности метода пересчета любые 2 порога так, чтобы у меня не возникало такой ситуации, как в описанном мною случае.
Возможность пересчета проверяется для того, чтобы в дальнейшем рассчитать статистическую оценку прогностической "силы" - я правильно понял?

Но ведь для расчета статистической оценки прогностической "силы" в модели логистической регрессии необходимо использовать именно тот порог, который применяется для классификации в этой модели - я так понимаю? А в моем случае при использовании этого порога доля верной классификации в одном из классов равна 1 (то есть полностью верно классифицируется). По этой причине не могу рассчитать функцию обратную функции стандартного нормального распределения от к=1, а следовательно и d*. Как тут быть?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт мар 21, 2008 4:41 pm 
Не в сети

Зарегистрирован: Чт мар 20, 2008 1:25 pm
Сообщений: 191
Откуда: Солнечная система
Если принимается гипотеза о том, что прогностическая сила не зависит от порога, то именно это общее значение и есть прогностическая сила метода класификации для любого порога.
С другой стороны, надо присмотреться к ситуации с безошибочной классификацией. Возможно, дело в слишком малом числе наблюдений. Дело в том. что нормальное распрежделение имеет плотность, которая положительна всюду, а потому безошибочная классификация невозможна - при безграничном росте числа наблюдений.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт мар 21, 2008 5:51 pm 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
1. Гипотеза о том, что прогностическая сила не зависит от порога, я так понимаю, - это гипотеза о совпадении прогностических сил для обоих правил, проверяемая методом, который вытекает из теоремы 3?
2. "Если принимается гипотеза о том, что прогностическая сила не зависит от порога, то именно это общее значение и есть прогностическая сила метода класификации для любого порога."
Не понял: общее значение ЧЕГО есть прогностическая сила классификации? Значение статистической оценки прогностической "силы", рассчитанное при любом значении порога?
3. "С другой стороны, надо присмотреться к ситуации с безошибочной классификацией. Возможно, дело в слишком малом числе наблюдений." Возможно, но такой порог был выбран специально, чтобы минимизировать число неверных классификаций для одного из классов при неизменной доле неверных классификаций в другом классе.
4. Если гипотеза о совпадении прогностических сил на двух порогах принимается на уровне значимости = 0,0001, а на уровне 0,001 - не принимается, то можно ли использовать метод пересчета на модель линейного дискриминантного анализа?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб мар 22, 2008 4:14 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
1. Об этом сказано в исходных публикациях.
2. См. п.1.
3. Выберите другой порог.
4. См. о понятии "уровень значимости" в любом курсе математической статистики.
Реальный уровень значимости между 0,0001 и 0,001 - обычно гипотезу отклоняют.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб мар 22, 2008 6:27 pm 
Не в сети

Зарегистрирован: Пн фев 11, 2008 6:08 pm
Сообщений: 65
Уважаемый Александр Иванович, а можно ли сделать таким образом: проверить гипотезу о совпадении прогностических сил, и если она верна, то применить метод пересчета на модель линейного дискриминантного анализа, но для расчета статистической оценки прогностической "силы" использовать не то значение порога, которое применяется для классификации в модели (при котором у меня доля верных классификаций в одном классе 100%), а другое значение порога?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб мар 22, 2008 6:34 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11265
Можно.


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 13 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 94


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB