Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Пт апр 26, 2019 3:53 am

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 6 ] 
Автор Сообщение
 Заголовок сообщения: Критерий Стьюдента при нескольких выборках
СообщениеДобавлено: Пн авг 20, 2007 12:44 pm 
Не в сети

Зарегистрирован: Пн авг 20, 2007 12:38 pm
Сообщений: 2
Откуда: Нижний Новгород
Глубокоуважаемый Александр Иванович!
Никак не найду в Ваших публикациях описание или анализ методик использования критериев проверки однородности средних при наличии повторности выборок (хотя какой-то дежа-вью у меня есть). Например, если есть две опытные и две контрольные группы. Как оценить гипотезу об отсутствии различий между опытными и контрольными группами?
Можно посчитать 6 парных комбинаций критериев Стьюдента или Вилкоксона и подключить какую-либо хитроумную эвристику, но это не будет как-то теоретически обоснованной альфа-вероятностью.
Можно проверить однородность групп по критерию Фишера, но это будет проверкой не той гипотезы, т.к. неоднородность может определяться различиями между двумя опытными или двумя контрольными группами
Можно почитать про линейные контрасты Шеффе или LSD, но про то ли это (как здесь быть с непараметрикой)?
И, наконец, как все это будет влиять на альфа-вероятность нулевой гипотезы. Прошу помочь.
Заранее спасибо Полина
P.S. Тут есть и другие проблемы. Чтобы они были понятно, приведу пример.
Проверяется научная гипотеза о том, что наличие хорка вызывает увеличение ритма сердцебиения у мышей-полевок, живущих в радиусе 50 м от норы его обитания. Проведено случайным образом шесть 50-метровых окружностей в пределах территории некоторого лесостепного массива. В трех из них было зафиксировано наличие норки хорька, а в трех - нет. В пределах упомянутых 6 участков биологи измерили частоту сокращения сердечной мышцы у отлавливаемых мышей-полевок, нашли среднее и дисперсию.
Определяющим фактором в оценке эффекта воздействия является участок, т.к. в одном из участков может жить престарелый хорек, потерявший хищнические инстинкты, там у мышей-полекок наблюдается адаптация и нормальное сердцебиение, а на другом обследованном участке хорьков нет, но там - дупло совы и у тамошних мышей-полевок повышенное сердцебиение составляет повседневный образ жизни. И в наименьшей мере результаты эксперимента зависят от количества мышей, обследованных в каждом участке.
Таким образом, экспериментальная единица - это участок и число степеней свободы только 6. Если исследователь затеет дисперсионный анализ и станет манипулировать количеством мышей, у которых измерялось частота сокращения сердечной мышцы, в группах как числом степеней свободы то не будет ли он завышать число степеней свободы (многократный замер в одних и тех же условиях). Если же экспериментатор нарисует только две окружности: с хорьком и без, то он выполнит эксперимент без повторностей и рискует получить эффект с точностью до наоборот (на опытном участке может оказаться престарелый хорек, а на контрольном участке - дупло с совой и трясущимися мышами).


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пн авг 27, 2007 5:56 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8218
Глубокоуважаемая Полина!

1. Про классический дисперсионный анализ Вы знаете. Он опирается на предположение нормальности распределений рассматриваемых случайных величин, а на практике нормальности нет. Непараметрические аналоги обсуждаются в соседней теме "Многомерная непараметрика" http://forum.orlovs.pp.ru/viewtopic.php?t=583

2. Чтобы применить статистические методы, необходимо от реальной проблемы перейти к той или иной вероятностно-статистической модели. В которой нет речи о, следуя Вашему примеру, хорьках и мышах, вместо них рассматриваются те или иные случайные величины, а задача состоит в оценивании (характеристик, параметров, плотности распределения) или в проверке гипотез. Вероятностно-статистическая модель подвергается изучению. Полученные в ней выводы интерпретируются затем в терминах реальной проблемы (следуя Вашему примеру, получают выводы о хорьках и мышах).

3. К сожалению, я никак не могу перейти к той или иной вероятностно-статистической модели, следуя Вашему примеру о хорьках и мышах.
С мышами более-менее ясно - замеряют частоту сокращения сердечной мышцы у отлавливаемых мышей-полевок, эту частоту можно рассматривать как реализацию случайной величины, распределение которой одно и то же для каждого участка в форме круга.
А вот как меняются распределения от круга к кругу? Кроме наличия хорька Вы вводите еще его возраст как показатель активности. Не вполне ясно - разве с возрастом хорек становится вегетарианцем?
И еще говорите о совах.
Какую же гипотезу Вы хотите проверять?
Простейший вариант - проверить совпадение функций распределения для всех выборок. Т.е. гипотезу о том, что частота сокращения сердечной мышцы у отлавливаемых мышей-полевок не зависит ни от наличия хорька, ни от наличия совы.
Для проверки такой гипотезы и предназначен дисперсионный анализ (параметрический и непараметрический).
А что Вас интересует - в терминах вероятностно-статистической модели?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт авг 28, 2007 7:03 am 
Не в сети

Зарегистрирован: Пн авг 20, 2007 12:38 pm
Сообщений: 2
Откуда: Нижний Новгород
Большое спасибо за ответ, глубокоуважаемый Александр Иванович!
Задача крайне проста: нужно проверить гипотезу об эффекте влияния хорька на сердцебиение куропаток. И больше ничего! Совы и возраст хорьков в рамках этой задачи - просто примеры посторонних возмущающих факторов.
Какой критерий значимости использовать - абсолютно неважно. Интересна только стратегия группировки. Приведу возможные варианты такой стратегии:
а)Объединить три группы измерений с хорьком и три группы измерений без оного и сравнить по Стьюденту или непараметрике (но тут нет учета неоднородности условий измерений и еще много чего);
б)по трем значениям групповых средних рассчитываем средние и вариансы для опыта и контроля и сравниваем их по t-критерию (получаем смещенную оценку альфа-вероятности);
в) то же, но средние и дисперсии для опыта и контроля рассчитываем как средневзвешенное по количеству измерений из групповых средних и дисперсий (смещенность оценки не изменяется);
г) рассчитываем 15 парных комбинаций критериев Стьюдента или Вилкоксона и подключаем какую-либо хитроумную эвристику их усреднения (каждая из пар не является статистически независимой, а использование формул усреднения не даст теоретически обоснованную альфа-вероятность нулевой гипотезы);
д) выполняем дисперсионный анализ на полном наборе данных (по Фишеру проверяется не та гипотеза, которая сформулирована, т.к. неоднородность может определяться различиями между двумя опытными или двумя контрольными группами);
е) в том же дисперсионном анализе рассчитываем критерии минимальной значимой разности, линейные контрасты Шеффе или подключаем иные алгоритмы множественных сравнений (проблему см. в п.г.).

Как правильно!!!? Назовите букву от а) до е), пожалуйста. Или какую-либо альтернативу.
Но хотелось бы иметь в виду фразу из Адлера (1976):"повторные опыты нельзя путать с повторными измерениями в одном опыте. Такие измерения часто делаются и являются полезными, но не могут заменить повторных опытов… ". В этом эксперименте число степеней свободы: число участков или число отловленных куропаток?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт авг 28, 2007 9:57 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8218
Я же подробно разъяснил: начинать надо с формулировки вероятностно-статистической модели.
Т.е. с перехода от реальной проблемы к задаче прикладной статистики.
Только в рамках вероятностно-статистической модели можно обоснованно сравнивать различные алгоритмы расчетов.

Ю.П. Адлер известен своим невежеством в статистике.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вт ноя 11, 2008 10:41 pm 
Не в сети

Зарегистрирован: Чт июл 19, 2007 4:03 pm
Сообщений: 29
Александр Иванович, в Ваших работах часто встречались упоминания о высоких, классических и низких статистических технологиях (как в книге «Прикладная статистика»). В связи с этим я хотел спросить: использование критерия Стьюдента при условии случайности выборки и нормальности распределения для проверки гипотез является низкой или классической статистической технологией (то есть допустимо ли его использовать, или лучше пользоваться другими методами)?


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Ср ноя 12, 2008 1:35 pm 
Не в сети

Зарегистрирован: Чт мар 20, 2008 1:25 pm
Сообщений: 191
Откуда: Солнечная система
Распределения реальных данных, как правило, не являются нормальными. Кроме того, по нескольким десяткам набюдений вообще нельзя проверить нормальность достаточно достоверно. Поэтому в подавляющем большинстве случаев применение критерия Стьюдента не является обоснованным. Эту технологию признаем низкой.
Подробнее - глава 4 "Эконометрики" и др.


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 6 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 3


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB