Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Пн авг 03, 2020 11:37 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 17 ] 
Автор Сообщение
 Заголовок сообщения: Корреляция
СообщениеДобавлено: Вс янв 22, 2006 6:22 pm 
Уважаемый, профессор!
Я занимаюсь обработкой психологических данных, измеренных в порядковой шкале (порядков всего - 5), испытуемых - 30. Какую кореляцию лучше выбрать? Пользуюсь программой "Статистика 6", корреляция Спирмена не находит интересующих меня связей между переменными, статистика Кэнделла - обнаружила их. На чём остановиться?
Ирина.


Вернуться наверх
   
 
 Заголовок сообщения: Ирина
СообщениеДобавлено: Вс янв 22, 2006 10:53 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
Остановитесь на статистике Кендалла


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт фев 03, 2006 10:15 am 
Подскажите пожалуйста, где взять программу Статистика 6???
Demon666-74@mail.ru


Вернуться наверх
   
 
 Заголовок сообщения:
СообщениеДобавлено: Ср янв 10, 2007 3:26 pm 
Не в сети

Зарегистрирован: Ср дек 27, 2006 4:19 pm
Сообщений: 17
Откуда: Томск
Уважаемый Александр Иванович!

Прошу Вашей консультации по следующей проблеме. Необходимо оценить корреляцию попарно связанных выборок, в одной из которых оценка производилась в порядковой шкале, в другой - в шкале отношений. Есть ли какие-либо статистические критерии для решения подобных задач, или проще категоризировать данные, оцененые в шкале отношений, и перейти к использованию ранговых критериев?

Заранее благодарен,
Денис


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Ср янв 10, 2007 5:54 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
Целесообразно использовать непараметрические коэффициенты ранговой корреляции Спирмена или Кендалла. Категоризовать (огрублять) данные не следует.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт янв 11, 2007 10:27 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
А еще лучше познакомиться с классической книгой М. Кендалла (Кендэла) "Ранговые корреляции".
Библиотеки еще существуют. А то читают люди разную чушь.
Как я писал в "Вестнике статистики" в 1990 г.: "Профессора-невежды порождают новых невежд".


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт янв 11, 2007 3:26 pm 
Не в сети

Зарегистрирован: Ср дек 27, 2006 4:19 pm
Сообщений: 17
Откуда: Томск
Проф.А.И.Орлов писал(а):
А еще лучше познакомиться с классической книгой М. Кендалла (Кендэла) "Ранговые корреляции".
Библиотеки еще существуют.

Спасибо за совет. Прочтение этой книги - в ближайших планах.

С уважением,
Денис


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт май 18, 2007 1:05 am 
Не в сети

Зарегистрирован: Пт май 18, 2007 12:55 am
Сообщений: 2
Откуда: Gomel [Belarus]
А мне все таки кажется, что в психологических исследованиях с малой выборкой, когда стоит задача разделить объекты на категории применять многомерные исследующие методы, в данном случае на мой взгляд было бы качественнее использовать кластерный анализ методом к-средних, а потом искать различия меджду получившимися группами по Манну-Уитни.
Ну а если уже совсем хочется коэффицент корреляции Спирмена или Тау Кендалл, то можно попробовать рассчитать границы доверительного интервала для них. Если ноль не попадает в интервал, значит со степенью уверенности для которой рассчитывался интервал мы можем утверждать, что корреляция есть только слаааабенькая:)
По наименьшему абсолютному значению границы ДИ...


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт май 18, 2007 9:01 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
Если сначала провести кластер-анализ, то после него применение методов проверки гипотез однородности будет некорректным, поскольку будут нарушены предположения о независимости элементов выборок.

Доверительные интервалы для коэффициентов ранговой корреляции рассчитывать незачем, поскольку речь идет о проверке гипотез об их отличии от нуля, а для этого есть таблицы критических значений.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Чт июн 14, 2007 11:55 pm 
Не в сети

Зарегистрирован: Пт май 18, 2007 12:55 am
Сообщений: 2
Откуда: Gomel [Belarus]
И все же - доверительные интервалы отражают количественно степень уверенности причем в данном конкретном случае, а таблица это как будто обобщение, грубо и некорректно, мне кажется что в медицине и психологии так работать нельзя, особенно в условиях столь малой выборки. А с к-средних это я наверное действительно погорячился...


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Пт июн 15, 2007 6:10 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
Если речь о проверке гипотез, то
Цитата:
Доверительные интервалы для коэффициентов ранговой корреляции рассчитывать незачем, поскольку речь идет о проверке гипотез об их отличии от нуля, а для этого есть таблицы критических значений.

Если речь об оценивании коэффициента ранговой корреляции, то, конечно, надо строить доверительные интервалы.
См. также:
Новиков Д.А., Новочадов В.В. Статистические методы в медико-биологическом эксперименте (типовые случаи). Волгоград: Издательство ВолГМУ, 2005. – 84 с.
http://www.mtas.ru/search_results.php?s ... on_id=2821


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб июл 07, 2007 9:12 pm 
Не в сети

Зарегистрирован: Сб июл 07, 2007 9:01 pm
Сообщений: 4
Здравствуйте, господин Орлов! Можно ли применять коэффициент ассоциации и контингенции вместо корреляции как непараметрический критерий? И надо ли потом и возможно ли это проверка на существенность?Спасибо.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Сб июл 07, 2007 9:25 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
Чо это за коэффициенты такие?
Опишите вероятностно-статистическую модель, формулы расчетов, тогда и обсудим. И
Цитата:
проверки на существенность

не бывает. Проверяют ту или иную статистическую гипотезу. На том или ином уровне значимости. Познакомьтесь с учебниками на нашем сайте http://orlovs.pp.ru Заодно узнаете, как меня зовут. А также поймете, почему за обращение "господин" при личной встрече дал бы по морде. "Господ" надо вешать за ноги.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс июл 08, 2007 6:26 pm 
Не в сети

Зарегистрирован: Сб июл 07, 2007 9:01 pm
Сообщений: 4
Извините, Александр Иванович! Я дилетант, хотя Прикладную статистику прочла. В общем виде: дана выборка 40 человек,можно ли определить тесноту связи через коэффициенты ассоциации и контингенции между уровнем гуманизации личности и уровнем саморазвития, если взять их как качественные признаки, каждый из которых представлен в виде альтернативных : есть (или нет) гуманизации, есть (или нет) саморазвития. Нигде не смогла найти, как тогда определить статистическую значимость гипотезы. В книгах пишут, что связь есть, если К больше 0,5.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс июл 08, 2007 6:33 pm 
Не в сети

Зарегистрирован: Сб июл 07, 2007 9:01 pm
Сообщений: 4
В учебнике Р.А. Шмойловой сказано: Для определения этих коэффициентов создается расчетная таблица (таблица «четырех полей»), где статистическое сказуемое схематически представлено в следующем виде:

Признаки А (да) А (нет) Итого
В (да) a b a + b
В (нет) с d c + d
Итого a + c b + d n

Здесь а, b, c, d - частоты взаимного сочетания (комбинации) двух альтернативных признаков; n - общая сумма частот.Коэффициент ассоциации можно расcчитать по формуле К = (а d- b с)/ (а d+b с).


Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс июл 08, 2007 7:18 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 8986
Из учебника "Эконометрика", гл.13. п.13.5:
http://orlovs.pp.ru/econ.php#ek1

Начало цитаты:

Итак, необходимо уметь проверять по статистическим данным гипотезу независимости двух альтернативных признаков. Речь идет о статистической проверке нулевой гипотезы
Н0: p11 = p1 p2 (22)
(что эквивалентно проверке равенства p00 = (1 - p1)(1 - p2)). Нетрудно проверить, что гипотеза о справедливости равенства (22) эквивалентна гипотезе
Н0 : p00 p11 - p10 p01 = 0. (23)
В простейшем случае предполагается, что проведено n независимых испытаний (Xi , Yi), i = 1,2,...,n, в каждом из которых проконтролированы два альтернативных признака, а вероятности результатов контроля не меняются от испытания к испытанию. Общий вид статистических данных приведен в табл.5.

Табл. 5. Общий вид результатов контроля
по двум альтернативным признакам.
Х=0 Х=1 Всего
У=0 a b a+b
У=1 c d c+d
Всего a+c b+d n

В табл.5 величина a - число испытаний, в которых (Xi , Yi) = (0,0), величина b - число испытаний, в которых (Xi , Yi) = (1,0), и т.д.
Случайный вектор (a, b, c, d) имеет мультиномиальное распределение с числом испытаний n и вектором вероятностей исходов (p00 , p10 , p01 , p11 ). Состоятельными оценками этих вероятностей являются дроби a/n, b/n, c/n, d/n соответственно. Следовательно, критерий проверки гипотезы (23) может быть основан на статистике
Z = ad - bc . (24)
Как вытекает из известной формулы для ковариаций мультиномиального вектора (см., например, формулу (6.3.5) в учебнике С.Уилкса [14] на с. 153),
М(Z) = n (p10 p01 - p00 p11), (25)
что равно 0 при справедливости гипотезы независимости (23).
Связь между переменными X и Y обычно измеряется коэффициентом, отличающимся от Z нормирующим множителем:
V = (ad - bc) { (a + b)(a + c)(b + d)(c + d) } - 1/2 (26)
[т.е. выражение в фигурных скобках берется в степени (-1/2) - А.О.]
(см. классическую монографию М. Дж. Кендалла и А. Стьюарта [15, с.723], на которую уже были ссылки, в частности, в главе 5). При справедливости гипотезы Н0 и больших n случайная величина nV2 [т.е. n умножить на V в квадрате 2 - А.О.]имеет хи-квадрат распределение с одной степенью свободы, а n1/2V [т.е. V умножить на квадратный корень из объема выборки - А.О. ]имеет стандартное нормальное распределение с математическим ожиданием 0 и дисперсией 1 (см. [15, с.736]).

Конец цитаты.

Здесь знаменатель другой, чем у Вас. Но зато описан метод проверки гипотезы независимости признаков. У Вас объем выборки 40 - это "большой объем".
Ваш коэффициент К - это коэффициент Юла (1900, 1912) - см. [15, с.723].
Если хотя бы один из признаков имеет более чем две градации, то для проверки независимости признаков потаблице сопряженности (так на русский язык переводят термин "таблицы контингенции") применяют критерий хи-квадрат [15, с.745 и далее].
Кроме книги Кендалла и Стьюарта [15], есть много других. Сам я писал только о таблицах 2Х2.
В учебнике Шмойловой есть ошибки - см.:http://forum.orlovs.pp.ru/viewtopic.php?t=548


Последний раз редактировалось Проф.А.И.Орлов Вс июл 08, 2007 7:43 pm, всего редактировалось 1 раз.

Вернуться наверх
 Профиль  
 
 Заголовок сообщения:
СообщениеДобавлено: Вс июл 08, 2007 7:25 pm 
Не в сети

Зарегистрирован: Сб июл 07, 2007 9:01 pm
Сообщений: 4
спасибо, обязательно прочитаю .


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 17 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 5


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB