Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Вт мар 19, 2024 1:55 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ Сообщений: 10 ] 
Автор Сообщение
 Заголовок сообщения: Новая парадигма математической статистики
СообщениеДобавлено: Чт авг 23, 2012 9:22 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
НОВАЯ ПАРАДИГМА МАТЕМАТИЧЕСКОЙ СТАТИСТИКИ

Александр Иванович Орлов

МГТУ им. Н.Э. Баумана, МФТИ, Группа авиакомпаний «Волга-Днепр»,
Москва, Россия, prof-orlov@mail.ru

Новая парадигма математической статистики основана на переходе от параметрических статистических методов к непараметрическим, от числовых данных – к нечисловым, на интенсивном использовании информационных технологий. Ее отличительные черты выявлены в работе в сравнении со старой парадигмой математической статистики середины ХХ в.

Математическая статистика – это наука о том, как обрабатывать данные. Этими словами начинается учебник «Прикладная статистика» [1]. Противоречия нет. В середине ХХ в. наука об обработке данных называлась математической статистикой. Затем – прикладной статистикой. Настало время вернуться к прежнему названию.
За сменой названий стоит смена парадигм. Под парадигмой понимаем систему идей, взглядов и понятий, различных моделей решения проблем, а также методов исследования. Цель работы – описать и сравнить две парадигмы в области анализа данных – старую и новую.

1. Послевоенное развитие отечественной статистики

Основные достижения математики в ХХ в. - аксиоматизация теории вероятностей, создание математической статистики и линейное программирование (есть и другие мнения).
К середине ХХ в. в СССР, как и за рубежом, сформировалась научно-практическая дисциплина, которую называем классической математической статистикой. Специалисты-статистики учились теории по книге Г. Крамера [2], написанной в военные годы и впервые изданной на русском языке в 1948 г. Из прикладных руководств назовем учебник [3] и таблицы с комментариями [4].
Затем внимание многих специалистов сосредоточилось на изучении математических конструкций, используемых в статистике. Примером таких работ является монография [5]. В ней получены продвинутые математические результаты, но из них трудно (прямо скажем, почти невозможно) выделить рекомендации для статистика, анализирующего конкретные данные.
Что же послужило причиной такого сдвига интересов? Некоторые особенности исторического развития СССР.
Большой вред развитию статистической науки и практики в нашей стране нанесло Всесоюзное совещание статистиков 1954 г. На нем было принято решение, что статистика – это одна из экономических наук, фактически – ведомственная наука ЦСУ–Госкомстата–Росстата РФ (Федеральной службы государственной статистики). При этом организаторы совещания не посмели покуситься на само существование математической статистики, но отнесли ее исключительно внутрь математики, в которой была выделена специальность «теория вероятностей и математическая статистика». Все остальные области применения статистических методов перестали замечаться официальными структурами, т.е. стали полулегальными. Конечно, специалисты нашли способы противодействия. Например, статистические методы в химии относились к «химической кибернетике», статистические методы в медицине – к «математическому моделированию в медицине».
В результате решений Всесоюзного совещания статистиков 1954 г. работы по математической статистике стали рассматриваться исключительно с позиций математики. Стали цениться изощренные теоремы (типа полученных в монографии [5]), никак не связанные с анализом реальных данных. В то же время вопросы практики применения статистических методов стали отодвигаться на задний план и даже подвергаться гонениям. Типичным примером является провал при защите на мехмате МГУ им. М.В. Ломоносова в 1971 г. докторской диссертации В.В. Федорова, в которой были получены базовые результаты в области планирования эксперимента – одного из важнейших направлений статистических методов.
Как реакция на уход в математику выделилась новая научная дисциплина - прикладная статистика. В учебнике [1] в качестве рубежа, когда это стало очевидным, мы указали 1981 г. – дату выхода массовым тиражом (33 940 экз.) сборника [6], в названии которого использован термин «прикладная статистика» (полное название: «Современные проблемы кибернетики (прикладная статистика)». С этого времени линии развития математической статистики и прикладной статистики окончательно разошлись. Первая из них полностью ушла в математику, перестав интересоваться практическими делами. Вторая позиционировала себя в качестве науки об обработке данных – результатов наблюдений, измерений, испытаний, анализов, опытов.
Вполне естественно, что в прикладной статистике стали развиваться свои математические методы и модели. Необходимость их появления вытекает из потребностей конкретных прикладных исследований. Это математизированное ядро прикладной статистики вполне естественно назвать теоретической статистикой. Тогда под собственно прикладной статистикой следует понимать обширную промежуточную область между теоретической статистикой и применением статистических методов в конкретных областях. В нее входят, в частности, вопросы формирования вероятностно-статистических моделей и выбора конкретных методов анализа данных (т.е. методология прикладной статистики и других статистических методов), проблемы разработки и применения информационных статистических технологий, организации сбора и анализа данных, т.е. разработки статистических технологий. Именно прикладной статистике посвящены многие публикации в разделе «Математические методы исследования» нашего журнала.
С рассматриваемой точки зрения общая схема современной статистической науки выглядит, по нашему мнению, следующим образом (от абстрактного к конкретному):
1. Математическая статистика – часть математики, изучающая статистические структуры. Сама по себе не дает рецептов анализа статистических данных, однако разрабатывает методы, полезные для использования в теоретической статистике.
2. Теоретическая статистика – наука, посвященная моделям и методам анализа конкретных статистических данных.
3. Прикладная статистика (в узком смысле) посвящена статистическим технологиям сбора и обработки данных. Она включает в себя методологию статистических методов, вопросы организации выборочных исследований, разработки статистических технологий, создания и использования статистических программных продуктов.
4. Применение статистических методов в конкретных областях (в экономике и менеджменте – эконометрика, в биологии – биометрика, в химии – хемометрия, в технических исследованиях – технометрика, в геологии, демографии, социологии, медицине, истории, и т.д.).
Часто позиции 2 и 3 вместе называют прикладной статистикой. Иногда позицию 1 именуют теоретической статистикой. Эти терминологические расхождения связаны с тем, что описанное выше развитие рассматриваемой научно-прикладной области не сразу, не полностью и не всегда адекватно отражается в сознании специалистов. Так, до сих пор выпускают учебники, соответствующие уровню представлений середины ХХ века.
Примечание. Здесь мы уточнили схему внутреннего деления статистической теории, предложенную нами ранее в [7]. Естественный смысл приобрели термины «теоретическая статистика» и «прикладная статистика» (в узком смысле). Однако необходимо иметь в виду, что в недавнем учебнике [1] прикладная статистика понимается в широком смысле, т.е. как объединение позиций 2 и 3.
Отметим, что математическая статистика, как и теоретическая с прикладной, заметно отличается от ведомственной науки органов официальной государственной статистики. ЦСУ, Госкомстат, Росстат РФ применяли и применяют лишь проверенные временем приемы позапрошлого (19-го) века. Приходится с сожалением констатировать, что большинство учебных курсов в экономических ВУЗах и учебников с названиями «Статистика» или «Общая теория статистики» понимают под последней статистику в смысле Росстата. Возможно, следовало бы от этого ведомства полностью отмежеваться и сменить название дисциплины, например, на «Анализ данных». В настоящее время компромиссным самоназванием рассматриваемой научно-практической дисциплины является термин «статистические методы».
В последнее время стало ясно, что абстрактно-математическое направление в статистике исчерпало потенциал развития. Нет важных новых работ, потому что нет новых идей. В то же время в теоретической и прикладной статистике – масса новых результатов. Настало время следовать мудрым словам одного из моих учителей члена-корреспондента АН СССР Л.Н. Большева (06.03.1922 - 29.08.1978) «Вся математическая статистика является прикладной» ([6]). Мы считаем необходимым объединить выделенные выше ветви статистики – математическую, теоретическую и прикладную – в единую математическую статистику. Первую из ветвей предлагаем называть «математическими методами в статистике».
Во второй половине 80-х годов в СССР развернулось общественное движение, имеющее целью создание профессионального объединения статистиков. Аналогами являются британское Королевское статистическое общество (основано в 1834 г.) и Американская статистическая ассоциация (создана в 1839 г.). К сожалению, деятельность учрежденной в 1990 г. Всесоюзной статистической ассоциации (ВСА) [8] оказалась парализованной в результате развала СССР. Некоторую активность проявили Российская ассоциация статистических методов, Российская академия статистических методов, Белорусская статистическая ассоциация, созданные на базе ВСА.
В ходе создания ВСА проанализировано состояние и перспективы развития статистических методов. Коллективными усилиями создана новая парадигма математической статистики, основанная, в частности, на переходе от параметрической статистики, основанной на использовании параметрических семейств распределений, к непараметрической и нечисловой статистике. Выявлена необходимость создания нового поколения учебной литературы, которая должна сменить издания на основе идей середины ХХ в.
Какова ситуация в других странах, в мире в целом? От англо-саксонских стран СССР отстал более чем на 150 лет в деле создания профессионального объединения статистиков. За эти годы на Западе был пройден долгий путь организационного строительства, найдены способы эффективного сочетания теории и практики, объединения статистиков различных направлений – от теоретиков-вероятностников до работников официальной государственной статистики. Центральным ядром была и остается математическая статистика. Есть и развитие: основной статистический журнал «The Annals of Mathematical Statistics», созданный в 1930 г., в 1973 г. был разделен на два - «The Annals of Statistics» и «The Annals of Probability». Общее число научных журналов, публикующих работы по теории вероятностей, математической и прикладной статистике Д.С. Шмерлинг [9] оценивает как 1000 – 1500. В своей статье он приводит несколько сотен наименований.
Статистические методы основаны на теории вероятностей. В СССР была создана самая мощная в мире научная школа по теории вероятностей. К сожалению, это стратегическое преимущество не удалось реализовать в виде адекватного развития статистических методов. Число специалистов (на миллион граждан страны) в СНГ на порядок меньше, чем в других развитых странах. Если бы удалось ввести в средней школе полноценный курс вероятности и статистики - а такой курс есть в Японии и США, Швейцарии, Кении и Ботсване, почти во всех странах, кроме стран бывшего социалистического лагеря (см. подготовленный ЮНЕСКО сборник докладов [10]) - то ситуация могла бы быть резко улучшена. Надо, конечно, добиться, чтобы такой курс был построен на высоких статистических технологиях [11], а не на устаревших. Другими словами, он должен отражать современные достижения, а не концепции пятидесятилетней или столетней давности.

2. Основные черты новой парадигмы

Демонстрацией необходимости новой парадигмы является само появление новой научной области - прикладной статистики. Сравнение парадигм удобно провести с помощью табл.1, в которой выделены 17 основных характеристик систем идей, взглядов и понятий.

Таблица 1. Сравнение новой и старой парадигм
№ Характеристика Старая парадигма Новая парадигма
1 Типовые исходные данные Числа, вектора, функции Объекты нечисловой природы
2 Основной подход к описанию данных Распределения из параметрических семейств Произвольные (непрерывные) функции распределения
3 Математический аппарат Суммы Расстояния и алгоритмы оптимизации
4 Источник постановок задач Математические традиции, сформировавшиеся к середине ХХ века Современные потребности анализа данных (XXI век)
5 Отношение к вопросам устойчивости выводов Практически отсутствует интерес к устойчивости выводов Развитая теория устойчивости (робастности)
6 Оцениваемые величины Параметры распределений Характеристики и плотности распределений, зависимости и др.
7 Возможность применения Наличие повторяющегося комплекса условий Наличие обоснованной вероятностно-статистической модели
8 Центральная часть теории Статистика числовых случайных величин Статистика в пространствах произвольной природы
9 Роль информационных технологий Только для расчета таблиц Инструмент получения выводов (датчики псевдослучайных чисел, размножение выборок, в т.ч. бутстреп, и др.)
10 Учет соображений информатики Информатика находится вне статистики Учет возможностей проведения расчетов
11 Точность данных Данные полностью известны Учет свойств данных, в частности, интервальных
12 Типовые результаты Предельные теоремы Рекомендации для конкретных объемов выборок
13 Вид постановок задач Отдельные задачи Статистические технологии
14 Стыковка алгоритмов Не рассматривается Весьма важна
15 Роль моделирования Отдельные системы аксиом Системы моделей
16 Анализ экспертных оценок Отдельные алгоритмы Прикладное «зеркало» общей теории
17 Роль методологии Практически отсутствует Основополагающая

Основные составляющие новой парадигмы подробно разбирались на страницах журнала «Заводская лаборатория». Развитие нечисловой статистики за 30 лет проанализировано в [12]. Пять актуальных направлений, в которых развивается современная прикладная статистика, т.е. пять «точек роста» - непараметрика, робастность, бутстреп, статистика интервальных данных, статистика объектов нечисловой природы – разобраны в [13]. Проблемы устойчивости (робастности) рассмотрены в [14]. Большую роль стала играть методология [15, 16] – при постановках задач, построении систем моделей.
Стало ясно, что надо разделять четыре уровня работ – методологический, теоретический, методический, прикладной (см. табл.2).

Таблица 2. Четыре уровня работ по математической статистике
Методологический уровень. Как ставить задачу (как организовать моделирование)? Основные идеи метода
Теоретический уровень. Проработка основных идей, доказательство теорем
Методический уровень. Разработка методик, алгоритмов, программных продуктов, рекомендаций по практическому использованию
Прикладной уровень. Практическое использование: адаптация и применение разработанного метода при решении конкретных практических задач

Особенно важным представляется разделение методологического и теоретического уровней, а именно, выявление актуальных для практики и подлежащих решению постановок задач и цепочек теорем, посвященных все более продвинутым математическим результатам решения поставленной на методологическом уровне задачи (в качестве общеизвестного примера можно указать на двухсотлетнюю историю Центральной предельной теоремы).
Выявилась роль статистики в пространствах произвольной природы [12, 17], позволяющей единообразным образом анализировать как результаты измерений, наблюдений, испытаний, анализов, опытов, так и экспертные оценки разнообразных видов [18, 19]. В частности, оказалось, что задачи классификации [20] наиболее естественно ставить и решать в рамках статистики в пространствах произвольной природы и тем самым относить их к нечисловой статистике [17], а не к многомерному статистическому анализу.
Принципиально важным является понятие «высокие статистические технологии» [11], вводящее в прикладную статистику производственный процесс анализа данных, состоящий из последовательностей операций, каждая из которых – оценивание, проверка гипотезы или иная операция, используемая и в математической статистике, но по отдельности, без объединения в процесс. Важной оказалась проблема «стыковки алгоритмов», т.е. проверки условий применимости последующей статистической операции (алгоритма) после окончания выполнения предыдущей.
Например, перед проведением регрессионного анализа иногда рекомендуют разбить совокупность данных на однородные части, т.е. провести классификацию. Однако после классификации выделенные подсовокупности сосредоточены в отдельных частях исходного пространства, следовательно, моделирующие их плотности распределения равны 0 вне соответствующих частей, а потому не могут иметь нормальное распределение. Следовательно, к полученным подсовокупностям результатов измерений (наблюдений, испытаний, анализов, опытов) принципиально нельзя применять методы регрессионного анализа, предполагающие нормальность погрешностей (ошибок, невязок). Следует использовать непараметрические методы регрессии, не опирающиеся на заведомо не выполненную в рассматриваемом случае гипотезу нормальности погрешностей.
За рубежом по каждому из перечисленных узких научных направлений ведутся научные исследования. Однако в единое целое – в новую научную парадигму – они интегрированы именно в нашей стране (СССР и СНГ). Важно эффективно использовать это наше конкурентное преимущество – общее достояние российского научного сообщества.

3. Последствия перехода на новую парадигму

В качестве примера рассмотрим подготовку специалистов, поскольку именно она определяет уровень выполняемых ими в дальнейшем научных и прикладных работ. При переходе на преподавание согласно новой парадигме прикладной статистики необходимо существенно изменить содержание традиционного для университетов и технических вузов курса «Теория вероятностей и математическая статистика». В частности, необходимо изучать случайные величины (точнее, случайные элементы) со значениями в произвольных пространствах (в пространстве бинарных отношений, конечных множеств, других нелинейных пространствах); центральные предельные теоремы в полном объеме - для разнораспределенных слагаемых, в многомерном пространстве; средние величины в произвольных пространствах как решения оптимизационных задач; законы больших чисел в произвольных пространствах; непараметрический подход ко всем основным задачам прикладной математической статистики. В то же время почти отпадает необходимость в изучении таких традиционных тем, как геометрические вероятности; параметрические семейства распределений (за исключением нормального распределения, появляющегося в центральных предельных теоремах); параметрические постановки в математической статистике, достаточные статистики, неравенство Рао-Крамера, метод максимального правдоподобия, метод одношаговых оценок; проверка параметрических гипотез с использованием распределений Стьюдента и Фишера.
Ряд проблем связан с использованием распространенных программных продуктов при преподавании. Очевидно, что математические методы исследования, в том числе методы статистического анализа данных, требуют больших вычислений и зачастую невозможны без компьютеров. Применение новой парадигмы прикладной статистики, продвинутое применение высоких статистических технологий [11] предполагает использование соответствующих программных продуктов. Статистические пакеты – постоянно используемые интеллектуальные инструменты исследователей, инженеров, управленцев, занимающихся анализом больших массивов данных. Более 20 статистических пакетов, разработанных под нашим руководством Всесоюзным центром статистических методов и информатики, в том числе пакеты СПК, АТСТАТ-ПРП, СТАТКОН, АВРОРА-РС, ЭКСПЛАН, ПАСЭК, НАДИС, проанализированы в [21, 22]. Сравнительному анализу четырех диалоговых систем по статистическому контролю посвящена статья [23], и т.д. Однако наряду с очевидной пользой статистические пакеты могут приносить вред неискушенному пользователю. Например, в них зачастую пропагандируется применение двухвыборочного критерия Стьюдента, когда условия его применимости не проверены, а зачастую и не выполнены. Между тем хорошо известно, каковы отрицательные последствия использования критерия Стьюдента вне сферы его применимости, а также и то, что применять его нет необходимости, поскольку разработаны более адекватные критерии [24].
Другой пример. Малограмотность переводчиков в русифицированной версии MS Excel (по крайней мере в разделе «Анализ данных») шокирует специалиста по прикладной статистике: например, «объем выборки» именуется «счет». С сожалением приходится констатировать, что не соответствует современным требованиям и электронный учебник – обзор методов, реализованных в пакете STATISTICA-6. Анализ допущенных в документации к пакету недочетов занял бы не меньше места, чем сама документация. В [21] продемонстрировано, насколько трудоемким оказался критический анализ всего лишь нескольких десятков ГОСТов по статистическим методам управления качеством.
Это замечание касается, конечно, не только пакетов. Из одной публикации в другую кочуют одни и те же ошибки. Для разоблачения каждой нужна развернутая публикация. Например, распространенная ошибка при использовании критериев Колмогорова и омега-квадрат разобрана в статье [25], ошибочные утверждения о том, какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона, разоблачены в [26].
Основное противоречие в области разработки статистических пакетов на настоящий момент таково. Те, кто программирует, не являются специалистами по прикладной статистике, поскольку это не входит в их профессиональные обязанности. С другой стороны, специалисты по статистическим методам не берутся реализовывать их в пакетах, поскольку такая работа, весьма трудоемкая и ответственная, обычно не соответствует их профессиональным устремлениям. Судя по опыту Всесоюзного центра статистических метолов и информатики, стоимость разработки (на профессиональном уровне) пакета среднего уровня сложности – порядка 70 тыс. руб. (в ценах 1990 г.), что соответствует 10,5 млн. руб. РФ в ценах 2012 г. (индекс инфляции за 22 года примерно равен 150 при расчете по методике [27]). Это означает, что разработкой, распространением и сопровождением статистических пакетов должны заниматься специализированные на этом организации или подразделения, в том числе коммерческие организации – как во всем мире.
В нашей стране активная работа по созданию развернутой системы отечественных статистических пакетов развернулась в 80-х годах. Как уже отмечалось, только Всесоюзным центром статистических метолов и информатики было разработано более 20 программных продуктов по прикладной статистике и другим статистическим методам. Эта работа проводилась в рамках нашего более широкого проекта, нацеленного на объединение усилий специалистов по статистическим методам с целью повышения эффективности теоретических и прикладных исследований. Важным промежуточным итогом было создание в 1990 г. Всесоюзной организации по статистическим методам и их применениям и Всесоюзной статистической ассоциации [8]. Планы тех лет отражены в статье [28]. Итогом виделось создание (развертывание, организационное оформление) новой отрасли прикладной науки по образцу метрологии.
Развал СССР, либерализация цен и гиперинфляция начала 90-х положили конец рассматриваемому проекту. Из плана работ реализована только подготовка серии современных учебников [1, 17, 19, 29, 30, 33 и др.], составленных на основе наших научных статей (учебники выложены в свободном доступе на сайте «Высокие статистические технологии» http://orlovs.pp.ru и странице Лаборатории экономико-математических методов в контроллинге МГТУ им. Н.Э. Баумана http://ibm.bmstu.ru/nil/biblio.html ). Предприятия и организации, лишившись оборотных средств из-за инфляции, перестали покупать статистические программные продукты, коллективы разработчиков распались, перестали поддерживать статистические пакеты в условиях быстрого обновления технических средств и базового программного обеспечения. В результате многообразие продуктов на отечественном рынке статистических пакетов резко сократилось, и монополистами оказались SPSS, STATISTICA, STATGRAPHICS (и немногие другие). При анализе программных продуктов целесообразно сказать несколько слов об аналитических надстройках над распространенными системами широкого назначения, такими, как, например, Oracle и т.п. Приходится констатировать, что в них примитивная статистика сочетается с хорошей визуализацией, облегчающей практическое использование подобных систем и при этом, увы, дающей импульс распространению устаревших статистических методов.
На опасность бездумного применения статистических пакетов В.В. Налимов обращал внимание еще около 40 лет назад [31]. Он имел в виду прежде всего склонность к проведению расчетов без знакомства с сутью применяемых методов. Необходимо обратить внимание также на научно-технический уровень самих пакетов и сопровождающей документации. Дополнительно к сказанному ранее приходится констатировать, что в популярных в настоящее время в России статистических пакетах нет примерно половины того, что разработано представителями отечественной вероятностно-статистической научной школы и включено в современные учебники [1, 17, 27], подготовленные в соответствии с рекомендациями Всесоюзной статистической ассоциации и – позже - Российской ассоциации статистических методов. Сказанное легко проверить, сопоставив содержание указанных учебников и перечень методов, включенных в распространенные пакеты. Поэтому в научно-учебном комплексе «Инженерный бизнес и менеджмент» МГТУ им. Н.Э. Баумана мы сознательно избегаем использования в учебном процессе популярных в настоящее время пакетов, чтобы не приучать студентов к статистике 60-70-х годов прошлого века. Однако, поскольку нет современных пакетов, приходится для практических расчетов использовать устаревшие программные продукты.
Тиражи пакетов и учебников сопоставимы. Пакет STATGRAPHICS имеет более 40 тыс. зарегистрированных пользователей, учебник [1] выпущен суммарным тиражом 3 тыс. экземпляров, его электронную версию только с сайта «Высокие статистические технологии» на 01.08.2012 скачали более 41 тыс. пользователей (viewtopic.php?f=5&t=387&p=5732#p5732 ). Поэтому состав пакетов и качество документации имеют большое значение. Они во многом определяют качество прикладных научных работ и обоснованность хозяйственных решений.
Отметим, что по сравнению с 80-ми годами к настоящему времени наметился рост внимания к статистическим технологиям [11], а не только к их составляющим – конкретным методам обработки данных. В этом суть популярного ныне подхода Data Mining (на русском - «добыча данных», «интеллектуальный анализ данных»). Термин Data Mining введен эмигрантом из СССР Г. Пятецким-Шапиро в 1989 г. Задачи, решаемые Data Mining, – классификация, кластеризация, регрессия, ассоциация (поиск повторяющихся паттернов, например, поиск устойчивых связей) – это типичные задачи прикладной статистики. Новизна состоит в разработке технологий добычи данных путем решения не одной, а ряда таких задач.
Итак, статистические пакеты – интеллектуальные инструменты, необходимые широким кругам научных работников, инженеров, менеджеров. Однако распространенные в настоящее время статистические программные продукты отстают от современного уровня научных исследований примерно на 30 лет. Весьма актуальна задача разработки статистических пакетов нового поколения, соответствующих современному научному уровню и одновременно обеспечивающих удобства пользователей, достигнутые в популярных ныне пакетах. Эта задача должна решаться одновременно с созданием систем обучения, сопровождения и внедрения пакетов нового поколения, в частности, в соответствии с технологиями типа «Шесть сигм» [32].
Подчеркнем, что прикладная статистика является общенаучной дисциплиной. В США статистиков больше, чем математиков [31]. Этот перекос необходимо исправлять. У прикладной статистики должен быть такой же статус и такая же инфраструктура, как у математики. В частности, система научно-исследовательских институтов, статистические факультеты в ведущих вузах, отделение в составе РАН, и т.д., и т.п.
Должна быть организована подготовка студентов всех специальностей по современным методам прикладной статистики и смежным дисциплинам, а также переподготовка специалистов. Важно от старой парадигмы 1950-х годов, распространенный при обучении теории вероятностей и математической статистики, перейти к новой парадигме, выраженной, например, в учебниках [1, 17, 19, 27, 29, 30, 33]. Новая парадигма основана, в частности, на непараметрической и нечисловой статистике, а старая – на нереалистических предположениях о возможности применения семейств параметрических распределений данных (результатов измерений, наблюдений, испытаний, анализов, опытов) в инженерных, управленческих, экономических, медицинских и других практических задачах, встающих перед научными и практическими работниками, поэтому для модернизации народного хозяйства и эффективного внедрения инноваций необходимо сменить парадигму анализа данных – от представлений середины ХХ в. перейти к современным.
Работа выполнена при финансовой поддержке Министерства образования и науки РФ в рамках Постановления Правительства РФ № 218.

Литература

1. Орлов А.И. Прикладная статистика. - М.: Экзамен, 2006. - 671 с.
2. Крамер Г. Математические методы статистики. - М.: Мир, 1975. - 648 с.
3. Смирнов Н.В., Дунин-Барковский И.В. Курс теории вероятностей и математической статистики для технических приложений. Изд. 3-е, стереотипн. – М.: Наука, 1969. – 512 с.
4. Большев Л.Н., Смирнов Н.В. Таблицы математической статистики / 3-е изд.- М.: Наука, 1983. - 416 с.
5. Каган А.М., Линник Ю.В., Рао С.Р. Характеризационные задачи математической статистики. - М.: Наука, 1972. - 656 с.
6. Современные проблемы кибернетики (прикладная статистика). - М.: Знание, 1981. – 64 с.
7. Орлов А.И. О перестройке статистической науки и её применений // Вестник статистики. 1990. №1. С.65 – 71.
8. Орлов А.И. Создана единая статистическая ассоциация // Вестник Академии наук СССР. 1991. №7. С.152-153.
9. Шмерлинг Д.С. Журналы по теории вероятностей , математической статистике и их применениям / Вероятность и математическая статистика: Энциклопедия / Гл. ред. Ю.В. Прохоров. – М.: Большая Российская энциклопедия, 1999. – С.893-910.
10. The teaching of statistics / Studies in mathematics education. Vol.7. - Paris, UNESCO, 1989. - 258 pp.
11. Орлов А.И. Высокие статистические технологии // Заводская лаборатория. 2003. Т.69. № 11. С.55-60.
12. Орлов А.И. Тридцать лет статистики объектов нечисловой природы (обзор) // Заводская лаборатория. Диагностика материалов. 2009. Т.75. № 5. С.55-64.
13. Горский В.Г., Орлов А.И. Математические методы исследования: итоги и перспективы // Заводская лаборатория. 2002. Т.68. № 1. С.108-112.
14. Орлов А.И. Устойчивые математические методы и модели // Заводская лаборатория. Диагностика материалов. 2010. Т.76. № 3. С.59-67.
15. Новиков А.М., Новиков Д.А. Методология. – М.: СИНТЕГ, 2007. – 668 с.
16. Орлов А.И. О развитии методологии статистических методов // Статистические методы оценивания и проверки гипотез. Межвузовский сборник научных трудов. – Пермь: Изд-во Пермского государственного университета, 2001. – С.118-131.
17. Орлов А.И. Организационно-экономическое моделирование: учебник : в 3 ч. Часть 1: Нечисловая статистика. – М.: Изд-во МГТУ им. Н.Э. Баумана. – 2009. – 541 с.
18. Орлов А.И. О развитии экспертных технологий в нашей стране // Заводская лаборатория. Диагностика материалов. 2010. Т.76. № 11. С.64-70.
19. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч.2. Экспертные оценки. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2011. - 486 с.
20. Орлов А.И. О развитии математических методов теории классификации // Заводская лаборатория. Диагностика материалов. 2009. Т.75. № 7. С.51-63.
21. Орлов А.И. Сертификация и статистические методы (обобщающая статья) // Заводская лаборатория. 1997. Т.63. № 3. С. 55-62.
22. Орлов А.И. Внедрение современных статистических методов с помощью персональных компьютеров // Качество и надежность изделий. № 5(21). - М.: Знание, 1992, с.51-78.
23. Орлов А.И. Математическое обеспечение сертификации: сравнительный анализ диалоговых систем по статистическому контролю // Заводская лаборатория. 1996. Т.62. № 7. С.46-49.
24. Орлов А.И. О проверке однородности двух независимых выборок // Заводская лаборатория. 2003. Т.69. № 1. С.55-60.
25. Орлов А.И. Распространенная ошибка при использовании критериев Колмогорова и омега-квадрат // Заводская лаборатория. 1985. Т.51. № 1. С.60-62.
26. Орлов А.И. Какие гипотезы можно проверять с помощью двухвыборочного критерия Вилкоксона? // Заводская лаборатория. 1999. Т.65. № 1. С.51-55.
27. Орлов А.И. Эконометрика. Изд. 4-е. – Ростов-на-Дону: Феникс, 2009. - 572 с.
28. Орлов А.И. О современных проблемах внедрения прикладной статистики и других статистических методов // Заводская лаборатория. 1992. Т.58. № 1. С.67-74.
29. Орлов А.И. Теория принятия решений. – М.: Экзамен, 2006. – 576 с.
30. Орлов А.И. Организационно-экономическое моделирование: теория принятия решений. — М. : КноРус, 2011. — 568 с.
31. Налимов В.В. О преподавании математики экспериментаторам // О преподавании математической статистики экспериментаторам. Препринт Межфакультетской лаборатории статистических методов №17. – М.: Изд-во МГУ им. М.В. Ломоносова, 1971. – С.5-39.
32. Орлов А.И. «Шесть сигм» - новая система внедрения математических методов исследования // Заводская лаборатория. Диагностика материалов. 2006. Т.72. №5. С. 50-53.
33. Орлов А.И. Организационно-экономическое моделирование : учебник : в 3 ч. Ч.3. Статистические методы анализа данных. - М.: Изд-во МГТУ им. Н.Э. Баумана, 2012. - 624 с.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вт авг 28, 2012 10:54 am 
Не в сети

Зарегистрирован: Вт авг 28, 2012 10:12 am
Сообщений: 13
Все это хорошо, может быть, даже замечательно. Но непараметрические критерии маломощны. Для практики, для исследователей особенно в области биологии параметрические критерии сохраняют свою значимость и будут сохранять еще долго.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вт авг 28, 2012 12:47 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
Неверно. Непараметрические критерии не менее мощны, чем параметрические. Параметрические методы, в том числе критерий Стьюдента, применяют только те, кто не знаком с современной прикладной статистикой.
Читайте учебник "Прикладная статистика" http://ibm.bmstu.ru/nil/biblio.html#books-09-prikstat


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вт авг 28, 2012 1:45 pm 
Не в сети

Зарегистрирован: Вт авг 28, 2012 10:12 am
Сообщений: 13
Проф.А.И.Орлов писал(а):
Неверно. Непараметрические критерии не менее мощны, чем параметрические. Параметрические методы, в том числе критерий Стьюдента, применяют только те, кто не знаком с современной прикладной статистикой.
Читайте учебник "Прикладная статистика" http://ibm.bmstu.ru/nil/biblio.html#books-09-prikstat

Применяют критерий Стьюдента все. Только грамотно. Есть приближенные решения проблемы Беренса-Фишера. Вы почему-то об этом умалчиваете. Если вы ученик Большева, то вам знакома фамилия Пагурова.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вт авг 28, 2012 1:48 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
Математик Пагурова (ВМК МГУ) занималась распределением статистики Стьюдента для нормальных распределений с разными дисперсиями.
Такие работы не нужны, поскольку нет на свете нормальных распределений.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вт авг 28, 2012 3:26 pm 
Не в сети

Зарегистрирован: Вт авг 28, 2012 10:12 am
Сообщений: 13
Проф.А.И.Орлов писал(а):
Математик Пагурова (ВМК МГУ) занималась распределением статистики Стьюдента для нормальных распределений с разными дисперсиями.
Такие работы не нужны, поскольку нет на свете нормальных распределений.

На свете нет вообще никаких распределений. Модель приближенно отображает реальность. Кто изучал, насколько отклонения от нормальной модели искажают выводы? Кто конкретно? Особенно в биологии и медицине.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вт авг 28, 2012 4:27 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
Читайте учебник "Прикладная статистика" http://ibm.bmstu.ru/nil/biblio.html#books-09-prikstat


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Пт ноя 16, 2012 7:15 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
Публикация:
781. Орлов А.И. Новая парадигма математической статистики // Материалы республиканской научно-практической конференции «Статистика и её применения – 2012». Под редакцией профессора А.А. Абдушукурова. – Ташкент: НУУз, 2012. – С.21-36.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Вс авг 25, 2013 11:43 am 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
Еще одна публикация:
817. Орлов А.И. Основные черты новой парадигмы математической статистики / А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2013. – №06(090). С.188-214. – IDA [article ID]: 0901306013. – Режим доступа: http://ej.kubagro.ru/2013/06/pdf/13.pdf, 1,688 у.п.л., импакт-фактор РИНЦ=0,581.


Вернуться наверх
 Профиль  
 
 Заголовок сообщения: Re: Новая парадигма математической статистики
СообщениеДобавлено: Ср май 04, 2016 2:05 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 11255
Публикации о новой парадигме

1. Орлов А.И. Новая парадигма разработки и преподавания организационно-экономического моделирования, эконометрики и статистики в техническом университете // Статистика и прикладные исследования: сборник трудов Всерос. научн. конф. – Краснодар: Издательство КубГАУ, 2011. – С.131-144.
2. Орлов А.И. Новая парадигма прикладной статистики // Статистика и прикладные исследования: сборник трудов Всерос. научн. конф. – Краснодар: Издательство КубГАУ, 2011. – С.206-217.
3. Орлов А.И. Новая парадигма прикладной статистики // Заводская лаборатория. Диагностика материалов. 2012. Т. 78. №1, часть I. С.87-93.
4. Орлов А.И. Организационно-экономическое моделирование, эконометрика и статистика в техническом университете // Вестник МГТУ им. Н.Э. Баумана. Сер. «Естественные науки». 2012. №1. С. 106-118.
5. Орлов А.И. Новая парадигма математической статистики // Материалы республиканской научно-практической конференции «Статистика и её применения – 2012». Под редакцией профессора А.А. Абдушукурова. – Ташкент: НУУз, 2012. – С.21-36.
6. Орлов А.И. Новая парадигма организационно-экономического моделирования, эконометрики и статистики // Вторые Чарновские Чтения. Сборник тезисов. Материалы II международной научной конференции по организации производства. Москва, 7 – 8 декабря 2012 г. – М.: НП «Объединение контроллеров», 2012. – С. 116-120.
7. Орлов А.И. Новая парадигма математических методов экономики // Экономический анализ: теория и практика. – 2013. – № 36 (339). – С.25–30.
8. Орлов А.И. Организационно-экономическое моделирование, эконометрика и статистика при решении задач экономики и организации производства // Инженерный журнал: наука и инновации, 2014, вып. 1. URL: http://engjournal.ru/catalog/indust/hidden/1198.html
9. Орлов А.И. Новая парадигма анализа статистических и экспертных данных в задачах экономики и управления / А.И. Орлов // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета (Научный журнал КубГАУ) [Электронный ресурс]. – Краснодар: КубГАУ, 2014. – №04(098). С. 105 – 125. – IDA [article ID]: 0981404008. – Режим доступа: http://ej.kubagro.ru/2014/04/pdf/08.pdf , 1,312 у.п.л., импакт-фактор РИНЦ=0,346
10. Орлов А.И. Новая парадигма анализа статистических и экспертных данных в задачах управления // Труды X Международной конференции «Идентификация систем и задачи управления» SICPRO '15. Москва, 26-29 января 2015 г. М.: Институт проблем управления им. В.А. Трапезникова, 2015. 1484 с. [Электронный ресурс]. - Электронные текстовые дан. (121 файл, 68,5 Мб). - М.: ИРУ РАН, 2015. - 1 электронно-оптический диск (CD-ROM). - Системные требования: Pentium 4. Acrobat PReader 6.0 и выше. - Загл. с экрана. - ISBN 978-5-91450-162-1. - С.34 - 42.
11. Орлов А.И. Новая парадигма математических методов исследования // Заводская лаборатория. Диагностика материалов. 2015. Т.81. №.7 С. 5-5.
12. Орлов А.И. Основные черты новой парадигмы математической статистики // Политематический сетевой электронный научный журнал Кубанского государственного аграрного университета. 2013. № 90. С. 45-71.


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ Сообщений: 10 ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 21


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB