Высокие статистические технологии

Форум сайта семьи Орловых

Текущее время: Пт сен 22, 2017 4:37 pm

Часовой пояс: UTC + 3 часа




Начать новую тему Ответить на тему  [ 1 сообщение ] 
Автор Сообщение
 Заголовок сообщения: Зачем нужны общественные базы знаний именно в России
СообщениеДобавлено: Пт авг 26, 2016 12:25 pm 
Не в сети

Зарегистрирован: Вт сен 28, 2004 11:58 am
Сообщений: 7215
Зачем нужны общественные базы знаний именно в России

17.08.2016 г.

Я начинаю, в рамках тематики своей лаборатории в Институте Проблем управления им. В. А. Трапезникова Академии Наук, разработку концепции общественных баз знаний. Вместе с соавтором из Института прикладной математики им. М. В. Келдыша уже подал доклад на международную конференцию "Управление крупномасштабными системами", которая проводится ежегодно под эгидой моего института, ИПУ РАН. internet.jpg

Пересказывать доклад не стану, потому что вижу, что уже сейчас он устарел, а я сам многого еще не знал, когда писал его. Я активно изучаю современную литературу по соответствующим информационным технологиям (Knowledge engineering, Digital libraries, Semantic libraries, Semantic Web), и работаю над тем, как именно их надо наиболее правильно применить именно в России, конкретно для наших задач восстановления российской государственности после попадания в исторический тупик в результате ошибочного выбора 1991 года.

Что такое общественные базы знаний, зачем они нам нужны, какие возможности для их создания предоставляют современные информационные технологии. Я сейчас вижу два главных направления, которые считаю наиболее важными именно для России. Но сначала, в двух cловах, о какой технологической платформе идет речь. Начать надо с понятия Semantic Web.

Вы знаете, что такое обычный Web? 99% пользователей мировой паутины ошибочно отождествляют его с Интернетом. Это неверно. Паутина - гигантское, но все же только подмножество Интернета. Интернет - это любой комп, в который воткнут сетевой шнурок, и которому присвоен сетевой адрес по протоколу TCP \ IP. Это тоже, кстати, не единственный сетевой протокол. И в Советском Союзе тоже шли к "интернету" - аналог TCP \ IP появился в ИАЭ им. Курчатова в 1984 году. Действующий TCP \ IP был стандартизован уже в 1981 г. Сетевых протоколов в мире много, просто у остальных очень небольшие рыночные и технические ниши.

А вот Паутина - это компы, которые выдают "контент" по протоколу передачи гипертекста - HTTP. Т.е. машины, на которых стоит HTTP - сервер. Apache, например. Это протокол уровня приложений, он на самом деле сидит НАД Интернетом. В народе, по-простому мы называем такие машины "сайтами". Поверх HTTP сидит язык разметки страниц HTML. Его придумал в конце 80-х великий Тим Бернерс-Ли, сотрудник ЦЕРН-а, в целях создания инструмента аннотирования научных препринтов в цифровой библиотеке ЦЕРН-а. Вскоре оказалось, этот язык разметки блестяще подходит для создания "сайтов".

Где-то в 1969 году Артур Кларк предсказывал, среди прочего, появления к 2000 г всемирной электронной библиотеки. Можно было бы сказать, что он угадал, если бы реальность не оказалась "более другой" и более примитивной. Паутина - это не всемирная библиотека, а всемирная свалка. Если кто помнит: "существование Интернета, бесспорно, спорно без порно". Решая задачу, как рыскать на этой свалке, поднялся Великий Гугл. Технологии поиска по ключевым словам оказались страшно трудоемкими, дорогостоящими и неэффективными. Гугл перестал раскрывать информацию о числе машин, отрабатывающих в параллель поисковые запросы со всего мира, около 10 лет назад, когда это число превысило 20 тыс. Неэффективны результаты поиска: все знают, что в реальности актуальна только первая страница, которую вывалит Гугл, но для чего-то поисковый сервер отрабатывает и выдает все остальные "20 тысяч". Все упирается в то, что алгоритмы Гугла ориентируются - и не могли не ориентироваться, - на популярность материалов. А это весьма и весьма косвенный показатель РЕЛЕВАНТНОСТИ результатов поиска сделанному запросу.

И тогда снова появился Тим Бернерс-Ли. В 1999 г он написал в Scientific American статью, в которой признал, что получилась, в общем, фигня, но положение можно исправить. Главное - не получилось создать организованную библиотеку. А нужна ведь именно библиотека, а не свалка мусора. А где библиотека, там по крайней мере, есть ТЕМАТИЧЕСКИЙ КАТАЛОГ. На призыв Бернерс-Ли сообщество разработчиков, в принципе, откликнулось. Термин Semantic Web сейчас понимают не как замену обычной Паутине, а как очередную надстройку над ним, в частности - в виде дополнительной "интеллектуальной" разметки.

У них там на Западе" разработки в области Semantic Web ориентированы в основном на коммерцию: приложения B2C (business to consumer) и B2B (business to business). Дополнительная ("семантическая") разметка позволит осуществлять не только более осмысленный поиск самими пользователями Паутины, но и облегчить работу поисковым роботам. Я же хочу предложить использование этого пучка технологий для задач именно наших, русских. Для задач развития гражданского общества и народовластия.

ПЕРВОЙ такой задачей я вижу создание общественной базы знаний по социально-экономической истории. России, но вообще говоря, затем можно будет говорить и о всемирной истории. Смотрите, какая штука. До сих пор российийское общество расколото по отношению к советскому периоду истории и Октябрю 1917 г. Я рассматриваю это как твердый эмприрический факт. Сам по себе этот факт, по моему убеждению, не смертелен. Но проблема в том, что антисоветчики продолжают, как и 25 -30 лет, начиная с "Перестройки", не моргнув глазом, втюхивать в дискуссиях откровенно протухшее и никакими проверенными фактами не подтвержденное дерьмо (pardon my French...) вроде "затопленных барж с офицерами" и "нефтяных сверхдоходах при Брежневе". "Демократы" (они же "либералы"), монархисты присвоили себе монопольное право на цитирование ФАКТОВ. Какая уж тут интерпретация - до нее еще добраться надо, разгребая авгиевы конюшни антисоветчины. Дальше всех в этом монополизме продвинулись те, кто раньше захватил информационные каналы - то же "Эхо".

Обществу нужна нормальная система хранения и доступа для ВЕРИФИЦИРОВАННОЙ информации по нашей социально - экономической истории. Такая система возможна только на основе открытого рецензирования и принципиального не-удаления НИКАКИХ сообщений. Чего В ПРИНЦИПЕ нет, скажем, в Википедии. Там в чистом виде работает подковерная политика - кто захватил группы общественного модерирования по данной тематике, тот может самовольно удалять неугодные тексты и данные. Нужен процесс открытой СЕТЕВОЙ ЭКСПЕРТИЗЫ, один мой хороший знакомый работает над этой концепцией. По мере опубликования всевозможных статей я буду немедленно оповещать об этом российское общество.

Система должна, как я глубоко убежден, ориентироваться на архивирование именно исторической информации и не касаться актуальной. Актуальная информация неизбежно затянет в актуальную же политику со всеми нехорошими последствиями. Но 90-е и нулевые года - это УЖЕ история, и этого вполне достаточно, чтобы политики и так было выше крыши. Важно только, чтобы все доклады, статьи, исследования были хорошо верифицированы в процессе той ОТКРЫТОЙ общественной сетевой экспертизы. Сам факт открытости ЛЮБОГО КУСКА ЛЮБОГО ТЕКСТА для ЛЮБОЙ критики есть наилучшая защита от политиканства. Политика - да, противостояние идеологических группировок - да, но никакого «мошенства». Вся перестроечная пропаганда со всеми этими "Новыми мирами" и "Огоньками" была основана на откровенном вранье. Больше такого мы не допустим.

Допускается использование только уже открытой и опубликованной информации. Система должна быть общественной и РАСПРЕДЕЛЕННОЙ. Возможно, понадобится разработка протокола взаимодействия с серверами по типу BitTorrent. Все это можно обсуждать, сейчас речь будет идти о КОНЦЕПЦИИ. Ну, давайте с социально - экономической историей пока закончим. Есть еще одна фундаментальная проблема у страны.

ВТОРАЯ проблема многократно тяжелее первой. Вот товарищи левые уже много лет обсуждают какой должна быть "правильная" плановая экономика (в противовес или развитие той, что была в СССР - см., например, последний ролик Лекса Кравецкого https://www.youtube.com/watch?v=PF-NzNXPgP4). Товарищи упускают следующее. Прежде чем понять, КАК производить что бы то ни было, нужно - на уровне всего общества, я подчеркиваю, - понять, ЧТО производить, это принципиальный социальный выбор поважнее дилеммы из фантиков "социализм - капитализм".

Дело вот в чем. У России есть опыт модернизации - начиная со сталинских пятлеток. В результате этой модернизации в России впервые в ее истории, в индустриальный период, была создана прибыльная экономика. До советской власти индустриализация проводилась за счет внешних кредитов, которые царская экономика вернуть кредиторам не могла. После советской власти все держится на экспорте советской нефти. РФ не сделала ничего для создания добывающей промышленности, а для СССР вся нефтянка означала только ЗАТРАТЫ, поскольку окупаемость наших месторождений, по соврменным оценкам - не менее 20 лет. Чистый доход от брежневских инвестиций в создание добывающей отрасли и развитие восточных территорий (а это более 500 новых городов в стране за 25 лет) Россия стала получать только в нулевых, при Путине. Это строгие эконометрические данные (http://forum-msk.org/material/economic/10478349.html), полученные не за один век. Только Сталин создал в стране рентабельную экономику. Успех? Успех. Но можем ли мы повторить этот опыт.

Я утверждаю, что - разумеется, нет. СССР был в 2 раза больше РФ, по населению. РФ гнила 25 лет, уничтожала науку, образование, машиностроение. Мир за это время ушел очень далеко в технологическом смысле. Повторить опыт Сталина означало бы тотальное импотрозамещение. В лучшие свои годы этого не было даже в СССР. В конце 80-х импортного оборудования было у нас 20% (половина - из СЭВ). Но в целом, да - СССР был весьма близок к автаркии. В науке это означало 85%. Ровно такая доля от ВООБЩЕ ВСЕХ научных тематик, существовавших в мире, было представлено в СССР.

Сейчас положение качественно иное. Глобализацию надо воспринимать как объективную реальность. И зависимость России от этой глобализации тоже. Это, повторяю - свершившийся факт, нравится нам он или нет. А это значит, что при любой экономике - хоть плановой, хоть рыночной - стране нужна НЕВЕРОЯТНО хитроумная и продуманная промышленная и научная политика. Попросту - надо понимать, что можно ипортозаместить, а что невозможно или неразумно. А то что надо завозить - надо тоже завозить по-умному, а не как попало. Надо понимать. откуда лучше завозить. Нужна огромная база знаний по современным технологиям, этакая технологическая карта мира, и это тоже должна быть ОБЩЕСТВЕННАЯ информационная система, чтобы ей могли пользоваться и ученые, и конструкторы, и бизнес, и правительственные органы.

В 1928 - 1934 гг в СССР была издана "Техническая энциклопедия" в 26 томах, каждый по 600-800 страниц, под редакцией профессора Мартенса. Вот что делает нация, собравшаяся делать Большой Скачок. Я хочу сказать, что сейчас нужно нечто подобное, НО сейчас нужно нечто гораздо более хитрое. Тогда это была просто Энциклопедия. Поскольку задача была поставлена просто - техническая самодостаточность, независимость, автаркия - то в Энциклопедии были сведения только принципиального характера. То есть - как работает, скажем, доменная печь, или дизельный двигатель, или химический реактор. В ПРИНЦИПЕ. Мы все это построим ТУТ, у нас, в СССР. Инженерам нужны принципиальные сведения, а не кто в мире это производит. Сейчас все в принципе не так. Сейчас бизнесу и правительству нужен ИНСТРУМЕНТ ДЛЯ АНАЛИЗА, который дает не только принципиальную, но технико-экономическую информацию. Надо знать, кто, где и что В МИРЕ производит, и СВЯЗЬ одной конкретной технологии с остальными.

Искренне полагаю, что если в России удастся создать такие системы, то это будет новейшее слово как в области практический демократии и гражданского общества, так и области "экономики знаний", о которой так много говорят на Западе. Именно мы, из своей навсегда отставшей северной берлоги, можем создать самую современную платформу такой экономики знаний. На общественных, повторяю, началах, при минимальном правительственном финансировании. Открытого софта в мире более чем достаточно, надо только с умом его заточить. Но для начала нужно всем миром обговорить КОНЦЕПЦИЮ таких систем.


Куракин

Павел Вячеславович,

ведущий инженер ИПУ РАН



http://forum-msk.org/material/economic/12120950.html
http://www.za-nauku.ru/index.php?option ... &Itemid=39


Вернуться наверх
 Профиль  
 
Показать сообщения за:  Сортировать по:  
Начать новую тему Ответить на тему  [ 1 сообщение ] 

Часовой пояс: UTC + 3 часа


Кто сейчас на форуме

Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 1


Вы не можете начинать темы
Вы не можете отвечать на сообщения
Вы не можете редактировать свои сообщения
Вы не можете удалять свои сообщения
Вы не можете добавлять вложения

Найти:
Перейти:  
cron
Powered by phpBB © 2000, 2002, 2005, 2007 phpBB Group
Русская поддержка phpBB