Подходы к вероятностной системе знания

Зачитано в качестве сообщения на научно-методической конференции "Современное образование: технические университеты в модернизации экономики России", 27 января 2011 года, Томск, ТУСУР, и опубликовано в материалах конференции.

Технологии организации обратной связи между предприятиями и университетами, готовящими специалистов для этих предприятий, дают слабый эффект по причине того, что проблема лежит глубже. Реальная проблема заключается в рассогласовании языков, применяемых для описания одних и тех же предметных областей предприятиями и университетами. Более того, аналогичная проблема проявляется и внутри предприятий – между техническими специалистами, менеджерами и кадровиками. Для активно развивающихся областей проблема только усугубляется рассогласованностью терминологий различных источников. Предлагается системное решение данной проблемы, представляющее собой интернет-сервис, содержащий в своём составе постоянно изменяющуюся базу вероятностно связанных сущностей предметных областей.

1. Проблематика

Вследствие технического прогресса, очевидно сужение специализаций в самых различных отраслях. До недавних пор ситуация, когда точно понять, в чём специализируется конкретный человек, могли только те, кто специализируются в той же, либо сопредельных областях, была свойственна только отдельным теоретическим дисциплинам. Но в последнее время, в связи с усложнением прикладных областей – например, информационных технологий, - этот случай стал типичным для многих направлений деятельности и знания.

В частности, достаточно острой является данная проблема в различных инженерных областях. По ходу выполнения различных проектов, участвовавшие в них специалисты приобретают массу знаний, навыков и бесценного опыта. И хотя сам специалист, как правило, ещё может объяснить области своей специализации, то чтобы понять это объяснение, чаще всего, нужно быть специалистом в одной из сопредельных областей. Например, человек, не являющийся специалистом в какой-либо области информационных технологиях, как правило, не улавливает даже разницы ни между программистом и инженером по программному обеспечению, ни между программистом и системным администратором – а в действительности имеет место структуризация даже намного более детальная. Таким образом, получается, что опыт специалиста в существующей системе описания знания, может быть описан только в очень обобщённом виде, а, в очень значительной части, не может быть описан и систематизирован вообще.

Потому, с одной стороны, индивидуальные знания и навыки с трудом поддаются учёту и передаче, и очень редко могут быть повторно использованы. С другой же стороны, очень часто проблемы производства решаются крайне неудачными способами по той причине, что не удаётся найти человека, успешно решавшего сходные задачи. С третьей стороны, образовательные программы остаются плохо согласуемыми с потребностями реальной индустрии даже в редких случаях организации систем обратной связи «производство - университет». То есть, на практике, имеет место ситуация, когда технические специалисты, организаторы производства, кадровики и преподаватели говорят на разных языках. Данная проблема имеет место даже до того, как к делу подключаются специалисты по маркетингу, которые вводят новые сущности совершенно произвольно, чем ещё больше запутывают ситуацию. Примеров на данные тему автор видел огромное количество – вместе с тем, что попытки системного решения данной проблемы, если и делались[1][2], то не получили широкого распространения, поскольку проблема, как таковая, системно не рефлексируется.

И, как отдельную проблему – имеющую, правда, гораздо меньший вес, но также осознаваемую плохо, - можно рассмотреть проблему разночтения терминологий в активно развивающихся прикладных областях. Если опытный специалист ещё может разобраться в том, что термин А, применённый одним автором, является в большинстве случаев синонимом термина B, применённого другим автором, но с учётом некоторых нюансов, то у студента, один преподаватель которого применяет термин A, а другой – термин B, возникает явный когнитивный диссонанс. И ещё хорошо, если при попытке как-то его разрешить, студент не сделает вывода, что «никто ничего вообще не знает». Кроме того, проблема разночтения терминов дополнительно усиливает проблему разрыва в понимании , о которой было сказано выше.

В ходе разработки подходов к динамической системе образования [3] возникло ощущение, что используя последние достижения информационных и социальных технологий, можно попытаться комплексно и системно решить проблему различия языков, описывающих предметные области, а заодно, частично, решить проблему разночтения в терминологиях.

2. Идея

Идея возможного решения заключается в создании сетевой модели связанных между собой понятий, утверждений, фактов какой-либо предметной области, в которой каждая связь имеет, помимо типа отношения (синоним, обобщение, ассоциация, и так далее), свою вероятность. В системе, если рассматривать её в целом, должно быть учтено максимально возможное количество сущностей и отношений между ними, используемых в рамках предметных областей. Вообще, количество необходимых сущностей описания отдельной предметной области в системе будет определяться характером решаемых на каждый конкретный момент задач, речь о которых пойдёт ниже. Но, поскольку предлагаемая структура данных изначально предполагается динамической, список сущностей в процессе эксплуатации системы будет постоянно пополняться. В систему обязательно должны включаться альтернативные модели представлений. То есть, например, возникновение нового определения какого-либо понятия, не совпадающего с уже заданным, или возникновение альтернативной классификации какого-либо раздела, не отменяют, и не просто дополняют старые версии, но понижают вероятность их достоверности. Со временем, и с возникновением новых фактов (которые также могут включаться в систему), вероятности (достоверности) могут изменяться.

Комплексно вся эта система названа «вероятностной системой знания» (наверное, правильнее было бы «достоверностной», но это звучит по-русски гораздо хуже – в принципе, вероятность в данном случае эквивалентна достоверности). По ходу развития описательной части системы, она сможет охватывать всё новые предметные области – либо постепенно интегрировать ранее очерченные, – если предположить, что создание системы начнётся сразу с нескольких областей знания.

3. Реализация

Безусловно, система должна представлять собой программную оболочку, хранящую данные и обеспечивающую взаимодействие пользователей с системой. Очевидно, что если созданием модели знания будет заниматься один-два-три человека, система будет иметь совершенно субъективный характер, и не решит поставленных проблем.

К счастью, современные технологии предоставляют нам отличный инструмент для наполнения данными такой системы, и он же - источник энергии[4][5] для функционирования содержательной части системы на протяжении длительного времени – профессиональные социальные сети[6]. Впрочем, если полностью основываться на демократических методах, то результат, скорее всего, будет ещё хуже[7], чем если бы он был субъективен.

Скорее всего, на начальном этапе потребуется сформировать некий экспертный совет в каждой из предметных областей проекта, который сможет верифицировать и дополнить первоначальную структуру. Также, возможно, этот совет сможет дать рекомендации другим пользователям (как положительные, так и отрицательные) в плане их наделения полномочиями (меньшими, чем у первоначального экспертного совета) по модификации вероятностей в системе. Специалисты, рекомендованные экспертами, смогут сделать тоже самое, но уже с меньшими индексами достоверности, и так далее. Через некоторое время можно будет рассмотреть вопрос о возможности как-то минимально влиять на вероятности и не рекомендованным пользователям.

Таким образом, хотя запуск системы и потребует значительных ресурсов, в дальнейшем можно рассчитывать на выход системы на частичную самогенерацию. Вместе с тем, о полном отказе от модерации, как представляется, речь идти не может – по крайней мере, на обозримых этапах развития системы.

4. Калибровка

С наполнением системы описанием какой-либо одной, пилотной, предметной области, лицами, модерирующими систему, должна быть проведена калибровка с целью выяснения оптимальных параметров соотношения влияния на достоверность специалистами различного уровня. Логично предположить, что на достаточно раннем этапе развития (но не изначально!), во-первых, будет проведена стратификация первоначального экспертного совета по отдельным разделам детализованной предметной области. Соответственно, будет определено соотношение достоверностей влияния эксперта какой-либо области на сопредельные области – причём, данные величины тоже будут предметом экспертной оценки.

Во-вторых, на некотором этапе развития, неизбежно возникновение обратной связи – то есть, уже оценка тех или иных достоверностей экспертом, возможно, будет влиять на «компетентность» эксперта.

По мере развития системы, «калибрующие» вмешательства должны продолжаться, однако с течением времени их величина, очевидно, должна минимизироваться. Кроме того, «сильные» калибрующие действия должны будут производиться по мере подключения к системе всё новых отраслей знания.

5. Применение

Данная система изначально ориентируется на использование в рамках парадигмы сервисно-ориентированных архитектур[8] – то есть, будет обеспечиваться возможность интеграции системы в различные корпоративные программы в качестве справочника и классификатора предметной области, ну и, возможно, для выполнения каких-либо других функций, например, сервисных или обучающих. В частности, очевидно необходимой является связь подобной системы знания с системой управления проектами предприятия, системой управления кадрами предприятия или кадрового агентства, системой управления учебными курсами в учебном заведении или на предприятии.

При внедрении таких связок в рамках одного предприятия, помимо интеграции по справочникам (что само по себе серьёзная задача), мы получим с помощью такой системы, универсальный общий язык понятий в рамках предметной области для специалистов, управленцев и кадровиков, и эффективный инструмент управления, во-первых, распределением кадров по задачам с учётом знаний, навыков и квалификаций, и, во-вторых, требованиями к профессиональной до- и пере-подготовке специалистов.

Если мы сможем внедрить (для начала - в рамках предприятия) практику регулярного обновления списка компетенций специалистов в рамках подобной системы знаний, мы автоматически подключим к интегрированной системе предприятия и непосредственно специалистов. Скорее всего, по завершении каждого проекта будет требоваться коррекция специалистом списка знаний и навыков, которыми он обладает – что даст, помимо прочего, возможность учёта уникального опыта.

Если мы сможем подключить к подобной системе университет (то есть, связать предлагаемые учебные курсы с нашей системой знания – что, несомненно, задача трудоёмкая, но выполнимая), мы получим достаточно простое в использовании средство обратной связи «предприятие - университет», априорно лишённое проблемы различных языков. Что интересно, каким-то образом данное связывание может быть сопоставлено с опроцентовкой по разделам дисциплин, предусмотренное новыми стандартами образования – только в нашем случае, картина будет более «объёмной». Очевидно, что на достаточно раннем этапе возможность влиять на достоверность этих связей должна быть дана и студентам, прошедшим обучение.

Если мы сможем подключить к данной системе кадровые агентства (то есть, внедрить систему классификации вакансий и резюме – для тех специалистов, которые не классифицировались раньше), то мы получим очень сильно расширенные возможности как для поиска вакансий, так и для поиска специалистов. Поскольку система знания связанная, в неё окажутся включены (причём – вероятностно!) и связанные навыки, которые напрямую не указал в резюме соискатель, и возможности учёта детализированных квалификаций.

Наконец, если мы подключим к такой системе программные среды нескольких предприятий, мы, при желании, сможем получить инструмент для экспертизы возможностей контрагента выполнить ту или иную задачу. А как минимум – возможность сотрудничества и координации усилий в случае возникновения задач, требующих проведения исследований, а также априорную синхронизацию системы координат в рамках предметных областей.

6. Безумные идеи

К разряду безумных может быть отнесено предположение, что при достаточной «мощности» по количеству понятий и связей, при должном уровне калибровки и при разделении характера отношений, система может быть уподоблена нейронной сети, и использована в качестве экспертной систему, для получения некоторого нового знания, и тому подобное. Данная тема в данный момент прорабатывается, и, по видимому, должна являться темой отдельной статьи.

Разработка программной оболочки, а также организационной модели системы, в настоящее время ведётся в порядке частной инициативы автора.

7. Литература

1. Stanford ontology editor and knowledge-base framework. http://protege.stanford.edu/

2. Лапшин В.А. «Онтологии в компьютерных системах». М.: Научный мир, 2010.

3. Долматов А.В. «Подходы к созданию динамической системы образования» . http://dolmatoff.net/?mode=general&page=dynamic

4. Боровиков С., Переслегин С., Переслегина Е. «Социосистема как "тепловая машина"»

5. Ильин В.Н. «Термодинамика и социология: Физические основы социальных процессов и явлений». 2010. ISBN 978-5-484-01098-1

6. Свечкарев В.П. «Модели и механизмы взаимосвязи и взаимодействия участников высокотехнологичных инноваций: от проектного управления к многоагентному сообществу» http://ivdon.ru/magazine/archive/n1y2009/116/

7. Парадокс Эрроу http://dame.mipt.ru/books/publ/erroy.html

8. Сервисно-ориентированная архитектура http://dic.academic.ru/dic.nsf/ruwiki/90411


Пока нет комментариев


имя e-mail

Комментарии публикуются после предварительного просмотра