4.2 Приобретение знаний в СОЗ. ч.1

В процессе приобретения знаний решаются две задачи - получение, т.е. извлечение знаний из источников и их систематизация (структуризация).
При извлечении знаний происходит взаимодействие с источником (источниками) знаний с целью получить необходимые для создания БЗ сведения - о ходе решения экспертом профессиональных задач, о приоритетах и учитываемых ограничениях, о фактах, событиях и взаимосвязях между ними и т.п.
В ходе структуризации происходит упорядочение и оформление полученных сведений, отбрасывается лишнее, выделяются уровни и классы полученной системы знаний, создаются наглядные документы, а также формулируются гипотезы о дальнейшем выборе способов представления знаний в БЗ.
Систематизация знаний выполняется в рамках одного из базовых подходов: структурного или объектно-ориентированного.


Эти подходы реализованы в так называемых методах структурного и объектно-ориентированного анализа. Они достаточно подробно изучаются в дисциплине «Проектирование информационных систем». Здесь же мы поговорим о методах извлечения знаний.


Задачи извлечения знаний для создания баз знаний относятся к числу наиболее важных и трудоемких в практике построения СОЗ. Существует даже специальное научно-практическое направление – инженерия знаний, в рамках которого разрабатываются и применяются методы практического извлечения знаний для СОЗ. Инженер по знаниям – специалист, который является обязательным участником процесса создания СОЗ (см. главу 2). Далее дадим краткий обзор основных методов извлечения знаний.


В зависимости от того, какие источники знаний используются, выделяют два больших класса методов извлечения знаний:
- коммуникативные;
- текстологические.
Первые предполагают коммуникации с экспертами, вторые – извлечение знаний из текстов (учебников, монографий. документов, методик и т.п.). Инженер по знаниям, как правило, комбинирует и те и другие. Очевидно, что общение с экспертом требует некоторой ориентации в данной предметной области, освоение инженером по знаниям специальных понятий и терминов, профессионального языка эксперта (хотя бы для того, чтобы эти два специалиста могли понимать друг друга). То есть, даже если основным источником знаний в данной области будет эксперт, инженер по знаниям должен ознакомиться со специальной литературой. В других случаях текстологические методы становятся необходимы и для более полного охвата проблемной области, детализации описания объектов и методов, возможно, дополнения знаний экспертов. Так, при построении модели предметной области на основе концепций фреймов, семантических сетей или ситуационного подхода, скорее всего, кроме знаний экспертов потребуются знания, изложенные в текстах (документация, нормативы, технологические схемы, методики, инструкции, учебники и т.п.). Не обойтись без анализа текстов и при построении КБЗ, где организуются большие объемы текстопредставимых знаний, устанавливаются взаимосвязи понятий, процессов и явлений проблемной области.


В [3] текстологические методы извлечения знаний делятся на следующие подклассы:
- анализ специальной литературы;
- анализ учебников;
- анализ методик.
Анализ учебников можно считать наиболее простым для понимания предметной области, поскольку учебная литература именно для этого и предназначена. Методики отличаются концентрированным изложением практически важных моментов, отсутствием теоретических пояснений, комментариев и предполагают для своего освоения наличие у человека определенных знаний в данной области. То же самое можно сказать и о специальной литературе, особенно о литературе научного плана, где могут излагаться авторские взгляды и результаты исследований. В то же время именно специальная литература, отражая практический опыт эксперта в своей области, может стать источником уникальных экспертных знаний для СОЗ.


Для практической работы с текстами в [3] предлагается следующий алгоритм действий:
1) составить базовый список литературы для ознакомления с предметной областью;
2) выбрать текст;
3) бегло ознакомиться с текстом. При появлении незнакомых терминов провести консультации со специалистами или обратиться к справочной литературе, словарям и т.п.;
4) сформировать первую гипотезу о макроструктуре текста;
5) внимательно прочитать текст, выписывая ключевые слова и выражения, выделяя тем самым «смысловые вехи» текста (компрессия текста);
6) определить связи между найденными ключевыми словами. Разработать макроструктуру текста в виде графа или реферата – сжатого текста;
7) сформировать новое представление знаний (поле знаний) на основании макроструктуры текста.
Таким образом, в результате этого алгоритма инженер по знаниям из анализируемого текста формирует собственное знание (поле знаний) предметной области. Документирование этого знания можно проводить с помощью различных графических нотаций, в том числе, с помощью семантических сетей, структурных схем, фреймов или различных видов диаграмм, используемых в современных методологиях структурного и объектно-ориентированного анализа (см, например, [16] ).

Арсенал коммуникативных методов, применяемых в инженерии знаний, достаточно широк и разнообразен. Прежде всего, эти методы делятся на такие подклассы, как [3]:
пассивные;
активные.
К числу пассивных относятся:
- наблюдение. При этом инженер по знаниям находится непосредственно рядом с экспертом при решении им профессиональных задач, записывает его действия (в том числе, возможна и видеозапись), реплики и пояснения. Используется наблюдение как за реальным процессом, так и за его имитацией. Во втором случае больше возможностей для пояснения действий экспертом, возможность остановиться на некотором этапе, вернуться назад и др.;
- протокол мыслей вслух. В этом случае также ведется наблюдение за экспертом, но на него также возлагается задача пояснять все свои действий, объяснять логику своих рассуждений и то, почему принято это или иное решение. Задачей инженера по знаниям является протоколирование рассуждений эксперта и последующий анализ этого «протокола» с возможными коррекциями на следующих этапах извлечения знаний (например, при последующем уточнении в ходе применения активных методов извлечения знаний – опросов, интервью и др.);
- лекции. Послушать лекцию от эксперта – это очень удобно и хорошо для инженера по знаниям. Правда, как и опытный студент, инженер по знаниям должен уметь из обилия рассуждений эксперта выделить наиболее важные фрагменты знаний. Стоит добавить, что далеко не каждый эксперт в предметной области способен прочитать вразумительную лекцию. Но, если эксперт имеет опыт проведения лекций, и это ему нравится… тогда этот метод становится весьма результативным и комфортным для обеих сторон методом извлечения знаний. Следует также учесть, что необходимо правильно задавать темы лекций, а также вопросы по ходу лекции.

Читать дальше:

4.2 Приобретение знаний в СОЗ. ч.2



Похожие статьи:

Резюме к 4 главе
25 июня 2012,
1. В ИИС можно выделить три стратегии получения знаний, т.е. «обучения» системы: - приобретение знаний в СОЗ из источников; - формирование знаний в системах интеллектуального ана ... Читать полностью

Глава 4. ПРИОБРЕТЕНИЕ ЗНАНИЙ В ИИС. ТЕХНОЛОГИИ МАШИННОГО ОБУЧЕНИЯ. 4.1 Стратегии получения знаний в ИИС
25 июня 2012,
До сих пор мы говорили о представлении знаний с помощью специальных моделей, позволяющих так организовать знания в базе знаний ИИС, что они выступают в качестве инструмента вывода искомого решения. ... Читать полностью

Резюме к 3 главе
26 июня 2012,
1. Модели представления знаний делятся на два типа – фор-мальные логические и эвристические модели. Соответственно определяется логический и эвристический метод рассуждений в СОЗ. Логически ... Читать полностью

Резюме к 1 главе
11 июля 2012,
1. Интеллектуальная информационная система (ИИС) -  компьютеризированная система  сбора, хранения, обработки, представления информации, работа которой основывается на имитации (воспро ... Читать полностью

3.8 Ситуационный подход в представлении знаний и выводе решений. ч.4
26 июня 2012,
Последний способ предполагает больший объем работы с экспертами. Он представляется весьма эффективным в случаях, когда пользователь не обладает необходимым резервом времени для выбора решения. И ... Читать полностью