Фиксация границ распознаваемых состояний

Казалось бы, дело сделано... После того, как сформированы эталонные модели и реализован алгоритм автоматического выделения текущих векторов признаков, задача распознавания ситуации решается относительно просто — методом сравнения текущей ситуации (вернее, ее вектора признаков) с эталоном. Однако и здесь есть проблема...

Поясним ее суть. Коль скоро мы ставим перед собой задачу распознавания ситуации, то мы вынуждены ее фиксировать на некоторый момент времени. В результате для системы распознавания она представляет собой состояние, характеризующееся некоторым набором признаков. Задача состоит в том, чтобы это состояние было привязано к существующей модели, в большинстве случаев предстающей в виде набора связанных функциональными и логическими отношениями дискретных состояний системы. То есть, вектор текущего состояния системы в результате поочередного сравнения с состояниями, помещенными в узлах модели (эталонами), должно быть классифицирован и отнесен к некоторой «окрестности» узла. Задача сложная, даже если представить себе, что анализу подвергается поток сообщений, релевантных тематике исследования.

Соответственно, границы каждого состояния, зафиксированного в модели, должны быть некоторым образом описаны, что крайне сложно сделать без четких критериев (особенно, если значения многих параметров описываются терминами естественного языка). Должны существовать критерии, которые позволили бы определить где в данном конкретном случае пролегает граница между «много» и «мало» и методы, с помощью которых эти слова приобретают свойства терминов, с заданной точностью описывающих значение параметра.

Почему мы все время вращаемся вокруг проблем, связанных с использованием естественного языка? — Это легко объяснить: аналитика практически никогда не имеет дела с чисто техническими феноменами (хотя там тоже следует выделять некие границы критических состояний). В результате многие сведения о системе представляются в виде лингвистических переменных — именно таких переменных, относительно значения которых существует лишь некая оценка, полученная либо в результате предварительно проведенного анализа значения представительной выборки сходных высказываний о феноменах, подобных рассматриваемому, либо в результате экспертного опроса ограниченной группы экспертов, чей опыт полагается гарантией точности. Соответственно, при появлении на входе системы анализа слова «несколько» можно с некоторой вероятностью утверждать, что это слово соответствует значению, лежащему в пределах диапазона от четырех до десяти (но этот пример достаточно прост, и поэтому он создает иллюзию легкости, с которой может быть определены квантитативные параметры для каждого слова естественного языка).

Это означает, что система не только должна располагать иерархически организованным тезаурусом, но и набором метрик, обеспечивающих возможность сравнения однотипных феноменов, описываемых различными наборами терминов. Существует два полярных подхода к введению границ значения — аналитический (о котором мы только что говорили) и директивный, когда аксиомы формулируются по произволу некоторого лица. Логическое обоснование этих аксиом невозможно, однако существует возможность логическими средствами определить целостность и непротиворечивость предложенной системы. Между этими полюсами лежит множество альтернативных подходов — от синтеза дискретных шкал, маркированных терминами, до адаптивных алгоритмов коррекции системы аксиоматических утверждений, на начальном этапе установленных по произволу, а далее — настраиваемой (обучаемой) тестовыми последовательностями.

А как быть в случае, когда осуществление метризации не представляется возможным, а потребность в фиксации факта смены состояния все-таки существует? — Одним из путей является переход от терминов, с той или иной точностью обозначающих качество или количество (а значит, обладающих некоторой метрикой и точностью), к терминам, которые могут принимать только значения «истина» или «ложь», к числу которых могут быть отнесены термины, выполняющие предикативные функции (отглагольные существительные, глаголы, причастия, деепричастия и соответствующие концепты, выражающие их сущность). Точность описания состояния снижается, однако вероятность пребывания системы в определяемом такими терминами состоянии оказывается значительно выше.

В результате ситуация будет описываться моделью, в которой будут присутствовать предикативные цепочки и идентификаторы объектов, либо классов объектов. Такая модель может быть приведена к наивысшей степени абстракции (концепты предикатов плюс идентификаторы классов) либо детализирована с тем, чтобы обеспечивалась необходимая точность распознавания. Проблема определения множества терминов, обладающих высокой информативностью (обеспечивающих высокую избирательность распознающей системы) зачастую решается эвристическими методами, хотя при условии частой повторяемости феномена словарь может быть сформирован с применением аппарата математической статистики (анализа тех же частотно-ранговых распределений, но уже для других классов терминов).

Один из вариантов реализации такого подхода — некоторое подобие CRA-карт (см. предыдущий пункт), но построенных в терминах более высокого уровня абстракции. Очевидным недостатком характерного для CRA-карт способа отображения является то, что он указывает лишь на наличие связи (по сути — предиката, выражающего некоторое отношение между идентификаторами объектов и классов объектов). Вероятно, над дугами следовало бы указывать тип отношения (предикат, его выражающий), однако число предикатов может оказаться достаточно большим для того, чтобы их можно было отобразить. Еще один, менее явный, недостаток заключается в том, что эти отношения не развернуты в пространстве-времени. Модель ситуации, отображаемая с помощью CRA-карты (и ее усовершенствованного аналога), не будет обладать избирательностью по отношению к временному аспекту существования системы, и вследствие этого будет иметь исключительно интегральный характер. Перечисленные недостатки не мешают применению таких методов для синтеза словарей, однако, при попытке перенести их на задачи распознавания ситуаций, эти недостатки становятся уже ощутимыми — ведь ситуация — это некоторое состояние, привязанное к «временным координатам».

Какие усовершенствования должны быть внесены в данный или подобный ему метод для того, чтобы он мог быть эффективно использован в системе распознавания ситуаций? Для начала уточним содержание понятия «состояние». С этой целью обратимся к методу аналогии. Рассмотрим простой физический опыт: пусть некая фотокамера на протяжении нескольких периодов колебания фиксирует движение шарика, раскачиваемого на нити. При выборе длительного времени экспозиции кадра на нем запечатлеется лишь трасса, по которой не возможно установить текущую координату шарика (интегральная картина — CRA карта), но позволяет сформулировать заключение о характере процесса и описать его термином «колебание». Если же фотокамера будет последовательно регистрировать положение раскачивающегося шарика на подряд следующих кадрах фотопленки, то мы получим зарегистрированную последовательность мгновенных состояний шарика, описываемых его положением в пространстве (здесь мы можем определить все параметры движения шарика). Но стоит разрезать пленку на кадры и перемешать их, как установить направление движения шарика становится невозможным (мгновенное состояние, вырванное из контекста).

Становится очевидным, что если рассматривать ситуацию, как нечто, что может быть распознано в результате сопоставления эталона с вырванным из контекста мгновенным состоянием системы, то серьезные ошибки распознавания при наличии повторяющихся фаз протекания процесса исключить не представляется возможным.

Что же может быть использовано для устранения отмеченных недостатков? Что связывает текущее состояние с контекстом или предшествующее состояние с последующим? Здесь следует выделить два базовых понятия: «процесс» и «событие».

Событие — это результат завершения процесса приведшего к смене состояния системы. То есть событие не имеет длительности (временной протяженности) — это лишь факт перехода системы из предшествующего состояния в состояние последующее. Событие характеризуется временем наступления, именами или идентификаторами предшествовавшего и результирующего состояний, и может быть отображено на значения «истина» и «ложь», т. е. обладает свойствами, делающими его удобным для использования в системах автоматического распознавания ситуаций. По существу, упоминавшиеся ранее фреймовые модели представления ситуаций строятся именно в терминах событий и состояний.

Использование событий в качестве элементов для построения (и описания правил) системы распознавания ситуаций позволяет связать события с учетом последовательности их наступления (придать модели свойства временной селективности). Такие модели и описания уже пригодны для формирования как интегральных, так и детализированных описаний.

Но сформировать вектор признаков, который мог бы быть использован в сочетании с такой моделью, применяя исключительно статистические методы, невозможно — требуется тщательный анализ системы отношений самого разного плана. Учету должны подлежать отношения переноса энергии, отношения предшествования и следования, пространственные отношения и отношения модальности — в противном случае будут утрачены существенные для интерпретации ситуации нюансы.

В некоторых ситуациях эти отношения могут быть вскрыты на основе формально-логического анализа синтаксических структур различного уровня, однако в большинстве случаев требуется привлечение семантики. В зависимости от характера решаемой задачи к анализу может привлекаться семантика ограниченного подмножества терминов, служащих для выражения специфических отношений, либо семантической атрибуции должен быть подвергнут каждый термин в массиве высказываний. Очевидно, что если при анализе текста не проводится разграничение между оттенками модальности или фазами завершенности действия, то намерение не может быть отличено от действия, возможное — от действительного, а свершившееся от происходящего... и так далее. Чем больше семантических атрибутов распознает система, тем точнее ее выводы.