Лекции.Орг


Поиск:




Разрешающие возможности аналитико-синтетической переработки информации

Большинство технологических процессов информационно-библиотечной деятельности (формирование СПА, создание информационных продуктов, обслуживание пользователей, информационное обеспечение деятельности организации, поддержка управленческих решений и т. д.) предполагает осуществление аналитико-синтетической переработки каких-либо исходных сведений. Аналитико-синтетическая переработка представляет собой преобразование документов в процессе их анализа и извлечения необходимой информации, а также оценка, сопоставление, обобщение и представление информации в виде, соответствующем запросу.

Процедура аналитико-синтетической переработки включает две взаимосвязанные операции: анализ сведений и синтез, т. е. создание на их основе информационной продукции.

Как известно, концепция интеллектуализации информационно-библиотечной деятельности базируется на двух постулатах. Во-первых, на усилении потребностей именно в интеллектуальной продукции, являющейся наиболее комфортной для пользователей. Во-вторых, на достижениях информационной науки, делающих процессы создания интеллектуальной продукции реально выполнимыми.

К таким научным достижениям относится изученность многих явлений и процессов, в том числе:

- свойств, присущих социальной информации, и прежде всего свойства неаддитивности и кумулятивности, т. е. способности информации к уплотнению;

- закономерностей развития документального потока и возможности по их проявлению судить о состоянии научно-практической деятельности, в процессе которой происходит формирование потока;

- способности «документального шлейфа», сопровождающего развитие любых идей, а затем объектов как реализации этих идей, преодолевать дискретность, неполноту отдельных текстовых сообщений и воссоздавать действительную картину мира;

- новых возможностей информационного поиска с ориентацией на совокупные электронные ресурсы;

- разрешающих возможностей различных методов анализа и синтеза информации.

Охарактеризуем разработки, касающиеся совершенствования методов интеллектуального преобразования информации.

Осуществление процессов аналитико-синтетической переработки всегда сопровождается свертыванием, т. е. уменьшением физического объема исходных данных. Не столь очевидно противоположное — возможность развертывания сообщений, повышения их информативности.

Когда каждому отдельному документу приписываются предметные рубрики, то происходит процесс свертывания информации, передачи содержания текстового сообщения с помощью сравнительно небольшого количества ключевых понятий. Но затем, когда этот документ войдет в состав поисковой системы, через предметные рубрики будут установлены его связи с другими публикациями на эту же тему. Подобные связи не содержались в тексте документа. Они оказались выявленными благодаря установлению его места в потоке. Поэтому всегда, когда аналитико-синтетической переработке подвергаются не отдельные сообщения, а документальный «шлейф», сопровождающий развитие какой-либо идеи, объекта, проблемы, появляются предпосылки для развертывания информации. Собственно на этом и основывается возможность создания интеллектуальной информационной продукции.

Рассмотрим, как менялись объекты анализа, повышалась глубина качественного преобразования исходных сведений.

Объекты анализа Процессы аналитико-синтетической переработки информации Регламентация (нормализация) процессов аналитико-синтетической переработки
Формальные признаки Составление библиографического описания Правила (стандарты) библиографического описания
Содержание документа Аннотирование Универсальные планы аннотаций
Содержание документа   Реферирование Универсальные планы-макеты рефератов; планы-макеты, учитывающие особенности объектов описания —> планы-макеты, учитывающие особенности отрасли и объектов описания
Факты (объекты, явления, процессы) Предметизация   Языки предметных рубрик, тезаурусы
Факты с их характеристикой Фактографический анализ Нормализованные планы-досье на различные объекты описания
Документальный «шлейф» объекта или проблемы; содержание входящих в него документов; факты и их характеристика, отраженные в документах Фасетный и контент-анализ Содержательно-статистический анализ Морфологический синтез   Многоаспектный рубрикатор предметной области
Предметная область Концептуальный анализ   Перечень значимых для потребителя аспектов исследования (наблюдения) предметной области

 

Изменение объектов анализа отразилось и на результатах синтеза:

Объекты анализа Результат аналитико-синтетической переработки
Внешние признаки документа Библиографическое описание  
Содержание документа   Индекс (поисковый образ), аннотация, реферат
Содержание некоторого множества документов, отобранных по определенному признаку (теме, проблеме)   Библиографические, аннотированные или реферативные пособия (списки, указатели, обзоры)  
Факты, отраженные в текстах документов   Фактографические досье, таблицы фактографических данных
Документальный «шлейф» объекта или проблемы, включая содержание входящих в него документов   Дайджесты Перечни направлений деятельности специалистов-разработчиков; учреждений, занятых исследованием данной проблемы
Предметная область, т. е. сами объекты или проблемы   Рубрикаторы перспективных направлений Характеристика научно-технического потенциала авторов и организаций. Аналитический обзор состояния предметной области

 

В настоящее время единичные документы крайне редко выступают объектами анализа. При создании информационной продукции преобразованию, как правило, подлежат некие совокупности текстовых сообщений, отобранные по признаку их соответствия информационным потребностям пользователей. Именно благодаря этому становится возможным развертывание сообщений, для чего устанавливаются: связи между документами; частота встречаемости различных признаков содержания (направлений и методов исследований; областей приложения результатов; сведений об авторах и организациях-разработчиках; связей взаимодействия между организациями и т. д.); непротиворечивость исходных концепций, фактов, выводов и рекомендаций; связи между различными отраслями и проблемами (через картину рассеяния документов) и т. д.

С изменением объектов анализа существенно менялась и методика преобразования информации. Целью ее разработки явилась нормализация процедуры свертывания-развертывания сообщений для повышения качества и облегчения этих процессов, а также снижения субъективности получаемых результатов.

По мере углубления анализа содержания документов наблюдается:

- использование специализированных, а не универсальных инструментов преобразования информации;

- ориентация этих инструментов не только на содержание документов, но и на особенности информационных потребностей пользователей.

Действительно из всего набора инструментов анализа-синтеза лишь правила составления библиографического описания являются, во-первых, универсальными, т. е. не зависящими от отраслевой принадлежности текстового сообщения и, во-вторых, отражающими признаки только документа.

Планы пояснительных и описательных аннотаций также в своем большинстве, универсальны, но при их составлении учитывается целевое назначение будущего пособия (рекомендательное, профессионально-производственное, научно-вспомогательное).

Что же касается реферативных аннотаций и, особенно, рефератов, то при их написании во внимание принимаются:

- содержание информационных потребностей, т. е. тематика и характер сведений, интересующих пользователей;

- отраслевая принадлежность документа;

- объект описания (материал или сырье, оборудование, технологический процесс, памятник культуры и т. д.).

Одним из первых на необходимость создания специализированных инструментов анализа указал Д.Ю. Теплов. До него планы рефератов включали универсальные содержательные аспекты типа: цель работы, методы, результаты, рекомендации автора и область их применения, место и время проведения исследования или разработки и т. д.

Д.Ю. Теплов предложил при разработке уже не планов, а планов-макетов будущих рефератов учитывать основной объект описания и именно применительно к его особенностям выбирать аспекты анализа текста. Тогда план-макет реферата на документы с описанием технологического процесса принимает следующий вид: теория процесса; описание отдельных технологических операций; объект, подвергаемый обработке; используемое оборудование или инструмент; контроль протекания процесса.

Сущность подобного аспектного или анкетного анализа состоит в том, что документы обрабатываются в соответствии с определенным заранее заданным перечнем вопросов, представленных в виде плана-макета. Ответом на каждый из вопросов может быть понятие или сочетание понятий, извлеченных из текста; предложения и даже абзацы, касающиеся наиболее значимых моментов содержания (выводы автора, рекомендации, ранее неизвестные отличительные признаки объекта и т. д.), ответом может быть пометка «таких сведений в документе нет», означающая действительное отсутствие информации, а не пропуск ее референтом.

Позже А. И. Жолкова обосновала полезность учета уже не только особенностей объекта описания, но и отраслевой специфики, обязательно сказывающейся на содержании документов. Ею было предложено использовать фасетный анализ и составление табличных многоаспектных рефератов.

Фасетный метод, однако, имеет свои ограничения, так как с его помощью можно получить представление только о содержании одного отдельно взятого документа, тогда как создание информационной продукции предполагает анализ массивов текстовых сообщений. Существует разница в работе с единичными источниками и их множеством. Речь идет не о количественной, а о качественной стороне дела. Даже если анализу подлежат 2-3 документа по одной теме, встает задача сравнения и совмещения их содержания. А это возможно лишь при условии унификации языка сообщений, использовании нормализованных словников или наборов стандартных фраз.

При реферировании отдельных текстов можно использовать извлекаемые из них фрагменты, базируясь на языке автора. При анализе некоторого множества документов (документального «шлейфа» объекта или проблемы) использование языка авторов не позволяет затем осуществлять содержательно-статистическую обработку, сведение воедино разрозненных данных.

Поэтому для аналитико-синтетической переработки множества документов более пригоден метод контент-анализа. Результатом его применения являются наборы понятий, выявляемые из текстов и нормализуемые путем их сопоставления с заранее составленными словниками (рубрикаторами, тезаурусами). Определение частоты употребления понятий и их сочетаний позволяет охарактеризовать содержание всего проанализированного массива, интенсивность развития различных направлений изучения объекта или проблемы, область применения результатов и т. д.

Если в схему контент-анализа включены некоторые внешние признаки документов — автор, организация-разработчик, страна, время создания текстового сообщения, типо-видовая характеристика документа, — то такой план-макет выступает инструментом уже не только анализа, но и синтеза выявленных сведений. Для этого из плана-макета последовательно выбираются главные, основные аспекты, характеризующие объекты наблюдения и некоторые другие, раскрывающие особенности развития этого объекта. Затем на этой основе строятся морфологические таблицы.

Морфологический метод, впервые предложенный Ф. Цвикки, служит целям многоаспектного изучения сложных систем. Он предусматривает всестороннее описание множества вариантов решений. Для упорядочения сведений о каждом из вариантов и предоставлении сведений в виде, пригодном для их сопоставления, предлагается построение многомерных морфологических таблиц.

Методика многоаспектного нормализованного преобразования информации, может использоваться при создании самой различной продукции: формировании фактографических баз данных, составлении дайджестов, написании аналитических обзоров и т. д. Но вне зависимости от сферы применения, при разработке инструментария учитываются три принципиальных момента.

Во-первых, планы-макеты анализа и синтеза ориентируют на тематику информационных потребностей и специфику предметной области, а не только на содержание документов.

Во-вторых, их разрабатывают до начала анализа, лишь представляя себе содержание информационных потребностей и цель создания той или иной продукции. Можно грамотно сформулировать поисковое предписание, с максимальной полнотой выявить необходимые документы, а затем в ходе анализа их содержания следовать не столько логике автора, сколько логике собственной задачи. Кроме того, при таком подходе оказывается возможным обнаружить сведения, отсутствующие в текстовых сообщениях или содержащиеся в них в неявном виде.

В-третьих, на протяжении всей работы планы-макеты остаются открытыми, т. е. предусматривается включение в них новых позиций, обнаруженных в ходе анализа документов.

Все перечисленные методы интеллектуального преобразования информации — аспектный, фасетный, контент-анализ, морфологический синтез имеют единую природу: они базируются на классифицировании объектов или систематике.

На начальном этапе освоения действительности классификация помогает ориентироваться в материале; на завершающем — подводить итоги сделанному.

Интересно, что объекты, объединенные в процессе классифицирования в одну группу (один класс, один фасет), могут в реальной практике никак не взаимодействовать. Это открывает такие стороны и взаимосвязи, которые не были известны прежде. С.С. Розова называет подобную способность классификаций «эффектом усиления», когда благодаря удачно найденному основанию группировки, совпадение объектов по одному признаку оборачивается их тождеством во многих свойствах.

Как было показано, процессы интеллектуального преобразования информации предполагают использование многомерного анализа и характеристики объектов. Обнаружить все значимые аспекты (фасеты) — суть выявить существенные свойства объектов и их отношения с другими объектами. Поскольку же при построении морфологических таблиц предусматривается перебор возможных вариантов характеристики объектов, то появляется возможность обнаружения тех свойств и отношений, которые не были известны на начальном этапе работы. Именно поэтому считается, что многомерные классификации обладают большим эвристическим потенциалом.

Надо отметить, что классифицирование может использоваться не только в процессе аналитико-синтетической переработки документов. Его применяют для построения рубрикатора информационных потребностей, «развертывания» неопределенных запросов пользователей и разработки стратегии поиска, сопоставления характеристик информационной продукции.

Для специалистов по информации всегда актуальна задача освоения той предметной области, в рамках которой ведется обслуживание пользователей. Классификационные схемы служат действенным средством вхождения в проблематику обслуживания, своеобразным метазнанием библиотекарей-библиографов и сотрудников информационных служб предприятий. На начальных этапах используются готовые схемы — библиотечно-библиографические классификации, оглавления к монографиям, учебникам для ВУЗов и т. д. Затем в ходе создания информационной продукции исходные классификации дополняются, часто существенно преобразуются, превращаются в многоаспектные, фасетные ИПЯ. Они могут предъявляться пользователям как результат изучения документального «шлейфа». Тогда осуществляется содержательно-статистический анализ массива и рубрикам (или их сочетаниям) приписывается частота встречаемости в текстах документов.

В библиотечной практике классификации и классифицирование традиционно связывают с процессом расстановки фонда и организации СПА. На самом же деле классификационный анализ выступает действенным средством осмысления, упорядочения и преобразования больших массивов информации.

Таким образом, многочисленные исследования профессиональных потребностей, документального потока и возможностей качественного преобразования текстовых сообщений создали предпосылки для дальнейшего развития обслуживания в направлении интеллектуализации и повышения комфортности создаваемой информационной продукции.

 



<== предыдущая лекция | следующая лекция ==>
Вопрос 3. Особенности документального потока | Сущность и значение управления качеством
Поделиться с друзьями:


Дата добавления: 2016-12-31; Мы поможем в написании ваших работ!; просмотров: 969 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Наука — это организованные знания, мудрость — это организованная жизнь. © Иммануил Кант
==> читать все изречения...

812 - | 706 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.014 с.