Проблемы машинной обработки информации

Здесь мы должны коснуться возможностей машинной обработки материалов способом контент-анализа. Из всех возможностей кон-тент-анализа, которые суммированы в группах I и II, ЭВМ можно поручить те задачи анализа текстов, когда в качестве единицы анализа выступает слово. Когда мы говорим, что речь идет о достаточно ограниченном наборе слов, мы имеем в виду ограниченность с точки зрения человеческого мышления. Память компьютера оперирует списком, состоящим из тысяч слов, но машинный анализ текста возможен, когда эти тысячи слов заложены в память ЭВМ. И тогда машина при обработке текстов занимается ни чем иным, как подсчитывает число материалов, в которых встречаются слова, интересующие исследователя. Подобные операции находят все большее применение, и предложениями провести такой анализ уже пестрят рекламные странички профессиональных журналов. Самое большее, чего можно ожидать от компьютера в плане усложнения задач, — выявление связки ключевых слов с близлежащими прилагательными, лексические цепочки. Иногда это вполне исчерпывающая задача для исследователя, и скорость считывания информации компьютером делает его незаменимым. Прибавим сюда возможности сканирования рукописного текста.

Более сложные случаи, когда речь идет о генерализации вывода, не обеспеченного симметричным рядом известных слов, пока неподвластны компьютеру. Другое дело, что экран компьютера может выступать в роли машинописного листа фиксации результатов, к которым приходит кодировщик. Но и тут существует соображение контроля за этим выводом. Думается, именно возможность контроля пока сдерживает применение компьютера в таком качестве.

Вспомним, как все это начиналось. Группа ученых Гарвардского университета в США (руководитель Ф. Стоун) в 1961 г. начала разработку принципов машинной обработки материала, проведя серию анализов самых различных текстов: газет, сочинений членов малых групп, программных речей, произнесенных кандидатами на президентский пост от демократической и республиканской партий США, документов личного характера (писем, дневников, автобиографий)'.

С самых первых попыток использования электронно-счетных устройств для работы с текстом становились ясными преимущества и не-

298 Часть III Социологические исследования звеньев коммуникативного процесса

достатки обработки текстового материала с помощью машин — они обеспечивали адекватность анализа огромных текстовых материалов, но требовали огромных усилий по составлению программы — собственно «словника», с учетом всех синонимических вариантов понятий, которые надо будет отыскивать в этом море пропускаемых через машину слов.

Авторы отлично понимали перспективы развития компьютерного дела — их размышления о том, что наборная клавиатура, связанная с компьютером, будет обычной принадлежностью школьного класса и делового офиса учителя, бухгалтера, психотерапевта, библиотекаря (ясно видно, что эти размышления относились к дореволюционной эпохе — до революции, связанной с изобретением персонального компьютера), звучат сегодня, как предвидение. Но для того чтобы выполнять все эти ожидаемые операции, нужно было, чтобы компьютер мог различать не только слова, но и смысл более пространных языковых единиц. Для этого нужно было решение проблемы синтаксического анализа. К сегодняшнему дню частично такие проблемы решены, коль скоро мы доверяем своему компьютеру — при наличии в нем специфических программ — проверку ошибок набранного текста.

С тех пор машинный метод обработки текстовых массивов все больше находит себе применение. Уже через десять лет после этого пионерского проекта Стоуна и его коллег практически повсеместно стали осуществляться проекты контент-аналитических исследований с применением ЭВМ.

Как ни странным это покажется на первый взгляд, именно пример с машинной обработкой текстов иллюстрирует очень важную для понимания сущности контент-анализа мысль. И в другом месте учебника эта мысль не прозвучала бы так явственно. Анализ содержания, как метод, не обладает магическими качествами — вы не получите из него больше, чем вложили. Если нечто значительное, важное, необычное не предусмотрено процедурой, то оно не появится в результате анализа, каким бы сложным и кропотливым он ни был.