Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


III. Прикладная лингвистика




К сфере прикладного языкознания относятся компьютерная лингвистика, прикладное терминоведение, автоматический перевод, лингвистическая информатика.

Компьютерная лингвистика.

В XX в. возникла необходимость создать языки человеко-машинного общения. Для этого было необходимо собственно лингвистические проблемы решать в единстве с другими науками — логикой, математикой, психологией и кибернетикой. Цель такого симбиоза наук - создание автоматических систем искусственного интеллекта, моделирующих знание. Знание хранится, обрабатывается и передается от поколения к поколению в языке и текстах. Поэтому моделирование научно-технических текстов — это моделирование системы знаний в соответствующей отрасли науки и техники.

Любая терминосистема связана с соответствующей системой знаний. Она всегда стремится найти свой оптимальный план выражения. Формой любого понятия являются знаки естественного языка. Следовательно, моделирование знаний - это структурирование соответствующей терминосистемы.

Система знаний представляется в виде сети: узлы такой сети представлены терминами соответствующей науки, а дуги между ними показывают отношения между понятиями. Однако передать логико-понятийные знания, обосновать и интерпретировать их при помощи одних терминосистем невозможно. Для достижения этой цели служит научный текст, где терминосистемы органически взаимодействуют с морфологической и синтаксической подсистемами естественного языка (значениями морфем, частей речи, служебных слов и словосочетаний). Любая логико-понятийная система знаний может быть представлена в виде текста.

Главной задачей прикладных лингвистических наук, связанных с анализом текста, является создание текстовой базы данных для ЭВМ. Такая база данных напоминает автоматизированные библиотечные фонды. Текстовая база данных, хранящаяся в памяти ЭВМ, позволяет многократно использовать тот или иной текст, получая каждый раз нужную информацию:

1) полный список всех словоформ соответствующего текста;

2) элементы морфологической подсистемы текста;

3) частоту встречаемости каждой словоформы и всех словоформ (суммарно)
данного текста или всех текстов, введенных в ЭВМ;

4) адреса словоформ (номера глав, параграфов, страниц);

5) статистику графических знаков (букв, буквосочетаний);

6) контексты каждой словоформы;

7) обратный словарь;

8) текст в полном виде.

Использование ЭВМ в прикладных отраслях языкознания основано на возможности кодирования любой информации при помощи чисел, которые можно обрабатывать посредством ЭВМ. Почву для использования ЭВМ в лингвистике подготовило опережающее развитие математической логики и теории алгоритмов: создание машины Поста, машины Тьюринга, алгоритмов Маркова. С появлением этих машин стала возможной обработка нечисловой информации. Машины были «обучены» мыслить по образцу человеческого интеллекта. В результате создается искусственный интеллект. Первый опыт в этой области описан в статье А. Тьюринга «Может ли машина мыслить» (1950). Им же был разработан наиболее эффективный и универсальный тест для определения уровня интеллектуальности (тест Тьюринга). Он опирается на систему вопросов и ответов, которая охватывает практически любую область интеллектуальной деятельности человека.

Система искусственного интеллекта способна решать самые разные задачи, но главными из них считаются: а) решение задач, б) принятие решений и в) распознавание объектов. Решение задач охватывает широчайший спектр вопросов от сложнейших математических задач до простых рассуждений, нахождения ответов на бытовые вопросы типа: какой обед можно приготовить из предложенного набора продуктов. Проблема принятия решений опирается на материал игровых стратегий (таких, как шахматы, шашки и т.п.).

Механизм распознавания образов использует так называемые эталонные образы, с которыми человек имеет дело в обыденной деятельности. Например, разные по форме, окраске, вкусу яблоки отождествляются с эталонным образом «яблоко» вообще. Понятие «образ» здесь отличается от одноименного психического понятия: это просто некоторое типовое родовое представление человека о группе видовых «предметов». Для этого машине необходимо узнавать объекты и подводить их под те или иные категории. Этим как раз и занимается прикладная лингвистика. Ее главная задача - моделирование речевой деятельности человека, анализ и синтез речи.

Без участия человека выполнение подобных задач невозможно. Необходимо «общение» человека с машиной. Машина, восприняв заданный текст, на него определенным образом реагирует: а) отвечает на вопрос, б) принимает информацию к сведению.

Для реагирования на тот или иной текст, необходимо сначала его понять. Процесс понимания у машин напоминает процесс понимания, происходящий в голове человека. Однако наука пока не может четко определить, что происходит в голове человека. Голова человека обычно сравнивается с «черным ящиком», представления о работе интеллекта основываются исключительно на входящей и выходящей информации. Ясно пока лишь, что для восприятия текста машиной необходимо структурировать смысл текста. Для этого машина должна хранить множество знаний о мире. Задача крайне сложная: так как знания бесконечны. Выход заключается в том, чтобы ориентировать машину только на одну, узкую, сферу знаний: биологию, математику, социологию.

В последнее время ученые увлечены принципиально новой идеей: нужно не только увеличивать объем памяти «умной» машины, но и создавать самообучающиеся системы. Смысл нового подхода в том, чтобы машина могла выполнять несколько важнейших операций:

а) извлекать из текста новую информацию,

б) включать ее в уже имеющиеся системы знаний,

в) при нехватке информации задавать для осмысления непонятого вопросы
человеку. По этому принципу работают многие компьютерные программы. Для использования языка кибернетическими системами, моделирующими восприятие и порождение речи, необходимы разработки структурных моделей фонологии, морфемики, морфологии и синтаксиса.





Поделиться с друзьями:


Дата добавления: 2016-10-06; Мы поможем в написании ваших работ!; просмотров: 1259 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Если вы думаете, что на что-то способны, вы правы; если думаете, что у вас ничего не получится - вы тоже правы. © Генри Форд
==> читать все изречения...

3866 - | 3804 -


© 2015-2026 lektsii.org - Контакты - Последнее добавление

Ген: 0.008 с.