Лекции.Орг


Поиск:




Категории:

Астрономия
Биология
География
Другие языки
Интернет
Информатика
История
Культура
Литература
Логика
Математика
Медицина
Механика
Охрана труда
Педагогика
Политика
Право
Психология
Религия
Риторика
Социология
Спорт
Строительство
Технология
Транспорт
Физика
Философия
Финансы
Химия
Экология
Экономика
Электроника

 

 

 

 


Прост Пов 2 НП Из ДЗ // ИЧС-G




 

Расшифровка: простое предложение, повествовательное, 2-я схема; глагол в форме настоящего простого времени, в изъявительном наклонении, залог – действительный; именная часть сказуемого выражена герундием.

Алгоритмизация.

При решении задачи алгоритмизации предложенного метода (для автоматического или автоматизированного анализа предложений) ключевыми являются следующие требования:

· метод должен включать формализованное и структурированное описание множества вариантов;

· метод должен включать набор формальных или формализуемых правил исключения подмножеств множества вариантов по мере рассмотрения последующих слов предложения;

· для автоматического анализа метод должен принимать в расчёт тот факт, что результатом определения формы слова и грамматической информации, соответствующей ей, чаще всего является не один, а несколько возможных вариантов разбора (алгоритм должен по мере возможности устранять морфологическую омонимию: например, слово wish английского языка ана­лизатор форм слов определит как «либо глагол, либо существительное», а анализатор синтак­сиса в предложении I wish you to hear my wish устранит омонимию, опираясь на контекст).

 

Перед тем, как перейти к рассмотрению возможных подходов к формализации и алгоритмизации метода, следует отдельно рассмотреть место синтаксического анализа в процессе анализа текста на естественном языке. Системы для работы с естественным языком, как правило, включаютс в себя несколько модулей, последовательно осуществля­ющих анализ языка на различных уровнях структурной организации.

Как в отечественной [9], так и в зарубежной [10] литературе, в задаче анализа текста на естественном языке различают (в порядке решения задач) морфологический, синтаксический, семантический и прагмати­ческий уровни анализа текстов на естественных языках. В задаче синтеза порядок следования модулей заменяется обратным.

Рисунок 1 (11) – Уровни анализа текста на естественном языке

 

Формально рассматриваемый в данной статье метод в качестве входных данных принимает не текст на естественном языке, а последовательность лексем, получаемую в результате анализа форм слов рассматриваемого предложения. Поэтому, если ставить целью разработку полностью автоматического анализатора предложений, следует сначала выбрать или создать модуль, выполняющий анализ форм слов языка (см., например, [11]), а затем опираться на формат выходных данных этого анализатора в качестве формата входных данных.

Для построения автоматизированной системы анализа предложений следует также рассмотреть вариант с интерактивным процессом расстановки грамматических тегов (пометок с грамматической информацией) над словами рассматриваемого предложения непосредственно перед анализом предложения или заранее.

Помимо этого, для построения алгоритма анализа предложения необходимо, чтобы информация о множестве вариантов трактовки предложения была представлена в максимально структурированной форме, допускающей эффективное выделение подмножеств с целью их снятия (исключения из рассмотрения).

Множество возможных вариантов трактовки предложения можно структурировать различными способами, например

– в виде множества листьев дерева вариантов анализа предложения;

– в виде многомерного пространства, век­торами которого являются конкретные варианты трактовки предложений, а измерениями – грамматические категории языка.

Для реализации алгоритма анализа предложения на естественном языке необходимо построение системы грамматических категорий, характеризующих как можно более полно максимально возможное число (по возможности все) предложений языка.

Кроме того, для работы алгоритма необходима информация о правилах снятия вариантов трактовок предложения. В рамках данной работы предполагается, что правила должны иметь вид «если начало предложения соответствует некоторому шаблону Х, то следует исключить из рассмотрения трактовки предложения из множества М*».

Для формализации набора правил следует также

– принять во внимание особенности формата входных данных (слов с соответствующей им грамматической информацией, возможно в нескольких вариантах): в ходе анализа потребуются уточнения грамматичес­кой информации, сопоставленной анализатором форм слов отдельным словам, в частности, на этом уровне возможно частичное устранение омонимии;

– разработать структуру данных, обеспечивающую хранение правил;

– также разработать структуру данных, служащую для представления текущего состояния
системы.

Опишем модель формально:

– пусть есть множество М всех возможных трактовок всех предложений языка. Это множество, очевидно, очень велико; очевидно также, что оно конечно. Вопрос о наиболее оптимальной его структуризации мы оставляем открытым, однако придерживаемся описанной ранее многомерной модели (измерениями будем считать грамматические категории (например, наклонение или время), а компонентами векторов – значения (наклонение – побудительное, время – прошедшее) категорий). Окончательная трактовка предложения будет представлять собой точку пространства (или малое его подмножество, если предложение может быть трактовано несколькими способа­ми);

грамматический маркер W, описываю­щий слово, – это результат морфологического анализа этого слова, содержащий возможные варианты его морфологического разбора (их может быть несколько) – код основы слова, морфологические признаки (число, падеж…); в общем случае W = (w1,.., wn) – набор всех морфологических омонимов слова;

входные данные для анализа – это цепочка грамматических маркеров S = (W1..Wn), составляющих предложение;

– неполный маркер ω есть такой грамматический маркер, который описывает не одно конкретное слово языка, а некоторый класс слов. Это достигается путём указания неполной карты морфологических признаков или указания класса допустимых основ слов вместо конкретной основы слова.

правило r (Σ, M*) снятия вариантов – это пара множеств неполных маркеров Σ=(σ1,..,σn) и вариантов трактовок M*, однозначно исключаемых из рассмотрения, если начало предложения соответствует набору Σ. Множество всех правил R описывается граммати­кой языка. Порядком правила | r.S | будем называть число неполных маркеров, входящих в Σ.

Применение правила приводит к сокра­щению множества допустимых вариантов тра­ктовок предложения (M’ = M \ M*).

Правила однозначны; применение означает полное и окончательное исключение из рассмотрения вариантов трактовки, перечисленных в теле правила, что затрудняет состав­ление свода правил для естественного языка.

 

 

Рисунок 2 (11) – Схема алгоритма анализа

 

Укрупнённая схема алгоритма анализа (рисунок 2) демонстрирует порядок выполнения предлагаемого алгоритма, реализую­щего метод анализа предложений на естес­твенном языке.

Обозначения, применённые на схеме:

rj.M* – множество вариантов трактовок предложения, исключаемое в соответствии с правилом rj.

Под уточнением маркеров w1..wn понимается снятие вариантов маркеров, не соответствующих правилу (только в случае морфологических омонимов).

M = M – rj.M* – из множества М всякий раз удаляются элементы, содержащиеся во множестве rj.M*.

Множество R всех правил считаем упорядоченным по возрастанию порядка правил, входящих в него.

Приведённая схема алгоритма является упрощённой, поскольку реальный анализ претерпевает ветвление всякий раз, когда возможно применение исключающих друг друга правил вследствие морфологи­ческой омонимии в словах предложения. В этом случае параллельно рассматриваются оба варианта усечения множества М.

Для данного алгоритма, вместе с тем, решения ряда проблем остаются открытыми, затрудняя тем самым непосредственную реализацию его на языке программирования. В первую очередь это связано с большим объёмом работ по внесению значительного количества правил, описывающих синтаксис английского языка:

– на данный момент выделение грамматических категорий, отвечающих заданным в статье критериям (существование и единственность значения категории для каждой из категорий, достаточность набора категорий для описания любого или подавляющего большинства предложений языка), в полной мере ещё не выполнено, но, тем не менее, авторы статьи не видят принципиальных препятствий выбору таких категорий или синтезу суррогатных категорий, представляющих собой объединения обычных грамматических категорий, используемых в лингвистике;

– в работе не приводятся формальные правила исключения вариантов ввиду того, что полный набор формальных правил будет иметь большой объём, не соответствующий объёму публикации;

Помимо этого, описанный алгоритм не раскрывает детали обработки данных, а описывает саму идею выполнения анализа, поэтому авторы статьи продолжают работу по улучшению и модернизации предложенного алгоритма по перспективным направлениям:

– оптимизация на уровне представления множества вариантов: возможен переход к первой из предложенных моделей структуризации множества возможных вариантов (древовидной) в том случае, если дерево вариантов трактовки предложения окажется возможным построить автоматически, опираясь, к примеру, на предложенную в статье многомерную модель (или, возможно, на какую-то другую модель) – переход к древовидному представлению позволит, во-первых, расширить базис операций для формирования условий снятия вариантов в правилах, а во-вторых, сократить количество правил, требующих проверки на каждом шаге анализа;

– оптимизация на уровне представления правил: с одной стороны, усложнив структуру правил, можно добиться меньшего числа проверок (например, настроив (или определив) бинарное отношение «А строже Б, если тождественно истинен предикат (для любого х) А (хB (x) (где à есть символ импликации, обратная импликация не столь важна)» между правилами или кэшируя результаты проверки применимости правил вида «предложение начинается с Do you..», результат которой остаётся неизменным после анализа второго слова предложения), с другой стороны, упростив структуру правил, можно добиться сокращения времени проверки применимости каждого из них.

Помимо значимости описанного подхода как подхода к решению задачи автоматизации анализа текста на естественном языке, следует также отметить, что предложенный метод реа­лизует новый подход в объяснении граммати­ческого и лексического материала. Многие известные на данный момент методики обучения иностранному языку подразумевают прохождение, объяснение и изучение лексико-грамматического материала от частного к общему, а предложенный алгоритм – от общего к частному.

Идеи, касающиеся метода обучения людей анализу предложений, изложенные в данной статье, ранее были предложены научному сообществу на международной конференции [6].

Ниже даны некоторые практические шаги для разработки компьютерной программы по обучению студентов владению пассивной грамматикой на основе сводной таблицы речевых задач.

Электронное пособие может быть подготовлено в формате хххххххххххх, распространяется в виде одного файла обычным копированием, и ввиду широкого распространения формата, открывается на любом современном компьютере под управлением ОС Windows и не требует для работы подключения к сети Интернет.

На рисунках 13-24 показаны возможный внешний вид оглавления электронного пособия по обучению пассивной грамматики. Также на примере конкретного предложения будет показан принцип работы обучающей программы. Рассмотрим разбор английского предложения «When were they invited to the party.» в режиме пословного предъявления на экран, причем разберем его с возможной ошибкой. Задача пользователя поставить в пустых квадратиках значок v, что означает снятие той или иной грамматической задачи с появлением каждого последующего слова. После того, как все значки v поставлены пользователем (с его точки зрения), нужно кликнуть кнопку «Выполнить». Если значки снятия задач поставлены в квадратах правильно, то должно появиться следующее слово.

Шаг 1. В окне программы со списком задач появляется слово When:

 

 

Рисунок 13.

 

Шаг 2. Предположим, что учащийся снял следующие задачи (см. рис. 14):

 

 

Рисунок 14.

 

Шаг 3. После клика клавиши «Выполнить» появляется окно с текстом «Вы дали неверный ответ. Начните сначала.». Это означает, задачи или одна из задач сняты неверно и что необходимо сделать еще одну попытку или попытки. Естественно необходимо разобрать ошибки. В данном случае задачу «Придаточное предложение» снимать еще рано, поскольку «when» может начинать придаточное предложение времени или придаточное подлежащее. Кроме того, задачу «вопрос к подлежащему» (?п) необходимо снять.

 

 

Рисунок 15.

 

Шаг 4. Повторяется операция с учетом допущенных в предыдущем шаге ошибок.

 

Рисунок 16.

 

Шаг 5. Кликаем «Выполнить». Появляется слово «were» с указанием на все его функции в предложении (рис. 17). Значит предыдущий шаг выполнен верно.

 

 

Рисунок 17.

 

Шаг 6. Снимаем задачи. Were есть глагол, не модальный (снимается М45), указывает на прошедшее время (соответственно снимаются Н, Б, Бп), на два вида действия – простой и длительный (снимаются С и ДС), на изъявительное наклонение (снимается Сослагательное). Задача «Безличное предложение» снимается, поскольку форма were указывает только на множественное число, а в безличном предложении формальное подлежащее it указывает на единственное число. Событие не стало развиваться по схеме 2 и 4 (снимаются), а значит предложение не придаточное и не повествовательное.

 

Рисунок 18.

 

Шаг 7. Кликаем «Выполнить». Открывается слово they и переходим к следующему шагу.

 

 

Рисунок 19.

 

Шаг 8. Мы можем снять только одну задачу – существование чего-либо (оборот there be), поскольку после глагола должно было появиться there.

 

 

Рисунок 20

 

Шаг 8. Кликаем «Выполнить». Появляется слово invited. Значит задачу сняли правильно.

 

 

Рисунок 21.

 

Шаг 9. По форме смыслового глагола invited определяем, что глагол were является вспомогательным (остальные функции снимаем), а смысловой глагол употреблен в форме страдательного залога. Вид действия простой, схема 5.

 

 

 

Рисунок 22.

 

Шаг 10. Кликаем «Выполнить». Появляются слова «to the party?».

 

 

Рисунок 23.

 

Шаг 11. Снимаем задачу «главное предложение» и кликаем «Выполнить». В строку «Перевод» по необходимости можно набивать текст перевода.

 

 

Рисунок 24.

 

Таким образом в статье раскрыты вопросы происхождения языка, выведена всеобщая форму познания и языка, выведены основные грамматические категории языка, а также выведена грамматическая формула предложения. Дано теоретическое обоснование активной и пассивной грамматики и дано описание практического применения их в обучении студентов «живым» способом и с помощью компьютерных программ, на основе разработанных алгоритмов языка

 

Библиографический список

1. Активная и пассивная грамматика // Энциклопедический словарь юного филолога (языкознание) /Сост. М.В. Панов. - М.: Педагогика, 1984 - с.: 16,18 // http://www.pedlib.ru/Books/1/0088/1_0088-1. shtml

2. Бабайцева В.В., Чеснокова Л.Д. Русский язык: Теория: Учеб. для 5-9 кл. общеобразоват. Учреждений. - 4-е изд., дораб. - М.: Просвещение. 1995. - 256 с.

9. Белоногов Г.Г., Богатырев В.И. Автоматизированные информационные системы /Под ред. К.В. Тараканова. – М.: Сов. радио, 1973 – 328 с.

6. Бухенский К.В., Заволокин А.И., Миронов В.В., Розанов А.К. Информационная система «Русско-английский словарь математических терминов»/ Изд. 1.2 (исправленное и дополненное), М.: РАО, Объединенный фонд электронных ресурсов «Наука и образование». 2013. Рег. № 18951. Объем - 7,2 Мб.

3. Валгина Н.С. Розенталь Д.Э. Фомина М.И. Современный русский язык: Учебник / Под редакцией Н.С. Валгиной. - 6-е изд., перераб. и доп. Москва: Логос, 2002.528 с. // http://librus. info/lib/teacher/Valgina1. rar

1. Заволокин А.И. Всеобщая формула познания и ее использование при изучении иностранного языка. Лингвострановедение: методы анализа, технологии обучения. Тринадцатый межвузовский семинар по лингвострановедению. (Москва, 16-17 июня 2015 г.) Сборник научных статей в 2 частях. Часть I. Языки в аспекте лингвострановедения. / Московский государственный институт международных отношений (университет) МИД России; (Под общей редакцией Л.Г. Ведениной) – М: МГИМО–Университет, 2016 – 371 с.

4. Заволокин А.И. Всеобщая формула познания и ее использование при изучении иностранного языка. Лингвострановедение: методы анализа, технологии обучения. Тринадцатый межвузовский семинар по лингвострановедению. (Москва, 16-17 июня 2015 г.) Сборник научных статей в 2 частях. Часть I. Языки в аспекте лингвострановедения. / Московский государственный институт международных отношений (университет) МИД России; (Под общей редакцией Л.Г. Ведениной) – М: МГИМО–Университет, 2016 – 371 с.

7. Заволокин А.И. Проблема разработки активной и пассивной грамматики для обучения владению иноязычной речью. Язык и коммуникация в контексте культуры./ Материалы IV междун. науч.-практ. конф. Рязань: ООО «ПРИЗ-Р», 2009. С. 193-199.

5/4. Заволокин А.И. Использование алгоритмов и рассуждений для обучения владению английским языком, для контроля и самоконтроля знаний, умений и навыков студентов. В сб. Язык и коммуникация в контексте культуры: материалы междунар. научн. конф. / РГУ 2007. Стр 272-287

1. Миронов В.В, Заволокин А.И. Розанов А.К. Проблема формализации правил русско-английского и англо-русского переводов текстов. Научно-методический журнал «Информатизация образования и науки» № 2(22) / 2014. http://informika.ru/pechatnye-izdaniya/zhurnal-informatizaciya-obrazovaniya-i-nauki/arhiv-vypuskov/2014/vypusk-n22-soderzhanie/

2. Заволокин А.И., Миронов В.В. Активная грамматика английского языка (для физико-математических и инженерно-технических специальностей). М.: Горячая линия – Телеком (2015).

3. Заволокин А.И., Миронов В.В., Розанов А.К. Электронный ресурс «Активная грамматика английского языка для автоматизации переводов». Рязань: РГРТУ, 2016.

6/5. Заволокин А.И. Лингвопсихофизиологический аспект обучения студентов владению речью в режиме перевода с иностранного языка на родной. В сб. Язык и коммуникация в контексте культуры: материалы международной научно-практической конференции, 21-22 марта 2008= Third Annual InternationalConferenceRyazanStateUniversity, Russia/ отв. ред. С.В. Лобанов; Ряз. гос. ун-т им. С.А. Есенина. - Рязань, 2008. - 236 с. Стр.176-182

7/6. Заволокин А.И. Обучение синхронному переводу студентов языковых и неязыковых вузов при помощи "сводной таблицы речевых задач". В сб. Проблемы преподавания профессионально-ориентированного иностранного языка: материалы междун. научн.-практ. конф. / [сост.Е.Е. Сухова]. - Рязань: Издатель Ситников, 2008. Стр 159-169

8. Заволокин А. И. Философский и психолингвистический взгляд на проблемы языка и речи и на проблемы создания активной и пассивной грамматики. Наука и образование XXI века: Материалы IV-й Международной научно-практической конференции (29 октября 2010 г., СТИ, г. Рязань). В 4-х томах: Том 4. Часть 1. «Современные проблемы образования» / Под общей редакцией проф. А.Г. Ширяева, доц. А.В. Барановского. – Рязань, СТИ. –2010. – 98 с.

2. Заволокин А.И., Миронов В.В. Активная грамматика английского языка (к языковой автоматизации). Учебное пособие для вузов. – 2-е изд. – М.: Горячая линия – Телеком, 2015. – 240 с: ил.

8. Заволокин А.И., Миронов В.В. Алгоритмическая процедура перевода с использованием активной грамматики /Сб. статей междун. науч.-практ. конф. «Актуальные проблемы современных лингвистических исследований». Рязань: Изд. «Узорочье». 2012. С. 277-283.

9/7. Иван Павлович Сусов. История языкознания // http://lib. web-malina.com/getbook. php? bid=4630

1. Когда ребенок говорит первое слово. http://www.privivki-detyam.ru/pervie-slova-rebenka.-kogda-rebenok-govorit-pervoe-slovo.html

4. Кулагина О.С.. О современном состоянии машинного перевода // Математические вопросы кибернетики. 1991. Вып. 3. С. 5-50.

5. Куракин Д.В. О разработке моделей и системных проектных решений для информационно-коммуникационной инфраструктуры управления научно-технической сферой. //Информатизация образования и науки. 2012. № 2 (14). С. 68-78.

10/8. Леонтьев А.А. Основы психолингвистики. М., 1997.287 с.

11/9. Мышление и язык / Под редакцией Д.П. Горского. - М.: Государственное издательство Политической литературы, 1957. // http://www.pedlib.ru/Books/1/0176/1_0176-283. shtml

2. Объективная диалектика. Т. 1. отв. ред. тома Ф.Ф. Вяккерев. М.: «Мысль». 1981. Материалистическая диалектика в пяти томах. По общей редакцией Ф.П. Константинова, В.Г. Марахова.

1. Пиотровский Р. Г. Компьютеризация преподавания языков. - Л.:ЛГПИ, 1988.

2. Пиотровский Р.Г. Автоматическая переработка текста: теория и практика к концу ХХ в. - Л. ЛГПУ. 2002.

3. Пиотровский Р. Г. Системно-семиотический компьютерный анализ и синтез единиц языка и речи. 07-04-90402а / Б. РосГПУ. 2008.

11. Пруцков А.В. Генерация и определения форм слов естественных языков на основе их последовательных преобразований // Вестник Рязанского государственного радиотехнического университета. – Рязань, 2009. Вып. 27. С. 51-58.

4. Пруцков А.В. Алгебраическое представление модели формообразования естественных языков / Электронный журнал Cloud of Science. 2014. T.1. №1.

12/10. Розенталь Д.Э. и др. Словарь лингвистических терминов // http://www.gumer. info/bibliotek_Buks/Linguist/DicTermin/p_2. php

13/11. Философский энциклопедический словарь. / Гл. редакция: Л.Ф. Ильичев, П.Н. Федосеев, С.М. Ковалев, В.Г. Панов - М.: Сов. Энциклопедия, 1983. - 840 с.

3. Философский энциклопедический словарь/Гл. редакция: Л.Ф. Ильичев, П.Н. Федосеев, С.М. Ковалев, В.Г. Панов – М.: Сов. Энциклопедия, 1983. – 840 с.

3. Цыганенко Г.П. Этимологический словарь русского языка. – К.: Рад. шк., 1989.

4. Цыганенко Г.П. Этимологический словарь русского языка. – К.: Рад. шк., 1989.

5. Шанский Н.М., Боброва Т.А. Школьный этимологический словарь русского языка. – М.: Дрофа, 2002.

6. Энгельс Ф. Роль труда в процессе превращения обезьяны в человека. К. Маркс и Ф. Энгельс, Сочинения, изд. 2, Т. 20, стр. 486-498.

7. Энгельс Ф. Диалектика природы. Заметки и фрагменты. К. Маркс и Ф. Энгельс, Сочинения, изд. 2, Т. 20

10. Jurafsky D., Martin J.H. Speech and Language Processing. An Introduction to Natural Language Processing, Computational Linguistics and Speech Recognition. //Prentice-Hall, Inc., Englewood Cliffs, New Jersey, 2000, 950 pp.

4. http://yunc.org/АКТИВНАЯ_И_ПАССИВНАЯ_ГРАММАТИКА

14/13. http://ru. wikipedia.org/wiki/Неполное_предложение

15/13. http://ru. wikipedia.org/wiki/Речь

8. Chimps use touches and noisy gestures when trying to get another chimps attention, researcher finds. http://phys.org/news/2013-01-chimps-noisy-gestures-attention.html

39. Valentin V. Mironov, Alexandr I. Zavolokin and Aleksey K. Rozanov. Preparing electronic handbook for using active grammar during process of translation of technical texts into English. SHS Web of Conferences 9, 02029 (2016). http://www.shs-conferences.org/articles/shsconf/abs/2016/07/contents/contents.html

 





Поделиться с друзьями:


Дата добавления: 2017-03-12; Мы поможем в написании ваших работ!; просмотров: 335 | Нарушение авторских прав


Поиск на сайте:

Лучшие изречения:

Что разум человека может постигнуть и во что он может поверить, того он способен достичь © Наполеон Хилл
==> читать все изречения...

2456 - | 2270 -


© 2015-2024 lektsii.org - Контакты - Последнее добавление

Ген: 0.012 с.