Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ѕонимание и порождение устной и письменной речи с помощью ѕ 




ѕока ѕ , обладающие возможностью обрабатывать письменные тексты и устную речь, имеют в пам€ти ограниченные конкретной предметной областью базы знаний.

Ѕаза знаний Ц определЄнным образом организованные лингвистические и нелингвистические данные и правила их обработки.

–ечемыслительна€ де€тельность человека Ц очень сложный и неизученный до конца процесс, поэтому сегодн€ нельз€ говорить о его полном моделировании на ѕ .

—уществующие экспериментальные промышленные системы обработки текста и речи созданы с учЄтом наложени€ определЄнных ограничений на их функционирование. —озданы дл€ решени€ частных задач.

 омпьютерные системы понимани€ св€зного текста:

ѕроблема понимани€ текста ѕ  находитс€ на начальный стадии изучени€. –азные точки зрени€ на эту проблему, разные уровни понимани€, построены различные системы понимани€ текста. Ќаиболее сложным дл€ понимани€ €вл€ютс€ тексты, описывающие взаимоотношени€ и поступки действующих лиц, так как в ѕ  должны хранитьс€ большие базы данных об окружающем мире. Ѕолее простые Ц тексты с описанием объектов статического мира. ѕонимание в таких системах трактуетс€ как извлечение из текста наиболее существенной информации. ѕолученна€ в результате информаци€ может пополнить базу данных ѕ  или быть отправлена пользователю.

ѕод передачей пользователю понимают способность ѕ  отвечать на вопросы пользовател€ относительно событий в тексте не в виде слов иди предложений, а в виде св€зного текста. —огласно современным теори€м автоматического понимани€ текста ѕ  пон€л текст, если он может:

1)  ратко изложить его содержание;

2) ќтвечать на вопросы к этому тексту;

3) Ќа основе текста создать картинку\схему и т.д.;

4) ѕриведЄнные в тексте сведени€ представить в иной форме (таблицы, графика);

5) Ќа основе анализа текста на одном €зыке выдать адекватную информацию на другом €зыке;

6) —равнить содержание двух разных текстов и выдать информацию об их сходствах и различи€х;

7) ѕутЄм анализа одного или нескольких текстов извлечь некие знани€, которые можно было бы поместить в базу данных.

”ровни понимани€ письменного текста (выдел€ютс€ при соотнесении с основными уровн€ми €зыка):

а) ћорфологический Ц сводитс€ к автоматическому приписыванию каждому слову его морфологических характеристик (наиболее освоенный вид понимани€ текста), в последние годы стал легко реализовыватьс€ в рамках лексико-грамматического анализа корпусов текстов;

б) —интаксический Ц суть в автоматическом выделении в каждом предложении текста членов и установлении между ними различных типов св€зей;

в) —емантический Ц в процессе автоматически устанавливаютс€ значени€ выделенных на синтаксическом уровне составл€ющих предложений. ѕ  определ€ет, выражаютс€ ли подлежащее одуш.\неодущ. —уществительным, сказуемое глаголом движени€\чувств, обсто€тельство времени/места. ѕодобные процедуры идут с опорой на окружение слова.

г) √иперсинтаксический (прагматический) Ц вы€снение семантических отношений между предложени€ми текста и вы€влением соответствующей тексту ситуации реальной действительности.

 


¬опрос 23.

ѕ , понимающий письменный текст, должен иметь в своей базе данных:

1) «нани€ о €зыке текста;

2) ѕравила использовани€ этих знаний;

3) «нани€ о реальном мире (конкретной предметной области);

4) ѕравила использовани€ знаний о фрагменте реального мира;

5) «нани€ о пользователе, желающем от ѕ  понимани€ текста.

“ипы автоматического понимани€:

1) ѕонимание-узнавание (в ѕ  есть лишь знани€ о €зыке) Ц суть в том, что ѕ  узнаЄт морфологическую структуру каждого слова, проводит синтаксический анализ каждого предложени€, узнаЄт в исходном тексте ключевые слова, словосочетани€ и предложени€);

2) ѕонимание уподобление (ѕ  имеет знани€ о €зыке и правила их использовани€, считаетс€, что система пон€ла текст, если она может ответить на вопросы по нему) Ц суть в нахождении готового ответа своей базе данных, ранее данных человеком, так как она уподобл€етс€ человеку;

3) ѕонимание-прогнозирование (ѕ  ориентированы на понимание текстов узкой специальности, должны иметь знани€ о €зыке, правилах их использовани€ и предметной области.) - считаетс€, что система пон€ла текст, если может определить, какой объект или событие предметной области соответствует фрагментам текста. ќднако одним и тем же фрагментам текста могут соответствовать разные объекты, поэтому их соотношение можно определить лишь с определЄнной долей веро€тности. ќтсюда и прогнозирование).

4) ѕонимание-объединение (в базе данных системы 4 вида вышеназванных знаний) Ц объедин€€ эти виды знаний, ѕ  должен уметь делать выводы, умозаключени€ по тексту, и объ€сн€ть, почему она сделала такой вывод (работа экспертных систем);

5) ѕонимание-объ€снение (в ѕ  есть все 5 видов вышеназванных знаний) Ц ѕ  должен уметь объ€снить пользователю, как она пон€ла текст. “ак как система должна дать ответ любому пользователю с учЄтом уровн€ его образовани€, используетс€ диалог Ђѕ ->пользовательї.

—егодн€ проблема автоматического понимани€ текста реализована в:

1) јвтоматических системах реферировани€ и аннотировани€ и перевода текста;

2) »нформационных и информационно-поисковых системах;

3) Ёкспертных системах.

 


¬опрос 24.

—истемы автоматического порождени€ письменного текста:

«анимаютс€ с 70-х, однако нет единой теории текстообразовани€, не может быть создана едина€ теори€ порождени€ текста из-за неоднозначного определени€ пон€ти€ Ђтекстї:

1) —оздатели диалоговых систем под текстом понимают любую реплику из нескольких слов;

2) —оздатели систем генерации метеосводок или статистических отчЄтов понимают под текстом некоторую таблицу;

3) —оздатели инструкций понимают под текстом цепочку несв€занных между собой предложений, относ€щихс€ к одному объекту.

Ётапы порождени€ текста:

1) —тратегический (решение, что писать) Ц результат: семантическое представление будущего текста;

2) “актический (решение, как писать) Ц результат: собственно текст в €зыковой форме.

¬иды компьютерных систем порождени€ текста:

1) —истемы, работающие на основе шаблонных технологий (стро€т будущий текст, манипулиру€ готовыми предложени€ми и словосочетани€ми как строительными блоками; просты и надЄжны, наход€т широкое промышленное применение; содержание порождЄнного текста представл€етс€ в виде фрагментов текстов, созданных ранее людьми, поэтому выгл€дит естественно, однако работает только с жЄсткими типами текстов);

2) —истемы, работающие на основе лингвистически мотивированных технологий (дл€ создани€ текста системе нужны сложные знани€ структуры содержани€ создаваемого текста и сложные лингвистические знани€, которые позвол€ют выразить содержание €зыковыми средствами; промышленных систем такого рода нет).

 


¬опрос 25.

ќбща€ структура системы порождени€ письменного текста:

а) ќболочка: определ€ет назначение порождающей системы (диалог, сказка, стих и т.д.), содержит базу данных из 2 частей:

- Ќелингвистическа€ (пон€ти€, св€зи, отношени€ между пон€ти€ми конкретной предметной области);

- Ћингвистическа€ (формализованные сведени€ о конкретном €зыке):

a. —писки морфем;

b. —лова с лексикой;

c. —интаксические структуры предложени€;

d. —емантико-синтаксические структуры абзацев и всего текста;

б) ѕланировщик выполн€ет функции:

- ќпредел€ет ту информацию, котора€ должна быть в тексте;

- ќпредел€ет, как она будет представлена;

- ќпредел€ет пор€док следовани€ абзацев;

- ”станавливает пор€док следовани€ синтаксических составл€ющих в пределах текста;

- ќсуществл€ет €зыковое оформление взаимосв€зи предложений в тексте;

- ќсуществл€ет построение синтаксических структур предложений текста;

- ќсуществл€ет выбор соответствующей лексики.

в) Ћингвистический реализатор обеспечивает грамматическую правильность текста и принимает все окончательные грамматические и морфологические решени€.

 


¬опрос 26.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-11-20; ћы поможем в написании ваших работ!; просмотров: 872 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

—вобода ничего не стоит, если она не включает в себ€ свободу ошибатьс€. © ћахатма √анди
==> читать все изречени€...

545 - | 486 -


© 2015-2023 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.013 с.