Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


—истемы машинного перевода




ѕеревод Ц вид человеческой €зыковой де€тельности, в результате которой текст на одном €зыке ставитс€ в соответствие тексту на другом €зыке при обеспечении их смысловыми эквивалентами.

“ипы перевода по степени автоматизации:

1) –учной

2) јвтоматизированный

а) ѕеревод, выполн€емый ѕ  с помощью человека (ѕ  обращаетс€ за справками к человеку);

б) ѕеревод, выполн€емый человеком с помощью ѕ :

- ¬ пам€ти ѕ  дву€зычный словарь и текстовый редактор;

- —истемы “ћ (Translation Memory) Ц в их основе лежит принцип сбора и хранени€ фрагментов переведЄнных человеком текстов на 2 €зыках, они хран€тс€ в специальном накопителе перевода и служат бесценным подспорьем при последующем выполнении переводов той же тематики.

3) ћашинный (автоматический) Ц выполн€емое ѕ  действие по преобразованию текста на одном €зыке в текст на другом €зыке при сохранении эквивалентности).

Ј “радиционный (выполненный человеком)

Ј —татистический (машинный)

ѕервые теоретические разработки по машинному переводу относ€тс€ к 30-40-м, но практическое применение иде€ машинного перевода нашла в 50-е. ѕервый машинный перевод был выполнен в ƒжорджстаунском университете в 1954. ¬ ћоскве первый машинный перевод был выполнен в 1955. “ак как большинство слов имеют несколько значений, то основна€ трудность заключаетс€ именно в выборе нужного варианта, дл€ чего человек использует контекст, жизненный опыт, который фактически невозможно формализовать и загрузить в ѕ , => идеального машинного перевода быть не может и человек посто€нно участвует в редактировании текста.

 


¬опрос 21.

“ипы систем ћѕ:

1) Ќа правилах €зыка (модель перевода человеком)

а) —труктуры систем ћѕ, основанных на первой системе:

 

“екст дл€ перевода
ѕереведЄнный текст
ƒву€зычный словарь
ћорфологический анализ исходного €зыка
—интаксический анализ исходного €зыка
—интаксический синтез переводного €зыка
—интаксические соответстви€ (структура)
ћорфологический синтез переводного €зыка

 


- ¬ процессе морфологического анализа слов предложени€ исходного €зыка каждое слово получает наборы лексико-грамматических признаков (часть речи, род и т.д.), ѕ  формирует эти наборы с опорой на специализированные дву€зычные словари;

- —интаксический анализ предложени€ исходного €зыка сводитс€ к поиску основных членов предложени€;

- —интаксический синтез заключаетс€:

a. ¬ создании предложени€ переводного €зыка определЄнной синтаксической структуры, определ€емой правилами €зыков;

b. «амена слов исходного €зыка на их переводные эквиваленты из словарей.

- ћорфологический синтез каждого слова предполагаемого родного €зыка сводитс€ к постановкам каждого слова в нужную форму, дл€ чего ѕ  использует лексико-грамматические признаки слов переводного €зыка.

б) ”спех —ћѕ зависит от автоматических словарей. ƒл€ всех слов закодированного вида указываютс€ грамматические признаки и лексико-семантическа€ информаци€.

в) »спользуютс€ два типа представлени€ лексических единиц в автоматическом словаре:

- ¬ виде словоформ (словарь включает всевозможные лексические единицы и подаЄтс€ гнЄздами);

- ¬ виде квазиосновы (числа, сто€щие после, условно обозначают наборы суффиксов и окончаний, присоедин€емых к основе дл€ получени€ соответствующей формы, эти числа называютс€ типами формообразовани€, а сами суффиксы и окончани€ Ц машинными окончани€ми.

г) ¬ыбор типа лексической единицы зависит от:

- “ипа €зыка (дл€ флективных рациональнее использовать квазиоснову, дл€ €зыков аналитического типа - словоформу);

- ќт объЄма словар€ и вычислительных ресурсов ѕ ;

- ќт типа системы —ћѕ (дл€ информативного перевода примен€ют квазиосноу, дл€ профессионального Ц словоформу).

д) ѕреимущества систем первой технологии:

- —интаксическа€ и морфологическа€ точность;

- —табильность и предсказуемость результатов;

- ¬озможность настройки на предметную область.

е) Ќедостатки:

- “рудоЄмкость и длительность разработки;

- Ќеобходимость пополнени€ словарей;

- Ђћашинныйї акцент.

2) —истемы второй технологии (основаны на поиске наиболее веро€тного перевода с использованием данных из параллельных корпусов);

а) ѕреимущества:

- Ћегко построить при наличии дву€зычного корпуса;

- ѕеренос технологии на любые пары €зыков

- Ћексическа€ гладкость.

б) Ќедостатки:

- ќграниченность параллельных корпусов и их качество;

- ѕлоха€ справл€емость с морфологией и синтаксисом;

- »скажение информации.

ќбе технологии обладают своими преимуществами и недостатками и не решили задачу по достижению качественного ћѕ. —истема Promt разработала Ђ√ибридную технологию переводаї. “акой перевод сохран€ет преимущества традиционной технологии (формирование синтаксически св€занного и грамматически правильного текста) и преимущества статистического метода (быстрое обучение, получение данных из параллельных корпусов в автоматическом режиме и гладкость текстов).

 


¬опрос 22.





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2016-11-20; ћы поможем в написании ваших работ!; просмотров: 598 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ћибо вы управл€ете вашим днем, либо день управл€ет вами. © ƒжим –он
==> читать все изречени€...

629 - | 497 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.013 с.