Ћекции.ќрг


ѕоиск:




 атегории:

јстрономи€
Ѕиологи€
√еографи€
ƒругие €зыки
»нтернет
»нформатика
»стори€
 ультура
Ћитература
Ћогика
ћатематика
ћедицина
ћеханика
ќхрана труда
ѕедагогика
ѕолитика
ѕраво
ѕсихологи€
–елиги€
–иторика
—оциологи€
—порт
—троительство
“ехнологи€
“ранспорт
‘изика
‘илософи€
‘инансы
’ими€
Ёкологи€
Ёкономика
Ёлектроника

 

 

 

 


ќрган≥зац≥€ ускладненого пошуку




ЋјЅќ–ј“ќ–Ќј –ќЅќ“ј є2

“ема: оптим≥зац≥€ (п≥двищенн€ ефективност≥) пошуку ≥нформац≥њ за рахунок орган≥зац≥њ ускладненого пошуку та використанн€ мови пошукових запит≥в.

ћета: навчитись використовувати мову пошукових запит≥в дл€ п≥двищенн€ точност≥ та швидкост≥ результат≥в пошуку. ¬иконати уточненн€ результат≥в пошуку.

“≈ќ–≈“»„Ќ≤ ¬≤ƒќћќ—“≤

ќрган≥зац≥€ ускладненого пошуку

—кладн≥ запити застосовують коли пошук за одним чи дек≥лькома ключовими словами не даЇ бажаного насл≥дку, бо к≥льк≥сть знайдених документ≥в залишаЇтьс€ непом≥рно великою. Ќа жаль, загальних стандарт≥в побудови складних запит≥в не ≥снуЇ, ≥ кожна пошукова система маЇ своњ особливост≥, детально ознайомитись з €кими можна на њњ сайт≥, скориставшись стор≥нкою допомоги.

”складнена техн≥ка пошуку дозвол€Ї полегшити ≥ прискорити його процес. ѕочнемо з пошуку за одним ключовим словом. “ут можлив≥ так≥ вар≥анти:

- пошук за ц≥лим словом;

- пошук за п≥др€дком.

ѕошук за ц≥лим словом в≥дпов≥даЇ на€вност≥ обовТ€зкових пропуск≥в праворуч ≥ л≥воруч в≥д ключового слова. ќтже, пошук за словом program уже не захопить документ≥в, що м≥ст€ть слово Д programs Ф. Ќа противагу цьому, п≥д час пошуку за п≥др€дком, досить на€вност≥ у текст≥ ключового слова в будь-€кому оточенн≥. Ќаприклад, пишете ключове слово науковий, а до вас приход€ть документи, що м≥ст€ть слова ДнаукаФ, ДнауковаФ ≥ нав≥ть ДантинауковийФ.

≤нший вар≥ант: ¬ам потр≥бно з≥брати в≥домост≥, наприклад, про пол≥тичн≥ парт≥њ в ”крањн≥. «адаючи ключове слово парт≥€ з пошуком за ц≥лим словом ¬и виключаЇте з пошуку документи, що м≥ст€ть це слово в ≥ншому в≥дм≥нку або числ≥: парт≥њ, парт≥€х ≥ т.п. ќднак, €кщо ¬и задасте пошук за п≥др€дком, наприклад, за ключовим словом парт≥€, то ¬аш пошук охопить ус≥ документи, що м≥ст€ть, наприклад, слова: партитура, партизан та ≥нш≥, що мало в≥днос€тьс€ до предмета пошуку.

ѕ≥д час пошуку за двома ≥ б≥льшою к≥льк≥стю сл≥в Ц к≥льк≥сть вар≥ант≥в пошуку значно зростаЇ. “ут, по-перше, надаЇтьс€ можлив≥сть комб≥нац≥њ њх за критер≥Їм обТЇднанн€ або зб≥гу, тобто за лог≥чними функц≥€ми јЅќ та ≤, в≥дпов≥дно. Ќаприклад, можна зд≥йснювати пошук за двома словами: мережа »Ћ» компТютерна. ѕ≥сл€ чого ¬ам прийдуть документи, що м≥ст€ть кр≥м ≥нформац≥њ про компТютерн≥ мереж≥ ≥нформац≥ю ≥ про телефонн≥ мереж≥, ≥ рибальськ≥, ≥ нав≥ть, може бути, про любовн≥ або мереж≥ шпигунства. «адавши т≥ ж сам≥ два слова, звТ€зан≥ лог≥чною функц≥Їю : мережа » компТютерна, ¬и значно звузите пошук, але виключите ≥нформац≥ю про глобальн≥ мереж≥, всесв≥тн≥ мереж≥ ≥ т. п., що м≥ст€ть у тому числ≥ ≥ потр≥бну ¬ам ≥нформац≥ю. ” звТ€зку з цим використовуЇтьс€ ще одна лог≥чна функц≥€ ≤-Ќ≈. ¬она дозвол€Ї використовувати таку, наприклад, комб≥нац≥ю ключових сл≥в: мережа »-Ќ≈ риболовна або мережа »-Ќ≈ шпигунська.

“ут напрошуЇтьс€ обТЇднанн€ виключень, повТ€заних лог≥чною функц≥Їю јЅќ: телефонна »Ћ» риболовна »Ћ» шпигунська »Ћ» любовна ≥ вз€тих у дужки, а пот≥м приЇднаних до основного слова функц≥Їю »-Ќ≈: мережа »-Ќ≈ (телефонна »Ћ» риболовна »Ћ» шпигунська »Ћ» любовна).

“ак≥ ускладнен≥ лог≥чн≥ функц≥њ пошуку допускаютьс€ де€кими пошуковими серверами.  р≥м рос≥йських позначень лог≥чних функц≥й використовуютьс€ англ≥йськ≥: AND, OR, AND, або ж спец≥альн≥ значки: &(), ((јЅќ) &! (≤-Ќ≈). ≤нш≥ вар≥анти позначенн€ лог≥чних функц≥й: »Ћ» (використовуЇтьс€ €к проб≥л), » (використовуЇтьс€ знак +), »-Ќ≈ (використовуЇтьс€ знак Ц).

 р≥м лог≥чних функц≥й можна використовувати лапки дл€ позначенн€ словосполучень. Ќаприклад, Д пол≥тична парт≥€Ф або Д виставка фотограф≥йФ. ÷е дозвол€Ї в≥дшукати за зазначеними сполученн€ми ключових сл≥в потр≥бн≥ нам документи, що м≥ст€ть њх строго в тому вигл€д≥, у €кому вони безпосередньо подан≥. ѕри цьому в область пошуку не потрапл€ть документи, що включають зазначен≥ словосполученн€ не у безпосередньому вигл€д≥, а т≥льки, наприклад, у такому: пол≥тична незалежна парт≥€ або виставка художн≥х фотограф≥й, оск≥льки в них потрапили Дсторонн≥ словаФ.

¬ар≥анти пошуку за ключовими словами, точн≥ше словосполученн€м, вз€тими у лапки, ≥ за ключовими словами, не повТ€заними н≥€кими знаками (за замовчуванн€м знаком јЅќ) Ї, фактично, двома пол€рними випадками. ћ≥ж ними знаходитьс€ вар≥ант, де ключов≥ слова повТ€зан≥ службовим оператором: Ѕ≤Ћя або ЅЋ»«№ ќ або ѕќ–”„ або англ≥йською мовою Ц NEAR. ѕоруч з цим службовим символом ставитьс€ число, €ке виражаЇ максимально припустиму к≥льк≥сть пром≥жних сл≥в, €к≥ розд≥л€ють ключов≥ слова. Ќаприклад: генетичн≥ –яƒќћ алгоритми.

÷е означаЇ, що м≥ж ключовими словами У генетичн≥ Ф ≥ Д алгоритми Ф може знаходитись у текст≥ не б≥льше дес€ти сл≥в, тобто вони знаход€тьс€ у документ≥ на невелик≥й в≥дстан≥. ≤ в цьому випадку даний документ в≥дпов≥даЇ заданому критер≥ю пошуку. ¬ протилежному випадку такий документ у ¬ашу область пошуку не потрапить.

—л≥д памТ€тати, що ≥снуЇ ≥ ц≥лий р€д сл≥в, котр≥ нехтуютьс€ пошуковими системами п≥д час запиту ≥ пошук за ними неможливий. ÷е так зван≥ стоп-слова, наприклад: на, що, це, дл€. —топ-слова наст≥льки часто зустр≥чаютьс€ у мов≥ (у нашому випадку в текст≥ документа), що шукати за ними дуже важко. ÷≥каво, що до таких списк≥в стоп-сл≥в на де€ких машинах вже вход€ть, наприклад слова ≥нтернет, компТютер, мережа. ÷≥ слова вже наст≥льки поширен≥, що Дн≥чого не означаютьФ.

—л≥д памТ€тати, що однакове написанн€ р≥зних за значенн€м сл≥в (омон≥м≥€) п≥д час пошуку за ключовими словами може привести до по€ви у списку в≥дпов≥дей досить неспод≥ваних результат≥в. Ќаприклад, слово ДлистФ. ƒодатково до омон≥м≥њ рос≥йськоњ мови: Длист каштанаФ ≥ Длист бумагиФ, п≥д час пошуку за допомогою ћ≈“» додаЇтьс€ ще значенн€ ДлистФ з украњнськоњ. “обто кр≥м омон≥м≥њ в рос≥йськ≥й та украњнськ≥й мовах окремо, зТ€вл€Їтьс€ ще украњнсько-рос≥йська омон≥м≥€: приклад перекладу Ц приклад ружь€, св€то перемоги Ц св€то верить, важкий стан Ц прокатный стан, влада народу Ц позвать ¬лада тощо.

„астково зн€ти таку неоднозначн≥сть можна за допомогою оператора нормальноњ форми (поставити поперед Дп≥дозр≥лимФ словом у запит≥ знак оклику). якщо ж використати пошук за фразою, омон≥м≥€ мови майже не впливаЇ на видачу результат≥в пошуку.

«апит з використанн€м ст≥йких фраз ≥ вираз≥в, що в≥днос€тьс€ до теми ¬ашого пошуку, Ї одним з найпотужн≥ших засоб≥в швидко отримати добротну доб≥рку результат≥в.

ƒл€ пошуку у таких випадках треба використати лапки (дужки) або оператори в≥дстан≥, тобто сл≥д шукати не слова, а словосполученн€. Ќаприклад, за запитом у лапках Д¬ек живиФ ћета з великою точн≥стю видасть стор≥нки, де м≥ститьс€ присл≥вТ€ Д¬ек живи Ц век учисьФ та його вар≥ац≥њ, при цьому в коротк≥й анотац≥њ ресурсу буде п≥дсв≥чена саме ключова фраза. «апити за фразою Д омпТютерна перифер≥€Ф, Дкурс валютФ, Дпрайс-листФ тощо значно скорочують загальне число знайдених документ≥в та дозвол€ють уточнити пошук.

” де€ких випадках п≥д час пошуку сл≥д застосовувати так званий розширений пошук. –≥зниц€ м≥ж простим ≥ розширеним засобами пошуку пол€гаЇ в тому, що при розширеному пошуку використовуютьс€ групи оператор≥в, €к≥ дозвол€ють точно вказати, €ким чином повинн≥ бути повТ€зан≥ м≥ж собою слова запиту, вказати в≥дстань м≥ж ними тощо. ѕерша група Ц це лог≥чн≥ оператори (таблиц€ 1), друга Ц дозвол€Ї задати в≥дстань м≥ж словами запиту (таблиц€ 2).

“аблиц€ 1 Ц Ћог≥чн≥ оператори

ќператор —инон≥ми ќпис
AND » & + Ћог≥чне У≤Ф маЇтьс€ на уваз≥, його можна опускати, тобто запит потр≥бна ≥нформац≥€ повн≥стю екв≥валентний запиту потр≥бна та ≥нформац≥€. «а будь-€ким з цих запит≥в будуть знайден≥ документи, що м≥ст€ть обидва слова. ќператор ≤ уточнюЇ область ¬ашого пошуку.
јЅќ OR »Ћ» | Ћог≥чне УјЅќФ дозвол€Ї шукати документи, що м≥ст€ть хоч би одне з сл≥в в запит≥. “ак, за запитом швидкий або пошук будуть знайден≥ документи, що м≥ст€ть будь-€ке з вказаних сл≥в або обидва слова одночасно. ќператор јЅќ розширюЇ сферу ¬ашого пошуку.
Ќ≈ NOT - Ћог≥чне ДЌ≈Ф обмежуЇ пошук документами, що не м≥ст€ть слово, вказане п≥сл€ оператора. Ќаприклад, за запитом нап≥й не кава будуть знайден≥ документи, що м≥ст€ть слово Днап≥йФ, але не м≥ст€ть слово ДкаваФ. ќператор Ќ≈ обмежуЇ область ¬ашого пошуку.
()    ругл≥ дужки задають пор€док д≥њ лог≥чних оператор≥в. Ќаприклад, ¬и друкуЇте запит швидкий або €к≥сний пошук. «а таким запитом ¬и отримаЇте документи, що м≥ст€ть або слово ДшвидкийФ, або одночасно слова Д€к≥снийФ та ДпошукФ (оск≥льки оператор “ј маЇтьс€ на уваз≥ ≥ д≥Ї першим). якщо ж ¬и напишете запит (швидкий або €к≥сний) пошук, то отримаЇте документи, де зустр≥чаютьс€ одночасно слова ДшвидкийФ та ДпошукФ, або Д€к≥снийФ та ДпошукФ.

 

 

“аблиц€ 2 Ц ќператори, що задають в≥дстань м≥ж словами запиту

ќператор —инон≥ми ќпис
" "   ѕодв≥йн≥ лапки дозвол€ють знаходити словосполученн€, вказане в них, або близьке до нього. ќстаннЇ застереженн€ повТ€зано з двома обставинами. ѕо-перше, стоп-слова в лапках нехтуютьс€, €к у звичайному запит≥. ѕо-друге, граматична форма сл≥в також лапками не ф≥ксуЇтьс€ (щодо запит≥в украњнською та рос≥йською мовами). Ќаприклад за запитом Д погода у ¬≥нниц≥Ф будуть знайден≥ документи, що м≥ст€ть так≥ словосполученн€: Дпогода у ¬≥нниц≥Ф, Дпогода та ¬≥нниц€Ф, Дпогода ¬≥нниц€Ф тощо.
—л2(...) с2(...) w2(...) [2,...] ќбмеженн€ в≥дстан≥ у словах (дв≥йка вказана €к приклад). якщо ¬и бажаЇте, щоб задан≥ ¬ами слова зустр≥чались, скаж≥мо, у межах 5 сл≥в, треба написати: сл5(сонце в≥тер вода). ¬ такому випадку будуть знайден≥ документи, де м≥ж словами ДсонцеФ, Дв≥терФ та ДводаФ розташовано не б≥льш двох ≥нших сл≥в (тобто загальне число сл≥в у фрагмент≥ не перевищуЇ 5). ѕор€док, у €кому зустр≥чаютьс€ задан≥ слова не важливий.
пр2(...) п2(...) реч2(...) s2(...) {2,...} ќбмеженн€ в≥дстан≥ у реченн€х (дв≥йка вказана €к приклад). якщо ¬и потребуЇте, щоб задан≥ ¬ами слова зустр≥чались, скаж≥мо, у межах 1 реченн€, треба написати: пр1(сонце в≥тер вода).

“аблиц€ Ц ќператори зр≥занн€ та нормальноњ форми

ќператор ќпис
* ќператор зр≥занн€. «≥рочка наприк≥нц≥ слова зам≥нюЇ дов≥льне число будь-€ких л≥тер. ќтже за запитом вол* окр≥м ДволаФ буде знайдено документи, що м≥ст€ть слова Двол€Ф, Д¬олиньФ, ДвольтФ та ≥нш≥ у будь-€к≥й граматичн≥й форм≥.
! ќператор нормальноњ форми. ≤нод≥ де€к≥ форми р≥зних сл≥в зб≥гаютьс€ за написанн€м. Ќаприклад, слово ДладаФ Ц це нормальна форма ≥менника ж≥ночого роду та одночасно родовий в≥дм≥нок слова ДладФ. ƒл€ того, щоб усунути таку неоднозначн≥сть, ¬и можете поставити перед словом у запит≥ знак оклику (!), п≥дкресливши, що це нормальна форма, та в≥дкинувши де€ку частину непотр≥бних словоформ. Ќаприклад, за запитом !лад не буде знаходитись словоформа ДладойФ, що Ї т≥льки у ≥менника ж≥ночого роду ДладаФ.

ѕќ–яƒќ  ¬» ќЌјЌЌя –ќЅќ“»

¬ ц≥й робот≥ ¬ам сл≥д п≥двищити повноту, точн≥сть та ефективн≥сть пошуку ≥нформац≥њ у мереж≥ ≤нтернет за темою, що виконувавс€ у попередн≥й лабораторн≥й робот≥. ƒл€ цього ¬ам пропонуЇтьс€ виконати так≥ кроки.

1. —формуйте ускладнений пошуковий запит, використовуючи лог≥чн≥ оператори та виконайте пошук ≥нформац≥њ у мереж≥ ≤нтернет за допомогою одн≥Їњ з пошукових систем, €к≥ ¬и використовували п≥д час виконанн€ першоњ лабораторноњ роботи.

2. ¬икористовуючи параметри ДрозширеногоУ (ДскладногоУ) пошуку оптим≥зуйте пошукову процедуру, розширюючи чи звужуючи область пошуку, наприклад:

- використовуючи оператори, що задають в≥дстань м≥ж словами запиту;

- використовуючи оператори, що задають обмеженн€ ≥нтервалу дат;

- застосовуючи оператори зр≥занн€ та нормальноњ форми.

3. ќц≥н≥ть результати виконанн€ пошуку, уточн≥ть результати шл€хом застосуванн€ функц≥њ Дшукати у знайденомуФ.

4. ѕор≥вн€йте результати поточного пошуку у план≥ пертинентност≥, точност≥ та повноти з результатами пошуку, отриманими у попередн≥й лабораторн≥й робот≥.

5. «роб≥ть висновки стосовно п≥двищенн€ ефективност≥ пошуку ≥нформац≥њ завд€ки застосуванню €к мови запит≥в та ≥нших параметр≥в ДрозширеногоУ (ДскладногоУ) пошуку

3. ѕќƒјЌЌя –≈«”Ћ№“ј“≤¬ –ќЅќ“» («¬≤“)

1. «в≥т подаЇтьс€ у вигл€д≥ листа електронноњ пошти (E-mail) на адресу [email protected].

“ема листа (обов'€зково): Ћр2 ќптим≥зац≥€ пошуку ≥нформац≥њ в ≤нтернет.

«м≥ст листа: дов≥льний, але обовТ€зковою Ї ≥нформац≥€ про виконавц€ Ц ѕ≤Ѕ студента, група.

2. ƒо листа маЇ бути прикр≥плений файл (документ Word95/XP) з результатами роботи:

- коп≥€ екрану стор≥нки з параметрами розширеного (складного) пошуку;

- коп≥€ екрану стор≥нки, €ка видаЇтьс€ пошуковою системою €к в≥дпов≥дь на запит користувача;

- таких пар коп≥й маЇ бути м≥н≥мум 3, одна з €ких маЇ бути оптимальною (в≥значити);

- пор≥вн€льний анал≥з результат≥в пошуку;

- висновки стосовно оптим≥зац≥њ пошуку фаховоњ ≥нформац≥њ за допомогою параметр≥в розширеного пошуку.

3. ћ≥н≥мум 10 роб≥т за заданою темою (електронн≥ верс≥њ).

 онтрольн≥ питанн€

1. ўо таке складний запит? Ќавед≥ть приклади застосуванн€ оператор≥в лог≥чних операц≥й у текст≥ запиту.

2. ўо таке ускладнений пошук? яке його основне призначенн€?

3. ¬ чому пол€гаЇ р≥зниц€ м≥ж простим ≥ розширеним способами пошуку?

4. ўо таке розширений пошук ≥ €к≥ параметри можна у ньому задавати?

5. ѕо€сн≥ть терм≥н Дстоп-словоФ. Ќавед≥ть приклади в≥домих ¬ам стоп-сл≥в.

6. ѕо€сн≥ть суть терм≥ну Уомон≥м≥€Ф. Ќавед≥ть к≥лька приклад≥в омон≥м≥њ.

7. Ќазв≥ть оператори, €к≥ дозвол€ють вказати, €ким чином повинн≥ бути повТ€зан≥ м≥ж собою слова запиту. Ќавед≥ть приклади застосуванн€ таких оператор≥в.

8. яким чином ≥ з €кою метою вказують в≥дстань м≥ж словами пошуку? Ќавед≥ть в≥дпов≥дн≥ приклади.

9. ¬ чому пол€гаЇ пошук за адресами Web-сервер≥в? Ќавед≥ть в≥дпов≥дн≥ приклади.

10. ƒл€ чого потр≥бн≥ ≥ €ким чином використовуютьс€ оператори зр≥занн€ та оператори нормальноњ форми? Ќавед≥ть в≥дпов≥дн≥ приклади.

11. Ќазв≥ть призначенн€ оператор≥в параметр≥в запиту. Ќавед≥ть к≥лька в≥дпов≥дних приклад≥в.

12. яким чином виконують пошук програмного забезпеченн€? ѕо€сн≥ть р≥зницю у програмному забезпеченн≥, що в≥дноситьс€ до ДsharewareФ ≥ ДfreewareФ.

 





ѕоделитьс€ с друзь€ми:


ƒата добавлени€: 2015-11-05; ћы поможем в написании ваших работ!; просмотров: 567 | Ќарушение авторских прав


ѕоиск на сайте:

Ћучшие изречени€:

Ћюди избавились бы от половины своих непри€тностей, если бы договорились о значении слов. © –ене ƒекарт
==> читать все изречени€...

2266 - | 2071 -


© 2015-2024 lektsii.org -  онтакты - ѕоследнее добавление

√ен: 0.017 с.