Інформаційні системи, побудовані на базі комп’ютерних мереж, забезпечують розв’язання ряду задач [Error: Reference source not found]: зберігання даних, обробка даних, організація доступу користувачів до даних, передача даних та результатів обробки даних користувачам. Потреба в даних колективного використання останнім часом все більше зростає. Останнє і привело до підвищеної уваги до різних систем розподіленої обробки даних. В цій галузі використовуються такі поняття як розподілена обробка даних, база даних з мережним доступом, архітектура „клієнт-сервер“, розподілені бази даних.
Під розподіленою обробкою даних розуміють обробку даних кількома територіально розподіленими комп’ютерами.
Технологія розподіленої обробки даних базується на двох концепціях. Перша концепція називається „файл-сервер“, а друга – „клієнт-сервер“. Сервер, в даному контексті, – це комп’ютер, який забезпечує функціонування тієї частини мережної версії СУБД, яка здійснює управління даними в термінах бази даних і називається сервером файлів або файл-сервером (File Server). Клієнт – задача, робоча станція чи користувач комп’ютерної мережі. В процесі обробки даних клієнт може сформувати запит до серверу для виконання складних процедур, читання файлу, пошуку інформації в БД тощо.
Файл-серверна модель реалізується наступним чином. В мережі є головний комп’ютер, який називається файловим сервером. Сервер надає в спільне використання інформаційні (фали, бази даних) та апаратні (принтери, модеми) ресурси. Мережна операційна система, яка забезпечує взаємодію користувачів з сервером, складається з двох частин: одна (основна) частина розміщується на файловому сервері, а друга (оболонка) встановлюється на комп’ютерах мережі (робочих станціях). Оболонка забезпечує взаємодію між програмами робочої станції та сервера. Файловий сервер в рамках такої архітектури використовується тільки як сховище даних, а їх обробка здійснюється на комп’ютері користувача.
У клієнт-серверній моделі сервер використовується не тільки як сховище програм та даних, а й як обчислюване середовище. Програмне забезпечення в розглянутій моделі складається з двох взаємозв’язаних програм: програми-сервера та програми-клієнта. Програма-клієнт формує запит та відправляє серверу (програмі), встановленій на комп’ютері із спільним доступом. Обробка запиту здійснюється на сервері, а клієнту, з використанням відповідного протоколу відображаються результати виконаного запиту. При цьому слід звернути увагу, що сервером тут називають як комп’ютер, так і програмне забезпечення.
Grid-технології. Одним з найперспективніших на даний час методів розподіленої обробки даних є використання grid-технологій. Ці технології базуються на використанні спеціальних комп’ютерних систем, які називаються кластерами. Кластер – це група комп’ютерів, об’єднаних високошвидкісними каналами зв’язку, яка представляє з точки зору користувача єдиний комп’ютер. Один із перших архітекторів кластерної технології Грегорі Пфістер запропонував наступне визначення [121]: „ Кластер – це різновид паралельної чи розподіленої системи, яка складається з кількох зв’язаних між собою комп’ютерів і використовується як єдиний уніфікований комп’ютерний ресурс “.
Суть grid-технологій полягає у прагненні об’єднати усі комп’ютери підприємства чи організації (а в ідеалі – усього світу) в єдину систему (єдиний кластер), що дозволить розподіляти і перерозподіляти ресурси між користувачами у відповідності до їх запитів. Маючи доступ до такого суперкомп’ютера, користувач може в будь-який час і в будь-якому місці запросити стільки обчислювальних ресурсів, скільки йому потрібно для розв’язання своєї задачі. Grid-технології часто порівнюють з єдиними системами електропостачання – така система здатна перерозподіляти потужності, направляючи чи перенаправляючи запити на недовантажені комп’ютери. Крім того, на grid-технології покладаються й задачі інформаційного характеру: зробити усю інформацію підприємства (світу) загальнодоступною. По суті тут мова йде про сміливий, фантастичний розвиток WorldWideWeb.
Потенціал grid-технологій уже сьогодні оцінюється дуже високо: він має стратегічний характер і в найближчій перспективі grid-технології повинні стати обчислювальним інструментарієм для розвитку високих технологій у різноманітних сферах людської діяльності, подібно до того, як таким інструментом стали персональний комп’ютер та Інтернет. Такі високі оцінки можна пояснити здатністю grid-технологій на основі безпечного і надійного віддаленого доступу до ресурсів розподіленої глобальної інфраструктури вирішувати дві проблеми [Error: Reference source not found]:
- Створення розподілених обчислювальних систем надвисокої пропускної здатності з обладнання, що випускається серійно при одночасному підвищенні ефективності наявного парку обчислювальної техніки шляхом використання ресурсів, які тимчасово простоюють.
- Створення широкомасштабних систем моніторингу, управління, комплексного аналізу та обслуговування із глобально розподіленими джерелами даних, які здатні підтримувати життєдіяльність державних структур, організацій та корпорацій.
З самого початку grid-технології призначалися для розв’язання складних наукових, виробничих та інженерних задач, які неможливо вирішити за прийнятні терміни на окремих обчислювальних установках. По мірі свого розвитку grid-технології почали проникати у промисловість та бізнес, у зв’язку з чим зараз grid-технології претендують на роль універсальної інфраструктури для обробки даних, у якій функціонує велика кількість служб (Grid Services), які дозволяють вирішувати не тільки конкретні прикладні задачі, а й передбачають сервісні послуги: пошук необхідних ресурсів, збір інформації про стан ресурсів, зберігання та доставка даних.
Застосування grid-технологій може привести до нової якості розв’язання наступних класів задач:
- масова обробка потоків даних великого об’єму;
- багатопараметричний аналіз даних;
- моделювання на віддалених суперкомп’ютерах;
- реалістична візуалізація великих наборів даних;
- складні бізнес-програми з великими об’ємами обчислень.
За принципами grid-технологій зараз інтенсивно розвивається новий метод використання програмного забезпечення, який називають хмарними обчисленнями.
Хмарні обчислення (cloud computing) – технологія обробки даних, у якій програмне забезпечення надається користувачу як Інтернет-сервіс [122].
За такої моделі користувач має доступ до власних даних, але не може управляти і не повинен турбуватися про інфраструктуру, операційну систему та, власне, програмне забезпечення, з яким він працює. „Хмарою“ метафорично називають мережу Інтернет, яка приховує усі технічні деталі.
Згідно одного із визначень „Хмарна обробка даних – це парадигма, у рамках якої інформація постійно зберігається на серверах в мережі Інтернет і тимчасово кешується на клієнтській стороні, наприклад, на персональних комп’ютерах, ноутбуках, смартфонах тощо“ [123]. Хмарна обробка даних як концепція включає в себе поняття програмне забезпечення як послуга (Software as a Service – SaaS) та інші технологічні тенденції, спільним в яких є впевненість в тому, що мережа Інтернет у змозі задовольнити потреби користувачів в обробці даних. Яскравим прикладом втілення в життя технології хмарних обчислень є проект Google Apps (http://www.google.com/apps/business/), який надає в користування офісні програми в режимі on-line, доступ до яких здійснюється за допомогою Web-броузера, тоді як програмне забезпечення та дані зберігаються на серверах Google.
Семінар 21