Для того, щоб забезпечити організацію та формалізоване подання облікової інформації в АІС, її пошук і обробку, а також для скорочення обсягів даних та трудомісткості їх обробки потрібні їх попередня класифікація й кодування.
Метою класифікації і кодування є упорядкування і взаємоузгодження різних об‘єктів (предметів, процесів, понять, властивостей та інших явищ матеріального або не матеріального походження). Слід зазначити, що класифікація економічної інформації існувала і до появи ІС, але під час створення ІС обліку, її інформаційної бази, класифікації та кодуванню облікової інформації відводиться особлива роль, оскільки вони є засобами для взаємного обміну інформацією між людиною та ЕОМ.
Класифікація та кодування – це дві невіддільні складові процесу перекладу різноманітної облікової інформації з природної мови на формалізовану мову ЕОМ.
Класифікація – це поділ заданої множини об‘єктів на підмножини за їх схожістю (однорідними властивостями) або відмінністю згідно з певними методами.
Об’єктами можуть бути перелік товарів, послуг, професії робітників, процеси та операції обробки тощо.
Під методом класифікації розуміють с укупність правил створення системи класифікаційних угрупувань і їх зв’язки між собою. Система класифікації дозволяє групувати об‘єкти і виділяти певні класи за рядом загальних властивостей.
Система класифікації - сукупність методів і правил класифікації та її результат.
Основні системи класифікаціїекономічної інформації - ієрархічна, фасетна і змішана (ГОСТ 6.01.1—87 — чинний в Україні). Зрозуміло, що їх застосовують для всіх видів економічної інформації, і, в першу чергу, для облікової.
Ієрархічнасистема класифікації – це система, в який поділ множини об‘єктів на підмножини виконується послідовно, згідно із заданими ознаками. Між класифікаційними групуваннями встановлюються відношення підпорядкування. Кожен об’єкт попадає при цьому лише до одного класифікаційного групування.
Ієрархічна система класифікації характеризується кількістю заданих ознак класифікації (рис.2.1). Кількість рівнів класифікації відповідає числу ознак, обраних у якості основи поділу, і характеризує глибину класифікації.
Рис.2.1. Класифікація об‘єктів за ієрархічною системою
Приклад класифікації об‘єктів за ієрархічною системою - структура Плану рахунків бухгалтерського обліку активів, капіталу, зобов’язань та господарських операцій підприємств й організацій:
0-й рівень - план рахунків;
1-й рівень - класи рахунків;
2-й рівень - назви синтетичних рахунків (рахунки першого порядку);
3-й рівень - назви субрахунків (рахунки другого порядку) тощо.
Така класифікація може застосовуватись для інформації про органи керівництва, для територіально-адміністративного поділу, для видів економічної діяльності тощо.
Переваги ієрархічної системи класифікації: простота, наочність, логічність побудови, пристосованість до ручної обробки; використання незалежних класифікаційних ознак у різних гилках ієрархічної структури.
Недоліки: жорстка структура, яка приводить до складності внесення змін; неможливість групувати об‘єкти за заздалегідь непередбаченим сполученням ознак; ускладнює автоматизовану обробку.
Фасетна класифікація полягає в паралельному поділі множини об‘єктів на незалежні підмножини (класифікаційні угруповання). Ознаки класифікації називають фасетами (списками). Кожний фасет містить сукупність однорідних ознак (список значень). Фасети взаємонезалежні. Значення у фасеті могуть бути розташовані в довільному порядку (рис. 2.2), хоча бажаним є їх упорядкування. Послідовність створення класифікаційних угруповань задається фасетною формулою: Ф = (ф1, ф2,... фn). Об'єкти відбирають згідно з наявністю ознак, заданих фасетною формулою у підмножини (Хі), тому одні й ти ж об'єкти можуть входити до різних підмножин. Для підмножин при заданій послідовності фасет існує декілька варіантів (комбінацій фасетів) ієрархічної класифікації.
Значення | Ф1 | Ф2 | ... | Фn |
... | ||||
m |
Рис.2.2. Фасетна система класифікації
Така класифікація може використовуватись, наприклад, для обробки даних внутрішніх підрозділів підприємства з виділенням окремих груп виробничих підрозділів: цех – дільниця – бригада тощо, де кожний виробничий підрозділ містить їх назви. У освіті для обробки даних з підготовки фахівців фасетами можуть бути: галузь знань, напрям підготовки, освітньо-кваліфікаційний рівень підготовки.
Переваги фасетної системи класифікації - гнучкість структури, можливості додавання нових фасет і віддалення застарілих; ефективність для автоматизованої обробки інформації. До недоліків такої системи можна віднести складність використання в разі ручної обробки даних, недостатньо повне використання місткості, тому що не усі можливі комбінації фасет мають практичне застосування. Все це вимагає при застосуванні фасетного методу класифікації дотримуватись наступних вимог: відбір і фіксування лише істотних для розв’язування конкретної економічної задачі ознак та їх не повторюваність в різних фасетах.
Змішана система класифікації передбачає використання обох систем.
Вибір методу класифікації залежить від мети дослідження економічних даних, але обраний метод класифікації має задовольняти такі вимоги: бути достатньо містким і повним; характеризуватися достатньою та економічно обгрунтованою глибиною (кількість ознак має бути виправданою); гнучкістю та надмірністю (можливість подальшого розширення номенклатури); забезпечувати розв'язання всіх комплексів задач; характеризуватися лаконічністю, чіткістю та ясністю класифікаційних ознак.
Метою кодування є представлення інформації в компактній і зручній формі для запису даних в документах, перенесенні їх на машинні носії, передачі і обробки за допомогою ЕОМ. Для цього об‘єктам класифікації та їх групам присвоюють коди - цифрові, буквені або цифрово-літерні умовні позначення в залежності від обраної системи кодування.
Код – це знак або сукупність знаків, застосованих для позначення об‘єктів класифікації та їх класифікаційних угруповань.
Кожний код характеризується:
· алфавітом – сукупністю знаків, використовуваних для його створення, при цьому позицію знака в коді називають розрядом;
· основою - числом (кількістю) знаків у алфавіті коду;
· довжиною - кількістю знаків у коді без урахування пропусків;
· структурою - визначеним складом і послідовністю розміщення знаків.
Для автоматизованої обробки інформації коди повинні забезпечувати:
· мінімальну довжину коду;
· єдність кодів для всіх задач, усіх комплексів, підсистем і рівнів управління;
· розв'язування усіх задач;
· інформаційні зв‘язки для взаємозв‘язаних систем обробки даних;
· можливість автоматичного контролю його правильності - змогу виявляти помилки, що виникають при введенні або формуванні кодів програмою. Для цього коду доповнюють додатковим розрядом із контрольним числом (розрахункове число, яке визначається за заданим алгоритмом і використовується для перевірки вірогідності запису коду).
Система кодування – це сукупність методів і правил кодового визначення об‘єктів.
Умовно можна виділити у системі кодування дві групи методів кодування: класифікаційну та реєстраційну (рис. 2.3).
Рис. 2.3. Методи кодування економічної інформації
Класифікаційна система кодування орієнтована на проведення попередньої класифікації об‘єктів або на основі ієрархічної системі або на основі фасетної системі; реєстраційна(ідентифікаційна) система кодування не потребує попередньої класифікації об‘єктів.
У класифікаційній системі кодування застосовують послідовний та паралельний методи побудови коду.
Послідовний метод кодування відповідає ієрархічній системі класифікації. Його сутність полягає в тому, що код угрупування створюється на основі коду угрупування попереднього рівня додаванням до нього одного або групи розрядів. Він містить велику інформативність, але, як правило, коди мають велику довжину і складну структуру, в зв’язку з цим метод використовується лише при незначних змінах техніко-економічної інформації. Його застосовують, наприклад, для класифікації галузей економіки, органів державного управління.
Розглянемо як приклад структуру коду рахунків аналітичного обліку виробництва: кожна позиція у класифікації рахунків аналітичного обліку містить шестизначний цифровий код і назву відповідних класифікаційних угруповань. Структура коду схематично має наступний вигляд (рис. 2.4):
Рис. 2.4. Структура коду рахунків аналітичного обліку
Сутність паралельного методу (його також називають розрядним, позиційним) полягає в утворені коду угрупування з кодів незалежних угруповань, отриманих за фасетною класифікацією. Для позначення того чи іншого фасету виділяється певний розряд або група розрядів коду; при цьому, на відміну від послідовного методу, немає залежності ознаки, записаної в одному розряді, від тих, що записані в інших розрядах. За таким кодом легко дізнатись, набором яких ознак описаний об’єкт класифікації. Таким чином, паралельна система забезпечує багатоаспектну класифікацію і кодування. Недолік - менша, ніж при послідовній системі інформативність.
Для прикладу розглянемо побудову ідентифікаційного номеру платника податків на додану вартість для юридичних осіб, який становить 12-розрядний числовий код і складається з незалежних фасет: Ф1 (7 розрядів) - ідентифікаційний код платника за Єдиним державним реєстром підприємств та організацій України (без контрольного числа), Ф2 (4 розряди) – адміністративно-територіальна підпорядкованість, побудована за двоступеневим ієрархічним методом класифікації і порядковим методом кодування: 8-9 розряди - код області, 10-11 розряди – код адміністративного району; Ф3 (1розряд) – контрольний розряд, алгоритм формування якого встановлює центральний орган ДПС.
У реєстраційній системі кодування найчастіше застосовують найбільш простий метод – порядковий (створення коду з чисел натурального ряду). Для зручності обробки інформації код при цьому містить однакову кількість розрядів (наприклад, 0017, 0218, 3126 і т.д.). Недолік методу – відсутність у коді будь-якої інформації про об’єкт, складність визначення груп об’єктів для автоматизованої обробки, тому метод застосовується при кодуванні одноознакових, сталих та малозначних номенклатур, наприклад, для створення табельних номерів працівників.
Серійно-порядковий метод створення коду оснований на використанні чисел натурального ряду та закріпленні серій (діапазонів) кодів за об‘єктами з однаковими ознаками. Реєстрація об’єктів здійснюється в межах виділених серій номерів При наявності двох і більше ознак для ознаки виділяється окремий розряд чи декілька розрядів коду, наприклад, одна група об‘єктів може отримати номери 0001-0075, друга - від 0076 до 0120 і т.д., де лівий розряд означає ознаку. Код за таким методом найбільш економічний за кількістю розрядів, але у ньому важко встановити оптимальну кількість вільних номерів для нових об’єктів. Він може застосовуватися для кодування структурних підрозділів на підприємстві, категорій працівників тощо.
В інформаційних системах будь-яка система кодування повинна забезпечити:
· однозначність коду, тобто однозначний опис певної кількості інформації, яка має завершений зміст;
· уніфікацію кодів для всіх типів інформації на основі створення єдиної структури кодів;
· мінімальну можливу довжину коду для спрощення процедури заповнення та перевірки документів, зменшення обсягу пам’яті та кількості помилок і часу обробки на комп’ютері;
· компресію, тобто можливість скорочення кількості знаків в кодах в деяких випадках;
· швидкий пошук інформації, сортування її за визначеною ознакою та корегування (без з’ясування змісту інформації, яка представлена тим чи іншим кодом);
· незначну надлишковість і гнучкість для можливості розширення об’єктів і внесення необхідних змін без порушення прийнятої структури класифікації.
Поряд із кодуванням економічної інформації застосовують і її шифрування, але не з метою спростити її обробку, а для того, аби приховати зміст інформації. Для досягнення цілей надійного захисту інформації ключ шифрування має бути достатньо складним, щоб унеможливити легке “зламування”, і зберігатися надійно від несанкціонованого доступу.
Шифрування в бухгалтерській практиці застосовують під час подання податкової звітності та реєстрів податкових накладних в електронному вигляді. Для цього на комп'ютері платника податків повинно бути встановлено програмне забезпечення шифрування та накладання електронного цифрового підпису.
Як технологічна операція, шифрування під час обробки даних в цілому ускладнює процес обробки і збільшує загальні витрати часу за рахунок операцій шифрування й розшифрування даних.
Сьогодні існує стійка тенденція проникнення класифікації та кодування в різні сфери людської діяльності. Це - кодування продукції й товарів згідно з єдиною системою штрих-кодів, запровадження реєстраційних номерів для автотранспорту та іншої техніки, номерів паспортів, реєстраційних номерів платників податків тощо. Більш того, кодування та створення єдиної електронної мережі передачі й обробки інформації принципово дає змогу лише один раз ідентифікувати особу в системі, а далі виконувати обмін даними за її кодом у різних функціональних системах – адміністративних, виробничих, юридичних тощо.
Для автоматизованої обробки облікової інформації кодуються не лише об‘єкти, а й процеси та операції обробки, технології, моделі і т. ін. Це істотно зменшує обсяги даних і час їх обробки.
Щоб спроектувати код, достатньо:
· визначити сукупність об‘єктів, які мають кодуватися;
· вибрати системи класифікації та кодування;
· визначити довжину (значність) коду та описати його структуру.
Приклади деяких кодів, що можуть розроблятися на підприємствах для автоматизації обліку, та можливих методів їх кодування наведено у табл. 2.2.
Присвоєні об'єктам класифікації коди фіксують у спеціальних документах – класифікаторах. Позиція класифікатора містить, як правило, назву об‘єктів і його код.
Класифікатор – це документ, що являє собою зібрання кодів і назв класифікаційних об‘єктів та їх угрупувань.
До класифікаторів, що застосовують для автоматизованого ведення обліку, належать: класифікатори синтетичних рахунків, субрахунків і кодів аналітичного обліку, типових господарських операцій; класифікатори-календарі; класифікатори професій тощо.
Крім класифікаторів, в інформаційних системах, у тому числі й обліку, широко використовують довідники, в яких міститься опис та властивості можливих значень об’єктів, суб’єктів, процесів. У довідниках зберігається умовно-постійна інформація для швидкого формування документів, облікових регістрів, стандартних звітів тощо. Прикладами довідників е довідники підприємств, контрагентів, штатного розпису, співробітників і т.д. Їх застосування дозволяє одноразово вводити та багаторазово використовувати різноманітні дані.
Кожний класифікатор або довідник має відповідну структуру, яка визначає його зміст (назву реквізитів, їх тип і довжину).
Таблиця 2.2.