Принята классификация выпускаемой продукции по следующему ряду уровней (Иерархическая классификация):
- семейство продуктов;
- группа продуктов;
- серия продуктов.
Однако эта система классификации не обеспечивает идентификацию любого выпускаемого изделия. Для каждой единицы продукта должны указываться следующие атрибуты (Фасеты):
- код серии продукта;
- конфигурационные параметры;
- свойства.
Код серии продукта – алфавитно-цифровой код, однозначно идентифицирующий отдельный продукт. Конфигурационные параметры – свойства, значения которых могут быть различными в зависимости от потребностей пользователей. Свойства – предопределенные характеристики отдельных продуктов, которые не могут меняться для одного и того же продукта.
Рассмотренные выше системы классификации хорошо приспособлены для организации поиска с целью последующей логической и арифметической обработки информации на ЭВМ, но лишь частично решают проблему содержательного поиска информации при принятии управленческих решений.
К исходным данным, используемым в процессе проектирования классификаторов относятся:
- состав задач, для которых разрабатывается классификатор;
- состав объектов классификации и мощность исходного множества;
- состав признаков классификации и число значений каждого признака;
- наименования отдельных группировок и объектов;
- динамика процесса изменяемости состава задач, объектов и признаков.
К требованиям, которым должны удовлетворять разрабатываемые классификаторы, можно отнести:
- полноту охвата объектов и признаков классификации каждым классификатором,
- согласованность признаков деления множеств объектов с алгоритмами обработки экономической информации,
- взаимную однозначность наименований объектов и их кодовых обозначений,
- простоту кодирования и возможность автоматизации классификации и кодирования,
- возможность увязки с другими классификаторами и системами обозначений,
- эффективность использования классификатора при обработке информации.
Рисунок А.11.5 – Схема процесса разработки классификатора
Для обеспечения информационной совместимости ЭИС разных уровней разработана Единая система классификации и кодирования (ЕСКК). ЕСКК предназначена для выполнения следующих функций:
- централизованной разработки общесистемных (общегосударственных) классификаторов;
- пополнения и обновления, своевременного и систематического оповещения организаций обо всех изменениях, внесенных в классификаторы;
- ответов на разовые запросы;
- оптимизации структуры классификаторов;
- проведению работы по созданию информационно-поисковых языков.
Рисунок А.11.6 – Схема структуры ЕСКК
В состав ЕСКК входит три составные части. Первая ее часть – “Комплекс нормативно-технических и методологических материалов” включает в себя документы, которые регламентируют:
- состав системы, цели системы, задачи и всю используемую терминологию системы;
- принципы и методы классификации и кодирования;
- категории и сферы действия классификаторов;
- принципы сопряжения и взаимодействия классификаторов;
- структуру работ по созданию и внедрению системы.
Второй частью является комплекс общесистемных классификаторов (ОК), в который входят следующие группы классификаторов:
1) Классификаторы о природных и трудовых ресурсах:
- профессии рабочих;
- должности служащих;
- кадров;
- специальностей;
- полезных ископаемых и т.д.
2) Классификаторы о продуктах труда и производственной деятельности:
- промышленной и сельскохозяйственной продукции;
- строительной продукции;
- деталей;
- услуг: в промышленности, в строительстве, в сельском хозяйстве, транспорте, материально-техническом снабжении;
- услуг населению.
3) Классификаторы структуры народного хозяйства и объектов административно-территориального деления:
- предприятий и организаций;
- отраслей народного хозяйства;
- стран;
- органов государственного управления;
- объектов административно-территориального деления;
- пунктов погрузки и разгрузки.
4) Классификаторы управленческой информации и документации:
- единиц измерения;
- технико-экономических показателей;
- управленческой документации;
- технической документации, обозначений стандартных и технических условий;
- технологической документации;
- операций и деталей.
КОДИРОВАНИЕ ТЕХНИКО-ЭКОНОМИЧЕСКОЙ ИНФОРМАЦИИ
Для полной формализации информации недостаточно простой классификации, поэтому проводят следующую процедуру — кодирование. Кодирование — это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Кодирование реализует перевод информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов. Система кодирования — это совокупность правил обозначения объектов и группировок с использованием кодов. Код — это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода. Различают следующие типы алфавитов: цифровой, буквенный и смешанный.
Код характеризуется следующими параметрами:
- длиной;
- основанием кодирования;
- структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;
- степенью информативности, рассчитываемой как частное от деления общего количества признаков на длину кода;
- коэффициентом избыточности, который определяется как отношение максимального количества объектов к фактическому количеству объектов.
К методам кодирования предъявляются определенные требования:
- код должен осуществлять идентификацию объекта в пределах заданного множества объектов классификации;
- желательно предусматривать использование в качестве алфавита кода десятичных цифр и букв;
- необходимо обеспечивать по возможности минимальную длину кода и достаточный резерв незанятых позиций для кодирования новых объектов без нарушения структуры классификатора.
Методы кодирования могут носить самостоятельный характер – регистрационные методы кодирования, или быть основанными на предварительной классификации объектов – классификационные методы кодирования.
Рисунок А.11.7 – Схема классификации систем кодирования
Регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый. В первом случае кодами служат числа натурального ряда. Каждый из объектов классифицируемого множества кодируется путем присвоения ему текущего порядкового номера. Данный метод кодирования обеспечивает довольно большую долговечность классификатора при незначительной избыточности кода. Этот метод обладает наибольшей простотой, использует наиболее короткие коды и лучше обеспечивает однозначность каждого объекта классификации. Кроме того, он обеспечивает наиболее простое присвоение кодов новым объектам, появляющимся в процессе ведения классификатора. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность машинной обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками.
В серийно-порядковом методе кодирования кодами служат числа натурального ряда с закреплением отдельных серий этих чисел (интервалов натурального ряда) за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва.
Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации. Группу классификационных систем кодирования можно разделить на две подгруппы в зависимости от того, какую систему классификации используют для упорядочения объектов: системы последовательного кодирования и параллельного кодирования.
Последовательные системы кодирования характеризуются тем, что они базируются на предварительной классификации по иерархической системе. Код объекта классификации образуется с использованием кодов последовательно расположенных подчиненных группировок, полученных при иерархическом методе кодирования. В этом случае код нижестоящей группировки образуется путем добавления соответствующего количества разрядов к коду вышестоящей группировки.
Параллельные системы кодирования характеризуются тем, что они строятся на основе использования фасетной системы классификации и коды группировок по фасетам формируются независимо друг от друга.
В параллельной системе кодирования возможны два варианта записи кодов объекта:
1) Каждый фасет и признак внутри фасета имеют свои коды, которые включаются в состав кода объекта. Такой способ записи удобно применять тогда, когда объекты характеризуются неодинаковым набором признаков. При формировании кода какого-либо объекта берутся только необходимые признаки.
2) Для определения групп объектов выделяется фиксированный набор признаков и устанавливается стабильный порядок их следования, то есть устанавливается фасетная формула. В этом случае не надо каждый раз указывать, значение какого из признаков приведено в определенных разрядах кода объекта.
Параллельный метод кодирования имеет ряд преимуществ. К достоинствам рассматриваемого метода следует отнести гибкость структуры кода, обусловленную независимостью признаков, из кодов которых строится код объекта классификации. Метод позволяет использовать при решении конкретных технико-экономических и социальных задач коды только тех признаков объектов, которые необходимы, что дает возможность работать в каждом отдельном случае с кодами небольшой длины. При этом методе кодирования можно осуществлять группировку объектов по любому сочетанию признаков. Параллельный метод кодирования хорошо приспособлен для машинной обработки информации. По конкретной кодовой комбинации легко узнать, набором каких характеристик обладает рассматриваемый объект. При этом из небольшого числа признаков можно образовать большое число кодовых комбинаций. Набор признаков при необходимости может легко пополняться присоединением кода нового признака. Это свойство параллельного метода кодирования особенно важно при решении технико-экономических, состав которых часто меняется.
Наиболее сложными вопросами, которые приходится решать при разработке классификатора, являются выбор методов классификации и кодирования и выбор системы признаков классификации. Основой классификатора должны быть наиболее существенные признаки классификации, соответствующие характеру решаемых с помощью классификатора задач. При этом данные признаки могут быть или соподчиненными, или несоподчиненными. При соподчиненных признаках классификации и стабильном комплексе задач, для решения которых предназначен классификатор, целесообразно использовать иерархический метод классификации, который представляет собой последовательное разделение множества объектов на подчиненные классификационные группировки. При несоподчиненных признаках классификации и при большой динамичности решаемых задач целесообразно использовать фасетный метод классификации.
Важным вопросом является также правильный выбор последовательности использования признаков классификации по ступеням классификации при иерархическом методе классификации. Критерием при этом является статистика запросов к классификатору. В соответствии с этим критерием на верхних ступенях классификации в классификаторе должны использоваться признаки, к которым будут наиболее частые запросы. По этой же причине на верхних ступенях классификации выбирают наименьшее основание кода.