Для того, чтобы информацию из документов можно было быстро находить, сортировать или группировать с целью получения итоговых данных, необходимо наличие в документах соответствующих реквизитов-признаков. Такие реквизиты-признаки должны быть закодированы условными обозначениями. Присвоение условных обозначений реквизитов осуществляется на основании классификаторов.
Классификатор — это систематизированный свод однородных наименований объектов по классификационным признакам (номенклатура) и их кодовых обозначений.
Код — условное обозначение объекта цифровым или алфавитно-цифровыми знаками по определенным правилам, установленным системами кодирования.
Существуют международные и общегосударственные классификаторы.
Международные классификаторы входят в состав Системы международных экономических стандартов (СМЭС). К ним относятся:
МСОК – отраслевая классификация всех видов экономической деятельности;
КОП - Международная стандартная торговая классификация основных продуктов и т.д.
Классификаторы, действующие на территории Российской Федерации, входят в Единую систему классификации и кодирования (ЕСКК). ЕСКК состоит из:
- общероссийских классификаторов. В настоящее время существует свыше 40 общероссийских классификаторов, действие которых распространяется на все объекты финансово-хозяйственной деятельности (ОКПО, ОКФС, СОАТО, ИНН и т.д.);
- отраслевых классификаторов, действующих для некоторых отраслей производства или видов деятельности (коды бухгалтерских счетов, коды видов оплаты и удержаний, виды операций с материальными ценностями и т.д.);
- региональных классификаторов, действующих для данной территории;
- локальных классификаторов, действующих для отдельного предприятия.
Локальные классификаторы составляются на номенклатуры, специфичные для данной организации. Сюда входит широкий круг номенклатур, используемых различными подразделениями и службами ее управления, например сотрудники, подразделения, продукция и т.п. Локальные коды должны быть едиными при решении различных экономических задач.
Составления локальных классификаторов осуществляется в два этапа. На первом этапе выполняется классификация информации, на втором — ее кодирование.
Классификация начинается с выявления номенклатуры объектов подлежащих кодированию.
Классифицирование – это деление множества объектов на классы в соответствии с нужным признаком. Такой признак называется классификационным. Значение классификационного признака позволяет установить сходство или различие объектов.
Существуют иерархический и фасетный методы классификации объектов.
Если классификационных признаков несколько и между ними существует иерархическая соподчиненность, то применяется иерархическая классификация. Иерархическая система классификации строится следующим образом:
- исходное множество объектов делится на классы в соответствии со значениями первого классификационного признака,
- полученные классы делятся на подклассы в соответствии со значениями второго классификационного признака, и т.д.
Например, требуется классифицировать всех студентов по факультету, специальности, возрасту. Первый классификационный признак название факультета позволяет выделить несколько классов с разными названиями факультетов (например, 10 разных наименований). Если на каждом факультете одинаковое количество специальностей, например по пять, то по второму классификационному признаку мы получим 50 подклассов с разными названиями специальностей. Допустим, третий классификационный признак имеет три градации: до 20 лет, от 20 до 25 лет, свыше 25 лет, тогда каждый подкласс будет разбит на три возрастных подкласса.
Если между признаками нет иерархической зависимости, то применяется фасетная классификация. Она используется для такого деления модели на классы, при котором ранг всех признаков одинаков. Классы-фасеты получают путем отнесения объектов в классы согласно значениям признаков одновременно. Например, множество студентов нужно разделить по двум признакам: пол, образование (среднее, среднее специальное и высшее). В результате получатся независимые классы-фасеты. Полученные таким образом фасеты позволяют с помощью операций пересечения, объединения и др. получать ответы на различные вопросы. Например, определить студентов мужчин с высшим образованием.
Кодирование – это процесс присвоения условного обозначения объектам.
Коды могут быть цифровыми, буквенными и буквенно-цифровыми.
Применяется несколько систем кодирования: порядковая, серийная, позиционная, комбинированная.
Порядковая система кодирования предполагает присвоение всем позициям кодируемой номенклатуры порядковых номеров без пропусков. Кодируемые объекты при этом не должны изменяться.
Серийная система ориентирована на кодирование объектов, которые предварительно сгруппированы в серии. Сериям присваиваются номера с учетом их возможных расширений. Например, группа коды продовольственных товаров – коды от 01 до 59, группа коды хозяйственных товаров – коды от 60 до 99.
Позиционная система кодирования отражает иерархическую соподчиненность признаков классификации. В коде каждому признаку отводится один или несколько разрядов в зависимости от значности кода признака. Например, разработать код группы, классификационные признаки специальность и год поступления. Если первый классификационный признак имеет значения от 01 до 99, в второй – от 0 до 9, то для номера группы требуется задать трехзначный код. Например, в коде группы студентов 119: 11- код специальности, 9 - год поступления студентов.
Комбинированная система так же, как и позиционная, предусматривает четкое выделение всех признаков номенклатуры. Но при этом каждый признак может кодироваться по любой системе: порядковой, серийной или позиционной. Комбинированная система более гибкая и широко применяется при решении экономических задач, поскольку обеспечивает автоматическое получение всех необходимых итогов в соответствии с выделенными признаками. Например, если на одну специальность поступает много студентов и их объединяют в несколько групп, то рассмотренный выше позиционный код может быть дополнен еще одним разрядом, формирование значения которого будет осуществляться в соответствии с порядковой системой. Тогда в коде группы студентов 1191 значение 11- код специальности, 9 - год поступления студентов, 1 - номер группы в потоке.
Суть и цель разработки классификаторов. Состав и содержание операций проектирования классификаторов экономической информации.
Целью, разработки классификаторов является установление соответствия между значениями справочных или описательных признаков какого-либо элемента или процесса и значениями группировочных признаков, например между значением реквизита «Фамилия И.О. рабочего» и значением «Табельный номер» рабочего или между значениями «Наименование материала» и «Код материала».
Все классификаторы, разрабатываемые и используемые в ЭИС, имеют эталонную и рабочую формы. Эталонная форма классификатора- это официальное издание классификатора на бумажном носителе, удобное для осуществления его ведения.Рабочая форма классификатора- это весь классификатор или его раздел, занесенный на машинный носитель и удобный для обработки информации.
Весь процесс разработки системы классификаторов для ЭИС можно разбить на четыре этапа.
На первом этапе«Разработка ТЗ на проектирование»выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе.Переченьклассификаторовопределяется на основе анализа реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов-признаков.
Далее определяют назначение классификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи или для поиска и логической обработки первичной информации с целью получения и выдачи результатной информации.
Содержанием второго этапаявляется«Разработка методических материалов проектирования», которая включает прежде всегоразработку основных критериев и принципов построения каждого классификатора. К критериям построения классификатора относятся такие, как:
• критерий отнесения того или иного объекта к конкретному классифицируемому множеству;
• степень охвата кодируемого множества объектов.
Третий этапсвязан с работами поорганизации сбора и обработки исходных данных, необходимых для составления классификаторов. К их числу относитсяразработка инструктивных материаловпо сбору и обработке исходных данных:
• определение перечня решаемых задач, использующих классификаторы;
• выделение классифицируемых объектов;
• определение состава признаков классификации и значений признаков;
• осуществление лингвистической обработки этих данных (удаление синонимов, омонимов, полисемии, антонимов и др.);
• согласование используемой терминологии в исходных данных
с ГОСТами.
На четвертом этапе «Составление классификаторов и системы их ведения» осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора.
Эталонный классификатордолжен быть согласован, отпечатан типографским способом и распространен всем пользователям для кодирования информации первичных документов.
Рабочие классификаторынаносятся на машинные носители в необходимых разрезах, передаются пользователям и заносятся в файлы справочников баз данных для выполнения процедуры автоматического заполнения машинных форм первичных документов и для декодирования результатной информации, получаемой после ее обработки.