Надежность информационных систем
Надежность - важнейшая характеристика качества любой системы, поэтому разработана специальная теория - теория надежности.
Теория надежности может быть определена как научная дисциплина, изучающая закономерности, которых следует придерживаться при разработке и эксплуатации систем для обеспечения оптимального уровня их надежности с минимальными затратами ресурсов.
Надежность - характеристика временная, она может быть ориентирована либо в прошлое, либо в будущее время и не допускает «точечных» во времени оценок. Иными словами, надежность - это свойство системы «штатно» функционировать во времени.
Надежность - комплексное свойство системы; оно включает в себя более простые свойства, такие как безотказность, ремонтопригодность, долговечность и т. д.
Основные показатели надежности
Показатель надежности - это количественная характеристика одного или нескольких свойств, определяющих надежность системы. В основе большинства показателей надежности лежат оценки наработки системы, то есть продолжительности или объема работы, выполненной системой. Показатель надежности, относящийся к одному из свойств надежности, называется единичным. Комплексный показатель надежности характеризует несколько свойств, определяющих надежность системы.
Ниже приводятся наименования основных показателей надежности систем и их определения в соответствии с ГОСТ 27.002-80 «Надежность в технике. Термины и определения».
Единичные показатели надежности
К единичным показателям надежности в соответствии с ГОСТ 27.002-80 относятся показатели безотказности, показатели ремонтопригодности и показатели долговечности.
Показатели безотказности
1. Вероятность безотказной работы - вероятность того, что в пределах заданной наработки отказ системы не возникнет.
2. Вероятность отказа - обратная величина, вероятность того, что в пределах заданной наработки отказ системы возникнет.
3. Средняя наработка до отказа - математическое ожидание наработки системы до первого отказа (существенно для невосстанавливаемых систем).
4. Средняя наработка на отказ - отношение наработки восстанавливаемой системы к математическому ожиданию числа ее отказов в пределах этой наработки (имеет смысл только для восстанавливаемых систем).
5. Интенсивность отказов - условная плотность вероятности возникновения отказа невосстанавливаемой системы, определяемая для рассматриваемого момента времени при условии, что до этого момента отказ не возник.
6. Параметр потока отказов (k(t)) - отношение среднего числа отказов для восстанавливаемой системы за произвольно малую ее наработку к значению этой наработки.
Показатели ремонтопригодности
1. Вероятность восстановления работоспособного состояния - вероятность того, что время восстановления работоспособного состояния не превысит заданного.
2. Среднее время восстановления работоспособного состояния, Тв - математическое ожидание времени восстановления работоспособного состояния системы.
Показатели долговечности
1. Средний ресурс - математическое ожидание наработки системы от начала ее эксплуатации или ее возобновления после ремонта до перехода в предельное состояние.
2. Срок службы (Тсс) - календарная продолжительность от начала эксплуатации системы или ее возобновления после ремонта до перехода в предельное состояние.
Комплексные показатели надежности
1. Коэффициент готовности (Кг) - вероятность того, что система окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение системы по назначению не предусматривается

2. Коэффициент оперативной готовности - вероятность того, что система окажется в работоспособном состоянии в произвольный момент времени, кроме планируемых периодов, в течение которых применение системы по назначению не предусматривается, и начиная с этого момента будет работать безотказно в течение заданного времени.
3. Коэффициент технического использования - отношение математического ожидания интервалов времени пребывания системы в работоспособном состоянии за некоторый период эксплуатации к сумме математических ожиданий интервалов времени пребывания системы в работоспособном состоянии, простоев, обусловленных техническим обслуживанием, и ремонтов за тот же период эксплуатации

где Тп - время простоя системы, обусловленное выполнением планового технического обслуживания и ремонта (время профилактики), пересчитанное на один отказ.
4. Коэффициент сохранения эффективности - отношение значения показателя эффективности за определенную продолжительность эксплуатации к номинальному значению этого показателя, вычисленному при условии, что отказы в системе в течение того же периода эксплуатации не возникают.
Коэффициент сохранения эффективности характеризует степень влияния отказов в системе на эффективность ее применения по назначению. Из ранее приведенного определения теории надежности следует, что коэффициент сохранения эффективности может служить интегральным критерием оптимизации надежности системы. Действительно, критерий оптимизации - это показатель, для которого указана желаемая его величина или желаемое направление его изменения. Направление изменения коэффициента сохранения правильно выбранного показателя эффективности определяет основные ориентиры в поиске свойств системы, которые обеспечивают ее оптимальную надежность.
Для пользователей сложных информационных систем понятие их надежности ощущается в наибольшей степени по коэффициенту готовности системы КГ, то есть по отношению времени работоспособного состояния системы к времени ее незапланированного простоя. Для типичного современного сервера Кг = 0,99, что означает примерно 3,5 суток простоя в год
| Коэффициент готовности | Максимальное время простоя в год | Тип системы |
| 0.99 | 3.5 сут. | обычная |
| 0.999 | 8.5 ч. | Высокой надежности |
| 0.9999 | 1 ч. | отказоустойчивая |
| 0.99999 | 5 мин. | безотказная |
Обеспечение надежности функционирования ИС
Информационная система - это сложная человеко-машинная система, включающая в свой состав эргатические звенья, технические средства и программное обеспечение. Все методы обеспечения надежности и достоверности И С можно отнести к двум классам. Один включает в себя методы, обеспечивающие безошибочность (безотказность, бессбойность) функциональных технических, эргатических и программных звеньев ИС, то есть, в конечном счете, повышающие их надежность. Другой - методы, обеспечивающие обнаружение и исправление ошибок, возникающих в информации, то есть методы контроля достоверности информации и ее коррекции, косвенно также повышающие функциональную надежность системы.
Названные классы не исключают, а взаимно дополняют друг друга, поскольку в такой сложной системе, как ИС, обеспечить высокую надежность и достоверность функционирования можно, только сочетая методы обоих классов.
Виды обеспечения надежности
Для построения надежных информационных систем можно использовать различные виды обеспечения:
? экономическое;
? временное;
? организационное;
? структурное;
? технологическое;
? эксплуатационное;
? социальное;
? эргатическое;
? алгоритмическое;
? синтаксическое;
? семантическое.
Обеспечение можно определить как совокупность факторов (элементов, методов, приемов, процедур, ресурсов и т. п.), способствующих достижению поставленной цели. Экономическое и временное обеспечения, обусловливаемые необходимостью соответственно материальных и временных затрат, используются для реализации процедур обеспечения достоверности. Организационное, эксплуатационное, техническое, социальное и эргатическое обеспечения применяются преимущественно для повышения надежности систем, а структурное и алгоритмическое обеспечения - для обоих классов методов.
Организационное обеспечение включает в себя вопросы разработки:
? правовых и методических аспектов функционирования ИС;
? нормативов достоверности информации по функциональным подсистемам и этапам преобразования информации;
? методики выбора и обоснования оптимальных структур, процессов и процедур преобразования информации и т. д.
Назначением структурного обеспечения является повышение надежности функционирования технических комплексов и эргатических звеньев, а также ИС в целом. Должно быть обосновано рациональное построение структуры ИС, непосредственно зависящее от качества решения таких вопросов, как выбор структуры технологического процесса преобразования информации, обеспечение обоснованных взаимосвязей между отдельными звеньями системы, резервирование элементов, узлов, устройств системы и использование специальных устройств, осуществляющих процедуры аппаратного контроля и т. д.
Технологическое и эксплуатационное обеспечения предназначены для повышения надежности работы технических средств и технологических комплексов. Технологическое обеспечение включает в себя выбор схемных и конструктивных решений применения отдельных технических устройств, технологий и протоколов реализации информационных процессов. Эксплуатационное обеспечение связано с выбором режимов работы устройств, технологий профилактического их обслуживания.
Социальное и эргатическое обеспечения имеют своим назначением повышение надежности работы эргатических структурных звеньев системы. Поскольку подавляющее большинство ошибок в информации возникает как раз из-за функциональной ненадежности именно этих звеньев (человеческого фактора), в литературе особенности их работы рассмотрены весьма обстоятельно. В одной из лучших работ по этой тематике указываются пять видов причин ошибок, возникающих в эргатических звеньях:
? психологические - неадекватность восприятия информации, выработка и реализация неоптимальной стратегии;
? мотивационные - неправильная постановка задачи, несогласованность целей субъекта с целями управления;
? эмоциональные - неустойчивые изменения преобразующих свойств субъекта от внешних и внутренних причин;
? интуитивные - неформализованный в сознании субъекта опыт, отражающий реальную ситуацию нерелевантно;
? эволюционные - устойчивые изменения преобразующих свойств субъекта в результате обучения или забывания.
Указанные причины могут привести к субъективным ошибкам трех типов:
? потере части полезной информации;
? внесению дополнительной (полезной или вредной) информации, не содержащейся в исходном сообщении;
? неадекватному преобразованию информации.
К социальному обеспечению относятся, например, такие факторы, как создание здоровой психологической обстановки в коллективе, повышение ответственности за выполненную работу, повышение квалификации специалистов, увеличение моральной и материальной заинтересованности в правильности выполнения работы. Особенно важно обеспечить согласованность целей субъекта с целями управления: лишь тогда, когда работник заинтересован в получении объективных, достоверных данных, они могут быть получены.
Эргатическое обеспечение включает в себя комплекс факторов, связанных с рациональной организацией работы человека в системе. Это, в первую очередь, правильное распределение функций между людьми и техническими средствами, обоснованность норм и стандартов работы, оптимальность интенсивности и ритмичности, построение рабочих мест в соответствии с требованиями эргономики.
Алгоритмическое обеспечение широко применяется для повышения надежности системы (обеспечение высокого качества и безошибочности алгоритмов и программ преобразования информации) и для реализации контроля достоверности информации.
Информационное синтаксическое и семантическое обеспечения заключаются во введении в ИС специальной информационной избыточности, соответственно, избыточности данных и смысловой избыточности, обусловливающих возможность проведения контроля достоверности информации.
Поскольку понятие «избыточность» - очень важное понятие в теории надежности, причем наличие избыточности является необходимым условием возможности проведения контрольных процедур, рассмотрим его более подробно.
Контрольные точки (точки рестарта, точки отката) - место повторного запуска программы при аварийном ее завершении. В контрольных точках обычно выполняются: внесение изменений в БД (в том числе всех изменений, ожидающих своей очереди - неоперативные файлы), разблокирование всех файлов, на обращение к которым был наложен запрет, запись информации о контрольной точке в системный журнал.






