Сведения, содержащиеся в БД, должны правильно и полностью отображать все свойства объекта. (Имеются в виду свойства, выбранные для фиксации в БД.) В этом случае информацию, хранимую в БД, можно считать целостной и достоверной. Факторы, вызывающие нарушения достоверности данных, могут быть самыми разными.
Ввод неправильных данных. В исходных документах или файлах с информацией, которыми вы пользуетесь для заполнения таблиц базы данных, могут быть неправильные данные. Некоторой защитой может служить проверка, при которой вводимые данные сравниваются с диапазоном допустимых значений. Например, цифра в бухгалтерской таблице, характеризующая месячную стипендию, не может быть меньше пятисот и больше тысячи рублей. Такие проверки помогают преодолеть некоторые трудности, но далеко не все. Если в документах имеются неправильные значения, не выходящие из допустимого диапазона, то в результате проверок ничего подозрительного обнаружено не будет.
Ошибка оператора. Данные, предназначенные для ввода в БД, могут быть правильными, но оператор при вводе допустит ошибку. Решение состоит в том, чтобы все вводимые данные независимо проверялись еще и вторым оператором. Такой подход обходится дорого, потому что независимая проверка удваивает количество работников и затраченное на работу время. Хотя в некоторых случаях, когда целостность данных очень важна, дополнительные усилия и затраты себя оправдывают.
Чтобы уменьшить вероятность ошибки, работа с данными всегда производится через форму. Её использование делает работу более удобной, что снижает вероятность ошибки.
Механическое повреждение. При механическом повреждении носителя, данные могут быть испорчены. Главная защита против подобной неприятности — резервное копирование.
Злой умысел. Не следует исключать возможности умышленной порчи данных. Первая линия обороны – это запрещение доступа к базе данных всем посторонним лицам. Это достигается закрытием физического доступа к компьютеру и установкой парольной защиты на доступ к работе. Вторая линия обороны состоит в том, что каждый пользователь получает доступ только к данным, находящимся в его компетенции. Третья линия – хранение резервных копий данных в безопасном месте. Напомним, что главной ценностью БД являются таблицы, всё остальное легко восстановить.
Избыточность данных. Избыточность не только означает ненужный расход места на диске и замедление обработки, но также может привести и к серьезному повреждению данных. Если вы храните один и тот же элемент данных в двух разных таблицах базы данных, то одна его копия может быть изменена, а другая, что находится во второй таблице, может остаться прежней. Такая ситуация приводит к расхождениям, и может случиться так, что вы не сможете сказать, какой из двух вариантов является правильным. Желательно сводить избыточность данных к минимуму. Определенная избыточность необходима, так как для установки связи между таблицами в них должно быть, как минимум, по одному одинаковому столбцу. Однако любой другой избыточности старайтесь избегать.
Самый распространенный метод уменьшения избыточности нормализация.Он состоит в том, что одна таблица из базы данных разбивается на две или несколько простых. Правда, после того как вы уберете большую часть избыточности из проекта базы данных, то, возможно, обнаружите, что ее производительность стала никуда не годной. Проектировщики БД часто используют избыточность специально для того, чтобы ускорить обработку данных.
Распространенная среди пользователей практика состоит в том, чтобы вначале проектировать базу данных с малой избыточностью и с высокой степенью нормализации, а затем, обнаружив, что важные приложения работают медленно, выборочно добавлять избыточность и уменьшать нормализацию. Главное слово здесь – "выборочно". Добавляемая избыточность предназначена для определенной цели, и так как она представляет определенный риск, предпринимайте соответствующие меры к тому, чтобы избыточность вызывала проблем не больше, чем решала.
Превышение технических возможностей базы данных. Система базы данных может работать безукоризненно годами, а затем периодически начать выдавать ошибки, которые постепенно становятся все более серьезными. Это означает наступление одного из пределов емкости системы.
Существуют пределы количества строк таблицы, а также предел столбцов, ограничений и других характеристик. Поэтому старайтесь контролировать соответствие текущего размера и содержимого вашей базы данных техническим характеристикам вашей СУБД. Если вы обнаружили, что предел какого-либо свойства уже близок, займитесь улучшением возможностей системы. Или заархивируйте старые данные, к которым вы больше не обращаетесь, а затем удалите их из базы данных.