Сканер – это устройство ввода в ЭВМ информации непосредственно с бумажного документа. Можно вводить тексты, схемы, рисунки, графики, фотографии и другую графическую информацию.
Сканеры являются важнейшим звеном электронных систем обработки документов и необходимым элементом любого "электронного стола". Записывая результаты своей деятельности в файлы и вводя информацию с бумажных документов в ПК с помощью сканера с системой автоматического распознавания образов, можно сделать реальный шаг к созданию систем безбумажного делопроизводства.
Сканеры весьма разнообразны, и их можно классифицировать по целому ряду признаков. Сканеры бывают черно-белые и цветные.
Черно-белые сканеры могут считывать штриховые изображения и полутоновые. Штриховые изображения не передают полутонов или, иначе, уровней серого. Полутоновые позволяют распознать и передать 16, 64 или 256 уровней серого.
Цветные сканеры работают и с черно-белыми, и с цветными оригиналами. В первом случае они могут использоваться для считывания и штриховых, и полутоновых изображений.
В цветных сканерах используется цветовая модель RGB: сканируемое изображение освещается через вращающийся RGB-светофильтр или от последовательно зажигаемых трех цветных ламп; сигнал, соответствующий каждому основному цвету, обрабатывается отдельно. Число передаваемых цветов колеблется от 256 до 65536 (стандарт High Color) и даже до 16,7 млн. (стандарт True Color).
Разрешающая способность сканеров составляет от 75 до 1600 dpi (dot per inch).
Конструктивно сканеры бывают ручные и настольные. Настольные, в свою очередь, делятся на планшетные, роликовые и проекционные.
Ручные сканеры конструктивно самые простые: они вручную перемещаются по изображению. С их помощью за один проход вводится лишь небольшое количество строчек изображения (их захват обычно не превышает 105 мм). У ручных сканеров имеется индикатор, предупреждающий оператора о превышении допустимой скорости сканирования. Эти сканеры имеют малые габариты и низкую стоимость. Скорость сканирования 5-50 мм/с (зависит от разрешающей способности).
Пример 4.17. Сканеры Mustek: GS-400L – черно-белый полутоновый, CG-8400T – цветной.
Планшетные сканеры самые распространенные; в них сканирующая головка перемещается относительно оригинала автоматически; они позволяют сканировать и листовые, и сброшюрованные (книги) документы. Скорость сканированя 2-10 с на страницу (формат А4).
Пример 4.18. Цветные сканеры: Mustek Paragon 1200, Epson ES1200, HP Scan Jet 11CX.
Роликовые сканеры наиболее автоматизированы; в них оригинал автоматически перемещается относительно сканирующей головки, часто имеется автоматическая подача документов, но сканируемые документы только листовые.
Пример 4.19. Сканер Mustek SF-630, скорость 10 с на страницу.
Проекционные сканеры внешне напоминают фотоувеличитель, но внизу лежит сканируемый документ, а наверху находится сканирующая головка. Сканер оптическим образом сканирует информационный документ и вводит полученную информацию в виде файла в память компьютера.
Файл, создаваемый сканером в памяти машины, называется битовой картой.
Существуют два формата представления графической информации в файлах компьютера: растровый формат и векторный.
В растровом формате графическое изображение запоминается в файле в виде мозаичного набора множества точек (нулей и единиц), соответствующих пикселям отображения этого изображения на экране дисплея. Редактировать этот файл средствами стандартных текстовых и графических процессоров не представляется возможным, ибо эти процессоры не работают с мозаичным представлением информации. В текстовом формате информация идентифицируется характеристиками шрифтов, кодами символов, абзацев и т.п. Стандартные текстовые процессоры предназначены для работы именно с таким представлением информации.
Следует также иметь в виду, что битовая карта требует большого объема памяти для своего хранения. Так, битовая карта с 1 листа документа формата А4 (204x297 мм) с разрешением 10 точек/мм и без передачи полутонов (штриховое изображение) занимает около 1 Мбайта памяти, она же при воспроизведении 16 оттенков серого – 4 Мбайта, при воспроизведении цветного качественного изображения (стандарт High Color – 65536 цветов) – 16 Мбайт. Иными словами, при использовании стандарта True Color и разрешающей способности 50 точек/мм для хранения даже одной битовой карты может не хватить емкости НЖМД. Сокращение объема памяти, необходимой для хранения битовых карт, осуществляется различными способами сжатия информации, например TIFF (Tag Image File Format), CTIFF (Compressed TIFF), JPEG, PCX, GIF (Graphics Interchange Format – формат графического обмена) и др. (файлы с битовыми картами имеют соответствующие указанным аббревиатурам расширения).
Наиболее предпочтительным является использование сканера совместно с программами систем распознавания образов, например типа OCR (Optical Character Recognition). Система OCR распознает считанные сканером с документа битовые (мозаичные) контуры символов (букв и цифр) и кодирует их ASCII-кодами, переводя в удобный для текстовых редакторов векторный формат.
Некоторые системы OCR предварительно нужно обучить распознаванию – ввести в память сканера шаблоны и прототипы распознаваемых символов и соответствующие им коды. Сложности возникают при распознавании букв, совпадающих по начертанию в разных алфавитах (например, в латинском (английском) и в русском – кириллица), и разных гарнитур (способов начертания) шрифтов. Но большинство систем не требуют обучения: в их памяти уже заранее помещены распознаваемые символы. Так, одна из лучших OCR – программный пакет TIGER 2.0 содержит прототипы 30 различных гарнитур, а для распознавания английских и русских букв использует встроенные электронные словари.
В последние годы появились интеллектуальные программы распознавания образов типа Omnifont, которые опознают символы не по точкам, а по характерной для каждого из них индивидуальной топологии. При наличии системы распознавания образов текст записывается в память ПК уже не в виде битовой карты, а в виде кодов, и его можно редактировать обычными текстовыми редакторами.
Сканер подключается к параллельному порту ПК. Для работы со сканером ПК должен иметь специальный драйвер, желательно драйвер, соответствующий стандарту TWAIN. В последнем случае возможна работа с большим числом TWAIN-совместимых сканеров и обработка файлов поддерживающими стандарт TWAIN программами, например распространенными графическими редакторами Corel Draw, Max Mate, Picture Publisher, Adobe Photo Shop, Photo Finish. Большинство драйверов ориентированы на работу с локальным компьютерным интерфейсом SCSI.