Почему пора прекратить сканировать документы в черно-белом формате

Сегодня многие до сих пор сохраняют отсканированные документы в виде файлов с изображениями, таких как TIFF, JPEG, PNG и BMP. Если вы тоже так делаете, знайте, вы просто создаете рисунок своего документа, который является исключительно визуальным представлением и ничем больше. Такой файл не допускает возможность поиска. Он не доступен для лиц с ограниченными возможностями и имеет множество недостатков.

Иногда в результате такого сканирования вы получаете беспорядочное множество разнообразных форматов изображений, которые лишь усложняют работу.

Другим серьезным недостатком такого подхода является отсутствие метаданных. Конечно, есть варианты размещения некоторых метаданных в файлах в формате TIFF. Но для JPEG это совершенно невозможно. По этой причине во многостраничных отсканированных документах вы в итоге получаете и JPEG, и TIFF-файлы.

Последний, но не менее важный недостаток заключается в том, что эти «документы» совершенно не доступны для лиц с ограниченными возможностями. В общем, такой результат непозволителен для современной компании. Приемлемым является формат PDF. И на то есть целый ряд причин.

Формат PDF основан на стандарте ISO 32000, в который включено все, что нужно

Согласно Международной организации по стандартизации, ISO 32000 «определяет цифровую форму для представления электронных документов, позволяющую пользователям обмениваться и просматривать электронные документы, вне зависимости от среды, в которой они были созданы, или среды, в которой они просматриваются или печатаются».

PDF обеспечивает сжатие без потерь

PDF обеспечивает сжатие черно-белых документов без потерь, благодаря чему качество изображения одинаково на любом экране и при любом количестве пикселей. Сравните его с отсканированной страницей, и вы увидите качество. И не заметите никакой разницы.

Слои PDF идеально воссоздают любой документ

Отсканировав документы в черно-белом виде, вы можете преобразовать их в PDF, что сделает их меньше и доступными для поиска. Также вы сможете уменьшить общий размер архива цветных документов. В любом случае такой подход позволит вам сэкономить пару-тройку гигабайт.

Иногда крохотные детали могут серьезно усложнить процесс сканирования документов. К примеру, маркетинговые материалы. Как правило, они состоят из черно-белых, а иногда и цветных, текстовых символов. Часто можно встретить различные изображения, например, логотип компании, где цвета и текст соединены вместе.

И ни одна схема сжатия недаст сделать такой документ небольшим по размеру и при этом сохранить текст в идеальном виде. PDF позволяет использовать многоуровневую структуру и сегментировать такое изображение на упорядоченные данные, которые можно проработать слой за слоем, выбрав наилучшую применимую схему сжатия. Это может быть JPEG или даже TIFF Group 4. В PDF доступно все.

Здесь слои отсортированы иначе, чем, к примеру, в JPEG, где будут проблемы в текстовой части, или TIFF, где возможны проблемы в отношении изображений. Мы сегментируем все эти слои и соответствующим образом их классифицируем. Фоновый слой — это простое изображение документа, которое может быть сжато в JPEG или JPEG 2000. Средний слой — это извлеченный черно-белый текст. Передний слой содержит в себе цвета, относящиеся к тому или иному участку текста. Все эти слои накладываются друг на друга и автоматически объединяются в любой программе для просмотра PDF, благодаря которой мы видим идеальный документ. В то же время становится возможным значительное сжатие слоев, поскольку они отсортированы в соответствии со специализированной системой сжатия.

Файлы формата PDF доступны для лиц с ограниченными возможностями

Во многих государствах действуют законы, согласно которым разрабатываемая или приобретаемая электронная информация должна быть доступна для людей с нарушениями зрения или слуха. Многие предприятия и частные организации также переняли данную политику

Итак, больше не нужно сканировать документы в черно-белом виде. Вы можете делать сканы в формате PDF, сохраняя все цвета и особенности. Полученный файл будет гораздо качественнее и меньше по весу, чем визуальное отображение в формате TIFF. Кроме того, с форматом PDF удобно работать всем категориям граждан.