TA44250 пишет:
цитата: |
п. 1. какое программное обеспечение используется для сканирования текстов? п. 2. Я хочу отсканировать этот заголовок: Повреждения кораблей от артиллерии и борьба за живучесть п. 3. Поэтому я могу загружать его. п. 4. Какое программное обеспечение используется? |
|
Откровенно говоря, судя по таким фразам, лично мне понятно, что человек вообще не имеет понятия, что такое "графическое изображение", "текстовый файл", что делается при сканировании, какие бывают форматы графических файлов, что такое OCR-распознавание текстов и для чего это нужно.
Начнем по пунктам.
п. 1. какое программное обеспечение используется для сканирования текстов? Ответ: любое, которое позволяет запустить конкретный сканер, соединенный с конкретным компьютером.
Точнее говоря, используется то программное обеспечение, которое находится в поставке со сканером. Если сканер куплен на базаре (по цене бутылки - было со мной такое однажды), то соответствующее ПО под ЭТОТ сканер скачивается из Интернета.
Еще точнее: в поставке со сканером может находиться несколько программ:
- TWAIN-драйвер,
- Простенькая программа обработки графических текстов (в форматах jpg, tiff и т.д.),
- Простенькая программа OCR-распознавания текстов,
- Или одна большая программа по работе со сканером, в которой реализованы вышеперечисленные функции (таким любит увлекаться HP),
- Также может быть в комплекте программа управления графическими файлами на компьютере (типа: Picasa, XnWiew).
- Кроме того, существуют программы преобразования графических файлов в чертежные форматы типа dwg.
Ну и существуют "сторонние" программы обработки графики (например: Photoshop, Corel Draw и т.д.)
Из моего опыта: лично мне хватает установки соответствующего TWAIN-драйвера под конкретный сканер. Если таковой существует и установлен, то сканировать можно в любой программе обработки графики, в которой есть функция обращения к сканеру. Моя любимая - старенький Photo Editor. Подходят и другие класса Adobe Photoshop.
Особое замечание по сканерам НР: у меня было несколько раз общения со сканерами НР с одним и тем же результатом: "нуегонафиг общаться со сканерами НР".
Проблема в том, что в тех НР-сканерах не было TWAIN-драйвера, а работа предлагалась только в специальной НР-программе, которая требовала кучу излишних действий и клацаний кнопками, при этом либо без запоминаний адресов папок и настроек, либо с требованием создавать настроечные файлы и т.д. Короче - расчет на каких-то дебилов, которые вообще ничего не понимают в процессе сканирования.
п. 1. какое программное обеспечение используется для сканирования текстов? Ответ с другой стороны: сканирование и текстов, и картинок выполняется одинаково. Только предварительно надо понимать, какие последующие действия должны выполняться с отсканированным файлом? (Для чего требуется выполнить сканирование?).
От этого зависят настройки процесса.
Процесс может выполняться в двух принципиальных отличиях:
- в цвете,
- в оттенках серого.
Если сканируется цветная картинка, которую потом будут использовать как картинку, то надо установить (выбрать) настройку "в цвете".
Если сканируется картинка в оттенках серого или черно-белый текст, то выбирается настройка "в оттенках серого".
Опыт показывает, что многие не видят этой разницы и часто сканируют черно-белые изображения в цвете. При этом не понимая, что цветная картинка как минимум будет занимать в три раза больше места. При сканировании в оттенках серого на одну точку ("пиксел") выделяется один байт (8 битов). При цветном сканировании - как минимум ТРИ байта (24 бита). А есть сканеры и под 48 битов на одну точку (6 байт). Есть разница: 1 байт или 3 (или 6) на одну точку? Подумайте.
Следующим важным показателем настроек сканирования - разрешение (Resolution).
Обычно выбирается одно из нескольких:
- 100 dpi (точек_на_дюйм),
- 200,
- 300,
- 400.
(Есть и другие варианты).
Разница: - если с полученным файлом ничего делаться не будет, то достаточно и 100 дпи.
Но есть угроза получить "муар" - особенно при сканировании изображений из журналов, газет, которые отпечатаны "точками". Раскрываете книгу по программированию, видите там картинки с экрана с "муаром" - понятно, что авторы ничего не понимали в сканировании.
Чтобы получить качественный файл после сканирования, бывает полезно сканировать с бОльшим разрешением, но потом уменьшить картинку, "гуляясь" изменением разрешения и размера. Дело в том, что если меняется разрешение в программе обработки графики, то при этом в другую сторону меняется габарит картинки. Например: отсканировали картинку шириной 5 см в 300 дпи. В программе поменяли разрешение на 100 дпи. При этом ширина картинки увеличилась в три раза (стала 15 см). После чего можно задействовать уменьшение размера (Resample). Причем, несколькими разами (например, несколько раз уменьшая размер на 70%, а не один раз на 33%). Вот при таких действиях муар и уходит.
Но есть еще один нюанс: я столкнулся с ситуацией, когда при изменении размера качество изображения в разных программах (по крайней мере в "старых") отрабатывается по-разному (в смысле в одной программе хуже, в другой лучше). Возможно в новых этой проблемы уже нет.