Как захватить текст с изображений с помощью программы ocr

Одна из вещей, которая часто расстраивала меня, - это невозможность легко скопировать текст из изображений и определенных файлов PDF (например, те, которые могли быть созданы из отсканированных документов). К счастью, со временем были разработаны программные решения для решения этой проблемы, что позволило значительно сэкономить время, которое в противном случае было бы потрачено на копирование и повторный набор текста вручную. В сегодняшней статье я расскажу о бесплатном программном инструменте Capture2Text, который использует алгоритм оптического распознавания символов (OCR), который позволит вам захватывать текст из изображений и файлов PDF.

Установка и настройка

Для начала перейдите на страницу проекта SourceForge и загрузите последнюю версию Capture2Text. Программное обеспечение поставляется в виде zip-архива и на данный момент не содержит специального установщика. После загрузки распакуйте архив и запустите файл Capture2Text.exe. Это запустит программное обеспечение и поместит значок в системный трей:

Во-первых, вам нужно настроить параметры программного обеспечения, в частности, какие горячие клавиши (или горячие клавиши) использовать для запуска и остановки захвата:

В моем случае я решил использовать клавиши «Windows + q», чтобы начать захват, и «Enter», чтобы остановить его. Вы можете настроить эти параметры так, как вам больше нравится. Помните, что клавиша «Windows + s» часто уже используется для захвата экрана (например, такими программами, как Microsoft One Note).

На следующей вкладке можно настроить параметры оптического распознавания текста, включая язык ввода (в настоящее время поддерживается семь языков) и использовать ли предварительную обработку распознавания для повышения точности (настоятельно рекомендуется). Наконец, на вкладке «Вывод» среди других параметров можно выбрать, сохранять ли захваченный текст в буфер обмена или запускать отдельное всплывающее окно.

Использование программного обеспечения

После того, как программное обеспечение установлено и настроено, вы можете начать использовать его с помощью комбинации клавиш быстрого запуска. С помощью мыши выберите область на изображении, содержащую текст, который вы хотите захватить. Чтобы остановить захват, просто нажмите горячую клавишу, которую вы выбрали, чтобы остановить захват. Затем текст будет скопирован либо в буфер обмена, либо во всплывающее окно вывода, либо в оба. Пример можно увидеть ниже.

Благодаря моему быстрому тестированию инструмента с изображениями, я нашел его точность приличной. Очевидно, что существуют ограничения для таких инструментов, как этот и OCR в целом. Например, сильно измененный текст (очень курсивный, курсив или современный) может работать не так хорошо, а иногда и вовсе не работать. Кроме того, в некоторых случаях это поможет немного отрегулировать размеры рамки захвата или поиграть с увеличением самого изображения, чтобы получить более точный результат.

При захвате текста из отсканированных документов PDF точность в порядке, с некоторыми последними изменениями, как правило, все еще необходимыми для снятого вывода (в зависимости от качества исходного сканирования). Кроме того, я заметил, что обработка программного обеспечения может занять несколько секунд, особенно когда его просят преобразовать большие объемы текста.

Тем не менее, в целом, я думаю, что инструмент хорошо работает, тем более что он доступен бесплатно - я призываю вас попробовать его.

Приложение от 16.11.2015:

В качестве другого варианта, для тех, у кого есть учетные записи Google, также можно использовать возможности распознавания Google, загрузив файл на свой диск Google (более подробную информацию можно найти здесь). Кроме того, для пользователей Google Chrome доступен также плагин OCR под названием Copyfish, который вы также можете попробовать.