Содержание
Преобразование отсканированных документов и изображений в редактируемые форматы Word, Pdf, Excel и Txt (простой текст)
Веб-сервис Free Online OCR
Free Online OCR — еще один бесплатный веб-сервис, очень похожий на предыдущий, но с расширенными функциями. Он:
- Он поддерживает 106 языков.
- Обрабатывайте многостраничные документы, в том числе на нескольких языках.
- Он распознает текст на отсканированных изображениях и фотодокументах многих типов. Помимо 10 форматов графических изображений, он управляет документами pdf, djvu, doxc, odt, zip-архивами и сжатыми файлами Unix.
- Сохраните выходные файлы в одном из 3-х форматов: txt, doc и pdf.
- Он поддерживает распознавание математических уравнений.
- Поворачивает изображение на 90–180 ° в обоих направлениях.
- Правильно распознает текст в нескольких столбцах на странице.
- Может распознать выбранный фрагмент.
- После обработки предлагает скопировать файл в буфер обмена, загрузить на компьютер, загрузить в сервис Google Docs или опубликовать в Интернете. Вы также можете мгновенно перевести текст на другой язык с помощью Google Translate или Bing Translator.
Мы должны отдать должное бесплатному онлайн-распознаванию текста за то, что оно хорошо читает изображения с низким разрешением и низкой контрастностью. Результат распознавания всех предоставленных ему русскоязычных текстов отказался быть стопроцентным или близким к нему.
Бесплатное онлайн-распознавание текста, на наш взгляд, является одной из лучших альтернатив FineReader, но оно обрабатывает бесплатно только 20 страниц (правда, на какой период не указано). Дальнейшее использование сервиса стоит от 0,5 доллара за страницу.
OCR CuneiForm
Бесплатная программа для чтения текстовой информации с изображений. Точность распознавания на порядок ниже, чем у предыдущей исследуемой программы. Но что касается бесплатной утилиты, то функциональность все равно отличная.
Интересный! CuneiForm распознает блоки текста, графики и даже различные таблицы. Также можно читать таблицы без строк.
Программа умеет читать и сохранять шрифт и размер распознанного текста. База шрифтов содержит большинство используемых гарнитур. Также поддерживается распознавание текста с пишущей машинки.
Для обеспечения точности к процессу распознавания прилагаются специальные словари, которые заполняют словарный запас отсканированных документов.
Преимущества:
- бесплатное распространение;
- использовать словари для проверки правильности текста;
- отсканированные тексты с фотокопий плохого качества.
Растрескивание:
- относительно невысокая точность;
- поддерживается небольшое количество языков.
Веб-сервис Free-OCR.com
Free-OCR.com (OCR — Optical Character Recognition, Optical Character Recognition) — это бесплатный интернет-сервис для распознавания отсканированного или сфотографированного текста, сохраненного в формате графического изображения (jpg, gif, tiff, bmp) или pdf. Он поддерживает 29 языков, в том числе русский и украинский, причем пользователь может выбрать не один, а несколько, если исходный текст их содержит.
Free-OCR не требует регистрации и не имеет ограничений по количеству загружаемых документов. Ограничен только размер файла — до 6 Мб. Сервис не обрабатывает многостраничные документы, точнее игнорирует все, кроме первого листа.
Скорость распознавания отсканированного текста довольно высока. Лист формата А4 с фрагментом книги на русском языке обрабатывался примерно за 5 секунд, но качество было невысоким. Крупные шрифты — как в детских книжках их распознает на 100%, а средние и мелкие — примерно на 80%. Немного лучше обстоит дело с англоязычными документами: мелкий, малоконтрастный шрифт распознается правильно примерно на 95%.
Readiris
Программа Readiris от бельгийского разработчика IRIS действительно является настоящим конкурентом российской ABBYY FineReader. Мощный, быстрый, кроссплатформенный, основанный на запатентованном движке OCR, который используют производители Adobe, HP и Canon, он отлично распознает даже самые трудные для чтения тексты. Он поддерживает 137 языков, в том числе русский и украинский.
Возможности и функции Readiris:
- Самая высокая скорость обработки файлов среди приложений этого класса, рассчитана на большие объемы.
- Сохранение исходного форматирования текста (шрифты, размер, стиль письма).
- Обработка одиночных и пакетных файлов, поддержка многостраничных документов.
- Распознавание математических уравнений, специальных символов и штрих-кодов.
- Очистите текст от «шума» — линий, подтеков и т.д.
- Интеграция с различными облачными сервисами: Google Docs, Evernote, Dropbox, SharePoint и некоторыми другими.
- Поддержка всех современных моделей сканеров.
- Форматы входных данных: pdf, djvu, jpg, png и другие, в которых графические изображения сохраняются, а также принимаются непосредственно со сканера.
- Форматы выходных данных: doc, docx, xls, xlsx, txt, rtf, html, csv, pdf. Поддерживается преобразование в djvu.
Интерфейс программы русский, использование интуитивно понятно. Он не дает пользователям возможности редактировать содержимое pdf файлов, как FineReader, но с основной задачей: распознавание текста, на наш взгляд, отлично ладит.
Readiris доступен в двух платных версиях. Стоимость лицензии Pro составляет 99 евро, корпоративной — 199 евро. Почти как ABBYY.
Microsoft OneNote
Программа для создания заметок Microsoft OneNote, за исключением очень старой и более новой версии 17, также содержит функцию распознавания текста. Он не такой продвинутый, как в специализированных приложениях, но его можно использовать, даже если нет других вариантов.
Чтобы распознать текст на изображении с помощью OneNote, вставьте изображение в файл («Изображение» — «Вставить»), щелкните его правой кнопкой мыши и выберите «Копировать текст из изображения».
Затем вставьте скопированный текст в любое место заметки.
По умолчанию установлен английский язык распознавания. Если вам нужен русский или любой другой, пожалуйста, измените настройку вручную.
Качество распознавания русского текста в Microsoft OneNote оставляет желать лучшего, поэтому его нельзя назвать полноценной заменой FineReader. И обрабатывать в нем большие многостраничные документы очень неудобно.
SimpleOCR
Замечательная маленькая программа для распознавания текста по изображениям. Он также поддерживает чтение рукописей. Проблема в том, что русского нет ни в языковой пакет интерфейса, ни в список поддерживаемых языков для распознавания.
Однако, если вам нужно сканировать на английском, датском или французском языках, лучшего бесплатного варианта нет.
В своей области программа обеспечивает точное декодирование символов, удаление шума и извлечение графики. Кроме того, в интерфейс программы интегрирован текстовый редактор, практически идентичный WordPad, что значительно увеличивает удобство использования программы.
Преимущества:
- точное распознавание текста;
- удобный текстовый редактор;
- убрать шум с изображения.
Растрескивание:
- полное отсутствие русского языка.
- https://convertio.co/ru/ocr/
- https://CompConfig.ru/software/programmy-i-servisy-dlya-skanirovaniya.html
- https://pomogaemkompu.temaretik.com/930401132721474208/5-besplatnyh-programm-dlya-skanirovaniya-i-raspoznavaniya-teksta/