Перейти к содержанию

Бесплатный распознаватель текстов


Nikolay Lazarenko

Рекомендуемые сообщения

Всем здравия желаю.

Хочется найти бесплатный распознаватель текстов...есть ли такой?

CuneiForm что-то не заработал у меня.И с виду примитивен.

Может что и найду сам...но помощь не помешала бы...

Заранее спасибо.

Ссылка на комментарий
Поделиться на другие сайты

В OCR-системе Google Docs появилась поддержка русского языка

 

Файлы, к которым можно применить функцию OCR, могут иметь разное происхождение:

 

изображения или PDF-файлы, полученные с помощью планшетных сканеров;

изображения, полученные с помощью цифровых камер или мобильных телефонов.

Из добавленных изображений и PDF-файлов извлекаются фрагменты текста, которые затем преобразуются в документы Google.

 

Чтобы качество извлеченного текста было достаточно хорошим, изображение или PDF-файл должны соответствовать определенным требованиям.

 

Разрешение. Чем выше разрешение файла, тем лучше он обрабатывается. Общее правило: высота каждой строки в документе должна составлять не менее 10 пикселей.

Ориентация. Распознаются только документы с горизонтальной ориентацией текста в написании слева направо. Если документ был отсканирован или сфотографирован в другой ориентации, поверните изображения в соответствующей программе, прежде чем добавлять их в Документы Google.

Языки, шрифты и наборы символов. В настоящее время наш алгоритм OCR поддерживает только символы латиницы, поэтому тексты, написанные, например, на японском или арабском языках, а также рукописные тексты пока не распознаются. Лучше всего распознаются распространенные шрифты, такие как Arial и Times New Roman.

Качество изображения. Лучше всего обрабатываются отчетливые изображения с равномерной освещенностью и хорошей контрастностью. Размытие или плохой фокус снижают качество распознавания текста.

Ограничения на размер файлов

 

Максимальный размер изображений (JPG, GIF и PNG) и PDF-файлов (PDF) составляет 2 МБ. В PDF-файлах при поиске текста для распознавания просматриваются только первые 10 страниц.google.

Ссылка на комментарий
Поделиться на другие сайты

Cihihen а если в двух словах то распознатся только английский текст с размером документы не больше 2 мб. Отличный функционал, ниче не скажешь)

Ссылка на комментарий
Поделиться на другие сайты

Решил поробовать на этом файле post-5006-1300640166_thumb.jpg получил это https://docs.google.com/document/d/1i6dgYp8...authkey=CMLu6mc

Качество не очень для столь простого текста при экспорте в Word поулчаем это img002.doc

При сканерование использовал 360Dpi максимально возможное для сервиса иначе размер переваливал за 2Мб

Изменено пользователем Самогонщик
Ссылка на комментарий
Поделиться на другие сайты

Вобщем выводы не утешительные.

Платные-finereader

Бесплатные-убогий CuneiForm (других можете не искать, этот лучший из бесплатных)

Либо пользуемся всевозможными online распознователями.

Ссылка на комментарий
Поделиться на другие сайты

а если в двух словах то распознатся только английский текст

распознавание текстов на 34 языках, включая русский. googledocs.

 

Отличный функционал, ниче не скажешь)

Допилят, русский три недели назад появился.

Изменено пользователем Cihihen
Ссылка на комментарий
Поделиться на другие сайты

При большом количестве страниц гугол вообще не вариант.

Естественно, что бесплатный сервис не для промышленной обработки текстов. Этим они сами занимаются оцифровывая книги. А в бесплатном будут ограничения.

Когда надо срочно пару страниц, да еще не дома, то нормально.

Изменено пользователем Cihihen
Ссылка на комментарий
Поделиться на другие сайты

2-3 страницы подобного теста легко набрать руками и по времени это будет быстрее чем затратить на сканирование загрузку в гугол и последующие её правку.

 

Да и обычно со сканером идёт родные распознователи текста.

Ссылка на комментарий
Поделиться на другие сайты

2-3 страницы подобного теста легко набрать руками

С этим думаю не все согласятся.

Да и обычно со сканером идёт родные распознователи текста.

Не у всех сканер, есть еще фотоаппараты и текст на картинке из почты или интернета.

Ссылка на комментарий
Поделиться на другие сайты

С этим думаю не все согласятся.

Пусть учиться печатать быстрее это необходимость если человек работает за компьютером. 200-250Сим\мин освоить очень реально

Ссылка на комментарий
Поделиться на другие сайты

Вопросы к ТС:

1- каковы объемы текста?

2- каковы источники и примерные характеристики исходных изображений?

3- каковы требования к срокам "перевода"?

Ссылка на комментарий
Поделиться на другие сайты

Платные то долеки до совершенства, а вы про бесплатный речь ведете.

Убедился я уже.Отчётливо проглядываемые символы за другие принимает :) Искажения на ровном месте...

А люди за такое "удовольствие" деньги немаленькие тратят,когда как результат не оправдывает...

Но хоть что-то :lol: ;)

Изменено пользователем Nikolay Lasarenko
Ссылка на комментарий
Поделиться на другие сайты

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти
×
×
  • Создать...