Бесплатный распознаватель текстов

20 марта, 2011

Всем здравия желаю.

Хочется найти бесплатный распознаватель текстов...есть ли такой?

CuneiForm что-то не заработал у меня.И с виду примитивен.

Может что и найду сам...но помощь не помешала бы...

Заранее спасибо.

20 марта, 2011

Платные то долеки до совершенства, а вы про бесплатный речь ведете.

20 марта, 2011

В OCR-системе Google Docs появилась поддержка русского языка

Файлы, к которым можно применить функцию OCR, могут иметь разное происхождение:

изображения или PDF-файлы, полученные с помощью планшетных сканеров;

изображения, полученные с помощью цифровых камер или мобильных телефонов.

Из добавленных изображений и PDF-файлов извлекаются фрагменты текста, которые затем преобразуются в документы Google.

Чтобы качество извлеченного текста было достаточно хорошим, изображение или PDF-файл должны соответствовать определенным требованиям.

Разрешение. Чем выше разрешение файла, тем лучше он обрабатывается. Общее правило: высота каждой строки в документе должна составлять не менее 10 пикселей.

Ориентация. Распознаются только документы с горизонтальной ориентацией текста в написании слева направо. Если документ был отсканирован или сфотографирован в другой ориентации, поверните изображения в соответствующей программе, прежде чем добавлять их в Документы Google.

Языки, шрифты и наборы символов. В настоящее время наш алгоритм OCR поддерживает только символы латиницы, поэтому тексты, написанные, например, на японском или арабском языках, а также рукописные тексты пока не распознаются. Лучше всего распознаются распространенные шрифты, такие как Arial и Times New Roman.

Качество изображения. Лучше всего обрабатываются отчетливые изображения с равномерной освещенностью и хорошей контрастностью. Размытие или плохой фокус снижают качество распознавания текста.

Ограничения на размер файлов

Максимальный размер изображений (JPG, GIF и PNG) и PDF-файлов (PDF) составляет 2 МБ. В PDF-файлах при поиске текста для распознавания просматриваются только первые 10 страниц.google.

20 марта, 2011

Cihihen а если в двух словах то распознатся только английский текст с размером документы не больше 2 мб. Отличный функционал, ниче не скажешь)

20 марта, 2011

Решил поробовать на этом файле получил это https://docs.google.com/document/d/1i6dgYp8...authkey=CMLu6mc

Качество не очень для столь простого текста при экспорте в Word поулчаем это img002.doc

При сканерование использовал 360Dpi максимально возможное для сервиса иначе размер переваливал за 2Мб

Изменено 20 марта, 2011 пользователем Самогонщик

20 марта, 2011

Вобщем выводы не утешительные.

Платные-finereader

Бесплатные-убогий CuneiForm (других можете не искать, этот лучший из бесплатных)

Либо пользуемся всевозможными online распознователями.

20 марта, 2011

а если в двух словах то распознатся только английский текст

распознавание текстов на 34 языках, включая русский. googledocs.

Отличный функционал, ниче не скажешь)

Допилят, русский три недели назад появился.

Изменено 20 марта, 2011 пользователем Cihihen

20 марта, 2011

Cihihen

При большом количестве страниц гугол вообще не вариант.

20 марта, 2011

При большом количестве страниц гугол вообще не вариант.

Естественно, что бесплатный сервис не для промышленной обработки текстов. Этим они сами занимаются оцифровывая книги. А в бесплатном будут ограничения.

Когда надо срочно пару страниц, да еще не дома, то нормально.

Изменено 20 марта, 2011 пользователем Cihihen

21 марта, 2011

2-3 страницы подобного теста легко набрать руками и по времени это будет быстрее чем затратить на сканирование загрузку в гугол и последующие её правку.

Да и обычно со сканером идёт родные распознователи текста.

21 марта, 2011

2-3 страницы подобного теста легко набрать руками

С этим думаю не все согласятся.

Да и обычно со сканером идёт родные распознователи текста.

Не у всех сканер, есть еще фотоаппараты и текст на картинке из почты или интернета.

21 марта, 2011

С этим думаю не все согласятся.

Пусть учиться печатать быстрее это необходимость если человек работает за компьютером. 200-250Сим\мин освоить очень реально

21 марта, 2011

Вопросы к ТС:

1- каковы объемы текста?

2- каковы источники и примерные характеристики исходных изображений?

3- каковы требования к срокам "перевода"?

21 марта, 2011

Fine Reader пробный скачал попользоваться.

То есть как изначально думал,что лучше не найти,так и вышло.

23 марта, 2011

Платные то долеки до совершенства, а вы про бесплатный речь ведете.

Убедился я уже.Отчётливо проглядываемые символы за другие принимает Искажения на ровном месте...

А люди за такое "удовольствие" деньги немаленькие тратят,когда как результат не оправдывает...

Но хоть что-то

Изменено 23 марта, 2011 пользователем Nikolay Lasarenko

Бесплатный распознаватель текстов

Рекомендуемые сообщения

Nikolay Lazarenko

Omnividente

Cihihen

Omnividente

Самогонщик

Omnividente

Cihihen

Самогонщик

Cihihen

Самогонщик

Cihihen

Самогонщик

Rassven

Nikolay Lazarenko

Nikolay Lazarenko

Пожалуйста, войдите, чтобы комментировать

Обзор

Активность

Магазин

Kaspersky Support Forum