Nikolay Lazarenko Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 Всем здравия желаю. Хочется найти бесплатный распознаватель текстов...есть ли такой? CuneiForm что-то не заработал у меня.И с виду примитивен. Может что и найду сам...но помощь не помешала бы... Заранее спасибо. Ссылка на комментарий Поделиться на другие сайты Поделиться
Omnividente Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 Платные то долеки до совершенства, а вы про бесплатный речь ведете. Ссылка на комментарий Поделиться на другие сайты Поделиться
Cihihen Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 В OCR-системе Google Docs появилась поддержка русского языка Файлы, к которым можно применить функцию OCR, могут иметь разное происхождение: изображения или PDF-файлы, полученные с помощью планшетных сканеров; изображения, полученные с помощью цифровых камер или мобильных телефонов. Из добавленных изображений и PDF-файлов извлекаются фрагменты текста, которые затем преобразуются в документы Google. Чтобы качество извлеченного текста было достаточно хорошим, изображение или PDF-файл должны соответствовать определенным требованиям. Разрешение. Чем выше разрешение файла, тем лучше он обрабатывается. Общее правило: высота каждой строки в документе должна составлять не менее 10 пикселей. Ориентация. Распознаются только документы с горизонтальной ориентацией текста в написании слева направо. Если документ был отсканирован или сфотографирован в другой ориентации, поверните изображения в соответствующей программе, прежде чем добавлять их в Документы Google. Языки, шрифты и наборы символов. В настоящее время наш алгоритм OCR поддерживает только символы латиницы, поэтому тексты, написанные, например, на японском или арабском языках, а также рукописные тексты пока не распознаются. Лучше всего распознаются распространенные шрифты, такие как Arial и Times New Roman. Качество изображения. Лучше всего обрабатываются отчетливые изображения с равномерной освещенностью и хорошей контрастностью. Размытие или плохой фокус снижают качество распознавания текста. Ограничения на размер файлов Максимальный размер изображений (JPG, GIF и PNG) и PDF-файлов (PDF) составляет 2 МБ. В PDF-файлах при поиске текста для распознавания просматриваются только первые 10 страниц.google. Ссылка на комментарий Поделиться на другие сайты Поделиться
Omnividente Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 Cihihen а если в двух словах то распознатся только английский текст с размером документы не больше 2 мб. Отличный функционал, ниче не скажешь) Ссылка на комментарий Поделиться на другие сайты Поделиться
Самогонщик Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 (изменено) Решил поробовать на этом файле получил это https://docs.google.com/document/d/1i6dgYp8...authkey=CMLu6mc Качество не очень для столь простого текста при экспорте в Word поулчаем это img002.doc При сканерование использовал 360Dpi максимально возможное для сервиса иначе размер переваливал за 2Мб Изменено 20 марта, 2011 пользователем Самогонщик Ссылка на комментарий Поделиться на другие сайты Поделиться
Omnividente Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 Вобщем выводы не утешительные. Платные-finereader Бесплатные-убогий CuneiForm (других можете не искать, этот лучший из бесплатных) Либо пользуемся всевозможными online распознователями. Ссылка на комментарий Поделиться на другие сайты Поделиться
Cihihen Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 (изменено) а если в двух словах то распознатся только английский текст распознавание текстов на 34 языках, включая русский. googledocs. Отличный функционал, ниче не скажешь) Допилят, русский три недели назад появился. Изменено 20 марта, 2011 пользователем Cihihen Ссылка на комментарий Поделиться на другие сайты Поделиться
Самогонщик Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 Cihihen При большом количестве страниц гугол вообще не вариант. Ссылка на комментарий Поделиться на другие сайты Поделиться
Cihihen Опубликовано 20 марта, 2011 Поделиться Опубликовано 20 марта, 2011 (изменено) При большом количестве страниц гугол вообще не вариант. Естественно, что бесплатный сервис не для промышленной обработки текстов. Этим они сами занимаются оцифровывая книги. А в бесплатном будут ограничения. Когда надо срочно пару страниц, да еще не дома, то нормально. Изменено 20 марта, 2011 пользователем Cihihen Ссылка на комментарий Поделиться на другие сайты Поделиться
Самогонщик Опубликовано 21 марта, 2011 Поделиться Опубликовано 21 марта, 2011 2-3 страницы подобного теста легко набрать руками и по времени это будет быстрее чем затратить на сканирование загрузку в гугол и последующие её правку. Да и обычно со сканером идёт родные распознователи текста. Ссылка на комментарий Поделиться на другие сайты Поделиться
Cihihen Опубликовано 21 марта, 2011 Поделиться Опубликовано 21 марта, 2011 2-3 страницы подобного теста легко набрать руками С этим думаю не все согласятся. Да и обычно со сканером идёт родные распознователи текста. Не у всех сканер, есть еще фотоаппараты и текст на картинке из почты или интернета. Ссылка на комментарий Поделиться на другие сайты Поделиться
Самогонщик Опубликовано 21 марта, 2011 Поделиться Опубликовано 21 марта, 2011 С этим думаю не все согласятся. Пусть учиться печатать быстрее это необходимость если человек работает за компьютером. 200-250Сим\мин освоить очень реально Ссылка на комментарий Поделиться на другие сайты Поделиться
Rassven Опубликовано 21 марта, 2011 Поделиться Опубликовано 21 марта, 2011 Вопросы к ТС: 1- каковы объемы текста? 2- каковы источники и примерные характеристики исходных изображений? 3- каковы требования к срокам "перевода"? Ссылка на комментарий Поделиться на другие сайты Поделиться
Nikolay Lazarenko Опубликовано 21 марта, 2011 Автор Поделиться Опубликовано 21 марта, 2011 Fine Reader пробный скачал попользоваться. То есть как изначально думал,что лучше не найти,так и вышло. Ссылка на комментарий Поделиться на другие сайты Поделиться
Nikolay Lazarenko Опубликовано 23 марта, 2011 Автор Поделиться Опубликовано 23 марта, 2011 (изменено) Платные то долеки до совершенства, а вы про бесплатный речь ведете. Убедился я уже.Отчётливо проглядываемые символы за другие принимает Искажения на ровном месте... А люди за такое "удовольствие" деньги немаленькие тратят,когда как результат не оправдывает... Но хоть что-то Изменено 23 марта, 2011 пользователем Nikolay Lasarenko Ссылка на комментарий Поделиться на другие сайты Поделиться
Рекомендуемые сообщения
Пожалуйста, войдите, чтобы комментировать
Вы сможете оставить комментарий после входа в
Войти