Перейти к содержанию

Бесплатный распознаватель текстов


Nikolay Lazarenko

Рекомендуемые сообщения

Всем здравия желаю.

Хочется найти бесплатный распознаватель текстов...есть ли такой?

CuneiForm что-то не заработал у меня.И с виду примитивен.

Может что и найду сам...но помощь не помешала бы...

Заранее спасибо.

Ссылка на комментарий
Поделиться на другие сайты

В OCR-системе Google Docs появилась поддержка русского языка

 

Файлы, к которым можно применить функцию OCR, могут иметь разное происхождение:

 

изображения или PDF-файлы, полученные с помощью планшетных сканеров;

изображения, полученные с помощью цифровых камер или мобильных телефонов.

Из добавленных изображений и PDF-файлов извлекаются фрагменты текста, которые затем преобразуются в документы Google.

 

Чтобы качество извлеченного текста было достаточно хорошим, изображение или PDF-файл должны соответствовать определенным требованиям.

 

Разрешение. Чем выше разрешение файла, тем лучше он обрабатывается. Общее правило: высота каждой строки в документе должна составлять не менее 10 пикселей.

Ориентация. Распознаются только документы с горизонтальной ориентацией текста в написании слева направо. Если документ был отсканирован или сфотографирован в другой ориентации, поверните изображения в соответствующей программе, прежде чем добавлять их в Документы Google.

Языки, шрифты и наборы символов. В настоящее время наш алгоритм OCR поддерживает только символы латиницы, поэтому тексты, написанные, например, на японском или арабском языках, а также рукописные тексты пока не распознаются. Лучше всего распознаются распространенные шрифты, такие как Arial и Times New Roman.

Качество изображения. Лучше всего обрабатываются отчетливые изображения с равномерной освещенностью и хорошей контрастностью. Размытие или плохой фокус снижают качество распознавания текста.

Ограничения на размер файлов

 

Максимальный размер изображений (JPG, GIF и PNG) и PDF-файлов (PDF) составляет 2 МБ. В PDF-файлах при поиске текста для распознавания просматриваются только первые 10 страниц.google.

Ссылка на комментарий
Поделиться на другие сайты

Cihihen а если в двух словах то распознатся только английский текст с размером документы не больше 2 мб. Отличный функционал, ниче не скажешь)

Ссылка на комментарий
Поделиться на другие сайты

Решил поробовать на этом файле post-5006-1300640166_thumb.jpg получил это https://docs.google.com/document/d/1i6dgYp8...authkey=CMLu6mc

Качество не очень для столь простого текста при экспорте в Word поулчаем это img002.doc

При сканерование использовал 360Dpi максимально возможное для сервиса иначе размер переваливал за 2Мб

Изменено пользователем Самогонщик
Ссылка на комментарий
Поделиться на другие сайты

Вобщем выводы не утешительные.

Платные-finereader

Бесплатные-убогий CuneiForm (других можете не искать, этот лучший из бесплатных)

Либо пользуемся всевозможными online распознователями.

Ссылка на комментарий
Поделиться на другие сайты

а если в двух словах то распознатся только английский текст

распознавание текстов на 34 языках, включая русский. googledocs.

 

Отличный функционал, ниче не скажешь)

Допилят, русский три недели назад появился.

Изменено пользователем Cihihen
Ссылка на комментарий
Поделиться на другие сайты

При большом количестве страниц гугол вообще не вариант.

Естественно, что бесплатный сервис не для промышленной обработки текстов. Этим они сами занимаются оцифровывая книги. А в бесплатном будут ограничения.

Когда надо срочно пару страниц, да еще не дома, то нормально.

Изменено пользователем Cihihen
Ссылка на комментарий
Поделиться на другие сайты

2-3 страницы подобного теста легко набрать руками и по времени это будет быстрее чем затратить на сканирование загрузку в гугол и последующие её правку.

 

Да и обычно со сканером идёт родные распознователи текста.

Ссылка на комментарий
Поделиться на другие сайты

2-3 страницы подобного теста легко набрать руками

С этим думаю не все согласятся.

Да и обычно со сканером идёт родные распознователи текста.

Не у всех сканер, есть еще фотоаппараты и текст на картинке из почты или интернета.

Ссылка на комментарий
Поделиться на другие сайты

С этим думаю не все согласятся.

Пусть учиться печатать быстрее это необходимость если человек работает за компьютером. 200-250Сим\мин освоить очень реально

Ссылка на комментарий
Поделиться на другие сайты

Вопросы к ТС:

1- каковы объемы текста?

2- каковы источники и примерные характеристики исходных изображений?

3- каковы требования к срокам "перевода"?

Ссылка на комментарий
Поделиться на другие сайты

Платные то долеки до совершенства, а вы про бесплатный речь ведете.

Убедился я уже.Отчётливо проглядываемые символы за другие принимает :) Искажения на ровном месте...

А люди за такое "удовольствие" деньги немаленькие тратят,когда как результат не оправдывает...

Но хоть что-то :lol: ;)

Изменено пользователем Nikolay Lasarenko
Ссылка на комментарий
Поделиться на другие сайты

Пожалуйста, войдите, чтобы комментировать

Вы сможете оставить комментарий после входа в



Войти
  • Похожий контент

    • Turkoman
      От Turkoman
      Добрый день.
       
      Cовсем скоро планируется выпуск бесплатного антивируса от Лаборатории Касперского.
      Что кардинально повлияло на изменение вашей ранее принципиальной позиции?
       
       
    • Mrak
      От Mrak
      Здравствуйте.
       
      По работе часто приходится слушать аудиозаписи протоколов судебных заседаний. Когда аудиозаписи многочасовые, на это уходит много времени. 
      Подскажите пожалуйста, существует ли бесплатный способ получить стенограмму многочасовой аудиозаписи?
      Пример:
      Например, можно ли "скормить" запись какому-нибудь chat gpt или боту в телеграмм, загрузить какую-нибудь программу или иным образом получить расшифровку?
      Платные варианты из серии - сделай сам или найми человека, кто будет сидеть в наушниках и создавать стенограмму, не предлагайте. Они известны. 
    • Анатолий81
      От Анатолий81
      Добрый день!  Не копируется текст в ворд - вацап, внутри ворда  копируется. Внутри вацапа не копируется. Это проблема. помогите решить  
    • KZMZ
      От KZMZ
      Добрый день
      я с Казахстана
      скачал касперский фри бесплатную
      установился но как раньше нет бесплатной подписки и просит код
      зашел под аккаунтом гугл она подписался на стандартный подписку которая на 31 дней
      как сделать как раньше установил и на год сразу активировался?
       

    • KL FC Bot
      От KL FC Bot
      Мы часто говорим о том, что не стоит скачивать пиратские версии игр, поскольку в них могут скрываться зловреды. Но угрозу могут представлять не только они. Иногда неприятные сюрпризы могут обнаружиться в изначально бесплатной игре — совсем недавно это произошло с Super Mario 3: Mario Forever. Но рассказываем обо всем по порядку.
      Зловреды в бесплатной игре Super Mario 3: Mario Forever
      Серия игр Super Mario, также известная как Super Mario Bros. или просто Mario, — одна из самых широко известных игровых вселенных. За 38 лет ее существования только в основной серии вышло 24 оригинальных игры плюс десяток ремейков и ремастерингов. А помимо нее также существует семь спин-офф-серий, которые добавляют в общую вселенную Mario еще многие десятки игр. Однако есть у них одна общая черта: все эти игры, за редчайшим исключением, официально выходили только на собственных игровых платформах Nintendo.
      Что же делать, если хочется поиграть в Mario на компьютере? Придется либо скачивать версии настоящих игр, портированные на PC, либо загружать игры, созданные фанатами Mario, что называется, по мотивам. Но следует иметь в виду, что оба варианта — совсем не официальные, на сайте Nintendo их, конечно же, скачать не получится.
      Поэтому поиск дистрибутива часто может завести в весьма сомнительные места, а вместо игры — или вместе с ней — предприимчивые люди могут подсунуть вам что-нибудь вредоносное. Что-то подобное как раз и произошло с бесплатной игрой Super Mario 3: Mario Forever, созданной фанатами Mario. Эксперты обнаружили версии игры, в комплекте с которыми на компьютер жертвы попадали сразу несколько зловредов.
       
      Посмотреть полную статью
×
×
  • Создать...