Автор Тема: Распознавание текста с документов  (Прочитано 8372 раз)

0 Пользователей и 1 Гость просматривают эту тему.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4524
Распознавание текста с документов.

Опыта линуксового у меня нет в этой области, но начинать с чего-то нужно, этот тип программ нужен почти в каждой конторе.

Cuneiform+YAGF

ABBYY FineReader Engine CLI for Linux

Оффлайн I-Jurij

  • Новичок
  • **
  • Сообщений: 34
Re: Распознавание текста с документов
« Ответ #1 : Март 19, 2016, 03:10:50 »
Дополню:
scantailor - Интерактивный инструмент постобработки для отсканированных страниц (нужная вещь при подготовке к распознаванию)
YAGF кроме cuneiform поддерживает еще и tesseract, который у меня делал дело лучше, чем cuneiform, хотя многие и хвалят его.
Кроме всего прочего, веду борьбу с тяжеловесностью, поэтому ставлю не YAGF, а
ocrfeeder - постоянно пользуюсь им,
или GimageReader, попроще, но мне нравится.
Есть онлайн-сервисы, один из них http://www.free-ocr.com/

ЗЫ: FineReader-cli - бесплатная для дома и офиса?
« Последнее редактирование: Март 20, 2016, 15:30:57 от I-Jurij »

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4524
Re: Распознавание текста с документов
« Ответ #2 : Март 19, 2016, 11:55:02 »
ЗЫ: FineReader-cli - бесплатная для дома и офиса?


Кому надо более качественную обработку, чем у свободных проектов - могут и приобрести. В фирмах она нужна, для быстрой правки распечатанных документов, там от скорости работы зависит доход фирмы, будешь долго возиться - люди не захотят с тобой заключать договора.

Дома мне системы распознавания не нужны, а побаловаться и свободного хватит.

Оффлайн I-Jurij

  • Новичок
  • **
  • Сообщений: 34
Re: Распознавание текста с документов
« Ответ #3 : Март 19, 2016, 12:35:18 »
могут и приобрести
Все, теперь ясно, думал пропустил приступ альтруизма.

Оффлайн Пользователь.

  • Редактор раздела
  • *****
  • Автор темы
  • Сообщений: 4524
Re: Распознавание текста с документов
« Ответ #4 : Март 19, 2016, 13:39:20 »
Есть бесплатная онлайн версия ABBYY Fine Rider http://finereaderonline.com/ru-ru

Оффлайн I-Jurij

  • Новичок
  • **
  • Сообщений: 34
Re: Распознавание текста с документов
« Ответ #5 : Март 20, 2016, 12:41:06 »
Есть бесплатная онлайн версия ABBYY Fine Rider http://finereaderonline.com/ru-ru
10 страниц бесплатно после регистрации, а потом до 5 бесплатных в месяц - я бы назвал это одноразовый онлайн сервис (если для дома).

Уточню насчет ocrfeeder + tesseract: если изображение в нормальном качестве (а еще лучше - обработано scantailor) - качество распознавания ничем не хуже, чем у finereader.
« Последнее редактирование: Март 20, 2016, 15:31:30 от I-Jurij »