OCR - системы распознавания текста.
Добавлено: Ср окт 28, 2009 11:49 am
[align=justify]OCR (Optical Char Recognition - оптическое распознавание символов) в Линуксе всегда был проблемой - никаких ФайнРидеров под него нет, а существующие системы типа GOCR работают только с командной строки и только с латиницей, да и то не особо успешно...
Ветераны компьютерного фронта
наверное помнят, что первой популярной системой был не ФайнРидер, а Куниформ (Cuneiform, "клинопись" в переводе). Потом эта "клинопись" пропала с горизонта, и довольно долго про неё ничего не было слышно. И вот, кажется в прошлом году, появилось сообщение что разработчики системы Cuneiform открыли её исходные тексты и выложили в публичный доступ под открытой лицензией.
На сегодняшний день есть уже программа cuneiform в Линуксе, у которой есть простенькая графическая оболочка и которая вполне пристойно распознает тексты, причем даже на русском языке (там еще целый список языков). Я недавно ей воспользовался (кстати, распознанный текст после минимальной коррекции был опубликован здесь, на этом форуме
). Вполне нармально работает.
Значит, еще один пробел в софте под Линукс ликвидирован, и это не может не радовать![/align]
Ветераны компьютерного фронта

На сегодняшний день есть уже программа cuneiform в Линуксе, у которой есть простенькая графическая оболочка и которая вполне пристойно распознает тексты, причем даже на русском языке (там еще целый список языков). Я недавно ей воспользовался (кстати, распознанный текст после минимальной коррекции был опубликован здесь, на этом форуме

Значит, еще один пробел в софте под Линукс ликвидирован, и это не может не радовать![/align]