Прочитал на Харбре заметку о появлении нового сервиса распознавания текстов от монстра этого дела. Обрадовался: вот, оно логичное и столь долгожданное дополнение ко всякого рода гуглодоксам! Даёшь FineReader в массы! И что же обнаружилось после регистрации?
После регистрации и переходу по ссылке в письме я попал на главную страницу сервиса (см. рисунок). Первое и единственное разочарование: всего четыре языка, среди которых нет украинского. Это делает сервис совершенно не актуальным для меня лично. На данный момент доступны русский, английский, немецкий и французский; но не более трёх одновременно.
Ради интереса скормил сервису страничку из английской книжки. Получил на почту ссылку на файл результата. Качество распознавания — файнридеровское. Никакой цветовой разметки неуверенно распознанных символов (наверное, можно было бы в настройках сделать это отключаемым).
В целом, сервис производит хорошее впечатление. Особенно, если учесть, что он совершенно бесплатен и находится в стадии бета-тестирования. Хочется пожелать разработчикам реализовать полновесную версию своего продукта, доступную онлайн в качестве удобного сервиса.
Кстати, о птичках… Мне кажется, что подобный сервис очень органично вписался бы в гуглодокументы.
попробуй украинский здесь
www.kanjiocr.com
>Качество распознавания — файнридеровское
а как насчёт вот этого
rasterecs.narod.ru/ImageS... — CAMERA_BOOK.jpg
Спасибо, попробую. PDF на выходе — не самый лучший вариант. :-(
Э-э-э… Распознавать сфотографированную книгу? По-моему, это чистой воды изврат.
>Э-э-э… Распознавать сфотографированную книгу? По-моему, это чистой воды изврат.
Вот-вот и я так же думал, пока не увидел, насколько чётко это работает здесь
www.kanjiocr.com
С цифровой камерой две страницы оцифровываю за три секунды, а со сканером — полторы минуты. Вот тебе и изврат, а качество одинаковое. Зачем тратить больше времени, если у тебя его нет...
Ну, про три секунды и полторы минуты — это пиз..ж и провокация :-)
Да, незачем.
Сегодня получил письмо:
Класс! Жизнь налаживается.