pvl-online.kz » Новости » Новый Abbyy FineReader Engine 11 научился классифицировать документы

Автор публикации: admin Просмотров: 631 Добавлен: 25-10-2013, 16:07 Комментарии: 0

 Компания Abbyy выпустила Abbyy FineReader Engine 11 -новую версию инструментария разработчика (SDK), который позволяет компаниям-разработчикам добавлять в свои решения функции оптического распознавания текста (OCR), распознавания рукопечатных символов (ICR), оптического распознавания меток (OMR), распознавания штрих-кодов и конвертации документов в PDF-файлы. Впервые инструментарий выходит одновременно для Windows, Linux и Mac-платформ.. Так, функция автоматической классификации позволяет сортировать документы во входящих пакетах по заранее заданным типам (например, счета, счета-фактуры, договоры, справки, полисы и т.п.). Предварительно классификатор обучается на небольшом наборе документов, представляющих каждый тип, который необходимо определять. Определение типа происходит по графическим и текстовым признакам. Новая функция позволяет классифицировать документы со скоростью до 120 страниц в минуту на одно ядро процессора, при этом может быть достигнута более высокая точность, чем при ручной сортировке. Рассортированные документы в дальнейшем могут быть сохранены в архив, распознаны, отправлены в соответствующие разделы СЭД и т.п. В то же время, экспорт в PDF стал быстрее на 12%, улучшенное сжатие фона документа позволяет уменьшить размер файлов на 50% (что особенно важно для архивного хранения), добавлен экспорт в формат PDF/A-2 (стандарт, принятый в Европе и США для архивного хранения, он позволяет использовать сжатие JPEG2000 и поддерживает юникод). В одну из ближайших версий планируется добавить экспорт в PDF/A-3 (формат является расширением PDF/A-2 и позволяет встраивать файлы любого типа, включая XML, CSV, CAD, изображения и любые другие). Новая версия полностью поддерживает 64-битную архитектуру. Это позволяет упростить разработку приложений под 64-битные системы. Инструментарий поставляется вместе с библиотекой, предоставляющей разработчикам простой и удобный Java API. Для улучшения качества распознавания изображений, полученных с помощью фотокамеры, добавлены: высветление фона изображения, автоматическая обрезка изображения, улучшенное исправление перекосов и других геометрических искажений. Также теперь лучше удаляется цифровой шум матрицы. Перед распознаванием с изображения удаляются печати, штампы и пометки, сделанные от руки - при необходимости они могут быть сохранены в финальной версии документа. Новый API позволяет извлекать данные из всех полей визитной карточки - ФИО, название компании, должность, адрес, номера телефонов и факса, адрес электронной почты, адрес сайта - и экспортировать их в CRM-системы или другие программы. Кроме того, улучшено качество распознавания арабского языка и языков группы CJK (китайский, японский, корейский). При этом количество ошибок при работе с арабским языком уменьшилось в 2 раза, а скорость обработки выросла в 3 раза, отметили в Abbyy. Японский язык теперь распознаётся в 2,5 раза быстрее, китайский - в 2,5-4 раза быстрее, а корейский - в 3 раза быстрее. "В новой версии Abbyy FineReader Engine мы сделали новую интеллектуальную систему классификации документов, которая позволит нашим пользователям быстро "разложить" все документы по типам, - сообщил директор по корпоративным проектам Abbyy Россия Дмитрий Шушкин. - Обычно эта задача решается вручную либо при помощи интеллектуального распознавания. Это достаточно ресурсоёмкий процесс, занимающий машинное время. При том что задача клиента иногда частично или даже полностью состоит лишь в классификации входящих документов (например, по разделам СЭД или по разным департаментам организации), а распознавание и извлечение атрибутов может требоваться лишь для части из них. Наш классификатор определяет тип документа по его внешнему виду, делает это очень точно и быстро. Он может использоваться как самостоятельно, так и в качестве этапа предобработки в таких комплексах, как Abbyy FlexiCapture". Abbyy FineReader Engine 11 содержит примеры кода, которые могут упросить разработку приложений. Примеры демонстрируют использование интерфейса программирования приложений (API) для решения типовых задач по обработке изображений документов. Инструментарий распознаёт печатные тексты на 202 языках, рукопечатные (то есть заполненные от руки формы) - на 126 языках. В новую версию включена словарная поддержка латыни, азербайджанского языка, а также дореволюционного варианта орфографии русского языка. Ссылки по теме

Каталог программ ABBYY

Купить программу ABBYY FineReader 11


Рейтинг:


Уважаемый посетитель, Вы зашли на сайт как незарегистрированный пользователь. Мы рекомендуем Вам зарегистрироваться либо войти на сайт под своим именем.

    
Другие статьи по теме:
Компания ABBYY предлагает воспользоваться обновленной версией облачного сервиса FineReader Online, который хорошо известен отечественным пользователям уже более четырех лет...


С ABBYY FineReader Pro для Mac пользователям не придется вручную набирать текст из бумажного документа: отсканировав его или открыв его изображение в программе, можно быстро скопировать несколько фраз или абзацев, таблицу или картинку. Если требуется внести правки в текст бумажного или PDF-документа, достаточно распознать его в программе и передать результат в удобный формат, например, в ...


Приложение используется в банковской отрасли и существенно упрощает работу с такими востребованными документами, как платёжные поручения, платёжные требования и инкассовые поручения, а в новую версию включена современная архитектура и поддержка последних версий операционных систем. Также расширены возможности настройки продукта с учетом специфических бизнес-процессов...


Компания ABBYY, один из крупнейших отечественных soft-производителей, порадовала пользователей выпуском новой версии FineReader - наиболее популярной программы для распознавания текста. Функционал новинки упрощает преобразование PDF-файлов и фотоизображений документов в форматы, которые можно отредактировать...


ABBYY FineScanner - программа для iOS-устройств, которая может фотографировать документы и обрабатывать снимки так, чтобы получившиеся электронные копии (по сути - сканы) были удобны для работы - чтения, печати или …...