Последние новости Архив новостей

[2005-10-25] - Выпуск новой версии SDK для распознавания документов, обработки форм и преобразования PDF-файлов – в ноябре 2005 года

В ноябре 2005 года компания ABBYY планирует выпустить инструментарий для разработчиков (SDK) — ABBYY FineReader Engine 8.0 для Windows. Этот SDK содержит все имеющиеся технологии распознавания, разработанные компанией ABBYY к настоящему моменту: распознавание печатных текстов (OCR – Optical Character Recognition), текстов, написанных от руки (ICR – Intelligent Character Recognition), меток (OMR – Optical Mark Recognition), одномерных и двумерных штрих-кодов, обработка PDF-файлов, извлечение данных с форм (FormReader) и неструктурированных документов (FlexiCapture). Все функции распознавания и сбора данных из документов, форм и PDF-файлов, доступны через единый универсальный API (Application Programming Interface). В новой версии продукта будут улучшены возможности полнотекстового распознавания документов, впервые появится полный набор функций, рассчитанный для распознавания текста на уровне отдельных полей. Перечисленные возможности широко востребованы при автоматизации таких задач как классификация и индексирование документов, извлечение из документов набора атрибутов с применением интеллектуальных алгоритмов анализа информации. Подобные задачи встречаются при обработке паспортов, потоковом вводе финансовых документов, договоров и т.д. Данные возможности в сочетании с улучшенными функциями преобразования PDF-файлов делают ABBYY FineReader Engine 8.0 удобным и эффективным средством для построения решений и программ по вводу документов и сбору данных. ABBYY FineReader Engine 8.0 распознаёт печатный текст (OCR) на 189 языках, поля, заполненные печатными буквами от руки (ICR) — на 91 языке. В новой версии продукта впервые реализована возможность низкоуровневого управления процессом распознавания, а именно возможность настройки на необходимую точность путём влияния на выбор гипотез, сформированных в процессе распознавания. Новая версия будет поставляться в комплекте с примерами кода, демонстрирующими, как наиболее эффективно использовать ABBYY FineReader Engine в различных типовых сценариях работы. Такими сценариями являются, например, «преобразование в PDF-файл с возможностью поиска», «распознавание на уровне полей», «архивирование с сохранением изображений и индексацией», «полнотекстовое преобразование в RTF», «полнотекстовое преобразование в HTML» и др. Каждый пример представляет собой небольшую программу, которую можно скомпилировать и изучить, как она работает. Приведены описания оптимальных параметров, в комплекте даны типовые изображения и данные по скорости работы и качеству распознавания. Разработчики смогут пользоваться примерами в качестве шаблонов при создании своих собственных программ и решений. Кроме того, в новой версии появилась функция диагностики, которая позволяет отследить все вызовы функций ABBYY FineReader Engine и измерить скорость их работы. Новые возможности ABBYY FineReader Engine 8.0: - улучшение базовых технологий распознавания; - улучшен режим распознавания отдельных полей документа; - усовершенствованы механизмы обработки PDF-файлов; - новый режим анализа документа - в ABBYY FineReader Engine 8.0 появился режим анализ документа для полнотекстового индексирования, в котором на странице автоматически находится и распознаётся вся текстовая информация, в том числе и та, что находится внутри картинок, графиков, диаграмм и т.п.; - ввод данных из документов и форм; - поддерживаемые входные и выходные форматы - ABBYY FineReader Engine поддерживает открытие изображений во всех распространённых форматах: BMP, PCX, DCX, JPEG, JPEG 2000, PNG, TIFF, а также PDF. В восьмой версии добавлена возможность открытия файлов популярных графических форматов GIF и DjVu.