Cognitive Technologies – это российская ИТ-компания, которая разработала искусственный интеллект за 70 миллионов рублей. Разработка технологии понимания сложных типов документов, по-другому называемая «искусственный интеллект» продолжалась пять лет. Именно за это время было потрачено свыше 70 млн. руб. Данное достижение дало возможность создать отечественную систему, которая способна обеспечить промышленное качество ввода документов, тип которых нельзя отнести к легким. К такой документации относится первичная бухгалтерия (накладные товарного транспорта, счета фактуры).
Как заявляет компания, данные технологии являются совершенно иными, нежели системы распознавания символов, к которым все привыкли. Точность распознавания, которую дают традиционные ORC-системы, не очень высока. Они способны распознать не более половины строк таблицы правильно. Поэтому их низкая пригодность не может полностью удовлетворить запросы производства. Такую информацию нам дал Владимир Арлазаров, который является президентом Cognitive Technologies, создавшей новаторское решение проблемы.
Он также утверждает, что порог для промышленного применения распознавания – это 75 % позиций правильного автоматического ввода. Cognitive Technologies в свою очередь такой порог переступили, поскольку сумели данный показатель увеличить на несколько процентов. Полная информация о товаре: его стоимость, поставщик, наименование – вот, что является итоговым результатом ввода этих документов. Она размещена с очень высокой точностью по ячейкам, которые являются внутренней базой данных заказчика.
50-60 процентов – это доля, которая припадает на документы, обладающие сложной структурой, во всем объеме документооборота бухгалтерии. Автоматическая обработка таких документов – это наиболее сложная задача, которую должен выполнить искусственный интеллект. Почему? Все дело в том, что на сегодняшний день еще не придуманы единые правила, которые регламентируют бухгалтерские документы, а также определяют расположение элементов в них.
Произвольной также является сама форма документов, поскольку формат может варьироваться от А5 до А4, при этом также может произвольно меняться ориентация файла. Поэтому задача искусственного интеллекта или системы распознавания документов состоит в том, чтобы понимать и распознавать все признаки напечатанной информации на уровне человека. Например, ход действия такой системы должен осуществляться следующим образом: напечатанное число – это один из реквизитов платежного документа или нет?