Журнал об информационных технологиях в России
Журнал об информационных технологиях в России
Блог
Новости
Видео
Решения
Опыт
Технологии
События
ИТ-журнал
Учебный центр
Конкурс красоты
magazine@sovinfosystems.ru
Заказать звонок
Задать вопрос
Войти
  • Корзина0
  • Отложенные0
  • Сравнение товаров0
magazine@sovinfosystems.ru
Москва, Киевское ш. 22-й км, д. 4, стр. 1, блок В, оф. 817В

  • Вконтакте
  • Facebook
  • Instagram
  • Telegram
  • YouTube
magazine@sovinfosystems.ru
Связаться с нами
Москва, Киевское ш. 22-й км, д. 4, стр. 1, блок В, оф. 817В

Войти
Журнал об информационных технологиях в России
Журнал об информационных технологиях в России
Блог
  • Новости
  • Видео
  • Решения
  • Опыт
  • Технологии
  • События
ИТ-журнал
Учебный центр
Конкурс красоты
+  ЕЩЕ
    Журнал об информационных технологиях в России
    Блог
    • Новости
    • Видео
    • Решения
    • Опыт
    • Технологии
    • События
    ИТ-журнал
    Учебный центр
    Конкурс красоты
    +  ЕЩЕ
      Сравнение0 Отложенные 0 Корзина 0
      Телефоны
      magazine@sovinfosystems.ru
      Заказать звонок
      • Блог
        • Назад
        • Блог
        • Новости
        • Видео
        • Решения
        • Опыт
        • Технологии
        • События
      • ИТ-журнал
      • Учебный центр
      • Конкурс красоты
      • Личный кабинет
      • Корзина0
      • Отложенные0
      • Сравнение товаров0
      • magazine@sovinfosystems.ru
      Контактная информация
      Москва, Киевское ш. 22-й км, д. 4, стр. 1, блок В, оф. 817В

      magazine@sovinfosystems.ru
      • Вконтакте
      • Facebook
      • Instagram
      • Telegram
      • YouTube

      Интеллектуальная обработка документов

      Главная
      —
      Блог
      —
      Новости и статьи по информационным технологиям
      —Интеллектуальная обработка документов
      28 марта 2025 2421 0

      Как ИИ меняет подход к управлению документацией

      О роли ИИ в управлении документами рассказывает директор департамента бизнес-решений компании «Инфолоджистикс» Павел Гаврилов.
      Значимость технологий, основанных на нейронных сетях, специализирующихся на обработке естественного языка, или больших лингвистических моделей (Large language model, LLM), не требует дополнительного упоминания. Присутствующий вокруг этой темы информационный бум последних лет уже сделал эту работу.

      Технологии генеративного ИИ (GenAI), согласно исследованию Gartner в 2024 году, находятся в завершающей стадии этапа завышенных ожиданий, где новая технология ещё воспринимается как «волшебная палочка», решающая все проблемы здесь и сейчас.

      Gartner---AI-Hype-Cycle.jpg

      Компания «Инфолоджистикс» производит большую работу по обоснованным применениям ИИ, уделяя особое внимание сфере аутсорсинга решений и сервисов, связанных с управлением документами и информацией.

      Предлагаем читателю квант осмысления исследовательской работы в применении GenAI к задачам работы с документами. Также примем на себя роль прогнозиста, чтобы сформулировать следствия, полезные другим.

      «I» – часть от «AI» – когда «всё сам»

      В предыдущие годы взаимодействие с системами СЭД и ЕСМ происходило в парадигме, «что вложил, то и получил». Зачастую пользователи вносили данные о добавляемых объектах в системы вручную. Настройки систем были жёстко фиксированными либо допускали небольшие отклонения от заданных правил, прописанных «в коде» или конструкторах маршрутов.

      Развитие функциональности конструкторов давало сделать больше, что порой приводило к очень сложным реализациям логики движения данных. Ниже пример бизнес-логики для всего лишь согласования служебной записки в одной из компаний.

      Пример-процесса-согласования-СЗ.jpg

      Со временем в цепочках сменяются ответственные, изменяются реальные бизнес-процессы, происходят разрывы преемственности команд. Поддержание логик усложняется и требует ресурсов, которые компании не всегда могут выделить.

      Есть и другая проблематика, связанная с документооборотом, – попытка решить задачу ввода данных в системы и характеризовать создаваемые в них объекты набором атрибутивной информации (номер и дата документа, наличие нужных подписей и т. д.).

      Такие решения реализовывались через дорогостоящие системы OCR, где создавались порой сотни предварительно заданных форм документов, без чего процесс распознавания не работал корректно, формы документов должны быть известны и настроены заранее. Сами формальные правила обработки документов также меняются со временем, что приводит к потребности перевнедрения.

      Даже хорошие внедрения требовали людей «в петле» процесса для верификации распознанных данных документов плохого качества и не подходящих под распознавание. Как следствие, не достигалась цель полной автоматизации, что нивелировало экономический эффект проекта. Всё это характерно для внедрений тяжеловесных решений по распознаванию, сделанных в районе 2010‑2020 годов.

      Суммируем проблемы, связанные с устоявшимися до последнего времени решениями.

      • Ручной ввод данных.
      • Шаблонное распознавание и необходимость постоянного пополнения альбома форм.
      • Ручная верификация распознанных данных.
      • Сложность формулировки и сопровождения бизнес-правил.
      • Малая осведомлённость о новых технологиях и подходах.

      Сложившаяся ситуация привела нас к попытке решить эти проблемы через применение ИИ, информация о гипотетических возможностях которого есть повсюду.

      «AI» – ИИ по 2022 год

      Мы могли бы начать отсчёт возрождения нейронных сетей в форме GenAI с идеи, описанной в 2009 году в статье Google «The Unreasonable Effectiveness of Data» (Google, 2009). Исследователи отмечали, что обучение сетей на больших объёмах неразмеченных данных – эффективнее, чем на меньших, но предварительно структурированных.

      Существовавшие ранее на рынке системы, созданные на основе правил и знаний, собираемых и пополняемых вручную большим количеством экспертов, стали быстро терять актуальность. Появились продукты, которые регулярно пополняют свои базы данных и автоматически формируют правила соотнесения данных внутри себя. Такие принципы работы распространились и на документационные системы, что привело к развитию некоторых особенностей.

      Строгие шаблоны уступили место гибким, возможность находить нужные поля возросла.

      Распознавание охватило не только текст, но и фото.

      Нахождение особых паттернов в медицинских данных (медицинские снимки).

      Возросла взаимоувязанность систем распознавания и систем-источников и -приёмников ввиду общего развития сред разработки и API.

      Меньше человеческого труда для ввода данных. Появились доступные решения для типичных задач в учётных / WMS системах.

      AI + (AI×AI×AI)= AI^10

      Что нас ждёт за горизонтом?

      Исследователи из Epoch, занимающиеся анализом и прогнозированием развития передовых систем ИИ, в работе «Will we run out of data?» прогнозируют, что вскоре производимой человечеством информации уже не будет достаточно для дальнейшего обучения моделей.

      Artificial general intelligence (AGI) – тот самый настоящий искусственный интеллект, равный или превосходящий человеческий в части обработки и синтеза новой информации. Предполагается, что после исчерпания данных для обучения моделей, их будут создавать другие генеративные модели, что и откроет путь к созданию AGI.

      Will-we-run-out-of-data.jpg

      Какие выводы можно сделать прямо сейчас?

      1.       Накапливайте все возможные данные о деятельности компании:

      • документы;
      • внешнюю и внутреннюю переписку;
      • записи разговоров;
      • логи изменений в учётных системах;
      • архивы операционных данных;
      • документационные архивы.

      Может наступить момент, когда ранее непонятно для чего нужные данные позволят усилить внедряемые вами решения, основанные на AGI. Это откроет путь к быстрому прогнозированию, анализу хозяйственной деятельности и оценке различных вариантов развития вашей компании.

      2.       Неструктурированных данных практически не существует. Зачастую они так или иначе структурированы: есть иерархии заголовков, глав, перекрёстных ссылок, форматов и графиков, нумерации страниц, метки времени и другие метаданные, которые в будущем могут быть использованы ИИ для анализа.

      3.       Откройте заново ценность архивов. Накопленные документационные архивы первичных документов, техническая документация, дела по финансовым продуктам, данные геологоразведки и так далее – действительно, за прошедшие годы накоплено огромное количество данных, которые можно пустить в дело только одним способом: оцифровать их.

      Экономически целесообразно делать это сейчас, чем позже пытаться сделать такую работу одномоментно в будущем. Зачастую при выполнении таких проектов уже сейчас графики работы строятся на годы вперёд ввиду общей трудоёмкости задачи.

      Оцифровка и структурирование архива – не только решение текущих задач, но и залог для будущих возможностей формировать ценные выводы о деятельности компании для создания преимущественного позиционирования на рынке.

      «Инфолоджистикс»

      infologistics.ru


      Авторизуйтесь и поставьте лайк
      Комментировать
      Текст сообщения*
      Перетащите файлы
      Ничего не найдено

      Последние новости по теме

      Crypto Summit 2026
      Crypto Summit 2026
      13.12.2025 0 19 0
      Новые стратегии и новые рынки: как прошли IEAE 2025 и IGHE 2025 в Москве
      Новые стратегии и новые рынки: как прошли IEAE 2025 и IGHE 2025 в Москве
      13.12.2025 0 20 0
      MFASOFT снижает нагрузку на техподдержку с помощью личного кабинета управления аутентификацией
      MFASOFT снижает нагрузку на техподдержку с помощью личного кабинета управления аутентификацией
      13.12.2025 0 22 0
      Индивидуальный подход к интеграции телефонии с «Плюсофон PRO»
      Индивидуальный подход к интеграции телефонии с «Плюсофон PRO»
      09.12.2025 0 59 0
      DNS как первый рубеж обороны: новые подходы к защите корпоративных сетей
      DNS как первый рубеж обороны: новые подходы к защите корпоративных сетей
      03.12.2025 0 367 0
      Назад к списку



      Журнал об информационных технологиях в России

      © 2025, СIS

      (Современные Информационные Системы)

      Журнал предназначен для лиц старше 16 лет.

      Контакты
      Журнал
      Мероприятия
      Учебный центр
      Конкурс красоты
      Подписаться на рассылку
      magazine@sovinfosystems.ru
      Связаться с нами
      Москва, Киевское ш. 22-й км, д. 4, стр. 1, блок В, оф. 817В

      • Вконтакте
      • Facebook
      • Instagram
      • YouTube
      magazine@sovinfosystems.ru
      Политика конфиденциальности