Решения с применением технологии глубокого обучения
«ИНЛАЙН ГРУП» предлагает услуги по разработке заказных решений в области построения ИТ-систем с использованием технологии глубокого обучения (deep learning, DL).
Глубокое обучение (deep learning, DL) — область машинного обучения, хорошо себя зарекомендовавшая в обработке неструктурированных данных, таких как текст, изображения, видеопоток или человеческая речь. Под термином глубокое обучение обычно подразумевается использование различных модификаций алгоритмов нейронных сетей, основанных на обучении представлениями. Если в случае классического машинного обучения (предиктивной аналитикиПредиктивная аналитика) входные данные, как правило, структурированы или могут быть приведены к общей структуре, а также охарактеризованы специализированными алгоритмами, то в случае задач DL предполагается, что нейронные сети сами смогут «выучить» структуру данных и выявить важные элементы, описывающие данные.
«ИНЛАЙН ГРУП» предлагает услуги по основным направлениям DL:
- Natural Language Processing (NLP) — анализ текста и речи с использованием алгоритмов обработки естественного языка;
- Computer Vision (CV) — анализ изображений и видеопотока с использованием алгоритмов компьютерного зрения.
Мы используем как открытые платформы, так и партнерские решения для реализации полного технологичного цикла проектов:
- совместно с экспертами генерируем продуктовые гипотезы;
- организовываем сбор и предварительную обработку данных из систем хранения;
- проверяем гипотезы путем построения DL-моделей и их опытного тестирования;
- разрабатываем визуализацию для пользователей, либо интегрируем систему с уже существующими сервисами.
«ИНЛАЙН ГРУП» работает с широким набором open source инструментов и различными программными продуктами лидеров отрасли (SAP, SAS, Google Cloud Platform, Amazon Web Services). Например, являясь партнером SAP, предлагает решения на основе их экосистем SAP Data Intelligenсe.
«ИНЛАЙН ГРУП» имеет обширный опыт проверки гипотез в области предиктивной аналитикиПредиктивная аналитика, а также их воплощения в законченный продуктовый сервис в различных сферах:
- нефтегазовый инжиниринг;
- ритейл;
- энергетика;
- информационные технологии.
У компании есть запатентованные инструменты в области когнитивных технологий и опыт сотрудничества со Школой анализа данных (ШАД) Яндекс. Наличие собственных вычислительных мощностей позволяет оперативно включаться в проекты разной технической сложности, а также проводить вычислительные эксперименты на своей инфраструктуре.
«ИНЛАЙН ГРУП» выделяет два ключевых шага выполнения проектов DL: проверка гипотезы и реализация решения на основании проверенной гипотезы как законченного программного решения, внедренного в повседневную практику, обоснование и проверка бизнес-эффективности.
Гипотеза — это предположение о возможности создания на базе доступных данных (исторических, оперативных, из внешней среды) и алгоритмов глубокого обучения системы, эффективно решающей какую-либо технологическую или бизнес-задачу. Мы предлагаем совместно сформулировать продуктовую гипотезу, провести ее проверку и, при положительном результате, создать законченное решение, цель которого — получение дополнительной прибыли, снижение рисков или повышение эффективности на конкретных участках работы в условиях снижения влияния человеческого фактора.
В ряде случаев мы готовы рассмотреть возможность провести проверку работоспособности гипотезы (proof of concept/proof of value) на безвозмездной основе или за условную плату. После признания гипотезы рабочей наша команда проработает промышленную реализацию и внедрение полноценного решения или сервиса предиктивной аналитики на коммерческой основе. Результат — интегрированный со всеми необходимыми системами сервис, отвечающий заданным стандартам качества. Если же первоначальная гипотеза не подтверждается — заказчик несет минимальные финансовые затраты.
Примеры задач для DL
Предполагается, что для увеличения эффективности работы службы поддержки мы сможем разработать функциональный блок или подсистему, анализирующую текст обращения пользователя и автоматически определяющую тематику обращения, перенаправляя запросы профильным специалистам. Такая функциональная возможность в действующей системе поможет оптимизировать работу службы поддержки, а с технической точки зрения будет решаться задача NLP (Natural Language Processing — обработка естественного языка) — идентификация тематики текста по его содержанию. Также мы поможем определить ключевые метрики эффективности системы для оценки её пользы для бизнеса.
Другой пример из области машинного зрения (CV или computer vision) — идентификация объектов и оценка их характеристик на изображениях и в видеопотоке — распознавание образов, их классификация, а также задачи сегментации изображений. Кроме того, алгоритмы машинного зрения активно и успешно используются при решении различных задач во многих отраслях экономики, в том числе на производстве. Например, задачи по анализу и распознаванию видов линейных объектов и определение дефектов в процессе осуществления мобильного обхода или супервайзинга объектов инфраструктуры (трубопровод, линии электропередач и прочие производственные участки).