19 апреля 2018 года CNEWS провёл мероприятие, посвященное Big Data. И хотя некоторые эксперты утверждают, что волна интересна к Big Data уже прошла, зал был наполнен участниками до отказа, да и состав докладчиков был внушительным.
На правах ведущего, открывал конференцию Станислав Макаров, который поделился зарубежными трендами Big Data, а также основными новостями и сплетнями данного рынка. Общее видение развития Big Data, красивые слайды, англоязычный контент и множество ссылок на первоисточники, заставили зал слушать доклад с явным интересом. Ну и как всегда немного скепсиса и юмора в конце доклада.
Следующим доложился представитель компании «Naumen», Никита Никитинский. Его доклад был посвящен роботизации службы технической поддержки, в основе которой лежит их ИТ-решение в части ITSM. Роботизация маршрутизации заявки внутри службы технической поддержки, «умный» поиск по базе знаний, машинное обучение. В целом интересно, и ориентировано на практику, также звучали цифры получаемого эффекта. Много внимания было уделено используемым технологиям, полный стек которых рекомендую смотреть в презентации докладчика.
Компания «Тринити» в лице Евгении Евдокимовой – представила системы поддержки принятия решений, построенные на машинном обучении. Доклад содержал множество практических кейсов применения, это и прогноз оттока абонентов (телеком, розничная торговля), и даже прогноз увольнения сотрудников, а также прогноз отклика на маркетинговые компании, анализ покупательских корзин в розничной торговле (с распознаванием лиц!), прогнозирование брака в производстве и прогноз поломок оборудования. Из интересных фактов — срок действия прогнозной модели 0,5 — 1 год, дальше нужно обновление, прямо как с моделями бизнес-процессов.
Самойлов Михаил от компании «Инфокомпас» рассказал о масштабном проекте по анализу данных пассажиров, передвигающихся на общественном транспорте в городе Москве. Тут и информирование пассажиров московского общественного транспорта, и организация обратной связи с пассажирами, и прокладка маршрутов, и даже социальная сеть внутри автобуса. Была обозначена и ключевая задача — пересадить москвичей на общественный транспорт. Из новостей, скоро заработает программа лояльности на базе карты Тройка, наверное, будет считать минуты, проведенные в общественном транспорте, и компенсировать их «призовыми поездками».
Мне было интересно узнать, что в Департаменте транспорта г. Москвы создается центр глубокой аналитики, при сотрудничестве с партнерами, и в том числе со спецслужбами. В общем «Большой Брат» скоро будет смотреть за нами пока мы едем в общественном транспорте. Зал застыл в тишине на время доклада, ведь это не автоматизация service desk — это коснется каждого.
Представитель Банка России, Валерий Артемьев сделал общетеоретический доклад где было много общих слов про BI, Data mining, Advanced analytics, Data science, в общем стартовая презентация по теме. Но уже в конце доклада вопрос из зала «вскрыл» идущий проект ЦБ по сбору всех транзакций из банков не только по юридическим лицам, что уже работает на практике, но и по физическим лицам, что планируется в ближайшее время. Вот и практический пример Big Data. Коррупционерам теперь не укрыться нигде, так как доходы легко сводятся с расходами.
Представитель компании «Сибур», Владимир Чернаткин, рассказал о практических проектах с применением машинного обучения на нефтехимическом производстве. Это и анализ зависимости эффективности технологического процесса от температуры воздуха на улице, и снижение частоты останова производства от изменения качества гранул пенопропилена на входе, и повышение выхода готовой продукции на 0.1%, что дало 800 тонн продукции в год дополнительно, и даже построение модели нефтехимического реактора для последующего изменения техпроцесса и уменьшения времени капитального ремонта реактора за счет предсказательной модели. Все конкретно и по делу, а Вы что думали, это же производство. Масштабы проектов полгода, работали спринтами, выкатывая раз в две недели, версию модели.
Варвара Новожилова из компании «Аэроклуб», которая оказывает тревел-услуги, рассказала о примерах применения клиентской аналитики, таргетированом предложении, рекомендательных системах, дополнительных продажах, нестандартных зависимостях, которые были обнаружены, гипотезах и их подтверждении. С точки зрения технологий, запомнилась RTB платформа, которая преследует нас всех навязчивой рекламой и появление нового словосочетания — data mining platform (DMP). Еще мне понравился термин — B2B2C, в общем интересный и бодрый доклад.
Доклад Ильи Мунермана о машинном обучении, нейронных сетях и «скоринге» изобиловал математическими терминами, так что мне пришлось вспоминать дисциплины из первого образования. Понравилась идея о том, что одна нейронная сеть работает внутри, например, на распознавание мошенников в кредитном процессе, а вторая работает на проверку корректности работы первой на основании внешних данных. В докладе прозвучали интересные факты про «Индекс должной осмотрительности» для анализа контрагентов, вероятности их банкротства или смены собственников на «мошенников». Из озвученных фактов, ежегодно 120 тысяч организаций утрачивают платежеспособность, а лишь 13 тысяч банкротится из-за сложных российских бюрократических процедур. Разница между этими цифрами, это интереснейший объект для анализа. Бизнес-модель для проверки контрагента интересная, да и докладчик зажигал, надеюсь данный бизнес будет расти экспоненциально.
Доклад представителя «Шоколадницы», Игоря Кукоева был про анализ параметров ресторанов для понимания возможного их пересечения в борьбе за клиента, и не только для ресторанов, но и для структур управления ресторанами. Была представлена аналитическая модель, которая похоже использовалась при объединении Шоколадницы с Кофе Хаусом.
Представитель Сбербанк-Технологий, Борис Рабинович, рассказал о новой платформе для автоматизации процессов и анализа данных. Была представлена программа — фабрика данных, в которой уже работают data scientist. Технических терминов в докладе было много, объемы поражали, правда детального рассказа о решении той или иной бизнес-задачи, за исключением ускорения выдачи кредита и борьбы с мошенничеством не было. 10 Пбайт данных, 5000 транзакций в секунду, 6 часов на ежесуточное обновление данных. В системе уже работают несколько сотен исследователей данных, вот это компетенцию собрали. Технологический стек ищите в презентации докладчика, он был озвучен.
Последним выступал Вячеслав Колчин, представитель УК «ФДР», мне показалось, что он рассказывал очень сложно о простом. В целом доклад был про непредсказуемость человека, но словесные конструкции докладчика никак не складывались у меня в единое целое, возможно просто мое хранилище для новой информации уже переполнилось, и я уже не смог выделить суть доклада. Ум, чувства или воля. Сознание против бессознательных решений. Цитаты Каннемана, Достоевского. В общем, занимательная философия, и в качестве финала высказывание, «Человек путается в целях, а робот не имеет совести». Отличный финал для мероприятия.
В целом, данное мероприятие CNEWS было интересное, по делу, не зря сходил, спасибо организаторам!