Константин Короткий только в 2018 году окончил программу «Магистр экономики» РЭШ, но уже успел стать одним из основателей стартапа Data Nerds и спустя год поступить на PhD в Стэнфордскую высшую школу бизнеса. Мы попросили его рассказать о компании, о том, почему в России и за рубежом столь востребованы специалисты по машинному обучению и экономике одновременно, а также как ему удалось попасть в один из самых престижных университетов мира.
Стартап с экономическими корнями
Когда появилась Data Nerds и какова ваша роль в компании?
Компанию мы создали практически год назад – в конце мая – с моими одногруппниками из РЭШ и нашими друзьями с факультета ВМК МГУ. Сейчас у нас работает 10 человек, но мы активно ищем новых людей. Если первые проекты найти было очень тяжело, то сейчас, во-первых, новых клиентов находить стало намного проще, во-вторых, они уже и сами на нас выходят. В итоге мы вынуждены отказываться от ряда проектов просто потому, что у нас не хватает ресурсов.
Какие решения для бизнеса вы предлагаете?
Мы применяем методы машинного обучения и эконометрики для того, чтобы оптимизировать различные бизнес-процессы. Проекты бывают самые разные – мы не выбирали какую-то конкретную область для специализации. Мы работаем как с компаниями из тяжелой промышленности, так и с ритейлом, например.
Внутри нашей компании образовалось две команды. Одна занимается «компьютерным зрением» – автоматическим анализом потока фотографий и видео. Таких задач очень много на производстве – это обычно или цеха, или поля. Фото- или видеофиксация – лучший способ дистанционно понять, что происходит, потому что не всегда можно доверять людям на местах, традиционно очень много воровства.
Второе направление работы Data Nerds связано в основном с ритейлом. Мы сотрудничаем с многими сетями магазинов различной направленности - и продукты питания, и фэшн-индустрия, как оффлайн, так и онлайн-форматы. Для них мы помогаем подготовить промо-акции, рекомендуем, как выставить цены на товар, делаем прогноз спроса. Задачи очень разные, все зависит от клиента.
И кто ваши клиенты?
Сейчас я лично работаю над крупным проектом с Новолипецким металлургическим комбинатом – мы прогнозируем, когда сырье придет на комбинат. Другой долгоиграющий проект для компании Продимекс (агробизнес) – мы вводим «компьютерное зрение» на разных участках их бизнес-процесса, чтобы снизить в том числе воровство. Мы активно работаем с ритейлом в России, и у нас уже есть зарубежные проекты – я не могу раскрывать названия компаний, но среди наших клиентов, например, сеть украинских магазинов «эконом-класса». Мы с ними тоже работаем над ценообразованием.
Экономика и машинное обучение
Зачем стартапу, специализирующемуся на машинном обучении, экономисты?
Нужно понимать, что есть большая разница между просто машинным обучением и машинным обучением, которое приносит деньги. Сам по себе этот метод анализа данных про математические задачи, про классификацию, прогнозы. Внедрять машинное обучение – еще не означает зарабатывать.
Допустим, мы научились прогнозировать спрос в конкретном магазине – но как на этом заработать? Сам по себе прогноз еще никому не сэкономил ни копейки. Было очень много случаев – не у нас, а вообще, в том числе на Западе – когда разрабатывалась какая-то система, которая что-то прогнозирует или классифицирует, она отдавалась клиенту в надежде, что он сам разберется, что с этим делать. Но этого не происходило, и в итоге компания-клиент теряла деньги.
И здесь на помощь приходит экономика?
Да, на самом деле связать математическую модель, даже если она хорошо построена, с реальным бизнес-процессом так, чтобы она экономила деньги – это задача для специалиста по анализу данных не менее сложная, чем разработка изначальной модели. Именно поэтому некоторые компании скептично относятся к машинному обучению – не всегда видно, какой от него экономический эффект.
Экономическое образование необходимо для того, чтобы бизнес-задачу в таком виде, в котором ее формулирует клиент, трансформировать в математическую задачу, которую можно решить, запрограммировать и т.д. Нужно идею клиента вписать в общие задачи фирмы – максимизации прибыли и т.д., понять, как именно можно задачу упростить и какие именно предположения ввести, чтобы довести задачу до конкретной математической постановки.
Основная проблема развития направления анализа данных в России сейчас – в том, что практически нет людей, которые могут конкретную бизнес-задачу перевести в математическую плоскость. Ребят, которые знают, что такое машинное обучение, готовы работать с самой математической основой, довольно много. Это выпускники Школы анализа данных «Яндекса», ВМК МГУ, «Физтеха». Они готовы по набору переменных Х предсказывать У, но это совсем не все и даже не основное.
Что вам дало обучение в РЭШ?
В РЭШ на программе «Магистр экономики», где я учился, пока нет курсов по машинному обучению. Но дается образование очень высокого качества, в том числе по эконометрике. Оказалось, что если вы освоили эконометрику, то не такая большая проблема изучить за некоторое время машинное обучение самостоятельно.
Да, пришлось потратить несколько месяцев на изучение. Мы начали с общих книг, а потом перешли к статьям более узкой направленности. Я, например, занимаюсь ценообразованием, внутри компании веду по этой теме работу, и одновременно это мой исследовательский интерес. Я изучал литературу по ценообразованию с помощью машинного обучения – и оказалось, что ее не так много.
Маркетинг и наука
Кажется, что маркетингом должны заниматься сами компании и это очень прикладная специальность. В чем разница между научным и прикладным маркетингом?
Разница в основном в том, что в рамках компаний люди обычно не занимаются разработкой чего-либо инновационного с точки зрения науки. Как правило, для того, чтобы принести деньги клиенту или сократить его издержки, достаточно подобрать инструмент и правильно его применить.
Научный маркетинг заключается в том, что мы сами разрабатываем эти инструменты. И далеко не все компании вроде нашей могут позволить себе этим заниматься – это не всегда экономически целесообразно. Хотя иногда мы делаем исключения, например, когда нужно установить цены для целой продуктовой линейки. Это нетривиальная задача, которая плохо описана в литературе.
Такие научные подходы успешно работают?
Да, например, мы оптимизировали ценообразование для сети магазинов, которая продает товары для дома. Мы обнаружили, что в линейках товаров есть отдельные предметы, которые «каннибализируют» прибыль – то есть товары с низкой маржинальностью, которые перетягивают на себя покупателей. Если мы уберем этот товар, действительно ли люди перейдут на другие?
Мы разработали, и потом я совместно с профессором РЭШ Дарьей Дзябурой усовершенствовал модель, которая позволяет обнаруживать «канибализирующие товары», устранять такие ситуации правильным образом (выставляя оптимальную цену) и оптимизировать в целом ценообразование по линейке. Применив эту модель на практике, мы увидели увеличение прибыли компании по этому сегменту. Мы продолжаем эксперименты, и этот продукт является уникальным – ничего подобного пока не делают ни в России, ни в Америке, ни где-либо еще.
Сейчас вы сами преподаете в РЭШ на разных программах. Чему вам кажется важным научить студентов?
Мне кажется, что студентам очень важно научиться понимать предположения, которые стоят за теми или иными методами и инструментами. Это не новая идея, этому нас учил профессор Сергей Измалков на встречах по дипломным работам. Чем дальше я ухожу в бизнес, тем больше начинаю понимать, что это очень важно.
И в эконометрике, и в машинном обучении есть очень много разных инструментов для анализа данных – и люди не могут понять, какой из них лучше для конкретной ситуации. Часто в итоге люди начинают либо использовать только то, что они умеют, либо хаотично все перебирать, каким-то образом выискивая лучший инструмент. Поэтому очень важно понимать, какие предположения стоят за каждым из них.
Почему вы решили поступать на PhD? Как вам удалось попасть в Стэнфорд?
В этом году я поступил в Стэнфордскую высшую школу бизнеса (Stanford Graduate School of Business) на программу по количественному маркетингу. Я решил продолжить обучение, потому что понял, что необходимо развиваться дальше. Работа в компании, выполнение различных проектов – это горизонтальное развитие, а PhD – вертикальное. Это возможность думать над разными проблемами долго, писать статьи и разрабатывать новые методы.
В таких крупных компаниях, как Facebook или Google, есть свои внутренние лаборатории, которые занимаются разработкой методов. Мы как стартап не можем себе позволить такую роскошь. Разработка методов – лишь часть нашей деятельности, финальная цель – их применение.
Но мне очень важно было этот год поработать, чтобы поступить на программу в Стэнфорде. Потому что, особенно если вы едете в бизнес-школу, вне зависимости от направления (маркетинг, финансы), хорошо бы понимать, что нужно компаниям. Это неиссякаемый источник для научных статей.
На ваш взгляд, насколько востребованы сейчас на российском и международном рынке специалисты вашего профиля?
Спрос очень большой – даже, я бы сказал, гигантский в России. И мне, и моим товарищам по Data Nerds поступали предложения пойти работать в другие компании за очень большие деньги. Такие зарплаты можно объяснить только тем, что спрос большой, а предложения мало. Необходимы люди, которые и хорошо понимают различные виды анализа данных (в том числе машинное обучение и эконометрику), и имеют и могут применить экономические знания. На мой взгляд, с этим видом задач в России могут справиться только выпускники РЭШ с некоторой дополнительной подготовкой.
Причем спрос будет только больше – это не хайп, который через год сойдет на нет. Это очевидно, когда вы общаетесь с компаниями. Большая часть бизнеса пока не готова внедрять машинное обучение. Скажем, в России 90% компаний даже не знают, что это такое, а 10% знают и готовы работать в этом направлении. Эти 90% постепенно будут перемещаться в группу к 10%.
Перспективно это направление и за рубежом, хотя есть своя специфика. На американском рынке уже, наоборот, 90% компаний слышали про машинное обучение, а 10% ничего о нем не знают. В США таким компаниям, как наша, уже не так просто что-то продать, нужно отличаться от конкурентов. Но все равно перспективы огромные – там гигантский рынок и есть большое количество примеров успешного применения машинного обучения в различных сферах.