Продолжаем серию публикаций, в которых выпускники разных программ РЭШ делятся кейсами и своими карьерными историями. В этой статье Сайдаш Мифтахов (BAE’21) рассказывает, как на позиции аналитика данных в компании Северсталь он решал задачи по оптимизации процессов выплавки и охлаждения металла.
Секреты выплавки стали
Сайдаш Мифтахов – выпускник программы Совместного бакалавриата НИУ ВШЭ и РЭШ 2021, на момент событий кейса – четверокурсник, работающий на позиции аналитика данных в Северстали.
Северсталь – вторая по величине в России сталелитейная и горнодобывающая компания. Занимается производством более 55 тысяч различных продуктов из стали.
Задача: оптимизация процесса выплавки металла
В Северсталь ежедневно поступает множество заказов, и раньше технология производства сводилась к тому, что практически под каждый заказ производилась отдельная выплавка металла. Проблема заключалась в том, что для плавки необходим минимальный фиксированный объем стали. Условно: приходит заказ на 20 тонн, а нужно плавить минимум 300. Конечно же, это очень неэффективно. Именно в решении данной задачи и заключалась моя работа.
Декомпозируем и оптимизируем
Во-первых, мы сформировали большой пул заказов, которые не подходили под минимальный объем плавки, и по которым изначально у нас планировались избытки. Дальше мы выясняли требования: что от нас хотят на выходе? У металла очень много различных физических характеристик, которые называются механическими свойствами. При заказе металла указывается его марка, то есть диапазон подходящих характеристик. Идея была в том, чтобы посмотреть на эти требования и выделить блоки маленьких заказов, которые можно объединить, немного варьируя химический состав металла. Главное было понять, какие заказы можно объединять, а какие – нет. В этом и заключалась моя задача как аналитика данных.
И здесь сразу прослеживается связь data science с экономикой: процесс производства стали сопровождается транзакционными издержками, от которых необходимо избавиться, оптимизировав его.
Мы сделали конструктор, в котором можно сформировать заказ и получить на выходе определенный набор механических свойств.
Какие методы были использованы?
Итак, мы берем все химические свойства металла, и, исходя из них, прогнозируем набор механических свойств на выходе. По сути решение задачи сводится к построению регрессии на диапазоне данных. И в этом заключается основное новшество нашей модели — мы решаем задачу регрессии не с конкретным импутом, как это происходит обычно, а с целым набором входных характеристик. Подобное нововведение сильно упростило жизнь производственникам, ведь у них появилась возможность эффективнее оценить и распределить риски.
В РЭШ у нас был курс машинного обучения и, конечно, он здесь помог. Но главное не это. Школа приучает к тому, что ты берёшь задачу и решаешь её не в том виде, в котором она дана, а переформулируешь в реалиях для конечного пользователя. В этом смысле очень помог определенный тип мышления, который у меня сформировался в РЭШ.
Как эффективно охладить металл?
Задача: оптимизация работ по охлаждению металлов
На производстве мы также столкнулись с необходимостью оптимизировать работу установки по охлаждению металлов. Наша команда должна была составить алгоритм и выбрать значения управления агрегатом таким образом, чтобы на выходе получить нужную температуру сплава. Делая эту функцию автоматической, мы избавляли процесс производства от человеческого фактора и возможных ошибок.
Однако, тут мы обнаружили следующую проблему: на исторических данных выбор параметра зависит от характеристики, поэтому невозможно выделить причинно-следственные связи и понять, что на что здесь повлияет: постановка параметра агрегата на химические свойства металла или наоборот. Нужно отметить, что машинное обучение предполагает, что исследуемые данные независимы, а здесь у нас эта предпосылка нарушается.
Какие методы были использованы?
В итоге при решении данного кейса нам пришлось обращаться к эконометрическим работам, чтобы посмотреть, как схожая проблема каузальности решается там.
Конечная модель получилась двухэтапной:
- по характеристикам стали мы предсказывали параметр агрегата, который устанавливался исторически;
- оценивали, как отклонение параметра от таргетируемого значения ведет к изменению температуры.
Допустим, операторы всегда ошибались в большую сторону и ставили большее значение параметра, чем нужно. Тогда нам нужно понять, на сколько нужно его понизить, чтобы добиться подходящей температуры. Идею двухэтапности модели мы взяли из эконометрики.
Подать документы для поступления в 2022 году на Совместную программу по экономике НИУ ВШЭ и РЭШ вы можете с 20 июня по 25 июля 2022 года включительно (для лиц, поступающих только по результатам ЕГЭ и для лиц, поступающих без вступительных испытаний).