👨💻 Герой: Алексей Васильев, 34 года, Москва. Выпускник механико-математического факультета МГУ.
🛠 Работа: руководитель группы дата-сайентистов в Сбере. Обычно работает в офисе, 5/2 с 10:00 до 19:00.
🧭 Рынок: Data scientist в России: 427 вакансий
Зачем нужна лаборатория по искусственному интеллекту?
Лаборатория AI Сбера создавалась как центр компетенций в области искусственного интеллекта. С одной стороны, это научное подразделение и, как в любой лаборатории, мы здесь можем проводить эксперименты, проверять различные идеи, придумывать новые алгоритмы. С другой стороны, лаборатория — часть банка. Поэтому большая часть того, чем занимается лаборатория, имеет применение в банке и дочерних компаниях.
В лаборатории по искусственному интеллекту Сбера присутствуют разные группы. Например, есть группа AI в медицине. На основе её технологий в Москве появились система поддержки принятия врачебных решений. Пациент приходит на приём, доктор его опрашивает, составляет перечень жалоб, а искусственный интеллект предлагает три наиболее вероятных варианта диагноза.
Есть группа рекомендательных систем. В этом направлении разрабатывают технологии, которые оценивают поведение клиента и прогнозируют его интерес к другим продуктам компании на основе его предпочтений и предпочтений похожих пользователей. Вы взаимодействуете с рекомендательной системой каждый раз, когда смотрите ютуб: выбрали один ролик — в очереди уже стоят несколько похожих. Рекомендательные системы упрощают поиск контента, удерживают пользователей и помогают компаниям больше зарабатывать.
Или есть исследовательская группа, где сотрудники придумывают новые алгоритмы и пишут научные статьи.
Задачи в лаборатории
Я пришёл в Сбер в начале 2020 года на должность сеньор-дата-сайентиста в группу рекомендательных систем. Сейчас я руковожу этим направлением и вместе с двумя дата-сайентистами мы помогаем другим подразделениям улучшать их алгоритмы. Ещё мы консультируем команды и помогаем им добавлять рекомендательные системы к банковским сервисам и продуктам.
Классическая рекомендательная система построена на матрице взаимодействия между пользователем и объектами. Например, если мы говорим про видеосервис, то объектами будут фильмы: на пересечении строки и столбца матрицы стоит оценка фильма, который посмотрел пользователь.
Большая часть оценок нам неизвестна, и поэтому задача в том, чтобы заполнить матрицу предполагаемыми оценками исходя из информации о просмотренных фильмах. Далее список всех возможных фильмов нужно отранжировать и сделать так, чтобы у пользователя в рекомендациях оказались объекты с максимальным рейтингом с учётом его личных интересов.
При этом нужно учитывать, что подобные предсказания можно делать только в том случае, когда пользователь уже посмотрел несколько фильмов. Всегда будут случаи, когда он только начинает пользоваться сервисом или когда появляется новый объект, который ещё никто не видел — всё это дополнительные сложности и разные наборы математических алгоритмов.
Работа до Сбера
До Сбера я работал руководителем проектов и тимлидом в компании «Консультант Плюс». Это онлайн-справочник по правовой системе российского законодательства — что-то вроде поисковика по законам и другим документам из юридической сферы.
Вместе с командой я занимался улучшением и оценкой качества поиска: мы анализировали статистику, находили проблемные запросы и давали рекомендации по их улучшению. Например, если пользователи не могли найти какой-то закон, то мы пытались выяснить причину: его могло не быть в системе, поиск его не нашёл или проранжировал на слишком низкую позицию.
Ещё мы занимались внутренней аналитикой и помогали сотрудникам оценивать эффективность проделанной работы. Например, когда выходит новый закон — его недостаточно просто залить в систему: разные люди его изучают, комментируют и дополняют ссылками на другие законы. Дальше приходили мы и смотрели, как на это реагируют пользователи — как часто обращаются к комментариям, как долго читают документ и куда двигаются дальше.
Например, какой-то комментарий читали много — наверное, он полезный и нужный. А другие мало — возможно, людям и так понятен закон, либо они не так интересуются конкретно этим вопросом. Всё это мы анализировали.
Поступление в ШАД
Одно из преимуществ работы в сфере ИТ — гибкий график во многих компаниях: приходишь пораньше, делаешь запланированную работу и в нужное время отправляешься на учёбу.
С 2016-го по 2018 год я работал по гибкому графику и параллельно учился в Школе анализа данных (ШАД) — это помогло упорядочить накопившиеся математические знания и прокачаться в сфере больших данных. Так я открыл для себя дата-сайенс и планирую дальше развиваться в этом направлении.
Помимо знаний ШАД даёт две вещи: ты начинаешь ценить время и перестаёшь делать то, что отвлекает от цели. Работа с учёбой выключили меня из жизни на два года, всё свободное время я старался распланировать так, чтобы успевать выполнить задания к дедлайну. Во время учёбы понимаешь, что времени на самом деле более чем достаточно на что-то кроме работы. Поэтому всем, кто боится начать учёбу для повышения своих профессиональных навыков из-за нехватки времени, стоит просто попробовать.
После ШАДа я ещё полтора года проработал в «Консультант Плюс» и перешёл в Сбер — присоединился к большому комьюнити ради опыта и роста в профессии.
Рабочий график и инструменты
В офисе примерно с 10 утра до 7 вечера. Обычно утро начинается с планёрки, где каждый участник команды кратко рассказывает три пункта: что он сделал за предыдущий день, что будет делать сегодня и какие есть проблемы.
Планёрка занимает не более 15 минут — это не строгая мера контроля, а способ не застревать в рутинных задачах. Дальше работа: встречи, просмотр почты, планирование, постановка задач, мониторинг и написание кода.
Основной язык программирования — Python. Среда разработки — Jupyter Notebook или PyCharm.
Нужна ли математика в работе?
Зависит от ситуации. Для веб-разработки математика нужна на уровне средней школы. Например, чтобы посчитать ширину блоков во время вёрстки макета.
Если речь идёт о классическом машинном обучении или нейросетях, то под капотом этих технологий лежит математика — линейная алгебра, статистика, теория вероятностей и матанализ. Создать или правильно внести структурные изменения в эти технологии без знания математики вряд ли получится.
Моё мнение — математика нужна каждому программисту. Она развивает аналитическое мышление и помогает в карьере — математические знания часто проверяют на собеседованиях и указывают в требованиях вакансии.
Как ты поддерживаешь свой мозг в тонусе?
Мне нравится решать математические и алгоритмические задачки — это хороший способ скоротать время перед сном или по дороге на работу: в уме придумываю приблизительный план, а потом оформляю решение.
Тренируюсь на олимпиадных задачах по математике или программированию. Часть заданий беру с braingames.ru — это сайт без готовых ответов, где условия задачи можно обсуждать с другими пользователями. Каждое решение нужно расписывать и отправлять модераторам — правильный ответ без достаточных обоснований не засчитывается. Всё проверяют живые люди.
Что посоветуешь новичкам
Постарайтесь пораньше решить, чем хотите заниматься. Я с детства интересовался математикой и двигался туда, где её больше: в школе ходил на олимпиады, поступил на мехмат МГУ, закончил аспирантуру и нашёл себя в дата-сайенс. Если не знаете, с чего начать, — посоветуйтесь с человеком, мнению которого доверяете. Дальше начинайте пробовать и искать себя.
Не комплексуйте из-за возраста. Я поступил в ШАД в 30 лет и был не самым возрастным человеком в наборе — некоторым было даже за 40. Поэтому при желании выучиться и стать востребованным специалистом никогда не поздно.