Как найти подходящую команду по машинному обучению

Вопросы, которые следует задавать, и тревожные сигналы, которых следует избегать

Как специалист по машинному обучению, ориентироваться в разнообразии ролей машинного обучения в отрасли может быть сложно. Названия должностей обычно не очень помогают, потому что они меняются в зависимости от компании, а также в зависимости от организации внутри компании. Названия должностей также имеют тенденцию меняться со временем, как мы видели в ребрендинге аналитиков данных в ученых данных.

Поэтому, чтобы ориентироваться на рынке труда и находить для себя потенциальные роли, вам необходимо составить список наводящих вопросов. Вот 3:

какая у них команда ML?
какая разница в навыках?
чем они владеют и кто их клиенты?

Давайте немного углубимся в каждый из этих 3 наводящих вопросов, и почему они всегда должны быть у вас в голове при исследовании рынка труда ML.

Что это за команда ML?

В зрелой технологической компании (хотя и не обязательно в стартапе) вы обычно найдете 3 типа команд машинного обучения: инфра, прикладные и исследовательские:

Команды Infra ML создают сервисы для разработки моделей, которые они предоставляют другим командам через API или пользовательские интерфейсы. Одна команда может владеть службой моделирования, другая — службой разработки признаков, третья — службой логических выводов и так далее. Команды инфраструктуры машинного обучения работают над такими проблемами, как:

Масштабируемость: как мы можем масштабировать наши услуги на весь набор моделей машинного обучения, принадлежащих компании?
эффективность: как мы можем снизить вычислительные затраты на обучение и обслуживание наших моделей?
интеграция: как мы можем интегрировать прогнозы модели с продуктом? Как мы обрабатываем случаи ошибок, когда вызов вывода модели терпит неудачу?
автоматизация и абстракция: как мы можем автоматизировать и абстрагироваться от большей части тяжелой работы, связанной с разработкой модели? Как мы можем создать удобные инструменты самообслуживания, чтобы даже бизнес-партнеры, не являющиеся техническими специалистами, могли создавать и развертывать свои собственные модели?

Команды прикладного машинного обучения проектируют, разрабатывают, тестируют, развертывают и многократно улучшают модели машинного обучения, которые решают конкретные бизнес-задачи, используя инструменты, принадлежащие инфраструктурным группам машинного обучения, где это возможно. Эти команды работают над такими проблемами, как:

фрейминг: как мы можем сформулировать бизнес-проблему как проблему машинного обучения?
обнаружение данных и функций: какие данные нам нужны для решения этой проблемы? Как получить правильные этикетки и убедиться, что они надежны? Какие функции нам нужны и каков охват этих функций?
экспериментирование и A/B-тестирование: какая модель лучше всего подходит для нашего варианта использования?
непрерывное улучшение: как часто мы должны переобучать модель? Как мы можем улучшить следующую версию модели, добавив больше функций, больше размеченных данных, лучшую выборку или лучшую архитектуру модели?

Команды исследователей машинного обучения изобретают новые алгоритмы или архитектуры моделей, главной целью которых является публикация их результатов в академических журналах и на конференциях. Они являются родиной инноваций, таких как оптимизатор ADAM, механизм внимания или определенные архитектуры моделей, такие как AlexNet или BERT. Большая часть исследований в области машинного обучения никогда не попадает в производство, но когда это происходит, это может привести к изменению парадигмы с огромным приростом производительности. Исследовательские группы работают над такими проблемами, как:

как мы можем превзойти последние достижения в общедоступном наборе эталонных данных?
каковы эмпирические законы масштабирования, описывающие поведение больших нейронных сетей?
почему глубокое обучение вообще работает и каковы его ограничения?
как именно работает тонкая настройка большой языковой модели?

Выберите команду, которая лучше всего подходит для той работы по машинному обучению, которой вы хотите заниматься. Основываясь на моих собственных наблюдениях, команды инфра-МО, как правило, привлекают людей с опытом разработки программного обеспечения, в то время как команды прикладного и исследовательского МО, как правило, привлекают людей с академическим образованием, часто с докторской степенью. Это может быть связано с тем, что роли прикладного и исследовательского машинного обучения в большей степени зависят от экспериментов, что может быть более естественным для ученого с докторской степенью, чем для инженера.

Наконец, избегайте фабрик булавок, когда разработчики моделей создают артефакты моделей и передают их инженерам для развертывания. Это расстраивает всех, потому что приводит к излишним затратам на коммуникацию, замедляет циклы итераций и создает нечеткое право собственности и поиск виноватых, когда что-то ломается в производственной среде.

В чем пробел в навыках?

«Я абсолютно знаю, что это сложно, но мы научимся это делать». — Джефф Безос

Никогда не будет роли, для которой у вас есть все необходимые навыки. Вместо этого всегда будет разрыв между вашим личным набором навыков и теми, которые определяют роль.

Это приводит к компромиссу: если разрыв в навыках велик, вы узнаете больше, но вам потребуется больше времени, чтобы набраться опыта. Если разрыв в навыках невелик, вы учитесь меньше, но вы быстрее развиваетесь и быстрее вносите свой вклад.

Выберите роль с достаточно небольшим разрывом в навыках, чтобы вы чувствовали себя уверенно, чтобы внести свой вклад в течение разумного периода времени, но избегайте ролей, в которых вам действительно нечему учиться. Например, если новая команда прикладного машинного обучения использует те же технологии моделирования и тот же технологический стек, с которым вы сейчас работаете, только в другой проблемной области, для вашего обучения нет ничего технически нового, и это может быть не лучшая карьера. двигаться.

Размышляя о пробелах в навыках в потенциальных новых ролях, также полезно принять то, что психологи называют мышлением роста по сравнению с фиксированным мышлением: верьте, что вы освоите необходимые навыки на лету.

Чем они владеют и кто их клиенты?

Каждая команда должна чем-то владеть, и у них должны быть клиенты. В частности,

Команды Infra ML владеют сервисами, а их клиентами являются либо другие команды Infra ML, либо команды прикладного ML,
прикладные команды машинного обучения владеют моделями, а их клиенты — пользователи приложений и веб-сайтов компании,
Исследовательские группы машинного обучения владеют исследовательскими областями, а их заказчиками в основном являются другие исследовательские группы, и в редких случаях, если инновация достаточно практична для производства, команды инфра- и прикладного машинного обучения.

Будьте осторожны с командами, которые либо ничем не владеют напрямую, либо владеют чем-то, но не имеют клиентов. Например, если прикладная команда машинного обучения не владеет моделями напрямую, а вместо этого делает предложения для моделей, принадлежащих другим командам, влияние в этой команде всегда будет ограничено доброй волей других. Или, если команда инфра машинного обучения владеет сервисом, у которого очень мало внутренних клиентов, рано или поздно может возникнуть вопрос, действительно ли этот сервис и, следовательно, команда все еще нужны.

Таким образом, вопрос «Чем они владеют и кто их клиенты» является чрезвычайно полезным тревожным сигналом, и вы всегда должны помнить об этом при опросе новых команд машинного обучения.

Последние мысли

Когда вы ищете свою следующую (или первую) команду машинного обучения, всегда держите в уме эти 3 вопроса:

какая у них команда ML? Инфра, прикладная или исследовательская?
каков разрыв в навыках, и вас это устраивает? Есть ли что-то новое для вас, чтобы узнать?
чем они владеют и кто их клиенты? Если им ничего не принадлежит, как они могут оказывать влияние? Если у них нет клиентов, зачем они нужны?

Наконец, так же, как со временем меняются роли и титулы, меняются и ваши собственные предпочтения. Лично я начал свой путь с исследований в области машинного обучения, но вскоре переключился на прикладное машинное обучение, потому что мне гораздо больше нравились перспективы создания реального влияния, чем публикации статей, которые вскоре могут быть забыты. Я также знаю коллег, которые перешли от прикладного МО к инфра-МО, потому что им не нравился непредсказуемый характер проведения экспериментов МО или потому что они хотели освоить новые навыки.

Всегда помните, что это ваша карьера, и если вы не будете заботиться о своих интересах, никто другой этого не сделает. Делайте выбор, который приведет вас туда, где вы хотите быть.

📫 Подпишитесь и получайте мою следующую статью прямо на ваш почтовый ящик.
💪 Стань участником Medium и разблокируйте неограниченный доступ.
📖 Получить мою электронную книгу для получения более практических идей по машинному обучению .