Ниже приведено учебное руководство, которое поможет вам пройти проверку Microsoft DP-100: проектирование и внедрение решения для анализа данных в Azure всего за 60 часов.

В руководстве предполагается, что у вас есть базовое представление о машинном обучении и вы выполнили хотя бы несколько основных сквозных задач по классификации и регрессии.

Первый шаг - пройти официальную страницу DP-100 в Microsoft, https://www.microsoft.com/en-us/learning/exam-dp-100.aspx, чтобы понять, что нужно можно ожидать на экзамене. Из раздела Измерение навыков, основанного на процентном соотношении, мы можем видеть, что большинство вопросов будут от выбора модели / обучения / оценки, EDA / преобразования данных, проектирования функций и среды разработки / развертывания.

В экзамене 35 вопросов, и примерно 50% из них основаны на общих темах машинного обучения, а типы вопросов включают:

  • Пример из 4–6 вопросов.
  • Множественный выбор одного ответа
  • Множественный выбор Множественные ответы
  • Расставить в правильном порядке
  • Заполните Код

Экзамен начался с тематического исследования, и после того, как вы ответите на все вопросы в этом разделе и выйдете из него, вы не сможете вернуться и просмотреть их. Итак, идеальный подход здесь - прочитать весь пример целиком один раз, а затем пройти часть раздела, основанную на вопросе. Пример может быть связан с проблемой классификации, а вопрос может заключаться в том, как исправить проблему переобучения.

Другие типы вопросов говорят сами за себя, и вы можете попробовать метод исключения, чтобы ответить на неизвестный вопрос, поскольку нет отрицательной оценки.

Измеряемые навыки включают:

  • Разработка моделей (40–45%) - этот раздел имеет самый высокий процент. Большинство вопросов в этой области будут общими, и они не зависят от языка программирования и SDK. Итак, даже если вы работали над scikit-learn, вы сможете правильно ответить на вопросы.
  • Подготовка данных для моделирования (25–30%). Этот раздел занимает второе место по процентной ставке и представляет собой сочетание общих вопросов и тем, относящихся к платформе Microsoft. В этой области может возникнуть несколько каверзных вопросов.
  • Выполнение проектирования функций (15–20%). Хотя в этом разделе содержится небольшой процент, я чувствовал, что в этой области есть несколько сложных вопросов.
  • Определите и подготовьте среду разработки (15–20%) - этот раздел будет содержать все вопросы, связанные с платформой Microsoft Azure. Итак, вы должны иметь хотя бы четкое представление о различных инструментах, платформах и сервисах.

Ниже приводится приблизительное руководство о том, как потратить 60 часов на сдачу экзамена DP 100.

1. Пройдите бесплатное интерактивное обучение на Microsoft Learn (10 часов)

Хотя полный набор руководств займет около 30 часов, https://query.prod.cms.rt.microsoft.com/cms/api/am/binary/RE2PLKZ, вы можете перемотать вперед несколько руководств или даже пропустите их, так как все они не появятся на экзамене.

2. Студия машинного обучения Azure (10 часов)

Это отправная точка, чтобы узнать больше о платформе машинного обучения от Microsoft - Machine Learning Studio, которая представляет собой инструмент перетаскивания, который вы можете использовать для создания, тестирования и развертывания решений для прогнозной аналитики. Вам нужно потратить некоторое время на изучение Студии машинного обучения, поскольку это основной строительный блок, и большинство вопросов, специфичных для Microsoft, основаны на этом приложении. Вы можете создать бесплатную учетную запись для изучения Студии машинного обучения Microsoft Azure. Убедитесь, что вы создали несколько экспериментов и изучили все возможности, предоставляемые Студией машинного обучения. Щелкните каждый модуль и просмотрите его свойства, а также убедитесь, что вы щелкнули «Быстрая справка» в правом нижнем углу страницы, чтобы узнать больше об этом модуле.

3. Галерея Azure AI (10 часов)

Выберите раздел Эксперименты на https://gallery.azure.ai/browse, чтобы изучить различные эксперименты по классификации, регрессии, кластеризации, обнаружению аномалий, преобразованию данных, обучению, тестированию, оценке, статистическим функциям, анализу текста и другие. Вы можете начать с материалов от Microsoft и при необходимости изучить эксперименты других пользователей.

4. Справочник по модулю Студии машинного обучения (20 часов)

Потратьте очень много времени на этот раздел - https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/. Прочтите все модули и внимательно просмотрите варианты, доступные для каждого модуля, поддерживаемые параметры, типы данных, с которыми работает этот модуль, и любые сравнения с другими связанными модулями. Каждая из тем в списке очень важна. Трудно пройти экзамен, не зная всех тем на этой странице. Поэтому, пожалуйста, уделите много времени этой странице.

5. Общие темы (10 часов)

Просмотрите следующие темы, так как по ним тоже будет мало вопросов. Вы можете просто потратить некоторое время, чтобы понять, что делает это приложение или сервис и на каком этапе вашей работы это будет применимо.

Пожалуйста, оцените статью, если она помогла вам сдать экзамен Microsoft Certified Azure Data Scientist Associate Exam.