Если вы не читаете второй абзац ниже, мне было бы любопытно услышать ваши первоначальные мысли о том, что такое 0,53 доллара в заголовке. Не стесняйтесь записывать их в разделе комментариев.
Новости технологий: «Машинное обучение». Деловые новости (Forbes, Wall Street Journal и др.): «Машинное обучение». LinkedIn, Twitter: «Машинное обучение».
За последние шесть месяцев или около того я буквально не мог посетить ни одну из вышеперечисленных торговых точек, не увидев так или иначе упоминаемого о машинном обучении.
Итак, я решил немного углубиться и проверить, что такое «машинное обучение» (назовем его ML).
Согласно Википедии, Машинное обучение — это подобласть «информатики, которая дает компьютерам возможность обучаться без явного программирования. Разработанное на основе изучения распознавания образов и теории вычислительного обучения в искусственном интеллекте, машинное обучение исследует изучение и построение алгоритмов, которые могут учиться и делать прогнозы на основе данных — такие алгоритмы преодолевают следующие строго статические программные инструкции, делая прогнозы или решения, основанные на данных, путем построения модели из выборочных входных данных. Машинное обучение используется в ряде вычислительных задач, где невозможно разработать и запрограммировать явные алгоритмы; Примеры приложений включают фильтрацию спама, обнаружение сетевых злоумышленников или внутренних злоумышленников, стремящихся к утечке данных», оптическое распознавание символов (OCR), поисковые системы и компьютерное зрение.
Просто прочитав само определение, можно легко увидеть, что для полного понимания машинного обучения требуются некоторые базовые знания, начиная от информатики и заканчивая математикой и статистикой.
Однако не отчаивайтесь. В эпоху облачных вычислений, в которой мы живем сегодня, многие игроки неплохо скрывают сложный аспект машинного обучения. Amazon Web Services (AWS), Microsoft Azure, IBM Watson Machine Learning и Google Cloud Platform предлагают управляемые сервисы машинного обучения с оплатой по факту использования, которые позволяют каждому создавать и обучать машины. модели обучения и создавать желаемые прогнозы на основе данных.
Я использовал платформу AWS, изучая удивительный мир машинного обучения. Когда у меня будет немного свободного времени, я надеюсь также изучить сервисы машинного обучения, предлагаемые платформами Microsoft, Google и IBM Cloud.
Для начала мне было достаточно просмотреть страницы AWS ML Начало работы и Часто задаваемые вопросы. Сервис AWS ML хорошо документирован (как и другие сервисы AWS).
Как я применил машинное обучение?
Я создаю модель машинного обучения (следуя учебному пособию по машинному обучению AWS), которая ищет потенциальных клиентов для целевой маркетинговой кампании.
Вместо того, чтобы рассылать маркетинговые электронные письма сотням тысяч клиентов, я создал модель машинного обучения, которая выявляла бы клиентов, которые с большей вероятностью купят недавно выпущенный банковский продукт, с помощью общедоступных наборов данных из Калифорнийского университета в Ирвайне (UCI). ) Репозиторий машинного обучения» (пример банковских и маркетинговых данных клиентов).
Поскольку я буду немного говорить о моделях машинного обучения, давайте сначала определимся. Модель машинного обучения – это набор шаблонов, которые алгоритмы машинного обучения находят в ваших данных на этапе оценки и обучения набора данных.
Вот рецепт из 7 шагов, которым необходимо следовать при создании приложения ML:
- Подумайте, какую бизнес-проблему вы пытаетесь решить, создавая приложение ML, и какой ответ вы хотите предсказать с помощью модели ML.
- Сбор и подготовка данных (здесь я имею в виду много данных, которые были очищены). Прогностическая сила вашей модели машинного обучения будет зависеть от того, насколько хороши ваши данные.
- Проверьте свои данные (AWS предоставляет хорошие инструменты для проверки данных).
- Создайте источник данных для обучения — AWS ML использует этот источник данных для обучения и оценки вашей модели машинного обучения.
- Создайте модель ML (очень важный шаг, поскольку модель ML идентифицирует шаблоны и генерирует прогнозы.
- Проверьте прогностическую эффективность модели и установите пороговое значение.
- Используйте модель для создания прогнозов.
Моя модель машинного обучения предсказала, что 120 клиентов (из примерно 4500 в выборке данных) с большой вероятностью купят новый продукт. Любые клиенты со значением «1», идентифицируемые алгоритмами машинного обучения, являются теми, на кого я могу специально ориентироваться во время различных маркетинговых мероприятий во время запуска продукта.
На шаге № 6, описанном выше, было выполнено несколько дополнительных настроек (оценка точности модели с использованием метрики площади под кривой (AUC) и корректировка порогового значения 0,77 (по умолчанию 0,5), чтобы направлять модель обучения на то, как целевые значения Назначены «0» и «1».
Итак, почему заголовок "0,53 долл. США"? Именно столько я заплатил за изучение этой удивительной технологии со следующим счетом AWS:
Очень недорого для очень мощной концепции, если вы спросите меня.