Публикации по теме 'monitoring'


Надежность: подготовьте свой завод к машинному обучению в будущем — начните сохранять данные об отказах!
Инструменты управления надежностью оборудования гораздо более автоматизированы и интеллектуальны, чем в прошлые годы, но то, будут ли они работать и насколько хорошо они будут работать для какой-либо отдельной компании, зависит от постоянной проблемы: доступных данных. Хорошо известно, что машинное обучение (МО) на основе данных о состоянии датчиков может ускорить выявление и анализ проблем, но плохие или отсутствующие данные об отказах могут замедлить МО, а также диагностику человека и..

Система мониторинга с Grafana и Prometheus
В современном цифровом мире системный мониторинг стал неотъемлемой частью обеспечения производительности и стабильности онлайн-приложений и сервисов. Системные администраторы и рабочие группы должны постоянно следить за состоянием своих систем, выявляя и устраняя проблемы до того, как они затронут конечных пользователей. Именно здесь на помощь приходит Prometheus, мощный инструмент мониторинга и оповещения, разработанный специально для современных инфраструктурных сред. Node Exporter..

Прогнозирование временных рядов для Prometheus и Grafana с помощью BigQuery ML
Используйте BigQuery ML, чтобы добавить в Prometheus возможности прогнозирования и сделать мониторинг более интеллектуальным. Для мониторинга и оповещения я использую Prometheus и Grafana, которые отлично подходят для этого. Но некоторые метрики имеют тенденции и повторяющиеся закономерности, что затрудняет их отслеживание с помощью предупреждений на основе пороговых значений. Поэтому я хотел узнать, может ли BigQuery ML прийти на помощь. Он предлагает прогнозирование временных..

Максимизация ценности стека мониторинга Grafana: интеграция Loki и Tempo
В этом посте я хочу углубиться в сложную тему, с которой инженеры часто сталкиваются при настройке системы мониторинга для производства. Отладка сложных приложений, особенно тех, которые содержат несколько микросервисов, может быть сложной задачей. Однако наличие такой комплексной системы, как Grafana, включающей ведение журнала, экспорт метрик и отслеживание, может значительно облегчить этот процесс. Но чтобы по-настоящему раскрыть его ценность, решающее значение имеет интеграция этих..

Мониторинг производства в реальном времени и оповещение с использованием машинного обучения, ElasticSearch и Grafana
В сегодняшней сложной бизнес-среде обеспечение бесперебойной работы и выявление критических проблем в режиме реального времени является серьезной задачей. Прошли те времена, когда обширные команды следили за графиками и поддерживали тысячи правил предупреждений, чтобы обеспечить бесперебойную работу важных систем. В этой статье рассказывается об инновационном и полнофункциональном подходе к использованию машинного обучения, ElasticSearch и Grafana для обеспечения мониторинга производства и..

Обеспечение качества искусственного интеллекта (часть 2)
Часть 2: « Она модель и хорошо выглядит» Это вторая статья из моей серии об обеспечении качества для систем, использующих машинное обучение. В первой части мы представили некоторые общие концепции и рассмотрели методы обеспечения качества данных, которые входят в модель. Теперь мы предполагаем, что данные чистые, модель-кандидат создана, и группа специалистов по анализу данных хочет запустить ее в производство. Что нужно сделать, чтобы убедиться в его точности? Тестовый набор..

Мониторинг конвейеров машинного обучения
В этом блоге я много говорил о процессе внедрения кода машинного обучения в производство. Однако, когда модели запущены в производство, вы еще не закончили, вы только начинаете. Модели придется столкнуться со своим злейшим врагом: Реальным миром! В этом посте основное внимание уделяется тому, какие виды мониторинга вы можете использовать, чтобы понять, как ваша модель работает в реальном мире. При этом учитывается как непрерывное обучение, так и использование обученной модели. Он..