19 марта 2019 года была официально запущена GPU-версия базы данных Alibaba Cloud RDS PostgreSQL. Эта новая версия базы данных использует параллельное ускорение гетерогенных вычислений RDS, обеспечивая значительные улучшения. На самом деле было показано, что вычислительные возможности графических процессоров примерно в 50 раз выше, чем у центральных процессоров. Используя гетерогенные вычисления на уровне облачной инфраструктуры RDS, это первая база данных в Китае, которая коммерчески применяет графические процессоры в области пространственной информации.

Параллельные вычисления на графическом процессоре

Графические процессоры можно определить как любые графические процессоры с высокопроизводительной параллельной архитектурой. Традиционные процессоры имеют только четыре или восемь вычислительных ядер, тогда как графические процессоры могут иметь до нескольких тысяч вычислительных ядер. В сочетании с кешем данных и управлением потоком все это делает графические процессоры подходящими для ускорения задач обработки данных, требующих больших вычислительных ресурсов. В прошлом графические процессоры разрабатывались для использования преимуществ параллельных графических вычислений. Однако в последние годы, с ростом применения графических процессоров в ИИ и высокопроизводительных вычислениях в целом, графические процессоры становятся все более синонимами как мощных, так и универсальных процессоров.

С запуском этой версии RDS впервые адаптируется к платформе GPU на уровне облачной инфраструктуры, закладывая основу для построения параллельной гетерогенной вычислительной среды для ApsaraDB. Учитывая большой объем пространственной графики, данных изображений и сложных вычислений, возможности ускорения графических процессоров на первом этапе объединяются с Ganos, что повышает производительность обработки пространственных данных. Ganos может предоставлять эффективные вычислительные услуги, такие как хранение, запросы и анализ, для различных типов пространственно-временных данных в облаке.

Система предоставляет гетерогенную вычислительную среду ЦП и ГП, которая может автоматически определять среду ГП и устанавливать метод оптимизации на основе правил для оценки гибридных вычислений ЦП, ГП или ЦП-ГП. В пространственных вычислениях можно установить оптимальную адаптацию между пространственной параллельной моделью ГИС (например, инфраструктурой растровых данных Raster-Chunk-Cell) и параллельной моделью CUDA (вычислительная платформа, запущенная NVIDIA), что сокращает планирование задач GPU и максимизирует использование ресурсов графического процессора.

Приложения этой архитектуры графического процессора

Ускорение переноса пространственных данных в облако

Пространственные растровые данные (изображения дистанционного зондирования, модели высот и т. д.) имеют большое количество разбиений, большой объем и низкую скорость переноса в облако. Повышение скорости записи ApsaraDB за счет улучшения базовых алгоритмов — это сценарий приложения, который беспокоит пользователей. Если взять в качестве примера алгоритм повторной выборки растровых данных, качество изображения выборки кубической свертки и более продвинутых алгоритмов повторной выборки хорошее, но вычислительная нагрузка возрастет. Следовательно, повышение эффективности обработки базовых алгоритмов является ключом к ускорению обработки растровых данных. В соответствии с выводом 10000 * 10000 пикселей данных изображения дистанционного зондирования, 100 миллионов алгоритмов выборки необходимо запускать независимо, что требует интенсивных вычислений, а растровые данные представляют собой матричную модель, поэтому возможность параллельного ускорения графического процессора может быть полностью использована. повысить эффективность повторной выборки.

Динамическое проецирование изображений в реальном времени

В пространственных приложениях дистанционного зондирования системы координат часто несовместимы из-за разных источников данных или методов сбора. Когда данные необходимо наложить и отобразить единообразно, они либо заранее преобразуются в одну и ту же систему координат, либо проецируются динамически в реальном времени. Использование первого будет иметь проблему избыточности данных, а использование второго более эффективно. Однако из-за большого объема вычислений часто трудно добиться отображения в реальном времени в среде ЦП. Эта проблема может быть решена путем использования параллельных вычислений на графическом процессоре для повышения эффективности вычислений динамической проекции.

Более быстрая обработка данных отслеживания

С быстрым развитием интернет-технологий путешествий и определения местоположения увеличивается объем данных, генерируемых движущимися объектами (такими как самолеты, корабли и автомобили). Доступ, обновление, отображение, передача и хранение таких больших объемов данных о дорожках представляет собой серьезную проблему для отрасли. Однако с помощью возможностей параллельных вычислений графического процессора данные отслеживания мобильных объектов могут быть динамически прорежены в режиме реального времени, чтобы уменьшить емкость хранилища, а также быстро передавать и отображать данные.

Доказано, что он оптимизирует вычислительную производительность

Сравнительный тест показал, что возможности параллельных вычислений графических процессоров в среднем примерно в 50 раз выше, чем у центральных процессоров. Это улучшение становится еще более очевидным по мере увеличения объема данных и усложнения вычислительных задач. Например, когда данные хранятся на облачном диске SSD, GPU работают в 9–15 раз быстрее, чем CPU, для хранения изображений дистанционного зондирования (включая создание индекса). Затем, когда данные хранятся в Alibaba Cloud OSS, графические процессоры работают в 4–7 раз быстрее, чем процессоры, используемые для процесса получения хранилища данных.

Как использовать эту версию в облаке Alibaba

Версия Alibaba Cloud RDS для PostgreSQL с графическим процессором была запущена в общедоступном облаке и в настоящее время доступна только в China East 2 (Шанхай). При покупке продукта выберите базовую версию PG10 и выберите модель ускорения графического процессора в столбце «Тип». По умолчанию в системе уже есть среда GPU. Вы можете оценить производительность вычислений с ускорением на графическом процессоре, не устанавливая никаких параметров.

Дополнительные сведения о RDS для PostgreSQL см. на следующих страницах:

Оригинальный источник