Вопросы по теме 'google-cloud-data-fusion'

Получение ошибки тайм-аута соединения при запуске простого конвейера слияния данных для экспорта данных из Bigquery и записи в GCS
Я пытаюсь использовать службу объединения данных Google, я создал простой конвейер, который будет извлекать данные из BigQuery и загружать эти данные обратно в GCS в формате json, но когда я запускаю конвейер, я получаю следующую ошибку....
758 просмотров
schedule 08.06.2022

java.lang.NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream. ‹init› (Ljava / io / InputStream; Z) V в предварительном просмотре
Экспериментирую с Google Cloud Data Fusion. Я присоединяюсь к 2 таблицам BigQuery с помощью объединителя + пишу обратно в BigQuery. В предварительном просмотре я получаю эту ошибку: java.lang.NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream....
770 просмотров
schedule 12.04.2022

Не удалось запустить программу run program_run
Источник ошибки: io.cdap.cdap.internal.app.runtime.distributed.remote.RemoteExecutionTwillRunnerService#543-runtime-startup-1 Сообщение об ошибке: java.io.IOException: com.jcraft.jsch.JSchException: java.net.ConnectException: время...
537 просмотров
schedule 27.04.2023

Сбой инициализации слияния данных кластера Dataproc
Я создал простой конвейер, который читает из таблицы SQL Server и записывает в таблицу BigQuery. Затем я настраиваю его для использования Spark, развертываю и запускаю. Он начинается с подготовки кластера dataproc, и я вижу, что он относительно...
941 просмотров

Проблема с разрешениями в Google Cloud Data Fusion
Я следую инструкциям в образце руководства по Cloud Data Fusion и все вроде работает нормально, пока я не попробую запустить конвейер в самом конце. Разрешения API Cloud Data Fusion Service устанавливаются для учетной записи службы, управляемой...
1076 просмотров

Как запустить конвейер Google Data Fusion Pipeline из облачной функции на основе событий
Есть ли способ запустить конвейер Google Data Fusion из облачной функции (предпочтительно на основе Python)? Основное требование заключается в том, что функция Cloud на основе событий будет выполняться всякий раз, когда новый файл поступает в...
779 просмотров

При использовании конвейера в реальном времени невозможно передать данные в bigquery из gcs
Я разработал конвейер в реальном времени для слияния данных, чтобы получать данные из pubsub, а затем передавать их в GCS, а затем в BQ. Однако после GCS (который доступен как приемник) я не могу передавать данные в BQ, потому что GCS доступен только...
147 просмотров

Не удается подключиться к локальному серверу SQL с помощью Google Cloud Data Fusion
Я пытаюсь проверить соединение с помощью Cloud Data Fusion для подключения к локальному серверу SQL. В нашем проекте GCP используется не сеть по умолчанию, а пользовательский VPC. Важно отметить, что безопасность очень важна, поскольку эта база...
1007 просмотров
schedule 03.10.2022

Экземпляр Cloud Data Fusion не удаляется
Я попытался удалить экземпляр слияния облачных данных. Консоль сообщила, что экземпляр удаляется уже несколько дней. Несмотря на то, что у меня нет реального работающего конвейера, он накапливает расходы ~ 40 долларов в день. Когда я пытаюсь...
133 просмотров
schedule 08.05.2023

Google Cloud Datafusion как принимать самозаверяющие сертификаты
Мы только начинаем использовать слияние облачных данных Google для нашего ETL. У нас есть вариант использования, чтобы попасть на сервер (самоподписанный) и получить некоторую информацию с помощью http-плагина в продукте слияния данных. В моем...
176 просмотров

Конвейерные зависимости в Data Fusion
У меня есть три конвейера в Data Fusion, например A, B и C. Я хочу, чтобы конвейер C запускался после выполнения конвейеров A и B, оба завершены. Триггеры конвейера накладывают зависимость только на один конвейер. Можно ли это реализовать в Data...
817 просмотров
schedule 26.03.2023

Слияние данных: GCS создает папки, а не объект
Я пытаюсь создать объект GCS (файл) с помощью плагина создания GCS Data Fusion. но вместо этого он создает папку. Как я могу создать файл вместо папки ??
125 просмотров
schedule 09.06.2022

Как я могу использовать DataFusion для выполнения операций ETL, когда мне нужно преобразовать несколько файлов данных (.txt)? Использование функций в пользовательском интерфейсе Datafusion
Задачи описаны ниже. Несколько файлов данных в Google Cloud Storage (GCS) хранятся в разделах (/ directory01 / directory02 /.../. Text) Я собираюсь использовать datafusion для выполнения работы с ETL и загрузить ее в таблицу bigQuery. Операция...
54 просмотров

Пользователь не авторизован для работы в качестве учетной записи службы
Я новичок в GCP и собираюсь перенести таблицы из хранилища Azure blob в облачное хранилище. Я следую инструкциям здесь (используйте слияние данных). Когда я закончил развертывание конвейера и собирался его запустить, у меня появилась ошибка, и в...
140 просмотров