Вопросы по теме 'google-cloud-data-fusion'
Получение ошибки тайм-аута соединения при запуске простого конвейера слияния данных для экспорта данных из Bigquery и записи в GCS
Я пытаюсь использовать службу объединения данных Google, я создал простой конвейер, который будет извлекать данные из BigQuery и загружать эти данные обратно в GCS в формате json, но когда я запускаю конвейер, я получаю следующую ошибку....
758 просмотров
schedule
08.06.2022
java.lang.NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream. ‹init› (Ljava / io / InputStream; Z) V в предварительном просмотре
Экспериментирую с Google Cloud Data Fusion. Я присоединяюсь к 2 таблицам BigQuery с помощью объединителя + пишу обратно в BigQuery. В предварительном просмотре я получаю эту ошибку: java.lang.NoSuchMethodError: net.jpountz.lz4.LZ4BlockInputStream....
770 просмотров
schedule
12.04.2022
Не удалось запустить программу run program_run
Источник ошибки:
io.cdap.cdap.internal.app.runtime.distributed.remote.RemoteExecutionTwillRunnerService#543-runtime-startup-1
Сообщение об ошибке:
java.io.IOException: com.jcraft.jsch.JSchException: java.net.ConnectException: время...
537 просмотров
schedule
27.04.2023
Сбой инициализации слияния данных кластера Dataproc
Я создал простой конвейер, который читает из таблицы SQL Server и записывает в таблицу BigQuery. Затем я настраиваю его для использования Spark, развертываю и запускаю. Он начинается с подготовки кластера dataproc, и я вижу, что он относительно...
941 просмотров
schedule
01.07.2022
Проблема с разрешениями в Google Cloud Data Fusion
Я следую инструкциям в образце руководства по Cloud Data Fusion и все вроде работает нормально, пока я не попробую запустить конвейер в самом конце. Разрешения API Cloud Data Fusion Service устанавливаются для учетной записи службы, управляемой...
1076 просмотров
schedule
03.06.2022
Как запустить конвейер Google Data Fusion Pipeline из облачной функции на основе событий
Есть ли способ запустить конвейер Google Data Fusion из облачной функции (предпочтительно на основе Python)?
Основное требование заключается в том, что функция Cloud на основе событий будет выполняться всякий раз, когда новый файл поступает в...
779 просмотров
schedule
26.11.2023
При использовании конвейера в реальном времени невозможно передать данные в bigquery из gcs
Я разработал конвейер в реальном времени для слияния данных, чтобы получать данные из pubsub, а затем передавать их в GCS, а затем в BQ. Однако после GCS (который доступен как приемник) я не могу передавать данные в BQ, потому что GCS доступен только...
147 просмотров
schedule
05.12.2022
Не удается подключиться к локальному серверу SQL с помощью Google Cloud Data Fusion
Я пытаюсь проверить соединение с помощью Cloud Data Fusion для подключения к локальному серверу SQL. В нашем проекте GCP используется не сеть по умолчанию, а пользовательский VPC.
Важно отметить, что безопасность очень важна, поскольку эта база...
1007 просмотров
schedule
03.10.2022
Экземпляр Cloud Data Fusion не удаляется
Я попытался удалить экземпляр слияния облачных данных. Консоль сообщила, что экземпляр удаляется уже несколько дней. Несмотря на то, что у меня нет реального работающего конвейера, он накапливает расходы ~ 40 долларов в день. Когда я пытаюсь...
133 просмотров
schedule
08.05.2023
Google Cloud Datafusion как принимать самозаверяющие сертификаты
Мы только начинаем использовать слияние облачных данных Google для нашего ETL.
У нас есть вариант использования, чтобы попасть на сервер (самоподписанный) и получить некоторую информацию с помощью http-плагина в продукте слияния данных.
В моем...
176 просмотров
schedule
13.04.2022
Конвейерные зависимости в Data Fusion
У меня есть три конвейера в Data Fusion, например A, B и C. Я хочу, чтобы конвейер C запускался после выполнения конвейеров A и B, оба завершены. Триггеры конвейера накладывают зависимость только на один конвейер. Можно ли это реализовать в Data...
817 просмотров
schedule
26.03.2023
Слияние данных: GCS создает папки, а не объект
Я пытаюсь создать объект GCS (файл) с помощью плагина создания GCS Data Fusion.
но вместо этого он создает папку.
Как я могу создать файл вместо папки ??
125 просмотров
schedule
09.06.2022
Как я могу использовать DataFusion для выполнения операций ETL, когда мне нужно преобразовать несколько файлов данных (.txt)? Использование функций в пользовательском интерфейсе Datafusion
Задачи описаны ниже. Несколько файлов данных в Google Cloud Storage (GCS) хранятся в разделах (/ directory01 / directory02 /.../. Text)
Я собираюсь использовать datafusion для выполнения работы с ETL и загрузить ее в таблицу bigQuery.
Операция...
54 просмотров
schedule
04.07.2022
Пользователь не авторизован для работы в качестве учетной записи службы
Я новичок в GCP и собираюсь перенести таблицы из хранилища Azure blob в облачное хранилище. Я следую инструкциям здесь (используйте слияние данных).
Когда я закончил развертывание конвейера и собирался его запустить, у меня появилась ошибка, и в...
140 просмотров
schedule
24.04.2022