Публикации по теме apache-zeppelin

Публикации по теме 'apache-zeppelin'

Как сделать XGBoost доступным в Apache Zeppelin

Это пошаговое руководство по установке XGBoost (эффективная реализация повышения градиента) в Apache Zeppelin (веб-блокнот для интерактивной аналитики в SQL, Scala и Spark). Если у вас не установлен Zeppelin, воспользуйтесь этим кратким руководством . Шаг 1. Создайте XGBoost Для этого шага нам нужно клонировать репозиторий из github и собрать проект: git clone --recursive https://github.com/dmlc/xgboost Затем нам нужно войти в только что клонированный репозиторий и собрать..

Вопросы по теме 'apache-zeppelin'

Почему ноутбук Zeppelin не может подключиться к S3

Я установил Zeppelin на свой компьютер aws EC2 для подключения к моему искровому кластеру. Версия Spark: Автономная версия: spark-1.2.1-bin-hadoop1.tgz Я могу подключиться к искровому кластеру, но получаю следующую ошибку при попытке...

3272 просмотров

apache-spark apache-zeppelin

14.12.2022

В Цеппелине нет переводчиков

Я только что установил на свой Mac следующее (Yosemite 10.10.3): Oracle Java 1.8 обновление 45 Scala 2.11.6 spark 1.4 (предварительно скомпилированный выпуск: http://d3kbcqa49mib13.cloudfront.net/spark-1.4.0-bin-hadoop2.6.tgz ) zeppelin из...

26538 просмотров

apache-zeppelin

09.06.2022

Как указать отсутствующее значение в кадре данных

Я пытаюсь загрузить CSV-файл во фрейм данных Spark с помощью spark-csv [1], используя блокнот Apache Zeppelin, и при загрузке числового поля, которое не имеет значения, синтаксический анализатор не работает для этой строки, и строка пропускается. Я...

3648 просмотров

csv apache-spark apache-zeppelin spark-dataframe

21.09.2022

Как использовать Zeppelin для доступа к кластеру aws spark-ec2 и корзинам s3

У меня есть настройка кластера aws ec2 с помощью сценария spark-ec2. Я хотел бы настроить Zeppelin так, чтобы я мог писать код Scala локально на Zeppelin и запускать его в кластере (через мастер). Кроме того, я хотел бы иметь доступ к своим ведрам...

2087 просмотров

amazon-ec2 amazon-s3 apache-spark apache-zeppelin

03.08.2022

Фильтрация Spark DataFrame: сохранить элемент, принадлежащий списку

Я использую Spark 1.5.1 со Scala на ноутбуке Zeppelin. У меня есть DataFrame со столбцом с именем userID с типом Long. Всего у меня около 4 миллионов строк и 200 000 уникальных идентификаторов пользователей. У меня также есть список из 50 000...

3407 просмотров

apache-spark dataframe apache-spark-sql scala apache-zeppelin

24.12.2022

экспортировать данные в csv с помощью zeppelin

Мне нужно экспортировать данные в формате csv из моего интерпретатора %sql в zeppelin. Как я могу это сделать? Мне нужно добавить кнопку, и при нажатии на нее она должна экспортировать данные в csv, как показано на графиках в zeppelin в...

10376 просмотров

apache-zeppelin

24.06.2023

Zeppelin: Scala Dataframe на python

Если у меня есть абзац Scala с DataFrame, могу ли я поделиться им и использовать его с python. (Насколько я понимаю, pyspark использует py4j ) Я пробовал это: Абзац Скала: x.printSchema z.put("xtable", x ) Параграф Python:...

11093 просмотров

python apache-spark pyspark apache-zeppelin

02.12.2022

Импорт дополнительного репозитория apache zeppelin

Как импортировать дополнительную зависимость в zeppelin? Я пытаюсь импортировать библиотеку (седло) в apache zeppelin, однако... import org.saddle._ <console>:21: error: object saddle is not a member of package org import...

4563 просмотров

java maven scala apache-zeppelin saddle

04.07.2023

Как настроить Zeppelin-env.sh во время начальной загрузки в EMR

У меня есть сценарий для запуска EMR с Spark и Zeppelin через CLI, а также действие начальной загрузки для установки Anaconda python. aws emr create-cluster --applications Name=Hadoop Name=Hive Name=Spark \ Name=Zeppelin-Sandbox \ ...... \...

4412 просмотров

amazon-web-services aws-cli apache-zeppelin emr

30.04.2024

В Hortonworks Sandbox 2.4 использование Spark драйвера SQLServer приводит к тому, что подходящий драйвер не найден

HDP версии 2.4 Я пытаюсь записать в базу данных SQL Server через драйвер JDBC Microsoft SQL Server sqljdbc41.jar. Я выполняю следующее в Zeppelin: val foo = sqlContext.jdbc("jdbc:sqlserver://X;databaseName=X;user=X;password=X", "X")...

234 просмотров

sql-server apache-spark jdbc apache-zeppelin hortonworks-data-platform

15.04.2023

java.lang.IllegalArgumentException: требование не выполнено: операции вывода не зарегистрированы, поэтому ничего не нужно выполнять

Когда я выполняю приведенный ниже код, возникает ошибка «java.lang.IllegalArgumentException: требование не выполнено: операции вывода не зарегистрированы, поэтому ничего не нужно выполнять». Кто-нибудь может мне помочь? val ssc = new...

983 просмотров

scala spark-cassandra-connector apache-zeppelin

31.08.2022

Интерпретатор %spark.r не работает в Zeppelin 0.6.1

У меня есть кластер Spark 1.6.2 с Hadoop YARN, Oozie. Я установил Zeppelin 0.6.1 (бинарный пакет со всеми интерпретаторами: zeppelin-0.6.1-bin-all.tgz). Когда я пытаюсь использовать скрипт SparkR с интерпретатором %spark.r, %spark.r # Creating...

1995 просмотров

apache-spark apache-spark-sql sparkr apache-zeppelin

06.02.2024

Zeppelin LDAP аутентификация

Я пытаюсь включить аутентификацию LDAP для Zeppelin. Конфигурация в shiro.ini выглядит так: ldapRealm = org.apache.zeppelin.server.LdapGroupRealm ldapRealm.contextFactory.environment[ldap.searchBase] = ou=abcIds,ou=abcPeople,o=abc...

2567 просмотров

apache-zeppelin shiro

21.02.2023

Apache Zeppelin за обратным прокси-сервером Apache

Я запускаю свой экземпляр Apache Zeppelin за веб-сервером Apache, где веб-сервер служит только в качестве резервного прокси. Если я просматриваю сайт с обратным прокси-сервером https://my-domain.com/zeppelin/ , я получаю веб-сайт с активами,...

2559 просмотров

websocket apache reverse-proxy apache-zeppelin

04.01.2023

lzo не обнаружен при запуске Spark в zeppelin на контейнере докера

Я пытаюсь запустить искровой код в zeppelin, и я получаю следующее: java.lang.ClassNotFoundException: Class com.hadoop.compression.lzo.LzoCodec not found такая же проблема со встроенной искрой zeppelin и моей собственной установкой с искровой...

745 просмотров

apache-spark hadoop cloudera-cdh apache-zeppelin

29.07.2023

Будет ли zeppelin 0.6.0 работать со Spark 1.4.1?

Я установил zeppelin 0.6.0 на свой кластер с spark 1.4.1 (HDP 2.3). Согласно примечаниям к выпуску я вижу, что он поддерживает spark 1.6. но не уверен, что он обратно совместим. Когда я пытаюсь запустить sc.version в блокноте, я вижу, что задание...

38 просмотров

apache-spark apache-zeppelin

08.06.2023

Установите бинарный файл Apache Zeppelin на Ubuntu Linux

Я пытаюсь установить Apache Zeppelin и различные интерпретаторы на Ubuntu Linux, используя AWS EC2. Ниже приведены мои шаги для двоичного файла и исходного кода. SSH через Putty как ubuntu@IP wget...

4489 просмотров

apache-spark apache-zeppelin

07.11.2023

Использование средства выбора даты в интерпретаторе Zeppelin jdbc

У меня есть набор диаграмм в блокноте Zeppelin, которые извлекают данные из базы данных за определенный период времени с помощью интерпретатора jdbc. Что я хотел бы сделать, так это иметь возможность выбирать период, который будет применяться ко всем...

3120 просмотров

apache-zeppelin

18.12.2022

Пример потоковой передачи Zeppling в твиттере, невозможно

Следуя руководству zeppelin по потоковой передаче твитов и запрашивая их с помощью SparkSQL, я сталкиваюсь с ошибкой, когда временная таблица «твитов» не найдена. Точный используемый код и ссылки, указанные ниже Ссылка:...

244 просмотров

apache-spark apache-spark-sql apache-zeppelin

18.02.2023

Apache Zeppelin: очень медленный вывод html

Моя цель — взять некоторые данные из интерпретатора python и/или scala в Zeppelin и, наконец, отобразить данные, встроенные в какую-нибудь библиотеку JavaScript, такую как Plotly, D3, Vis и т. д. Идеальной бесшовной интеграцией было бы просто...

1286 просмотров

apache-zeppelin

27.06.2023