高效率：使用DBeaver连接spark-sql-编程知识

高效率：使用DBeaver连接spark-sql

提高运行效率一般采取底层使用spark引擎替换成hive引擎的方式提高效率，但替换引擎配置较为复杂考虑到兼容版本且容易出错，所以本篇将介绍使用DBeaver直接连接spark-sql快速操作hive数据库。

在spark目录下运行以下命令，创建一个SparkThirdService端口号为10016

sudo -u root ./sbin/start-thriftserver.sh \
--hiveconf hive.server2.thrift.port=自定义端口号 \
--hiveconf hive.server2.thrift.bind.host=主机ip地址 \
--hiveconf spark.sql.warehouse.dir=hdfs://主机IP地址:hadoop端口/hive在hdfs下的路径目录
--master yarn \
--executor-memory 4G \
--conf spark.sql.shuffle.partitions=10

主机地址和端口自己按照自己的环境需要更改

每次重启后运行启动都要执行，可自己编写为sh文件执行

在/home下创建一个client-saprk-sql

vi /home/client-saprk-sql

将启动SparkThirdService内容写入到文件中：

这里写了该文件的绝对路径

sudo -u root /opt/module/spark/sbin/start-thriftserver.sh \
--hiveconf hive.server2.thrift.port=10016 \
--hiveconf hive.server2.thrift.bind.host=192.168.10.137 \
--hiveconf spark.sql.warehouse.dir=hdfs://192.168.10.137:9000/user/hive/warehouse \
--master yarn \
--executor-memory 4G \
--conf spark.sql.shuffle.partitions=10

执行：

sh /home/client-saprk-sql

编辑连接：

测试连接成功

建个表插入数据测试一下：

CREATE TABLE test_table (id STRING,name STRING
);

INSERT INTO test_table VALUES ('1', 'John');
INSERT INTO test_table VALUES ('2', 'Jane');

使用spark-sql方式操作hive插入速度非常快

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/235705.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

高效率：使用DBeaver连接spark-sql

相关文章

链表高频面试题

Windows系列：windows server 2016 下域环境的搭建（完整版）

91基于matlab的以GUI实现指纹的识别和匹配百分比

Android 架构实战MVI进阶

Course1-Week3-分类问题

【JAVA面向对象编程】--- 探索子类如何继承父类

前端：实现div的隐藏与显示

WSL2 docker GUI 界面

Word 小知识之 docx 和 doc 的区别

最新Midjourney绘画提示词Prompt

建堆的时间复杂度和堆排序

树莓派 SPI操作