hive数据的导入导出

一、hive 的数据导入

Linux本地文件以及数据格式：
在这里插入图片描述
在hive中创建表：

create table t_user(
id int
,name string
)
row format delimited
fields terminated by ","
lines terminated by '\n'
stored as textfile;

stored as常见的几种格式

1. TextFile：使用TextFile格式存储的表将数据以文本文件的形式进行存储。这是最常用的默认存储格式。
2. SequenceFile：使用SequenceFile格式存储的表将数据以键-值对的形式存储，适用于数据压缩和高效读取。
3. ORC（Optimized Row Columnar）：ORC是Hive的一种高性能列式存储格式，它以列的方式组织数据，提供了更高的压缩率和查询性能。
4. Parquet：Parquet是一种列式存储格式，也是Hive的一个常用选项。它支持高度压缩和谓词下推等优化，适用于大规模数据分析。
5. Avro：Avro是一种跨语言的数据序列化系统，Hive可以使用Avro格式存储数据!

加载本地数据

load data local inpath '/home/hivedata/user.txt' into table t_user ;
-- 如果在into前面加了overwrite就是覆盖之前的数据重新导入数据

加载hdfs上的数据
*注意：hdfs上需要有数据
从本地上传文件到hdfs上
在这里插入图片描述

// 追加添加
load data inpath '/yan/hivedata/user.txt' into table t_user;
//覆盖添加
load data inpath '/yan/hivedata/user.txt' into table t_user;

把别的表中的数据插入目标表

create table u1(
id int,
name string
);
insert into u1
(select id ,name from t_user);

# 查询一次插入多个表 ,把from写在前面
from t_user 
insert into u2 select *
insert into u3 select id ,name;

克隆表

-- 把表结构和数据一起复制
create table u4 as select * from t_user;
-- 只复制表结构,只需要使用like 表名即可，不用select
create table u5 like t_user;

本地数据导入和hdfs数据导入的区别：

本地：将数据copy到hdfs的表目录下
hdfs：将数据剪切到hdfs的表目录下

二、hive中数据的导出

导出到本地文件系统的目录下

# 必须加overwrite
insert overwrite local directory '/home/hivedata/out/out1' select * from t_user;
# 在本地Linux系统中，最后一级的out1也是目录

在这里插入图片描述

导出到hdfs的目录下

-- 比本地少了local
insert overwrite directory '/yan/hivedata/out/out1' select * from t_user;

导出的数据文件中，默认字段不分割，其中的方括号是hdfs默认的分隔，之前的逗号分隔符没有了在这里插入图片描述
把hdfs上的数据导入到Linux本地：

hive -e 'select * from zoo.t_user' >> /home/hivedata/out/out2/02
# 02是我建的空文件
# 导出的文件中字段分隔符默认是\t

在这里插入图片描述

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/14674.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

hive数据的导入导出

一、hive 的数据导入

二、hive中数据的导出

相关文章

使用wordpress搭建WebStack导航网站记录

回归预测 | MATLAB实现CNN-BiGRU-Attention多输入单输出回归预测

机器人轨迹生成：轨迹规划与路径规划

Linux 文件属性

【Azure】解析 Microsoft Defender for Cloud：云安全的保护与管理

Portraiture最新PS/LR 4.1.0.3皮肤修饰插件

SIFT（尺度不变特征变换）

开源网安受邀参加2023全球数字经济大会，分享软件安全落地实践经验

OpenCV使用putText将文字绘制到图像上

无源光网络（PON）介绍及其应用

通俗易懂讲解CPU、GPU、FPGA的特点

山西电力市场日前价格预测【2023-07-10】