Hive数据类型

1.基本数据类型

在这里插入图片描述
示例:

-- 创建表并定义列的数据类型
CREATE TABLE data_types_example (tinyint_column TINYINT,smallint_column SMALLINT,int_column INT,bigint_column BIGINT,boolean_column BOOLEAN,float_column FLOAT,double_column DOUBLE,string_column STRING,timestamp_column TIMESTAMP,binary_column BINARY
);-- 插入示例数据
INSERT INTO data_types_example VALUES
(1, 10, 100, 1000, TRUE, 3.14, 6.28, 'example', '2024-04-23 12:00:00', CAST('binary data' AS BINARY));-- 查询示例数据
SELECT * FROM data_types_example;
  • 对于Hive的string类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储2GB的字符数。
  • 不同的数据类型具有不同的数据范围和存储大小。确保选择的数据类型可以容纳数据的范围,并且不会浪费过多的存储空间。

2.集合数据类型

Hive有三种复杂数据类型array、map和struct。array和map与Java中的array和map类似,而struct由一组称为成员的不同数据组成,其中每个成员可以具有不同的类型。

在这里插入图片描述

  1. ARRAY

    • ARRAY是一种有序的集合,其中的元素可以重复
    • 它用于存储具有相同数据类型的多个值,例如一组数字、字符串等。
    • ARRAY类型的语法为ARRAY<data_type>,其中data_type表示数组中元素的数据类型。
  2. MAP

    • MAP是一种键值对的集合,其中的键和值可以是任意数据类型
    • 它用于存储类似于字典或关联数组的数据结构。
    • MAP类型的语法为MAP<key_data_type, value_data_type>,其中key_data_type表示键的数据类型,value_data_type表示值的数据类型。
  3. STRUCT

    • STRUCT是一种类似于结构体或元组的数据类型,它可以包含多个字段,每个字段都有自己的数据类型
    • 它用于表示具有多个属性的复合数据类型。
    • STRUCT类型的语法为STRUCT<field1:data_type1, field2:data_type2, ...>,其中field1field2等表示字段名,data_type1data_type2等表示字段的数据类型。

  1. ARRAY 示例
    一个表存储了每位学生的课程成绩,其中每个学生可能修读了多门课程,我们可以使用ARRAY来表示每位学生的成绩列表。
CREATE TABLE student_grades (student_id INT,grades ARRAY<INT>
);INSERT INTO student_grades VALUES
(1, ARRAY(85, 90, 75)),
(2, ARRAY(78, 82, 95)),
(3, ARRAY(88, 92, 80));
  1. MAP 示例
    一个表存储了每**位员工的基本信息,其中包括姓名、部门和工资等信息,**我们可以使用MAP来表示员工的基本信息。
CREATE TABLE employee_info (employee_id INT,info MAP<STRING, STRING>
);INSERT INTO employee_info VALUES
(1, MAP('name', 'Alice', 'department', 'HR', 'salary', '5000')),
(2, MAP('name', 'Bob', 'department', 'Finance', 'salary', '6000')),
(3, MAP('name', 'Charlie', 'department', 'IT', 'salary', '7000'));
  1. STRUCT 示例
    一个表存储了商品的详细信息,包括商品ID、名称和价格,我们可以使用STRUCT来表示商品的详细信息。
CREATE TABLE product_details (product_id INT,details STRUCT<name: STRING,price: DOUBLE>
);INSERT INTO product_details VALUES
(1, STRUCT('Laptop', 1200.50)),
(2, STRUCT('Smartphone', 800.25)),
(3, STRUCT('Tablet', 500.75));

3.数据类型转换

1.隐式转换

在Hive中,有时候可以进行隐式类型转换,这是指在查询中不需要显式地使用CAST函数,Hive会根据上下文自动进行类型转换。

  • (1)任何整数类型都可以隐式地转换为一个范围更广的类型,如tinyint可以转换成int,int可以转换成bigint。
  • (2)所有整数类型、float和string类型都可以隐式地转换成double。
  • (3)tinyint、smallint、int都可以转换为float。
  • (4)boolean类型不可以转换为任何其它的类型

示例:

  1. 整数类型转换
  • 在算术运算或比较操作中,如果参与运算的两个数类型不同,Hive会自动将小的整数类型转换为大的整数类型,例如将TINYINT转换为INT,INT转换为BIGINT。
SELECT 1 + 2.5; -- 将整数1隐式转换为浮点数,结果为3.5
  1. 字符串类型转换
  • 字符串拼接操作中,Hive会自动将非字符串类型转换为字符串类型
SELECT 'Age: ' || 25; -- 将整数25隐式转换为字符串,结果为'Age: 25'
  1. 布尔类型转换
  • 在逻辑运算中,Hive会自动将布尔类型转换为整数类型(0表示FALSE,1表示TRUE)
SELECT TRUE AND FALSE; -- 将布尔值转换为整数,结果为0
  1. 日期类型转换
  • 在日期运算中,Hive会根据上下文自动进行日期类型转换。
SELECT current_date() - '2024-04-23'; -- 将字符串日期转换为日期类型,然后计算日期差
  1. 浮点数类型转换
  • 在算术运算中,Hive会自动进行浮点数类型转换
SELECT 10 / 3.0; -- 将整数10隐式转换为浮点数,结果为3.33333...

2.显式转换

在Hive中,显式转换是指使用CAST函数明确指定将一个数据类型转换为另一个数据类型。

  • 语法:cast(expr as ) expr表示要转换的表达式,type表示要转换成的目标数据类型
  • 返回值:Expected “=” to follow “type”
  • 说明:返回转换后的数据类型

示例:

  1. 将字符串转换为整数
SELECT CAST('123' AS INT);
  1. 将整数转换为字符串
SELECT CAST(123 AS STRING);
  1. 将字符串表示的日期转换为日期类型
SELECT CAST('2024-04-23' AS DATE);
  1. 将日期类型转换为字符串表示
SELECT CAST(CURRENT_DATE() AS STRING);
  1. 将字符串转换为布尔类型
SELECT CAST('true' AS BOOLEAN);
  1. 将布尔类型转换为字符串
SELECT CAST(TRUE AS STRING);
  1. 将浮点数转换为整数
SELECT CAST(3.14 AS INT);
  1. 将整数转换为浮点数
SELECT CAST(100 AS FLOAT);
  1. 将时间戳转换为日期类型
SELECT CAST('2024-04-23 12:00:00' AS DATE);

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/644368.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Java框架】SpringBoot(二)核心配置

目录 yml文件什么是yml文件yml文件的优点使用场景脚本语言序列化配置文件 yml的基本语法yml支持的数据类型字面量对象(属性和值)、Map(键值对)数组复合结构 Spring Boot配置文件的值注入第一种读取方式Value第二种读取方式ConfigurationProperties第三种读取方式自动装配Enviro…

hyperf 三十一 极简DB组件

一 安装及配置 composer require hyperf/db php bin/hyperf.php vendor:publish hyperf/db 默认配置 config/autoload/db.php 如下&#xff0c;数据库支持多库配置&#xff0c;默认为 default。 配置项类型默认值备注driverstring无数据库引擎 支持 pdo 和 mysqlhoststringl…

【软件安装】(十六)双系统Ubuntu22.04引导启动菜单的默认项

一个愿意伫立在巨人肩膀上的农民...... 好学的人总是喜欢在电脑上安装双系统&#xff0c;可是安装好系统之后&#xff0c;就会出现默认启动优先级的苦恼&#xff0c;如果在Bios中设置Windows引导启动为优先启动&#xff0c;那么每次想要进如Ubuntu系统就都需要重新设置Bios。如…

通过Bedrock Access Gateway解决方案快速访问Amazon Bedrock的多种大语言模型

Bedrock Access Gateway&#xff08;BAG&#xff09;解决方案提供了开箱即用、兼容 OpenAI 的代理功能&#xff0c;帮助用户轻松无缝地从 OpenAI 迁移到 Amazon Bedrock。 1. 概述 亚马逊云科技的 Amazon Bedrock 服务支持一系列领先的基础模型&#xff0c;为客户提供多种选择…

CSS3:border-image

<!DOCTYPE html> <html><head><meta charset"utf-8"> </head><body><p>原始图片</p><img src"./images/border1.png" alt""><p>一、</p><p>border: 27px solid transp…

【解决NodeJS项目无法在IDEA中调试的问题】使用JetBrains IDEA 2023 调试nodejs项目

项目采用Ant Design Pro React&#xff0c;使用前后端分离开发方式&#xff0c;后端可以很容易的打断点调试&#xff0c;但是前端通过网页进行调试&#xff0c;在IDEA中加了调试断点&#xff0c;但是没有什么用处。 解决方案如下&#xff1a; 点击新建运行配置 新建JavaScrip…

【Linux】实现一个进度条

我们之前也学了gcc/vim/make和makefile&#xff0c;那么我们就用它们实现一个进度条。 在实现这个进度条之前&#xff0c;我们要先简单了解一下缓冲区和回车和换行的区别 缓冲区其实就是一块内存空间&#xff0c;我们先看这样一段代码 它的现象是先立马打印&#xff0c;三秒后程…

网络安全主题纪录片

网络安全主题纪录片 文章目录 网络安全主题纪录片第四公民黑客帝国系列龙纹身女孩碟中谍系列虎胆龙威4匿名者终结者2&#xff1a;审判日东方快车谋杀案黑客国家公敌我是谁&#xff1a;没有绝对安全的系统黑客军团速度与激情系列十亿美元大劫案勒索软件的背后黑客的恐惧为什么网…

web前端框架设计第六课-样式绑定

web前端框架设计第六课-样式绑定 一.预习笔记 1.class属性绑定 给P标签绑定一个类样式&#xff0c;类名为active。当active取值为true时&#xff0c;表示绑定样式成功&#xff0c;取值为false时&#xff0c;取消绑定 以对象形式给P标签绑定多个类样式 以数组形式给P标签绑定多…

使用linux,c++,创作一个简单的五子棋游戏

#include <iostream> #include <vector> #include <unordered_map> using namespace std; // 棋盘大小 const int BOARD_SIZE 15; // 棋子类型 enum ChessType { EMPTY, BLACK, WHITE }; // 棋盘类 class ChessBoard { private: vect…

全氟己酮灭火绳的用法早知道:灭火绳多少钱一米?

全氟己酮灭火装置作为一种高效、安全、环保的灭火技术&#xff0c;已经成为了备受青睐的新型灭火选择之一。伴随着市场需求不断增长&#xff0c;在全氟己酮厂家的努力下&#xff0c;各式各样的全氟己酮自动灭火装置不断涌现&#xff0c;包括自动灭火贴、灭火片、灭火毯、灭火绳…

go语言并发实战——日志收集系统(八) go语言操作etcd以及利用watch实现对键值的监控

有关包的安装 我们要实现go语言对第三方包的操作需要我们下载第三方包go.etcd.io&#xff0c;下载命令&#xff1a; go get go.etcd.io/etcd/client/v3 ectd的put与get操作 相关函数说明与示例 我们想实现对etcd进行简单的操作的步骤还是比较简单的&#xff0c;在我上一篇文…