Java new String getBytes 使用utf8静态枚举 StandardCharsets.UTF_8

Java new String 使用utf8静态枚举 用 StandardCharsets.UTF_8

new String(byteArray "utf8")getByte("utf8")要捕获异常

new String(byteArray, StandardCharsets.UTF_8)getBytes(StandardCharsets.UTF_8) 就不用捕获异常了

StandardCharsets.UTF_8

StandardCharsets.UTF_8

在这里插入图片描述

StandardCharsets

StandardCharsets 是 Java 7 引入的一个实用类,位于 java.nio.charset 包中。这个类提供了对几种最常用的字符编码的静态引用,这些字符编码以 Charset 对象的形式表示。使用 StandardCharsets 而不是手动创建或查找字符集对象的好处是,它可以提高性能(因为 StandardCharsets 缓存了这些对象)并减少错误(因为您不需要记住或输入确切的字符集名称)。

以下是 StandardCharsets 类中定义的一些常量:

  • US_ASCII:表示 ASCII 字符集,这是一个 7 位的字符集,包含 128 个字符。
  • ISO_8859_1:表示 ISO-8859-1 字符集,这是一个 8 位的字符集,包含 256 个字符,是 ASCII 的超集。
  • UTF_8:表示 UTF-8 字符集,这是一种变长字节表示的 Unicode 字符集,非常流行,因为它能够兼容 ASCII 并且能够表示所有的 Unicode 字符。
  • UTF_16:表示 UTF-16 字符集,这是一种使用 16 位单元表示的 Unicode 字符集。注意,StandardCharsets 没有直接提供 UTF_16BE(大端序)或 UTF_16LE(小端序)的常量,因为 UTF_16 本身不指定字节顺序;它通常与 ByteBuffer 的字节顺序设置一起使用。
  • UTF_16BE(Java 9 及以上):在 Java 9 及更高版本中,StandardCharsets 类增加了对 UTF-16BE(大端序)的直接支持。
  • UTF_16LE(Java 9 及以上):同样,在 Java 9 及更高版本中,StandardCharsets 类也增加了对 UTF-16LE(小端序)的直接支持。

请注意,最后两个常量(UTF_16BEUTF_16LE)是在 Java 9 中引入的。如果您使用的是 Java 8 或更早的版本,这些常量将不可用。

使用 StandardCharsets 类的示例:

import java.nio.charset.StandardCharsets;
import java.nio.ByteBuffer;
import java.nio.CharBuffer;public class StandardCharsetsExample {public static void main(String[] args) {byte[] bytes = "Hello, World!".getBytes(StandardCharsets.UTF_8);String decoded = new String(bytes, StandardCharsets.UTF_8);System.out.println(decoded); // 输出: Hello, World!// 使用 ByteBuffer 和 CharBuffer 进行编码和解码ByteBuffer byteBuffer = ByteBuffer.wrap(bytes);CharBuffer charBuffer = StandardCharsets.UTF_8.decode(byteBuffer);System.out.println(charBuffer.toString()); // 输出: Hello, World!}
}

在这个示例中,我们使用 StandardCharsets.UTF_8 来编码和解码字符串。这种方式比使用字符串字面量(如 "UTF-8")来指定字符集更加高效且安全。

StandardCharsets类是Java中的一个工具类,它提供了一组标准字符集常量。这些常量用于在Java程序中指定字符集,以便在处理文本数据时进行编码和解码操作。StandardCharsets类位于java.nio.charset包中,是一个final类,不能被继承。

StandardCharsets类提供了以下常量:

  • UTF_8:表示UTF-8字符集。
  • UTF_16:表示UTF-16字符集。
  • UTF_16BE:表示UTF-16 Big Endian字符集。
  • UTF_16LE:表示UTF-16 Little Endian字符集。
  • US_ASCII:表示US-ASCII字符集。
  • ISO_8859_1:表示ISO-8859-1字符集。

使用StandardCharsets类可以方便地指定字符集,例如在读取或写入文件时指定字符集,或者在网络通信中指定字符集。下面是一个使用StandardCharsets类的示例代码:

import java.nio.charset.StandardCharsets;public class Example {public static void main(String[] args) {String str = "Hello, World!";// 使用UTF-8编码将字符串转换为字节数组byte[] bytes = str.getBytes(StandardCharsets.UTF_8);// 使用UTF-8解码字节数组为字符串String decodedStr = new String(bytes, StandardCharsets.UTF_8);System.out.println("Encoded bytes: " + bytes);System.out.println("Decoded string: " + decodedStr);}
}

这个示例演示了如何使用StandardCharsets类将字符串编码为字节数组,并将字节数组解码为字符串。在这个示例中,我们使用UTF-8字符集进行编码和解码操作。

jdk17的 StandardCharsets 类的源码

/** Copyright (c) 2011, 2019, Oracle and/or its affiliates. All rights reserved.* DO NOT ALTER OR REMOVE COPYRIGHT NOTICES OR THIS FILE HEADER.** This code is free software; you can redistribute it and/or modify it* under the terms of the GNU General Public License version 2 only, as* published by the Free Software Foundation.  Oracle designates this* particular file as subject to the "Classpath" exception as provided* by Oracle in the LICENSE file that accompanied this code.** This code is distributed in the hope that it will be useful, but WITHOUT* ANY WARRANTY; without even the implied warranty of MERCHANTABILITY or* FITNESS FOR A PARTICULAR PURPOSE.  See the GNU General Public License* version 2 for more details (a copy is included in the LICENSE file that* accompanied this code).** You should have received a copy of the GNU General Public License version* 2 along with this work; if not, write to the Free Software Foundation,* Inc., 51 Franklin St, Fifth Floor, Boston, MA 02110-1301 USA.** Please contact Oracle, 500 Oracle Parkway, Redwood Shores, CA 94065 USA* or visit www.oracle.com if you need additional information or have any* questions.*/
package java.nio.charset;/*** Constant definitions for the standard {@link Charset charsets}. These* charsets are guaranteed to be available on every implementation of the Java* platform.** @see <a href="Charset.html#standard">Standard Charsets</a>* @since 1.7*/
public final class StandardCharsets {// To avoid accidental eager initialization of often unused Charsets// from happening while the VM is booting up, which may delay// initialization of VM components, we should generally avoid depending// on this class from elsewhere in java.base.private StandardCharsets() {throw new AssertionError("No java.nio.charset.StandardCharsets instances for you!");}/*** Seven-bit ASCII, also known as ISO646-US, also known as the* Basic Latin block of the Unicode character set.*/public static final Charset US_ASCII = sun.nio.cs.US_ASCII.INSTANCE;/*** ISO Latin Alphabet {@literal No. 1}, also known as ISO-LATIN-1.*/public static final Charset ISO_8859_1 = sun.nio.cs.ISO_8859_1.INSTANCE;/*** Eight-bit UCS Transformation Format.*/public static final Charset UTF_8 = sun.nio.cs.UTF_8.INSTANCE;/*** Sixteen-bit UCS Transformation Format, big-endian byte order.*/public static final Charset UTF_16BE = new sun.nio.cs.UTF_16BE();/*** Sixteen-bit UCS Transformation Format, little-endian byte order.*/public static final Charset UTF_16LE = new sun.nio.cs.UTF_16LE();/*** Sixteen-bit UCS Transformation Format, byte order identified by an* optional byte-order mark.*/public static final Charset UTF_16 = new sun.nio.cs.UTF_16();
}

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/541340.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

国产化系统查看配置

1、查看电脑系统/CPU/GPU等 1.1 开始 -》工具箱 可以查看CPU/GPU/操作系统等详细信息。 1.2 查看系统CPU 在计算机右键属性&#xff0c;可以查看到系统&#xff08;统信UOS、银河麒麟&#xff09;&#xff1b;CPU&#xff08;x86兆芯、x86海光、ARM鲲鹏、ARM phytium飞腾、L…

Linux编译器gcc/g++的功能与使用

一、程序的生成 首先&#xff0c;我们知道程序的编译分为四步&#xff1a; 1、预处理 2、编译 3、汇编 4、链接 1.1预处理 预处理功能主要包括头文件展开、宏定义、文件包含、条件编译、去注释等。 所谓的头文件展开就是在预处理时候&#xff0c;将头文件内容拷贝至源文…

光伏行业如何起步?光伏业务管理软件是重点!

随着全球对可再生能源的需求日益增强&#xff0c;光伏行业作为其中的佼佼者&#xff0c;正迎来前所未有的发展机遇。然而&#xff0c;如何在这一领域成功起步&#xff0c;却是许多企业和个人面临的挑战。在这个过程中&#xff0c;光伏业务管理软件的重要性不容忽视。 光伏行业的…

蓝桥杯历年真题省赛java b组2016年第七届

一、题目 取球博弈 两个人玩取球的游戏。 一共有N个球&#xff0c;每人轮流取球&#xff0c;每次可取集合{n1,n2,n3}中的任何一个数目。 如果无法继续取球&#xff0c;则游戏结束。 此时&#xff0c;持有奇数个球的一方获胜。 如果两人都是奇数&#xff0c;则为平局。 假设双…

计算机丢失vcruntime140.dll解决办法分享,有效解决vcruntime140.dll丢失问题

vcruntime140.dll是一个属于 Visual C Redistributable for Visual Studio 2015 的动态链接库文件。这个文件是运行那些用 Visual Studio 2015 或相关版本开发的 C 应用程序必不可少的一部分。如果系统中缺少此文件&#xff0c;或文件损坏&#xff0c;则可能会在尝试启动相关软…

C语言函数—递归理解和练习

练习&#xff1a; 编写函数不允许创建临时变量&#xff0c;求字符串的长度。 我们看到这道题&#xff0c;第一个想到的是不是strlen int main() {char[] "bit";//[b][i][t][\0]//里面一共4个字符&#xff08;包括结尾的、0&#xff09;但是我们的strlen函数并不会计…

mysql 常用命令

1、显示锁的时间 show status like innodb_row_lock%;2、锁一行的方法 //开启 begin; //锁一行 select * from tbl_user where name 1aa1 for update;//解锁 commit;3、设置不自动提交 set autocommit 0; //自动提交 set autocommit 1;4、查看是否支持profile show vari…

洛谷P1182数列分段

题目描述 对于给定的一个长度为 N 的正整数数列 &#xff0c;现要将其分成 M&#xff08;M≤N&#xff09;段&#xff0c;并要求每段连续&#xff0c;且每段和的最大值最小。 关于最大值最小&#xff1a; 例如一数列 4 2 4 5 14 2 4 5 1 要分成 33 段。 将其如下分段&#…

信雅纳网络测试的二次开发集成:XOA(Xena Open-Source Automation)开源自动化测试

目录 XOA是什么 XOA CLI XOA Python API ​XOA Python Test Suite/测试套件 XOA Converter Source Code XOA是什么 XOA&#xff08;Xena Open-Source Automation&#xff09;是一个开源的测试自动化框架&#xff0c;追求“高效、易用、灵活”的跨操作系统的开发框架。能…

细说C++反向迭代器:原理与用法

文章目录 一、引言二、反向迭代器的原理与实现细节三、模拟实现C反向迭代器反向迭代器模板类的设计反向迭代器的使用示例与测试 一、引言 迭代器与反向迭代器的概念引入 迭代器&#xff08;Iterator&#xff09;是C标准模板库&#xff08;STL&#xff09;中的一个核心概念&am…

3.15作业

1、思维导图 2、模拟面试题 1&#xff09;什么是IP地址&#xff1f; 答&#xff1a;ip地址是主机在网络中的唯一标识&#xff0c;分为IPv4和IPv6&#xff0c;IP网络号主机号 2&#xff09;IP地址和MAC地址的区别 答&#xff1a;IP地址是由数字和点分十进制表示的主机在网络中…