Python(八)字符编码

❤️ 专栏简介:本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中,我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。
☀️ 专栏适用人群 :本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无论你是学生、职场人士还是对编程感兴趣的爱好者,都能从中受益。跟着我的学习笔记一起学习python吧。
🌙专栏目标:本专栏的目标是帮助我自己记忆、方便回顾所学知识以及帮助其他想学习python的小伙伴掌握Python编程语言的基本概念和技巧,并逐步提高我们的编程能力。通过这个专栏,我们将学会如何编写Python代码,理解各种数据类型、控制结构和函数,掌握常用的Python模块和库,以及应用Python解决实际问题。

⭐️ 专栏主要内容: 主要学习python的开发环境搭建;Python的基础知识,包括变量、数据类型、条件语句和循环等;python的数据结构和算法;python的函数和模块;python的文件处理等。
🌴 专栏说明 :如果文章知识点有错误的地方,欢迎大家随时在文章下面评论,我会第一时间改正。让我们一起学习,一起进步。
💑专栏主页:从零开始的Python入门之路

在这里插入图片描述

❤️ 专栏简介:本专栏记录了我个人从零开始学习Python编程的过程。在这个专栏中,我将分享我在学习Python的过程中的学习笔记、学习路线以及各个知识点。
☀️ 专栏适用人群 :本专栏适用于希望学习Python编程的初学者和有一定编程基础的人。无论你是学生、职场人士还是对编程感兴趣的爱好者,都能从中受益。跟着我的学习笔记一起学习python吧。
🌙专栏目标:本专栏的目标是帮助我自己记忆、方便回顾所学知识以及帮助其他想学习python的小伙伴掌握Python编程语言的基本概念和技巧,并逐步提高我们的编程能力。通过这个专栏,我们将学会如何编写Python代码,理解各种数据类型、控制结构和函数,掌握常用的Python模块和库,以及应用Python解决实际问题。

⭐️ 专栏主要内容: 主要学习python的开发环境搭建;Python的基础知识,包括变量、数据类型、条件语句和循环等;python的数据结构和算法;python的函数和模块;python的文件处理等。
🌴 专栏说明 :如果文章知识点有错误的地方,欢迎大家随时在文章下面评论,我会第一时间改正。让我们一起学习,一起进步。
💑专栏主页:从零开始的Python入门之路

在这里插入图片描述

在计算机世界中,字符编码是实现文本数据传输和存储的基础。不同的字符编码方案使得计算机能够识别和处理不同的语言和字符集。本文将介绍一些常见的字符编码方案,包括ASCII码表、GB2312、GBK、GB18023、Unicode和UTF-8等,并简单它们的工作原理和应用。

文章目录

  • 1. 字符编码的总体情况:
  • 2. ASCII码表:
  • 3. GB2312:
  • 4. GBK:
  • 5. GB18030:
  • 6. Unicode:
  • 7. UTF-8:

1. 字符编码的总体情况:

字符编码是将字符映射到数字的过程,以便计算机能够处理和存储文本数据。不同的字符编码方案有不同的字符集和编码规则。在字符编码的发展中,ASCII、GB系列、Unicode和UTF-8是其中的重要里程碑。

2. ASCII码表:

ASCII(American Standard Code for Information Interchange)是最早的字符编码方案之一。它使用7位二进制数表示128个字符,包括英文字母、数字、标点符号和控制字符。ASCII码表在计算机通信和基本文本处理中具有重要作用。

示例代码:

char = 'A'
ascii_code = ord(char)
print(ascii_code)

运行结果:

65

在上述示例中,我们使用内置函数ord()将字符’A’转换为对应的ASCII码值65。

参考链接:

  • ASCII码表详解
  • ASCII码表及其应用

3. GB2312:

GB2312是中国国家标准简体中文字符集的字符编码方案。它采用双字节编码,能够表示约7,000多个常用汉字和符号。GB2312是中国最早的汉字编码方案,适用于简体中文环境。

示例代码:

char = '中'
gb2312_code = char.encode('gb2312')
print(gb2312_code)

运行结果:

b'\xd6\xd0'

在上述示例中,我们使用字符串的encode()方法将字符’中’编码为GB2312格式的字节码。

参考链接:

  • GB2312字符集

4. GBK:

GBK是对GB2312的扩展,它能够表示超过20,000个汉字和符号。GBK兼容GB2312,同时增加了更多的汉字字符。GBK广泛应用于中文环境中的文本处理和显示。

示例代码:

char = '国'
gbk_code = char.encode('gbk')
print(gbk_code)

运行结果:

b'\xb9\xfa'

在上述示例中,我们使用字符串的encode()方法将字符’国’编码为GBK格式的字节码。

参考链接:

  • GBK字符集

5. GB18030:

GB18030是中国国家标准的字符编码方案,它是GBK的超集。GB18030能够表示大部分中文字符,包括繁体字和少数民族文字。GB18030成为了现代中文环境中的主流字符编码方案。

示例代码:

char = '喜'
gb18030_code = char.encode('gb18030')
print(gb18030_code)

运行结果:

b'\xd0\xc2'

在上述示例中,我们使用字符串的encode()方法将字符’喜’编码为GB18030格式的字节码。

参考链接:

  • GB18030字符集

6. Unicode:

Unicode是一种标准的字符编码方案,它为世界上几乎所有的字符提供了唯一的数字标识。Unicode使用4个十六进制数表示一个字符,允许表示超过130,000个字符。

示例代码:

char = '😊'
unicode_code = ord(char)
print(unicode_code)

运行结果:

128522

在上述示例中,我们使用内置函数ord()将字符’😊’转换为对应的Unicode码值128522。

参考链接:

  • Unicode官方网站
  • Unicode编码介绍

7. UTF-8:

UTF-8是一种可变长度的Unicode字符编码方案,它可以在不同的环境中进行兼容和交互。UTF-8使用1至4个字节来表示不同的字符,兼容ASCII码表。

示例代码:

char = '🌞'
utf8_code = char.encode('utf-8')
print(utf8_code)

运行结果:

b'\xf0\x9f\x8c\x9e'

在上述示例中,我们使用字符串的encode()方法将字符’🌞’编码为UTF-8格式的字节码。

参考链接:

  • UTF-8编码介绍
  • UTF-8和Unicode的关系

字符编码是计算机中文本数据处理的基础,不同的字符编码方案在不同的语言和地区发挥重要作用。通过了解ASCII码表、GB2312、GBK、GB18023、Unicode和UTF-8这些常见字符编码方案,我们可以更好地处理多语言环境下的文本数据。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/21525.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【youcans动手学模型】目标检测之 OverFeat 模型

欢迎关注『youcans动手学模型』系列 本专栏内容和资源同步到 GitHub/youcans 【youcans动手学模型】目标检测之 OverFeat 模型 1. OverFeat 卷积神经网络模型1.1 论文摘要1.2 技术背景1.3 基本方法模型设计多尺度分类滑动窗口(Sliding window)定位&#…

RabbitMQ高阶使用

1. 问题 2. 延时任务 2.1 什么是延时任务 在当前时间往后延迟多少时间执行的任务 2.1.1 和定时任务区别 定时任务有明确的触发时间,延时任务没有定时任务有执行周期,而延时任务在某事件触发后一段时间内执行,没有执行周期定时任务一般执行的…

二、RocketMQ消息存储源码分析

RocketMQ源码深入剖析 6 Broker源码分析 Broker模块涉及到的内容非常多,本课程重点讲解以下技术点: 1、Broker启动流程分析 2、消息存储设计 3、消息写入流程 4、亮点分析:NRS与NRC的功能号设计 5、亮点分析:同步双写数倍性…

洛谷P1059 [NOIP2006 普及组] 明明的随机数

(一)Question 1. 问题描述 2. Input 输入有两行,第 1 行为 1 个正整数,表示所生成的随机数的个数 N。第 2 行有 N 个用空格隔开的正整数,为所产生的随机数。 3. Output 输出也是两行,第 1 行为 1 个正整数 M,表示不相同的随机数的个数。第 2 行为 M 个用空格隔开的正…

“简单易懂的排序:深入了解直接选择排序“

文章目录 🔍 选择排序的原理与过程📈 选择排序的优缺点👉 代码实现 🔍 选择排序的原理与过程 本文我们直接说一个优化过的直接选择排序。其思路大同小异. 选择排序的思路很简单 每次从待排序的数据中选择一个最小和最大的元素&a…

fatal: unable to access ‘http://xxxx‘: Empty reply from server

当你遇到 “fatal: unable to access ‘http://xxxx’: Empty reply from server” 的错误信息时,通常表示 Git 客户端无法连接到指定的服务器或仓库。 以下是一些可能导致该错误的原因以及一些排除故障的步骤: 错误的 URL:确保你提供的 URL…

pdf转图片操作方法是什么?分享两个简单的方法!

PDF转图片是一个常见的需求,无论是为了方便编辑、共享,还是为了其他用途,我们需要简单而有效的方法来实现这个目标。本文将介绍两种简单的PDF转图片方法:记灵在线工具和截图方法。 记灵在线工具是一个强大而易于使用的在线工具&a…

UNIX网络编程卷一 学习笔记 第二十三章 高级SCTP套接字编程

SCTP是一个面向消息的协议,递送给用户的是部分的或完整的消息。只有当发送大消息时,在对端才会递送部分的消息。部分消息被递送给应用后,多个部分消息组合成单个完整消息不由SCTP负责。在SCTP应用进程看来,一个消息既可由单个输入…

Mars3d采用ellipsoid球实现模拟地球旋转效果

1.Mars3d采用ellipsoid球实现模拟地球旋转效果 2.开始自选装之后,模型一直闪烁 http://mars3d.cn/editor-vue.html?idgraphic/entity/ellipsoid 3.相关代码: import * as mars3d from "mars3d"export let map // mars3d.Map三维地图对象 …

WPS Office AI实战:智能表格化身智能助理

前面我们已经拿 WPS AI 对Word文字、PPT幻灯片、PDF 做了开箱体验,还没有看过的小伙伴,请翻看以前的文章,本文开始对【智能表格】进行AI开箱测验。 表格在日常的数据处理中占绝对地位,但表格处理并不是每一个人都擅长,…

第2讲 KMD ISP子系统缩略词及目录结构

QCOM Camera子系统缩略词介绍 CPAS(Camera Peripherals and Support)CDM(Camera Data Mover)TFE(Thin Front End)IFE(Image Front End)OPE(Offline Processing Engine)BPS(Bayer Processing Segment)SFE(Sensor Front End)LRME(Low Resolution Motion Estimation)CSID(Camera …

taro3 微信小程序 createIntersectionObserver 监听无效

项目: taro3 vue3 官方文档 版本:3.x Taro.createIntersectionObserver(component, options) 创建并返回一个 IntersectionObserver 对象实例。在自定义组件或包含自定义组件的页面中,应使用 this.createIntersectionObserver([options]) …