Python复合型数据避坑指南

目录

前言

列表(Lists)

 1. 修改可变对象

 2. 浅拷贝和深拷贝

元组(Tuples)

集合(Sets)

字典(Dictionaries)

 1. 键值唯一性

 2. 键的类型

实际应用场景

 1. 数据分析与清洗

 2. 网络爬虫与数据提取

 3. 软件开发与数据结构设计

 4. 数据库操作与ORM框架

总结


前言

在Python中,复合型数据(例如列表、元组、集合和字典)是非常常用的数据类型,它们可以以结构化的方式组织和操作数据。然而,由于其灵活性和特性,使用复合型数据时常常容易出现一些陷阱和问题。本指南将深入探讨Python复合型数据的常见陷阱,并提供一些避免这些问题的实用建议和技巧,以帮助更好地利用Python的复合型数据。

列表(Lists)

 1. 修改可变对象

列表是可变的数据类型,因此在对列表中的可变对象(如列表、字典等)进行操作时要格外小心。在修改列表中的可变对象时,很容易影响到原始列表。

# 修改可变对象会影响原始列表
original_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]
modified_list = original_list
modified_list[0][0] = 100
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

 2. 浅拷贝和深拷贝

当需要复制列表时,应该了解浅拷贝和深拷贝的区别。浅拷贝只会复制列表的顶层元素,而深拷贝会递归复制所有嵌套的对象。

import copyoriginal_list = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]# 浅拷贝
shallow_copy = copy.copy(original_list)
shallow_copy[0][0] = 100
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]# 深拷贝
deep_copy = copy.deepcopy(original_list)
deep_copy[0][0] = 1000
print(original_list)  # 输出: [[100, 2, 3], [4, 5, 6], [7, 8, 9]]

元组(Tuples)

元组是不可变的数据类型,因此不能对其进行修改。但需要注意,如果元组中包含可变对象,则可变对象的内容是可以被修改的。

# 元组中包含可变对象
tuple_with_list = ([1, 2, 3], [4, 5, 6])
tuple_with_list[0][0] = 100
print(tuple_with_list)  # 输出: ([100, 2, 3], [4, 5, 6])

集合(Sets)

集合是一种无序且不重复的数据类型,常用于去重和集合运算。然而,由于其不可索引的特性,有时可能会导致意外的结果。

# 集合不支持索引
my_set = {1, 2, 3}
print(my_set[0])  # 报错: 'set' object is not subscriptable

字典(Dictionaries)

 1. 键值唯一性

字典的键必须是唯一的,如果尝试使用相同的键来添加新的键值对,则会覆盖原有的键值对。

my_dict = {'a': 1, 'b': 2}
my_dict['a'] = 100
print(my_dict)  # 输出: {'a': 100, 'b': 2}

 2. 键的类型

字典的键可以是不可变的数据类型,如字符串、整数、元组等,但不能是可变的数据类型,如列表、集合、字典等。

# 字典的键不能是列表
my_dict = {[1, 2]: 'value'}  # 报错: unhashable type: 'list'

实际应用场景

复合型数据在Python中有着广泛的应用,从数据分析到软件开发,都可以见到它们的身影。通过一些实际的应用场景来进一步了解如何在实践中避免坑并正确地使用复合型数据。

 1. 数据分析与清洗

在数据分析中,经常需要处理来自各种数据源的复合型数据,比如JSON格式的数据、嵌套的字典和列表等。

下面是一个简单的示例,演示了如何从JSON文件中读取数据,并进行清洗和处理。

import json# 读取JSON文件
with open('data.json', 'r') as f:data = json.load(f)# 提取数据并清洗
cleaned_data = []
for item in data:if 'name' in item and 'age' in item:cleaned_data.append({'name': item['name'], 'age': item['age']})# 打印清洗后的数据
print(cleaned_data)

在这个示例中,首先读取了一个JSON文件,然后遍历数据并进行了清洗,只保留了包含'name'和'age'字段的数据。

 2. 网络爬虫与数据提取

在网络爬虫开发中,经常需要处理HTML页面中的复合型数据,比如提取表格数据、链接和文本内容等。

看一个示例,演示如何使用BeautifulSoup库从网页中提取表格数据。

from bs4 import BeautifulSoup
import requests# 发送HTTP请求获取网页内容
url = 'https://example.com'
response = requests.get(url)
html_content = response.text# 使用BeautifulSoup解析网页内容
soup = BeautifulSoup(html_content, 'html.parser')# 提取表格数据
table = soup.find('table')
if table:rows = table.find_all('tr')data = []for row in rows:cells = row.find_all('td')if cells:row_data = [cell.text.strip() for cell in cells]data.append(row_data)# 打印提取的表格数据
print(data)

在这个示例中,使用了requests库发送HTTP请求获取网页内容,然后使用BeautifulSoup库解析HTML内容,并提取了表格数据。

 3. 软件开发与数据结构设计

在软件开发中,合理设计和使用复合型数据结构可以提高代码的可读性、可维护性和性能。

看一个示例,演示如何设计一个简单的数据结构来表示学生信息。

class Student:def __init__(self, name, age, courses):self.name = nameself.age = ageself.courses = coursesdef __repr__(self):return f"Student(name={self.name}, age={self.age}, courses={self.courses})"# 创建学生对象
student1 = Student('Alice', 20, ['Math', 'Physics', 'Chemistry'])
student2 = Student('Bob', 22, ['History', 'Literature', 'Geography'])# 打印学生信息
print(student1)
print(student2)

在这个示例中,定义了一个Student类来表示学生信息,包括姓名、年龄和所修课程。然后,创建了两个学生对象,并打印它们的信息。

 4. 数据库操作与ORM框架

在数据库操作和使用ORM(对象关系映射)框架时,也经常需要处理复合型数据,比如查询结果集、模型对象和关联数据等。

下面是一个简单的示例,演示了如何使用SQLAlchemy ORM框架来定义模型和查询数据。

from sqlalchemy import create_engine, Column, Integer, String
from sqlalchemy.ext.declarative import declarative_base
from sqlalchemy.orm import sessionmaker# 创建数据库引擎和会话
engine = create_engine('sqlite:///:memory:')
Base = declarative_base()
Session = sessionmaker(bind=engine)
session = Session()# 定义模型类
class Product(Base):__tablename__ = 'products'id = Column(Integer, primary_key=True)name = Column(String)price = Column(Integer)# 创建数据表
Base.metadata.create_all(engine)# 创建产品对象并插入数据
product1 = Product(name='Product 1', price=100)
product2 = Product(name='Product 2', price=200)
session.add(product1)
session.add(product2)
session.commit()# 查询数据
products = session.query(Product).all()# 打印查询结果
for product in products:print(product.name, product.price)

在这个示例中,使用了SQLAlchemy ORM框架来定义一个简单的产品模型,然后创建了两个产品对象并插入数据,最后查询了所有产品数据并打印出来。

总结

本文介绍了在使用Python复合型数据时常见的陷阱和问题,并提供了一些避免这些问题的实用建议和技巧。通过深入了解列表、元组、集合和字典的特性,以及如何正确地使用它们,可以更好地利用Python的复合型数据,编写出更加健壮和高效的代码。希望本文能够帮助大家避免在使用复合型数据时遇到的常见问题,并提高Python编程的水平和效率。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/498826.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

记忆化搜索(Function,天下第一)

Function 这是一道很直观的递归题目,但是使用递归会导致时间超限,所以需要使用记忆化搜素。 首先把坑点讲一下:出题人会给出负数,而我们知道数组下标是不能有负数的,如果是二维数组还可以用map数组进行储存&#xff0c…

DETR(1):论文详解

文章目录 1. DETR 模型结构2.损失函数2.1 预测结果和GT 的匹配2.2 训练的loss计算3.实验3.1 大物体表现效果好3.2 Transformer Encoder 和Decoder的作用3.3 object query4. 伪代码5. 结论

Python set 集合

Python 集合 集合(set)是一个无序的不重复元素序列。 集合中的元素不会重复,并且可以进行交集、并集、差集等常见的集合操作。 可以使用大括号 { } 创建集合,元素之间用逗号 , 分隔, 或者也可以使用 set() 函数创建…

width:100%和width:auto有啥区别

项目中使用了with属性,突然好奇auto 和 100% 的区别,特地搜索实践总结了一下观点 一、 width属性介绍二、 代码带入三、 分析比较四、 总结 一、 width属性介绍 width 属性用于设置元素的宽度。width 默认设置内容区域的宽度,但如果 box-siz…

皇冠测评:网络电视盒子哪个品牌好?电视盒子排行榜

欢迎各位来到我们的测评频道,本期我们要分享的产品是电视盒子,因很多网友留言不知道网络电视盒子哪个品牌好,我们通过为期一个月的测评后整理了电视盒子排行榜,想买电视盒子的可以看看下面这五款产品,它们各方面表现非…

(每日持续更新)信息系统项目管理(第四版)(高级项目管理)考试重点整理第12章 项目质量管理(三)

博主2023年11月通过了信息系统项目管理的考试,考试过程中发现考试的内容全部是教材中的内容,非常符合我学习的思路,因此博主想通过该平台把自己学习过程中的经验和教材博主认为重要的知识点分享给大家,希望更多的人能够通过考试&a…

污水处理设备远程监控:HiWoo Cloud如何打造智慧环保新时代

随着工业化和城市化的快速推进,污水处理成为了保护环境、维护生态平衡的重要一环。传统的污水处理设备管理方式往往依赖于人工巡检和现场控制,不仅效率低下,而且难以实时掌握设备的运行状况。在这个背景下,HiWoo Cloud平台推出了污…

Matlab: Introduction to Hybrid Beamforming

文章目录 来源混合波束赋形的基本概念System Setup关键函数 来源 在matlab的命令行输入 doc hybrid beamforming 混合波束赋形的基本概念 混合波束形成简介 本例介绍了混合波束形成的基本概念,并说明了如何模拟这种系统。 现代无线通信系统使用空间复用来提高散…

模拟算法题练习(一)

模拟算法介绍: 模拟算法通过模拟实际情况来解决问题,一般容易理解但是实现起来比较复杂,有很多需要注意的细节,或者是一些所谓很“麻模“的东西。 模拟题一般不涉及太难的算法,一般就是由较多的简单但是不好处理的部…

如何开发自己的npm包并上传到npm官网可以下载

目录 搭建文件结构 开始编写 发布到npm 如何下载我们发布的npm包 搭建文件结构 先创建新文件夹,按照下面的样子布局 .├── README.md //说明文档 ├── index.js //主入口 ├── lib //功能文件 └── tests //测试用例 然后再此根目录下初始化package包 npm init…

蓝桥杯题练习:平地起高楼

题目要求 function convertToTree(regions, rootId "0") {// TODO: 在这里写入具体的实现逻辑// 将平铺的结构转化为树状结构,并将 rootId 下的所有子节点数组返回// 如果不存在 rootId 下的子节点,则返回一个空数组}module.exports convert…

西门子WinCC冗余项目使用

1 如果需要使用WinCC冗余系统时,请仔细阅读下面的文档,它将解决以下几个问题: (1)WinCC冗余有什么样的功能? (2)需要购买什么样的授权? (3)应…