用python实现基本数据结构【01/4】

说明

        如果需要用到这些知识却没有掌握,则会让人感到沮丧,也可能导致面试被拒。无论是花几天时间“突击”,还是利用零碎的时间持续学习,在数据结构上下点功夫都是值得的。那么Python 中有哪些数据结构呢?列表、字典、集合,还有……栈?Python 有栈吗?本系列文章将给出详细拼图。
 

第1章:ADT抽象数据类型,定义数据和其操作

什么是ADT: 抽象数据类型(Abstract Data Type),学过数据结构的应该都知道。

如何为 ADT 选择数据结构

  1. 数据结构是否满足 ADT 域指定的存储要求?
  2. 数据结构是否提供数据访问和操作功能来完全实现 ADT?
  3. 高效执行?基于复杂性分析。

        下边代码是个简单的示例,比如实现一个简单的Bag类,先定义其具有的操作,然后我们再用类的magic method来实现这些方法:

class Bag:"""constructor: 构造函数sizecontainsappendremoveiter"""def __init__(self):self._items = list()def __len__(self):return len(self._items)def __contains__(self, item):return item in self._itemsdef add(self, item):self._items.append(item)def remove(self, item):assert item in self._items, 'item must in the bag'return self._items.remove(item)def __iter__(self):return _BagIterator(self._items)class _BagIterator:""" 注意这里实现了迭代器类 """def __init__(self, seq):self._bag_items = seqself._cur_item = 0def __iter__(self):return selfdef __next__(self):if self._cur_item < len(self._bag_items):item = self._bag_items[self._cur_item]self._cur_item += 1return itemelse:raise StopIterationb = Bag()
b.add(1)
b.add(2)
for i in b:     # for使用__iter__构建,用__next__迭代print(i)"""
# for 语句等价于
i = b.__iter__()
while True:try:item = i.__next__()print(item)except StopIteration:break
"""

第2章:array 和 list

        array: 定长,操作有限,但是节省内存;貌似我的生涯中还没用过,不过python3.5中我试了确实有array类,可以用import array直接导入

        list: 会预先分配内存,操作丰富,但是耗费内存。我用sys.getsizeof做了实验。我个人理解很类似C++ STL里的vector,是使用最频繁的数据结构。

  • list.append: 如果之前没有分配够内存,会重新开辟新区域,然后复制之前的数据,复杂度退化
  • list.insert: 会移动被插入区域后所有元素,O(n)
  • list.pop: pop不同位置需要的复杂度不同pop(0)是O(1)复杂度,pop()首位O(n)复杂度
  • list[]: slice操作copy数据(预留空间)到另一个list

来实现一个array的ADT:

import ctypesclass Array:def __init__(self, size):assert size > 0, 'array size must be > 0'self._size = sizePyArrayType = ctypes.py_object * sizeself._elements = PyArrayType()self.clear(None)def __len__(self):return self._sizedef __getitem__(self, index):assert index >= 0 and index < len(self), 'out of range'return self._elements[index]def __setitem__(self, index, value):assert index >= 0 and index < len(self), 'out of range'self._elements[index] = valuedef clear(self, value):""" 设置每个元素为value """for i in range(len(self)):self._elements[i] = valuedef __iter__(self):return _ArrayIterator(self._elements)class _ArrayIterator:def __init__(self, items):self._items = itemsself._idx = 0def __iter__(self):return selfdef __next__(self):if self._idex < len(self._items):val = self._items[self._idx]self._idex += 1return valelse:raise StopIteration

2.1 二维数组Two-Demensional Arrays

class Array2D:""" 要实现的方法Array2D(nrows, ncols):    constructornumRows()numCols()clear(value)getitem(i, j)setitem(i, j, val)"""def __init__(self, numrows, numcols):self._the_rows = Array(numrows)     # 数组的数组for i in range(numrows):self._the_rows[i] = Array(numcols)@propertydef numRows(self):return len(self._the_rows)@propertydef NumCols(self):return len(self._the_rows[0])def clear(self, value):for row in self._the_rows:row.clear(value)def __getitem__(self, ndx_tuple):    # ndx_tuple: (x, y)assert len(ndx_tuple) == 2row, col = ndx_tuple[0], ndx_tuple[1]assert (row >= 0 and row < self.numRows andcol >= 0 and col < self.NumCols)the_1d_array = self._the_rows[row]return the_1d_array[col]def __setitem__(self, ndx_tuple, value):assert len(ndx_tuple) == 2row, col = ndx_tuple[0], ndx_tuple[1]assert (row >= 0 and row < self.numRows andcol >= 0 and col < self.NumCols)the_1d_array = self._the_rows[row]the_1d_array[col] = value

2.2 The Matrix ADT, m行,n列。这个最好用还是用pandas处理矩阵,自己实现比较*疼

class Matrix:""" 最好用pandas的DataFrameMatrix(rows, ncols): constructornumCols()getitem(row, col)setitem(row, col, val)scaleBy(scalar): 每个元素乘scalartranspose(): 返回transpose转置add(rhsMatrix):    size must be the samesubtract(rhsMatrix)multiply(rhsMatrix)"""def __init__(self, numRows, numCols):self._theGrid = Array2D(numRows, numCols)self._theGrid.clear(0)@propertydef numRows(self):return self._theGrid.numRows@propertydef NumCols(self):return self._theGrid.numColsdef __getitem__(self, ndxTuple):return self._theGrid[ndxTuple[0], ndxTuple[1]]def __setitem__(self, ndxTuple, scalar):self._theGrid[ndxTuple[0], ndxTuple[1]] = scalardef scaleBy(self, scalar):for r in range(self.numRows):for c in range(self.numCols):self[r, c] *= scalardef __add__(self, rhsMatrix):assert (rhsMatrix.numRows == self.numRows andrhsMatrix.numCols == self.numCols)newMartrix = Matrix(self.numRows, self.numCols)for r in range(self.numRows):for c in range(self.numCols):newMartrix[r, c] = self[r, c] + rhsMatrix[r, c]

第3章:Sets 和 Maps

除了list之外,最常用的应该就是python内置的set和dict了。

3.1 sets ADT

集合是一个容器,它存储给定可比域中唯一值的集合,其中存储的值没有特定的顺序。

class Set:""" 使用list实现set ADTSet()length()contains(element)add(element)remove(element)equals(element)isSubsetOf(setB)union(setB)intersect(setB)difference(setB)iterator()"""def __init__(self):self._theElements = list()def __len__(self):return len(self._theElements)def __contains__(self, element):return element in self._theElementsdef add(self, element):if element not in self:self._theElements.append(element)def remove(self, element):assert element in self, 'The element must be set'self._theElements.remove(element)def __eq__(self, setB):if len(self) != len(setB):return Falseelse:return self.isSubsetOf(setB)def isSubsetOf(self, setB):for element in self:if element not in setB:return Falsereturn Truedef union(self, setB):newSet = Set()newSet._theElements.extend(self._theElements)for element in setB:if element not in self:newSet._theElements.append(element)return newSet

3.2 Maps or Dict: 键值对,python内部采用hash实现。

class Map:""" Map ADT list implementionMap()length()contains(key)add(key, value)remove(key)valudOf(key)iterator()"""def __init__(self):self._entryList = list()def __len__(self):return len(self._entryList)def __contains__(self, key):ndx = self._findPosition(key)return ndx is not Nonedef add(self, key, value):ndx = self._findPosition(key)if ndx is not None:self._entryList[ndx].value = valuereturn Falseelse:entry = _MapEntry(key, value)self._entryList.append(entry)return Truedef valueOf(self, key):ndx = self._findPosition(key)assert ndx is not None, 'Invalid map key'return self._entryList[ndx].valuedef remove(self, key):ndx = self._findPosition(key)assert ndx is not None, 'Invalid map key'self._entryList.pop(ndx)def __iter__(self):return _MapIterator(self._entryList)def _findPosition(self, key):for i in range(len(self)):if self._entryList[i].key == key:return ireturn Noneclass _MapEntry:    # or use collections.namedtuple('_MapEntry', 'key,value')def __init__(self, key, value):self.key = keyself.value = value

3.3 The multiArray ADT, 多维数组,一般是使用一个一维数组模拟,然后通过计算下标获取元素

class MultiArray:""" row-major or column-marjor ordering, this is row-major orderingMultiArray(d1, d2, ...dn)dims():   the number of dimensionslength(dim): the length of given array dimensionclear(value)getitem(i1, i2, ... in), index(i1,i2,i3) = i1*(d2*d3) + i2*d3 + i3setitem(i1, i2, ... in)计算下标:index(i1,i2,...in) = i1*f1 + i2*f2 + ... + i(n-1)*f(n-1) + in*1"""def __init__(self, *dimensions):# Implementation of MultiArray ADT using a 1-D # array,数组的数组的数组。。。assert len(dimensions) > 1, 'The array must have 2 or more dimensions'self._dims = dimensions# Compute to total number of elements in the arraysize = 1for d in dimensions:assert d > 0, 'Dimensions must be > 0'size *= d# Create the 1-D array to store the elementsself._elements = Array(size)# Create a 1-D array to store the equation factorsself._factors = Array(len(dimensions))self._computeFactors()@propertydef numDims(self):return len(self._dims)def length(self, dim):assert dim > 0 and dim < len(self._dims), 'Dimension component out of range'return self._dims[dim-1]def clear(self, value):self._elements.clear(value)def __getitem__(self, ndxTuple):assert len(ndxTuple) == self.numDims, 'Invalid # of array subscripts'index = self._computeIndex(ndxTuple)assert index is not None, 'Array subscript out of range'return self._elements[index]def __setitem__(self, ndxTuple, value):assert len(ndxTuple) == self.numDims, 'Invalid # of array subscripts'index = self._computeIndex(ndxTuple)assert index is not None, 'Array subscript out of range'self._elements[index] = valuedef _computeIndex(self, ndxTuple):# using the equation: i1*f1 + i2*f2 + ... + in*fnoffset = 0for j in range(len(ndxTuple)):if ndxTuple[j] < 0 or ndxTuple[j] >= self._dims[j]:return Noneelse:offset += ndexTuple[j] * self._factors[j]return offset

第4章:Algorithm Analysis

一般使用大O标记法来衡量算法的平均时间复杂度, 1 < log(n) < n < nlog(n) < n^2 < n^3 < a^n。 了解常用数据结构操作的平均时间复杂度有利于使用更高效的数据结构,当然有时候需要在时间和空间上进行衡量,有些操作甚至还会退化,比如list的append操作,如果list空间不够,会去开辟新的空间,操作复杂度退化到O(n),有时候还需要使用均摊分析(amortized)

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/107771.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

64、使用 Spring WebFlux 的 WebClient 整合第三方Restful服务

这节的要点&#xff1a; 就是弄两个项目 &#xff0c; 从 端口9090 这个项目&#xff0c;通过 webClient&#xff0c; 去访问 端口8080 的项目&#xff0c;并获取8080项目的数据。 ★ RESTful客户端的两种方式 - 应用基于传统的Spring MVC框架&#xff0c;此时考虑使用RestTe…

K线学习001-早晨之星1

K线定义 早晨之星&#xff0c;顾名思义&#xff1a;就是在太阳尚未升起的时候&#xff0c;黎明前最黑暗的时刻&#xff0c;一颗明亮的启明星在天边指引着那些走向光明的夜行人&#xff0c;前途当然看好。 早晨之星&#xff0c;即预示着跌势将尽&#xff0c;大盘处于拉升的前夜&…

TSUMU58CDT9-1显示器芯片方案

TSUMU58CDT9-1是用于LCD显示器的整体解决方案图形处理IC&#xff0c;面板分辨率高达WUXGA。它配置了高速集成三adc /PLL、集成DVI/HDMI接收器、高质量显示处理引擎、集成微控制器和支持LVDS面板接口格式的输出显示接口。TSUMU58CDT9-1支持一个灵活的可配置数字输入接口&#xf…

Ansible 自动化运维工具部署主从数据库+读写分离

文章目录 Ansible 自动化运维工具部署主从数据库读写分离一、主从复制和读写分离介绍二、准备工作&#xff08;1&#xff09;节点规划&#xff08;2&#xff09;修改主机名&#xff08;3&#xff09;免密&#xff08;4&#xff09;配置IP映射&#xff08;5&#xff09;安装ansi…

VMware vCenter Server Appliance7小版本升级

本文尝试使用 vCenter Server Appliance 管理界面 (VAMI) 进行对vCenter Server Appliance7应用进行小版本升级&#xff0c;从7.0.3.00100升级到7.0.3.01600。 一、升级前的准备工作 1、检查当前运行环境&#xff08;当前为7.0.3.00100&#xff09; 2、从 VMware官网下载压缩…

WebStorm使用Element组件库

文章目录 WebStorm使用Element组件库1. webstorm使用vue文件2. 首先需要安装Element Plus2. 项目完成引入-以日历为例 WebStorm使用Element组件库 1. webstorm使用vue文件 在Test.vue文件中书写模板,并暴露对外接口 <script> export default {name: "Test" }…

线性表——顺序表(增删查改)

顺序表是用一段物理地址连续的存储单元依次存储数据元素的线性结构&#xff0c;一般情况下采用数组存 储。在数组上完成数据的增删查改。 静态顺序表——使用定长数组储存数据 静态顺序表只适用于确定知道需要存多少数据的场景。静态顺序表的定长数组导致N定大了&#xff0c;空…

springWeb

springweb就是spring框架中的一个模块&#xff0c;对web层进行了封装&#xff0c;使用起来更加方便。如何方便&#xff1f;参数接收框架进行封装 SpringWeb拥有控制器&#xff0c;接收外部请求&#xff0c;解析参数传给服务层。 SpringWeb运行流程 用户发起请求 ip:端口/项目名…

利用 Python 中的地理空间数据与 GeoPandas

推荐&#xff1a;使用 NSDT编辑器快速搭建3D应用场景 空间数据的真正潜力在于它能够连接数据点及其各自的位置&#xff0c;为高级分析创造无限的可能性。地理空间数据科学是数据科学中的一个新兴领域&#xff0c;旨在利用地理空间信息并通过空间算法和机器学习或深度学习等先进…

车载多通道语音识别挑战赛(ICMC-ASR)丨ICASSP2024

由希尔贝壳、理想汽车、西工大音频语音与语言处理研究组、新加坡南洋理工大学、天津大学、WeNet开源社区、微软、中国信通院等单位发起的“车载多通道语音识别挑战赛”&#xff08;ICMC-ASR&#xff09;将作为IEEE声学、语音与信号处理国际会议&#xff08;ICASSP2024&#xff…

2个U盘安装Windows10的方法推荐!

"我刚刚购买了一块全新的硬盘。我在旧硬盘上安装了 Windows 10 操作系统&#xff0c;现在我希望将它迁移到我的新硬盘上。是否有人可以提供帮助&#xff0c;并指导我该如何进行&#xff1f;我是否只需将旧硬盘插入计算机&#xff0c;然后在 BIOS 中更改启动顺序以启动新硬…

第4篇 vue的基本语法操作以及组件,声明周期,路由的操作

一 vue常用操作案例 1.1 事件渲染 1.数据渲染的方式&#xff1a;使用插值表达式{{}}进行数据渲染 2.数据渲染的方式&#xff1a;以使用 v-bind指令&#xff0c;它的简写的形式就是一个冒号&#xff08;:&#xff09;&#xff0c;v-bind 特性被称为指令。指令带有前缀 v- 代…