一、数据结构概述
基本概念
数据结构指的是计算机存储数据和组织数据的方式,存储数据和组织数据的目的是为了后期对数据的再次利用,所以存储的数据一般是具有一个或者多个特定关系的集合,利用不同的数据结构可以提高数据的访问效率。
思考:为什么大家来到新教室选好座位之后需要填写座位表?? 答案:方便管理班级学生
数据指的是可以被输入到计算机并且可以被计算机处理的符号的总称,数据的英文是Data。
数据结构
数据是有单位的,数据的基本单位是数据元素(Data Element),在计算机中数据元素是作为整体来处理的,比如学生的信息。数据元素是由多个数据项组成的,所以数据项也被称为数据的最小单位,比如学生信息中的学号、姓名、年龄,数据项属于数据元素不可分割的一部分。
举例:比如国家是数据元素,则每个国家的城市就是数据项,数据项是数据不可分割的部分。
注意:世界上不止有一个国家,如果每个国家都是数据元素的话,则多个数据元素的集合就被称为数据对象(Data Object)。
数据结构就是描述多个数据之间的逻辑结构和物理结构。逻辑结构指的是数据元素之间的逻辑关系,物理结构指的是计算机中存储数据的方式,所以物理结构也被称为存储结构。
注意:数据元素的逻辑关系和物理关系没有必然的联系,数据元素可能同时存储逻辑关系和物理关系,数据元素之间也可能只存在一种关系,或者数据元素之间一种关系都没有。
逻辑关系
对于数据结构的逻辑关系,可以分为四种:集合(无关系)、线性结构(一对一)、树状结构(一对多)、图状结构(多对多)。
物理关系
数据的物理关系可以分为两种:一种是顺序结构(连续存储),另一种是离散结构(离散存储),一般把顺序结构也称为顺序存储,一般把离散结构也称为链式存储,两种区别如下图
算法概念
广义上讲算法是研究数据之间的逻辑关系,然后选择某种方案来存储数据,并在此基础上对数据进行处理,其实更加直白的说:算法指的是计算或者解决问题的步骤。
请问:如果把下面的一个随机数列中的数值按照从小到大顺序进行排列??具体步骤是什么??
算法特征
(1)有穷性:指的是程序执行必须在有限次数内完成,而每一次必须在有限时间内执行完成。
(2)确定性:执行的每一条语句都必须有准确的解释,不能出现二义性,意味着相同的输入 就会相同的输出。
(3)可行性:程序中每一条复杂语句都可以分解为基本指令,并且每条基本指令都必须在有 限时间完成。
(4)输入项:指的是算法可以有一个或者多个参数作为初始条件,然后对程序进行有效执行。
(5)输出项:指的是算法经过运算之后可以有一个或者多个输出,所以一个有意义的算法是 应该有输出结果的。
总结:一个程序的执行是需要用户选择合适的算法和数据结构的,程序 = 数据结构+算法。
思考:到底什么样的数据结构和算法是合适的?怎么去评定选择的数据结构和算法是否合适?
回答;对于数据结构的选择和算法的选择并不是唯一的,但是选择要是合适的,衡量数据结构和算法的选择是否合适,取决于算法实现的运行时间和内存空间。一般是通过两个专业性名称,分别是“时间复杂度”和“空间复杂度”。
时间复杂度
时间复杂度不是算法的运行时间来衡量,因为程序的运行时间取决于CPU的性能,不同性能的CPU执行指令的周期是不一样的,比如8bit单片机的主频是12MHZ,而32bit单片机的主机可以168MHZ,而计算机的CPU主频都是xxx.GHZ 。
时间复杂度指的是算法程序的语句的执行次数,也可以称为语句频度,一个程序的语句执行次数越多,则时间复杂度越大,则说明算法不合适。时间复杂度一般采用数学符号大O()表示,一般时间复杂度的计算中都会出现n,n表示规模,对于时间复杂度是表示算法的趋势。
一般会把算法程序的语句的执行次数用T()表示,但是对于函数T()可能是一个多项式,而时间复杂度就是找出函数T()影响最大的项,所以时间复杂度是执行语句的估算值,使用数学符号大O()表示。O其实是order的缩写。大O的括号中写的值就是影响程序执行语句最大的那个项。
计算技巧:只需要计算出算法的基本执行语句的最高次项,并且把最高次项的系数舍弃,就是算法的时间复杂度,需要使用数学符号O(xxx),如果计算出的是常数项,则时间复杂度衡为O(1)。
空间复杂度
空间复杂度指的是程序运行期间所需要的内存空间,空间复杂度越大,则说明程序运行期间需要的内存越多,则说明算法不合适。
注意:程序中的时间复杂度和空间复杂度是可以互相转换的,一般情况下是相互制约的,意味着“鱼和熊掌不可兼得”,所以用户根据实际情况去选择时间还是空间,意味着要选择合适的算法来保持平衡。
一个好的算法通常是执行时间短,占用空间少,并且可读性好、容易维护,易于移植到其他平台。
结构类型
大家在学习C语言的时候接触的数组在数据结构中是属于线性表的一种,线性表是由一组具有n个相同类型的数据元素组成的。
线性表中的任何一个数据元素有且只有一个直接前驱,以及有且只有一个直接后继,另外首元素是没有前驱的,尾元素是没有后继的。
某个元素的左侧相邻元素被称为“直接前驱”,元素左侧所有的数据元素被称为“前驱元素”。
某个元素的右侧相邻元素被称为“直接后继”,元素右侧所有的数据元素被称为“后继元素”。
满足这种数学关系的一组元素,逻辑关系就是线性结构,并且逻辑关系是一对一的,比如一个教室学生的学号、一个排队的队伍、一摞堆好的盘子.....都属于线性结构,当然线性结构和存储方式是无关的,简单理解:只有逻辑关系是一对一的,就是线性结构。
所以,根据数据的存储方式可以把线性表分为两种:顺序存储的线性表,链式存储的线性表。
顺序表
顺序表指的是使用一组内存地址连续的内存单元来依次存储线性表中的数据元素,使用这种存储结构的线性表就被称为顺序表。
简单理解:数据存储在一块连续的内存中,在C语言中可以具名的数组,也可以使用匿名的数组(堆内存)。
顺序表的特点:数据元素之间的逻辑关系是相邻的,并且内存地址也是相邻的,所以只要知道存储线性表的第一个数据元素的内存地址,就可以对线性表中的任意一个元素进行随机访问。通常用户使用动态分配的数组来实现顺序表,也就是使用堆内存实现。
随机访问指的是在同等时间内具有访问任意元素的能力,和随机访问相对立的就是顺序访问,顺序访问花费的时间要高于随机访问,比如卷轴(顺序)和书籍(随机)、磁带(顺序)和唱片(随机)。
练习:请问该笔试题的结果是什么?请给出简单的推理过程,请独立完成该笔试题的分析。
练习:请问该笔试题的结果是什么?请给出简单的推理过程,请独立完成该笔试题的分析。
练习:请问该笔试题的结果是什么?请给出简单的推理过程,请独立完成该笔试题的分析。
思考:既然数组可以作为线性表来使用,请问如何对数组中的元素进行增加和删除以及访问?
回答:如果打算使用数组实现线性表的特性,需要知道三个条件:数组首元素地址、数组元素的容量、数组有效的最后一个元素的下标。
笔试题:
笔试题:
代码
sequencelist.c代码
/********************************************************************************************************
*
*
* 该程序实现顺序表元素的增删改查,目的是提高设计程序的逻辑思维,另外为了提高可移植性,所以顺序表中元素的
* 数据类型为DataType_t,用户可以根据实际情况修改顺序表中元素的类型。
*
* 另外,为了方便管理顺序表,所以用户设计SeqList_t结构体,该结构体中包含三个成员:地址+容量+有效元素的下标
*
*
*
* Copyright (c) 2023-2024 yfm3262@163.com All right Reserved
* ******************************************************************************************************/
#include <stdio.h>
#include <stdbool.h>
#include <stdlib.h>//指的是顺序表中的元素的数据类型,用户可以根据需要进行修改
typedef int DataType_t;//构造记录顺序表SequenceList各项参数(顺序表的首地址 + 顺序表的容量 + 顺序表中最后有效元素的下标)的结构体
typedef struct SequenceList
{DataType_t * Addr; //记录顺序表首地址unsigned int Size; //记录顺序表的容量int Last; //顺序表中最后元素的下标 }SeqList_t;//创建顺序表并对顺序表进行初始化
SeqList_t * SeqList_Create(unsigned int size)
{//1.利用calloc为顺序表的管理结构体申请一块堆内存SeqList_t *Manager = (SeqList_t *)calloc(1,sizeof(Manager));if(NULL == Manager){perror("calloc memory for manager is failed");exit(-1); //程序异常终止}//2.利用calloc为所有元素申请堆内存Manager->Addr = (DataType_t *)calloc(size,sizeof(DataType_t));if (NULL == Manager->Addr){perror("calloc memory for element is failed");free(Manager);exit(-1); //程序异常终止}//3.对管理顺序表的结构体进行初始化(元素容量 + 最后元素下标)Manager->Size = size; //对顺序表中的容量进行初始化Manager->Last = -1; //由于顺序表为空,则最后元素下标初值为-1return Manager;
}//判断顺序表是否已满
bool SeqList_IsFull(SeqList_t *Manager)
{return (Manager->Last + 1 == Manager->Size) ? true : false;
}//向顺序表的尾部加入元素
bool SeqList_TailAdd(SeqList_t *Manager, DataType_t Data)
{//1.判断顺序表是否已满if ( SeqList_IsFull(Manager) ){printf("SequenceList is Full!\n");return false;}//2.如果顺序表有空闲空间,则把新元素添加到顺序表尾部Manager->Addr[++Manager->Last] = Data;return true;
}//向顺序表的头部加入元素
bool SeqList_HeadAdd(SeqList_t *Manager, DataType_t Data)
{//1.判断顺序表是否已满if ( SeqList_IsFull(Manager) ){printf("SequenceList is Full!\n");return false;}//2.如果顺序表有空闲空间,则需要把顺序表所有元素向后移动1个单位for (int i = Manager->Last;i >= 0;i--){Manager->Addr[i+1] = Manager->Addr[i];}//3把新元素添加到顺序表的头部,并且更新管理结构体中的元素下标+1Manager->Addr[0] = Data;Manager->Last++;return true;
}//判断顺序表是否已满
bool SeqList_IsEmpty(SeqList_t *Manager)
{return (-1 == Manager->Last) ? true : false;
}//删除顺序表的元素
bool SeqList_Del(SeqList_t *Manager,DataType_t DestVal)
{int temp = -1; //记录要删除的元素的下标//1.判断顺序表是否为空if ( SeqList_IsEmpty(Manager) ){printf("SequenceList is Empty!\n");return false;}//2.此时需要查找目标值是否在顺序表中for (int i = 0; i <= Manager->Last; ++i){ //如果目标值和顺序表中元素的值相同if (DestVal == Manager->Addr[i]){temp = i; //把目标元素的下标备份到变量temp中break;} }//3.如果顺序表没有目标值的元素则直接终止函数if (-1 == temp){printf("destval [%d] is not found\n",DestVal);return false;}//4.如果找到了目标元素,则直接把该元素的后继元素向前移动一个单位for (int i = temp ; i < Manager->Last ; ++i){Manager->Addr[i] = Manager->Addr[i+1];}//5.由于删除了一个元素,则需要让顺序表的有效元素下标-1Manager->Last--;return true;
}//遍历顺序表的元素
void SeqList_Print(SeqList_t *Manager)
{for (int i = 0; i <= Manager->Last; ++i){printf("Element[%d] = %d\n",i,Manager->Addr[i]);}
}int SeqList_Remove(*L,int p)
{//判断顺序表的地址是否有效if(NULL == L){return 0;}int e = 0; //变量e,记录待删除元素的值//把待删除元素的值备份到变量e中e = L[p];//把待删除元素的后继元素向前移动一个单位for (int i = p; i < length; ++i){L[i] = L[i+1];}return 1;
}//递增排序 1 2 30 40 55
void SeqList_Insert(SeqList *L,int x)
{int temp = -1; //记录待插入元素的下标//遍历顺序表,找到插入位置,比较元素for (int i = 0; i <= last; ++i){if (x < L[i]){temp = i;break;}}if( -1 == temp){L[last+1] = x;return;}//把待插入位置的后继元素向后移动for (int i = last; i >= temp; i--){L[i+1] = L[i];}L[temp] = x;
}int main(int argc, char const *argv[])
{//1.创建顺序表SeqList_t * Manager = SeqList_Create(10);//2.向顺序表中的尾部插入新元素SeqList_TailAdd(Manager,5);SeqList_TailAdd(Manager,2);SeqList_TailAdd(Manager,1);SeqList_TailAdd(Manager,4);SeqList_TailAdd(Manager,6); //3.遍历顺序表SeqList_Print(Manager); // -- 5 2 1 4 6printf("\n");//4.向顺序表中的头部插入新元素SeqList_HeadAdd(Manager,9);SeqList_HeadAdd(Manager,7);SeqList_HeadAdd(Manager,8);SeqList_HeadAdd(Manager,0);SeqList_HeadAdd(Manager,10); //5.遍历顺序表SeqList_Print(Manager); // --10 0 8 7 9 5 2 1 4 6printf("\n"); //6.删除顺序表的元素SeqList_Del(Manager,20);SeqList_Del(Manager,5);SeqList_Del(Manager,10);SeqList_Del(Manager,0);SeqList_Del(Manager,30);//7.遍历顺序表SeqList_Print(Manager); // --8 7 9 2 1 4 6printf("\n");return 0;
}