基于BF算法和KMP算法的病毒感染检测

案例引入:

实验任务:

代码实现:

注意:我以项目的形式编写此代码,编译环境为VS2022,代码移植可能会导致错误

mystring.h:存放结构体以及函数声明

#define _CRT_SECURE_NO_WARNINGS
#pragma once
#include<stdio.h>
#include<stdlib.h>
#include<assert.h>
#include<stdbool.h>
#include<string.h>#define MAXSIZE 1024 
typedef struct string
{char str[MAXSIZE];int curSize;
}string;//给定一个字符串,创建一个顺序表
string* createString(const char* str);//遍历串
void traverseString(string* pstr);//在给定串中插入,
void insertString(string* pstr, char* str, int pos);//区间删除
void deleteString(string* pstr, int start, int end);//是否为空
bool isEmpty(string* pstr);//当前个数
int lenString(string* pstr);//匹配算法
int bfString(string* mainStr, string* subStr);
void nextArray(string* pstr, int* next);
int kmpString(string* mainStr, string* subStr);//病毒检测实现
void virusDetection(void);
void getCirculation(string* pstr);

mystring.c:书写相关的代码实现

#include "mystring.h"//给定一个字符串,创建一个顺序表
string* createString(const char* str)
{//创建内存string* pstr = (string*)calloc(1, sizeof(string));assert(pstr);//初始化int count = 0;//拷贝字符串while (str[count]!= '\0'){pstr->str[count] = str[count];count++;}//最后的\0pstr->str[count] = str[count];//记录长度pstr->curSize = count;return pstr;
}//遍历串
void traverseString(string* pstr)
{for (int i = 0; i < pstr->curSize; i++){printf("%c", pstr->str[i]);}printf("\n");
}//在给定串中的指定位置插入,这里的位置是数组的下标
void insertString(string* pstr, const char* str, int pos)
{int len = strlen(str);//判断序号的有效性if (pos > MAXSIZE || pos < 0){printf("无效位置\n");return;}//判断是否溢出if (len + pstr->curSize > MAXSIZE){printf("数据溢出,无法插入\n");return;}//如果插入位置在字符串 \0的后面//那么选择直接将该字符串与原串相连接if (pos > pstr->curSize){for (int i = 0; i < len; i++){pstr->str[pstr->curSize++] = str[i];}}//一般情况:pos在串的内部else{//将pos之后的串向后挪len个位置for (int i = pstr->curSize; i >= pos; i--){//这里画图理解pstr->str[len + i] = pstr->str[i];}//插入新的元素for (int i = 0; i < len; i++){pstr->str[pos + i] = str[i];pstr->curSize++;}}
}//区间的删除,给出区间(数组下标)
void deleteString(string* pstr, int start, int end)
{if (pstr->curSize == 0){printf("空字符串\n");return;}//注:这里对于区间的合法性判断可以找反面//区间的合法性初步判断if (start > MAXSIZE || end > MAXSIZE || start < 0 || end < 0){printf("无效区间\n");return;}//区间合法性再次判断if (start > pstr->curSize){printf("无效区间\n");return;}//如果右区间超过字符串长度,那么将其赋值为字符串长度-1if (end > pstr->curSize - 1){end = pstr->curSize - 1;}//计算删除的元素个数int len = end - start + 1;//开始删除,这里是数组的伪删除for (int i = start, j = end+1; j < pstr->curSize; i++, j++){pstr->str[i] = pstr->str[j];}pstr->curSize -= len;pstr->str[pstr->curSize] = '\0';
}
//是否为空
bool isEmpty(string* pstr)
{return pstr->curSize == 0;
}//当前个数
int lenString(string* pstr)
{return pstr->curSize;
}//BF算法(Brute force暴力匹配)
int bfString(string* mainStr, string* subStr)
{//参数说明://index:记录开始比较的起始位置//i,j分别遍历主串和字串,判断是否相等int index, i, j;i = j = index = 0;//长度合法性if (mainStr->curSize < subStr->curSize){printf("长度错误\n");}while (index < mainStr->curSize){//如果第一个字符相同,那么一直向后比较if (mainStr->str[index] == subStr->str[j]){//开始比较过程i = index;while (j < subStr->curSize){if (mainStr->str[i] == subStr->str[j]){i++;j++;}//有一个字符不相等,则退出循环,将j置为0是为了开始下一次匹配else{j = 0;break;}}//如果j!=0,那么说明字串每一个字符都可以匹配,所以直接返回index即可if (j != 0){return index;}//反之说明没有匹配到,index继续向后index++;}//如果第一个字符不相同,则不会开启匹配过程else{index++;}}//如果上面没有return,那么就说明没有找到,则返回-1return -1;
}//kmp算法
//求解next数组(处理第i个不匹配时,如何开始下一次匹配的问题)
void nextArray(string* subStr, int* next)
{//i在后面走,j在前面走int i, j;i = 0, j = -1;//将第0个置为-1next[0] = -1;//求最大的公共前缀和后缀串长度while (i < subStr->curSize){if (j == -1 || subStr->str[i] == subStr->str[j]){i++;j++;next[i] = j;}else{//重置j的值j = next[j];}}
}//开始匹配(移位过程)
int kmpString(string* mainStr, string* subStr)
{//先判断长度的合法性if (mainStr->curSize < subStr->curSize){printf("长度错误\n");return -1;}//创建i,j分别遍历主串和子串int i, j;i = j = 0;//根据元素个数动态申请内存//这里为何要加1呢?多申请一个(因为上面i++之后对next进行了赋值,导致数组下标溢出)int *next=(int*)malloc(subStr->curSize*sizeof(int)+1);//获取next数组nextArray(subStr,next);//开始匹配操作while (i < mainStr->curSize && j < subStr->curSize){if (j == -1 || mainStr->str[i] == subStr->str[j]){i++;j++;}else{j = next[j];}//结束判断if (j == subStr->curSize){return i - j;}}//free(next);return -1;
}//样本数量
#define sampleSize 50
//病毒DNA最大长度
#define virusMaxSize 20
//人的DNA最大长度
#define peopleMaxSize 500//注:在结构体声明中,定义了MAXSIZE为char的最大长度,这里的病毒和人DNA不得超过MAXSIZE//将字符串第一个字符移动到最后一个
void getCirculation(string* pstr)
{//先保存第一个字符char temp = pstr->str[0];//后续的字符都整体向前移动for (int i = 1; i < pstr->curSize; i++){pstr->str[i - 1] = pstr->str[i];}//将最后一个字符改为第一个字符pstr->str[pstr->curSize - 1] = temp;
}void virusDetection(void)
{//定义两个指针数组来分别来接受病毒的DNA和人的DNA序列string* virus[sampleSize];string* people[sampleSize];//count用来记录输入的样本数量,以便于后续处理int count = 0;for (int i = 0;; i++){//读取数据char virus_temp[virusMaxSize];char people_temp[peopleMaxSize];scanf("%s %s", virus_temp, people_temp);count++;//创建结构体virus[i] = createString(virus_temp);people[i] = createString(people_temp);//清楚缓存区字符while (getchar() != '\n');//设置结束条件if (!strcmp(virus[i]->str, "0") && !strcmp(people[i]->str, "0")){break;}}//最后的0不算是样本count--;//数据读取完成后开始检测/*由于病毒的DNA是环状的,这里选择创建一个新的数组,将环状的DNA变为顺序的*///这里数组大小为病毒序列长度,因为是环状的,可以自己尝试找找规律,会得到virusMaxSize个不同的序列for (int i = 0; i < count; i++){//赋值变量int flag = -1;//virus->curSize是病毒实际的长度//此步骤是获取一个病毒DNA的所有顺序DNA序列for (int j = 0; j < virus[i]->curSize; j++){//循环一次,得到一个不同的序列getCirculation(virus[i]);//查找一次(这里也可以用bf算法)int end = kmpString(people[i], virus[i]);//如果查到了,那么说明已经感染,则进行下一个样本的比较if (end != -1){printf("YES\n");flag = 1;break;}}//判断是否 一个样本中,查找完对应的所有的病毒序列,还没有查到if (flag == -1){printf("NO\n");}}
}

最后就是测试了,创建test.c用于函数测试

#include"mystring.h"int main()
{virusDetection();return 0;
}

输入样例:

abbab abbabaab

baa cacdveabacsd

abe def

0 0

输出:

代码中的难点在于kmp算法的实现,建议阅读《大话数据结构》,再看B站的视频加深理解,一个讲的很好的视频:BV1jb411V78H

如有错误,请在评论区指正,谢谢!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/705480.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

2024中国应急(消防)品牌巡展西安站成功召开!惊喜不断

消防品牌巡展西安站 5月10日&#xff0c;由中国安全产业协会指导&#xff0c;中国安全产业协会应急创新分会、应急救援产业网联合主办&#xff0c;陕西消防协会协办的“一切为了安全”2024年中国应急(消防)品牌巡展-西安站成功举办。该巡展旨在展示中国应急&#xff08;消防&am…

Linux服务器lvm磁盘管理fdisk和df磁盘大小不同修改

服务器端由于硬盘是通过VCenter原来100G磁盘复制的虚拟机,复制完成后,原来100G的磁盘通过选择 磁盘重新复制出150G的磁盘,开机后发现还是原来的100G的磁盘,通过fdisk -l 查看有个sdb是150G, 但是已经划转的lvm盘只有100G, 通过df查看也是原来的100G: pvs查看pv里也是10…

服务器之间实现免密码传输文件(scp免密传输)

问题&#xff1a;需要定时将本服务器的文件传输到指定服务器上作为备份 通过scp实现不同服务器之间的文件传输 正常使用scp传输文件 传输文件命令&#xff1a;scp /data/文件 root服务器地址&#xff1a;/指定目录 传输文件夹命令&#xff1a;scp -r /data/文件 root服务…

ZYNQ专题-在自己的板子上移植U-boot无法联网问题

背景 在开发自己项目的时候&#xff0c;需要针对自己的板子进行相关的移植工作。在完成初步的U-boot移植后&#xff0c;发现U-boot无法ping通host主机。 移植方法是参考的正点原子教程。会不会是因为硬件不一致导致的&#xff1f;如前面文中提到的&#xff0c;板载使用的是KSZ…

pytest自动化测试框架tep环境变量、fixtures、用例三者之间的关系

&#x1f345; 视频学习&#xff1a;文末有免费的配套视频可观看 &#x1f345; 关注公众号&#xff1a;互联网杂货铺&#xff0c;回复1 &#xff0c;免费获取软件测试全套资料&#xff0c;资料在手&#xff0c;涨薪更快 tep是一款测试工具&#xff0c;在pytest测试框架基础上集…

GPT-4o 引领人机交互新风向,向量数据库赛道沸腾了

OpenAI 发布 ChatGPT-4o&#xff0c;意味着人机交互进入新的时代。Chat-GPT4o 是一个跨文本、视觉和音频端到端训练的新模型&#xff0c;所有输入和输出都由同一个神经网络处理。这也在告诉所有人&#xff0c;GenAI 连接非结构化数据&#xff0c;非结构化数据之间跨模态的交互正…

利用管道通信(pipe)测量进程间的上下文切换(context switch)开销

利用管道通信(pipe)测量进程间的上下文切换(context switch)开销 《https://pages.cs.wisc.edu/~remzi/OSTEP/cpu-mechanisms.pdf》 Measuring the cost of a context switch is a little trickier. The lmbench benchmark does so by running two processes on a single CPU…

[Vs2019报错找不到服务实例的解决方案]

计算机疑难杂症记录与分享004 Vs2019报错找不到服务实例的解决方案1、问题现象1.1、问题一&#xff1a;打开vs2019打开项目工程文件&#xff0c;直接弹窗报错1.2、问题二&#xff1a;能打开工程了。识别项目文件不兼容问题。 2、问题原因3、问题一的解决3.1、方法一(亲测无效)3…

Java 自然排序和比较器排序区别?Comparable接口和Comparator比较器区别?

注&#xff1a;如果你对排序不理解&#xff0c;请您耐心看完&#xff0c;你一定会明白的。文章通俗易懂。建议用idea运行一下案例。 1&#xff09;自然排序和比较器排序的区别&#xff1f; 自然排序是对象本身定义的排序规则&#xff0c;由对象实现 Comparable 接口&#xff…

Linux 第三十四章

&#x1f436;博主主页&#xff1a;ᰔᩚ. 一怀明月ꦿ ❤️‍&#x1f525;专栏系列&#xff1a;线性代数&#xff0c;C初学者入门训练&#xff0c;题解C&#xff0c;C的使用文章&#xff0c;「初学」C&#xff0c;linux &#x1f525;座右铭&#xff1a;“不要等到什么都没有了…

基础之音视频2

01 前言 02 mp 03 mp实例 简易音乐播放器 04 音频 sound-pool 1.作用 播放多个音频&#xff0c;短促音频 2.过程 加载load- 3.示例 模拟手机选铃声 步骤&#xff1a; 创建SoundPool对象&#xff0c;设置相关属性 音频流存入hashmap 播放音频 05 videoview 3gp 体积小 mp4 …

掌握Linux常用命令,扫平面试需求障碍

cd 切换目录。 > cd ../ #切换到父级目录 > cd /tmp # 切换到/tmp目录 > cd ~ # 切换到当前用户的家目录 ls命令 查看文件与目录的命令&#xff0c;list 的缩写。 > ls -l #列出长数据串&#xff0c;包含文件的属性与权限数据等 > ls -a #列出隐藏…