字符串和内存函数
- 1. 前言
- 2. 求字符串长度
- 2.1 strlen
- 3. 长度不受限制的字符串函数
- 3.1 strcpy
- 3.2 strcat
- 3.3 strcmp
- 4. 长度受限制的字符串函数
- 4.1 strncpy
- 4.2 strncat
- 4.3 strncmp
- 5. 字符串查找
- 5.1 strstr
- 5.2 strtok
- 6. 错误信息报告
- 6.1 strerror
- 7. 字符操作函数
- 7.1 字符分类函数
- 7.2 字符转换函数
- 8. 内存操作函数
- 8.1 memcpy
- 8.2 memmove
- 8.3 memcmp
1. 前言
大家好,我是努力学习游泳的鱼。今天我们来学习一些常用的库函数。有了这些库函数,我们可以更加方便地操作字符串和内存,从而提升我们的编码效率。话不多说,我们开始吧!
注:以下大部分函数对应的头文件都是string.h
。
2. 求字符串长度
2.1 strlen
size_t strlen ( const char * str );
strlen
函数可以求字符串的长度。使用时只需把字符串的起始位置的地址作为参数传递给strlen
。该函数会从起始位置一直往后数字符,直到遇到\0
。最终返回的是\0
之前字符的个数。- 参数指向的字符串必须以
\0
结束。否则求出来的是随机值。 - 返回类型是
size_t
,是无符号类型。
接下来使用三种方式来模拟实现strlen
。
// 1. 使用计数器
size_t my_strlen(const char* str)
{int count = 0;assert(str != NULL);while (*str != '\0'){count++;str++;}return count;
}// 2. 递归
size_t my_strlen(const char* str)
{assert(str != NULL);if (*str == '\0')return 0;elsereturn 1 + my_strlen(str + 1);
}// 3. 指针-指针
size_t my_strlen(const char* str)
{assert(str != NULL);char* begin = str;// 找\0while (*str != '\0'){str++;}return str - begin;
}
3. 长度不受限制的字符串函数
3.1 strcpy
char* strcpy(char * destination, const char * source );
strcpy
函数会把源字符串拷贝到目标空间中去。- 源字符串必须以
\0
结束。 - 会将源字符串中的
\0
拷贝到目标空间。 - 目标空间必须足够大,以确保可以存放源字符串。
- 目标空间必须可变。
strcpy
返回的是目标空间的起始地址。
接下来我们来模拟实现strcpy
函数。
char* my_strcpy(char* dest, const char* src)
{char* ret = dest;assert(dest && src);while (*dest++ = *src++){;}return ret;
}
3.2 strcat
char * strcat ( char * destination, const char * source );
strcat
会把源字符串追加到目标字符串后面。- 源字符串必须以
\0
结束。 - 会把源字符串的
\0
拷贝到目标空间中去。 - 目标空间必须足够大,以确保可以存放源字符串。
- 目标空间必须可变。
strcat
返回的是目标空间的起始地址。- 不能自己给自己追加,因为当源字符串和目标空间重合时,会覆盖掉源字符串后面的
\0
。
有没有发现,其中很多点和strcpy
很像?
接下来我们来模拟实现strcat
。只需要两步:
- 找到目标空间的
\0
。 - 从目标空间的
\0
开始,把源字符串拷贝到目标空间中去。
char* my_strcat(char* dest, const char* src)
{assert(dest && src);char* ret = dest;// 找目标空间的\0while (*dest){dest++;}// 从目标空间的\0开始,向后拷贝while (*dest++ = *src++){;}return ret;
}
3.3 strcmp
int strcmp ( const char * str1, const char * str2 );
strcmp
函数比较的不是字符串的长度,而是比较字符串中对应位置上的字符的大小,如果相同,就比较下一对儿,直到不同或者都遇到\0
。- 若
str1<str2
,则返回值为负数;若str1>str2
,则返回值为正数;若str1=str2
,则返回值为0
。
接下来我们来模拟实现strcmp
。
int my_strcmp(const char* str1, const char* str2)
{assert(str1 && str2);while (*str1 == *str2){if (*str1 == '\0'){return 0; // 相等}str1++;str2++;}// 不相等if (*str1 > *str2){return 1;}else{return -1;}
}
4. 长度受限制的字符串函数
4.1 strncpy
char * strncpy ( char * destination, const char * source, size_t num );
- 拷贝
num
个字符从源字符串到目标空间。 - 如果源字符串的长度小于
num
,则拷贝完源字符串后,在目标的后面追加0
,直到num
个。
下面是strncpy
的模拟实现。
char* my_strncpy(char* dest, const char* src, size_t count)
{assert(dest && src);char* start = dest;while (count && (*dest++ = *src++) != '\0'){count--;}if (count){while (--count){*dest++ = '\0';}}return start;
}
4.2 strncat
char * strncat ( char * destination, const char * source, size_t num );
- 在目标空间后最多追加
num
个字符。 - 如果
num
大于源字符串的长度,则num
直接看作源字符串的长度。 - 一定会在最后追加
\0
。
模拟实现如下:
char* my_strncat(char* front, const char* back, size_t count)
{assert(front && back);char* start = front;// 找front中的\0while (*front){front++;}// 拷贝while (count--){if ((*front++ = *back++) == '\0'){return start;}}*front = '\0';return start;
}
4.3 strncmp
int strncmp ( const char * str1, const char * str2, size_t num );
- 只比较前
num
个字符。
以下是模拟实现:
int my_strncpy(const char* s1, const char* s2, size_t count)
{assert(s1 && s2);while (1){if (count == 0){return 0;}else if (*s1 > *s2){return 1;}else if (*s1 < *s2){return -1;}else{if (*s1 == '\0'){return 0;}s1++;s2++;count--;}}
}
5. 字符串查找
5.1 strstr
char * strstr ( const char *str1, const char * str2);
- 在
str1
中查找str2
,如果找到了,就返回第一次出现的起始位置;如果找不到,就返回空指针NULL
。
最简单的实现方式是直接暴力查找。
char* my_strstr(const char* str1, const char* str2)
{assert(str1 && str2);const char* s1 = str1;const char* s2 = str2;const char* cur = str1;while (*cur){s1 = cur;s2 = str2;while (*s1 && *s2 && *s1 == *s2){s1++;s2++;}if (*s2 == '\0'){// 找到了return (char*)cur;}cur++;}// 找不到return NULL;
}
5.2 strtok
char * strtok ( char * str, const char * sep );
strtok
用于分割字符串。sep
是一个字符串,定义了用作分隔符的字符集合。- 第一个参数指定一个字符串,它包含了
0
个或者多个由sep
字符串中一个或者多个分隔符分割的标记。 strtok
函数找到str
中的下一个标记,并将其用\0
结尾,返回一个指向这个标记的指针。(注:strtok
函数会改变被操作的字符串,所以在使用strtok
函数切分的字符串一般都是临时拷贝的内容并且可修改。)strtok
函数的第一个参数不为NULL
,函数将找到str
中第一个标记,strtok
函数将保存它在字符串中的位置。strtok
函数的第一个参数为NULL
,函数将在同一个字符串中被保存的位置开始,查找下一个标记。- 如果字符串中不存在更多的标记,则返回
NULL
指针。
使用举例:
#include <stdio.h>
#include <string.h>int main()
{char arr[] = "abc@def.123@456";char buf[30] = { 0 }; // 使用strtok,一般要做备份strcpy(buf, arr);const char* sep = "@."; // 分隔符的集合char* str = NULL;for (str = strtok(buf, sep); str != NULL; str = strtok(NULL, sep)){printf("%s\n", str);}return 0;
}
6. 错误信息报告
6.1 strerror
char * strerror ( int errnum );
- 会返回错误码对应的错误信息。
- 有一个全局变量
errno
,会记录库函数在调用失败后的错误码。使用时需要引用头文件errno.h
。
使用举例:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <limits.h>
#include <errno.h>int main()
{int* p = (int*)malloc(INT_MAX);if (p == NULL){printf("%s\n", strerror(errno));}return 0;
}
7. 字符操作函数
以下函数对应的头文件是ctype.h
。
7.1 字符分类函数
函数 | 如果它的参数复合下列条件就返回真 |
---|---|
iscntrl | 任何控制字符 |
isspace | 任何空白字符 |
isdigit | 十进制数字 |
isxdigit | 十六进制数字 |
islower | 小写字母 |
isupper | 大写字母 |
isalpha | 大小写字母 |
isalnum | 大小写字母或数字 |
ispunct | 标点符号 |
isgraph | 图形字符 |
isprint | 可打印字符 |
7.2 字符转换函数
转小写:
int tolower( int c );
转大写
int toupper( int c );
8. 内存操作函数
8.1 memcpy
void * memcpy ( void * destination, const void * source, size_t num );
- 函数
memcpy
从source
的位置开始向后复制num
个字节的数据到destination
的内存位置。 - 这个函数在遇到
'\0'
的时候并不会停下来。 - 如果
source
和destination
有任何的重叠,复制的结果都是未定义的。
模拟实现如下:
void* my_memcpy(void* dest, const void* src, size_t count)
{assert(dest && src);void* ret = dest;while (count--){*(char*)dest = *(char*)src;dest = (char*)dest + 1;src = (char*)src + 1;}return ret;
}
8.2 memmove
void * memmove ( void * destination, const void * source, size_t num );
- 和
memcpy
的差别就是memmove
函数处理的源内存块和目标内存块是可以重叠的。 - 如果源空间和目标空间出现重叠,就得使用
memmove
函数处理。
模拟实现如下:
void* my_memmove(void* dest, const void* src, size_t count)
{assert(dest && src);void* ret = dest;if (dest < src){// 前->后while (count--){*(char*)dest = *(char*)src;dest = (char*)dest + 1;src = (char*)src + 1;}}else{// 后->前while (count--){*((char*)dest + count) = *((char*)src + count);}}return ret;
}
8.3 memcmp
int memcmp ( const void * ptr1,const void * ptr2,size_t num );
- 比较从
ptr1
和ptr2
指针开始的num
个字节。 - 返回值和
strcmp
类似,根据大小关系返回正数、负数或者0
。
模拟实现如下:
int my_memcmp(const void* ptr1, const void* ptr2, size_t num)
{assert(ptr1 && ptr2);while (num--){if (*(char*)ptr1 > *(char*)ptr2){return 1;}else if (*(char*)ptr1 < *(char*)ptr2){return -1;}ptr1 = (char*)ptr1 + 1;ptr2 = (char*)ptr2 + 1;}return 0;
}