C标准库不支持正则表达式,但大部分Linux发行版本都带有第三方的正则表达式函数库。
以常见的<regex.h>
为例:
/*
regcomp将正则表达式编译成适合后续regexec函数搜索的形式
preg指向模式缓冲区,传出参数
regex字符串,传入参数
cflag决定编译类型,可位或:-REG_EXTENDED扩展正则表达式语法-REG_ICASE不区分大小写-REG_NOSUB不存储匹配结果-REG_NEWLINE识别换行符
*/
int regcomp(regex_t *preg, const char *regex, int cflags);
/*
regexec使用编译好的模式串匹配字符串,nmatch和pmatch用来提供匹配上的位置信息
其中regmatch_t:
typedef struct {regoff_t rm_so; //匹配的起始regoff_t rm_eo; //匹配的结尾
} regmatch_t;
eflags位或,可位或:-REG_NOTBOL-REG_NOTEOL-REG_STARTEND
*/
int regexec(const regex_t *preg, const char *string, size_t nmatch, regmatch_t pmatch[], int eflags);
/*
regerror将regcomp和regexec返回的错误码转为错误信息字符串
errorcode是regcomp和regexec的返回值
errbuf是接收错误信息字符串的缓存区,传出参数
*/
size_t regerror(int errcode, const regex_t *preg, char *errbuf, size_t errbuf_size);
/*清空regex_t结构体内容*/
void regfree(regex_t *preg);
使用的例子:
#include <stdint.h>
#include <stdio.h>
#include <stdlib.h>
#include <regex.h>
#define ARRAY_SIZE(arr) (sizeof((arr)) / sizeof((arr)[0]))
static const char *const str = "1) John Driverhacker;\n2) John Doe;\n3) John Foo;\n";
static const char *const re = "John.*o";
int main()
{static const char *s = str;regex_t regex;regmatch_t pmatch[1];regoff_t off, len;if(regcomp(®ex, re, REG_NEWLINE))exit(EXIT_FAILURE);printf("String = \"%s\"\n", str);printf("Matches:\n");for(int i = 0; ; i++) {if(regexec(®ex, s, ARRAY_SIZE(pmatch), pmatch, 0))break;off = pmatch[0].rm_so + (s - str);len = pmatch[0].rm_eo - pmatch[0].rm_so;printf("#%d:\n", i);printf("offset = %jd; length = %jd\n", (intmax_t) off, (intmax_t) len);printf("substring = \"%.*s\"\n", len, s + pmatch[0].rm_so);s += pmatch[0].rm_eo;}exit(EXIT_SUCCESS);
}