Flaurm实现中文搜索

目录

    • 摘要
    • 需求
    • 本文涉及环境情况如下
    • 解决方案
    • 最终效果
    • 文章其他链接:

摘要

  Flarum本身对中文支持并不理想,但随着版本更新,逐渐加强了对中文的优化。然而在1.8.5版本,却还是不支持中文搜索网站文章内容。作者在检索了全网教程,对于Flarum支持中文搜索的教程都很复杂。本人比较怕麻烦,再加上数据才迁移到新的服务器上,生怕再出问题,故需要一个简单、稳定的方法,就有了这篇文章。

警告
此方法会在一定程度上影响数据库性能,请明确需求后再进行操作。

需求

让Flarum搜索框,支持搜索中文,方法简单、稳定,实现效果如下:
image-20240210231853277

本文涉及环境情况如下

序号环境名称版本
1Flarum1.8.5
2MYSQL8.2.0

解决方案

警告
本文涉及部分危险操作,有可能会造成数据丢失,请在开始操作前,备份数据库及重要文件!

1.对ngram_token_size进行设置。打开MySQL配置文件mysql.cnf,加入如下内容

[mysqld]
ngram_token_size=2

image-20240211001012211

此步操作详细解释参考下面内容

ngram_token_size进行设置的详情解释。
具体来说:

  • ngram_token_size 是一个配置参数,用于指定 Ngram 全文索引的 token 大小。Ngram 是一种文本分析方法,它将文本分割成一系列的 n-gram(即长度为 n 的字符串序列)。在全文索引中,这种方法特别适用于处理像中文或日文这样的语言,因为这些语言不像英文那样使用空格分隔单词。
  • =2 表明了 ngram 的长度被设置为 2。这意味着系统将在创建全文索引时,将文本分割成长度为 2 个字符的序列。例如,对于中文文本,“中华人民”将被分割为“中华”、“华人”、“人民”这样的序列。

这个设置对于处理中文、日文等语言的全文搜索特别有用,因为它允许数据库更有效地索引和搜索这些语言的文本内容。通过将 ngram_token_size 设置为 2,MySQL 能够更好地理解和索引这些语言的结构,从而提高搜索的准确性和效率。

2.重启MySQL生效配置

3.删除原索引文件

# 如有前缀直接复制本段 0,若没有前缀,请去除flarum_
ALTER TABLE flarum_posts DROP INDEX content;
ALTER TABLE flarum_discussions DROP INDEX title;

image-20240210234951790

  如果出现报错1091 - Can't DROP 'title'; check that column/key exists,原因主要做如下

  • 不存在索引或列
  • 索引或列名有误
  • 权限问题
  • 服务器问题

4.重建新的索引文件

(1)文章内容索引创建

# 如有前缀直接复制本段 0,若没有前缀,请去除flarum_
SELECT * FROM `flarum_posts`;	
CREATE FULLTEXT INDEX content ON flarum_posts (content) WITH PARSER ngram; 

image-20240210235636770
(2)讨论内容索引创建

# 如有前缀直接复制本段 0,若没有前缀,请去除flarum_
SELECT * FROM `flarum_discussions`;	
CREATE FULLTEXT INDEX title ON flarum_discussions (title) WITH PARSER ngram; 

执行截图如下
image-20240210234412389

提示:
SELECT * FROM可以省略

最终效果

image-20240211000342376

文章其他链接:

  • 个人博客:https://www.draper-crypto.top/use/u0003/
  • FORESEESTUDIO论坛:https://foreseestudioblog.top/d/44

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/468020.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

uniapp API文档地址 以及 HBuilder安装

uniapp API文档地址 以及 HBuilder安装 一、进入 当前网站 uni-app 官网 [uni-app](https://zh.uniapp.dcloud.io/quickstart-hx.html)二、点击截图下载文件 三、 进入 当前网站 (https://www.dcloud.io/hbuilderx.html) 浏览器会识别 也可以自行选择…

【STM32 CubeMX】GPIO_HAL库源码分析

文章目录 前言一、GPIO_HAL库源码分析1.1 初始化GPIO1.2 HAL_GPIO_Init源码分析GPIO_InitTypeDef初始化结构体HAL_GPIO_Init函数 总结 前言 提示:这里可以添加本文要记录的大概内容: 例如:随着人工智能的不断发展,机器学习这门技…

MockServer 服务框架设计

大部分现有的 mock 工具只能满足 HTTP 协议下简单业务场景的使用。但是面对一些复杂的业务场景就显得捉襟见肘,比如对 socket 协议的应用进行 mock,或者对于支付接口的失败重试的定制化 mock 场景。 为解决上述问题,霍格沃兹测试学院设计并研…

Day 44 | 动态规划 完全背包、518. 零钱兑换 II 、 377. 组合总和 Ⅳ

完全背包 题目 文章讲解 视频讲解 完全背包和0-1背包的区别在于:物品是否可以重复使用 思路:对于完全背包问题,内层循环的遍历方式应该是从weight[i]开始一直遍历到V,而不是从V到weight[i]。这样可以确保每种物品可以被选择多次…

【机器学习】数据清洗之处理异常点

🎈个人主页:甜美的江 🎉欢迎 👍点赞✍评论⭐收藏 🤗收录专栏:机器学习 🤝希望本文对您有所裨益,如有不足之处,欢迎在评论区提出指正,让我们共同学习、交流进步…

比特币突破5万美元,2年来首次

作者:秦晋 2月13日凌晨,时隔两年,比特币首次突破50000美元关口。最高触及50363美元、24小时涨幅3.53%。创下2021年12月以来的新高。 据《财富》报道,本次上涨得益于三方面,首先是比特币ETF资金流入,比特币E…

Vue3.0(六):VueX 4.x详解

Vuex4状态管理 什么是状态管理 在开发中,我们的应用程序需要处理各种各样的数据,这些数据需要保存在应用程序的某一个位置,对于这些数据的管理,就是 状态管理目前前端项目越来越复杂,多组件共享同一数据的状态很常见…

Microsoft Excel 加载数据分析工具

Microsoft Excel 加载数据分析工具 1. 打开 Excel,文件 -> 选项2. 加载项 -> 转到…3. 分析工具库、分析工具库 - VBA4. 打开 Excel,数据 -> 数据分析References 1. 打开 Excel,文件 -> 选项 2. 加载项 -> 转到… ​​​ 3…

机器学习:卷积介绍及代码实现卷积操作

传统卷积运算是将卷积核以滑动窗口的方式在输入图上滑动,当前窗口内对应元素相乘然后求和得到结果,一个窗口一个结果。相乘然后求和恰好也是向量内积的计算方式,所以可以将每个窗口内的元素拉成向量,通过向量内积进行运算&#xf…

【王道数据结构】【chapter5树与二叉树】【P158t3】

编写后序遍历二叉树的非递归算法 #include <iostream> #include <stack> typedef struct treenode{char data;struct treenode *left;struct treenode *right; }treenode,*ptreenode;ptreenode buytreenode(char x) {ptreenode n(ptreenode) malloc(sizeof (treeno…

基于LLM的业务流程自动化

在当今竞争激烈的商业环境中&#xff0c;业务流程&#xff08;尤其是文档处理工作流程&#xff09;的自动化对于寻求提高效率和减少人工错误的公司来说变得至关重要。 传统方法往往难以跟上任务的数量和复杂性&#xff0c;而人工主导的流程速度缓慢、容易出错&#xff0c;并且可…

C++ //练习 6.30 编译第200页的str_subrange函数,看看你的编译器是如何处理函数中的错误的。

C Primer&#xff08;第5版&#xff09; 练习 6.30 练习 6.30 编译第200页的str_subrange函数&#xff0c;看看你的编译器是如何处理函数中的错误的。 环境&#xff1a;Linux Ubuntu&#xff08;云服务器&#xff09; 工具&#xff1a;vim 代码块 /***********************…