04、全文检索 -- Solr -- 管理 Solr 的 core(使用命令和图形界面创建、删除 core,以及对core 目录下的各文件进行详细介绍)

目录

  • 管理 Solr 的 core
    • 创建 Core
      • 方式1:solr 命令创建
        • 演示:使用 solr 命令创建 Core:
        • 演示:命令删除 Core(彻底删除)
      • 方式2:图形界面创建
        • Web控制台创建Core
        • Web控制台删除 Core(未彻底删除)
          • 重新加回刚刚删除的core
    • Core 目录下的文件介绍:
      • 创建的 core 对应的目录下的文件:
      • Core 目录的 conf 子目录下的文件:
        • managed-schema
        • solrconfig.xml
        • protwords.txt
        • stopword.txt
        • synonyms.txt

管理 Solr 的 core

管理 Solr 的 core,类似于管理传统的关系型数据库里面的表。
演示怎么创建core、怎么删除core


学习之前需要先启动 Solr

执行如下命令即可启动Solr:

solr start -p <端口>

如果不指定端口,Solr 默认的端口是8983

直接输入 solr start 启动就可以了;

显示:在8983端口上启动Solr服务器,等待长达30分钟。寻找快乐!

在这里插入图片描述



创建 Core


Solr 使用 Core 保存索引文档,Solr 的 Core 有点类似于 RDBMS 的表。
因此,在正式使用Solr之前,必须先创建Core。


Solr 提供了两种方式来创建 Core:

方式1:使用 solr 命令的 create_core子命令(或用 create子命令也行)创建Core。

Solr所支持的子命令:
create:根据Solr的运行状态选择创建Core或Collection;如果Solr以单机方式运行,该命令创建core;若Solr以云模式运行,该命令创建Collection。

方式2:通过图形界面创建Core。



方式1:solr 命令创建

演示:使用 solr 命令创建 Core:

solr create_core -c ljhCore -d sample_techproducts_configs-c: 指定所创建Core的名字。
-d:指定所创建Core以哪个目录为模板。以 E:\install\Solr\solr-8.11.2\server\solr\configsets 目录下的子目录作为配置模板。

演示:

1、先把 security.json 这个配置文件的这个 blockUnknown 属性改为 false ,就是对未知的用户,先不阻塞,可以访问图形管理界面。不然得话,用上面那个命令创建 Core 就会失败。

在这里插入图片描述

如图:重启之后,可以不用登录,就可以访问这个web图形控制平台。

在这里插入图片描述

接下来就输入这个命令来创建core

solr create_core -c ljhCore -d sample_techproducts_configs

可以看到,成功创建一个叫 ljhCore 的 core

在这里插入图片描述


可以看到,创建的 ljhCore 就放在这里
新创建得到的Core保存在: E:\install\Solr\solr-8.11.2\server\solr

在这里插入图片描述

- d: 的解释:

自己的话解释 -d sample_techproducts_configs :

简单来说,我创建这个 ljhCore 这个core,也就是逻辑索引库,也叫反向逻辑库,
在通过这个cord 进行全文检索的时候,需要用到各种 solr 的配置文件,而需要用到的这些配置文件,在 _default 和 sample_techproducts_configs 这两个文件夹里面都存在,区别就是 sample_techproducts_configs 文件夹里面的配置文件比_default 文件夹里面的配置文件更多更完善。
所以在创建 ljhCore 这个core 时,就指定了 -d sample_techproducts_configs 这个文件夹,表示到时候这个core需要用到的配置文件,就去这个文件夹里面获取就可以了。


详细解释:

使用 create core 创建 Core 时,需要使用 -d 选项指定配置文件目录。正如前面所言,
Solr 使用 Core 保存索引文档,因此在每个 Core 中都需要配置唯一标识、字段类型、字段、停用词等大量与索引库相关的信息,
这些配置信息需要分别提供各种不同的配置文件。所以Solr 允许通过 -d 选项指定到哪个目录去找配置文件。通俗地说,Solr  每次创建 Core 时都需要大量的配置文件,而 -d 选项就用于指定这些配置模板所在的路径;
如果不指定 -d 选项,Solr 将默认为该选项使用 _defaut 值,
也就是使用 server\solr\confgsets 路径下 _default 目录下的配置文件作为配置模板。
但不推荐将_default 目录下的配置文件作为产品级的 Core 来使用。在 serversolr\confgsets 路径下还提供了一个 sample_techproducts_confgs 目录,
该目录下的配置文件可作为产品级的 Core 来使用,因此推荐使用该目录作为 Core 配置文件的目录。

在这里插入图片描述



演示:命令删除 Core(彻底删除)

命令格式:

solr delete [-c Core名称] [-p 端口]

使用solr命令的create_core子命令创建Core时或delete子命令删除Core时,没有提供选项指定用户名和密码,因此需要先将前面security.json文件中blockUnknown属性设为false,它表示关闭Solr的用户验证功能。

在这里插入图片描述


演示:

端口如果不指定,那么就会使用默认的8983端口
输入这个命令来删除刚刚创建的 core

solr delete -c ljhCore 

删除 core 成功

在这里插入图片描述

刚刚创建的 ljhCore 对应的文件夹目录也看不到,这是彻底删除

在这里插入图片描述



方式2:图形界面创建


Web控制台创建Core

(1)在server\solr路径下创建一个 ljhcore 目录——该目录就是要创建的 Core 所在的目录。

在这里插入图片描述

(2)将server\solr\configsets\sample_techproducts_configs 目录内 conf 整个目录(配置文件模板)
复制到第一步创建的 ljhcore 目录中。
(注意:通过这种方式创建Core时,它不会自动生成配置文件,所以需要手动把配置文件复制过来)

在这里插入图片描述


(3)在Web控制台填写 Core 的 name 和 directory 后,然后单击“Add Core”按钮创建Core

——通过这种方式创建Core时,无需关闭 blockUnknown 选项。

在这里插入图片描述

如图:创建 core 成功

在这里插入图片描述

如图,再看文件夹目录,多出了这些,表示初始化成功。
在这里插入图片描述

小提示:name 可以随便写,但是实例的目录要对应好

在这里插入图片描述

这个 dataDir 这里,名字也可以自己起,我也可以写成 mydata 之类的。
在这里插入图片描述


如果不在文件夹先创建core的目录和添加配置文件(conf文件夹),直接在控制台创建,是创建失败的,如图:
我直接创建个aaa,没有在 solr-8.11.2\server\solr 路径下先提前创建 core 的目录和添加配置文件,所以创建失败。
失败原因如图:
在这里插入图片描述

再看下文件夹目录:solr 会自动创建一个 aaa 文件夹,但是里面是空的。

在这里插入图片描述



Web控制台删除 Core(未彻底删除)

在Web控制台先选中指定 Core,然后单击该界面上“Unload”按钮即可删除被选中Core。

通过图形界面删除 Core 时,其本质只是卸载。

如图:点击后确认删除

在这里插入图片描述

可以看到 core 被成功删除

在这里插入图片描述

如图:在图形界面删除的core,其实并未彻底删除,一些配置文件还在。
data 文件夹里面是空的。

在这里插入图片描述


Web控制台删除Core 与 命令行界面 删除Core的区别:

用“solr delete”命令删除Core时,它会把整个Core对应的目录都彻底删除;

当通过图形界面删除 Core 时,它只是将该 Core 从 Solr 系统里删除,并未删除该 Core 对应的目录,因此以后还可重新添加回来。



重新加回刚刚删除的core

把 data 文件删除掉

在这里插入图片描述


name 我这里随便写写试试看,但是实例的文件夹目录要对应好

在这里插入图片描述

重新加回这个core 成功

在这里插入图片描述

可以看到这些配置文件都重新加回来了,
删除的时候data文件夹是空的,现在加回来了

在这里插入图片描述



如果 abc 这个core 的名字不好听,要重新改的话,那么就在图形界面把这个core删除,重新加回来的时候改个名字就可以了

在这里插入图片描述



Core 目录下的文件介绍:


创建的 core 对应的目录下的文件:

- conf:该目录存储该Core的配置信息。
- data(可重命名):保存该Core的索引信息
- core.properties:保存了该Core的名称、dataDir 指定了 core 的索引数据的存储目录。还指定了该core的 schema 配置文件和 config 配置文件。

在这里插入图片描述



Core 目录的 conf 子目录下的文件:


在Core目录的conf子目录下可看到如下常见配置文件:
managed-schema
managed-schema(就是以前的schema.xml):定义该Core的整体Schema,包括该Core包括哪些Field类型、哪些Field约束、哪些Field、哪些动态Field、哪些Copy Field。该文件以前的文件名是schema.xml、用户可通过文本编辑器直接编辑它,现在则推荐使用图形界面编辑,这样更安全、有效。

在这里插入图片描述

solrconfig.xml
solrconfig.xml:该 Core 的索引库相关配置。

在这里插入图片描述


protwords.txt
protwords.txt:配置该 Core 额外的保护词。所谓保护词就是停止对该词的 “词干化”,在正常词干化的处理方式下,managing、managed、manageable 这些单词最终都会变成 manage。如果不希望某个单词被词干化,就将该单词添加到此文件中。保存所有的保护词列表。

如图:基本上没有加任何的保护词。

在这里插入图片描述

在这里插入图片描述

stopword.txt
stopword.txt:配置该 Core 额外的停用词,Lucene 不会对停用词创建反向索引库,因此程序也不能对停用词执行搜索。保存所有的停用词列表。      

停用词:比如这句 “ 好吃的鸡腿 ”,这里的 “的” 字就属于停用词,
因为我们如果进行检索的话,只会去检索“好吃”,“好吃的”,“鸡腿”,并不会单独去检索这个 “的” 字,因为没有意义 。
所以 Lucene 不会对 停用词 创建反向索引库

在这里插入图片描述

如果我在这里添加 “帅气” 这个词作为停用词,那么 lucene 就不会为这个 “帅气” 创建反向索引库,那么我们在进行全文检索的时候,通过“帅气”这个词来查找时,耗费的时间就会比较长。

在这里插入图片描述


synonyms.txt
synonyms.txt:用于配置该Core的所有同义词。保存了所有的同义词列表。

在这里插入图片描述

比如: color => colour

color 是美式英语的写法; colour 是英式英语的写法;
但是它们表示的意义都是 “颜色”

当我把 color => colour 添加到 synonyms.txt 这个保存同义词列表的配置文件里面,
那么如果一篇文章里面出现了color 和 colour 这两个词,当我们在查找 color 的时候,这个 colour 也应该被查找出来,反之也是。

把 color => colour 添加到 synonyms.txt,相当于把 color 和 colour 当成同一个词。

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/449382.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

python使用fabric库

目录 一&#xff1a;介绍 二&#xff1a;远程命令执行 三&#xff1a;文件上传&#xff0c;下载 四&#xff1a;执行多台服务器命令 一&#xff1a;介绍 Fabric是一个Python库&#xff0c;用于简化SSH连接和自动化任务。它提供了一个简单的API来执行远程命令、上传和下载文…

软件工程(最简式总结)

目录 第一章:概述 1.软件危机的表现原因 2.常见的软件开发方法包括&#xff1a; 3.软件工程基本原则 4.软件工程三要素 5.设计模式的分类 6.针对变换型数据流设计步骤 7.针对事务型数据流设计步骤 第二章&#xff1a;软件过程 1.软件生命周期 2.软件过程模型 &…

【牛B得一塌糊涂】窗口归一化技术,改进医学图像的分布外泛化能力

窗口归一化技术&#xff0c;改进医学图像的分布外泛化能力 提出背景WIN、WIN-WIN、无参数归一化、特征级别数据增强如何提升分布外的泛化&#xff1f; 总结子问题1: 医学图像中的局部特征表示不足子问题2: 训练数据与新场景数据分布不一致子问题3: 模型在分布外数据上泛化能力不…

链表——C语言——day17

链表 链表是一种常见的重要的数据结构。它是动态地进行存储分配的一种结构。在用数组存放数据时&#xff0c;必须事先定义固定的长度&#xff08;即元素个数&#xff09;。链表则没有这种缺点&#xff0c;它根据需要开辟内存单元。 链表有一个“头指针“变量&#xff0c;图中…

docker exec命令流程

背景 在使用docker时&#xff0c;我们经常会使用docker的很多命令&#xff0c;比如docker exec等创建容器并执行命令&#xff0c;那么你知道这条命令背后的原理吗&#xff0c;本文就来解析下这条命令大致的执行流程图 docker exec命令 首先我们按照启动docker之后&#xff0…

集合的总结与复习

集合总结 1.1 什么是集合 集合可以看做是一个对象容器&#xff0c;可以存储很多个对象&#xff0c;管理多个对象及操作比较方便 1.2 集合与数组的区别 长度区别: 数组的长度是固定的而集合的长度是可变的&#xff1b; 存储数据类型的区别: 数组可以存储基本数据类型,也可以…

百无聊赖之JavaEE从入门到放弃(十八)其他常用类

目录 一.Math 类 二.Random 类 三.File类 四.枚举 一.Math 类 java.lang.Math 提供了一系列静态方法用于科学计算&#xff1b;常用方法如下&#xff1a; abs 绝对值 acos,asin,atan,cos,sin,tan 三角函数 sqrt 平方根 pow(double a, double b) a 的 b 次幂 max(double a,…

大数据分析|设计大数据分析的三个阶段

文献来源&#xff1a;Saggi M K, Jain S. A survey towards an integration of big data analytics to big insights for value-creation[J]. Information Processing & Management, 2018, 54(5): 758-790. 下载链接&#xff1a;链接&#xff1a;https://pan.baidu.com/s/1…

C++ pair+map+set+multimap+multiset+AVL树+红黑树(深度剖析)

文章目录 1. 前言2. 关联式容器3. pair——键值对4. 树形结构的关联式容器4.1 set4.1.1 set 的介绍4.1.2 set 的使用 4.2 map4.2.1 map 的介绍4.2.2 map 的使用 4.3 multiset4.3.1 multiset 的介绍4.3.2 multiset 的使用 4.4 multimap4.4.1 multimap 的介绍4.4.2 multimap 的使…

java处理ppt方案详解

需求 需要系统中展示的ppt案例有一个动态展示的效果&#xff0c;也就是要有动画的交互&#xff0c;要求支持浏览器直接打开预览 背景 目前已经实现了前端上传pptx文件&#xff0c;后端解析为png的图片&#xff0c;前端掉接口返回对应的图片&#xff0c;模拟播放ppt的效果 各种尝…

今天又接到了一个离谱的DEBUG订单

一、BUG程序 #include <iostream> #include <string>class Rectangle { private:int width;int height;public:Rectangle(int w, int h) {width w;height h;}void setWidth(int w) {width w;}void setHeight(int h) {height h;}int getArea() {return width *…

大数据应用开发3-Scala笔记1

一、编程框架 Scala语言是在JVM上运行的&#xff0c;兼容Java语法 区分大小写 - Scala是大小写敏感的&#xff0c;这意味着标识Hello 和 hello在Scala中会有不同的含义。 类名 - 对于所有的类名的第一个字母要大写。 如果需要使用几个单词来构成一个类的名称&#xff0c;每个…