opensearch基础知识

news/2024/11/28 16:19:04/文章来源:https://www.cnblogs.com/MapleDream/p/18574485

opensearch基础

  1. Cluster

    • Contains one or more nodes
    • Managed by a master node
  2. Node

    • Single server part of a cluster
    • Types: Master-eligible, data, ingest, etc.
  3. Index

    • Collection of documents with similar characteristics
    • Managed by shards
  4. Shard(分片):

    OpenSearch 索引中的数据可以增长到巨大的比例。为了保持其可管理性,它被拆分为多个分片。每个 OpenSearch 分片都是一个 Apache Lucene 索引,每个单独的 Lucene 索引都包含 OpenSearch 索引中文档的子集。以这种方式拆分索引可以控制资源使用。Apache Lucene 索引的文档数量限制为 2,147,483,519 个。

    • Single Lucene instance
    • Holds part of an index's data
    • Types: Primary and replica
  5. Document

    • Basic unit of information
    • Expressed in JSON format
  6. Field

    • Smallest individual unit of data in a document
    • Has a defined datatype
  7. Mapping

    • Defines how a document and its fields are stored and indexed (定义文档及其字段的存储和索引方式)
  8. Segment (段)

    • An inverted index (倒排索引)
    • Created when a new document is indexed (在为新文档编制索引时创建)
    • Merged into larger segments over time

如果安装的opensearch是集群,那么每个node节点都需要安装插件

opensearch安装分词插件

#进入docker容器
docker exec -it opensearch-node1 bash
  1. 安装opensearch提供的分词插件(analysis-smartcn)

    #进入容器后,执行以下命令
    bin/opensearch-plugin install analysis-smartcn
    
  2. 通过压缩包安装插件

    #file:///opensearch-analysis-ik.zip 为压缩文件在容器中的位置
    bin/opensearch-plugin install file:///opensearch-analysis-ik.zip
    

安装IK分词器启动opensearch服务的报错:

  1. NoClassDefFoundError: org/apache/commons/logging/LogFactory

    #缺少jar包,下载commons-logging-1.2.jar后复制到对应的目录(opensearch-node1为容器的名称)
    docker cp /data/openSearch/commons-logging-1.2.jar opensearch-node1:/usr/share/opensearch/plugins/opensearch-analysis-ik
    
  2. 分词插入数据时报错空指针 org.wltea.analyzer.dic.Dictionary.singleton._StopWords;

    #进入docker容器
    docker exec -it opensearch-node1 bash
    #查看/usr/share/opensearch/plugins/opensearch-analysis-ik/config是否存在,如果不存在的话
    cd /usr/share/opensearch/plugins/opensearch-analysis-ik
    mkdir config
    chmod 755
    #将opensearch-analysis-ik目录下的所有文件复制到config目录
    cp -r /usr/share/opensearch/config/opensearch-analysis-ik/* /usr/share/opensearch/plugins/opensearch-analysis-ik/config
    
  3. #本地通过 find 命令查找文件
    find / -name "sonar-pmd-plugin-2.6.jar"
    

其他操作:

#本地通过 find 命令查找文件
find / -name "sonar-pmd-plugin-2.6.jar"
#修改IKAnalyzer.cfg.xml来设置自定义分词
docker cp /data/openSearch/IKAnalyzer.cfg.xml opensearch-node1:/usr/share/opensearch/plugins/opensearch-analysis-ik/config

opensarch集群的docker-compose文件:

version: '3'
services:opensearch-node1:image: opensearchproject/opensearch:latestcontainer_name: opensearch-node1environment:- cluster.name=opensearch-cluster # Name the cluster- node.name=opensearch-node1 # Name the node that will run in this container- discovery.seed_hosts=opensearch-node1,opensearch-node2 # Nodes to look for when discovering the cluster- cluster.initial_cluster_manager_nodes=opensearch-node1,opensearch-node2 # Nodes eligibile to serve as cluster manager- bootstrap.memory_lock=true # Disable JVM heap memory swapping- "OPENSEARCH_JAVA_OPTS=-Xms512m -Xmx512m" # Set min and max JVM heap sizes to at least 50% of system RAM- "DISABLE_INSTALL_DEMO_CONFIG=true" # Prevents execution of bundled demo script which installs demo certificates and security configurations to OpenSearch- "DISABLE_SECURITY_PLUGIN=true" # Disables Security pluginulimits:memlock:soft: -1 # Set memlock to unlimited (no soft or hard limit)hard: -1nofile:soft: 65536 # Maximum number of open files for the opensearch user - set to at least 65536hard: 65536volumes:- opensearch-data1:/usr/share/opensearch/data # Creates volume called opensearch-data1 and mounts it to the containerports:- 9200:9200 # REST API- 9300:9300 # TCP API- 9600:9600 # Performance Analyzernetworks:- opensearch-net # All of the containers will join the same Docker bridge networkopensearch-node2:image: opensearchproject/opensearch:latestcontainer_name: opensearch-node2environment:- cluster.name=opensearch-cluster # Name the cluster- node.name=opensearch-node2 # Name the node that will run in this container- discovery.seed_hosts=opensearch-node1,opensearch-node2 # Nodes to look for when discovering the cluster- cluster.initial_cluster_manager_nodes=opensearch-node1,opensearch-node2 # Nodes eligibile to serve as cluster manager- bootstrap.memory_lock=true # Disable JVM heap memory swapping- "OPENSEARCH_JAVA_OPTS=-Xms512m -Xmx512m" # Set min and max JVM heap sizes to at least 50% of system RAM- "DISABLE_INSTALL_DEMO_CONFIG=true" # Prevents execution of bundled demo script which installs demo certificates and security configurations to OpenSearch- "DISABLE_SECURITY_PLUGIN=true" # Disables Security pluginulimits:memlock:soft: -1 # Set memlock to unlimited (no soft or hard limit)hard: -1nofile:soft: 65536 # Maximum number of open files for the opensearch user - set to at least 65536hard: 65536volumes:- opensearch-data2:/usr/share/opensearch/data # Creates volume called opensearch-data2 and mounts it to the containernetworks:- opensearch-net # All of the containers will join the same Docker bridge networkopensearch-dashboards:image: opensearchproject/opensearch-dashboards:latestcontainer_name: opensearch-dashboardsports:- 5601:5601 # Map host port 5601 to container port 5601expose:- "5601" # Expose port 5601 for web access to OpenSearch Dashboardsenvironment:- 'OPENSEARCH_HOSTS=["http://opensearch-node1:9200","http://opensearch-node2:9200"]'- "DISABLE_SECURITY_DASHBOARDS_PLUGIN=true" # disables security dashboards plugin in OpenSearch Dashboardsnetworks:- opensearch-netvolumes:opensearch-data1:opensearch-data2:networks:opensearch-net:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/842936.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

半导体制造领域中的粒子缺陷(Particle Defect)

随着半导体技术的进步,制造过程中的质量控制已成为提高半导体器件性能和可靠性的核心。粒子缺陷不仅会显著降低器件的电气性能,例如导致电路短路或开路等故障,而且对器件的长期可靠性产生严重影响,从而增加了器件性能退化和失效的可能性。 Part1 引 言 半导体制造行业是现…

DSPf28335-GPIO

GPIO(通用输入输出端口 general purpose intput output) DSP TMS320F28335一共176个引脚。包括:电源引脚、晶振引脚、复位引脚、下载引脚、BOOT引脚、GPIO引脚。 除了上述的5类引脚外的GPIO引脚一共88个,88个GPIO引脚又分为A、B、C三类。 A类为0~31; B类为32~63; C类为64…

iOS手机免越狱群控系统:实现同步投屏与多设备管理的新工具

免越狱群控系统概述 免越狱群控系统是一种基于苹果官方接口和网络通信技术的电脑端软件,通过合法合规的方式接入并操控多台iOS设备。该系统无需对iOS设备进行越狱,即可实现集中化、自动化控制。其核心功能包括:同步投屏:实时查看和控制多台iOS设备的屏幕。 批量操作:一键执…

NeRF学习笔记

NeRF 学习笔记参考资料十分钟带你快速入门NeRF原理_哔哩哔哩_bilibili 任务概述网络结构:输入 1. 采样点位置数据集是五维数据。theta phi决定了射线的方向,xyz是相机位置。 但是感觉x,y,z,theta phi为什么不直接用xyz表示?感觉剩下两个信息是冗余的。因为可能和射线有关,所…

考研打卡(29)

开局(29) 开始时间 2024-11-28 14:45:31 结束时间 2024-11-28 15:17:32 明天是1125今天去学冠领了几份资料数据结构具有5层节点的AVL树至少有_______个节点。(南昌大学 2015年) A 10 B 12 C 15 D 17B 答案设Nh表示深度为h的平衡二叉树中含有的最少节点数…

解决水库安全监测难题 长期无外接电源 低功耗设备智能化监测系统

解决水库安全监测难题 长期无外接电源 低功耗设备智能化监测系统国内某水库安全监测项目需要监测点分散,且无外接供电。项目年限为4年,不允许使用太阳能电板。因此,我们需要设备具备低功耗且内置电池的功能。为了满足客户的要求,我们的研发团队将采集仪从NLM511T升级到电池…

Android11修改摄像头前后置方法,触觉智能RK3568开发板演示

RK3566/3568安卓Android11系统下,修改摄像头前后置的方法,触觉智能EVB3568开发板演示本文介绍在Android11系统下,修改摄像头前后置属性的方法。使用触觉智能EVB3568鸿蒙开发板演示,搭载瑞芯微RK3568,四核A55处理器,主频2.0Ghz,1T算力NPU;支持OpenHarmony5.0及Linux、An…

70%效率提升:开源AI技术在医疗用药咨询中的应用

一、系统概述 在医疗行业中,信息的准确性和实时性至关重要。我们的开源免费软件——思通数科AI多模态能力平台,通过集成先进的语音识别(ASR)技术,为医疗行业提供了一个全新的解决方案。该平台不仅能够理解多人对话中的语音指令,还能提供精准的药物咨询和用药指导,极大地…

Symbolic Discovery of Optimization Algorithms

目录概Lion代码Chen X., Liang C., Huang D., Real E., Wang K., Liu Y., Pham H., Dong X., Luong T., Hsieh C., Lu Y. and Le Q. V. Symbolic discovery of optimization algorithms. NeurIPS, 2024.概 本文搜索出了一个优雅的, 且经验上似乎更好的优化器: Lion. Lion作者通…

RAG实验:块大小分割实验、矢量存储;FAISS 与 Chroma、向量存储和 Top k、向量存储中的距离度量

比较 RAG 第 1 部分:块大小分割实验我探索了 RAG 模型中的各种块大小,并使用专为评估检索器组件而设计的 RAGAS 评估器对其进行了评估。如您所知,检索器部分会生成随后输入到语言模型 (LLM) 中的“上下文”。 在这个实验中,我采用了BGE作为嵌入技术(它在 HuggingFace 的排…

ssh登录出现sign_and_send_pubkey: no mutual signature supported

加上-o PubkeyAcceptedKeyTypes=+ssh-rsa 例如:ssh -i key.txt stinky@172.16.1.143 -o PubkeyAcceptedKeyTypes=+ssh-rsa

win小工具合集(持续更新)

日常、工作使用的win小工具推荐 一、Snipaste(截屏)安静的躺在后台,随时随地F1光速截屏和编辑,贴图也OK。 二、Ditto(剪贴板)安静的躺在后台,随时随地Ctrl + ~查看和粘贴曾经复制过的内容(包括图片),且支持搜索,再也不用频繁Ctrl + c了。 三、PotPlayer(音视频播放…