ragflow-ollama 知识库建立测试-编程知识

ragflow-ollama 知识库建立测试

news/2025/3/4 9:23:53/文章来源:https://www.cnblogs.com/supermao12/p/18745741

ollama查看模型

C:\Users\DK>ollama show deepseek-r1:7bModelarchitecture        qwen2parameters          7.6Bcontext length      131072embedding length    3584quantization        Q4_K_MParametersstop    "<｜begin▁of▁sentence｜>"stop    "<｜end▁of▁sentence｜>"stop    "<｜User｜>"stop    "<｜Assistant｜>"LicenseMIT LicenseCopyright (c) 2023 DeepSeekC:\Users\DK>

架构 (architecture): qwen2
表示该模型的架构类型是 qwen2，这通常指的是模型所采用的具体神经网络架构设计。不同架构会影响模型的训练效率、推理速度、效果等。
参数量 (parameters): 7.6B (76亿)
该模型有约76亿个参数。参数量是衡量一个深度学习模型大小的标准，通常与模型的学习能力、性能有关。参数越多，模型的潜在能力越强，但同时也可能需要更多的计算资源。
上下文长度 (context length): 131072
这个参数表示模型能够处理的最大上下文窗口的大小，即在一次推理中能够考虑的最大输入文本长度。这里是131072个token（词元），说明该模型能够处理非常长的文本输入。
嵌入维度 (embedding length): 3584
嵌入维度表示每个token或单词在模型内部表示的向量的维度。嵌入维度越高，通常模型能捕捉的语义信息越丰富。这里的值是3584。
量化方式 (quantization): Q4_K_M
量化是指对模型权重进行压缩，以减少内存使用并加速推理。在这里使用了 Q4_K_M 量化方案。Q4代表使用4位量化，K和M可能是特定的量化策略细节（如如何映射权重值）。
停止符号 (stop tokens):
"<｜begin▁of▁sentence｜>", "<｜end▁of▁sentence｜>", "<｜User｜>", "<｜Assistant｜>"
这些是模型用来标记对话开始、结束和区分角色的特殊token。它们帮助模型理解何时开始生成回答，何时结束，以及对话中的哪个部分属于用户，哪个属于助手。
许可证 (License): MIT License
该模型遵循MIT开源许可证，意味着你可以自由使用、修改、分发该模型，但需要附带原作者的版权声明和许可证。

主要看嵌入维度与上下文长度，这些对rag的部署很重要

阿里云百炼平台测试

在阿里云上找到key，加入进ragflow
模型有免费额度可以进行对比测试

ragflow安装

1.从github网址clone ragflow的仓库
2.\ragflow-main\ragflow-main\docker 更这个文件下的.env
#RAGFLOW_IMAGE=infiniflow/ragflow:v0.15.0-slim
#
# To download the RAGFlow Docker image with embedding models, uncomment the following line instead:
RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0
注释silm 打开完整版
3.来到.env文件下docker compose -f docker-compose.yaml up -d

如果使用localhost按登录没反应，换成其他本地的网卡地址

添加模型

ollama则可以用他暴露的局域网地址api
qwen直接用一条apikey就可以

选择全局模型，和embeding，其他默认即可

配置知识库

调用api的效果要优于本地模型

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/892095.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

北大手册第Ⅲ版已公开，带你深度学习DeepSeek-R1推理模型！

北大手册第Ⅲ版已公开，带你深度学习DeepSeek-R1推理模型！随着DeepSeek的全球风靡和广泛应用，智能化的普及步伐显著加快。通过对算法、模型和系统的系统级协同创新，DeepSeek汇聚了众智与众力，创造了许多精彩成果。为了更好的使用DeepSeek-R1大模型，使其能够为我们提供更专…

delphi 协程，全面开启新的主流开发方式，多线程转向 - 协程开发，跟上主流的步伐

前言 golang依靠协程大败 Java，让Java 长时间以来难以想到方案，至今也没有做出成熟的协程模型解决方案，有的人误解以为协程仅仅是开发服务端的人才会用到，这个完全是误解，协程是一种解决问题的思路转变，客户端和服务端都可以使用协程来开发，用协程几句代码…

lua符号

__ 注释符号

供应链中的的“四流合一”

供应链的四流就是人们常说的物流、商流、资金流和信息流。这篇文章，我们来学习一下供应链中的“四流合一”到底是什么。在供应链中，物流、资金流、信息流、商流是共同存在的，商流、信息流和资金流的结合将更好的支持和加强供应链上、下游企业之间的货物、服务往来（物流）。…

摆烂重新学markdown

Markdown学习首先呢,博客园呢,右边的编辑器是可以选择Markdown编辑文章的,刚刚百度百科查到的然后呢,预览可以看看你写的文章能呈现出来的效果再然后呢,ctrl+s可以保存,写一点保存一点吧好的,那就开始摆烂写垃圾吧 1.大标题怎么写呢? 大标题===#+空格+内容文字 2.2级标题怎…

[2025.3.1 JavaWeb学习]Maven高级

分模块设计将不同的功能块分开开发设计，而后只需要引入依赖即可使用继承与聚合继承

关于阶段性JavaWeb学习总结

Deepseek开源啦，R1模型可以部署本地使用，完全免费还能断网使用，感兴趣的朋友可以尝试一下

下载Ollama 下载地址：https://ollama.com/ 下载后根据显卡性能选择对应大小的R1模型,额...我的是1.5b 终端/cmd，执行命令，本地运行模型 ollama run deepseek-r1:1.5b 可使用2种办法快捷使用配合VS cord插件Continue使用安装插件后Add Chat model，选择本地模型这时候就可以…

【硬件测试】基于FPGA的256QAM基带通信系统开发与硬件片内测试,包含信道模块,误码统计模块,可设置SNR

1.算法仿真效果本文是之前写的文章:《基于FPGA的256QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR》的硬件测试版本。在系统在仿真版本基础上增加了ila在线数据采集模块，vio在线SNR设置模块，数据源模块。硬件ila测试结果如下：（完整代码运行…

V90通过工艺对象在1200上的使用

配置CU参数打开V-Assistant,新建工程选择驱动选择电机型号选择控制模式V90伺服定位控制方式分为两种，一种是通过工艺对象，另外一种是通过EPOS标准块: a.如果选用工艺对象控制伺服电机，控制模式选用速度控制。报文选用标准报文3. b.如果选用EPOS标准块控制伺服电机，控制模式…

昆明理工大学25年冶金工程考研预计调剂145人

--冶金工程考研809冶金物理化学有色冶金学有色金属冶金冶金过程及设备F002钢铁冶金学

VSG虚拟同步发电机simulink建模与仿真

1.课题概述VSG虚拟同步发电机simulink建模与仿真，虚拟同步发电机（Virtual Synchronous Generator, VSG）技术是电力电子领域的一项重要创新，特别在可再生能源接入电网的应用中展现出巨大潜力。VSG通过先进的控制策略，使逆变器控制的电源系统（如光伏、风能系统）表现出与传…