ragflow-ollama 知识库建立测试

news/2025/3/4 9:23:53/文章来源:https://www.cnblogs.com/supermao12/p/18745741

ollama查看模型

C:\Users\DK>ollama show deepseek-r1:7bModelarchitecture        qwen2parameters          7.6Bcontext length      131072embedding length    3584quantization        Q4_K_MParametersstop    "<|begin▁of▁sentence|>"stop    "<|end▁of▁sentence|>"stop    "<|User|>"stop    "<|Assistant|>"LicenseMIT LicenseCopyright (c) 2023 DeepSeekC:\Users\DK>
  1. 架构 (architecture): qwen2
    表示该模型的架构类型是 qwen2,这通常指的是模型所采用的具体神经网络架构设计。不同架构会影响模型的训练效率、推理速度、效果等。
  2. 参数量 (parameters): 7.6B (76亿)
    该模型有约76亿个参数。参数量是衡量一个深度学习模型大小的标准,通常与模型的学习能力、性能有关。参数越多,模型的潜在能力越强,但同时也可能需要更多的计算资源。
  3. 上下文长度 (context length): 131072
    这个参数表示模型能够处理的最大上下文窗口的大小,即在一次推理中能够考虑的最大输入文本长度。这里是131072个token(词元),说明该模型能够处理非常长的文本输入。
  4. 嵌入维度 (embedding length): 3584
    嵌入维度表示每个token或单词在模型内部表示的向量的维度。嵌入维度越高,通常模型能捕捉的语义信息越丰富。这里的值是3584。
  5. 量化方式 (quantization): Q4_K_M
    量化是指对模型权重进行压缩,以减少内存使用并加速推理。在这里使用了 Q4_K_M 量化方案。Q4代表使用4位量化,K和M可能是特定的量化策略细节(如如何映射权重值)。
  6. 停止符号 (stop tokens):
    "<|begin▁of▁sentence|>", "<|end▁of▁sentence|>", "<|User|>", "<|Assistant|>"
    这些是模型用来标记对话开始、结束和区分角色的特殊token。它们帮助模型理解何时开始生成回答,何时结束,以及对话中的哪个部分属于用户,哪个属于助手。
  7. 许可证 (License): MIT License
    该模型遵循MIT开源许可证,意味着你可以自由使用、修改、分发该模型,但需要附带原作者的版权声明和许可证。

主要看嵌入维度与上下文长度,这些对rag的部署很重要

阿里云百炼平台测试


在阿里云上找到key,加入进ragflow
模型有免费额度可以进行对比测试

ragflow安装

1.从github网址clone ragflow的仓库
2.\ragflow-main\ragflow-main\docker 更这个文件下的.env
#RAGFLOW_IMAGE=infiniflow/ragflow:v0.15.0-slim
#
# To download the RAGFlow Docker image with embedding models, uncomment the following line instead:
RAGFLOW_IMAGE=infiniflow/ragflow:v0.16.0
注释silm 打开完整版
3.来到.env文件下docker compose -f docker-compose.yaml up -d


如果使用localhost按登录没反应,换成其他本地的网卡地址

添加模型

ollama则可以用他暴露的局域网地址api
qwen直接用一条apikey就可以

选择全局模型,和embeding,其他默认即可

配置知识库




调用api的效果要优于本地模型

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/892095.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

北大手册第Ⅲ版已公开,带你深度学习DeepSeek-R1推理模型!

北大手册第Ⅲ版已公开,带你深度学习DeepSeek-R1推理模型!随着DeepSeek的全球风靡和广泛应用,智能化的普及步伐显著加快。通过对算法、模型和系统的系统级协同创新,DeepSeek汇聚了众智与众力,创造了许多精彩成果。为了更好的使用DeepSeek-R1大模型,使其能够为我们提供更专…

delphi 协程,全面开启 新的主流开发方式,多线程转向 - 协程开发,跟上主流的步伐

前言 golang依靠 协程 大败 Java,让Java 长时间以来 难以想到方案,至今也没有做出 成熟的 协程模型解决方案,有的人 误解以为 协程 仅仅是开发服务端的人 才会用到,这个完全是误解,协程是一种解决问题的思路转变, 客户端 和 服务端 都可以使用协程来开发,用协程几句代码…

lua符号

__ 注释符号

供应链中的的“四流合一”

供应链的四流就是人们常说的物流、商流、资金流和信息流。这篇文章,我们来学习一下供应链中的“四流合一”到底是什么。在供应链中,物流、资金流、信息流、商流是共同存在的,商流、信息流和资金流的结合将更好的支持和加强供应链上、下游企业之间的货物、服务往来(物流)。…

摆烂重新学markdown

Markdown学习 首先呢,博客园呢,右边的编辑器是可以选择Markdown编辑文章的,刚刚百度百科查到的 然后呢,预览可以看看你写的文章能呈现出来的效果 再然后呢,ctrl+s可以保存,写一点保存一点吧 好的,那就开始摆烂写垃圾吧 1.大标题怎么写呢? 大标题===#+空格+内容文字 2.2级标题怎…

[2025.3.1 JavaWeb学习]Maven高级

分模块设计将不同的功能块分开开发设计,而后只需要引入依赖即可使用继承与聚合 继承

Deepseek开源啦,R1模型可以部署本地使用,完全免费还能断网使用,感兴趣的朋友可以尝试一下

下载Ollama 下载地址:https://ollama.com/ 下载后根据显卡性能选择对应大小的R1模型,额...我的是1.5b 终端/cmd,执行命令,本地运行模型 ollama run deepseek-r1:1.5b 可使用2种办法快捷使用配合VS cord插件Continue使用 安装插件后Add Chat model,选择本地模型 这时候就可以…

【硬件测试】基于FPGA的256QAM基带通信系统开发与硬件片内测试,包含信道模块,误码统计模块,可设置SNR

1.算法仿真效果 本文是之前写的文章:《基于FPGA的256QAM基带通信系统,包含testbench,高斯信道模块,误码率统计模块,可以设置不同SNR》的硬件测试版本。在系统在仿真版本基础上增加了ila在线数据采集模块,vio在线SNR设置模块,数据源模块。硬件ila测试结果如下:(完整代码运行…

V90通过工艺对象在1200上的使用

配置CU参数打开V-Assistant,新建工程选择驱动选择电机型号选择控制模式V90伺服定位控制方式分为两种,一种是通过工艺对象,另外一种是通过EPOS标准块: a.如果选用工艺对象控制伺服电机,控制模式选用速度控制。报文选用标准报文3. b.如果选用EPOS标准块控制伺服电机,控制模式…

昆明理工大学25年冶金工程考研预计调剂145人

--冶金工程考研809冶金物理化学有色冶金学有色金属冶金冶金过程及设备F002钢铁冶金学

VSG虚拟同步发电机simulink建模与仿真

1.课题概述VSG虚拟同步发电机simulink建模与仿真,虚拟同步发电机(Virtual Synchronous Generator, VSG)技术是电力电子领域的一项重要创新,特别在可再生能源接入电网的应用中展现出巨大潜力。VSG通过先进的控制策略,使逆变器控制的电源系统(如光伏、风能系统)表现出与传…