自己搭建专属AI:Llama大模型私有化部署

news/2025/3/9 22:50:07/文章来源:https://www.cnblogs.com/hetianlab/p/18619633

前言

AI新时代,提高了生产力且能帮助用户快速解答问题,现在用的比较多的是Openai、Claude,为了保证个人隐私数据,所以尝试本地(Mac M3)搭建Llama模型进行沟通。

Gpt4all

安装比较简单,根据 https://github.com/nomic-ai/gpt4all 下载客户端软件即可,打开是这样的:

然后选择并下载模型文件,这里以Llama为例:

下载模型文件完,选择模型文件则可以进行对话了:

也可以利用基于 nomic-embed-text嵌入模型,把文档转成向量方便语义检索和匹配。选择文档所在的目录:

然后对话中选择对应的文档即可:

如果文件太大,需要在设置适当添加token大小,太大也不好,处理会慢且机器会卡死:

gpt4all使用起来还是比较方便的,但是有几个缺点:有些能在huggingface.co搜到的模型在gpt4all上面搜不到、退出应用后聊天记录会消失。

【----帮助网安学习,以下所有学习资料免费领!加vx:dctintin,备注 “博客园” 获取!】

 ① 网安学习成长路径思维导图
 ② 60+网安经典常用工具包
 ③ 100+SRC漏洞分析报告
 ④ 150+网安攻防实战技术电子书
 ⑤ 最权威CISSP 认证考试指南+题库
 ⑥ 超1800页CTF实战技巧手册
 ⑦ 最新网安大厂面试题合集(含答案)
 ⑧ APP客户端安全检测指南(安卓+IOS)

Ollama

安装也很方便,下载 https://ollama.com/download/Ollama-darwin.zip ,然后运行如下命令即可启动Llama:

ollama run llama3.2

为了方便图形化使用,可以借助 https://github.com/open-webui/open-webui 完整图形化的使用,启动也很简单,直接使用官方仓库中的命令即可:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

然后访问本地的3000端口即可:

open-webui的原理也比较简单,Ollama启动后会在本地监听11434端口,open-webui也是利用这个端口来和Ollama通信完成的图形化使用。open-webui还可以多选模型一起回答:

整体测试下来,发现Llama3.2对于文档分析差点意思,给他提供一个pdf文档,也看不出个啥来。但是上面的gpt4all,然后通过nomic-embed-text模型嵌入后好点。

总结

本文演示了通过不同手段来运行Llama模型,来达到本地使用LLM的目的。

更多网安技能的在线实操练习,请点击这里>>

  

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/855931.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

20222415 2024-2025-1 《网络与系统攻防技术》实验八实验报告

1.实验内容 (1)Web前端HTML 能正常安装、启停Apache。理解HTML,理解表单,理解GET与POST方法,编写一个含有表单的HTML。 (2)Web前端javascipt 理解JavaScript的基本功能,理解DOM。 在(1)的基础上,编写JavaScript验证用户名、密码的规则。在用户点击登陆按钮后回显“欢迎+…

Odoo18.0 Pos中使用Windcave支付

Windcave 是新西兰的一家领先支付技术公司,专注于提供支付解决方案和技术,帮助企业接受各种电子支付方式。该公司原本名为 Payment Express,后来在2020年更名为 Windcave,旨在体现其为全球支付行业带来创新和便捷的愿景。 本文将介绍如何在Odoo18.0门店系统(POS)中接入Wind…

给网站设置三级域名

适用于使用 Github Pages 部署的网站,域名平台不限,可以是腾讯云,也可以是阿里云1. 域名站点新增解析 以腾讯云为例,新增解析记录如下红框内所示,其余解析记录之前是给主域名添加的,185.199.111.153 等都是 github.io 的IP地址 需要注意的是,添加的记录值为 你的github账…

提升电商商品数据分析效率,关键在这里!

商品数据背后的秘密:电商团队如何用协同工具打造数据驱动决策 数据是电商行业的生命线,而商品数据分析是核心驱动力之一。从日销额到库存周转,从热销品类到滞销清单,每一组数据都蕴藏着优化运营的关键。然而,许多电商团队在实际操作中却面临以下难题: 1. 数据孤岛:各部门…

最强AI智能体竟如此简单!Anthropic首次公开内部秘籍!

0 前言 过去一年中,我们与不同行业中开发大语言模型 (LLM) 智能体的多个团队进行了合作。我们发现,最成功的实现并非依赖复杂的框架或专业化的库,而是通过简单、可组合的模式构建。 本文分享从客户合作及自身开发智能体的过程中所学到的经验,并为开发者提供构建高效智能体的…

Kali下修改系统时间——tzselect

tzselect:交互式选择时区一、命令介绍 tzselect命令用于交互式选择系统时区。 二、命令示例 登录到Kali上发现系统时间与本地时间相差一个小时这可不行啊,那就手动修改一下吧,运行tzselect会有很多想选供我们选择,如非洲、亚洲等,我们选择亚洲之后到具体国家选择模块,毫无…

IGM机器人维修的关键环节

在现代科技领域,机器人已经成为不可或缺的一部分,它们广泛应用于各个行业,包括制造业、服务业、医疗、科研等。对于任何机器人来说,定期的维护和修理都是必不可少的。这不仅可以确保机器人正常工作,还可以延长其使用寿命。对于IGM机器人维修工作显得尤为重要,因为任何故障…

c#多语言实现

也许你会有多语言这样的需求,后期方便添加语言,基于这样的需求写了个辅助类; 先看代码:1 public class LanguageHelper2 {3 private static Dictionary<string, string> m_lstLanguage = new Dictionary<string, string>();4 private static Dictionar…

无法访问 Maven 3.8.1 http 仓库

1.情景展示 从git上面下载下来的项目,项目导包失败,具体报错信息如下: 无法访问 Maven 3.8.1 http 仓库 可能的解决方案:检查 Maven settings.xml 是否不包含 http 仓库 检查 Maven pom 文件是否不包含 http 仓库 http://maven.aliyun.com/nexus/content/groups/public/ 在 …

类文件结构详解 .class文件

回顾一下字节码 在 Java 中,JVM 可以理解的代码就叫做字节码(即扩展名为 .class 的文件),它不面向任何特定的处理器,只面向虚拟机。Java 语言通过字节码的方式,在一定程度上解决了传统解释型语言执行效率低的问题,同时又保留了解释型语言可移植的特点。所以 Java 程序运…

《黑神话:悟空》史诗级更新!ToDesk云电脑免下载畅玩!

重磅消息!《黑神话:悟空》终于迎来史诗级更新!新功能、新玩法、还有新套装,之前玩家提的地图、小曲进度条,游戏科学都安排上了,这更新内容的诚意度堪比DLC!首先是新玩法增加挑战又叫boss rush,天命人打通一周目后,在土地庙进入挑战,分为复战和连战模式。 复战模式可以…

昂瑞微 OM6626:芯片界的超级 “多面手”

嘿,各位科技迷们!今天咱要来探秘一下芯片界的一位 “全能明星”—— 昂瑞微 OM6626。这小家伙的诞生,那可是有一番精彩故事呢!一、诞生背景:时代呼唤的 “超级英雄” 如今这物联网的世界,那发展速度就跟坐了火箭似的。大家对低功耗、高性能的无线通信芯片,那叫一个渴望啊…