docker部署codegeex4实现本地IDE编程助手

news/2025/1/31 7:24:40/文章来源:https://www.cnblogs.com/xuhe2/p/18691674

实现了使用docker运行的ollama作为VSC或者其他IDE的编程助手,实现本地化的AI推理

环境

debian12
docker
ollama

环境配置

ollama

参考 ollama在docker中使用 可以实现在docker中使用ollama

  • 支持GPU,但是需要配置Nvidia container toolkit

使用指令启动服务

docker run --rm -d --gpus=all -v ollama:/root/.ollama -p 11434:11434 --name ollama ollama/ollama

如果出现端口被占用的情况,就更换一个端口

当ollama在docker中启动的时候,启动指令就是ollama serve
image

我的11434端口处于占用,所以,使用了11432端口

测试ollama是否启用

使用docker ps指令检查容器的状态

在浏览器中打开对于的IP+port可以检查ollama serve是否启动,处于可以被外部访问的状态.
image

模型

参考 本地化部署codegeex4

模型下载

参考 ollama的codegeex4下载

ollama pull codegeex4

测试模型

终端访问

使用docker exec -it ollama /bin/bash进入容器内部

在终端中运行模型测试效果

ollama run codegeex4

效果如下
image

API调用

参考 API官方文档

curl http://localhost:11434/api/chat -d '{"model": "codegeex4","messages": [{"role": "user","content": "写一段JS代码,输出hello world!"}]
}'

效果如图
image

VSC设置

参考github的配置方式
image

我设置地址为http://192.168.1.106:11432/v1/chat/completions, 模型名字为codegeex4
之后会显示已连接代表成功
image

测试效果

image

成功可以补全代码了

  • 对性能要求不高, 感觉很适合本地化部署和使用

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/876059.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

云--CloudSchool

www.cloudschool.com

idea--普通项目转换为Maven项目

方法一: 待补。。。 方法二: 1.选中项目2.添加框架3.选择Maven效果图:

进阶社工

进阶社工 近日无聊,看了一道社工题,如下:寻找拍照者所在的位置 xx省xx市xx县xx路口/与xx路口交汇处传统社工的思路先根据车牌号 大致定位到 湖南省郴州市。 接下来通过抖音/大众点评/美团 搜索郴州市所有的银行/酒店,根据银行/酒店的外观进行一步步筛选,最后定位到具体位置…

51单片机

51单片机的学习笔记环境配置 芯片选AT89C52 生成16进制文件,便于烧录 烧录:生成对应hex文件导入后,芯片型号为STC89C5RC。串口根据下载STC-ISP说明来操作即可,一般有CH340和PL2303两种。 下载后要重新按一下开关,冷启动void Delay(unsigned int x) //@11.0592MHz {unsign…

spark--快速入门指南

https://spark.apache.org/docs/latest/quick-start.html

第二轮easy~hard题目

题目1代码 #include<iostream> #include<vector> using namespace std; vector<int> num; int mybsearch(int l, int r, int x) {while (l < r) {int mid = (l + r )>> 1;if (num[mid] >= x) r = mid;else l = mid + 1;}return l; } int main() …

bioRxiv|L2G:一张GPU卡也能训的基因组学语言模型

预训练语言模型(如BERT、GPT等)在自然语言处理(Natural Language Processing, NLP)领域取得了显著进展,其在多种语言任务中的表现令人瞩目。这一成功激发了基因组学领域的研究者们尝试开发类似的基础模型(Foundation Models, FMs),以解决复杂的基因组学任务。然而,构建…

Java基础学习(十)

Java基础学习(十):集合 目录Java基础学习(十):集合概念数据结构泛型CollectionListArrayListLinkedListSetHashSetLinkedHashSetTreeSet 本文为个人学习记录,内容学习自 黑马程序员概念数组长度固定,不够灵活,因此出现了集合集合 vs 数组长度:数组的长度固定,集合长…

Java基础学习(十一)

Java基础学习(十一):常见算法 目录Java基础学习(十一):常见算法查找算法排序算法 本文为个人学习记录,内容学习自 黑马程序员查找算法七大查找算法:基本查找(顺序查找)、二分查找(折半查找)、插值查找、斐波那契查找、分块查找、数表查找、哈希查找基本查找核心:从…

[2025.1.26 MySQL学习] 存储引擎

存储引擎 MySQL体系结构图

范围修改查询问题

范围修改查询问题 http://www.nfls.com.cn:10611/up/paper/国家集训队2024论文集.pdf P63 引入 这部分作者定义了半群和幺半群来描述一般的线段树可以做到的结构半群:结合律幺半群:结合律、有幺元交换半群:结合律、交换律形式化问题:(以下是通俗易懂的版本)给定交换半群 …

实现超图S3M数据在Ceisum中的解析、加载

使用超图提供的S3M加载模块。参考文档:S3M_JS使用方法 1. 将项目的Cesium库的Build目录及其内容放在S3M_JS目录中,与S3M_module同级。2. 调用该模块解析、加载S3M数据 const layer = new S3MTilesLayer({context: window.viewer.scene._context,url }) window.viewer.scene.p…