一、AI推理引擎工具
-
SGLang
高性能推理引擎,专为高并发场景设计,支持多GPU部署,适合企业级应用。 -
VLLM
高效推理引擎,专注于大规模在线服务,支持多GPU加速,适合需要快速推理的场景。 -
LLaMA.cpp
轻量级推理框架,适合边缘设备和资源受限的场景。 -
摩尔线程 AI 推理套件
包含 MT Transformer 和 TensorX,针对 Transformer 架构大模型和传统模型的推理加速,支持超长文本处理和多种优化技术。
二、AI训练与微调工具
-
Axolotl
功能丰富的微调工具,支持多种 Hugging Face 模型(如 Llama、Pythia、Falcon),提供全微调、LoRA、QLoRA 等训练方法。 -
Unsloth
开源的 LLM 微调工具,支持多种主流模型(如 Llama-3、Mistral、Phi-4),显著提升训练速度,减少内存使用。 -
LLaMA-Factory
开源的低代码大模型训练框架,支持高效微调方案(如 LoRA 和 QLoRA),适配多种开源模型,提供可视化训练和推理平台。 -
DeepSpeed
提供大规模分布式训练和显存优化,适合超大规模模型训练。 -
AdapterHub
低资源消耗,快速微调,适合多任务微调。 -
Alpaca-LoRA
结合 LoRA 技术,优化生成任务。
三、AI应用与平台工具
-
Omnitool
开源 AI 桌面工具,支持多种主流 AI 平台和服务,适用于艺术创作、文案生成、语音合成、教育学习和企业开发。 -
Cherry Studio
多模型桌面客户端,支持 Windows、macOS 和 Linux 系统,集成多种主流大语言模型(如 OpenAI、DeepSeek、Gemini 等),内置 300 多个预配置的 AI 助手。 -
Anko
免费的 AI 内容创作平台,聚合了主流 AI 大模型服务商(如 ChatGPT、Gemini、文心一言等),支持多模型创作。 -
Hugging Face
AI 模型开发交流平台,提供丰富的开源模型和开发工具。 -
Wordware
一个集成开发环境(IDE),通过自然语言编程实现 AI 代理的快速开发和部署,支持多模态数据和一键API部署。
四、AI多模态工具
-
Stable Diffusion
文本转图像的 AI 技术,用于生成高质量图像。 -
DALL-E
由 OpenAI 开发,能够根据文本描述生成图像。 -
NEXUS-O
多模态 AI 模型,由多所高校和机构联合推出,能实现对语言、音频和视觉信息的全方位感知与交互。 -
WeGen
中科大联合上海交大等推出的统一多模态生成模型,结合扩散模型和多模态大语言模型,支持动态实例一致性和提示自重写机制。
五、AI创新工具
-
Kiln AI
开源的 AI 原型设计和数据集协作开发工具,支持微调专属模型,可导出数据集用于本地或云端训练。 -
NodeTool
开源的 AI 工作流可视化构建器,支持拖放节点设计复杂工作流,无需编码即可快速原型设计和测试。
六、AI工具适用场景建议
- 个人/新手:优先选择 Unsloth 或 Kiln AI,显存要求低且易上手。
- 研究/多模型实验:推荐 LLaMA-Factory,社区资源丰富。
- 工业级/多模态:选择 ms-SWIFT 或 NEXUS-O,功能全面且支持部署优化。
- 创意与内容创作:推荐 Stable Diffusion 或 WeGen,适合生成高质量图像和多模态内容。
- 专业领域分析:如科技研发或金融分析,推荐 DeepSeek。