囊括所有大模型：高质量中文预训练模型大模型多模态模型大语言模型集合-编程知识

在自然语言处理领域中，预训练语言模型（Pretrained Language Models）已成为非常重要的基础技术，本仓库主要收集目前网上公开的一些高质量中文预训练模型、中文多模态模型、中文大语言模型等内容(感谢分享资源的大佬)，并将持续更新…

在这里插入图片描述

Expand Table of Contents

更新日志
通用基础大模型
垂直基础大模型
通用对话大模型
垂直对话大模型
多模态对话大模型
大模型评估基准
在线体验大模型
开源模型库平台
开源数据集库
开源中文指令数据集
Embedding
Other-Awesome
NLU系列
- BERT
- RoBERTa
- ALBERT
- NEZHA
- XLNET
- MacBERT
- WoBERT
- ELECTRA
- ZEN
- ERNIE
- ERNIE3
- RoFormer
- StructBERT
- Lattice-BERT
- Mengzi-BERT
- ChineseBERT
- TaCL
- MC-BERT
- 二郎神
- PERT
- MobileBERT
- GAU-α
- DeBERTa
- GlyphBERT
- CKBERT
- LERT
- RoCBert
- m3e
- LEALLA

NLG系列
- GPT
- GPT-3
- NEZHA-GEN
- CPM-Generate
- T5
- T5-PEGASUS
- Mengzi-T5
- 盘古α
- EVA
- BART
- 闻仲
- 余元
- RWKV
- Bloom
- PromptCLUE
- ChatYuan
- SkyText
- ProphetNet

NLU-NLG系列
- UniLM
- Simbert
- RoFormer-sim
- CPM-2
- CPT
- 周文王
- GLM
- PLUG
- OPD
Multi-Modal
- WenLan
- CogView
- 紫东太初
- Mengzi-oscar
- R2D2
- Chinese-CLIP
- TaiYi-CLIP
- AltCLIP
- AltDiffusion
- Taiyi-Stable-Diffusion
- wukong
- OFA
- QA-CLIP

Table
- SDCUP

Base-LLM

大规模基础模型：表格中只罗列出参数量大于7B以上模型。

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献	备注
Breeze-Base	7B	2024-02	中英	通用	🤗HF	/	MediaTek Research
TowerBase	7/13B	2024-02	多语	通用	[🤗HF]	/	Unbabel	CD
Qwen1.5-Base	0.5/1.8/4 7/14/72B	2024-02	中英	通用	[🤗HF]	Qwen1.5	Qwen	/	Blog
LongAlign-Base	6/7/13B	2024-02	中英	通用	[🤗HF]	LongAlign	THUDM	/	Paper
Chinese-Mixtral-Base	8x7B	2024-02	中英	通用	[Baidu] [🤗HF]	Chinese-Mixtral	Yiming Cui	MOE
iFlytekSpark-Base	13B	2024-01	中英	通用	mindspore	/	科大讯飞	CD
Orion-Base	14B	2024-01	多语	通用	[🤗HF]	Orion	OrionStarAI	CD	Paper	RAG Plugin
YaYi2-Base	30B	2023-12	多语	通用	[🤗HF]	YAYI2	wenge-research	CD	Paper
Aquila2-Base	7/34/70B	2023-12	中英	通用	[🤗HF]	Aquila2	FlagAI	CD
Alaya-Base	7B	2023-12	中英	通用	[🤗HF]	Alaya	DataCanvas	CD
Qwen-Base	1.8/7 14/72B	2023-12	中英	通用	[🤗HF]	Qwen	阿里云	CD	Paper Report Report2
DeepSeek-Base	7/67B	2023-11	中英	通用	[🤗HF]	DeepSeek-LLM	deepseek-ai	CD
Yuan-2.0	2/51 102B	2023-11	中英	通用	baidu [🤗HF]	Yuan-2.0	IEIT-Yuan	CD
Alaya-Base	7B	2023-11	中英	通用	[🤗HF]	Alaya	DataCanvasIO	CD
Yi-Base	6/9/34B	2023-11	中英	通用	[🤗HF]	Yi	01.AI	CD
XVERSE-Base	7/13 65B	2023-11	多语	通用	[🤗HF]	XVERSE	元象科技	CD
Nanbeige-Base	16B	2023-11	中英	通用	[🤗HF]	Nanbeige	Nanbeige LLM Lab	CD
LingoWhale	8B	2023-11	中英	通用	[🤗HF]	LingoWhale-8B	DeepLang AI	CD
Skywork-base	13B	2023-10	中文	通用	[🤗HF]	Skywork	SkyworkAI	CD	Paper
BlueLM-Base	7B	2023-11	中英	通用	[🤗HF]	BlueLM	vivo AI Lab	CD
Chatglm3-base	6B	2023-10	中英	通用	[🤗HF]	ChatGLM3	THUDM	ND
Ziya2-Base	13B	2023-10	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
OpenBA-LM	15B	2023-09	中英	通用	[🤗HF]	OpenBA	OpenNLG Group	ED	Paper
TigerBot-Base-70B	80B	2023-09	多语	通用	[🤗HF]	TigerBot	虎博科技	CD	Paper
FLM	101B	2023-09	中英	通用	[🤗HF]	/	CofeAI	CD
falcon	7/40 180B	2023-09	多语	通用	[🤗HF]	/	Technology Innovation Institute	CD
Baichuan2	7/13B	2023-09	中文	通用	[🤗HF]	Baichuan2	百川智能	CD
Chinese-LLaMA-2-16K	7/13B	2023-08	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
YuLan-LLaMA-2	13B	2023-08	中英	通用	[🤗HF]	YuLan-Chat	中国人民大学	CD
Aquila-Base-33B	33B	2023-08	中英	通用	TODO	Aquila	FlagAI	CD
TigerBot-Base-13B	13B	2023-08	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
Linly-Chinese-LLaMA-2	7/13B	2023-07	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD
Chinese-LLaMA-2	7B	2023-07	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
Jiang-base	13B	2023-07	中文	通用	[🤗HF]	/	知未智能	CD
bwx	7/13B	2023-07	中文	通用	[🤗HF]	/	蓝鲸国数	CD
Llama2	7/13 70B	2023-07	多语	通用	[🤗HF]	llama	Meta	CD	Paper
PolyLM	13B	2023-07	多语	通用	[🤗HF]	PolyLM	达摩院	CD	Paper
Baichuan-13B	13B	2023-07	中文	通用	[🤗HF]	Baichuan-13B	百川智能	CD
TigerBot	7B	2023-07	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
InternLM-base	7/20B	2023-07	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
MPT	7/30B	2023-06	多语	通用	[🤗HF]	llm-foundry	MosaicML	CD
Baichuan	7B	2023-06	中英	通用	[🤗HF]	baichuan-7B	百川智能	CD
Chinese-Falcon	7B	2023-06	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD	Blog
AtomGPT	13B	2023-06	中英	通用	[🤗HF]	/	原子回声	CD
Aquila	7B	2023-06	中英	通用	[🤗HF]	Aquila	FlagAI	CD
Chinese-LLaMA	33B	2023-06	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
TigerBot	7B	2023-06	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
Panda-OpenLLaMA	7B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
Panda	7/13B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
OpenLLaMA	13B	2023-05	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD
BiLLa-LLM	7B	2023-05	中英	通用	[🤗HF]	BiLLa	Zhongli Li	CD
Ziya-LLaMA-Reward	7B	2023-05	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
YuYan	11B	2023-04	中文	通用	[🤗HF]	/	网易伏羲	CD	Paper
Chinese-LLaMA	7/13/33B	2023-04	中文	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD	Blog
OpenChineseLLaMA	7B	2023-04	中英	通用	[🤗HF]	OpenChineseLLaMA	OpenLMLab	CD
MOSS-003	16B	2023-04	中英	通用	[🤗HF]	MOSS	复旦大学	CD
BBT-2-Text	13B	2023-04	中文	通用	申请	BBT-FinCUGE-Applications	超对称	CD	Paper
BBT-2-Text	12B	2023-04	中文	通用	申请	BBT-FinCUGE-Applications	超对称	CD	Paper
Chinese-LLaMA	13B	2023-04	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
flan-ul2	20B	2023-03	多语	通用	[🤗HF]	ul2	Google	ED	Paper
CPM-Bee	10B	2023-01	中英	通用	[🤗HF]	CPM-Bee	OpenBMB	CD
BLOOM	176B	2022-11	多语	通用	[🤗HF]	Megatron-DeepSpeed	BigScience	CD	Paper
BLOOMZ	176B	2022-11	多语	通用	[🤗HF]	Megatron-DeepSpeed	BigScience	CD	Paper
flan-t5-xxl	11B	2022-11	多语	通用	[🤗HF]	t5x	Google	ED	paper
CPM-Ant+	10B	2022-10	中英	通用	BMB	CPM-Live	OpenBMB	CD	blog
GLM	130B	2022-10	中英	通用	申请	GLM-130B	清华大学	ND	paper
CPM-Ant	10B	2022-09	中文	通用	[🤗HF]	CPM-Live	OpenBMB	CD	blog
GLM	10B	2022-09	中文	通用	[🤗HF]	GLM	清华大学	ND	paper
源1.0	245B	2021-09	中文	通用	API	Yian-1.0	浪潮	CD	paper
CPM-2	10/11/ 200B	2021-06	中文	通用	申请	CPM	智源研究院	ED	paper
PanGu-Alpha	13/200B	2021-05	中文	通用	[🤗HF]	PanGu-Alpha	鹏城实验室	CD	paper
PLUG	27B	2021-04	中文	通用	申请	AliceMind	阿里巴巴	ED
GPT-3	13/30B	2021-04	中文	通用	TODO	GPT-3	达摩院	CD

[Back to Top]

Domain-Base-LLM

各个垂直领域开源基础模型

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
Tongyi-Finance-Base	14B	2023-11	中文	金融	ModelScope	通义金融-14B	通义金融大模型	CD
ChiMed-GPT	13B	2023-10	中文	医疗	[🤗HF]	ChiMed-GPT	中国科学技术大学	CD	Paper
CodeShell-base	7B	2023-10	中英	代码	[🤗HF]	codeshell	WisdomShell	CD
WiNGPT-base	7B	2023-09	中文	医学	[🤗HF]	WiNGPT2	Winning Health AI Research	CD
XuanYuan	70B	2023-09	中文	金融	[🤗HF]	XuanYuan	度小满	CD	Report
CodeLLAma	7/13/ 34B	2023-08	多语	代码	[🤗HF]	codellama	Meta Research	CD	Paper
educhat-base-002	7/13B	2023-06	中英	教育	[🤗HF]	EduChat	华东师范大学	CD
AquilaCode-NV	7B	2023-06	中英	代码	[🤗HF]	Aquila	FlagAI	CD
AquilaCode-TS	7B	2023-06	中英	代码	[🤗HF]	Aquila	FlagAI	CD
LaWGPT	7B	2023-05	中英	法律	[🤗HF]	LawGPT	Pengxiao Song	CD
CodeGeeX	13B	2022-06	多语	代码	申请	CodeGeeX	清华大学	CD	blog

[Back to Top]

ChatLLM

具备问答和对话等功能的大型语言模型。

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
Command-R	35B	2024-03	多语	通用	🤗HF	/	CohereForAI	CD
Breeze-Instruct	7B	2024-02	中英	通用	🤗HF	/	MediaTek Research
aya-101	13B	2024-02	多语	通用	🤗HF	/	Cohere For AI	CD	Paper
ChemLLM	7B	2024-02	多语	通用	🤗HF	/	AI4Chem	CD	Paper
TowerInstruct	7/13B	2024-02	多语	通用	[🤗HF]	/	Unbabel	CD
Qwen1.5-Chat	0.5/1.8/4/ 7/1472B	2024-02	中英	通用	[🤗HF]	Qwen1.5	Qwen	/	Blog
MiniCPM	2B	2024-02	中英	通用	[🤗HF] ModelScope	MiniCPM	OpenBMB	/	Report
LongAlign-Chat	6/7/13B	2024-02	中英	通用	[🤗HF]	LongAlign	THUDM	/	Paper
Chinese-Mixtral-Chat	8x7B	2024-02	中英	通用	[Baidu] [🤗HF]	Chinese-Mixtral	Yiming Cui	MOE
iFlytekSpark-Chat	13B	2024-01	中英	通用	mindspore	/	科大讯飞	CD
rwkv-5-world	0.1/1/ 3/7B	2023-01	多语	通用	[🤗HF]	RWKV-LM	BlinkDL		URL
Orion-Chat	14B	2024-01	多语	通用	[🤗HF]	Orion	OrionStarAI	CD	Paper
internlm2-chat	7/20B	2024-01	中英	通用	[🤗HF]	InternLM	InternLM	CD	Report
Chinese-Mixtral	8x7B	2023-01	中英	通用	[🤗HF]	/	HIT-SCIR	CD-MOE
Telechat	7/12B	2024-01	中英	通用	[🤗HF]	Telechatx	Tele-AI	CD	Report
kagentlms	7/13B	2024-01	中英	通用	[🤗HF]	KwaiAgents	KwaiKEG
YaYi2-Chat	30B	2023-12	多语	通用	[🤗HF]	YAYI2	wenge-research	CD	Paper
SUS-Chat	34/72B	2023-12	中英	通用	[🤗HF]	SUS-Chat	SUSTech-IDEA	CD
Aquila2-Chat	7/34/70B	2023-12	中英	通用	[🤗HF]	Aquila2	FlagAI	CD
Alaya-Chat	7B	2023-12	中英	通用	[🤗HF]	Alaya	DataCanvas	CD
Qwen-Chat	1.8/7/ 14/72B	2023-12	中英	通用	[🤗HF]	Qwen	阿里云	CD	Paper Report Report2
DeepSeek-Chat	7/67B	2023-11	中英	通用	[🤗HF]	DeepSeek-LLM	deepseek-ai	CD
Yi-Chat	6/34B	2023-11	中英	通用	[🤗HF]	Yi	01.AI	CD
Alaya-Chat	7B	2023-11	中英	通用	[🤗HF]	Alaya	DataCanvasIO	CD
OrionStar-Yi-Chat	34B	2023-11	中英	通用	[🤗HF]	OrionStar-Yi-34B-Chat	OrionStarAI	CD
Nanbeige-Chat	16B	2023-11	中英	通用	[🤗HF]	Nanbeige	Nanbeige LLM Lab	CD
OpenChat 3.5	7B	2023-11	中英	通用	[🤗HF]	openchat	OpenChat	CD	Paper
XVERSE-Chat	7/13B	2023-11	多语	通用	[🤗HF]	XVERSE	元象科技	CD
AndesGPT	7B	2023-11	中文	通用	[🤗HF]	AndesGPT-7B	OPPO-Mente-Lab	CD
SeaLLM-Chat	13B	2023-11	多语	通用	[🤗HF]	SeaLLMs	SeaLLMs	CD
BlueLM	7B	2023-11	中英	通用	[🤗HF]	BlueLM	vivo AI Lab	CD
Skywork-chat	13B	2023-10	中文	通用	[🤗HF]	Skywork	SkyworkAI	CD	Paper
Zephyr	7B	2023-10	多语	通用	[🤗HF]	alignment-handbook	Hugging Face H4	CD	Paper
Mistral	7B	2023-10	多语	通用	[🤗HF]	mistral-src	Mistral AI	CD	Paper
chatglm3	6B	2023-10	中英	通用	[🤗HF]	ChatGLM3	THUDM	ND
Zhiyin-chat	7B	2023-10	中英	通用	[🤗HF]	Zhiyin	中科院声学所	CD
Ziya2-Chat	13B	2023-10	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
Vulture	40/180B	2023-10	多语	通用	[🤗HF]	/	VILM-AI		TODO
Vulture	3/7/ 40/180B	2023-09	多语	通用	[🤗HF]	/	VILM	CD
Colossal-LLaMA-2	7B	2023-09	中英	通用	[🤗HF]	ColossalAI	HPC-AI Tech	CD	Blog
OpenBA-chat	15B	2023-09	中英	通用	TODO	OpenBA	OpenNLG Group	ED	Paper
WeMix-LLaMA2	7/70B	2023-09	中英	通用	[🤗HF]	WeMix-LLM	Alpha-VLLM	CD
Stable Beluga	7/13/70B	2023-09	中英	通用	[🤗HF]	/	Stability AI	CD
TigerBot-chat	70B	2023-09	中英	通用	[🤗HF]	TigerBot	虎博科技	CD	Paper
Openbuddy_llama	70B	2023-09	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
falcon-180B-chat	180B	2023-09	多语	通用	[🤗HF]	/	Technology Innovation Institute	CD
Baichuan2	7/13B	2023-09	中文	通用	[🤗HF]	Baichuan2	百川智能	CD
Chinese-Alpaca-2-16K	7/13B	2023-09	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
InternLM-Chat-8k	7B	2023-08	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
InternLM-Chat-v1.1	7B	2023-08	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
YuLan-Chat-2	13B	2023-08	中英	通用	[🤗HF]	YuLan-Chat	中国人民大学	CD
falcon	7/40B	2023-06	多语	通用	[🤗HF]	[🤗HF]	Technology Innovation Institute	CD
Toucan	7B	2023-08	中英	通用	[🤗HF]	Toucan-LLM	Kendryte	CD
Zhuzhi	6B	2023-08	中英	通用	[🤗HF]	Zhuzhi-6B	竹间智能	ND
Atom	7B	2023-08	中英	通用	[🤗HF]	Llama2-Chinese	FlagAlpha	CD
openbuddy	3/7/ 13/40B	2023-08	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
Aquila-Chat-33B	33B	2023-08	中英	通用	TODO	Aquila	FlagAI	CD
vicuna-V1.5-16K	7/13B	2023-08	多语	通用	[🤗HF]	FastChat	lm-sys	CD	Paper
vicuna-V1.5	7/13B	2023-08	多语	通用	[🤗HF]	FastChat	lm-sys	CD	Paper
Chinese-Alpaca-2	13B	2023-08	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
WizardLM-V1.0	70B	2023-08	多语	通用	[🤗HF]	WizardLM	operatorx	CD
TigerBot-chat-13B	13B	2023-07	中英	通用	[🤗HF]	TigerBot	虎博科技	CD
huozi	7B	2023-08	中英	通用	[🤗HF]	huozi	哈工大	CD
Chinese-Alpaca-2	7B	2023-07	中英	通用	[🤗HF]	Chinese-LLaMA-Alpaca-2	Yiming Cui	CD
AntX	7/13B	2023-07	中文	通用	[🤗HF]	/	AntX.ai	CD
BatGPT	15B	2023-07	中英	通用	[🤗HF]	BatGPT	上海交通大学	ND	Paper
WizardLM-V1.2	13B	2023-07	多语	通用	[🤗HF]	WizardLM	operatorx	CD	Paper
llama2-Chinese-chat	13B	2023-07	中英	通用	[🤗HF]	llama2-Chinese-chat	Ke Bai	CD
Jiang-chat	13B	2023-07	中文	通用	[🤗HF]	/	知未智能	CD
Llama2-chinese-chat	7/13B	2023-07	中英	通用	[🤗HF]	Llama2-Chinese	FlagAlpha	CD
LL7M	7B	2023-07	多语	通用	[🤗HF]	/	Joseph Cheung	CD
Chinese-Llama-2	7B	2023-07	中英	通用	[🤗HF]	Chinese-Llama-2-7b	LinkSoul-AI	CD
Llama2-chat	7/13/70B	2023-07	多语	通用	[🤗HF]	llama	Meta	CD	Paper
PolyLM-chat	13B	2023-07	多语	通用	[🤗HF]	PolyLM	达摩院	CD	Paper
Baichuan-13B-chat	13B	2023-07	中文	通用	[🤗HF]	Baichuan-13B	百川智能	CD
vicuna-V1.3	7/13/33B	2023-07	多语	通用	[🤗HF]	FastChat	lm-sys	CD	Paper
WizardLM-V1.0	7/13/30B	2023-07	多语	通用	[🤗HF]	WizardLM	operatorx	CD	Paper
TigerBot-v2-sft	7B	2023-07	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
InternLM-chat	7/20B	2023-07	中文	通用	[🤗HF]	InternLM	上海人工智能实验室	CD	report
vicuna汉化版	33B	2023-07	中文	通用	baidu-hiks	chinese-StableVicuna	ziwang-com	CD
CuteGPT	13B	2023-07	中英	通用	[🤗HF]	CuteGPT	复旦大学知识工场	CD
MPT-chat	7/30B	2023-06	多语	通用	[🤗HF]	llm-foundry	MosaicML	CD
ChatGLM2	6B	2023-06	中英	通用	[🤗HF]	ChatGLM2-6B	清华大学	ND
BayLing	7/13B	2023-06	中英	通用	[🤗HF]	BayLing	中国科学院	CD
ZhiXi-Diff	13B	2023-06	中英	通用	[🤗HF]	KnowLLM	浙江大学	CD
Anima	33B	2023-06	中文	通用	[🤗HF]	Anima	Gavin Li	CD
OpenLLaMA-Chinese	3/7/13B	2023-06	中文	通用	[🤗HF]	OpenLLaMA-Chinese	FittenTech	CD
openbuddy-falcon-7b-v1.5	7B	2023-06	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
AtomGPT_chat	13B	2023-06	中英	通用	[🤗HF]	AtomGPT	原子回声	CD
AquilaChat	7B	2023-06	中英	通用	[🤗HF]	Aquila	FlagAI	CD
YuLan-Chat	13/65B	2023-06	中英	通用	[🤗HF]	YuLan-Chat	中国人民大学	CD
Chinese-Alpaca	33B	2023-06	中文	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
TigerBot-sft	7/180B	2023-06	多语	通用	[🤗HF]	TigerBot	虎博科技	CD
ChatYuan	7B	2023-06	中英	通用	[🤗HF]	ChatYuan-7B	ClueAI	CD
Panda-Instruct	13B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
Panda-Instruct	7B	2023-05	中英	通用	[🤗HF]	pandallm	dandelionsllm	CD
BiLLa-SFT	7B	2023-05	中英	通用	[🤗HF]	BiLLa	Zhongli Li	CD
Ziya-LLaMA-v1	13B	2023-05	中英	通用	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD	Blog
BLOOMChat V1.0	176B	2023-05	多语	通用	[🤗HF]	bloomchat	SambaNova Systems	CD	Blog
BiLLa	7B	2023-05	中英	通用	[🤗HF]	BiLLa	Zhongli Li	CD
Bactrian-X	7/13B	2023-05	多语	通用	[🤗HF]	bactrian-x	MBZUAI	CD
Bactrian-ZH	7B	2023-05	中文	通用	[🤗HF]	bactrian-x	MBZUAI	CD
ChatFlow	7/13B	2023-05	中英	通用	[🤗HF]	Linly	深圳大学计算机视觉研究所	CD
OpenBuddy	7/13B	2023-05	多语	通用	[🤗HF]	OpenBuddy	OpenBuddy	CD
YuYan-dialogue	11B	2023-04	中文	通用	[🤗HF]	/	网易伏羲	CD	paper
Moss-moon-003-sft-plugin	16B	2023-04	中英	通用	[🤗HF]	MOSS	复旦大学	CD
moss-moon-003-sft	16B	2023-04	中英	通用	[🤗HF]	MOSS	复旦大学	CD
RWKV-4-Raven	3/7/14B	2023-04	中英	通用	[🤗HF]	ChatRWKV	BlinkDL	RNN	Blog
Phoenix-inst-chat	7B	2023-04	中文	通用	[🤗HF]	LLMZoo	香港中文大学	CD
Phoenix-chat	7B	2023-04	中文	通用	[🤗HF]	LLMZoo	香港中文大学	CD
ChatPLUG	3.7B	2023-04	中文	通用	[🤗HF]	ChatPLUG	阿里巴巴	ED	Paper
Chinese-Alpaca	13B	2023-04	中文	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
BELLE-LLAMA	13B	2023-04	中文	通用	[🤗HF]	BELLE	贝壳	CD
LLaMA-tuned	7/13/ 33/65B	2023-04	中文	通用	[🤗HF]	LMFlow	香港科技大学	CD
Chinese-Vicuna	7/13B	2023-03	中文	通用	[🤗HF]	Chinese-Vicuna	Facico	CD
ChatYuan-V2	0.7B	2023-03	中英	通用	[🤗HF]	ChatYuan	元语智能	ED
Chinese-Alpaca	7B	2023-03	中文	通用	[🤗HF]	Chinese-LLaMA-Alpaca	Yiming Cui	CD
Luotuo	7B	2023-03	中文	通用	[🤗HF]	Chinese-alpaca-lora	华中师范大学	CD
BELLE-LLAMA	7B	2023-03	中英	通用	[🤗HF]	BELLE	贝壳	CD
ChatGLM	6B	2023-03	中英	通用	[🤗HF]	ChatGLM-6B	清华大学	ND

[Back to Top]

Domain-ChatLLM

开源的垂直领域对话大模型

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	架构	文献
ChemDFM	13B	2024-03	中英	化学	🤗HF	/	OpenDFM	CD	Paper
starcoder2	3/7/15B	2024-02	中英	代码	🤗HF	starcoder2	bigcode-project	CD	Paper
TuringMM-Chat	34B	2024-02	中英	教育	🤗HuggingFace 🤖ModelScope	/	光年无限	CD
deepseek-moe	16B	2024-01	中英	代码	[🤗HF]	DeepSeekMoE	DeepSeek	CD-MOE
Code Millenials	1/3/ 13/34B	2023-01	多语	代码	[🤗HF]	code-millenials	BudEcosystem	CD
WizardCoder	15/33B	2024-01	多语	代码	[🤗HF]	WizardLM	operatorx	CD	Paper
DeepSeek-Coder	1/7/33B	2023-11	中英	代码	[🤗HF]	DeepSeek-Coder	deepseek-ai		Blog
Phind	34B	2023-10	多语	代码	[🤗HF]	/	Phind	CD	Blog zh
Tongyi-Finance-Chat	14B	2023-11	中文	金融	ModelScope	通义金融-14B-Chat	通义金融大模型	CD
Skywork-math	13B	2023-10	中文	数学	[🤗HF]	Skywork	SkyworkAI	CD	Paper
XuanYuan-Chat	70B	2023-10	中英	金融	[🤗HF]	XuanYuan	Duxiaoman度小满	CD
zhilu	13B	2023-10	中英	金融	[🤗HF]	/	SYSU-MUCFC-FinTech-Research-Center	CD
TestGPT	7B	2023-10	中文	测试	[🤗HF]	Test-Agent	codefuse-ai	CD
cross	7/13B	2023-10	多语	数学	[🤗HF]	/	Mathoctopus	CD
CodeFuse	13/14/ 15/34B	2023-10	中文	代码	[🤗HF]	MFTCoder	codefuse-ai	CD
Taiyi	7B	2023-10	中英	医学	[🤗HF]	Taiyi-LLM	DUTIR-BioNLP	CD
CodeShell-chat	7B	2023-10	中英	代码	[🤗HF]	codeshell	WisdomShell	CD
DISC-LawLLM	13B	2023-09	中文	法律	[🤗HF]	/	ShengbinYue	CD	Report
WiNGPT-chat	7B	2023-09	中文	医学	[🤗HF]	WiNGPT2	Winning Health AI Research	CD
ziya-coding	15/34B	2023-09	中英	代码	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
AgriGPT	6/13b	2023-09	中文	农业	[🤗HF]	AgriGPTs	AgriGPTs
XuanYuan-chat	70B	2023-09	中文	金融	TODO	XuanYuan	度小满	CD	Report
夫子•明察	6B	2023-09	中文	司法	[🤗HF]	fuzi.mingcha	山东大学	ND
仲景	13B	2023-09	中文	医学	[🤗HF]	Zhongjing	Songhua Yang	CD	Paper
CodeFuse	13/34B	2023-09	中英	代码	[🤗HF]	MFTCoder	codefuse-ai	CD
EcomGPT	7B	2023-09	中英	电商	TODO	EcomGPT	Alibaba
DISC-MedLLM	13B	2023-08	中文	医疗	[🤗HF]	DISC-MedLLM	FudanDISC	CD	Paper
K2	7B	2023-08	中英	科学	[🤗HF]	k2	daven	CD
CodeLLAma	7/13/34B	2023-08	多语	代码	[🤗HF]	codellama	Meta Research	CD	Paper
sqlcoder	15B	2023-08	中英	代码	[🤗HF]	sqlcoder	Defog.ai	CD
智海-录问	7B	2023-08	中文	法律	[🤗HF]	wisdomInterrogatory	zhihaiLLM	CD
WizardMath-V1.0	7/13/70B	2023-08	多语	数学	[🤗HF]	WizardLM	operatorx	CD
QiaoBan	7B	2023-08	中文	情感	[🤗HF]	QiaoBen	哈尔滨工业大学
HuangDi	13B	2023-08	中文	中医	[🤗HF]	HuangDI	Zlasejd	CD
ZhongJing		2023-08	中文	中医	TODO	CMLM-ZhongJing	复旦大学
TCMLLM	6B	2023-08	中文	中医	[🤗HF]	TCMLLM	2020MEAI	ND
AutoAudit	7B	2023-07	中文	安全	[🤗HF]	AutoAudit	Jiaying Li	CD
Lychee	10B	2023-07	中文	法律	[🤗HF]	lychee_law	davidpig	ND
IvyGPT	6B	2023-07	中文	医学	[🤗HF]	IvyGPT	WangRongsheng
MING	7B	2023-07	中文	医学	[🤗HF]	MING	上海交通大学	CD
Mozi	7B	2023-07	中英	科技	[🤗HF]	science-llm	GMFTBY	CD
StarGLM	6B	2023-07	中文	天文	[🤗HF]	StarGLM	LI YUYANG	ND
TransGPT	7B	2023-07	中英	交通	[🤗HF]	TransGPT	北京交通大学	CD
CodeGeeX2	6B	2023-07	中英	代码	[🤗HF]	CodeGeeX2	清华大学	ND
Yayi-llama2	7/13B	2023-07	中英	舆情	[🤗HF]	Yayi	中科闻歌	CD
Ziya-Writing	13B	2023-07	中英	写作	[🤗HF]	Fengshenbang-LM	IDEA研究院	CD
MindChat	13B	2023-07	中文	心理	[🤗HF]	MindChat	华东理工大学	CD
ShenNong-TCM-LLM	7B	2023-07	中英	医学	[🤗HF]	ShenNong-TCM-LLM	michael-wzhu	CD
ailawyer	13B	2023-07	中英	法律	[🤗HF]	JurisLMs	openkg	CD
educhat	7B/13B	2023-06	中英	教育	[🤗HF]	EduChat	华东师范大学	CD
Sunsimiao	7B	2023-06	中英	医学	[🤗HF]	Sunsimiao	华东理工大学	CD
Media LLaMA	7B	2023-06	中文	媒体	baidu	Media-LLaMA	智媒开源研究院	CD
PULSE	7/14B	2023-06	中文	医学	[🤗HF]	PULSE	OpenMEDLab	CD
ChatLaw	13/33B	2023-06	中文	法律	[🤗HF]	ChatLaw	北京大学	CD
BaoLuo	6B	2023-06	中文	法律	[🤗HF]	BaoLuo-LawAssisant	LeiZi	ND
CoLLaMA	7B	2023-06	中英	代码	[🤗HF]	CoLLaMA	Denilah	CD
TechGPT	7B	2023-06	中英	教育	[🤗HF]	TechGPT	东北大学	CD
Yayi	7B	2023-06	中英	舆情	[🤗HF]	Yayi	中科闻歌	CD
MeChat	6B	2023-06	中文	医学	[🤗HF]	smile	qiuhuachuan	ND
ziya-medical	13b	2023-06	中英	医学	[🤗HF]	MedicalGPT	Ming Xu	CD
Taoli	7B	2023-06	中英	教育	待开源	taoli	北京语言大学	CD
Lawyer-llama	13B	2023-06	中英	法律	[🤗HF]	lawyer-llama	Quzhe Huang	CD
QiZhen-CaMA	13B	2023-06	中英	医学	[🤗HF]	QiZhenGPT	浙江大学	CD
扁鹊-2.0	6B	2023-06	中文	医学	[🤗HF]	BianQue	华南理工大学	ND
SoulChat	6B	2023-06	中文	心理	[🤗HF]	SoulChat	华南理工大学	ND
HanFei	7B	2023-05	中文	法律	baidu-d6t5	HanFei	中国科学院深圳先进院	CD
QiZhen	6B	2023-05	中英	医学	[baidu]	QiZhenGPT	浙江大学	CD
ChatMed-Consult	7B	2023-05	中英	医学	[🤗HF]	ChatMed	michael-wzhu	CD
LaWGPT-beta1.1	7B	2023-05	中英	法律	[🤗HF]	LawGPT	Pengxiao Song	CD
Cornucopia	7B	2023-05	中英	金融	[🤗HF]	Cornucopia-LLaMA-Fin-Chinese	yuyangmu	CD
HuatuoGPT	7B	2023-05	中文	医学	[🤗HF]	HuatuoGPT	香港中文大学	CD	Paper
LexiLaw	6B	2023-05	中文	法律	[🤗HF]	LexiLaw	Haitao Li	ND	Paper
XuanYuan	176B	2023-05	中文	金融	申请	XuanYuan	度小满	CD	Paper
LawGPT	6B	2023-05	中文	法律	[🤗HF]	LAW-GPT	hongchengliu	N
扁鹊-1.0	0.7B	2023-04	中文	医学	[🤗HF]	BianQue	scutcyr	ED
ChatGLM-Med	6B	2023-04	中文	医学	[🤗HF]	Med-ChatGLM	哈尔滨工业大学	ED
BenTsao	7B	2023-04	中文	医学	[🤗HF]	Huatuo-Llama-Med-Chinese	哈尔滨工业大学	CD
DoctorGLM	6B	2023-04	中文	医学	TODO	DoctorGLM	xionghonglin	ND
Firefly	1/2/7B	2023-04	中文	文化	[🤗HF]	Firefly	Yang JianXin	CD
ChatRWKV	7B	2023-01	中英	小说	[🤗HF]	ChatRWKV	BlinkDL	RNN	Blog

[Back to Top]

MultiModal-ChatLLM

收集包含中文的多模态大模型，具备对话等功能。

模型	大小	时间	语言模型	非语言模型	语言	领域	下载	项目地址	机构/个人	文献
DeepSeek-VL	1.3/7B	2024-03	DeepSeek	SigLip/SAM	中英	图文	🤗HF	DeepSeek-VL	deepseek-ai	Paper
OmniLMM	3/12B	2024-02	MiniCPM	SigLip	中英	图文	🤗HF	OmniLMM	[OpenBMB](https://github.com/01-ai)
MiniCPM-V	3B	2024-02	MiniCPM-2.4B	SigLip-400M	中英	图文	🤗HF	OmniLMM	[OpenBMB](https://github.com/01-ai)
Yi-VL	6/34B	2024-01	Yi	CLIP-VIT	中英	图文	[🤗HF]	Yi	01-ai
Lyrics	14B	2023-12	/	/	中英	图文	[🤗HF]	Fengshenbang-LM	IDEA研究院
Qwen-Audio	7B	2023-12	Qwen-7B	Whisper-large-v2	中英	文音	[🤗HF]	Qwen-Audio	Qwen	Paper
SPHINX	13B	2023-10	/	/	中英	图文	[🤗HF]	LLaMA2-Accessory	Alpha-VLLM
Skywork-MM	13B	2023-10	/	/	中英	图文	[🤗HF]	Skywork	SkyworkAI	Paper
CogVLM	7/14B	2023-10	Qwen	ViT	中英	图文	[🤗HF]	/	CausalLM
fuyu	8B	2023-10	/	/	中英	图文	[🤗HF]	/	Adept AI Labs	Blog
Ziya-Visual	14B	2023-10	LLaMA	InstructBLIP	中英	图文	[🤗HF]	Fengshenbang-LM	IDEA研究院	Paper
CogVLM	17B	2023-10	EVA2-CLIP-E	Vicuna-v1.5	中英	图文	TODO	CogVLM	THUDM	Paper
idefics	9/80B	2023-10	LLaMA	CLIP-ViT	中英	图文	[🤗HF]	/	HuggingFaceM4	log
InternLM-XComposer	7B	2023-10	InternLM	EVA-CLIP	中英	图文	[🤗HF]	InternLM-XComposer	InternLM	Report
WeMix-LLM	13B	2023-09	LLama2	/	中英	图文	[🤗HF]	WeMix-LLM	Alpha-VLLM
Vally	7/13B	2023-08	BelleGroup/BELLE-LLaMA-EXT	OFA-Sys/chinese-clip-vit-large-patch14	中英	图文	[🤗HF] [🤗HF]	Valley	罗瑞璞	Paper
SALMONN	/	2023-08	/	/	中英	语音	TODO	SALMONN	Bytedance
IDEFICS	9/80B	2023-08	llama	CLIP-ViT	中英	图文-通用	[🤗HF]	m4-logs	HuggingFaceM4	Paper
Qwen-VL	7B	2023-08	Qwen-7B	Openclip ViT-bigG	中英	通用	[🤗HF]	Qwen-VL	阿里云
Qwen-VL-chat	7B	2023-08	Qwen-7B	Openclip ViT-bigG	中英	通用	[🤗HF]	Qwen-VL	阿里云
LLasM	7B	2023-07	Chinese-Llama2	whisper-large-v2	中英	语音	[🤗HF]	LLaSM	北京灵琐
Chinese-LLaVA	7B	2023-07	Chinese-Llama2	Clip-vit	中英	视觉	[🤗HF]	Chinese-LLaVA!	北京灵琐
RemoteGLM	6B	2023-07	VisualGLM-6B	VisualGLM-6B	中文	遥感	TODO	RemoteGLM	lzw-lzw
VisualCLA	7B	2023-07	Chinese-Alpaca-Plus	CLIP-ViT-L/14	中文	视觉	[🤗HF]	Visual-Chinese-LLaMA-Alpaca!	Ziqing Yang
yuren	7B	2023-07	baichuan-7B	CLIP	中英	视觉	[🤗HF]	yuren-baichuan-7b	Pleisto
VisCPM-Chat	10B	2023-06	CPM-Bee	Q-Former	中英	视觉	[🤗HF]	VisCPM	OpenBMB
VisCPM-Paint	10B	2023-06	CPM-Bee	Stable Diffusion 2.1	中英	视觉	[🤗HF]	VisCPM	OpenBMB
XrayPULSE	7B	2023-06	PULSE	MedCLIP	中文	医学	[🤗HF]	XrayPULSE	OpenMEDLab
SEEChat	6B	2023-06	ChatGLM	CLIP-ViT	中文	/	[🤗HF]	SEEChat	360
Ziya-BLIP2-14B-Visual-v1	14B	2023-06	LLaMA-13B	BLIP2	中英	通用	[🤗HF]	Fengshenbang-LM!	IDEA研究院
Video-LLaMA-BiLLA	7B	2023-05	BiLLa-7B	MiniGPT-4	中英	通用	[🤗HF]	Video-LLaMA	达摩院多语言NLP	Paper
Video-LLaMA-Ziya	13B	2023-05	Ziya-13B	MiniGPT-4	中英	通用	[🤗HF]	Video-LLaMA	达摩院多语言NLP	Paper
XrayGLM	6B	2023-05	ChatGLM-6B	BLIP2-Qformer	中英	医学	[🤗HF]	XrayGLM	澳门理工大学
X-LLM		2023-05	ChatGLM	ViT-g	中文	/	TODO	X-LLM	Paper
VisualGLM	6B	2023-05	ChatGLM-6B	BLIP2-Qformer	中英	视觉	[🤗HF]	VisualGLM-6B![

[Back to Top]

中文指令数据集

收集包含中文的指令数据集，用于微调语言模型。

名称	大小	时间	语言	下载	项目地址	作者	备注
FinCorpus	50G	2023-09	中文	dataset	XuanYuan	度小满	金融领域
TransGPT-sft	346k	2023-07	中文	dataset	TransGPT	北京交通大学
TransGPT-pt	58k	2023-07	中文	dataset	TransGPT	北京交通大学
ShareGPT-Chinese-English	90K	2023-07	中英	dataset	llama2-Chinese-chat![	Ke Bai
educhat-sft-002-data-osm	400w	2023-06	中英	dataset	EduChat	华东师范大学	教育
chatgpt-corpus	3M	2023-06	中文	dataset	chatgpt-corpus	plex
Simle	350k	2023-06	中文	dataset	smile	qiuhuachuan	心理健康
QiZhen	20k	2023-06	中文	dataset	QiZhenGPT	浙江大学	医学
BayLing-80	80	2023-06	中英	dataset	BayLing	中国科学院	多轮指令
Tigerbot-dataset	120k	2023-06	中英	dataset	TigerBot	虎博科技
lawyer-llama	/	2023-05	中文	dataset	lawyer-llama	Quzhe Huang	法律
Bactrian-X	67K	2023-05	多语	dataset	bactrian-x	MBZUAI
CrimeKgAssitant	52k	2023-05	中文	dataset	LAW-GPT	hongchengliu	法律
moss-002-sft-data	1.1M	2023-04	中英	dataset	MOSS	复旦大学
moss-003-sft-data	1.1M	2023-04	中英	dataset	MOSS	复旦大学
moss-003-sft-plugin-data	300K	2023-04	中英	dataset	MOSS	复旦大学
Safety-Prompts	100K	2023-04	中文	dataset	Safety-Prompts	清华大学	评测平台
OASST1	/	2023-04	多语	dataset	Open-Assistant	OpenAssistant
ShareChat	90K	2023-04	中英	dataset	ShareChat	czhko
GPT-4-LLM	52K	2023-04	中文	dataset	GPT-4-LLM	Instruction-Tuning-with-GPT-4	paper
COIG	200K	2023-04	中文	dataset	FlagInstruct	BAAI	paper
RedGPT	50k	2023-04	中文	dataset	RedGPT	MiniGPT
shareGPT_cn	20k	2023-04	中文	dataset	shareGPT_cn	shareAI
generated_chat_0.4M	0.4M	2023-04	中文	dataset	BELLE	Ke Technologies	角色对话
multiturn_chat_0.8M	0.8M	2023-04	中文	dataset	BELLE	Ke Technologies	多轮任务
school_math_0.25M	0.25M	2023-04	中文	dataset	BELLE	Ke Technologies	数学题
Zhihu-KOL	/	2023-03	中文	dataset	Zhihu-KOL	Rui Wang
InstructionWild	104k	2023-03	中英	dataset	InstructionWild	Xue Fuzhao
Alpaca-CoT	/.	2023-03	中英	dataset	Alpaca-CoT	Qingyi Si
GuanacoDataset	/	2023-03	多语	dataset	guanaco-model	Guanaco
Traditional-Chinese-alpaca	52K	2023-03	中文	dataset	Traditional-Chinese Alpaca	NTU NLP Lab	gpt翻译
alpaca_chinese_dataset	/	2023-03	中文	dataset	alpaca_chinese_dataset	akou	人工校验
alpaca-chinese-dataset	/	2023-03	中文	dataset	alpaca-chinese-dataset	carbonz	机器翻译
train_2M_CN	2M	2023-03	中文	dataset	BELLE	Ke Technologies
train_1M_CN	1M	2023-03	中文	dataset	BELLE	Ke Technologies
train_0.5M_CN	0.5M	2023-03	中文	dataset	BELLE	Ke Technologies
HC3 人类-ChatGPT 问答	/	2023-03	中文	dataset	chatgpt-comparison-detection	SimpleAI
firefly-train-1.1M	1.1M	2023-03	中文	dataset	Firefly	Jianxin Yang

[Back to Top]

Embedding

MTEB排行榜: https://huggingface.co/spaces/mteb/leaderboard 镜像

模型	大小	时间	语言	领域	下载	项目地址	机构/个人	文
BCE	279M	2024-01	多语	通用	[🤗HF]	BCEmbedding	netease-youdao
Cohere	Base	2023-09	多语	通用	[🤗HF]	/	Cohere	Blog
jina	Base	2023-10	中英	通用	[🤗HF]	/	Jina AI
Dmeta	400MB	2024-02	中文	通用	[🤗HF]	/	DMetaSoul
bge-m3		2024-02	中文	通用	[🤗HF]	/	BAAI	Paper
tao-8k		2023-11	中文	通用	[🤗HF]		amu
bge	s/b/l	2023-10	中文	通用	[🤗HF]	/	BAAI
gte-zh	s/b/l	2023-08	中文	通用	[🤗HF]	/	Alibaba DAMO	Paper
m3e	s/b/l	2023-06	中文	通用	[🤗HF]	/	Moka-AI
LaBSE			多语	通用	[🤗HF]	/	Sentence Transformers

[Back to Top]

大模型评估基准

1. C-Eval ![

C-Eval 是一个全面的中文基础模型评估套件。它包含了13948个多项选择题，涵盖了52个不同的学科和四个难度级别，查看论文了解更多细节。

[官方网站] [Github] [论文]

2. FlagEval ![

FlagEval是一个面向AI基础模型的评测工具包。我们的目标是探索和集合科学、公正、开放的基础模型评测基准、方法及工具，对多领域（如语言、语音、视觉及多模态）的基础模型进行多维度（如准确性、效率、鲁棒性等）的评测。我们希望通过对基础模型的评测，加深对基础模型的理解，促进相关的技术创新及产业应用。

[官方网站] [Github]

3. SuperCLUElyb ![外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

SuperCLUE琅琊榜，这是一个中文通用大模型对战评价基准，它以众包的方式提供匿名、随机的对战。在本文中，我们发布了初步的结果和基于Elo评级系统的排行榜，Elo评级是国际象棋和其他竞技游戏中广泛使用的评级系统。我们邀请整个社区加入这项工作，贡献新的模型，并通过提问和投票选出你最喜欢的答案来评估它们。

[官方网站] [Github]

4. XiezhiBenchmark ![

该基准包括来自13个不同学科的516个学科的220,000个多项选择题，以及15,000个来自单一学科和多个学科的问题。我们对47个最新的大型语言模型在Xiezhi上进行了评估，结果表明在科学、工程、农学、医学和艺术等领域，大型语言模型的表现超过了人类的平均水平，但在经济学、法学、教育学、文学、历史和管理学等领域，人类的表现仍然远远超过了大型语言模型。

[官方网站] [Github] [论文]

5. Open LLM Leaderboard

由HuggingFace组织的一个LLM评测榜单，目前已评估了较多主流的开源LLM模型，以英文为主。主要目标是跟踪、排名和评估最新的大语言模型和聊天机器人，让所有人方便的观察到开源社区的进展和评估这些模型。这个排行榜有一个关键优势，社区中的任何成员都可以提交模型，并在 Hugging Face 的 GPU 集群上自动评估。

[官方网站]

6. 中文大模型安全评测平台 ![外

大模型安全测评依托于一套系统的安全评测框架，涵盖了仇恨言论、偏见歧视言论、犯罪违法、隐私、伦理道德等八大类别，包括细粒度划分的40余个二级安全类别。

[官方网站] [Github] [论文]

7. OpenCompass大语言模型评测 !

OpenCompass 是一款开源、高效、全面的评测大模型体系及开放平台。我们提供完整开源可复现的评测框架，支持大语言模型、多模态模型各类模型的一站式评测。利用分布式技术，即使面对千亿参数模型也能在数小时内完成评测。基于多个不同维度的高认可度数据集开放多样化的评测方式，包括零样本评测、小样本评测和思维链评测，全方位量化模型各个维度能力。

[官方网站] [Github]

[Back to Top]

在线体验大模型

注：需要申请或者注册方可体验,更多见Github

1. ChatGPT–OpenAI

OpenAI所提出的GPT相关模型，也是目前最火的大语言模型，发布版本已经到了4.0.

[官方网站]

2. New bing–微软

NewBing是微软在2023年3月推出的一款全新的搜索引擎，它基于OpenAI的大型语言模型（LLM），并结合了ChatGPT和DALL·E的技术，为用户提供了一个AI驱动的网络助手。

[官方网站]

3. 文心一言–百度

百度全新一代知识增强大语言模型，文心大模型家族的新成员，能够与人对话互动，回答问题，协助创作，高效便捷地帮助人们获取信息、知识和灵感。

[官方网站]

4. 通义大模型–阿里

阿里大模型统一品牌，覆盖语言、听觉、多模态等领域致力于实现接近人类智慧的通用智能，让AI从“单一感官”到“五官全开”

[官方网站]

5. 星火认知大模型–科大讯飞

科大讯飞推出的新一代认知智能大模型，拥有跨领域的知识和语言理解能力，能够基于自然对话方式理解与执行任务。从海量数据和大规模知识中持续进化，实现从提出、规划到解决问题的全流程闭环。

[官方网站]

6. Claude–Anthropic

Claude，是人工智能初创公司Anthropic 发布的一款类似ChatGPT的产品。

[官方网站]

7. ChatGLM–智谱AI

基于千亿基座模型 GLM-130B，注入代码预训练，通过有监督微调等技术实现人类意图对齐，具备问答、多轮对话、代码生成功能的中英双语大模型。

[官方网站]

8. 天工大模型–昆仑万维

天工作为一款大型语言模型，拥有强大的自然语言处理和智能交互能力，能够实现智能问答、聊天互动、文本生成等多种应用场景，并且具有丰富的知识储备，涵盖科学、技术、文化、艺术、历史等领域。

[官方网站]

9. 序列猴子大模型–出门问问

序列猴子大模型是一个具有长序列、多模态、单模型、大数据等特点的超大规模语言模型，基于其通用的表示能力与推理能力，能够进行多轮交互，打造更便捷流畅的用户体验，极大地提高了生产效率和数据处理能力，被广泛应用于问答系统、自然语言处理、机器翻译、文本摘要等领域。

[官方网站]

10. MOSS–复旦大学

MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型

[官方网站]

11. 360智脑大模–360

360智脑的生成与创作、多轮对话、代码能力、阅读理解、逻辑与推理、多模态等十大核心能力可覆盖大模型全部应用场景。

[官方网站]

12. 曹植GPT大语言模型–达观数据

达观数据积极探索大语言模型LLM的实践，研发国产版GPT“曹植”系统，作为垂直、专用、自主可控的国产版ChatGPT模型，不仅实现专业领域的AIGC智能化应用，且可内置在客户各类业务系统中提供专用服务

[官方网站]

13. 日日新–商汤

商汤“日日新SenseNova”大模型体系，正式问世

不仅展示了大模型体系下的语言大模型，还展示了AI文生图创作、2D/3D数字人生成、大场景/小物体生成等一系列生成式AI模型及应用，还揭开了依托商汤AI大装置SenseCore实现“大模型+大算力”融合创新的研发体系。

[官方网站]

14. 天燕大模型–APUS

天燕大模型是APUS公司自研的多模态大模型（LMM），具备对文本、图像、视频、音频的理解和生成能力（视频和音频的能力即将推出）。

[官方网站]

15. 元乘象–智子引擎

图文机器人

[官方网站]

16. 西湖大模型–西湖心辰

[官方网站]

17. Dongni–深思考

AI多模态搜索引擎

[官方网站]

18. 山海大模型–云知声

只需一次对话即可获取信息、知识和灵感，解决需求。是每个人身边的助理、朋友和专家。

[官方网站]

19. MiniMax大模型–MiniMax

MiniMax 最新一代的中文大语言模型帮助人类高效写作、激发创意、获取知识、做出决策现已对企业开放API体验

[官方网站]

[Back to Top]

开源模型库平台

🤗HuggingFace: The AI community building the future.

模型下载地址: https://huggingface.co/models

ModelScope: ModelScope平台是以模型为中心的模型开源社区

模型下载地址:https://modelscope.cn/models

flagopen: flagopen飞智大模型技术开源体系

模型下载地址: https://model.baai.ac.cn/models

始智AI: 中国AI开源创新社区

模型下载地址: https://wisemodel.cn/models

[Back to Top]

开源数据集库

huggfaceing数据集仓库: https://huggingface.co/datasets

包含了自然语言处理、计算机视觉、语音、多模态等数据集，内置100多个多语言公共数据集下载

ModelScope数据集仓库:https://modelscope.cn/datasets

提供了覆盖自然语言处理、计算机视觉、语音、多模态等数据集，更有阿里巴巴集团贡献的专业领域数据集，

flagopen数据集仓库: https://data.baai.ac.cn/data

内置公共数据集下载，可下200G大规模预训练语料WuDaoCorpora

cluebenchmarks数据集仓库：https://www.cluebenchmarks.com/dataSet_search.html

多个中英文NLP数据集，并可申请下载100GB的高质量中文预训练语料CLUECorpus2020

MNBVC: Massive Never-ending BT Vast Chinese corpus

超大规模中文语料集

OpenDataLab数据集仓库: https://opendatalab.com/

OpenDataLab 是有影响力的数据开源开放平台，公开数据集触手可及。

OSCAR: Open Super-large Crawled Aggregated coRpus, 多语言数据集

最新版本包含1.4T的中文语言数据集

参考链接

https://github.com/lonePatient/awesome-pretrained-chinese-nlp-models