1.大模型的演变
机器学习 : 监督学习(人为的告知) 和 无监督学习(不进行干预) 和 强化学习(奖惩的方式) 和 深度学习(模拟人的大脑)
大模型: 卷基座,如参数;卷模型的应用,如rag工作流,agent中台;卷多模(文本,图片,视频)
2.大模型的使用与训练
大模型的使用: prompt,提示词的工程
大模型的训练的三个阶段: 预训练、SFT(监督微调)以及RLHF(基于人类反馈的强化学习)
预训练:提升底层的通用能力(3-25岁不断的学习),不管什么都要去学习。能力: 进行补全句子
SFT(监督微调): 对某一个领域进行深刻的学习,能力: 对问题进行回答
RLHF(基于人类反馈的强化学习): 不懂就问,能力:纠正SFT的回答,通过打分的机制,不断的优化输出的结果。
3.大模型的特点与分类
规模和参数量大、适应性和灵活性强
广泛数据集的预训练、计算资源需求大
分类:
大语言模型(LLM):专注于自然语言处理
多模态模型:多模态能够同时处理和理解不同感知通道。计算机视觉模型,音频处理模型
4.大模型的工作流程(IO)
4.1分词化 与 词表 映射
更具词粒度 和 字符粒度 和 子词粒度 将其分解为更小的粒度
词根的映射,就是说,将一个单词映射成一个元素的 token id,这是token的"身份证",实际上给了一串数字
然后根据概率进行补全后面的单词。
比如 lark is a __ 根据最后的概率来进行填写最后一个单词
5.大模型的应用
同义千问的官网去寻找
可以添加官方微信【LarkMidTable2021】,群为VIP群,需要赞助10元才可以添加 , 添加时备注【AI】,可以参与讨论AI啦!