ChatGPT以降,彻底引爆了AI,大模型进入了公众视野,每个人都可以享受AI带来的乐趣。大语言模型(Large Language Model LLM)虽然可以达到「类人」的水平,但仍需要以「大模型角度」去思考和对话才能最大限度的利用大模型的威力。这便是Prompt Engineer需要做的事情。今天就让我们学习总结一些Prompt技巧,以能优雅的训服大模型。
说起来挺吓人的,但其实也没那么复杂,只要稍学习一下,厘清LLM的本质,就能掌握到Prompt的精髓,从而就能大大提高使用LLM的效率。
本质是提问的技巧
大模型第一次达到了「类人」水平,用户可以用自然语言与计算机进行交流了。那么为了达到事半功倍的效果,我们就要精进提问的技巧,这便是Prompt Engineering。如何做呢?要把大模型视为精通某一领域的专业顾问,要以与专业顾问(比如导游,咨询师)对话的角度来看待问题。
比如说马上五一假期了,想要去上海玩,你问大模型『五一假期去上海玩,推荐一些行程』,大模型肯定会给你一个中规中矩的万能日程。这不能怪大模型,如果你如此问一个导游,负责的导游会直接反问你一大堆细节问题,因为这是行程所必须的;或者也是随便推荐一些大家都知道的地方。但肯定 是没有参考价值的。
为了达到最好的「沟通」效果,避免「Garbage In, Garbage Out」,就需要:
- 视为在与专业人士对话,也就是要拟定大模型的角色
- 一次对话尽可能的专注于一个问题或者一个主题
- 把问题描述清楚,需要的关键要素都列清楚,比如时间,地点人物,关键事件等等
- 限定问题,也就是说要尽可能多的补充问题细节,限定问题需要的回答,比如说可以做什么,不可以做什么,需要什么是时间点
- 恰当的分隔,要多多使用标点符号对提问进行分隔,这样更有利于大模型抓住重点
可以发现,这其实是沟通的技巧,抛开大模型,我们与正常的人沟通时,不也应该这样做吗?平时里的闲聊除外,正式的与人沟通时也应该使用这些技巧以达到最好的沟通效果。所以,最先需要掌握就是沟通技巧中的提问技巧。
继续我们上面的问题,使用上面的方法来优化提示:『五一假期,从南京出发,坐高铁,目的地上海,亲子3日游,不去迪士尼,不去动物园,安排详细行程』。这回得到的回答肯定有更大的参考价值。
及时补充上下文
大语言模型较以往的AI最大的进步在于超长的上下文记忆能力,这是它能达到「类人」水平的最主要的原因。那么在与大模型进行对话的时候,就要及时的补充上下文信息。一方面,你不可能一次性的把提问信息全都写全写对,那么一旦想到新的提示,就要及时的给到大模型;另外一方面,大模型有时候会胡编乱造,甚至胡言乱语(大模型都有一个叫做温度temperature的参数以控制这方面的行为),这并不是bug,而是语言创造力的一个体现。那么,一旦发现大模型跑偏了,就需要及时提供新的提示,补充上下文信息,对大模型进行纠正。
另外,就是如果感觉问题不太好理解,或者对输出有特殊的要求,还有一个补充上下文的办法就是给一个输出的示例,大模型是能够很好的捕获这一点的,并且这个对让大模型输出优质的回答非常有帮助。
不用担心溢出哈(就是输入字数太多,导致大模型理解不了),都4202年了,现在的大模型的上下文能力至少在4096个Token以上,对于大部分的常规问题来说足够了。
掌握常见的命令和特殊标记
大模型的输入是自然语言,但计算机毕竟是程序化的机器,那么就会有一些特殊的命令和标记以代表一些常用的功能。这个其实不是大模型所特有的,凡是接收字符串输入的地方,都会有一些特殊的命令和标记,如搜索引挚,如一些聊天应用。
特殊命令和特殊标记的作用在于简化输入,提升效率,特别是对于一些复杂的问题,比如像专业领域的问题,标准化的标记能大大的加强共识程度。这也跟大模型关系不大,就比如说数学和物理学上的符号,能达到一符号胜千言。
命令就是简洁,清晰和无歧义的动词:如描述,拟定,写出,规划等等。
而特殊标记则像方括号[],三个引号"“”,三个###等等。
理解专业领域知识
前面的几点都是一些通用的提示优化小技巧,适用于常规的通用的小问题。如果是专业领域的问题,光有以上的技巧明显是不够的。这时就需要领域知识了,对领域要有深刻的理解,并熟悉领域的专业术语,把抽象的,泛化的问题或者需求,用专业术语进行描述,甚至对领域进行建模,转化为详细的,具体的提示词。然后输入到大模型,由大模型进行求解或者实现。最为典型的两个领域就是代码生成和图像生成,这是两个专业性比较强的领域,对结果的要求也比较高,因此对提示词的要求也更高。
Code prompts
要想让大模型写出更好的代码,就必须尽可能详细的给出代码要素,例如:编程语言必须指明,输出输出的参数或者格式必须指明,把限制说清楚,比如不能用什么,比如时间空间复杂度的限制,最重要的就是把需求写清楚,也就是要实现什么功能的代码。
扩展阅读:
- GitHub Copilot 教程:提示词、技巧和用例
- How to use GitHub Copilot: Prompts, tips, and use cases
- Tips for Effective Code-Generating ChatGPT Prompt Design
图像生成
对于像Stable Diffusion的AIGC,更是需要一些特定领域的专业知识,才能写出比较好的提示词,达到预期的效果。比如提示词中要包含艺术风格,尺寸,比例,色彩,线条等等,而且要是关键词式的。所以,已经有一些工具,直接给出各种领域参数的可选择的具体值,以代替文本输入框,只需要在众多的参数的值中选择后,即可生成图片,确实方便很多。
扩展阅读:
- Stable Diffusion 提示词入门指南
- Explore Prompting
优质的资源
Prompting是有固定的套路可循的,就好比写代码,不用重复造轮子,已经有很多优质的prompt模板了。学会坐在现成的轮子上面,不但可以提高效率事半功倍,且能走的更稳更远。
- ChatGPT 中文调教指南
- Awesome Deliberative Prompting
- Awesome ChatGPT Prompts
GitHub是个座金矿,每当需要什么资源的时候就去搜索「awesome xxx」就能得到非常优质的相关资源合集,这比自己一个一个的去找要方便太多了。
Prompt Engineer工具
提示工程Prompt Engineering已经成为了一个新的专业,有专职的职位叫做提示工程师Prompt Engineer,它们需要对领域有深刻理解,把抽象的,泛化的需求,描述为具体的提示词以让大模型去求解或者实现。除了提示工程师外,也有专门的提示工具,用以生成提示词,或者帮助做提示优化,当不知道如何提示时,或者想优化提示词时,就可以使用这些工具来帮忙:
- prompt.com
- Prompt Engineering IDE
- PromptBench
如何学习大模型 AI ?
由于新岗位的生产效率,要优于被取代岗位的生产效率,所以实际上整个社会的生产效率是提升的。
但是具体到个人,只能说是:
“最先掌握AI的人,将会比较晚掌握AI的人有竞争优势”。
这句话,放在计算机、互联网、移动互联网的开局时期,都是一样的道理。
我在一线互联网企业工作十余年里,指导过不少同行后辈。帮助很多人得到了学习和成长。
我意识到有很多经验和知识值得分享给大家,也可以通过我们的能力和经验解答大家在人工智能学习中的很多困惑,所以在工作繁忙的情况下还是坚持各种整理和分享。但苦于知识传播途径有限,很多互联网行业朋友无法获得正确的资料得到学习提升,故此将并将重要的AI大模型资料包括AI大模型入门学习思维导图、精品AI大模型学习书籍手册、视频教程、实战学习等录播视频免费分享出来。
😝有需要的小伙伴,可以点击下方链接免费领取或者V扫描下方二维码免费领取🆓
第一阶段(10天):初阶应用
该阶段让大家对大模型 AI有一个最前沿的认识,对大模型 AI 的理解超过 95% 的人,可以在相关讨论时发表高级、不跟风、又接地气的见解,别人只会和 AI 聊天,而你能调教 AI,并能用代码将大模型和业务衔接。
- 大模型 AI 能干什么?
- 大模型是怎样获得「智能」的?
- 用好 AI 的核心心法
- 大模型应用业务架构
- 大模型应用技术架构
- 代码示例:向 GPT-3.5 灌入新知识
- 提示工程的意义和核心思想
- Prompt 典型构成
- 指令调优方法论
- 思维链和思维树
- Prompt 攻击和防范
- …
第二阶段(30天):高阶应用
该阶段我们正式进入大模型 AI 进阶实战学习,学会构造私有知识库,扩展 AI 的能力。快速开发一个完整的基于 agent 对话机器人。掌握功能最强的大模型开发框架,抓住最新的技术进展,适合 Python 和 JavaScript 程序员。
- 为什么要做 RAG
- 搭建一个简单的 ChatPDF
- 检索的基础概念
- 什么是向量表示(Embeddings)
- 向量数据库与向量检索
- 基于向量检索的 RAG
- 搭建 RAG 系统的扩展知识
- 混合检索与 RAG-Fusion 简介
- 向量模型本地部署
- …
第三阶段(30天):模型训练
恭喜你,如果学到这里,你基本可以找到一份大模型 AI相关的工作,自己也能训练 GPT 了!通过微调,训练自己的垂直大模型,能独立训练开源多模态大模型,掌握更多技术方案。
到此为止,大概2个月的时间。你已经成为了一名“AI小子”。那么你还想往下探索吗?
- 为什么要做 RAG
- 什么是模型
- 什么是模型训练
- 求解器 & 损失函数简介
- 小实验2:手写一个简单的神经网络并训练它
- 什么是训练/预训练/微调/轻量化微调
- Transformer结构简介
- 轻量化微调
- 实验数据集的构建
- …
第四阶段(20天):商业闭环
对全球大模型从性能、吞吐量、成本等方面有一定的认知,可以在云端和本地等多种环境下部署大模型,找到适合自己的项目/创业方向,做一名被 AI 武装的产品经理。
- 硬件选型
- 带你了解全球大模型
- 使用国产大模型服务
- 搭建 OpenAI 代理
- 热身:基于阿里云 PAI 部署 Stable Diffusion
- 在本地计算机运行大模型
- 大模型的私有化部署
- 基于 vLLM 部署大模型
- 案例:如何优雅地在阿里云私有部署开源大模型
- 部署一套开源 LLM 项目
- 内容安全
- 互联网信息服务算法备案
- …
学习是一个过程,只要学习就会有挑战。天道酬勤,你越努力,就会成为越优秀的自己。
如果你能在15天内完成所有的任务,那你堪称天才。然而,如果你能完成 60-70% 的内容,你就已经开始具备成为一名大模型 AI 的正确特征了。
这份完整版的大模型 AI 学习资料已经上传CSDN,朋友们如果需要可以微信扫描下方CSDN官方认证二维码免费领取【保证100%免费
】
😝有需要的小伙伴,可以Vx扫描下方二维码免费领取==🆓