AIGC学习笔记(1)——AI大模型提示词工程师

文章目录

  • AI大模型提示词工程师
    • 1 Prompt工程之原理
      • 1.1 AIGC的发展和产业前景
        • 前言
        • AIGC时代的到来
        • 发展趋势和应用展望
      • 1.2 大模型的类型和特点
        • 大模型的对比
        • 上手
        • 特点
      • 1.3 大模型技术原理和发展
        • 成语接龙和暴力穷举
        • ChatGPT如何理解人类语言
        • 如何存储数据
        • 图像存储
        • 电脑存数字
        • 如何让电脑知道存的什么?
        • 向量化
        • 为什么需要向量化
        • 向量可以计算
        • 难点
        • 调整位置
        • 科学的方式
        • Word2vec算法
        • 信息压缩与特征提取
        • 谷歌论文-自注意力机制
        • TransFormer算法演进
        • 通用人工智能模型
    • 2 Prompt工程之原则
      • 2.1 设计Prompt的3个原则
        • 相关性
        • 确定焦点
        • 清晰度
      • 2.2 设计Prompt的1个万能公式
      • 2.3 设计Prompt的5个技巧
      • 2.4 设计Prompt高质量答案的2个窍门
    • 3 Prompt工程之迭代
      • 3.1 Prompt优化与迭代
      • 3.2 Prompt样本提示
        • 零样本提示(Zero-shot Prompting)
        • 少量样本提示(Few-shot Prompting)
      • 3.3 Prompt思维链提示
        • 文本转化
        • Zero-shot CoT 零样本思维链
        • 自洽性/自一致性(Self-Consistency)
      • 3.4 Prompt生成知识提示
        • 生成知识提示(Generate Knowledge Prompting)
    • 4 Prompt工程之应用
        • 4.1 Prompt文本总结
      • 4.2 Prompt文本判断
      • 4.3 Prompt文本转化
      • 4.4 Prompt文本扩展

AI大模型提示词工程师

1 Prompt工程之原理

1.1 AIGC的发展和产业前景

前言
  • 什么是AI?
    • 人工智能(Artificial Intelligence)
  • 什么是AGI?
    • 通用人工智能(Artificial General Intelligence)
  • 什么是AI2.0?
    • ChatGPT的横空出世代表着 AI2.0 时代,也就是通用人工智能时代
  • 什么是大模型?
    • 是大规模语言模型(Large Language Model)的简称。语言模型是一种人工智能模型,他被训练成理解和生成人类语言。“大”是指模型的参数量非常大,比如ChatGPT、文心一言等。
AIGC时代的到来
  • 出现了大量的内容生产工具,比如 ChatGPT、Midjourney、Stable Diffusion等。
  • PGC专业生成内容(Professional Generated Content)
  • UGC用户生成内容(User Generated Content)
  • AIGC人工智能生成内容(Artificial Intelligence Generated Content)
发展趋势和应用展望
  • 发展趋势:
    • 更强大的模型
    • 多模态的生成
    • 个性化生成
  • 应用展望:
    • 内容创作和自动写作
    • 娱乐和游戏
    • 广告和营销
    • 个性化组手和教育
    • 自动化客服
  • 会不会是泡沫?
    • OpenAI创始人 Sam Altman:AI是少有的被严重炒作之后,还被严重低估的东西。

1.2 大模型的类型和特点

大模型的对比

image.png

上手

image.png

特点
  • 知识丰富
  • 道德感强,法律边界清晰
  • 有记忆力,可联系上下文
  • 知错就改
  • 知人晓事

1.3 大模型技术原理和发展

成语接龙和暴力穷举

image.png

ChatGPT如何理解人类语言
  • 计算机底层:二进制
  • 将 现实问题 转化为 数学问题
如何存储数据
图像存储
电脑存数字
如何让电脑知道存的什么?
  • 向量化
  • 信息压缩与特征提取
向量化
  • 将 东西 与 数字组合,比如 [0, 180, 75, 35] 分别表示 [性别, 身高, 体重, 年龄]
为什么需要向量化
  • 方便电脑处理
  • 寻找规律
向量可以计算
难点
  • 坐标要多少维度?
  • 每个维度代表什么?
调整位置
  • 通过计算距离,不断调整位置
科学的方式

image.png

Word2vec算法

image.png

信息压缩与特征提取

image.png

谷歌论文-自注意力机制
  • 解决了自然语言特征提取的问题

image.png

TransFormer算法演进

image.png

通用人工智能模型
  • 在此之前,都是一些细分领域:围棋、玩游戏、图像识别、设计模型、标注数据等
  • 而通用人工智能,是利用自然语言,理解整个文明成果的能力,和人类无缝交流的能力

image.png

image.png

2 Prompt工程之原则

2.1 设计Prompt的3个原则

相关性
  • 提示词应该与当前话题或内容相关。
确定焦点
  • 提示词应该能够引起人们的注意力并帮助他们专注于重点。
  • 避免用一些专业的术语,或者一些模糊的语言。
清晰度
  • 提示词应该能够明确传达出想要表达的意思。

2.2 设计Prompt的1个万能公式

  • 内容前提:让ChatGPT知道你是谁
  • 角色设定:给ChatGPT赋予一个身份,让他知道他是谁
  • 明确目标:明确的目标指令,指令一定要清晰
  • 补充需求:回答需要注意什么,或者回答范围和形式等

image.png

2.3 设计Prompt的5个技巧

  • 优化表达式
  • 用继续不断输出
  • 由浅入深,提升问题质量
  • 预设回答方案
  • 给参考答案,让GPT更懂你

2.4 设计Prompt高质量答案的2个窍门

  • 加强 GPT 的思辨分析意识
  • 给 GPT 划分范围

3 Prompt工程之迭代

3.1 Prompt优化与迭代

  • 通常情况下,Prompt很难一次性到位,就需要根据大模型给出的结果,然后不断迭代Prompt

3.2 Prompt样本提示

零样本提示(Zero-shot Prompting)
  • 也就是不需要微调,不需要提供任何示例样本就可以直接通过提问来让模型解决相应的任务。这是因为模型本身就通过了大量数据进行了训练。
少量样本提示(Few-shot Prompting)
  • 在需求比较复杂时,可以使用 few-shot 少量样本提示,相当于在 Prompt 中给问题提供一个 Context 上下文,在上下文里给模型提供示例。
  • 这个示例的作用实际是引导,引导模型找到对应的回答方式,从而生成更准确的响应。

3.3 Prompt思维链提示

文本转化
  • 对于一些需要推理的复杂任务,few-shot就无能为力了。这个时候就引申出一个概念:思维链提示-CoT(Chain-of-Thought Prompting)通常涉及到推理的复杂任务,并不是一步直接得到答案,中间会有很多的计算和推理过程。
在这些数字中,1,3,5,23,69,70,10,84,923,32 有多少个奇数,多少个偶数。
Zero-shot CoT 零样本思维链
  • 让 AI 通过思维推理,分析出最终答案
在这些数字中,1,3,5,23,69,70,10,84,923,32 有多少个奇数,多少个偶数。请一步一步思考
自洽性/自一致性(Self-Consistency)
  • 让ChatGPT 产生多个思维链,也就是多个推理路径,最终选择一个一致性最高的答案。
为一个问题,提供3个解决方案,最终结合3个解决方案给出与问题一致性最高的答案
从北京如何到大理?

3.4 Prompt生成知识提示

生成知识提示(Generate Knowledge Prompting)
  • 还有很小情况下,我们无论怎么让模型思考,都无法解决我们的问题。因为模型本身可能缺少解决问题的背景知识,或者模型想到不到要用什么背景知识。
    • 前者:只能是我们主动通过上下文 Context 的方式把背景知识直接添加到 Prompt 中,再让模型去回答。
    • 后者:可以先给模型一些示例,让模型自己去生成对应问题的背景知识,这个技巧就是【生成知识提示】。这样有了背景知识后,再把生成后的背景知识添加到 Context 中向模型提问,这样模型因为有了背景知识自然就能准确回答我们的问题。

4 Prompt工程之应用

4.1 Prompt文本总结
  • 可以总结评论、新闻等文案,生成简短的摘要

image.png

4.2 Prompt文本判断

  • 输入文本,执行模种分析任务,可能是:提取标签、提取名称、理解文本情感

image.png

4.3 Prompt文本转化

  • 擅长将输出转化为不同格式,比如从一种语言翻译成另一种语言,帮助拼写、语法纠正和编写正则表达式。

image.png

4.4 Prompt文本扩展

  • 将短文本,例如一组说明或主题列表,输入到大语言模型中,让模型生成更长的文本,例如基于某个主题的电子邮件或论文。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/327129.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

echarts 仪表盘进度条 相关配置

option {series: [{type: gauge,min: 0,//最大值max: 100, //最小值startAngle: 200,//仪表盘起始角度。圆心 正右手侧为0度,正上方为90度,正左手侧为180度。endAngle: -20,//仪表盘结束角度splitNumber: 100, //仪表盘刻度的分割段数itemStyle: {color…

虾皮怎么选品:虾皮(Shopee)跨境电商业务成功的关键步骤

在虾皮(Shopee)平台上进行跨境电商业务,选品是至关重要的一环。有效的选品策略可以帮助卖家更好地了解市场需求,提高销售业绩和客户满意度。以下是一些成功的选品策略,可以帮助卖家在虾皮平台上取得更好的业务成绩。 先…

算法训练day60|单调栈part0

参考:代码随想录 84.柱状图中最大的矩形 要求当前柱形的左右两边第一个比他小的位置 对于高度为5的柱子(index为2) mid 他的左边第一个比他小的柱子为1,index为1 left 他的右边第一个比他小的柱子高度为2,index为4…

【前端】[vue3] vue-router使用

提示:我这边用的是typeScript语法,所以js文件的后缀都是ts。 安装vue-router: (注意:vue2引用vue-router3 vue3才引用vue-router4) npm install vue-router4src文件夹下面创建 router/index.ts(…

ES -极客学习

Elasticsearch 简介及其发展历史 起源 Lucene 于 Java 语言开发的搜索引擎库类创建于 1999 年,2005 年成为 Apache 顶级开源项目Lucene 具有高性能、易扩展的优点Lucene 的局限性 只能基于 Java 语言开发类库的接口学习曲线陡峭原生并不支持水平扩展原生并不支持水…

软件测试|SQL JOIN的用法,你会了吗?

SQL JOIN 是在关系型数据库中常用的操作,用于将两个或多个表中的数据合并起来,以满足查询需求。本文将介绍 SQL JOIN 的基本概念、不同类型的 JOIN,以及使用示例。 SQL JOIN 的概念 在关系型数据库中,数据通常分布在多个表中&am…

低代码开发会取代传统开发吗? 两者有什么区别 该如何选择

低代码开发技术在近几年逐渐被普及,帮助很大一部分开发者完成了复杂的工作。由于低代码开发方案入门门槛低且上手难度小,所以即使是非专业人士也可借助其便利性自主开发软件系统,整个开发过程几乎不需要专业程序员。久而久之就出现了一种声音…

基于JavaWeb+SSM+Vue四六级词汇微信小程序系统的设计和实现

基于JavaWebSSMVue四六级词汇微信小程序系统的设计和实现 源码获取入口KaiTi 报告Lun文目录前言主要技术系统设计功能截图订阅经典源码专栏Java项目精品实战案例《500套》 源码获取 源码获取入口 KaiTi 报告 (1)课题背景 伴随着社会的快速发展, 现代社…

Git保姆级安装教程

Git保姆级安装教程 一、去哪下载二、安装2.1 具体安装步骤2.2 设置全局用户签名 一、去哪下载 1、官网(有最新版本):https://git-for-windows.github.io/ 2、本人学习时安装的版本,链接:https://pan.baidu.com/s/1uAo…

locust 快速入门--程序调试

背景 对测试的api引入locust后,不在使用requests库进行http请求了,而是通过client属性发送请求,实质是使用HttpSession。 问题:如果对locust程序进行调试 解决方案: 因为locust使用协程,需要开启pych…

解决vue3中watch 监听不到旧值的问题,亲测有效!

问题描述 这个问题是我在公司vue3项目的时候发现的一个问题,watch 在监听对象/数组变量的变化时,发现对象的数据变化时 旧数据 获取到的和新数据是一样的 类似于下面这样 const objref({a:我是原来的值,b:6, })obj.a改变值watch(obj,(nel,old)>{ c…

LeetCode-有效的字母异位词(242)

题目描述: 给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。 注意:若 s 和 t 中每个字符出现的次数都相同,则称 s 和 t 互为字母异位词。 思路: 这题还是比较简单的,首先将两个字符…