[AI/GPT] AI大模型的基础概念

news/2025/2/11 9:00:10/文章来源:https://www.cnblogs.com/johnnyzen/p/18706975

概述:AI大模型

基础概念

幻觉现象 = 一本正经胡说八道

  • AI幻觉,是指大语言模型【编造】它认为是真实存在的、甚至看起来合理或可信的信息。
  • 大模型出现幻觉,简而言之就是“胡说八道”。
  • 准确而言,是指模型生成的内容现实世界事实用户输入不一致的现象。
  • 研究人员将大模型的幻觉分为
  • 事实性幻觉(Factuality Hallucination)
  • 忠实性幻觉(Faithfulness Hallucination)。
  • 致使大模型产生幻觉的原因主要有:
  • 数据缺陷
  • 数据中捕获的事实知识的利用率较低
  • 长尾知识回忆不足
  • 难以应对复杂推理的情况

token = 划分方式取决于模型的分词器(tokenizer)

  • 摘要
  • AI大模型中,token是指文本中的最小语义单元,通常是一个单词、一个字符其他子字符串‌
  • token自然语言处理NLP)中扮演着至关重要的角色,它不仅是文本处理的基石,也是人类与机器对话的桥梁‌
  • token的定义和作用
  • token可以是一个单词、一个字符、一个子词单元(如前缀、后缀、词根等),甚至是一个特殊的标记(如换行符、标点符号等)‌
  • 在大模型中,token的划分方式取决于模型使用的分词器tokenizer
  • 常见的分词策略包括:

‌ + 基于字符的分词‌:每个字符(包括字母、数字、标点符号等)都被视为一个单独的token。

例如,文本“hello, world!”会被分解为['h', 'e', 'l', 'l', 'o', ',', ' ', 'w', 'o', 'r', 'l', 'd', '!']‌

‌ + 基于单词的分词‌:每个单词被视为一个单独的token。

例如,文本“hello, world!”会被分解为['hello,', 'world!']。
这种方法在处理英文等以空格分隔单词的语言中比较常见,但在处理中文没有明显单词分隔符的语言时会遇到困难‌

  • 基于子词的分词‌:将单词分解为更小的子词单元。

例如,文本“unbelievable”可能会被分解为['un', 'believ', 'able']。
这种方法结合了基于字符和基于单词的分词的优点,能够更好地处理罕见单词和拼写错误,同时保持模型的效率‌

  • token在不同场景中的应用

在大模型中,token的应用非常广泛。
例如,GPT-3等大语言模型使用token来处理和生成文本。
token不仅限于单词,还可以是一个字符标点符号
具体的划分方式依赖于模型使用的分词算法‌
此外,token图像生成推理大模型中也有应用,自回归模型将图像数据量化为离散token,并通过逐步预测的方式进行生成‌

X 参考文献

  • AI幻觉 - 百度百科
  • 为什么对于同一个问题当多次询问时,大模型会给出不同答案? - Zhihu

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/881490.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

Nacos的应用案例实战

作者:尹正杰 版权声明:原创作品,谢绝转载!否则将追究法律责任。 目录一.Nacos实现服务注册和发现实战案例1.部署Nacos集群2.运行服务提供者的JAVA应用2.1 安装JDK2.2 安装Maven2.3 解压准备好的JAVA示例应用2.4 查看Nacos服务相关配置是否正确信息2.5 编译JAVA代码2.6 运行…

前端如何判断浏览器 AdBlock/AdBlock Plus(最新版)广告屏蔽插件已开启拦截

前端如何判断浏览器 AdBlock/AdBlock Plus(最新版)广告屏蔽插件已开启拦截2个月前AdBlock/AdBlock Plus疑似升级了一次因为自己主要负责面对海外的用户项目,发现以前的检测AdBlock/AdBlock Plus开启状态方法已失效了,于是专门研究了一下。并尝试了很多方法。 已失效的老方法…

[Whole Web] 前端项目规范 -- 4. Git提交信息规范(Commitlint + commitizen + cz-git)

前面讲的都是在git提交之前的一些流程检查,而当我们git提交的时候,提交信息,也应该是需要规范的 commitlint 在使用Git提交代码时,通常都需要填写提交说明,也就是Commit Message git commit -m 提交测试说白了,Commit Message就是我们提交的时候,在-m后面写的提交说明,…

lua包管理器luarocks使用

下载lua 1) 这边用lua 5.1.5 exe文件LuaBinaries - Browse /5.1.5/Tools Executables at SourceForge.net,下载lua-5.1.5_Win64_dll15_lib.zip文件名解释:dll15表示vs2017的编译器,dllg4表示cygwin gcc4.x的编译器, dllw4表示4表示MingW gcc4的编译器 头文件,dll文件LuaBin…

新突破!上海交大重磅新作LIMO:挑战RL Scaling范式

前言 在追求人工智能极限的道路上,"更大即更强" 似乎已成为共识。特别是在数学推理这一被视为 AI 终极挑战的领域,业界普遍认为需要海量数据和复杂的强化学习才能获得突破。然而,来自上海交通大学的最新研究却给出了一个令人震惊的答案:仅需 817 条精心设计的样本…

Paragon ExtFS for Windows – Windows 系统读取 Linux 分区文件软件

Paragon ExtFS for Windows是一款可以让用户在Windows系统下访问和查看Linux分区下文件的工具,支持Ext2/Ext3/Ext4分区,并且支持查看媒体文件和文件导入导出,是一款非常不错的跨平台系统访问工具。 Paragon ExtFS for Windows 是一款可以让用户在 Windows 系统下访问和查看 …

[Whole Web] 前端项目规范 -- 3. Git工作流规范(Husky + Lint-staged)

Git 流程规范配置 在前端项目开发中,规范git提交信息,也是经常使用的手段,如何确保团队成员都遵循ESint规则,且不会将不符合规范的代码推送到Git仓库? 答案是:使用带有git hooks功能的husky。git hooks是git内置的功能,它会在执行Git命令之前(或之后)进行一些其它操作…

《DeepSeek从入门到精通》PDF免费下载

全网疯传的DeepSeek使用教程,DeepSeek:从入门到精通(104页面,资料比较全)(清华大学元宇宙文化实验室出的)全网疯传的DeepSeek使用教程 点击查看原文下载内容简介 DeepSeek:从入门到精通(104页面,资料比较全)(清华大学元宇宙文化实验室出的) 文章中提到了微博、小红书、抖…

【洛谷P3884】二叉树问题[JLOI2009]

这个主要是二叉树的大杂烩 [JLOI2009] 二叉树问题 题目描述 如下图所示的一棵二叉树的深度、宽度及结点间距离分别为:深度:\(4\) 宽度:\(4\) 结点 8 和 6 之间的距离:\(8\) 结点 7 和 6 之间的距离:\(3\)其中宽度表示二叉树上同一层最多的结点个数,节点 \(u, v\) 之间的距…

[Whole Web] 前端项目规范 - 1. 项目风格统一

项目风格统一 在前端项目中存在.vscode文件夹,文件夹下一般存在两个文件extensions.json和setting.json。作用是保持所有开发者安装了相同的插件和相同的配置,保持开发环境一致性。extensions.json 在当前项目中,需要安装哪些插件。 {"recommendations": ["V…

告别熬夜写代码!VSCode+Cline扩展插件+DeepSeek-V3大模型,让你的编程水平瞬间超越99.9%的人

🚀 个人主页 极客小俊 ✍🏻 作者简介:web开发者、设计师、技术分享 🐋 希望大家多多支持, 我们一起学习和进步! 🏅 欢迎评论 ❤️点赞💬评论 📂收藏 📂加关注什么是DeepSeek-V3 DeepSeek是杭州深度求索公司发布的一系列在知识类任务上表现出色的人工智能模型! …

RocketMQ实战—8.营销系统业务和方案介绍

大纲 1.电商核心交易场景的业务流程 2.电商支付后履约场景的业务流程 3.电商营销场景的业务说明 4.电商促销活动的Push推送 5.会员与推送的数据库表结构 6.营销系统的数据库表结构 7.营销系统的基础技术架构 8.XXLJob分布式调度运行原理 9.电商营销系统的工程结构 10.电商营销系…