大模型学习过程记录

一、基础知识

自然语言处理:能够让计算理解人类的语言。

检测计算机是否智能化的方法:图灵测试

自然语言处理相关基础点:

基础点1——词表示问题:

1、词表示:把自然语言中最基本的语言单位——词,将它转换成我们机器可以理解的对应词的意思。(即让机器理解这个词是什么意思)

2.词表示的目标:

计算词的相识度;

找出词和词的语义关系;

3.词表示方法的演变过程:

①使用词的近义词或与这个词有关的词表示这个词; (缺点:表示这个词的相关,实际上是有细微差异的,可能会错失一些新的词义,存在主观性)

②目前最常用的方案:将每个词表示为一个独立的符号,这种方法叫做:one-hot representation。(缺点:内存需求会随着词表增大而变大,词义的表示会依赖于词表出现频率)

③建立一个低维的稠密的空间,将每一个词学到这个空间里面,用空间里面的位置所对应的那个向量表示这个词。代表性的方法:word2vec

自然语言处理基础点2——语言模型(language model)

语言模型目的:语言模型其实就是要去能有能力根据前文去预测下一个词的能力。

语言模型主要完成的两个工作: (1)能够计算一个序列的词,它成为一句话的概率到底是什么。(比如:给出多个中文汉字,根据这些汉字出现的顺序组成一句合法的中文语句的概率)

(2)根据前面已经说的话,预测出下一个词是什么。

怎么实现根据前文预测下一个?

原理:一个词出现的概率是只受到它前面出现的这些词的影响。计算公式是:联合概率=累乘(条件概率)

构建语言模型的方法:

过去的方法是:N-gram——前面出现了几个词之后,后面出现的那个词他的频度到底是怎么样的。(原理:马尔科夫假设; 缺点:无法理解相似的词造成什么)

现在的方法是:Neural Language Model——将每个词表示成低维向量,则词性相似对应的向量相似,就可以推出在语境中可能有相似的作用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/526123.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

思科VLAN综合实操中的各项配置操作

一、思科VLAN综合实操中一般会有哪些配置? 在思科VLAN综合实操中,一般会涉及以下配置: 创建VLAN:使用命令 vlan $vlan_id 创建VLAN。 将端口划分到VLAN:使用命令 interface $interface 进入端口配置模式,…

【数据结构】万字长文图解+代码实现AVL树

目录 一、概念 二、图解 1.图解插入 2.图解右单旋 3.图解左单旋 4.图解右左双旋 5.图解左右双旋 6.验证是否是AVL树 三、代码实现 一、概念 AVL树是一种高度平衡的二叉搜索树,得名于其发明者的名字(G. M. Adelson-Velskii和E. M. Landis&#xff0…

Joe主题网站

一款博客网站源码 发现源码为大家内置了主题 清爽又强大真正的永久可用的一条源码,该版本为整合版本,内置了Joe主题,搭建后直接启用即可~ 安装环境要求: PHP 7.2 以上 MySQL, PostgreSQL, SQLite 任意一种数据库支持,…

【Web】浅聊Java反序列化之Rome——关于其他利用链

目录 前言 JdbcRowSetImpl利用链 BasicDataSource利用链 Hashtable利用链 BadAttributeValueExpException利用链 HotSwappableTargetSource利用链 前文:【Web】浅聊Java反序列化之Rome——EqualsBean&ObjectBean-CSDN博客 前言 Rome中ToStringBean的利用…

CorelDRAW Graphics Suite2024专业图形设计软件Windows/Mac最新25.0.0.230版

CorelDRAW Graphics Suite 2024是一款专业的图形设计软件,它集成了CorelDRAW Standard 2024和其他高级图形处理工具,为用户提供了全面的图形设计和编辑解决方案。 该软件拥有强大的矢量编辑功能,用户可以轻松创建和编辑矢量图形,…

在WSL2中安装多个Ubuntu教程

文章目录 前言一、前期准备1、WSL安装2、Docker安装 二、安装第二个Ubuntu系统1.切换为WSL22.获取Ubuntu16.04的tar文件从容器中导出tar 3. 将tar文件导入WSL4. 设置默认用户 总结 前言 适用于 Linux 的 Windows 子系统 (WSL) 是 Windows 的一项功能,可用于在 Wind…

7-15 2.2 译密码

输入5个字母,将其译成密码,密码规律是:用原来的字母后面第4个字母代替原来的字母。例如:A被E代替,C被G代替。 输入格式: 输入一行5个字符 输出格式: 输出一行5个字符 输入样例: China输出样例: Glmre #include …

C语言--函数指针变量和函数指针数组的区别(详解)

函数指针变量 函数指针变量的作用 函数指针变量是指向函数的指针,它可以用来存储函数的地址,并且可以通过该指针调用相应的函数。函数指针变量的作用主要有以下几个方面: 回调函数:函数指针变量可以作为参数传递给其他函数&…

STL之deque容器代码详解

1 基础概念 功能: 双端数组,可以对头端进行插入删除操作。 deque与vector区别: vector对于头部的插入删除效率低,数据量越大,效率越低。 deque相对而言,对头部的插入删除速度回比vector快。 vector访问…

【Node.js】-闲聊:前端框架发展史

前端框架的发展史是一个不断演进和创新的过程,旨在提高开发效率、优化用户体验,并推动前端技术的不断发展。以下是前端框架发展的主要阶段和关键里程碑: 早期阶段: 在这个阶段,前端主要由HTML、CSS和JavaScript等基础技…

解决ChatGPT发送消息没有反应

ChatGPT发消息没反应 今天照常使用ChatGPT来帮忙码代码,结果发现发出去的消息完全没有反应,即不给我处理,也没有抱任何的错误,按浏览器刷新,看起来很正常,可以查看历史对话,但是再次尝试还是一…

计算机视觉——P2PNet基于点估计的人群计数原理与C++模型推理

简介 人群计数是计算机视觉领域的一个核心任务,旨在估算静止图像或视频帧中的行人数量。在过去几十年中,研究人员在这个领域投入了大量的精力,并在提高现有主流基准数据集性能方面取得了显著进展。然而,训练卷积神经网络需要大规…