9.8.3 束搜索

news/2025/2/21 5:03:19/文章来源:https://www.cnblogs.com/dingxingdi/p/18723403

这里从一堆概率的乘积转化为一堆\(\log\)的求和的原因之一也是为了防止数值下溢。然后原文说是为了惩罚长序列,其实是为了惩罚短序列,在没有除以\(L^{\alpha}\)的时候,模型更倾向于输出短的序列,这个操作叫做规范化,如果\(\alpha=1\),则叫做完全规范化

那么调整超参数束宽的时候我们应该怎么调整呢?跟数据集一样,将\(k\)变大肯定没有问题,但是我们的时间是有限的,我们高效率的调整,应该是去发现到底是我们的RNN有问题还是我们的\(k\)设置的太小了。实际上,有一种比较简单的方法去做这件事情,我们利用RNN的功能是计算所有可能情况的概率和束搜索的功能是在所有可能的情况中选取概率最大的就好了
假设现在输入一个句子\(x\),一个好的翻译是\(y^*\),我们预测的翻译是\(\hat{y}\),那么我们只需要比较\(P(y^*|x)\)\(P(\hat{y}|x)\)(不妨忽略规范化)

  • \(P(y^*|x)>P(\hat{y}|x)\)
    这证明RNN的计算功能是没有问题的,是\(k\)太小了
  • \(P(y^*|x)≤P(\hat{y}|x)\)
    这证明RNN是有问题的,我们需要调整RNN

上面的过程是对一个句子而言的,实际中我们将所有预测错误的句子全部进行上面的操作,然后去统计到底是RNN犯的错误更多还是\(k\)犯的错误更多,然后就可以进行调整了(如果是RNN犯的错误更多,我们还可以将RNN犯的错误进行归类,比如RNN的介词弄不好,我们就可以多找一点介词训练样本)

显然,上面的做法只要使用了束搜索都可以用,而不是局限于机器翻译

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/886584.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

中科蓝讯之Downloader的配置介绍(待完善)

Downloader的配置介绍(待完善)系统配置:软开关机(Soft Power On/Off)定义软开关机是指通过软件控制实现的开关机操作。它通常依赖于设备的内部逻辑和软件程序来执行开关机动作。实现方式按键开关:通过按下按键触发设备内部的软件逻辑,实现开关机。例如,智能手机的电源键…

vscode 开始 python

环境变量设置:修改各版本的文件名: vscode 安装: 安装插件:python及python-snippets(cstrap版本) setting.json:加入:"editor.mouseWheelZoom": true,"python.analysis.completeFunctionParens": true设置为命令行: 可以自定义提示补全:

用豆包+Kimi,一分钟生成想要的PPT!

大家好!在快节奏的现代社会,时间就是金钱。对于经常需要制作PPT的朋友们来说,如何快速、高效地完成演示文稿的制作一直是个头疼的问题。今天,我要给大家介绍如何利用AI工具:豆包+kimi,让你在一分钟内轻松生成想要的PPT! 如何使用豆包+kimi生成PPT? 1、确定主题和内容:…

山东布谷科技:Ludo游戏开发全流程揭秘,打造下一个爆款桌游!

还记得童年时和小伙伴们围坐在一起,掷骰子、走棋子,在Ludo棋盘上斗智斗勇的欢乐时光吗?如今,这款经典桌游正以势不可挡的姿态席卷手游市场,成为休闲娱乐的新宠! Ludo起源于印度的古老游戏Pachisi,玩法类似国内的飞行棋,是一种适合2至4人玩的战略类棋盘游戏。其游戏规则…

20250219

1. 鸡蛋开始建仓 2. 胶系迎来变盘窗口。跌破17600之前,维持反弹至18200

179 选择最有可能的句子

对比一下语言模型和机器翻译的区别如下最大的不同就是机器翻译有一个编码和解码的过程(语言模型直接使用零向量作为隐状态),可以理解为机器翻译时一个条件概率,条件就是输入的句子

【Kali】解决Kali Linux中pip安装报错问题

我们在Kali Linux中会用Python执行相关脚本。但是在运行脚本过程中,难免会遇到安装依赖的问题。 如,下面Python代码中。 import requests from bs4 import BeautifulSoup import random分别导入了requests bs4等模块。由于缺少相关模块,代码运行会报错。因此,我们首先需要通…

SAP ABAP ALSM_EXCEL_TO_INTERNAL_TABLE 导入excel 和 GUI_UPLOAD 导入 txt

ALSM_EXCEL_TO_INTERNAL_TABLE 导入excel GUI_UPLOAD 导入 txt 这两个都是比较常见的导入功能,也很好用。 可以自定义封装一个类似下图导入功能。 1.ALSM_EXCEL_TO_INTERNAL_TABLE,这个函数模块可以把用户本地 EXCEL 文件中的一个矩形块中的内容上传到一个内表中。 输入参数…

Hello World---------queue

queue引入Jar 包 activemq-all-5.15.2.jarProducepackage com.city.producer;import org.apache.activemq.ActiveMQConnectionFactory;import javax.jms.*;public class JMSProducer {//默认连接用户名private static final String USERNAME ="admin";//默认连接密码…

Msmap :一个内存 WebShell 生成器

Msmap 是一个内存 WebShell 生成器。兼容各种容器、组件、编码器、WebShell/代理/杀手和管理客户端。用法 git clone git@github.com:hosch3n/msmap.git cd msmap python generator.py编辑config/environment.py # Auto Compile auto_build = True# Base64 Encode Class File b…

【一文解读】内外网文件摆渡系统详解:跨网传输与数据安全保障

在数字化时代,企业在内外网之间传输文件已经成为日常运作的一部分。然而,如何确保在不同网络环境下高效、安全地进行文件传输,成为许多企业面临的重要挑战。内外网文件摆渡系统应运而生,成为解决跨网数据传输瓶颈和保障数据安全的关键工具。本文将深入解析内外网文件摆渡系…