读天才与算法:人脑与AI的数学思维笔记24_预测性文本生成器

1. 起源

1.1. 人类讲故事可能起源于“假如……”这种问答结构

1.2. 讲故事是人类做安全试验的一种方式

1.2.1. 如果你问一个人“假如……”,其实是在探索你的行为对他可能带来的影响

1.3. 最早出现的故事极有可能就源自我们对在周遭混乱的环境中寻找某种秩序的渴望,想要在这个残酷无情的宇宙中找到自身存在的意义

1.3.1. 围坐在火堆旁分享当天的狩猎故事,可以帮助部落在第二天能获取更多的猎物

1.3.2. 智人力量上的短板,在部落的集体智慧中得到了弥补

1.3.3. 这种智慧的力量随着社交和分享的增加而增强

1.3.4. 营地的篝火点燃了人类创造力的火种

1.3.5. 这是一种早期的科学形式

1.4. 算法能不能构想出其他有趣的动物以便推动故事情节的发展?

1.4.1. 就像那些长有头、躯干和腿的动物一样,将不同事物的组成部分解构,然后再通过混合进行重构,就可以创造出千奇百怪的新事物

1.4.2. 这些具有奇技异能的新生物是促使新故事诞生的极佳催化剂

2. 预测性文本生成器

2.1. 到目前为止,大多数例子都基于自上而下的编程思想

2.1.1. 按照明确的规则,可随机填充单词的诗歌模

2.1.2. 将经典作品转换为新作品的代码

2.1.3. 通过编程获取数据并将其转化为故事的算法

2.1.4. 这些程序实际上并没有太多自由发挥的空间

2.2. 机器学习正在改变这一切

2.2.1. 算法可以从小说作者的所有作品中学习,探索他们的写作方式

2.2.2. 如果他们喜欢使用某个特定的词,这个词后面很可能会跟着其他出现频次高的词

2.2.3. 通过构建作者使用单词的概率图,算法可以生成该作者作品的续篇

2.2.4. 这就是预测性文本生成器的工作原理,其产出的文学作品既发人深省又引人入胜

3. Botnik

3.1. 一个名为“Botnik”的公司倡导使用机器学习来创造新文学

3.1.1. 一家研发人工智能自然语言技术的公司

3.1.2. 其致力于开发能与人协作的内容创作工具,即用人工智能挖掘人类的创造潜能

3.2. 该公司由作家杰米·布鲁(Jamie Brew)和《纽约客》(The New Yorker)前漫画编辑鲍勃·曼考夫(Bob Mankoff)于2016年创立

3.3. 算法有时会输出出人意料的超现实主义作品

3.3.1. Botnik为《宋飞正传》写出了精彩的剧本

3.3.2. Botnik还制作了一份感恩节食谱,并在YouTube上发布了一段视频,让人们了解如果把烹饪这件事交给算法

3.4. Botnik在学习了《哈利·波特》七卷丛书之后,生成了三页几乎可以以假乱真的续集

3.4.1. 有些时候,算法才是最纯粹的“天才”

3.5. Botnik确实可以从构建句子的方式中学习、辨认、识记,但其所捕捉到的只是这样一个事实存在:作者的写作风格

3.5.1. 只捕捉到了这一点:文本的局部,却没有从整体上考虑叙事结构

3.5.2. 就像爵士乐的“续作者”一样,它可以生成一些以假乱真的乐句,但最终还是难逃走向乏味、无聊和枯竭,因为算法不知道该继续向何处发展音乐

3.5.3. 小说家们很快就会失业是不大可能的

4. Scheherazade-IF

4.1. 2012年,乔治亚理工学院的马克·里德尔(Mark Riedl)和他的同事开发了一个会讲故事的算法“Scheherazade-IF”

4.1.1. 这个算法名字中的“Scheherazade”来源于王后山鲁佐德为暴虐的国王讲故事来安抚他的传说,她是一位优秀的故事讲述者

4.1.2. “IF”取自“Interactive Fiction”,意为交互式小说

4.2. 目标是在故事发展可能性的迷宫中找到一条更加连贯畅通的路径

4.3. 由于人类具备许多现实世界的知识,所以他们都是天生的、优秀的故事讲述者

4.4. 如果你要求Scheherazade-IF构建一个关于某个特定主题或情境的故事,而这个主题或情境它之前从未遇到过,那么它就会通过搜集和消化之前的故事来进行学习

4.5. Scheherazade-IF从由一大群人构成的大规模知识库中汲取新的信息并充分消化,再将这些范例汇总形成一个树状图,图中列出故事发展的各种可能方向

4.5.1. 好的故事讲述者,会在故事发展树状图中找到最佳的路径

4.5.2. 在很多故事情节会随玩家的选择而走向不同结局的开放性电脑游戏中,这种方法非常奏效

4.6. Scheherazade-IF正尝试通过它在网上收集到的数据,生成故事发展的可能性树状图,进而实现这一点

4.6.1. 它所做的选择获得的满意度得分可以与人类相媲美,远远高于随机生成的故事

5. Whim

5.1. What If Machine

5.2. 由欧盟资助的Whim(What If Machine)项目所试图解决的问题

5.2.1. 从网上搜罗以前的故事把它们重新组合在一起固然不错,但想象一下如果是前所未见的场景会有怎样的结果?

5.3. 作家在尝试创造新作品时面临的一个问题是,他们会卡在自己有限的固定思维模式里

5.3.1. Whim通过提供焕然一新的故事场景,把故事讲述者带出他们的舒适区

5.4. 由Whim生成的一个故事情节,最终促成了一部音乐剧于2016年在伦敦西区上演

5.4.1. 筛选算法分析音乐剧走红或惨败的原因,为Whim提供故事情节进一步发展的建议

5.4.2. 2016年春天,《飞越藩篱》在伦敦西区的艺术剧院进行了短暂的演出

5.4.2.1. 为完成这一作品,人类的干预可能和电脑的创造力一样多

6. 普洛普写手

6.1. PropperWryter

6.2. 在生成童话故事方面,另一个算法“普洛普写手”(PropperWryter)更胜一筹

6.3. 1928年,形式主义语言学家、民俗学家弗拉基米尔·普洛普(Vladimir Propp)在他的《故事形态学》里提出,俄国民间故事有31种叙事原型

6.4. “普洛普写手”把Whim提供的情节最终发展成为一个关于格林汉姆普通妇女反核运动的故事

6.4.1. 其音乐由另一个名为“机器人劳埃德·韦伯”(Android Lloyd Webber)的算法提供

7. “自动化”数学家

7.1. 数学家如果能提出诸如“假如……”这一类的问题,就意味着他距离突破知识边界已经只有一步之遥了

7.1.1. 假如有一个数的平方值为–1

7.1.2. 假如弯曲空间中,两条平行线可以相交

7.1.2.1. 黎曼几何

7.2. 打破固有的结构框架,从变化中探索有价值的新发现,是编写新的数学“故事”的经典工具

7.3. 如果数学是用数字讲述的故事,那么目前的算法在生成新的数学故事方面有多大的价值呢?

8. 整数序列在线百科全书

8.1. oeis dot org

8.2. 其目的旨在收集所有有趣的数列,并探索生成这些数列的公式或方法

8.3. 由素数(或者说除了1和它本身以外不再有其他因数的自然数)构成的数列

8.3.1. 对于该数列,很难找到一个通项公式来生成下一个数,这也是数学界公认的未解之谜之一

8.4. 可重分解因子数是一项由机器生成的发明

8.4.1. 可重分解因子数”(refactorable numbers)的概念,其定义为:数列中每个数字的因数个数,本身又是该数字的因数

8.4.2. 该数列中的奇数,被称为“奇数可重分解因子数”

8.4.2.1. odd refactorable numbers

8.4.3. 算法推测:所有的奇数可重分解因子数都是完全平方数

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/687226.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【RocketMQ问题总结-2】

RocketMQ 消息持久化 Broker通过底层的Netty服务器获取到一条消息后,会把这条消息的内容写入到一个CommitLog文件里去(一个Broker进程就只有一个CommitLog文件,也就是说这个Broker上所有Topic的消息都会写入这个文件)。 同时&…

贪心算法----最大数

今日题目:leetcode179------点击跳转题目 分析: 要把这些数组组成最大的数,首先我们把数字转化为字符串,根据自定义的排序规则把这些字符串字数排列,再用一个字符串接受这些字符串数字拼接成最大的字符串数字 排序规则…

Gradient发布支持100万token的Lllama3,上下文长度从8K扩展到1048K

前言 近日Gradient公司在Crusoe Energy公司的算力支持下,开发了一款基于Llama-3的大型语言模型。这款新模型在原Llama-3 8B的基础上,将上下文长度从8000 token大幅扩展到超过104万token。 这一创新性突破,展现了当前SOTA大语言模型在长上下…

while 习题

while 结构 习题 1.计算1到100所有整数和 2.提示用户输入一个小于100的整数,并计算从1到该数之间所有整数的和 3.求从1到100所有整数的偶数和、奇数和 echo -e \n 可以实现换行 4.用户输入密码,脚本判断密码是否正确,正确密码为123456&am…

章十二、数据库(1) —— 概述、MySQL数据库、SQL、DDL、DML、DQL、多表设计

为什么学习数据库: ● 实现数据持久化到本地; ● 使用完整的管理系统统一管理,可以实现结构化查询,方便管理; 一、 数据库概述 ● 数据库 数据库(DataBase)为了方便数据的 存储 和 管理 &…

01、vue+openlayers6实现自定义测量功能(提供源码)

首先先封装一些openlayers的工具函数,如下所示: import VectorSource from ol/source/Vector; import VectorLayer from ol/layer/Vector; import Style from ol/style/Style; import Fill from ol/style/Fill; import Stroke from ol/style/Stroke; im…

【Linux】项目自动化构建工具make/makefile

🎉博主首页: 有趣的中国人 🎉专栏首页: Linux 🎉其它专栏: C初阶 | C进阶 | 初阶数据结构 小伙伴们大家好,本片文章将会讲解Linux中项目自动化构建工具make/makefile的相关内容。 如果看到最后…

单链表经典oj题(2)

前言 这次将要把剩下的oj题将以图解和自己的理解把它讲解完,希望对大家有所帮助,这次的讲解也是干货 第一题 21. 合并两个有序链表 - 力扣(LeetCode) ok这次就简单点,大家自己去看题目了 将两个升序链表合并为一个…

Ubuntu18.04--虚拟机配置Samba并从Windows登录

前言: 本文记录我自己在Windows上安装 Virtualbox ,并在Virtualbox中安装 Ubuntu-18.04 虚拟机,在Ubuntu-18.04虚拟机里安装配置Smaba服务器,从 Windows 宿主系统上访问虚拟机共享samba目录的配置命令。 引用: N/A 正文 虚拟…

​​​【收录 Hello 算法】5.1 栈

目录 5.1 栈 5.1.1 栈的常用操作 5.1.2 栈的实现 1. 基于链表的实现 2. 基于数组的实现 5.1.3 两种实现对比 5.1.4 栈的典型应用 5.1 栈 栈(stack)是一种遵循先入后出逻辑的线性数据结构。 我们可以将栈类比为桌面上的一摞盘子…

Linux diff命令(比较两个文件或目录的内容差异)

文章目录 Linux diff 命令详解教程基本用法比较文件输出解释 递归比较(-r)示例代码 控制输出格式统一格式(-u)上下文格式(-c) 高级选项忽略所有空白差异(-w)仅报告文件是否不同 Linu…

SVN 合并到 Git 时有文件大于 100 M 被限制 Push

如果有文件大小大于 100M,GitHub 是会被限制推送到仓库中的,大概率情况会显示下面的错误: remote: Resolving deltas: 100% (3601/3601), done. remote: error: Trace: aea1f450da6f2ef7bfce457c715d0fbb9b0f6d428fdca80233aff34b601ff59b re…