读人工智能时代与人类未来笔记06_机器学习的力量

news/2025/2/19 9:57:21/文章来源:https://www.cnblogs.com/lying7/p/18198838

1. 挑战

1.1. 不同的目标和功能需要不同的训练技术

1.2. 我们必须关注人工智能的潜在风险

1.2.1. 应对日益盛行的人工智能将带来的风险，是一项必须与该领域的进步并行的任务

1.3. 我们不能将其开发或应用随便交予某个群体，无论这个群体是研究人员、公司、政府还是民间社会组织

2. 机器学习的三种形式

2.1. 监督学习

2.1.1. 监督学习是一种卓有成效的方法，可以用于创建一个模型来预测响应新输入的输出

2.1.2. 人工智能开发人员使用了一个包含示例输入的数据集，并且这些示例根据期望的输出或结果分别进行了标记

2.1.3. 发现Halicin的人工智能便是由监督学习产生的

2.2. 无监督学习

2.2.1. 在无监督学习中，训练数据只包含输入

2.2.2. 在只有大量数据的情况下，开发人员可以使用无监督学习来提取可能有用的见解

2.2.3. 无监督学习允许人工智能在没有任何结果信息的情况下识别模式或异常情况

2.2.4. 通过无监督学习训练的人工智能可以识别出人类可能因为模式间的微妙差别、数据规模过大或两者兼有而错过的那些模式

2.2.5. 此类人工智能也和人类自学者一样，可能给出古怪荒谬、毫无意义的结果

2.3. 强化学习

2.3.1. 在强化学习中，人工智能不是被动地识别数据之间的关系，它是受控环境中的“智能体”，会观察并记录环境对其行为的反应

2.3.1.1. 强化学习需要人类参与创建人工智能训练环境（即使人类在训练过程中不提供直接反馈）：人类定义了模拟器和奖励函数，人工智能则在此基础上进行自我训练

2.3.2. 即使是在模拟的、简化的环境中，比如一场国际象棋比赛，一步走棋也可能引发一连串的机会和风险

2.3.3. 在装配线上精准模拟机器人的操作显然比在拥挤混乱的城市街道上更容易

2.3.4. 其结果便是，指导人工智能在人工环境中自我训练通常并不足以产生最佳表现，还需要有反馈

2.3.5. 奖励函数的任务就是提供这种反馈，为的是向人工智能表明它的方法有多成功

2.3.5.1. 作为替代，程序员将这种奖励函数自动化，谨慎而又精确地指定该函数如何运行及如何模拟现实的性质

2.3.5.2. 在理想情况下，模拟器提供真实的体验，奖励函数则促进有效的决策

2.3.5.3. 为了获得有意义的结果，对模拟器和奖励函数的周密规范至关重要

3. 机器学习的力量

3.1. 在农业领域，人工智能使得农药的精确管理、疾病的检测和作物产量的预测更为便利

3.2. 在医学领域，人工智能促进了新药的发现、现有药物新应用的鉴定，以及对未来疾病的检测或预测

3.2.1. 人工智能已通过识别细微的放射指标，比人类医生更早地发现了乳腺癌

3.2.2. 通过分析视网膜照片发现了失明的原因之一是视网膜病变

3.2.3. 通过分析病史预测糖尿病患者的低血糖

3.2.4. 通过分析遗传密码发现了其他遗传性疾病

3.3. 在金融领域，人工智能被用来帮助推进贷款批准（或拒绝）、收购、合并、破产声明和其他交易流程

3.4. 千百年来，人类一直无法跨越文化和语言鸿沟进行清晰的沟通

3.4.1. 由于存在语言之间的理解误差，而且无法用一种语言向另一种语言的使用者传达信息，人类彼此之间产生了误解，阻碍了贸易，甚至引发了战争

3.4.2. 在巴别塔的故事中，这种语言的阻隔是人类不完美的象征，也是对人类傲慢的痛苦惩罚

3.5. 机器翻译水平突飞猛进

3.5.1. 与其说是因为应用了神经网络或机器学习技术，不如说是这些方法全新的、创造性的应用催生了这一进步

3.5.2. 从机器学习的基本构建模块开始，开发人员能够以巧妙方式继续创新，并在这个过程中解锁新的人工智能

3.5.3. 要将一种语言转换为另一种语言，译者需要捕捉特定的模式，即顺序依赖关系

3.5.4. 与传统的监督学习相比，语言翻译研究人员采用了“平行语料库”(parallel

corpora)技术，这种技术在训练中不需要输入和输出之间有具体对应关系

3.5.4.1. 这种方法极大地限制了训练数据量以及可用的文本类型

3.5.4.1.1. 政府文本和畅销书经常被翻译，但期刊、社交媒体、网站和其他非正式作品一般并无此待遇

3.5.4.2. 这种训练人工智能粗略匹配（而非翻译）文本主体的过程，即为平行语料库技术

3.5.4.3. 被用于训练的是高度近似的或部分的信息

3.5.5. 当谷歌翻译开始采用使用平行语料库训练的深度神经网络时，其性能提高了60%，而且此后一直在不断提高

3.5.6. 自动化语言翻译的巨大进步有望令商业、外交、媒体、学术界和其他领域均为之一变，因为人们可以比以往任何时候都更容易、更快捷、更廉价地接触到非母语

3.6. 机器学习不仅拓宽了人工智能的适用范围，还彻底改变了人工智能本身，甚至在以往的方法曾取得成功的领域（如基于符号和规则的系统）也莫不如此

3.6.1. 标准的神经网络可以识别输入和输出之间的关联模式，比如那些抗生素的一系列化学属性

3.6.1.1. 谷歌的BERT就是一种旨在改进搜索的双向转换器

3.6.2. 翻译文本和分类图像的能力是一回事，生成（亦即创建）新文本、新图像和新声音的能力则是另外一回事

3.7. 生成式神经网络，却可以实现创建

3.7.1. 生成式神经网络使用文本或图像进行训练

3.7.2. 它们产生新的文本或图像，这些文本或图像是合成的，但也是真实的

3.7.2.1. 从概念上讲，它们与其“前辈”已有所不同

3.7.2.2. 这些所谓的生成器的应用是令人惊愕的

3.7.2.2.1. 如果它们被成功应用于编码或写作，那么作者可以简单地创建一个大纲，然后让生成器来填充细节

3.7.2.2.2. 生成器还可能被用来进行深度伪造，即对人们从未做过的事情或说过的话进行虚假描述，且足以乱真

3.7.3. 生成器将丰富我们的信息空间，但如果没有监督，它们也可能模糊现实和幻想之间的界限

3.7.4. 能够产生类人文本的GPT-3是最值得关注的生成式人工智能之一

3.7.4.1. 它打开了将语言翻译转化为语言生产的新局面

3.7.5. 经过对主要来自互联网的大量数据的训练，转换器还可以将文本转换为图像或进行反向操作，即扩展和压缩描述，并执行与此类似的任务

3.8. 当一项技术变得更加强大、更加普遍时，其发展也必然伴随着挑战

3.8.1. 我们大多数人最常使用的在线功能“个性化搜索”就是一个例证

3.8.1.1. 人工智能可以记住搜索引擎以前被问及的事情及其作为回应而产生的概念

3.8.1.2. 从理论上讲，这对用户也越来越有帮助

3.8.2. 在线流媒体服务也在如法炮制，它们利用人工智能使针对电视节目和电影的建议更明确、更积极，或给出人们希望获得的更多答案

3.8.3. 随着人工智能对人们的了解越来越深入，获得的结果大体上还是积极的

4. 生成对抗网络

4.1. 简称GAN

4.1.1. 一种常见的生成式人工智能训练技术是让两个学习目标互为补充的网络进行对抗

4.2. 生成器网络的目标是产生潜在的输出，而判别器网络的目标是防止产生不良的输出

4.3. 生成器的任务是进行头脑风暴，而判别器的任务是评估哪些想法是相关的和现实的

4.4. 在训练阶段，生成器和判别器交替训练，训练判别器时保持生成器不变，反之亦然

4.5. 经过GAN训练的人工智能可以在人们起草电子邮件时建议补全句子，或者允许搜索引擎完成部分查询

4.6. 程序员可能很快就能省力了，他们只要勾勒出所需程序的大纲，然后将大纲交给人工智能完成即可

5. 过滤

5.1. 过滤可以帮助引导选择

5.1.1. 在现实世界中，外国游客会雇用导游，并根据自己的宗教信仰、国籍或职业，让导游带他们参观他们认为最值得去的历史古迹或最有意义的景点

5.2. 过滤也可以通过省略和遗漏信息而成为一种审查制度

5.3. 在网络空间，过滤会自我强化

5.3.1. 它会放大一些主题和来源，并出于实际需要而对其他内容视而不见

5.3.2. 这种事实上的遗漏的后果是双重的：既可以让个人变得闭目塞听，也可以让这些个体彼此难以一致

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.hqwc.cn/news/708075.html

如若内容造成侵权/违法违规/事实不符，请联系编程知识网进行投诉反馈email:809451989@qq.com，一经查实，立即删除！

[转帖]JVM内存配置最佳实践

https://help.aliyun.com/zh/sae/use-cases/best-practices-for-jvm-heap-size-configuration 如果JVM堆空间大小设置过大，可能会导致Linux系统的OOM Killer被激活，进而结束（kill）Java应用进程，在容器环境下可能会表现为频繁异常重启。本文介绍在容器环境下JVM堆参数的配…

高通在推动混合 AI 规模化扩展方面独具优势

高通在推动混合 AI 规模化扩展方面独具优势摘要正如白皮书第一部分所言，在云端和终端进行分布式处理的混合 AI 才是 AI 的未来。混合 AI 架构，或仅在终端侧运行 AI，能够在全球范围带来成本、能耗、性能、隐私、安全和个性化优势。高通正在助力实现随时随地的智能计算。…

自动获取随笔链接（用于博客签名或者版权信息）

今天弄了好久也不知道怎样自动获取每篇文章对应的链接，就在这时，突然发现博客签名里面有一个模板选项，下拉有个转载声明选择框，如下：点完之后，出现了我想要的东西！！这不就是我心心念念、苦苦寻找的自动获取文章链接函数吗？！ <p>本文来自博客园，作者：{autho…

MySQL下载并安装(Windows)

下载MySQL：下载地址：https://dev.mysql.com/downloads/mysql/ 安装MySQL：解压下载的MySQL压缩包，并添加到环境变量中去添加环境变量，请参照（https://www.cnblogs.com/pslsy/p/16226535.html）进行添加管理员方式打开cmd，或者右键单击开始菜单图标，选择Windows powers…

发现一个好看的电脑壁纸网站

网站截图如下：废话不多说，上链接！！ https://bz.zzzmh.cn/index作者：Shu-How Z 出处：http://www.cnblogs.com/zhangshuhao1116/个性签名：功不唐捐玉汝于成行而不辍未来可期著作权归作者所有。商业转载请联系作者获得授权，非商业转载请注明出处。来源：博客园cnblogs …

MJUCTF—WP

1.猫娘点开发现有两个文件, 一个加密压缩包, 一个word文档点开word发现是兽音加密, 点开在线网站进行解密# 得到一段文本, 先进行分割小小年内则伏勤, 阵阵寒风刺骨寒。是处寂寞无人问，一个身影自徘徊。个人的技艺超群, 福泽润物春意暖，瑞气盈盈岁月新, 控制人生如棋…

本地浏览器查看云服务器训练模型的tensorboard界面

最近还是在搞YOLO弄毕业设计，一开始是在自己电脑上训练的，但是当开始训练时电脑就卡得不行，别的啥都干不了；另一方面训练速度也特别慢，还得一直开着机不能中断。索性尝试把模型部署到阿里云服务器上训练，用的最低的2核2G的配置，勉勉强强能跑起来，好处自然是不占用自己…

关于单向循环链表的创建、插入、删除、遍历

关于单向循环链表的创建、插入、删除、遍历、单向循环链表的公式单向循环链表的代码 #include <stdio.h> // 标准输入输出头文件 #include <string.h> // 字符串处理头文件 memset/清空 #include <stdlib.h> // 标准库头文件 …

AnimationCurve关键帧数值修改小工具

效果图用途：界面动效已经由动效人员A做完(假设k了100帧)，然后UI同事又把一些节点的位置做了10px的调整此时一帧一帧去手动改，费事费力还可能出错。这个工具的用途就是：对相关节点的所有关键帧批量做偏移。public class AnimClipEditWnd : EditorWindow {[MenuItem(&quo…

elastic使用postman操作

1、账号认证 2、elastic索引put请求，创建索引 get请求，查询所有索引get请求，查询索引 delete请求，删除索引 put请求，增加文档数据 get请求，查询文档数据简单查询，按id简单查询，查询固定index索引下的所有数据修改数据整条修改局部修改

Python没有服务器如何部署运行Shiny应用程序

原文链接：https://tecdat.cn/?p=36205 原文出处：拓端数据部落公众号随着Web技术的快速发展，越来越多的数据科学家和开发人员倾向于使用Web应用程序进行数据分析和可视化。Shiny for Python作为一种流行的Web应用程序框架，为Python开发人员提供了便捷的数据展示和交互工具…

R语言CART决策树、随机森林、chaid树预测母婴电商平台用户寿命、流失可视化

全文链接：http://tecdat.cn/?p=31644 原文出处：拓端数据部落公众号借着二胎政策的开放与家庭消费升级的东风，母婴市场迎来了生机盎然的春天，尤其是母婴电商行业，近年来发展迅猛。用户获取和流失是一对相对概念，就好比一个水池，有进口，也有出口。我们不能只关心进口的…