构建LLM辅助生物威胁制造预警系统 人类越发展获取的超能力越大,破坏力越大,威胁越大。我们需要什么样的预警系统?既克服威胁又具有超能力 安全基础

https://openai.com/research/building-an-early-warning-system-for-llm-aided-biological-threat-creation

人类越发展获取的超能力越大,破坏力就越大,威胁越大。

人工智能就是为了赋予人人都能有超能力,而一旦被恶意或无意使用又威胁到人人。

中国神话《后羿射日》中同时出现十个太阳,无意间造成了人间惨剧。弹指间就是世界末日。

防止坏人利用工人智能获得超能力,感觉不太可能。就像现在的核武器。

人与人之间肯定有偏见,利益也不可能完全的公平。霸主也不可能是永远的霸主,当它落伍,手上又有超能力,会甘心落伍吗?新旧交替,秩序失衡,就会进入新一轮动荡期,直到平衡,新的秩序产生,周而复始。

回到每个人身上,人要生存,就需要各种物资与空间,就会为了获取这些而努力。而单独个体的努力就是弱小的,就会组群生存。生存大于一切。

我们需要什么样的预警系统?既克服威胁又具有超能力

比如孔子说要一个温文尔雅,礼乐不争的社会。是你的就是你的,不是你的不要抢,无论有你多大的能力。当有人认为,有能力不抢就是傻,历史是成功者写的,强权即真理,历史证明孔子方案有用但不合适。

还有博爱、兼爱、法家等等。MZ、ZY、FZ 在强Q面前摇摇欲坠。

今天,山姆奥特曼说,我们需要一个有利于全人类的AGI,既克服威胁又具有超能力。魔高一尺,道要高一丈。

设计原则:Access、Novelty

在考虑与人工智能系统相关的生物风险时,通用人工智能能力可以通过两种主要方式影响生物威胁的产生:增加访问和增加新颖性
增加访问: 获取作恶的生物专业知识。 比如一步步引导如何获取、合成、散播埃博拉病毒引发大的流行病,包括获得试剂和DNA。
增加新颖性: 协助恶意者开发新颖的生物威胁或更有害的已经存在的威胁版本。比如为如何修改冠状病毒珠以显著增加传染性提供建议。

增加访问:

1、要完全理解信息访问,需要反映恶意行为者可能利用对模型的访问的不同方式
2、尽可能引出模型的全部功能。
3、应该以对现有资源的改进来衡量。
在这里插入图片描述

鉴于目前前沿人工智能系统的发展速度,未来的系统似乎有可能为恶意行为者提供可观的好处。因此,我们必须为生物风险(以及其他灾难性风险)建立一套广泛的高质量评估,推进关于什么是“有意义的”风险的讨论,并制定有效的降低风险的策略。

即使没有人工智能,生物风险信息也相对容易获得。 在线资源和数据库包含比我们意识到的更危险的内容。创建生物威胁的分步方法和故障排除技巧已经只需在互联网上快速搜索即可。然而,生物恐怖主义在历史上仍然很少见。这凸显了一个现实,即其他因素,例如难以获得湿实验室或微生物学和病毒学等相关学科的专业知识,更有可能成为瓶颈。它还表明,物理技术访问或其他因素的变化(例如云实验室的更大数量)可能会显着改变现有的风险格局。

增加新颖性:

协议的创新性是否有提升? 我们想了解模型是否能够访问以前难以找到的信息,或者以一种新颖的方式合成信息。我们没有观察到任何这样的趋势。相反,我们观察到在创新方面的整体得分都很低。然而,这可能是因为参与者选择依赖他们知道有效的众所周知的技术,并且不需要发现新技术来完成练习。

人工智能系统能够帮助恶意行为者制造生物威胁

自主执行生物威胁创建过程

生物滥用

五个指标(准确性、完整性、创新、花费的时间和自评难度)和生物威胁创建过程的五个阶段(构思、获取、放大、制定和释放)

仅靠信息获取不足以造成生物威胁

我们正在开发一个蓝图,用于评估大型语言模型 (LLM) 可能帮助某人制造生物威胁的风险。

在一项涉及生物学专家和学生的评估中,我们发现 GPT-4 最多只能温和地提高生物威胁的创建准确性。虽然这种提升还不足以得出结论,但我们的发现是继续研究和社区审议的起点。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/448023.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

C/C++ (stdio.h)标准库详解

cstdio,在C语言中称为stdio.h。该库使用所谓的流与物理设备(如键盘、打印机、终端)或系统支持的任何其他类型的文件一起操作。 在本文将会通过介绍函数参数,举出实际的简单例子来帮助大家快速上手使用函数。 目录 一、流 二、库函数 1、F…

jenkins 下载插件sentry-cli失败 证书过期

现状 npm set ENTRYCLI_CDNURLhttps://cdn.npm.taobao.org/dist/sentry-cli npm set sentrycli_cdnurlhttps://cdn.npm.taobao.org/dist/sentry-cli 原因是npm原域名停止解析,在访问上面sentry-cli的cdn资源的时候 证书过期无法下载。 解决: 替换证书过期…

二、基本数值类型、数组和类型转换

文章目录 基本数值类型、数组和类型转换1.1 整数类型1.2 浮点数类型1.3 布尔类型1.4 字符类型1.5 数组类型1.5.1 一维数组1.5.2 多维数组 1.6 数据类型的转换1.6.1 自动类型转换1.6.2 强制类型转换 基本数值类型、数组和类型转换 本文为书籍《Java编程的逻辑》1和《剑指Java&a…

Linux进程信号处理:深入理解与应用(1)

🎬慕斯主页:修仙—别有洞天 ♈️今日夜电波:its 6pm but I miss u already.—bbbluelee 0:01━━━━━━️💟──────── 3:18 🔄 ◀️…

江科大stm32学习笔记10——对射式红外传感器

一、接线 上电之后可以看到对射式红外传感器亮两个灯,如果此时用挡光片挡住两个黑色方块中间的部分,则只亮一个灯。 二、代码 将4-1的工程文件夹复制粘贴一份,重命名为“5-1 对射式红外传感器计次”,打开keil,右键添…

【FPGA Verilog】各种加法器Verilog

1bit半加器adder设计实例 module adder(cout,sum,a,b); output cout; output sum; input a,b; wire cout,sum; assign {cout,sum}ab; endmodule 解释说明 (1)assign {cout,sum}ab 是连续性赋值 对于线网wire进行赋值,必须以assign或者dea…

银行数据仓库体系实践(16)--数据应用之财务分析

总账系统 在所有公司中,财务分析的基础都是核算,那在银行的系统体系中,核算功能在业务发生时由业务系统如核心、贷款、理财中实现登记,各业务系统会在每天切日后统计当天各机构的核算科目的发生额与余额,并统一送到总账…

day35 柠檬水找零 根据身高重建队列 用最少数量的箭引爆气球

题目1:860 柠檬水找零 题目链接:860 柠檬水找零 题意 一杯柠檬水5美元,每位顾客只买一杯柠檬水,支付5美玉,10美元,20美元,必须正确找零 开始时并没有零钱 若可以正确找零,则返回…

【教程】苹果上架常见要求的有哪些?

引言 苹果上架要求是苹果公司对于提交应用程序到苹果商店上架的要求和规定。这些要求主要是为了保证用户体验、应用程序的质量和安全性。开发者在准备提交应用程序之前,务必了解并遵守苹果上架要求,以确保应用程序能够通过苹果公司的审核。 1. 合法合规…

[C++]类和对象(中)

一:类的六个默认成员函数 如果一个类中什么成员都没有,简称为空类。空类中并不是什么都没有,任何类在什么都不写时,编译器会自动生成以下6个默认成员函数。默认成员函数:用户没有显式实现,编译器会生成的成员函数称为…

Transformer 自然语言处理(四)

原文:Natural Language Processing with Transformers 译者:飞龙 协议:CC BY-NC-SA 4.0 第十章:从头开始训练变换器 在本书的开头段落中,我们提到了一个名为 GitHub Copilot 的复杂应用,它使用类似 GPT 的…

【持续更新】2024牛客寒假算法基础集训营1题解 | JorbanS

文章目录 [A - DFS搜索](https://ac.nowcoder.com/acm/contest/67741/A)[B - 关鸡](https://ac.nowcoder.com/acm/contest/67741/B)[C - 按闹分配](https://ac.nowcoder.com/acm/contest/67741/C)[E - 本题又主要考察了贪心](https://ac.nowcoder.com/acm/contest/67741/E)[F -…