使用‘消除’技术绕过LLM的安全机制,不用训练就可以创建自己的nsfw模型

news/2024/10/23 7:14:40/文章来源:https://www.cnblogs.com/deephub/p/18247287

开源的大模型在理解和遵循指令方面都表现十分出色。但是这些模型都有审查的机制,在获得被认为是有害的输入的时候会拒绝执行指令,例如会返回“As an AI assistant, I cannot help you.”。这个安全功能对于防止误用至关重要,但它限制了模型的灵活性和响应能力。

在本文中,我们将探索一种称为“abliteration”的技术,它可以在不进行再训练的情况下取消LLM审查。这种技术有效地消除了模型的内置拒绝机制,允许它响应所有类型的提示。

 

https://avoid.overfit.cn/post/e828cf84358d42f6b4690d4c1c5669d8

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/724669.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

转换协议字节

转换协议字节/// <summary>/// 转换协议字节帮助类/// </summary>public class ByteUtil{/// <summary>/// byte数组转换int/// </summary>/// <param name="src"></param>/// <param name="offset"></param…

硬件开发笔记(十八):核心板与底板之间的连接方式介绍说明:板对板连接器

前言核心板与底板之间的连接方式至少就有四种以上,包括且不限于:DIP直插、板对板连接器、邮票孔和金手指。 常用连方式介绍DIP直插DIP就是以前的元器件封装,直接DIP插入焊接,宿便找了个,如下图:  可以定制自己的,一般来说,没有高速电路问题不大,但是这种方式对于复杂…

大模型应用之路:从提示词到通用人工智能(AGI)

大模型在人工智能领域的应用正迅速扩展,从最初的提示词(Prompt)工程到追求通用人工智能(AGI)的宏伟目标,这一旅程充满了挑战与创新。本文将探索大模型在实际应用中的进展,以及它们如何为实现AGI铺平道路。 基于AI大模型的推理功能,结合了RAG(检索增强生成)、智能体(…

进程还在,JSF接口不干活了,这你敢信?

1、问题背景: 应用在配合R2m升级redis版本的过程中,上游反馈调用接口报错,RpcException:[Biz thread pool of provider has been exhausted],通过监控系统和日志系统定位到现象只出现在一两个节点,并持续出现。第一时间通过JSF将有问题的节点下线,保留现场,业务恢复。 …

第四届计算机技术与信息科学国际研讨会(ISCTIS 2024)

【连续3年稳定EI,IEEE独立出版丨高校主办】第四届计算机技术与信息科学国际研讨会(ISCTIS 2024)将于2024年7月12-14日在中国西安举行。【连续3年稳定EI,IEEE独立出版丨十余所高校联合支持】第四届计算机技术与信息科学国际研讨会(ISCTIS 2024) 2024 4th International Symp…

第七届计算机信息科学与应用技术国际学术会议(CISAT 2024)

第七届计算机信息科学与应用技术国际学术会议(CISAT 2024)定于2024年7月12-14日在中国杭州召开,会议由浙江工业大学主办、浙江工业大学计算机科学与技术学院承办。【IEEE独立出版 | 快速稳定EI检索】第七届计算机信息科学与应用技术国际学术会议(CISAT 2024) 2024 7th Int…

如何实现网络隔离后,军工单位内网数据导出的安全性?

在现代信息化战争中,军工单位在信息安全方面的需求尤为突出。通常会采用物理隔离,将网络隔离成内网和外网,防止外部网络的恶意入侵和数据窃取。隔离后的数据仍存在内外网交换的需求,即涉及到内网数据导出,因此每日会面临网络带宽限制、数据安全风险、合规性要求和传输稳定…

2024年高考报名条件

2024年高考报名条件 更新:2024-3-20 19:38:10 发布:大学生必备网 纠错https://www.dxsbb.com/news/17828.html 教育部公布的2024年高考报名条件如下,供大家参考。 1.符合下列条件的人员,可以申请报名: (1)遵守中华人民共和国宪法和法律; (2)高级中等教育学校…

【日记】电脑这种机器总是有十分诡异的情况发生(946 字)

正文崔忽然又说他不来了,草。他说他突然来了个单子,要马上滚回去拟合同签单子。妈耶。我只能说还好我没急着订餐馆、宾馆和车票。看来今晚又能去跳舞了。昨晚梦到了紫。梦见她在学校附近的一个地方卖着什么东西。住处似乎在一个很高的出租屋里。梦里的她很漂亮。我没把这件事…

linux环境 kafka3.4.0 刚搭建好(用kraft替代zookeeper) 怎么建个topic测试一下消费有没有成功

在使用 Kafka 3.4.0 并且用 Kraft (Kafka Raft) 替代 Zookeeper 的情况下,步骤会有一些变化。这是因为 Kraft 模式下 Kafka 自身管理元数据,而不再依赖 Zookeeper。 以下是使用 Kraft 模式的 Kafka 3.4.0 创建 topic 并进行生产和消费测试的具体步骤: ### 1. **启动 Kafka 集…

如何确保数据跨域交换安全、合规、可追溯性?

数据跨域交换是指在不同的组织、系统或网络之间进行数据的传输和共享。随着数字经济的发展,数据跨域交换在促进数据流通和创新融合方面发挥着重要作用。然而,这一过程也面临着诸多挑战和风险,例如数据安全、合规性、完整性以及责任不清晰等问题。在进行不同地域文件传输时,…