10分钟搞懂大模型备案

news/2025/3/13 20:08:59/文章来源:https://www.cnblogs.com/senlin202511/p/18677094

大模型备案作为合规化运营的重要资质,办理难度大,申报周期长。为了方便大家快速弄懂大模型备案,我将大量涉及文件和繁杂的流程进行了精简和总结,力求让大家能快速理解重点。

一、申报材料
大模型备案主要涉及语料安全评估、模型安全评估、安全措施评估三部分,主要申报材料如下所示:
《安全评估报告》
《模型用户协议和隐私协议》
《语料标注规则》
《拦截关键词列表》
《评估测试题》
《生成式人工智能(大语言模型)上线备案表》

其中,一些文件的解释和要点如下:
1、安全评估报告
需由专业机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节中的安全性。确保其在提供服务时既不会侵犯用户的合法权益,也不会传播违法违规的内容。重点如下(文中提及的“本文件8.2要求”等要求,特指2024年2月29发布的《生成式人工智能服务安全基本要求》提及的要求,全文及具体细节可参考此文件):

(1)语料安全评估
服务提供者对语料安全情况进行评估时,要求如下:
1)采用人工抽检,从全部语料中随机抽取不少于4000条语料,合格率不应低于96%。
2)结合关键词、分类模型等技术抽检,从全部语料中随机抽取不少于总量10%的语料,抽样合格率不应低于98%。
3)评估采用的关键词库、分类模型应符合本文件第8章要求。

(2)生成内容安全评估
服务提供者对生成内容安全情况进行评估时,要求如下。
1)应建设符合本文件8.2要求的生成内容测试题库。

2)采用人工抽检,从生成内容测试题库中随机抽取不少于1000条测试题,模型生成内容的抽样合格率不应低于90%。
3)采用关键词抽检,从生成内容测试题库中随机抽取不少于1000条测试题,模型生成内容的抽样合格率不应低于90%。
4)采用分类模型抽检,从生成内容测试题库中随机抽取不少于1000条测试题,模型生成内容的抽样合格率不应低于90%。

(3)问题拒答评估
服务提供者对问题拒答情况进行评估时,要求如下。
1)应建设符合本文件8.3要求的拒答测试题库。
2)从应拒答测试题库中随机抽取不少于300条测试题,模型的拒答率不应低于95%。
3)从非拒答测试题库中随机抽取不少于300条测试题,模型的拒答率不应高于5%。

2、模型用户协议和隐私协议
模型服务协议是确保用户权益和企业利益得到充分保护的关键法律文件。此文件须明确签署双方在包括但不限于以下环节的责任和义务:
(1)服务范围
(2)双方权利义务
(3)数据使用
(4)违约责任
(5)费用和支付
(6)服务变更和终止
(7)争议解决
(8)法律适用和管辖
(9)用户反馈和投诉

3、语料标注规则
详细介绍标注人员资质、标注细则、标注流程等内容,确保来源合法性、流程规范性、结果准确性。以下是提交语料标注规则时应包含的关键要素:

4、拦截关键词列表
需要开发者准备一份详尽的拦截关键词列表,有效过滤有害信息,包括但不限于政治、色情、暴力、谣言等等。该份列表应至少包含10000个关键词,并定期更新以适应新的风险态势。为了确保内容的安全性和合规性,以下是准备拦截关键词列表时应考虑的关键点:
应至少覆盖《生成式人工智能服务安全基本要求》A.1以及A.2中17种安全风险,A.1中每一种安全风险的关键词均不宜少于200个,A.2中每一种安全风险的关键词均不宜少于100个。

5、评估测试题
用于检验生成内容的安全性,包括生成内容的正面示例、应拒答的负面内容以及非拒答测试题库。测试题集应严格按照《生成式人工智能服务安全基本要求》编制,确保测试结果的客观性和准确性。
部分省份的要求如下:
(1)题库采用人工抽检,从生成内容测试题库中随机抽取不少于1000条测试题,模型生成内容的抽样合格率不应低于90%;
(2)从应拒答测试题库中随机抽取不少于300条测试题,模型的拒答率不应低于95%;
(3)从非拒答测试题库中随机抽取不少于300条测试题,模型的拒答率不应高于5%;

6、生成式人工智能(大语言模型)上线备案表
须在线下领取,部分省份还会在领取表格时进行简单询问。备案表主要内容如下:
(1)基本情况
(2)模型研制过程
(3)服务内容
(4)安全防范措施
(5)安全评估结果
(6)自愿承诺

填写表格时,必须确保所有信息的真实性和准确性,不得遗漏,也不得出现前后矛盾的地方。

二、大模型备案办理步骤

1、向属地网信报备,获取备案表
注:须提前与各省/直辖市/自治区网信预约时间
确定备案级别:根据大模型的规模、服务范围和影响,确定是向省级还是市级网信办提交备案申请。

2、准备材料和自测自查
对照备案表要求和评估要点,准备相应材料和大模型自测。须重点关注以下环节是否达到要求:
(1)应答题/拒答题回答率
(2)生成内容合格率
(3)关键词拦截列表
(4)语料来源是否合法
(5)安全措施是否健全

3、编写材料,准备测试账号
(1)确保所有材料之间的信息一致,没有矛盾之处。
(2)检查材料的格式和语言,确保其专业性和可读性。
(3)在提交前进行最终确认,确保所有准备工作都已就绪。
(4)确保产品测试账号能正常使用

4、提交材料和测试账号给属地网信办审核
在完成材料准备和测试账号设置之后,企业需要将这些材料正式提交给属地网信进行初审。注:有些省份可能在提供部分材料后就进行网信测试。具体情况请提供所在省份,供办理人员了解详情。

5、属地网信办初审
如果通过,要向中央网信发起审核流程。
如果审核未通过,需要自查调整,重新提交。

6、中央网信复审
中央网信复审后,会公示通过备案的企业,并下发大模型备案号。备案成功后,企业需要在显著位置标明大模型备案号,并提供公示链接,还需要准备接受可能的后续监管和检查,确保持续符合备案要求。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/870799.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

视频为什么会糊(二)?B站的码率变化

原文链接:https://tingxuanr.github.io/note/视频为什么会糊二b站的码率变化/ 摘要:流媒体平台(不只B站,所有流媒体都在干,画质最差的还得是优爱腾三家)为了节约成本,不断的降低自家视频的码率。很多所谓的4k、蓝光清晰度还不如六七年前的,纯粹是自欺欺人。上一篇对比 …

爬取二手房案例--parsel教学篇(CSS选择器)

本文通过一个爬取二手房的案例,来分享另外一种解析数据的方式:解析神器python第三方库parsel库。之所以叫他解析神奇,是因为它支持三种解析方式。 可以通过Xpath,CSS选择器和正则表达式来提取HTML或XML文档中的数据。@目录前言导航parsel的使用安装parsel创建Selector对象解…

duckX 读写word,替换word中内容的整理

一、库编译 1.下载地址:https://github.com/amiremohamadi/DuckX 2. 使用git 下载: git clone https://github.com/amiremohamadi/DuckX 3.编译 1.打开代码所在目录 2.创建生成目录build 3.依次点击 config generate 4. 打开项目,选择编译库的种类 生成库位置二、使用 C++读…

OpenAI 宕机思考丨Kubernetes 复杂度带来的服务发现系统的风险和应对措施

本文以社区主流服务发现系统 Nacos 为例,从可靠性、可伸缩性、高性能、可维护性等 4 个方面探讨如何提升 Kubernetes 中微服务应用的稳定性。作者:王建伟(正己) 12 月 11 日,OpenAI 旗下 AI 聊天机器人平台 ChatGPT、视频生成工具 Sora 及其面向开发人员的 API 自太平洋时…

如何删除www目录下无法删除的文件?

您好,有时在尝试删除www目录下的文件时,可能会遇到权限不足或其他问题导致无法删除。以下是详细的排查步骤和解决方案,帮助您顺利删除这些文件:检查文件权限:确认要删除的文件和目录具有适当的权限。可以通过FTP客户端或SSH连接到服务器并检查文件夹权限。例如:bashls -l…

请问忘记FTP账号密码,如何重置?

如果您忘记了FTP账号密码,可以通过以下几种方式重置密码,确保您的FTP账户能够正常使用:通过控制面板重置:大多数云服务提供商和托管平台都提供了在线控制面板,您可以在其中找到FTP管理选项。登录控制面板后,选择“FTP管理”或类似选项,然后点击“重置密码”。按照提示完…

如何解决FTP上传文件失败的问题?

您好,FTP(文件传输协议)是用于在互联网上进行文件传输的常用工具。如果遇到FTP上传文件失败的情况,可能是由多种原因引起的。以下是详细的排查步骤和解决方案:检查FTP账户信息:确认您使用的FTP账户名和密码是否正确。如果不确定,可以尝试使用其他已知有效的账户进行测试…

如何开通25端口发送邮件

开通25端口通常是为了发送邮件。以下是详细的步骤和注意事项:检查防火墙设置:登录到您的服务器,确保防火墙已放行25端口。 使用命令行工具(如iptables或firewalld)查看防火墙规则。 示例命令:sudo iptables -L sudo firewall-cmd --list-all配置邮件服务:安装并配置邮件…

请问所有网站不能打开,云服务器问题如何排查?

当所有网站无法打开时,可能是由于云服务器配置错误或网络问题引起的。以下是详细的排查和解决方案:检查服务器状态:确认云服务器是否正常运行,可以通过云平台的管理界面查看服务器状态。 如果服务器处于关机或重启状态,尝试手动启动服务器,并等待其完全启动后再进行测试。…

多站点绑定同一域名的不同端口

要实现用户直接通过域名访问不同端口上的多个网站,可以通过以下几种方式来解决:使用反向代理: 反向代理是一种常见的解决方案,它允许您将不同的子域名或路径映射到不同的后端服务器或端口。具体步骤如下:安装Nginx或Apache:确保您的服务器上已经安装了Nginx或Apache作为反…

网站流量异常,如何排查和解决?

当您发现网站流量异常增加时,这可能是由多种原因引起的,包括恶意攻击、爬虫抓取、推广活动等。为了帮助您更好地理解和解决这个问题,以下是几个可能的原因及相应的解决方案:检查日志文件日志文件是排查流量异常的重要工具。大多数Web服务器(如Nginx、Apache)都会记录详细…

如何安全地修改织梦网站登录密码?

修改织梦CMS(DedeCMS)网站的登录密码是一个重要的安全操作,可以确保网站的安全性和稳定性。以下是详细步骤:登录后台: 使用管理员账号登录织梦CMS后台。进入用户管理: 在左侧菜单中找到“用户管理”或“管理员管理”选项,点击进入。选择管理员用户: 在用户管理页面中,…