大模型备案对象
大模型备案主要面向开发、运营大模型的企业、机构等主体(官方要求是具备舆论属性和社会动员能力的产品,而大模型产品基本都符合这两点特征)。比如,像百度开发了文心一言这样的大模型,百度就属于大模型备案的目标群体。
大模型备案材料
主要材料如下:
1、大模型上线备案申请表
涵盖大模型基本情况、模型研制、服务与安全防范、安全评估、自愿承诺等内容。
2、安全评估报告
由专业机构或团队完成,全面评估大模型在语料处理、模型训练、服务提供等环节的安全性,包括评估方法、语料安全评估、生成内容安全评估、问题拒答评估等。
3、模型用户协议和隐私协议
模型服务协议规定服务提供者和用户的权利、义务和责任,包含服务范围、双方权利义务、数据使用与保护等关键条款;隐私协议重点突出对用户个人信息的保护承诺。
4、语料标注规则
需介绍标注团队资质、标注细则、标注流程、质量控制机制、数据来源合法性、隐私保护措施、标注工具和技术支持、持续改进计划等。
5、拦截关键词列表
至少包含 10000 个关键词,全面覆盖政治敏感、色情、暴力等多种安全风险领域,并定期更新 。
6、评估测试题集
包括生成内容测试题库、拒答测试题库、非拒答测试题库等。生成内容测试题库总规模≥2000 题,覆盖语料和生成内容的五大模块 31 条风险;拒答测试题库中,模型应拒答题库规模≥500 题,模型非拒答题库应覆盖多方面内容;关键词库规模≥10000 个,要包含特定风险内容关键词 。
大模型备案流程
1、报请属地网信办
向企业注册地所属的网信办进行备案申请,电话联系相关工作人员,预约领取备案表时间。部分省份工作人员会在申请人领取表格时,针对大模型进行初步问询。
2、准备填写材料
企业根据表格及评估要点准备填写材料,包括填写大模型上线备案表,开展安全评估并形成报告,制定模型服务协议、语料标注规则,整理拦截关键词列表,准备评估测试题集等,同时准备好测试账号。
3、企业内部评估
企业内部展开对大模型的评估,编写相关材料,例如安全自评估报告等,对算法原理、数据来源、安全措施等进行全面评估,并确保材料内容真实、准确、完整。
4、提交审核
将准备好的材料附件及测试账号提交给属地网信办进行审核。有的省份不要求一定要准备好全部备案资料,可以先准备测试账号、电子版文件、光盘给属地网信办,根据其测试反馈意见修改好后再打印盖章正式提交。
5、属地网信办审核
材料审核:属地网信办对提交的材料进行审核,包括形式审查和实质审查,检查材料是否齐全、合规。
技术测试:对大模型进行技术测试,验证模型的性能、安全性和稳定性等。测试可能是远程线上测试,也可能是线下测试。
形成初审意见:若审核通过,属地网信办将相关材料上报中央网信办;若未通过,企业需根据反馈意见修改材料或调整模型能力后再次提审。
6、中央网信办复审
中央网信办对上报的材料进行复审及技术评审,对大模型的合规性、安全性等进行全面审查。通过后,企业将获得大模型备案号,并会进行公示;未通过则需重新进行上线备案。
大模型备案和大模型登记的区别
目的不同:大模型备案更侧重于监管,确保模型符合法律法规、社会道德规范等要求,保障公众利益和社会安全。而大模型登记主要是对模型的基本信息进行记录,类似于一种信息登记制度,方便对模型进行统计和管理。
要求不同:备案的要求相对更严格,需要提交详细的材料并经过多环节审核。有的省份的登记可能只需部分大模型备案所需资料(各省份要求不同)。
总结
大模型备案对于大模型行业的规范发展至关重要。明确目标群体,准备好关键材料,熟悉备案流程,了解与登记的区别,是顺利完成大模型备案的关键。如果对大模型备案不够了解,可以寻求外部机构协助办理,确保产品可以正常上线。