算法备案材料包含众多报告,其中最难的莫过于《算法安全自评估报告》。本人经手过几十份该材料,今天就结合个人经验总结下自评估报告的要点及一些容易踩的坑,希望可以帮助大家。有其它问题也可以参考这篇文章了解。
一、自评估报告常见问题
1、前后矛盾
报告内部的算法、风控、制度、措施等等环节出现前后不统一的部分都会被审核人员标出;此外,自评估报告与其它材料以及在算法备案系统中填报的内容有冲突的,也会被审核人员标出驳回。
2、填写信息不合规
主要分为两种情况。一种是表达不清晰,通常是技术人员编写材料时发生。主要是因为表达太过于侧重技术原理而忽视应用和调用逻辑。第二种是没有正确判断审核要素,回答方向本身存在问题(自评估报告审核要素超过100个,如有可能,还是建议寻找靠谱算法备案代办)。
3、故意不填不确定信息
一些开发者可能会凭借过往各种经验,选择性不填不确定的内容。其目的可能是希望提交审核后先确定其它内容是否OK,或者直接想蒙混过关。但工作人员已经明确这种做法是不可取的,会直接驳回。如果有填报事项实在不确定的,可以先找专业人员咨询再结合企业实际情况申报。如有条件,还是建议找专业机构协助,因为不同行业的不同产品的填报方式是不能通用的(后面会具体解释)。
4、真实性存疑
常见于购买模板或套用包含咨询等各种手段获得的报告。这类情况被判定真实性存疑的原因主要有三个:1是行业和产品形态有差异,报告描述不符合实际情况;2是重合度过高,明显不是企业针对性撰写的材料;3是汇报方式太过陈旧(审核标准是不断改变的,所以专业机构会不断优化、更新撰写角度和思路;但很多所谓模板都有时效性局限,并不一定能适应现在的审核标准)。
二、自评估报告主要部分简介
《算法安全自评估报告》通常包括以下内容:
1.算法情况
算法流程:详细描述算法的具体流程,可能需要以流程图的方式呈现,特别是当算法可细分为多个模型时,要区分不同模型进行描述。
算法数据:说明算法所使用的数据情况,包括数据的来源、类型(如图片、视频、文字、音频等)等。
算法模型:介绍算法模型的相关信息,若存在多个模型,需分别阐述。 干预策略:描述对算法进行干预的策略和方法。
结果标识:明确算法生成结果的标识方式。
2.服务情况
服务简介:具体描述备案的算法用于哪些服务,涵盖服务功能介绍、上线时间、展现形态、在应用产品中的入口位置、服务流量、用户情况等。
算法在服务中应用情况:包括算法线上服务和训练过程中的数据来源、数据形态、算法更新频率以及算法中间结果与其他服务或应用的共享情况等。
3.风险研判
算法滥用:说明算法是否存在被不当利用的行为及潜在风险,例如是否可能用于生成违法违规不良的内容,危害国家安全、公共利益等,并分析其可能造成的影响。
算法漏洞:探讨算法本身机制机理是否健全以及不健全可能导致的潜在风险,如是否对输入内容进行预处理、是否可能输出个人隐私、是否可能被攻击导致输出原始训练数据等。 - 算法恶意利用:分析算法是否有可能被恶意攻击(如使用输入内容投毒)、是否可能被高频调用等风险。
4.风险防控
风险防控情况:陈述为防止、控制上述风险而采取的机制,需与前文分析的各项风险相对应。
风险防范机制建设:至少包括算法机制机理审核、算法安全评估监测、对生成合成的虚假信息的辟谣机制、算法安全事件应急处置等制度层面的建设,还需留存制度实施的日志以确保事件可回溯。
5.用户权益保护
用户知情权:保障范围、保障手段及相关证明,包括告知个人信息处理规则、取得处理的合法性基础、公示算法的基本原理、目的意图和主要运行机制,以及是否向用户告知服务的使用限制、使用规范、是否由深度合成服务提供等。
用户个人信息保护:除告知个人信息处理规则、取得合法性基础外,若涉及向第三方共享个人信息、将用户输入内容和生成合成内容用于进一步算法训练,需确保真实披露并取得用户同意,同时说明是否提供用户行使删除权的方式、数据存储期限等。
其他权益保护:涉及收费服务的,描述保障消费者权益、未诱导额外消费的措施;涉及向未成年人提供服务的,说明保障未成年人权益的措施。 内容生态治理:包括防范和抵制违法违规不良信息的措施,如在程序、算法方面设置过滤、发现或抵制机制,以及人工审核的标准、如何与机器审核相结合等。
模型安全保障:说明在技术层面采取了何种措施以防范数据投毒、模型投毒等,例如是否建立识别违法和不良信息的特征库、是否建立关键词或敏感词过滤机制(若涉及使用用户输入内容进行进一步模型训练)。
数据安全防护:涵盖训练数据(包括预训练、优化训练使用的数据)的采集、使用、存储等,以及在涉及与第三方共享训练数据或模型权重时,为合法合规共享而采取的安全防护措施,如是否记录共享数据、是否建立审计措施等。训练数据来源多样,使用不同来源的数据需符合相应的合规要求。
6.安全评估结论
针对上述内容进行全面分析总结,得出算法是否符合国家法律法规及相应管理办法的有效结论。
7.其他应当说明的相关情况
可填写总结性内容,如有与其他外部技术合作的相应协议,也可放在此部分。 不同类型的算法备案,其报告内容可能会有所差异,具体要求可能因地区、行业以及相关法规政策的变化而有所不同。在填写报告时,建议严格按照相关规定和备案系统的要求进行,确保信息的准确性和完整性。同时,与算法相关技术人员密切合作,以保证对算法情况的描述真实、准确。
三、填报建议
1、大型企业,产品上线时间不紧急
大企业资源充足,产品多,可考虑用特定项目培养内部人员办理算法备案,从实操中总结经验,并在内部推广。这样做可以让备案经验在后续推广中复用。
2、产品急于上线
无论企业资源是否充足,都建议找专业算法备案代办机构服务。毕竟产品有死线要求,没有试错空间,承担不起被反复驳回的风险。