Salesforce AI Specialist篇之 Einstein Trust Layer

news/2024/12/22 9:24:07/文章来源:https://www.cnblogs.com/zero-zyq/p/18434084

本篇参考:

https://trailhead.salesforce.com/content/learn/trails/drive-productivity-with-einstein-ai

https://help.salesforce.com/s/articleView?id=sf.generative_ai_trust_layer.htm&type=5

https://blog.salesforceairesearch.com/meet-salesforces-trusted-ai-principles/

https://trailhead.salesforce.com/einstein-ai-trail/

https://trailhead.salesforce.com/content/learn/modules/large-language-models

序言

今年的DreamForce,salesforce针对AI进行更强的推广,针对salesforce从业者来说,AI两个证书免费考试。未来几篇博客主要针对Salesforce AI Specialist证书的考点知识进行讲解,更好的了解Einstein的功能以及如何通过Salesforce AI 更好的赋能我们的企业。虽然前两天考试挂了,很可惜只差一道题,但是感觉里面内容有一些很有趣并且以后有可能会用得到,预计会开几篇内容,根据AI Specialist的主要Topic进行博客的制作。没有题库,不用私聊/留言问题库问题。

  • Einstein Trust Layer: 15% of exam
  • Generative AI in CRM Applications: 17% of exam
  • Prompt Builder: 37% of exam
  • Einstein Copilot: 23% of exam
  • Model Builder: 8% of exam

本篇所针对的内容是 Einstein Trust Layer,让我们一起了解一下Salesforce如何通过AI进行赋能以及如何解决数据隐私,数据安全等痛点的。

Einstein 生成式AI术语介绍

术语 描述
Artificial intelligence (AI) 计算机科学的一个分支,计算机系统使用数据进行推理、执行任务并以类似人类的推理方式解决问题
Bias 偏见 由于机器学习过程中的假设不准确,计算机系统中的系统性和可重复性错误会以与系统预期功能不同的方式产生不公平的结果。
Corpus 语料库 用于训练LLM的大量文本数据集。
Domain adaptation 领域适应 将特定组织的知识添加到提示(Prompt)和基础模型中的过程。
Fine-tuning 微调 通过在较小的特定于任务的数据集上进行训练,使预先训练的语言模型适应特定任务的过程。
Generative AI gateway 生成式人工智能网关 该网关公开标准化的 API,以便与内部和合作伙伴生态系统中不同供应商提供的基础模型和服务进行交互
Generative Pre-Trained Transformer (GPT)
生成式预训练 Transformer (GPT)
一系列语言模型,经过大量文本数据的训练,以便生成类似人类的文本。
Grounding 接地 将特定领域的知识和客户信息添加到提示中的过程,为模型提供更准确响应所需的上下文。
Hallucination 幻觉 但在给定上下文的情况下,该模型输出的文本实际上不正确或几乎没有意义
Large language model (LLM)
大语言模型( LLM )
一种语言模型,由神经网络组成,该神经网络具有经过大量文本训练的许多参数。
Machine learning 机器学习 人工智能的一个子领域,专门研究计算机系统,旨在根据数据的反馈和推断而不是明确的指令来学习、适应和改进。
Natural Language Processing (NLP)
自然语言处理(NLP)
人工智能的一个分支,利用机器学习来理解人类书写的语言。大型语言模型是 NLP 的众多方法之一。
Prompt提示 对要完成的任务的自然语言描述。 LLM的输入。
Prompt chaining 提示链 将复杂任务分解为几个中间步骤,然后将其重新组合在一起的方法,以便人工智能生成更具体、定制和更好的结果。
Prompt design 提示设计 提示设计是创建提示的过程,可提高模型响应的质量和准确性。许多模型都需要特定的提示结构,因此在您使用的模型上测试和迭代它们非常重要。了解哪种结构最适合模型后,您可以针对给定用例优化提示。
Prompt injection提示注入 一种通过给予模型某些提示来控制或操纵模型输出的方法。通过这种方法,用户和第三方尝试绕过限制并执行模型未设计的任务
Prompt instructions 提示指示 提示指令是输入到提示模板中的自然语言指令。您的用户只需向 Einstein 发送指令即可。说明具有动词-名词结构和LLM任务,例如“撰写不超过 500 个字符的描述”。您的用户指令将添加到应用程序的提示模板中,然后相关的 CRM 数据将替换模板的占位符。提示模板现在是一个接地提示并发送到LLM 。
Prompt template 提示模板 带有占位符的字符串,这些占位符将替换为业务数据值,以生成发送到LLM最终文本指令。
Retrieval-augmented generation (RAG)
检索增强生成 (RAG)
一种基础形式,使用知识库等信息检索系统来丰富相关上下文的提示,以进行推理或训练。
Semantic retrieval 语义检索 允许LLM使用客户 CRM 数据中存在的类似且相关的历史业务数据的场景。
Toxicity 毒性 描述多种类型话语的术语,包括但不限于冒犯性、不合理、不尊重、令人不快、有害、辱骂或仇恨的语言。
Trusted AI 可信人工智能 Salesforce 创建的指南专注于负责任的 AI 开发和实施。

 Einstein Trust Layer

 我们以下方的demo来引出今天的主题。下方的gif是通过Email 选择指定的Prompt Template(后续会讲到) 然后基于gpt4生成的内容,那么从选择到数据生成返回到salesforce,都经历了哪些过程呢?

1. Secure Data Retrieval & Grounding安全数据检索和接地: 为了让LLM生成更具相关性和个性化的响应,它需要来自 CRM 数据的额外上下文。这个向Prompt提示添加额外上下文的过程就是我们所说的Grounding接地。我们可以使用将字段与 CRM 数据合并merge来建立Prompt提示,这些字段可以是record fields, flows, Apex, Data Cloud DMOs, and related lists。简单来说,接地我们可以理解成prompt template中使用merge field/placeholder进行额外的上下文。

安全数据检索意味着Prompt仅基于执行用户有权访问的数据,当我们使用接地,比如 record fields或者related lists,通过安全数据检索,我们可以保证仅基于执行用户有权访问的数据。数据检索过程遵循 Salesforce 中的现有访问控制和权限:

  • Data retrieval for grounding the prompt is based on the permissions of the user executing the prompt.
    用于支持提示的数据检索基于执行提示的用户的权限。
  • Data retrieval for grounding the prompt preserves in place all standard Salesforce role-based controls for user permissions and field-level security when grounding data from your CRM instance.
    当来自 CRM 实例的数据接地时,用于接地提示的数据检索会保留所有标准的基于 Salesforce 角色的用户权限和字段级安全控制。

2. Data Masking for the LLM LLM的数据屏蔽:Einstein 信任层会识别并屏蔽提示中选定的个人身份信息 (PII) 和支付卡行业 (PCI) 数据,然后将其发送到大型语言模型 ( LLM )。数据屏蔽可防止您的敏感数据暴露给LLM ,并将您的敏感 CRM 数据安全地存储在 Salesforce 内。使用模式和上下文来识别敏感数据。然后使用占位符文本屏蔽数据,以防止数据暴露给外部模型。 Einstein Trust Layer 临时存储原始实体及其各自占位符之间的关系。该关系稍后用于对生成的响应中的数据进行解密。此步骤和后续的 Data Demasking相关联。我们也可以使用audit trail来跟踪数据脱敏并查看脱敏数据。audit trail存储在数据云中。除了常规的PII以及PCI字段,salesforce也支持自定义的一些敏感字段的加密/屏蔽。

需要先启用Einstein Generative AI 以及 Data Masking,之后搜索Einstein Trust Layer便可以进行操作。

我的dev环境没有此项功能,所以没有相关截图。详情参考: https://help.salesforce.com/s/articleView?id=sf.generative_ai_mask_select.htm&type=5

3. Prompt Defense: To help decrease the likelihood of the LLM generating something unintended or harmful, Prompt Builder and Prompt Template Connect API use system policies. System policies are a set of instructions to the LLM for how to behave in a certain manner to build trust with users. For example, we can instruct the LLM to not address content or generate answers that it doesn’t have information about. System policies are one way to defend against jailbreaking and prompt injection attacks.

 提示防御: 为了帮助降低LLM生成意外或有害内容的可能性,提示生成器和提示模板连接 API 使用系统策略。系统策略是针对LLM如何以某种方式行事以建立与用户的信任的一组指令。例如,我们可以指示LLM不要处理其没有信息的内容或生成答案。系统策略是防御越狱和提示注入攻击的一种方法。

4. LLM Gateway & Zero Data Retention: 在salesforce端的步骤已经准备完成,接下来Response Generation 响应生成环节。在提示完成敏感信息保护后,就可以通过LLM网关发送。该网关管理与不同模型提供商的交互,并代表与多个LLMs进行通信的统一、安全的方式。网关和模型提供商使用 TLS 加密来确保数据在传输过程中的安全。Salesforce与外部合作伙伴模型提供商(例如 OpenAI 或 Azure Open AI)制定了零数据保留政策。该策略规定,从 Salesforce 发送到LLM数据不会保留,而是在响应发送回 Salesforce 后删除。

5. Toxicity Detection 毒性检测: 对生成的响应进行毒性扫描。检测过程包括毒性置信度评分,该评分反映了包含有害或不当内容的响应的概率。毒性评分和类别存储在数据云中。我们可以在data cloud中运行report,选择GenAIGatewayResponse with GenAIContentCategory report, 设置filter:Detector Type 为toxicity。

6. Data Demasking 数据解密: 我们为在提示过程中屏蔽数据而创建的占位符现在已替换为实际数据。原始实体及其各自占位符之间的关系用于重新水合响应,以便响应在发回时有用且有意义。

7. Feedback and Audit 反馈与审核: 当 Salesforce 中出现响应时,您可以接受、修改或拒绝该响应。您还可以提供明确的反馈。您对响应的明确反馈将作为审核和反馈数据(审核跟踪)的一部分捕获并存储在 Data Cloud 中。根据人工智能功能,您对响应的隐式操作也可以被捕获并存储在数据云中。

Audit Trail also includes the original prompt, masked prompt, scores logged during toxicity detection, the original output from the LLM, and the demasked output.
审核跟踪还包括原始提示、屏蔽提示、毒性检测期间记录的分数、 LLM的原始输出以及屏蔽输出。

Audit and feedback data are stored in your instance of Data Cloud. You have control over how long that data is stored in your instance of Data Cloud. Additionally, audit and feedback data are stored by Salesforce for 30 days for compliance purposes.
审核和反馈数据存储在您的 Data Cloud 实例中。您可以控制数据在 Data Cloud 实例中存储的时间。此外,出于合规性目的,Salesforce 会将审核和反馈数据存储 30 天。

 通过以上7个步骤,即完成了基于AI的内容生成一个生命周期。

总结:篇中主要介绍 Einstein Truest Layer 如何在AI执行过程中保护数据安全以及合规处理,篇中有错误地方欢迎指出,有不懂欢迎留言。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/806941.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

工地人员工装穿戴识别系统

工地人员工装穿戴识别系统通过AI视频智能分析技术,工地人员工装穿戴识别系统可在建筑工地复杂场景下对多个施工作业人员进行高精度识别,工地人员工装穿戴识别系统对施工现场监控区域人员是否佩戴安全帽进行自动识别预警。工地人员工装穿戴识别系统通过AI技术手段,实现了施工…

人员跌倒识别检测系统

人员跌倒识别检测系统通过YOLO网络模型算法,人员跌倒识别检测系统对监控画面区域进行7*24小时自动监测,不需人为干预当人员跌倒识别检测系统监测到现场画面中有人员倒地摔倒时,立即抓拍存档告警同步提醒后台值班人员及时处理。人员跌倒识别检测系统通过AI技术,人员跌倒识别…

工地高空作业安全带穿戴识别系统

工地高空作业安全带穿戴识别系统通过AI视觉分析技术,工地高空作业安全带穿戴识别系统对现场监控画面中施工作业区域的高空作业人员安全绳安全带穿戴进行检测,当检测到作业人员未按要求系安全带作业时,不需人为干预立即触发告警存档,同步通知后台值班人员及时制止。工地高空…

工作-k8s问题处理篇

前言:公司这边为集团,所以项目较多,我目前总负责的就到达十几个项目的总架构,其中还有海外项目,不过底下也有一定的细分,同事解决不了的问题会升级到我这,只k8s容器平台常用的就有三种,一种是技术中心部门研发的二开版,一种是国产XC化推广的xc容器平台,还有一种就是开…

【训练记录】2024年莆田市高中信息学奥赛国庆集训CSP-S提高组(第二天场外)

训练情况 rk#4 \(100 + 100 + 100 + 70 = 370\) 赛后反思 没什么很严重的失误,只是国庆早八起不来,打到后面时间不够做第四题了QAQ,下次一定早起TAT A题开场怎么是CF Div4 原题,显然因为 \(a,b,c,d\) 互不相同,最后切出来的结果只有三块或四块,三块的情况是两线没有交叉,…

抽烟行为识别预警系统

抽烟行为识别预警系统基于AI视觉智能分析技术,抽烟行为识别预警系统通过监测现场人员抽烟行为自动存档进行报警提示同步回传后台提醒值班人员及时处理。抽烟行为识别预警系统对现场人员吸烟行为进行7*24小时不间断识别监测,当发现有人抽烟时主动抓拍存档并同步触发报警。抽烟…

明厨亮灶AI智能分析盒

明厨亮灶AI智能分析盒通过AI视频分析技术,明厨亮灶AI智能分析盒赋能现场普通监控具备了AI智能检测的功能,能够迅速高效的识别厨房内的工作人员的着装状况:口罩穿戴识别、厨师服穿戴识别、吸烟识别、厨师帽穿戴识别、后厨鼠害识别、玩手机识别等。明厨亮灶AI智能分析盒对餐厅…

安全生产劳保穿戴监测系统

安全生产劳保穿戴监测系统通过计算机智能视频分析技术,安全生产劳保穿戴监测系统对现场区域施工作业人员防护用品穿戴是否合规进行自动监测,当安全生产劳保穿戴监测系统监测到现场施工人员没有按施工要求穿戴防护用品时,不需人为干预系统立即自动触发告警并抓拍存档同步提醒…

c++ vector容器、字符串

c++ vector容器 字符串:

2024.9.24 模拟赛 CSP4

模拟赛 暴力场。出题人学政治的? T1 商品值域线段树 直接看值域上,每两个相邻的点的差提供的贡献,相当于值域上某一区间每一个位置都有 \(1\) 的贡献再减一。 所以直接值域线段树,查询区间和。贪心发现左右端点一定挂在某个点上时最优。注意左右端点挂住的情况分别跑一遍。…

记一次内存告警

刚好国庆最后一天上班,遇到一个实例内存使用率100%的告警。 分析JVM内存常用的命令得总结一下:

Leetcode 275. H 指数 II

1.题目基本信息 1.1.题目描述 给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数,citations 已经按照 升序排列 。计算并返回该研究者的 h 指数。 h 指数的定义:h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她…