人工智能今天能为你做什么?生成式人工智能如何改变技术文档领域

▲ 搜索“大龙谈智能内容”关注GongZongHao▲ 

作者 | Fabrice Lacroix

大型语言模型(LLM)和生成式人工智能(GenAI),尤其是ChatGPT,这些是引领科技革新的新兴技术。它们不仅在科技界引起了轩然大波,也让每个企业的利益相关者深感震撼。人们纷纷尝试探索人工智能将如何影响、协助并改变他们的工作流程和组织运营模式。对错失机会的忧虑正在持续升温。领导者们急切地想要了解,在整合人工智能功能方面,他们是否会落后于竞争对手。这是不是就意味着,如同陨落的流星,它将摧毁那些行动迟缓的“恐龙”组织呢?虽然时间会揭示一切,但正如安迪·格罗夫所警告的那样:“只有偏执狂才能生存”。在这个快速变化的世界中,只有保持警觉并积极适应新技术的企业才能持续地生存和发展。

然而,不可否认的是,人工智能所孕育的机会已经大量涌现。在内容创作到消费的整个流程中,人工智能带来的变革已经深入到以下方面:

  • 创建:变革创作流程

  • 验证:管理跨版本、时间和来源的信息一致性

  • 翻译:以更低的成本走向全球

  • 发布:帮助用户自我培训

  • 搜索:重塑搜索体验

  • 阅读:增强客服

下面,我们描绘人工智能已经实现的重大变化。

- 1 -

变革创作流程

关于生成式人工智能是否可以用于编写技术文档,存在一些争议。有人认为GenAI怎么可能知道新发明产品的细节呢?毕竟,技术信息需要真实,我们不能冒险让人工智能产生“幻觉”的风险。

在Fluid Topics,我们坚定地支持一个理念:即公司中的每一个人,而不仅仅是技术作家(TW)和领域专家(SME,也就是开发产品的工程师),都可以为内容创作贡献力量。

Fluid Topics 有能力汲取各种类型的内容,包括非结构化的文档如Word文件,这通过让每个贡献者使用他们钟爱的工具来实现。构建统一的知识库并不意味着将单一的创作工具强加给所有的内容贡献者。然而,向这种新范式的转变需要TW改变他们的工作模式,成为编辑(Editor)和文案撰稿人(Copywriter),而不是采访者(Interviewer)和作者(Author)。而这正是人工智能可以发挥作用的地方。

现在,通过使用GenAI来重新措辞内容并遵循通用或企业标准,领域专家可以专注于内容创作,而不必过分担心语法、拼写和风格的问题,同时也不会给TW增加过多的工作负担。这样的结果导致领域专家和TW的工作流程发生了巨大的变革

  • 领域专家可以更加快速地进行写作,利用GenAI进行现场内容重新措辞,并检查GenAI所提供建议的准确性和真实准确性。对于领域专家来说,写作、改进和检查的过程变得更加动态和实时化,而TW在这一过程中不会过早参与进来。

  • 只有在领域专家完成他/她的工作之后,TW才会对内容进行审查。TW将专注于执行更具增值性质的任务,例如将这些新内容与现有内容进行对齐,并将其融入到更大的内容故事中。

关于这一新范式的一个问题是:它如何与内容质量检查工具(例如Schematron、Acrolinx或Congree)相互补充或替代?当然存在一定的重叠,但目前这些工具大多是相互补充的。在此过程中,质量检查和公司规则执行是在GenAI之后进行的,尽管这种情况将来可能会发生变化。事实上,这些供应商有可能将GenAI集成到他们的产品中,以提供支持SME-Author范式的全功能工具。

- 2 -

管理一致性

知识管理和技术文档的主要挑战之一是随着时间的推移和跨来源保持准确性和一致性,从根本上避免矛盾的信息。

这是一个人们耳熟能详的故事:一本手册详细阐述了产品版本1的流程,另一本指南则介绍了如何对产品进行故障排除。同时,为了支持这一过程,代理撰写了一篇包含相关提示的文章。然而,经过几年的产品迭代,目前最畅销的产品已经经历了两次重大演变,并衍生出四种不同的变体,同时远销三个不同的海外市场。

随着产品的不断演变和市场的不断拓展,相关的文档也应该得到相应的发展。然而,事实是否真的如此呢?所有翻译的内容是否都准确无误呢?为了制作快速入门指南而进行的复制粘贴操作,是否确保了内容的时效性和准确性呢?还有,帮助台工具中的所有知识库文章是否也得到了及时的更新和完善呢?

这是每家公司都需面对的挑战:即便技术内容信任度未受影响,它仍可能阻碍生产力,并降低公司的安全防范水平。单一来源——即使用一个工具编写所有内容——或许看似能解决此问题,但现实证明,这一方法在大规模操作中收效甚微。每位利益相关者都倾向于选择自己偏爱的创作工具(自然,我们无法强求产品营销部门的人员使用DITA进行编写,对吧?),更不必提及他们还需将内容复制粘贴至Word文件、各类文章乃至电子邮件中。

人工智能正是在此发挥其作用。它可以读取文档的所有版本以及团队生成的所有信息,并检测出其中的不连贯和不一致情况。它能够识别出哪些内容需要进行更新,并实时对生产进行检查。无论是在编写内容的过程中,还是在利用内容进行其他操作时,系统都可以自动核查其与现有材料的一致性。

人工智能在维护全面、一致且可靠的信息库方面具有巨大的潜力,这也进一步为每个利益相关者提供了成为内容贡献者的机会。

- 3 -

以更低的成本走向全球

对于进行全球销售的公司来说,一个关键的决策就是需要将多少内容翻译成多少种语言。翻译代表着金钱和时间方面的成本,翻译内容的可用性可能会延迟文档的发布(如果不是产品本身的话)。

机器翻译 (MT) 在过去十年中的进步有助于降低财务成本和缩短生成翻译所需的时间。事实上,机器翻译已经变得如此出色,以至于人们现在开始考虑是否有可能仅依靠机器翻译,将人类从翻译过程中完全剔除。

回答是肯定的,有三个原因:

  • 技术文档的编写从语言的角度来看是明确且易于掌握的。没有冗长而复杂的短语,没有双重否定、讽刺或轻描淡写。在大多数情况下,易于阅读意味着易于翻译。

  • 词汇本身是有限的。即使它可能包含大量术语,这些术语也是众所周知的。术语表和翻译记忆库包含所有必要的细节,以支持机器翻译引擎的专业化。

  • 如果你之前“手动”翻译过,并经过专家审查和修复,那么你就有了经过验证的翻译历史,这正是训练现代机器翻译引擎并获得更好结果所需要的。

最近的实验表明,机器翻译已经足够好,企业可以完全依赖它,而无需人工验证。请注意,当前的 DNN(深度神经网络)引擎仍然比基于 LLM 的翻译好一点,但两者的结合在未来可能会产生更高的准确性。

这对你来说意味着什么?简而言之,您可以大大简化您的发布工作流程。

试想一下,当你的内容以源语言形式编写完成后,可以毫不改动地发布到你的内容交付平台上,并且能够即刻以你所期望的多种语言展示出来:无论是10种、20种,甚至40种或更多。无论数字是多少,关键在于对内容的即时翻译,让你的内容在用户面前呈现出如同使用了23种语言般的丰富性,即使在草拟阶段其实只使用了一种语言。这包括用户的搜索查询、搜索结果页面以及展示的内容,所有这些都要求做到实时的翻译转换。

你也可以选择在预翻译内容(基于机器翻译,有或没有验证)和实时翻译之间平衡你的策略。例如,您可以使用英语创作,用日语和中文进行预翻译和验证,用西班牙语和法语进行预翻译而不进行验证,并通过实时翻译提供18种其他语言的属性访问权限,因为拥有更少的客户。可能性是无止境的:只有客户和合作伙伴可以访问即时翻译;您可以利用读者的反馈来发现翻译问题;您可以限制预翻译或验证到阅读最多的内容。内容使用分析在这里肯定有很大的帮助,并将帮助您做出最佳决策。

图1:即时机器翻译为传统的预翻译提供了一种灵活、经济的选择。

- 4 -

帮助用户进行自我培训

技术文档的内容涵盖广泛,因此必须准确且全面。然而,有时这种准确性是以牺牲可读性为代价的,导致用户难以快速搜索并找到他们所需的信息

想象一下,一名技术人员在试图理解一项维护任务,但是面对着一个长达40页的程序文档,其中每一个可能的细节都得到了详尽的描述。这时,一种能够简化阅读负担的方法叫做“渐进式披露”。这种方法通过使用可折叠和展开的区块,来实现动态地隐藏或显示部分内容。然而,这种方法也给技术编写人员带来了额外的工作负担,因为他们需要对内容进行语义标记,从而让UI知道应该何时显示或隐藏哪些内容。更为重要的是,写作必须以一种即使内容被显示和隐藏的任何组合,对读者来说仍然具有意义的方式进行。不用说,这种披露内容的方式并不适用于所有情况。例如,如果用户想要的信息分散在多个章节或文档中,那么这种方法就会显得捉襟见肘。

这就是LLM发挥作用的领域。他们精于总结和提炼,这就意味着,你可以向他们动态提供那些并非专门为这一目的而准备的内容,然后请求一份包含十行、一页或三页的精准总结。

考虑为想要了解产品特性或功能的用户提供一种新的体验。用户可以先问一个简单的问题:“我如何解决这个问题?”或“需要什么程序?”

文档交付平台可以展示支持的内容,但仅提供了一个概述,而不是直接链接到页面的建议,从而迫使用户深入了解这些内容。此外,读者可以将内容标记为书签以供将来使用,并根据需要查看详细信息。

GenAI在信息发现和自我训练方面无疑具有巨大价值。它可以从海量基础文档中自动提炼出更简洁或独特的内容。这不仅有助于解决培训新手时必须创建特定内容的难题,这是一项成本高昂的任务,而且还可以避免随着产品的发展,必须将培训材料与技术文档重新同步的问题。简而言之,GenAI开辟了新的可能性,能够自动生成所需内容,从而节省了大量时间和资源。

- 5 -

重塑搜索体验

在过去的十年里,随着语言模型和概率评估的崭新应用,搜索引擎取得了巨大的进步。它们的相关性得到了极大的提升,同时也能实现结果的动态个性化。因此,像Fluid Topics集成的现代搜索技术,对比基于TF IDF的引擎,例如Solr或Elastic,表现出了显著的优势。那些仍然依赖这种过时的技术,同时希望为用户提供优质搜索体验的公司,应该考虑进行更新换代了!

LLM正在推动语言模型领域迈向新的里程碑,助力搜索体验实现飞跃式的进化。经由大型内容集(数十亿页)的训练,LLM在处理自然语言和概念搜索方面表现出色,这与传统的关键词搜索截然不同。然而,其局限性在于作为通用模型,并未专门针对您的内容进行训练。因此,它们对您的产品知识或竞争对手的了解有限,无法为您提供准确且具体的答案。近期的研究与测试表明,仅对LLM进行微调并不一定会产生更出色的结果。因此,在未经深度定制的情况下,LLM在回答特定问题或提供针对您产品的详细信息方面可能有所不足。

但有一条前进的道路。通过正确地结合现代搜索技术和GenAI(即大和小语言模型),你可以获得两全其美的效果,并构建新的查询和交互方式。多种用例是可能的。最明显的包括:

  • 搜索结果整合:用户运行搜索,会列出多个文档,有时来自多个来源(参考指南、故障排除程序等),所有这些都是相关的。打开和阅读每一个回复可能是一项繁琐的任务,但利用GenAI生成一个统一的回复可以提供卓越的用户体验。

  • 问答:人工智能可以直接回复问题,而不是通过关键词搜索返回文档列表,让用户阅读文档来找到问题的精确答案。

  • 对话和帮助:用户可以从一个问题开始,人工智能会用一组内容、该内容的摘要或精确答案回答。然后用户进一步查询系统以进入下一步。想象一下,这个用户与一位熟记你所有内容的专家交谈,在用户解决问题的过程中,通过对话逐段传递信息。

图2:Bing(右边)通过将搜索结果合并为回复,提供了一种新的用户体验。

图3:Bing聊天的一步一步的帮助

- 6 -

增强客服

回复客户提交的支持案例要么很无聊,要么很复杂。

如果说无聊,那是因为用户提出的许多问题都是基本的、反复出现的。支持人员厌倦了重复性工作。为了解决这个问题,支持人员创建了一个专门的知识库,这是一组预定义的答案,如果需要,他们可以复制、粘贴和调整。

如果复杂的话,那是因为剩下的问题不同寻常,而且很高深。这些请求要求客服搜索、阅读、再次搜索、询问专家,并从从多个来源获得的所有文档中得出正确的答案。这就像是通过组装信息来解决一个谜题,然后绘制出一幅漂亮、清晰的画面。客服的经验越少,他们就需要更多的时间和其他客服与专家的帮助。

所有这些都花费了公司的时间和金钱。回复缓慢会引起用户不满。那么,如果你能自动化部分流程,并将回复无聊和复杂案件的时间减少三分之一甚至一半,会怎么样?这就是GenAI所能实现的。

通过巧妙地将搜索技术与生成式人工智能相结合,你可以轻松撰写案例回复。其运作原理就像身边有一位无所不知的专家助手,能够在短短几秒钟内为您提供精准答案。然而,正如所言,错误的信息可能会带来严重的后果,因此不能冒险依赖不完美的AI(当然,人类也并非完美无缺)。

为了实现最佳的回复效果,推荐的方法是结合搜索+GenAI双管齐下。通过这种组合,您可以预先准备好回复内容,并由客服团队进行后续的检查、验证和微调。这样,原本需要五分钟才能完成的任务现在仅需两分钟,原本耗时一小时的任务如今只需20分钟。更重要的是,这还将帮助新入职的客服人员迅速进入角色。他们可以检查机器人程序自动识别的、回复中引用的支持文档,以及生成的回复内容,从而在审查和验证回复的过程中逐步积累经验。无论是提高写作速度、提高回复准确性,还是加快新员工的入职速度,都将带来诸多好处。

图4:使用GenAI提出书面答案可以显著提高客服的效率

- 7 -

结论

这些只是GenAI可以应用于技术文档以转变业务的少数场景,我们可以想到还有许多其他方面例如:

  • 提供更好的内容阅读体验:根据需要解释代码示例或将代码示例从一种编程语言翻译到另一种语言。

  • 智能词汇表:在上下文中解释一个术语,重新表述内容以帮助理解,等等。

  • 协助回复RFI/RFP问卷:问问你的售前工程师,他们有多喜欢填写这些总是相同的电子表格,但又不至于让你盲目地复制粘贴或重复使用。如果可以自动化呢?

  • 从技术文档中获得销售/营销推介和技术故事:建议关于该产品的五个项目符号,建议简短的描述等。

这些无限的机会,恰恰证明了在创造、管理和利用信息以改变客户体验方面所取得的巨大进步。软件平台正在持续进化,以便整合并实现这种转变,这将是一段激动人心的旅程。

你准备好了吗?

原文地址:

https://tcworld.info/e-magazine/intelligent-information/what-can-ai-do-for-you-today-1279/

通过GongZongHao搜索“大龙谈智能内容”联系我们。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/211826.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

JSP:Servlet

Servlet处理请求过程 B/S请求响应模型 Servlet介绍 JSP是Servlet的一个成功应用,其子集。 JSP页面负责前台用户界面,JavaBean负责后台数据处理,一般的Web应用采用JSPJavaBean就可以设计得很好了。 JSPServletJavaBean是MVC Servlet的核心…

电脑键盘推荐

一、键盘分类 (1)键位个数 目前有75,84,87,98,104,108的。 (2)薄膜键盘和机械键盘 薄膜键盘就是大多数办公室常见的键盘,主要打一个便宜,耐造…

phpstudy和IDEA 配置php debug

1.安装xdebug 扩展,phpinfo() 查看 2.配置php.ini zend_extensionD:/phpstudy_pro/Extensions/php/php7.4.3nts/ext/php_xdebug.dll xdebug.collect_params1 xdebug.collect_return1 xdebug.auto_traceOn xdebug.trace_output_dirD:/phpstudy_pro/Extensions/php_l…

SQL LIKE 运算符:用法、示例和通配符解释

SQL中的LIKE运算符用于在WHERE子句中搜索列中的指定模式。通常与LIKE运算符一起使用的有两个通配符: 百分号 % 代表零个、一个或多个字符。下划线 _ 代表一个单个字符。 以下是LIKE运算符的用法和示例: 示例 选择所有以字母 “a” 开头的客户&#x…

【LeetCode刷题笔记】DFSBFS(一)

51. N 皇后 解题思路: DFS + 回溯 :由于 NxN 个格子放 N 个皇后, 同一行不能放置 2 个皇后,所以皇后必然放置在不同行 。 因此,可以从第 0 行开始,逐行地尝试,在每一个 i

P6 C++控制流语句(continue, break, return)

前言 今天我们讲的是控制流语句,本期内容是上期课程的延续。 控制流语句一般与循环语句一起工作,它们让我们可以更好的控制这些循环的实际运行。 我们有三个主要的控制流语句可以使用,continue 、break 和 return,它们有不同的…

12.docker的网络-host模式

1.docker的host网络模式简介 host模式下,容器将不会虚拟出自己的网卡、配置IP等,而是使用宿主机的IP和端口;也就说,宿主机的就是我的。 2. 以host网络模式创建容器 2.1 创建容器 我们仍然以tomcat这个镜像来说明一下。我们以h…

Vivado Modelsim联合进行UVM仿真指南

打开Vivado,打开对应工程,点击左侧Flow Navigator-->PROJECT MANAGER-->Settings,打开设置面板。点击Project Settings-->Simulation选项卡,如下图所示。 将Target simulator设为Modelsim Simulator。 在下方的Compil…

UE5 中的computer shader使用

转载:UE5 中的computer shader使用 - 知乎 (zhihu.com) 目标 通过蓝图输入参数,经过Compture Shader做矩阵运算 流程 1. 新建插件 2. 插件设置 3. 声明和GPU内存对齐的参数结构 4. 声明Compture Shader结构 5. 参数绑定 6. 着色器实现 7. 分配 work gr…

Go语言中结构体的使用和示例

结构体(简称struct)用于创建不同数据类型的成员集合,放入一个单一的变量中。虽然数组用于将相同数据类型的多个值存储在单一变量中,但结构体用于将不同数据类型的多个值存储在单一变量中。结构体对于将数据组合在一起以创建记录非…

Unity调用dll踩坑记

请用写一段代码,让unity无声无息的崩溃。 你说这怕是有点难哦,谁会这么不幸呢?不幸的是,我幸运的成为了那个不幸的人。 unity里面调用dll的方式是使用 DllImport ,比如有一个 Hello.dll,里面有一个 char* …

[23] 4K4D: Real-Time 4D View Synthesis at 4K Resolution

paper | proj | code 提出一种基于K-Planes的4D point cloud Representation;提出一种Hybrid appearance model,包含image blending model和SH model。其中,image blending model将3D点映射回原图中求得,SH model通过模型预测求得…