引言:AI 的机遇与挑战
自从 ChatGPT 横空出世以来,人工智能似乎一夜之间变得无处不在。在日常使用中,我们常常在惊艳与失望之间徘徊:它有时能展现出令人惊叹的能力,洞察深刻、对答如流,有时却又犯下令人哭笑不得的错误。正如 ChatGPT 官方页面的警示语所说:“ChatGPT 也可能会犯错。请核查重要信息。” 这提醒我们,尽管 AI 技术突飞猛进,但要将其转化为实际生产力,还需要深入的思考和探索。
在工程领域,特别是汽车电子测试这样的专业领域,我们更需要理性地看待 AI 的能力。不同于日常的聊天问答,工程领域对工具的可靠性、稳定性和可预测性有着极高的要求。那么,在这样的专业领域中,什么样的 AI 应用才是真正有价值的?AI 又该如何与现有的工作流程深度融合,真正帮助工程师提升工作效率?这些都是我们需要认真思考的问题。
今年初,我们给小北同学已经配上了AI智能助理PiHoo,看看他们配合得怎样了?
汽车电子测试的复杂性与 AI 应用机会
汽车电子测试是一个专业性强、流程复杂的领域。从测试项目启动开始,工程师们就要经历一系列严谨而复杂的工作环节:首先需要深入分析需求文档,制定相应的测试策略;继而设计测试用例并组织评审;之后要搭建和配置测试环境,开发测试脚本;最后是执行测试,进行问题分析,生成测试报告,并对测试结果进行验证确认。每一个环节都需要专业的知识和丰富的经验,任何一个环节的疏漏都可能影响最终的测试质量。
在这些复杂的工作流程中,AI 可以作为工程师的得力助手,在多个关键环节发挥重要作用。在测试需求分析阶段,AI 可以辅助处理和解析复杂的需求文档,帮助工程师提取关键的测试点,识别需求中潜在的风险。当进入测试用例设计阶段,AI 能够推荐合适的测试场景,辅助生成基础的测试用例,并提供测试覆盖度分析,帮助工程师确保测试的完整性。
在测试脚本开发阶段,AI 可以显著提升效率:它能够根据测试用例自动生成测试脚本框架,提供代码补全和优化建议,辅助识别潜在的代码缺陷。在脚本调试过程中,AI 可以分析执行日志,辅助定位问题,并给出修复建议。这可以加快开发速度。
到了测试执行阶段,AI 的价值同样显著。它可以协助优化测试执行策略,生成部分测试数据,在发现异常时及时预警。测试完成后,AI 还能分析测试日志,对问题进行分类,并协助生成规范的测试报告,提升测试后期工作的效率。
通过在这些特定环节中融入 AI 能力,可以显著提升工程师的工作效率,减少重复性工作。
然而,要真正实现这些目标,我们必须首先正视当前 AI 技术面临的几个主要挑战。
当前 AI 在工程领域面临的主要挑战
1. 自然语言的固有局限
人们常说,被误解是表达者的宿命。这源于自然语言与生俱来的模糊性和不确定性。正是因为这个原因,在工程领域,人们发明了各种专门的语言,如编程语言和建模语言等,以降低信息传达过程中的不确定性。然而,当 AI 来处理这些自然语言时,同样会面临理解偏差的问题。为了确保 AI 能够准确理解输入文本中表达的意图,我们必须建立完善的机制,比如增加评审和测试环节,以验证 AI 的理解是否与人类的预期相符。这种验证机制不仅是对 AI 输出的把关,更是确保整个工作流程可靠性的重要保障。
2. 复杂图表处理能力不足
在汽车电子测试领域的需求文档中,各种专业术语和复杂图表是不可或缺的表达方式。然而,当前的大语言模型(LLM)最擅长处理的是纯文本数据,即便具备了多模态处理能力,要完全理解工程领域中那些专业的、复杂的图表依然是一个巨大的挑战。为了解决这个问题,需要精心设计处理流程,将LLM 不擅长处理的信息转换为它能够理解的纯文本格式,如 JSON 或 Markdown 等。但任何转换过程都不可避免地会造成信息损失,因此在设计这样的处理流程时,必须考虑如何控制信息损失,并建立有效的异常提示机制,确保在关键信息可能丢失时及时警示用户。
3. 上下文长度限制
上下文长度的限制是当前大语言模型面临的一个显著瓶颈。例如 32k token 的上下文长度,换算成英文文本大约是 50~100 页左右,这其中还没有考虑连续对话占用的空间。在实际工程应用中,需求文档动辄几百上千页,远超模型的处理能力。需要对文档进行分段处理,但这又带来了新的挑战:在一份完整的工程需求文档中,不同段落之间存在着复杂的互相引用和依赖关系。简单的分段处理可能导致 AI 无法完整理解某个需求片段的完整语境。因此,所需要的预处理机制,在保证每个片段长度适中的同时,还要能为 AI 提供充分的上下文信息,使其能够准确理解每个需求片段在整体系统中的位置和意义。
4. 幻觉问题
大语言模型的"幻觉"问题,即模型生成看似合理但实际错误的内容,这在工程应用中是不能接受的。当我们把 AI 视为一种工程工具时,如果这个工具本身无法检测或预防可能出现的错误,使用它将会带来难以预估的风险。在汽车电子测试这样对可靠性要求极高的领域,AI 的每一个输出都可能影响到测试的质量和结果的可靠性。因此就必须建立一套输出验证和监控机制,根据 AI 输出结果的影响程度和范围,设置相应的验证流程和质量控制门槛,确保每一个 AI 的输出都经过充分的验证和确认。
5. 专业知识体系的局限
当前的大语言模型虽然经过了海量数据的训练,但在特定专业领域的知识掌握仍然不够深入和系统。在汽车电子测试领域,存在大量的专业标准规范(如 ISO 26262、ASPICE 等)、测试方法论和最佳实践,这些专业知识往往需要多年的实践和积累才能真正掌握。AI 在处理这些专业问题时,可能会出现理解片面或者无法准确把握具体场景需求的情况。因此,在应用 AI 工具时,我们需要建立专门的行业知识库来增强 AI 在特定领域的专业能力。
6. 工具链集成的挑战
汽车电子测试领域已经形成了一套成熟的工具链生态,包括需求管理工具、测试用例管理系统、自动化测试平台、缺陷跟踪系统等。要让 AI 真正发挥作用,就必须能够与这些既有的工具链无缝集成。然而,不同工具之间的数据格式、接口协议可能存在差异,如何让 AI 能够准确理解和处理这些工具产生的数据,如何确保 AI 的输出能够被这些工具正确接收和使用,都是需要解决的技术难题。
结语
在汽车电子测试这样的专业工程领域,我们需要的显然不是一个简单的聊天机器人。工程师们需要的是一个可靠的、值得信赖的问题解决工具。这个工具的输出必须是稳定、一致且可预期的 —— 我们不期待它带来任何“惊喜”,更不能容忍“惊吓”。即便它每次只能给出 60 分的结果,我们也希望它能保持这个水准,而不是时而 40 分,时而又达到 80 分。同时,这个工具必须具有清晰明确的能力边界,能够识别出什么是它可以胜任的,什么是超出其能力范围的。更重要的是,它需要具备完善的错误检测机制,在出现问题时能够及时向用户发出警示。只有同时满足这些要求,AI 工具才能真正在工程实践中发挥其价值,成为工程师可靠的助手。
作为深耕汽车电子测试领域十余年的专业咨询公司,北汇信息对 AI 技术保持开放的态度。我们将充分发挥在汽车电子测试领域的专业优势和丰富经验,探索 AI 技术与传统测试服务的融合。
大家对于AI在汽车电子测试领域里有什么期待?对于PiHoo如何帮助小北同学有什么想法?欢迎在评论区留言,我们将择优派送PiHoo精美钥匙扣。