我想我思 2024年12月18日 00:02 江苏
新场景驱动
在新科技的驱动下,未来实时通信网络应面向个人智能助理、沉浸式通信、多模态通信、多维连接等多感官、全媒体、多形态业务场景,助力实时通信业务的高质量发展,促进垂直行业数字化转型,提升个人业务沉浸式体验,驱动商业模式从用户经营、流量经营向价值经营演进。
端到端智能化
随着 AI 的蓬勃发展,用户日渐期待 AI 与实时通信深度融合,比如基于 AIGC 和智能媒体优化形成更为丰富的高质量内容,或通过自然语言处理、用户意图识别等,让实时通信业务端到端体验更为智能化。个人智能助理和 AI 智能通话是典型的实时通信网络端到端智能化业务场景。其中,个人智能助理是一种基于人工智能技术的虚拟助手,可通过语音、文字、手势等与用户进行实时交互,并根据用户需求提供相关信息、建议,执行对应的任务。而 AI 智能通话可为用户提供通话前智能代答、通话中意图智能分析,通话后记录智能推送等功能。
真实虚拟融合化
AR 眼镜、裸眼 3D 等沉浸式体验和多维感知终端为实时通信带来更丰富的业务交互体验。AR 眼镜通过第一人称视角,将数字内容与现实世界完美融合,使数字内容成为现实景观和体验的一部分,涵盖用户的驾驶、旅行、健康和教育等各类生活场景,成为连接虚拟与现实的交互枢纽和入口。裸眼 3D 通过自动立体显示、全息显示等,通过优化图像呈现,实现无需佩戴眼镜即可观看三维效果,提供高度真实感的立体视觉体验。
多维感知沉浸化
多模态通信结合语音识别、语音合成和手语识别等技术,可以基于多种输入/输出方式,如语音、图像、文字、肢体、表情、触感等,实现人机交互和信息实时传递。随着数字人理论和技术的日益完善,数字人与多模态通信的充分结合,可为用户带来商务会议、数字人分身通话等更加丰富的通信体验。基于用户上传的个性化形象或多角度视频,网络侧可构建高写实人物模型,并根据不同的会话场景实现人物模型的风格变化。未来实时通信网络需要引入多模态大模型,简化多模态信息与用户意图的识别,实现多模态信息的转换和生成。
新科技驱动
随着人工智能、元宇宙、跨学科融合等新科技的不断涌现,驱动未来实时通信网络从 2D 向 3D/全息、从物理向虚拟、从音视频向全媒体演进。人工智能融合 LLM、MLLM、AI Agent等,通过时空智能、具身智能感知世界、理解世界,分析多模数据、识别人类意图。元宇宙结合 XR、裸眼 3D、全息、数字身份、AI 等技术,实现物理世界和数字世界的真身与“化身、分身”融合可信通信。ICT、空天、算网等跨学科创新,驱使实时通信泛在化、全域化。
人工智能技术
人工智能技术能高效解决复杂问题,提升生产效率,创新服务模式。以 AIGC 技术为依托的各类产品呈现出快速增长的态势,其应用场景不断扩大,AI 未来将作为生产力工具来推动实时通信网络发展,为用户提供更加丰富的个性化内容体验。
LLM
(Large Language Models,大型语言模型):具有数十亿甚至数千亿参数的人工智能模型,在大量文本数据上进行训练,能够理解和生成自然语言,基于 LLM 所构建的 AI Agent 具备与未来实时通信网络结合的无限潜力。
结合 RAG
(Retrieval-Augmented Generation,即检索增强生成)、工具等构建 AI Agent,还可进一步确保生成内容的准确性、避免偏见和不当内容的产生等。
MLLM
(Multimodal Large Language Model,多模态大模型):能够处理和分析多种类型的数据输入,不仅限于文本,还包括图像、视频、音频和传感器数据等,这种跨模态的理解能力使得模型能够更全面地感知和解释世界,执行更多高阶实时通信任务。
AI Agent
:以 LLM/MLLM 为核心,实现任务拆解,进行推理决策、反思和自主学习等,通过 RAG 等技术实现短期和长期数据存储,将该数据作为上下文输入到 LLM/MLLM 中,并通过工具集(Tools),完成特定任务。
沉浸式通信技术
沉浸式通信技术结合了虚拟现实、增强现实、3D 建模等先进技术,可构建一个包括虚拟社区、虚拟经济和虚拟身份在内的全新虚拟世界。用户可以自由探索、交互并创造新的体验,极大地丰富我们的生活和工作方式。
沉浸式终端和交互技术
:随着 AR 眼镜 Micro LED 光机和光波导镜片等核心技术迅速走向成熟,轻量化、低功耗的 AR 眼镜将逐步成为广泛普及的增强现实体验终端,并借助自然语言、手势等多维交互能力,为运营商的实时通信业务开辟新的发展机遇。此外,VR 终端可以带来沉浸式共享空间,裸眼 3D 可以带来真人效果的数字分身,结合听声辨位、眼对眼交流、多视角观察、协同展示等功能,带来更丰富的通信体验。这些沉浸式终端,将成为未来虚实世界通信的统一入口。
虚拟身份
:用户在元宇宙中通常需要多个虚拟身份,如化身(Avatars),代表他们在虚拟世界中的自我。这个虚拟身份与用户物理世界身份有关联关系,需要提供全球唯一的虚拟身份来标识该用户,需要构建虚拟身份管理系统支撑运营商、互联网以及应用间开放且安全的互通。
多学科融合创新技术
跨学科新技术接连出现,生命科学和信息技术交叉融合,叠加算力、人工智能及通感一体等技术将有效扩展信息通信技术边界。
ICT 融合
:沉浸式通信交互、个人智能助理等要求实时通信网络提供低时延、大容量、高可靠的服务,网络业务需要能够加速迭代创新,那么实时通信网络架构需要引入前沿的 IT 技术。5GC SBA 架构开启了电信网络向服务化演进的大门,未来网络会向全服务化(HSBA,Holistic Service-Based Architecture)架构持续演进。在全系统、全网元范围内进一步贯彻服务化设计理念,优化服务设计、消除原子服务之间的耦合性;引入新的协议及服务化技术的增强,如引入 HTTP/3、Serverless 机制、函数服务等更多的服务化技术;同时需要与算力网络深度融合,形成算网一体化的新型基础设施,为用户提供低时延、高可靠的算力连接。可见电信网络的服务化、融合 IT 技术优秀实践,是大势所趋。
泛在连接
:下一代泛在实时通信网络在接入侧,需支持 6G、固定、WiFi、卫星等各种接入技术;在终端侧既支持兼容传统 SIP 终端,也支持未来 AR 眼镜、手表、裸眼 3D、机器人等新形态终端。
网络演进驱动
实时通信业务发展初期网络采用电路交换技术,随着以太网、TCP/IP、互联网的崛起,网络趋向 IP 化,由电路交换向分组交换转变。为了保证语音业务的持续演进,3GPP 提出了 IMS(IP Multimedia Subsystem,即 IP 多媒体子系统),基于“LTE+IMS”架构,运营商在4G阶段实现了全球普遍使用的 VoLTE。5G 时代之后,运营商又发布了 5G 新通话,构建交互式网络基础能力底座,使能一系列通话增强服务和创新应用,进一步丰富了实时通信业务体验。但当前 IMS/实时通信网络中仍存在以下待解决问题:
网元数目众多
IMS 网络中网元类型众多,进而导致网络故障风险点多,网络维护和功能升级复杂度高。
接口种类复杂
现网使用 SIP、H.248、Diameter、DNS、HTTP 等多种协议,涉及接口众多,网络运行和维护难度高。
交互机制冗长
当前的注册/呼叫机制不够灵活高效,如媒体协商与会话信令强绑定、SIP 状态机要求严格、业务触发机制僵化等问题,均将影响 XR 等超低时延业务极致体验的实现。
创新迭代困难
终端与网络业务耦合,会话控制与网络业务逻辑耦合。通过 SIP 信令交互实现上层业务控制,使得新业务上线或特定业务更新往往需要扩展 SIP 参数和基础网络频繁升级,协同改造过程复杂,从而导致新业务上线困难。
来源:下一代泛在实时通信网络架构白皮书