「专题速递」AR协作、智能NPC、数字人的应用与未来

9a07d3d622bad18771921881b0b1de9b.jpeg

c88e2a75e4d4d8ae5007079fc159beda.gif

元宇宙是一个融合了虚拟现实、增强现实、人工智能和云计算等技术的综合概念。它旨在创造一个高度沉浸式的虚拟环境,允许用户在其中交互、创造和共享内容。在元宇宙中,人们可以建立虚拟身份、参与虚拟社交,并享受无限的虚拟体验。

作为互联网大变局的核心概念之一,元宇宙正崭露头角,展现出足以重塑产业生态的潜力,描绘着一个与现实世界相对应的虚拟世界。虽然元宇宙仍处于早期的探索阶段,但我们坚信,舆论的泡沫消退之后,技术不会停止下前进的步伐——元宇宙的真正实现只是时间问题。

在本次技术大会中,我们将深入研究元宇宙相关的核心技术及其发展趋势,探讨AR协作、智能NPC、数字人的应用与未来。我们期待与参会者携手探索元宇宙相关技术的发展现状,并了解它将如何改变我们的生活和工作方式。

01

实现身份无关的多模态混合驱动的2D数字人实时生成技术

0654f145a683ef9937c60e7da251df57.jpeg

张玉兵

广州视源电子科技股份有限公司 

技术专家

我们致力于让思维表达更为平等和高效。有人思维清晰但不善表达,有人表达流畅但不喜出现在公开场合和镜头前,还有人因为突发疾病或其它原因而导致声音和形象欠佳。希望因为我们的存在,为更多的人扫除思维表达的障碍,让更多的人能够平等高效地表达自己的思维。

本次分享的思路:

1、介绍2D数字人克隆技术,解决教育培训和企业营销场景下降本增效的问题。其中包含两个技术特色:a)2D数字人表情编辑,解决了当前2D数字人只能对口型导致的不够真实而应用场景受限的问题,b)跨语言驱动,拓展了2D数字人的应用场景,可以应用跨语言出海业务的企业营销视频制作。

2、介绍不存在于这个世界上的2D虚拟人生成技术,解决了2D数字人制作过程中 a)用户定制数字人门槛较高 和 b)模特拍摄和肖像授权费用过高两个问题。其中的技术特色是:所采用神经网络渲染方案不依赖于视频前后帧间的信息,因此在制作不存在于这个世界上的新的虚拟人的过程中对算法的鲁棒性要求不高,可以对虚拟人素材进行评估筛选,保证了虚拟人生成的效果和稳定性。

3、介绍2D数字人脸表情、人头部姿态和肢体动作的实时驱动技术,解决在远程视频会议中完美出镜、视角矫正、背景替换、极致的低带宽传输等需求。技术特色是:a)实现身份无关的带有任意表情和动作的多模态混合驱动的2D数字人实时生成技术,b)同时结合轻量级的神经网络渲染技术极致优化运行时间,实现移动端实时运行。

4、介绍商业应用案例。

02

基于星火大模型的元宇宙NPC创新应用探索

5934f0645fcfec4065e3fb060adca4d7.png

刘健

科大讯飞

 MetaLab实验室研发负责人

元宇宙,这个虚拟的数字世界,将现实与虚构巧妙融合,创造出无尽的可能性。未来,大模型的融入将成为必然之选,它能赋予元宇宙更为真实、智能的交互体验,实现自然语言对话、内容生成等功能。这种结合将为元宇宙注入更丰富的内涵,提升用户的参与感和沉浸感,推动虚拟体验不断向前发展,激发创新、商业和社交领域的无限潜能。

本次分享将分为三个环节:首先,我们将简要介绍讯飞星火Spark,让您初步了解这一神奇的工具;其次,我们将深入探讨AI智能NPC的应用框架,带您领略大模型下智能NPC技术实现的原理;最后,我们将展示讯飞星火在云宇宙中的创新应用探索。通过以上三个环节,我们希望能够为您揭示元宇宙与大模型结合的实践探索之路。

03

AR协作的思考与实践

da4f8a0dfd5396a7b63e9e9fcdbb6fa4.jpeg

唐荣兴

亮风台 联合创始人&COO

主体内容会从经历的过去、现在、未来展开,稍列如下。

2003年开发PocketPC上的软件电话SIPPhone到现在刚好二十年,其间经历过2008年第一次创业的FeaturePhone上的视频通话,用户数千万级,感受过用户对沟通、交流的强烈需求。

第二次创业专注增强现实,2017年前后启动AR协作软件HiLeia的产品研发,感受到企业服务市场对AR协作的需求,感受到企业服务市场垂类场景对音视频通讯依然存在强烈的细分需求。

从二十年前的软件电话到音视频交流再到更加丰富内容与交互的AR协作,有幸见证了技术与场景的变迁与进化,似乎浓缩的是“音视频”从1维到2维再到3维的维度跃进?个人的思考、实践固然重要,行业的发展与用户需求递进才是本质与底层逻辑。

如果你希望参与到音视频技术大会当中,此刻刚刚好:“LiveVideoStackCon 2023音视频技术大会深圳站”门票限时9折优惠中,报名立享优惠,团体参会优惠更多哦!现在报名,与您相约深圳。

时间:2023年11月24日-25日

地点:深圳圣淘沙酒店(翡翠店)

获票方式:扫描下方二维码,或咨询票务微信,了解大会详情。

3aed5f44a86d1d07dc7ff4668ded11a4.png

优惠截止10月15日 

          票务服务:

微信同号13520771810

ticket@livevideostack.com

0d10d704e0cbcf99716d53e99edcffdf.jpeg

关于LiveVideoStackCon 音视频技术大会

LiveVideoStackCon是专注于音视频领域的技术大会,致力于分享一流的技术内容,在把握行业趋势和热点的同时持续挖掘技术深度。自首届以来的13场大会中,LiveVideoStackCon成为众多音视频技术人的舞台、国内多媒体生态的风向标,也成为大家技术交流、拓展专业网络、职场进阶的新方式。

LiveVideoStackCon 2023 深圳站,将以“沉浸·新视界”为主题,在2023年11月24日-25日在深圳和大家见面。本场音视频技术大会,依然聚焦在多媒体生态,精心打磨3场主题演讲、13场专题(包括一场圆桌专题)。本次大会规模约300+参会人员,50+技术分享,80+参会企业,并设有VIP社交晚宴、硬件体验区、扭蛋抽奖等各种活动,带来丰富、沉浸的技术大会体验。

▼点击下方阅读原文 ▼

进入LiveVideoStackCon 2023深圳站官网 了解更多精彩演讲

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.hqwc.cn/news/129456.html

如若内容造成侵权/违法违规/事实不符,请联系编程知识网进行投诉反馈email:809451989@qq.com,一经查实,立即删除!

相关文章

【Es基础入门必看】

Es基础入门 1. ElasticSearch的认知1.1 搜索1.2 倒排索引1.3 Lucene1.4 ES基本概念 1. ElasticSearch的认知 ElasticSearch(以下简称ES)是什么?按照官网的定义,ElasticSearch是一个分布式的、RESTFUL风格的搜索引擎。 1.1 搜索…

Netron【.pt转.onnx模型展示】

接着上一篇写哈,如何转.onnx的。 因为是转.onnx类型的,需要先安装onnx的包。 这是直接pip install onnx后转onnx报的错: 很显然是版本问题导致的,so: 将export.py的脚本拉到最下面的parse_opt函数,把“17”改为“12”…

超越React,JS代码体积减少90%!它为何是2023年最好的Web框架?

说到Web框架,大家最先想到的可能是 Vue、React,或者是Next.js。但不得不提,有个后起之秀“来势汹汹”,1.0版本发布至今仅一年,就出尽风头。它就是Astro。 Astro 是什么?一个现代化的静态站点生成器和前端框…

Notepad++提取含有特定字符串的行

ctrl M快捷键,进入"标记" 页面 标记所在行–循环查找-- 正则表达式 – 输入关键字 – 全部标记 – Copy Marked Text 关键字格式如下: .*关键字.*ctrl v,粘贴即可。

深入理解PKI

安全始终是网络通信的核心议题,PKI提供了一组标准的网络安全组件,可以为通信双方提供加密、完整性保护、认证等安全基础设施。原文: Public Key Infrastructure (PKI) Jacek DylagUnsplash 由于用户名和密码不足以验证用户的身份,因此PKI(公钥…

Deep learning of free boundary and Stefan problems论文阅读复现

Deep learning of free boundary and Stefan problems论文阅读复现 摘要1. 一维一相Stefan问题1.1 Direct Stefan problem1.2 Inverse Type I1.3 Inverse Type II 2. 一维二相Stefan问题2.1 Direct Stefan problem2.2 Inverse Type I2.3 Inverse Type II 3. 二维一相Stefan问题…

使用chat-GPT接口提取合同中关键信息

1 业务需求 目前公司有几千份合同,而且还会不断的增长;现在需要将合同中的关键信息提取出来给业务使用,业务现在需要将这些关键字段信息录入存档到档案系统;人工去阅读整个合同去提取这些信息,是很浪费人力的&#xff…

Netty深入浅出(无处不在的IO)

为什么要有Netty Netty是为了解决网络编程的复杂性和提供易于使用、高性能和可扩展的框架而开发的。它通过提供一组可重用的组件来处理网络通信的低级细节,例如套接字管理、线程和缓冲,简化了开发网络应用程序的过程。这使开发人员可以专注于应用程序逻…

Dubbo 环境隔离

通过标签实现流量隔离环境(灰度、多套开发环境等) 无论是在日常开发测试环境,还是在预发生产环境,我们经常都会遇到流量隔离环境的需求。 在日常开发中,为了避免开发测试过程中互相干扰,我们有搭建多套独…

Flink---11、状态管理(按键分区状态(值状态、列表状态、Map状态、归约状态、聚合状态)算子状态(列表状态、广播状态))

星光下的赶路人star的个人主页 这世上唯一扛得住岁月摧残的就是才华 文章目录 1、状态管理1.1 Flink中的状态1.1.1 概述1.1.2 状态的分类 1.2 按键分区状态(Keyed State)1.2.1 值状态(ValueState)1.2.2 列表状态(ListS…

在Remix中编写你的第一份智能合约

智能合约简单来讲就是:部署在去中心化区块链上的一个合约或者一组指令,当这个合约或者这组指令被部署以后,它就不能被改变了,并会自动执行,每个人都可以看到合约里面的条款。更深层次的理解就是:这些代码会…

王道考研计算机组成原理——计算机硬件的基础知识

计算机组成原理的基本概念 计算机硬件的针脚都是用来传递信息,传递数据用的: 服务程序包含一些调试程序: 计算机硬件的基本组成 控制器通过电信号来协调其他部件的工作,同时负责解析存储器里存放的程序指令,然后指挥…