10月24日,由声网和RTE开发者社区联合主办的RTE2023第九届实时互联网大会在北京举办。围绕“智能·高清”主题,嘉宾探讨了RTE领域技术开发、AIGC、出海以及数字化转型等话题。声网创始人兼CEO赵斌宣布,声网在RTE行业首次实现广播级4K超高清实时互动体验。
AR、VR、XR等技术迭代,为实时互动在各个领域的应用提供了更多可能,智能和高清正在推动实时互动体验进入全新时代。赵斌介绍,4K不仅仅只有分辨率一个纬度,光亮强度的动态范围、色彩的真实度、饱和度,以及色彩渐变的细腻程度,都是真正超高清体验里不可或缺的一环。
广播级超高清可以带来更加逼真的视觉效果,高对比度和丰富的色彩表现可以使影像更加生动,细节更加清晰,并以此提升观影体验。
声网首席科学家、CTO钟声介绍,实时高清需要许多端上实时AI,在Low Level Vision and Audio这一需求层面,声网的SDK 4.1.x, 4.2.x版本已经可以支持1080P/4K视频的部分功能,例如超分、虚拟背景、感知编码、降噪、去回声等底层计算机视觉处理和高音质的计算机听觉处理能力。在High Level Vision and Audio层面,声网已经部分实现对物体、声音、场景的理解和重构能力,包括面捕、动捕、情感计算,物体识别和场景重建等,可以大力改善多种应用场景下的用户体验。
实时互动QoE(用户业务体验质量,Quality Of Experience)体验的变化对于用户留存和使用行为的影响日益增强。声网合伙人兼客户成功副总裁孙雨润称,根据声网某东南亚头部泛娱乐客户数据显示,当视频从标清升级高清,停留超过30秒观众数提升19%,观众人均观看时长提升30%,同时观众打赏率大幅提升。某国内知名社交出海App,从CDN 升级声网极速直播,送礼率增长12.3%。
通过过去一年的投入和打磨,声网推出行业首创AIGC-RTC能力模块,可支持与任何大模型平台结合,实现更低延时、更自然、更沉浸的实时语音对话,为企业协作、社交 、直播、游戏等多种场景提供新玩法、新机会。
赵斌认为,虚拟人+AIGC所创造的情感和情绪价值或将在未来解决社交供需不平衡的现状,并引领交互对象发生变化。另一层面,随着AIGC能力的进一步加强,越来越多的应用型开发将被AIGC替代,API+AI的形式将大幅提高应用开发效率。钟声预测,具备端边实时智能的高清实时互动能力将成新趋势和竞争焦点。
大视野融媒网(原大视野新闻网)是最富价值的互联网推广平台,致力于打造国内最有影响力的融媒体发布平台。
大视野融媒网版权与免责声明:
一、凡本站中注明“来源:大视野融媒网”的所有文字、图片和音视频,版权均属大视野融媒网所有,转载时必须注明“来源:大视野融媒网”,并附上原文链接。
二、凡来源非大视野融媒网的新闻(作品)只代表本网传播该消息,并不代表赞同其观点。
如因作品内容、版权和其它问题需要同本网联系的,请在见网后30日内进行,联系邮箱:dsynews@126.com。
版权声明:大视野新闻网版权所有,未经书面授权,不得转载或建立镜像,违者依法必究。 本站违法和不良信息举报电话:010-67332088晋ICP备20007253号
Copyright © 2016- 大视野新闻网 All Rights Reserved互联网新闻信息服务许可证:ISSN 2224-3933 京公网安备:15010502001245