科技
业界 互联网 行业 通信 科学 创业

声网:打造更易用、更沉浸、更有趣的音视频互动体验

来源:壹点网 2022-11-15 10:07:25
A+ A-

年来,泛娱乐&出海领域逐渐受到追捧,随着元宇宙的爆火,实时互动技术也在该场景应用中变得越来越重要,在刚刚过去的RTE2022泛娱乐&出海论坛上,声网泛娱乐产品负责人李斯特以“次世代实时互动社交”为题,梳理了这一领域的机遇与挑战。

实时互动玩法创新 泛娱乐行业快速增长

实时互动的玩法继续在无边界渗透,并覆盖了更多的场景与用户,从大盘来说,今年全球泛娱乐用户时长每个月超过了10万亿分钟,全球泛娱乐APP实现了7.9%的快速增长。在泛娱乐产品的领域,音视频是最核心的呈现形式之一,全球头部的社交泛娱乐产品里,有超过50%的场景是包含直播的,在全球社交Top100的应用中,大约20%左右的应用包含了实时音视频能力。

我们看到,互动社交的玩法还在持续的快速迭代,包括语聊房的超大频道、实时聊天的高清视频、以及实时聊天过程中的互动游戏,以及3D的狼人杀等。这些互动玩法的升级也给实时音视频带来了更高的技术挑战。另外,实时互动的能力也逐渐渗透到更多像占星、冥想、招聘等细分场景,这些应用同样也对实时互动技术提出了新的要求。

另外,基于特定标签的社交产品如雨后春笋般出现。无论是在西方、中国,还是一些发展中国家,针对特定细分标签人群的产品越来越多,但这些产品也帮助实时互动社交去覆盖到了更广的人群,与此同时,更广的人群覆盖也要求实时音视频产品对使用者环境要有更高的宽容度,在一些“异常”场景下能够有更好的体验。

打造更易用、更沉浸、更有趣的音视频互动体验

我们在结社交互动玩法的进化过程中,发现对音视频的需求至少有三条更易用、更高的沉浸感、更有趣

首先是声网对于环境宽容度的提升,声网这几年在该技术的投入过程中,发现很多客户都会存在一些环境体验的障碍,比如在一个大环境里有一些噪音,针对这一痛点,声网升级了AI降噪能力,可以针对电视的噪音、敲击屏幕等百种以上的突发噪音进行有效的抑制,并带来纯净的沟通体验。声网AI降噪能力是利用纯软件算法,不依赖于硬件,并可以做到超低延迟的端上消除模式。

针对构建沉浸感这个维度上,我们发现今年有一个明显的高清化趋势。在声网的大盘数据中,720p及以上分辨率的视频通话数量比去年增长了319%,对应的通话分钟数比去年增长了127%。

不难得出,随着网络和移动设备的发展,特别是在一些视频群聊、秀场直播、游戏直播等场景里,人们对于视频的清晰度要求越来越高。但在这个过程中,由于视频分辨率的增加,对于网络和设备的要求也在进一步提升。与此同时,声网的视频算法在这方面也有一些新的进展。结合声网 PVC、AV1、超分以及HDR等各种能力,能够实现在同等画质下,视频码率下降30%,在同等码率下,画质相对原来有明显的提升

除了视频,声音也是塑造临场感的关键因素,声网在空间音频领域,可以做到在3D空间中去重建声音在真实环境下的一些物理效果。包括声音在传播过程中的阻碍、衍射、绕射,以及声音在互相影响过程中造成的一些混响,包括人声模糊的效果等。这些能力也同样支持纯软件算法,开发者更易使用。声网的空间音频算法在帮助客户构建元宇宙等主流场景应用中提供了很好的帮助。

此外,在视频演进这一方面,虚拟和现实的边界在逐渐模糊。在演进到元宇宙的过程中,可能会诞生很多种应用玩法。比如,我们看到AI换脸特效已经在直播、语聊领域得到了普遍的应用,声网也在和合作伙伴不断打磨AI换脸特效,去给视频直播和语聊领域提供更多的玩法支持。

音乐、游戏、直播玩法革新 推动用户价值增长

在和很多创业者的交流过程中,我们发现很多人面临着营收的压力。过去,大家都聚焦在用户增长上,但由于各方面的原因,大家开始关注用户价值与收入增长。我们发现了三个被市场和行业普遍验证了的新玩法:音乐玩法、游戏玩法和直播带货

从大盘来看,今年全球泛娱乐产品的应用商店收入还在持续增长,从收入规模来看,中国、美国、日本、沙特是最头部的一些市场,但在科威特、西班牙、墨西哥等一些小语种国家,也出现了非常快的增速。

为了更好地帮助开发者和伙伴去实现更多的玩法创新和收入增长,声网也做了很多的尝试。比如声网今年就携手音集协、AllBy Music 等版权合作伙伴,整合了国内数十万音乐人和数万家音乐版权公司的版权内容,保证对“音乐场景解决方案”中的内容版权合规负责。除了版权,声网还为合作伙伴提供了许多组件化音乐能力,包括歌词组件、演唱打分、游戏玩法等,帮助开发者以及合作伙伴更快的完成“基层”搭建工作。

在游戏方面,传统的直播、语聊领域,最好的用户收入转换工具一般是刷礼物,但一些新的游戏玩法可以更好的提升用户的参与度。声网也提供了不少游戏互动组件,能够实现对多场景、多人以及语音识别等诸多游戏玩法,比如我们推出的对抗王国激战、躲猫猫大作战、动物神射手等,可以替代过往的一些直播PK玩法。基于语聊房,我们还推出了碰碰我最强、飞镖达人、你画我猜等在过往非常流行的一些游戏。同时也做到了轻量化包装和低成本接入合作伙伴可以快速线多种玩法和服务

再说到直播带货,国外知名的电商直播拍卖Whatnot,在游戏化社交功能做的比较好的ooooo以及Popshop Live都在基于声网提供的技术去实现实时互动。

元宇宙赛道,今年也有一些层出不穷的创新,声网也希望在这个过程中能够助力开发者去促成最大化的行业效率。从数据来看,我们能看到大部分的元宇宙产品和应用,用户的单次使用时长都是低于5分钟的、每周打开次数也是低于50次的。

从结论上来讲,我们认为国民级的元宇宙社交产品还在路上,目前互动内容的不足是绝大部分虚拟社交产品面临的挑战,产品在玩法上的创新和独特还不够让更多的用户沉浸进来。另外,在产品形态、交互设计、视觉感受上的创新,还不足以构成一个产品的核心竞争力,也不够去创造新的用户价值增量。在针对用户的社交动机上,我们要去构建一个怎样的社交关系链?很多元宇宙的创业伙伴还在持续的创新。

在这个过程中,我们看到很多行业参与者也在对元宇宙场景去做更多的思考和结,概括一下,其一就是线上虚拟空间需要现实生活中的数字拓展,其二就是必须有一些社交机制的玩法构建,才能吸引更多的用户。

对此,我们也看到我们的客户以及一些行业中的创业者有一些相应的实践和思考。首先是全球首款音乐元宇宙Partyon,它把K歌演唱会这样的场景从线下迁移到线上,取得了不错的用户运营的效果。号称体育元宇宙的Stadium Live也把体育直播、虚拟化身和数字产品在线上去做了很好的结合。我们看到这些行业参与者对元宇宙持续探索过程中带来的玩法越来越真实,用户也越来越有成就感。

在这个过程中,声网也希望能够去助力开发者,为他们提供更多元宇宙的底层能力,比如面部驱动、捏人换装、以及元宇宙中的状态同步、空间音频等,让他们更灵活、更快速的去构建自己的元宇宙产品。

同时,我们还会构建一些功能层,客户可以按需使用,快速构建一些功能。当然,很多拥有很强应用开发能力的开发者,也可以直接基于我们的基础功能去完成他们的元宇宙应用创新。具体来说,声网储备了一批虚拟人或虚拟场景相关的素材库,开发者可以基于用量进行模型租赁,帮助他们减少前期的引入成本,比如“捏脸”,我们就提供了91个关键维度,开发者可以基于我们的基础能力去设计自己的捏脸模型,把自己的一些Avatar模型和捏脸结合起来,去创造每一个独一无二的用户形象。

我们还能实现对面部表情的实时驱动追踪,声网提供的面捕功能能够支持最高240个人脸关键点,一共51个表情。同时,我们元宇宙的各种不同的场景提供了许多组件化的能力,帮助开发者去构建他们自己独一无二的场景。我们的能力应用在了元宇宙中的语聊、一起看电影、摇骰子、K歌、一起跳舞等各种场景。

当然,我们只是提供了一些最基础的组件,更多的还是需要开发者在他们的创新能力上去提供更深层次、更丰富的场景,比如虚拟漫展、虚拟招聘会、虚拟演唱会、元宇宙婚礼、云展会等。其实,今年我们已经有了10多家客户上线了有一定用户影响力的元宇宙应用,我们也希望和更多的行业开发者一起去创造独一无二的元宇宙场景和形象,将这些元宇宙能力应用在更多的领域。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:kj005
文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com

相关新闻

精彩推荐