当前位置: 商业快讯 > 正文

问鼎视频技术之巅,人物专访焦华龙

2022-08-02 16:42:12       来源:榕城网

 

文:如畅

当今世界是眼球经济的世界,直播、短视频、VR、视频会议等视频服务领域快速兴起,人们对4K、8K等超高清画质的需求也不断提高,然而这却给宽带带来了超强负荷。想要解决既能降低带宽消耗,又能最大化还原视频画质的这一难题,背后的关键则是“视频编解码”技术,从CD到VR,从720p到8k,视频背后的“视频编解码”标准,推动整个视频产业的进化。有一位和视频编解码技术死磕到底的人,他就是Tencent media lab的资深研究员--焦华龙。焦华龙经历了视频编解码标准的一次次突围,用自己深厚的数学功底,不断尝试创新算法,他和的同事们向不可能的技术极致一次次发起挑战,于2020年10月自研全球首个面向PC和移动端等多H.266/VVC标准视频解码器O266dec,实现了在PC端和移动端等多4K的 H.266/VVC视频的30fps到60fps实时解码,从此手机可看4KH.266/VVC超高清视频;并携Tencent266编码器,参加国际顶级MSU(Moscow State University)编码器大赛,在4K/1fps赛道获得10项比赛指标中的8项第一名的成绩。Tencent266可以节省50%的码率,大幅降低带宽和存储成本,超过了美国google和intel公司的libaom和svtav1等,成为世界上运行速度最快、最节省码率的视频编解码器,也成为全球第一个商用化的VVC/H.266编解码器。与此同时,焦华龙深耕实时视频会议技术20年,他和同事们以强大的专注力,高效的的协作力,创新实时通讯时域伸缩性编码(SVC)技术,克服实时视频会议的一个个技术难点,在新冠疫情全球大爆发的关键时刻,一举推出“Tencent VooV Meeting”,实现了中国上亿人线上会议的最佳体验,并凭借其高质量的音视频效果,走进联合国,成为唯一的联合国75周年视频会议服务提供商。

焦华龙硕士毕业于浙江大学数学系,他自幼酷爱数学,他认为数学是思维的载体,数学它不是一窜枯燥的数字,更是一门美学,它的思想,它的表现形式都透着美感,而正是这份对数学的热爱与着迷,为焦华龙在视频编解码领域的开拓创新奠定了坚实的基础。焦华龙自硕士毕业后,就直接进入视频编解码领域工作,主要负责视频编解码器的算法创新与性能优化。焦华龙长期专注在一个自己热爱的领域工作并不断深入,他认为是其能取得杰出贡献的关键所在。在他的人生履历里处处闪耀着奋斗者的足迹。

1.焦华龙向视频技术高峰一路进发,所及之处步步生花。

2002年,毕业后的首家公司科达通讯,焦华龙就引领行业,参与视频会议的早期开发,基于视频压缩H.263标准,自行研发的码率控制算法解决了视频会议系统中致命的丢帧问题,使视频画面更加流畅;在霍尼韦尔中国研发中心,基于视频压缩H.264标准,焦华龙创新去交织,去噪声等视频处理算法并优化,帮助公司制造了世界尖端的安防监控设备,推广应用于世界两百多个国家;2010年,优酷土豆曾经是中国最大的视频网站,焦华龙担任编解码开发负责人,面对上亿人同时上传、下载视频,为了使网络运行更加通畅快捷,焦华龙带领团队自主研发了业内首个智能区分不同视频场景内容的转码系统并实际应用,该项目使得网站的视频上传转码成功率从不到95%提升到99.9%,同时大幅减少了用户视频的卡顿率,卡顿率从大约2%提升到低于0.1%;与此同时利用内容自适应编码和采用新的压缩标准,使得相同画面清晰度的视频消耗网络带宽下降超过30%;在当时每天数亿视频播放量和数百万视频上传量的情况下,为公司节约了大量成本的同时,大幅改善了用户体验,助力公司成为网络视频行业的领军品牌,并引领行业发展,焦华龙个人因此获得6项相关技术发明专利。该系列专利涉及视频固定码率的自适应分辨率转码方法、视频抖动检测方法、自适应视频反交错算法等技术。

在国家全民创业的政策鼓励与支持下,焦华龙是小企业腾飞的重要赋能者,也是最早一批中国研发视频实时通话与美化的技术专家,焦华龙带领团队通过创新多人视频通话实时编解码技术,实现了多人实时通话功能,同时搭载视频实时降噪,自动美颜衡等功能,并使计算机视觉相关算法(比如面部跟踪)得以优化,最终大大提高了视频实时通话的用户体验,以上功能涉及长期参考帧技术、视频通话场景的自适应分辨率技术,焦华龙因此共获得了9项发明专利,并成功应用于APP露脸(ChatGame),该软件曾在美国广受好评,并成功获得1400万美元融资,通过ChatGame,视频聊天时,能提供最流畅的视频效果,并展现聊天者最美的状态。焦华龙以上努力,都为后期“Tencent VooV Meeting”技术创新做好了准备。

除此之外,焦华龙还带领团队成功打造了云视频工厂,服务器端自动生成视频,并可添加特效,赋能中小企业运营,焦华龙也因此再次获得短视频技术领域的4项发明专利,众多APP品牌,如“趣头条”、“萌推”、“秀物”、“全民表情”都运用到了该项技术。其中“趣头条”已在美国纳斯达克上市,拥有上亿用户量。

焦华龙在视频技术深耕20年里,他一次次走在时代的前列,成为技术创新的推手,引领行业的发展,同时彰显了科技向善的主旨,让科技为人类带来更多的福祉。

2.焦华龙凝聚团队的力量,一路披荆斩棘,引领世界视频技术水

2019年焦华龙正式加入Tencent media lab,多媒体实验室是Tencent旗下顶尖的音视频通信和处理研发团队,焦华龙的此次加入,重点将完成新一代H.266标准下编解码器的实现和推动实时视频会议的技术创新。

(1)首创新一代H.266标准视频编解码器Tencent266,助推新标准落地推广,惠及各行业。

2020年7月新一代视频编解码标准H.266颁布,相较于上一代标准H.265/HEVC,在同样的主观质量下,可以减少50%左右的数据大小,既能满足人们对视频质量的追求,又能降低存储与流量消耗。如何将新标准落地,惠及各个行业,焦华龙和团队加紧研发,其中自适应环路滤波器(Adaptive Loop Filter,ALF)作为H.266/VVC解码器中复杂度最大,优化难度最高的模块,是Tencent在多上优化的重点,为了攻克难关,焦华龙一次次带领团队,大胆创新,小心求证,从一点一滴的优化中,积累质的改变,焦华龙为提升移动端ALF解码速度,带领团队对整个ALF流程进行整理与分类,并充分结合移动端SIMD对ALF滤波模块进行优化,使得解码器速度得到大幅提升, 解码速度是原始代码的2倍以上。最终,焦华龙带领团队通过全面的模块性能优化和出色的并行结构设计,实现H.266标准在移动端的单核1080p或多核4K码流的实时解码,Tencent266项目完全从零开始,不基于任何标准参考软件或开源代码,从根源上避免了部分开源软件的版权问题。该技术广泛应用于面向移动端的视频点播、视频直播、音视频通信、视频智能生产、短视频、VR/AR等各个领域。

2022年4月20日,世界编码器权威赛事(MSU)公布成绩,焦华龙团队自研的Tencent266编码器,在超高清离线赛道中夺得Y-VMAF、YUV-SSIM等10项比赛指标中的8项第一,相对于作为基准的×265编码器,Tencent266可以节省50%的码率,大幅降低视频传输的带宽和存储成本。焦华龙个人也取得相关专利。

(2)打造高品质的云视频会议系统“Tencent VooV Meeting”,造福世界数亿用户。

作为一款实时视频会议系统,在公司研发中,遇到的最大阻碍是:在实时通讯网络条件较差的环境下,以及人员设备差异较大情况下,用户体视频如何保持流畅性。而焦华龙恰恰是该领域的顶级专家,自从加入Tencent以来,焦华龙就带领团队,负责整个方案在编码器端的实现,在收发应用端的处理,以及模拟客户真实场景的实测优化。他始终在与时间赛跑,把所有的精力都投入到技术的研发中,经过数个月的努力,焦华龙带领团队创新采用SVC灵活分层编码技术,创新“帧”结构,解决视频卡顿、卡死的历史难题;技术的突破给团队带来巨大的鼓舞,在此基础上,团队针对视频会议对脸部识别的特殊需要,创新人脸测算方法,引入ROI(Region of Interest)编码技术,实现对感兴趣区域的实时编码,提升视频会议品质;同时还首创屏幕内容编码器TSE (Tencent Screen Encoder),构筑屏幕内容编码技术,实现会议实时屏幕共享其中,屏幕内容编码技术,于2021年获得中国国际大数据产业博览会颁发的领先科技成果奖---黑科技大奖。

2020年疫情爆发,焦华龙带领团队按时集成“Tencent VooV Meeting”第一个正式版本,疫情期间为2亿用户提供视频会议支持。焦华龙也因此获得公司卓越研发与技术突破奖,并再一次获得伸缩性视频编码技术专利。同年,“Tencent VooV Meeting”凭借完美的音视频体验,成为第75界联合国会议的首选产品。如今,“Tencent VooV Meeting”已经累积千万月活,对照ZOOM,投资界给出了“Tencent VooV Meeting”$1.2B的估值,当之无愧的成为了视频会议行业的独角兽。

在视频技术高速发展的20年里,编解码技术不断地创新突破,焦华龙实现了从一个追随者到引领者的重生,在他默默耕耘的世界里,一次次体验着孤独者的坚持,挫败后的崛起、以及成功后的喜悦,他和他的同事们以极大的专注度,始终不放弃的坚忍度,创造了视频技术的巅峰时刻,成为中国人的骄傲。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

关键词:

责任编辑:kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com
商业快讯

问鼎视频技术之巅,人物专访焦华龙

2022-08-02 16:42:12   榕城网

 

文:如畅

当今世界是眼球经济的世界,直播、短视频、VR、视频会议等视频服务领域快速兴起,人们对4K、8K等超高清画质的需求也不断提高,然而这却给宽带带来了超强负荷。想要解决既能降低带宽消耗,又能最大化还原视频画质的这一难题,背后的关键则是“视频编解码”技术,从CD到VR,从720p到8k,视频背后的“视频编解码”标准,推动整个视频产业的进化。有一位和视频编解码技术死磕到底的人,他就是Tencent media lab的资深研究员--焦华龙。焦华龙经历了视频编解码标准的一次次突围,用自己深厚的数学功底,不断尝试创新算法,他和的同事们向不可能的技术极致一次次发起挑战,于2020年10月自研全球首个面向PC和移动端等多H.266/VVC标准视频解码器O266dec,实现了在PC端和移动端等多4K的 H.266/VVC视频的30fps到60fps实时解码,从此手机可看4KH.266/VVC超高清视频;并携Tencent266编码器,参加国际顶级MSU(Moscow State University)编码器大赛,在4K/1fps赛道获得10项比赛指标中的8项第一名的成绩。Tencent266可以节省50%的码率,大幅降低带宽和存储成本,超过了美国google和intel公司的libaom和svtav1等,成为世界上运行速度最快、最节省码率的视频编解码器,也成为全球第一个商用化的VVC/H.266编解码器。与此同时,焦华龙深耕实时视频会议技术20年,他和同事们以强大的专注力,高效的的协作力,创新实时通讯时域伸缩性编码(SVC)技术,克服实时视频会议的一个个技术难点,在新冠疫情全球大爆发的关键时刻,一举推出“Tencent VooV Meeting”,实现了中国上亿人线上会议的最佳体验,并凭借其高质量的音视频效果,走进联合国,成为唯一的联合国75周年视频会议服务提供商。

焦华龙硕士毕业于浙江大学数学系,他自幼酷爱数学,他认为数学是思维的载体,数学它不是一窜枯燥的数字,更是一门美学,它的思想,它的表现形式都透着美感,而正是这份对数学的热爱与着迷,为焦华龙在视频编解码领域的开拓创新奠定了坚实的基础。焦华龙自硕士毕业后,就直接进入视频编解码领域工作,主要负责视频编解码器的算法创新与性能优化。焦华龙长期专注在一个自己热爱的领域工作并不断深入,他认为是其能取得杰出贡献的关键所在。在他的人生履历里处处闪耀着奋斗者的足迹。

1.焦华龙向视频技术高峰一路进发,所及之处步步生花。

2002年,毕业后的首家公司科达通讯,焦华龙就引领行业,参与视频会议的早期开发,基于视频压缩H.263标准,自行研发的码率控制算法解决了视频会议系统中致命的丢帧问题,使视频画面更加流畅;在霍尼韦尔中国研发中心,基于视频压缩H.264标准,焦华龙创新去交织,去噪声等视频处理算法并优化,帮助公司制造了世界尖端的安防监控设备,推广应用于世界两百多个国家;2010年,优酷土豆曾经是中国最大的视频网站,焦华龙担任编解码开发负责人,面对上亿人同时上传、下载视频,为了使网络运行更加通畅快捷,焦华龙带领团队自主研发了业内首个智能区分不同视频场景内容的转码系统并实际应用,该项目使得网站的视频上传转码成功率从不到95%提升到99.9%,同时大幅减少了用户视频的卡顿率,卡顿率从大约2%提升到低于0.1%;与此同时利用内容自适应编码和采用新的压缩标准,使得相同画面清晰度的视频消耗网络带宽下降超过30%;在当时每天数亿视频播放量和数百万视频上传量的情况下,为公司节约了大量成本的同时,大幅改善了用户体验,助力公司成为网络视频行业的领军品牌,并引领行业发展,焦华龙个人因此获得6项相关技术发明专利。该系列专利涉及视频固定码率的自适应分辨率转码方法、视频抖动检测方法、自适应视频反交错算法等技术。

在国家全民创业的政策鼓励与支持下,焦华龙是小企业腾飞的重要赋能者,也是最早一批中国研发视频实时通话与美化的技术专家,焦华龙带领团队通过创新多人视频通话实时编解码技术,实现了多人实时通话功能,同时搭载视频实时降噪,自动美颜衡等功能,并使计算机视觉相关算法(比如面部跟踪)得以优化,最终大大提高了视频实时通话的用户体验,以上功能涉及长期参考帧技术、视频通话场景的自适应分辨率技术,焦华龙因此共获得了9项发明专利,并成功应用于APP露脸(ChatGame),该软件曾在美国广受好评,并成功获得1400万美元融资,通过ChatGame,视频聊天时,能提供最流畅的视频效果,并展现聊天者最美的状态。焦华龙以上努力,都为后期“Tencent VooV Meeting”技术创新做好了准备。

除此之外,焦华龙还带领团队成功打造了云视频工厂,服务器端自动生成视频,并可添加特效,赋能中小企业运营,焦华龙也因此再次获得短视频技术领域的4项发明专利,众多APP品牌,如“趣头条”、“萌推”、“秀物”、“全民表情”都运用到了该项技术。其中“趣头条”已在美国纳斯达克上市,拥有上亿用户量。

焦华龙在视频技术深耕20年里,他一次次走在时代的前列,成为技术创新的推手,引领行业的发展,同时彰显了科技向善的主旨,让科技为人类带来更多的福祉。

2.焦华龙凝聚团队的力量,一路披荆斩棘,引领世界视频技术水

2019年焦华龙正式加入Tencent media lab,多媒体实验室是Tencent旗下顶尖的音视频通信和处理研发团队,焦华龙的此次加入,重点将完成新一代H.266标准下编解码器的实现和推动实时视频会议的技术创新。

(1)首创新一代H.266标准视频编解码器Tencent266,助推新标准落地推广,惠及各行业。

2020年7月新一代视频编解码标准H.266颁布,相较于上一代标准H.265/HEVC,在同样的主观质量下,可以减少50%左右的数据大小,既能满足人们对视频质量的追求,又能降低存储与流量消耗。如何将新标准落地,惠及各个行业,焦华龙和团队加紧研发,其中自适应环路滤波器(Adaptive Loop Filter,ALF)作为H.266/VVC解码器中复杂度最大,优化难度最高的模块,是Tencent在多上优化的重点,为了攻克难关,焦华龙一次次带领团队,大胆创新,小心求证,从一点一滴的优化中,积累质的改变,焦华龙为提升移动端ALF解码速度,带领团队对整个ALF流程进行整理与分类,并充分结合移动端SIMD对ALF滤波模块进行优化,使得解码器速度得到大幅提升, 解码速度是原始代码的2倍以上。最终,焦华龙带领团队通过全面的模块性能优化和出色的并行结构设计,实现H.266标准在移动端的单核1080p或多核4K码流的实时解码,Tencent266项目完全从零开始,不基于任何标准参考软件或开源代码,从根源上避免了部分开源软件的版权问题。该技术广泛应用于面向移动端的视频点播、视频直播、音视频通信、视频智能生产、短视频、VR/AR等各个领域。

2022年4月20日,世界编码器权威赛事(MSU)公布成绩,焦华龙团队自研的Tencent266编码器,在超高清离线赛道中夺得Y-VMAF、YUV-SSIM等10项比赛指标中的8项第一,相对于作为基准的×265编码器,Tencent266可以节省50%的码率,大幅降低视频传输的带宽和存储成本。焦华龙个人也取得相关专利。

(2)打造高品质的云视频会议系统“Tencent VooV Meeting”,造福世界数亿用户。

作为一款实时视频会议系统,在公司研发中,遇到的最大阻碍是:在实时通讯网络条件较差的环境下,以及人员设备差异较大情况下,用户体视频如何保持流畅性。而焦华龙恰恰是该领域的顶级专家,自从加入Tencent以来,焦华龙就带领团队,负责整个方案在编码器端的实现,在收发应用端的处理,以及模拟客户真实场景的实测优化。他始终在与时间赛跑,把所有的精力都投入到技术的研发中,经过数个月的努力,焦华龙带领团队创新采用SVC灵活分层编码技术,创新“帧”结构,解决视频卡顿、卡死的历史难题;技术的突破给团队带来巨大的鼓舞,在此基础上,团队针对视频会议对脸部识别的特殊需要,创新人脸测算方法,引入ROI(Region of Interest)编码技术,实现对感兴趣区域的实时编码,提升视频会议品质;同时还首创屏幕内容编码器TSE (Tencent Screen Encoder),构筑屏幕内容编码技术,实现会议实时屏幕共享其中,屏幕内容编码技术,于2021年获得中国国际大数据产业博览会颁发的领先科技成果奖---黑科技大奖。

2020年疫情爆发,焦华龙带领团队按时集成“Tencent VooV Meeting”第一个正式版本,疫情期间为2亿用户提供视频会议支持。焦华龙也因此获得公司卓越研发与技术突破奖,并再一次获得伸缩性视频编码技术专利。同年,“Tencent VooV Meeting”凭借完美的音视频体验,成为第75界联合国会议的首选产品。如今,“Tencent VooV Meeting”已经累积千万月活,对照ZOOM,投资界给出了“Tencent VooV Meeting”$1.2B的估值,当之无愧的成为了视频会议行业的独角兽。

在视频技术高速发展的20年里,编解码技术不断地创新突破,焦华龙实现了从一个追随者到引领者的重生,在他默默耕耘的世界里,一次次体验着孤独者的坚持,挫败后的崛起、以及成功后的喜悦,他和他的同事们以极大的专注度,始终不放弃的坚忍度,创造了视频技术的巅峰时刻,成为中国人的骄傲。

免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。

责任编辑:kj005

相关阅读

美图推荐

金融科技下,金融企业如何保障信息安全
主播雨化田们再接新活,这次让网友们下载的是交管12123APP
深圳看到科技发布Kandao Meeting S 180°超广角智能视频会议机
QQ音乐做了“一件有意义的小事”,让这些孩子听见“听不见”的音乐

精彩推荐