科技
业界 互联网 行业 通信 科学 创业

新壹科技:将视频处理“小时级”工作变成“分钟级”

来源:看点时报 2023-05-10 13:50:31
A+ A-

ChatGPT爆火以来,帮助文本、视频等内容创作者提高工作效率的AI辅助创作工具大量涌现,备受关注。我们访谈了一帧秒创的开发商新壹科技,试图向读者揭示此类应用的发展现状、商业模式和未来走向。

一帧秒创是一款“智能AI内容生成”工具,以”文生视频“为核心功能,把初始的一段话扩展成为视频脚本,再根据脚本的文字内容,在视频素材库中内匹配一些跟文字相对的视频片段,省略了人们手动搜索视频和剪辑的过程。最近,产品升级了文字扩写(文生文)、文生图等AI内容模块的能力。

一帧秒创的开发商新壹科技脱胎于秒创和小咖秀母公司一下科技,也由此拥有大量视频资源来充实素材库。公司CEO雷涛介绍说,视频方面的“小白用户”可以低成本、快速生成视频,剪辑时间可以从小时级别缩短到分钟级别。

对视频素材打标签,意在精准匹配  

娱乐资本论:请介绍一下“一帧秒创”的起源。

雷涛:2021年12月份,我们启动了一帧秒创项目,但当时还不知道这叫“AIGC”。我们最开始的目的,是希望文字类创作者都能低成本的制作视频。当时移动视频行业竞争白热化,很多长相漂亮,擅长聊天的人容易跟上潮流,但很多文字工作者却缺乏捕捉这个浪潮的技能和精力。

产品上,我们的视频界面简单,没有时间轴、对轨这些概念,用户能用填空的方式自助替换素材。在相对可标准化和可量化的视频生成上,比如新闻或科普视频的视频化,可能创作者过去的剪辑工作量是1个小时,现在可以缩短到分钟级别。

一帧秒创的首个版本于2022年6月份发布,前期做了一段时间的研发工作,比如素材结构化。

娱乐资本论:视频素材的来源主要是?

雷涛:以前秒拍、小咖秀的UGC 公版素材,还有一部分是我们合作的专有版权渠道,我们会根据用户实际使用素材的频率与版权方收益共享。

娱乐资本论:你们的技术路线是什么?

雷涛:我们前期做了两套产品系统,一个是大家看到的线上产品,另一个是专门针对场景、流程的视频标注系统。处理视频时,我们先通过算法拆分它的场景、镜头,形成素材,再通过多模态识别素材,把它灌进我们的标注系统里。另一部分对素材打的标签,我们叫客观标签,比如角色名称。这两部分内容占了我们70%左右的时间精力,相当于用了大半年初步建立了垂直行业的视频生成模型。

我们的产品会对用户意图进行分析,判断用户意图是偏向于文本匹配,还是视频生成。内部做了一套引擎用来调度开源模型和自研模型,为了丰富素材,降低用户的使用难度,我们也接入了GPT和其它一些开源的模型。

娱乐资本论:请介绍下你们最近上线的内容辅助生成工具。

雷涛:AI成文产品是我们希望用户只需要写一个标题,内容就能生成出来;文生图是希望用户在缺乏视频素材时也能用图片素材进行替换。声音方面,我们给用户提供了几十种风格的 AI 声音选择,后面也会开放权限让用户通过AI训练自己的声音。而文生视频可以把以上的模块综合调用起来。

为了满足用户出镜的需求,我们也会推出数字人。考虑到成本,目前会偏向于2D数字人来替代用户出镜。诸如一些播报场景,能做一些简单动作。

为垂直行业和企业定制专属视频素材库  

娱乐资本论:请概括你们的用户群体和商业模式。

雷涛:C端用户主要是对剪辑没概念,没用过剪辑工具的“小白”。B端主要是服务营销类行业。比如营销公司需要生成大量不同表述方式的文案,我们可以极大地降低他们的工作量。对于视频质量要求不是特别高的情形基本都能满足,比如医美行业的种草视频生成。

从目前的一些数据看B端付费客户目前主要分布在东南沿海地带。科普、娱乐生活行业的客户反馈比较正向,而家具、中药等细分垂类行业是我们还需要努力的方向。

当然,作为一款通用型产品来讲,我们目前也很难涵盖到所有用户使用的素材量,因为视频广度太大了。解决方案是用户可以自己上传专有素材,我们帮你做结构化处理。我们的产品现在很难做到一键生成后不修改直接过,而是类似“辅助驾驶”,辅助用户创作这样的定位。

此外,我们也给企业提供私人定制化解决方案,能把我们库里的视频移到他们的媒资库,也可以为他们的素材做结构化处理,给他们做视频化长尾词的搜索引擎优化。我们后端是一套视频搜索机制,像搜索引擎一样,他们搜视频标题,我们能搜到画面帧数。

目前来看,一些营销端、自媒体、融媒体机构的需求比较集中,相对聚焦在餐饮、快消、小家电这几个领域。至于具备场景开发能力的客户,我们可以协助他进行自己的视频素材存储和开发。

近期,我们还会发布一个面向政务的垂直模型。

娱乐资本论:ChatGPT出现后,给你们带来什么影响?

雷涛:激发了大家对同类产品的兴趣。我也看到一些人,会误以为AI马上要统治人类了,实际上AIGC目前更多是辅助内容生产。

娱乐资本论:你们主要盈利点在B端还是C端?

雷涛:从商业前景来讲是偏重于B端。我们计划后续开辟专门的板块,帮助KOL接入驻的营销公司比如本地生活,快消、种草的商单,实现商业变现的服务。目前,我们B端需求处于积压状态。至于C端我们也计划开发类似的出海产品。

娱乐资本论:平台为什么会把商单给你们呢?

雷涛:过去是集中于对头部 KOL 的投放,现在验证了在很多场景下,这种策略是无效的,因此投放趋势是往下沉去走,尤其是在流量日趋碎片化的趋势下。

很多KOC的订单单价低,比如200块钱,但是量大,广告主或平台需要对接大量的创作者。我们通过聚集这些零散的创作者,让平台找我们性价比更高,省时省力。

娱乐资本论:如果平台察觉AI生成的内容同质化严重时,会降低创作者的权重,你们有应对方法吗?

雷涛:我们产品的核心不在于跟算法对抗。要让视频效果越来越好,提高它“类人”的程度。AIGC内容就是会冲击原有社区的真人氛围,这种影响难以避免。

平台自身也会积极拥抱AIGC,这对他们有好处。假设技术能力不被别人甩开的情况下,AIGC能让平台更好地控制内容,以满足用户需要。很多用户就不在乎内容是不是真人做。平台能跳过真人,直接对接到用户需求、生产内容,用户粘度会更高。

互联网的“视频化”已经通过人完成了80%,剩下 20% 如果是通过AIGC去完成的,最终互联网的视频化会走向100%。那时它的承载介质不一定是手机,未来如何,值得期待。

发表于“娱乐资本论”

责任编辑:kj005
文章投诉热线:156 0057 2229  投诉邮箱:29132 36@qq.com

相关新闻

精彩推荐