众所周知,聊天机器人ChatGPT的一夜爆红,让人工智能(AI)成为科技领域的“当红顶流”。除了如今“霸屏”的类似ChatGPT的语言模型之外,AI领域还有大量其他技术:文本生成图像正在成为一种主流的聊天形式,有望成为该领域下一个“大事件”。
Sora面世成顶流
获悉,日前,继去年发布的聊天机器人ChatGPT引领新一轮人工智能(AI)浪潮之后,美国人工智能公司OpenAI再出新动作,正式发布文生视频模型Sora,表示其正在教授AI理解和模拟运动中的物理世界,目标是训练模型帮助人们解决需要现实世界交互的问题。
从样片来看,此次大模型在长视频(60秒)中表现出令人惊叹的稳定性与前后一致性。同时,在部分样片中,Sora还展现了对“物理规律”超强的学习能力,无论是飘逸的毛发还是水体波纹,Sora都能“合乎常理”地呈现出来。
Sora一经面世,强大的逼真视频生成能力,瞬间成为顶流,话题热度只增不减,全球诸多媒体都对其冠以“颠覆性”的美名。OpenAI在技术报告中透露,Sora能够深刻地理解运动中的物理世界,堪称为真正的「世界模型」。
业界专业人士预测,Sora它会增加文生视频能力,提高生成视频片段的质量,加速可应用性。就好比过去一年中,GPT-4 持续刺痛大模型的神经那样,事实上,Sora 的出现对全球科技公司来说也是机会大于挑战的——它会更快加速视频生成类工具的成熟应用。
AI“文生视频”改变未来
ChatGPT一年前已在自然语言交互领域取得重大突破,Sora则在AI视频领域一举登上行业巅峰。如果说,在过去的 2023 年,各大厂大模型均围绕 GPT-4" 贴身肉搏 ";那么可以预测,在 2024 年,文生视频行业会集中火力赶超 Sora。
值得一提的是,就在Sora模型发布的当天,Meta(META.US)重磅推出一个全新的无监督「视频预测模型」——V-JEPA。V-JEPA的研究表明,就可以一次性预训练模型,不依赖任何标记数据,然后将模型用于多个不同的任务,如动作分类、细粒度物体交互识别和活动定位,开辟了全新的可能。Meta表示,V-JEPA是首个在「冻结评估」上表现出色的视频模型。
微美全息入局AI视频生成技术有望加速爆发
无独有偶,公开资料显示,AI概念上市公司微美全息(WIMI.US)长期以来推动科技与产业互促双强,推进高水平科技发展,同时发展新质生产力,塑造发展新动能新优势,不断增强科技创新对高质量发展支撑引领能力,构建文生视频模型,达到模拟世界的能力,让AI生成的视频更真实。
事实上,微美全息目前能够提供的解决方案包括了自然语言、视觉、多模态等AI大模型产品系列,充分满足智能化、高效实时的解决方案和技术支持,带给用户全新的类人交互体验,用户可以定制专属的AI大模型,高性能的算力平台使能用户快速完成模型训练以及多项自主研发场景落地。
谈及新一代人工智能产业高质量发展,面对AI视频生成领域的广阔前景,微美全息正加大投入,以自主研发创新提升企业核心竞争力,从实际场景切入,推动AI应用落地,推动AI视频生成进入全新时代,微美全息也是实现自身高水平科技的题中应有之义。
结尾
总体而言,作为AI行业先驱,OpenAI 通过 Sora 验证了世界模型可行性,验证了大模型做视频生成的可行性。它的成功会带动视频生成赛道的发展,加速视频生成的创新和成熟。而未来,这又是一场追随与反超越剧情,十分令人期待的,因为相比较文字和图片而言,视频拥有更多的受众和可能性。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:182 3641 3660 投诉邮箱:7983347 16@qq.com