回顾人类发展的历史长河,自18世纪以来,大约每隔一百年,都会经历一次“革命”。历史上三次工业革命先后把人类带入三个时代——蒸汽时代、电气时代和信息时代。
第三次工业革命的领军人物比尔・盖茨认为,以人工智能为代表的第四次工业革命会给许多领域带来颠覆性变化。5G通信技术和通用人工智能技术是实现万物互联和万物智能的关键,人类也将因此进入智能时代。
数字人的发展沿革
人工智能、虚拟现实、人机交互等技术不断发展,使得元宇宙的愿景越来越清晰,人们不禁畅想在未来存在一个和真实世界平行的虚拟世界,即使足不出户,也可以由“数字分身” 在元宇宙中实现出行、社交、娱乐、购物和学习等体验,因此数字人技术如同不可阻挡的洋流,推动各行业的深刻变革。
数字人(Digital Human / Meta Human),是指运用计算机技术和人工智能技术创建的虚拟人物或数字化人格,旨在复制人类的行为和人格特征。数字人可以理解为将人类的外貌特征和动作表现转换成数字化模型,从而可以在虚拟世界中实现人物模拟。
在平常的观感上,数字人是整合了人物形象模拟、人物声音克隆、自然语言处理、知识图谱解析等众多世界领先的人工智能技术的可视化虚拟数字人。通过对人物形象的复制模拟,人物声音的克隆及语音合成,可随时随地与真人进行准确的交互性对话。
通俗来讲,数字人本质上是AI的一种进化,是通过计算机图形学技术进行虚拟制作的类人形象,没有现实世界中的身体。数字人的本体存在于计算设备中(比如电脑、手机),可通过显示设备呈现出来,让人类用眼睛看见。数字人具备人类的外观和行为模式,也具有人类身体的外观形体结构,表现出的行为模式与人类相仿,数字人的影像也通常呈现出人类的某种活动。数字人技术的发展历史可以追溯到计算机科学和人工智能的早期阶段。
1. 三维建模阶段(1990年代)
在数字人技术的早期阶段,研究人员主要采用三维建模技术来实现数字人的创建。这种方法需要专业的3D建模师手工制作数字人的外貌特征和骨骼结构,然后将其导入到游戏或电影等应用场景中。
图片来源:深度人工智能
2. 动作捕捉阶段(2000年代)
为了让数字人表现出更真实的情感和表情,人们开始研究面部表情捕捉技术。随着动作捕捉技术的发展,数字人的创建开始更加注重动作表现的逼真性。这种方法利用传感器捕捉真实人物的动作数据,然后将其应用到数字人模型上,使其能够以逼真的方式呈现出各种动作和表情。
图片来源:VR大空间
3. 深度学习阶段(2010年代至今)
随着深度学习技术的发展,数字人的创建开始更加注重对细节的还原和真实感的提升。目前,人们正在研究使用深度神经网络生成数字人的技术。这种技术可以生成更加真实的数字人,并且可以根据用户的需求进行自适应和个性化。
这种利用深度学习算法模型训练的方法,能够自动生成逼真的数字人模型。同时,这种方法还可以通过将多个模型结合起来,实现更加复杂的数字人模拟。
我国数字人发展历程
在2001年和2003年两次香山科学会议后,中国启动了数字人领域的研究计划。从2002年构建中国男、女首批数据集开始,现已完成8套能代表中华民族特色的数据集。2023年6月9日,中国科学院古脊椎动物与古人类研究所、周口店遗址博物馆与北京文博远大数字技术有限公司合作,利用AIGC技术设计出中国首个古人类“数字人”。
数字北京人图片来源:BTV新闻频道
2023年7月27日,中国首个国家级数字人专业委员会开始筹备。2023年8月9日,中国国内首个数字人存证备案的完整案例在中国数字人知识产权存证保护平台备案完成。2023年9月,中国信通院发布最新的数字人标准符合性验证结果,蚂蚁集团的灵境数字人平台,成为业界首个通过金融数字人评测的产品。
探索蓝海,谁是实力派?
当前阶段,虚拟数字人无疑是元宇宙概念下最受重视、投入最大、落地最快的领域之一。仅2021年,国内就有20家以上的数字人企业获得新一轮融资,且规模都在数千万元人民币以上。到了2022年,数字人更是几乎成为AI第一热门赛道,在诸多应用场景大放光彩。
目前国内市场涌现的数字人平台中,科大讯飞数字人、小冰数字人、硅基智能、风平智能、智影、闪剪、元分身、奇妙元、配播和花脸数字人等都是备受关注的代表。它们各自具备独特的技术实力和创新特点,在数字人逼真程度、安全性和用户体验等方面有所差异。
在技术实力方面,科大讯飞、小冰、硅基智能、风平智能、腾讯智影等平台具备较强的技术实力,能够实现高度逼真的数字人形象和动作表现;在安全性方面,科大讯飞、小冰、硅基智能和风平智能、智影等平台通过采用加密技术和安全协议等手段来保护用户数据的安全,为用户提供可靠的数字人服务,其他未公布安全性的平台在选择时则需要考虑其安全隐私是否能满足自身需求;在数字人逼真程度方面,这些平台均注重数字人的逼真表现,能够给观众带来沉浸式的体验。
数字人“走进”金融行业
据零壹财经统计数据显示,近年来已有20多家银行、消费金融、投资咨询公司、保险公司等机构的“数字员工”正式上岗。部分机构的数字人还会提供投资顾问、保险代理、经纪等服务,虚拟数字人已从实验室走进现实,逐渐应用于商业化金融场景。
在财富管理转型背景下,投顾业务作为金融机构对接客户的抓手变得愈发重要。最新数据显示,中国目前有7.9万名投资顾问人员服务约2.18亿投资者,每位证券投资顾问服务客户数为2750人。在中国证券市场上,自从投资顾问群体出现,就一直存在投资顾问服务客户数过多的难题。
“肯定服务不过来,抛开资产规模不说,个人觉得一位投资顾问最多服务50位投资者已经是极限了。”华南一家上市券商投顾业务负责人说。投资顾问在超负荷覆盖庞大客户群体下,难以深入了解客户,精细化服务更是无从谈起。
无论从政策端还是业务端考量,“买方投顾”时代已然到来。如何满足投资者千人千面的需求,如何从“产品为王”向“服务为王”、“专业为王”过渡,成为业内机构的新探索与差异化发展方向。居民财富快速增长,投顾转型大势所趋,大模型赋能机构实现降本增效,智能投顾数字人的研发需求应运而生。
顺应趋势,第一个“吃螃蟹”——九方智能投顾数字人
作为中国领先的在线投资决策解决方案提供商,九方财富(09636.HK)旗下核心业务子公司上海九方云智能科技有限公司(以下简称“九方智投”)从2019年便开始围绕“数智化”转型不断发力,凭借其多年证券行业数据积淀与金融科技研发积累,携手华为云和科大讯飞,推出业内首款证券投资数字人产品——九方智能投顾数字人“九哥”。
集百余位科研技术人员之力,耗时两年才研发而成的“九哥”是一款通过智能交互技术,对真人进行虚拟仿真的数字人系统,其内核依托于九方自研的“九章证券领域大模型”,可通过互动对话的形式为用户解答各类证券投资问题。
九方智能投顾数字人搭建了宏观政策、经济数据、行情数据、业务数据、研究报告、资讯新闻、公司公告、法律法规八大特色数据库,如同构建了一个包罗万象的“全能大脑”,可以在不同的指令场景下,从多维度出发,分析用户潜在的投资机会及潜在风险,从而帮助投资者作出更加科学的投资决策。
九方智能投顾数字人“九哥”拥有大盘分析、板块挖掘、热点追踪、策略生成、金融百科、个股诊断、事件推理、情绪陪伴八大核心能力。
图片来源:九方智投
在AIGC的赋能下,“九哥“还有更加智能的交互对话系统,相较于普通的问答机器人,它更像是一位贴心的投资顾问,既能多方位解析用户问题并提供专业的技术支持,又能精准识别用户意图且恰到好处地提供情绪价值,从维度、广度、深度等角度构建与投资者的连接。九方智投还利用知识图谱技术、事件与因果关系抽取技术,构建智能投顾数字人的金融产业链图谱与事理图谱,助力数字人进行产业资讯分析及市场投资逻辑推理。
九方智能投顾数字人也是业内首创金融诊股类数字人产品,可实现1对1互动诊股,专注于投顾服务场景,将先进的AI技术和专业的投资理念相结合,“九哥”已可以在一定程度上扮演专业人类投顾的角色,为投资者提供智能高效的陪伴式服务。
身处人工智能大变局,每一项业务都要以科技的手段再造。智能投顾作为一种创新的金融服务模式,利用人机交互技术为投资者提供更加便捷、高效、低成本的投资服务,让投资理财更加智能化、普惠化。
九方智能投顾数字人的出现,打破了传统真人投资顾问服务的时间和空间限制,通过人机交互技术,投资者可以随时随地通过九方智投APP获得投资建议,不再需要预约和等待,真正意义上实现了全年无休,7天24小时的全方位陪伴。
智能投顾数字人的亮相是投顾行业在金融科技探索路程上的里程碑,有望在未来助力整个金融行业数字化、智能化转型,为各金融细分领域的投资者提供更加智能化和个性化的服务,为中国数字经济高质量发展贡献绵薄之力。
数字人技术的发散思考
当前虚拟数字人理论和技术日益成熟,应用范围不断扩大,产业正在逐步形成、不断丰富,相应的商业模式也在持续演进和多元化。
图片来源:微盟运营中心
关于虚拟数字人的发展层次,华院计算认为有三重境界。第一层,能说会动,指的是数字人具备特定的相貌,可以用语言、动作进行表达;第二层,真情实感,是让数字人成为一个具备性格特征的独特个体,并且具有情感表达的能力;第三层,能思会想,数字人能感知其内部世界,形成主动学习和持续学习的能力。
图片来源:华院计算
但目前,大多数虚拟数字人虽然拥有逼真的外观和肢体动作,但它们对语言理解还是以文本为主,常规反应也主要靠基础设定。
以最近2024年商汤科技年会为例,为了缅怀去年12月逝世的创始人汤晓鸥教授,商汤科技采用先进的技术为大家带来了一场跨越时空的重逢。
其年会视频中我们看到了汤老师这位“数字人“进行喝水、低头以及一些手部动作,甚至连汤老师讲话间隙的咳嗽、停顿也都被还原了出来。此刻,数字人技术似乎不再是冰冷的代码,它想要探索第二重境界,用情感表达它是AI,也是爱。
图片来源:商汤科技年会
但回归现实,虽然大模型、大数据的驱动让人工智能在对话的自然度、趣味性上有了很大突破,但距离情感表达、主动学习、自主意识等还有很远的距离。未来多模态AI技术将成为数字人发展的最大推动力,该技术的引入将帮助数字人从基于文本的交互,转化为基于语义的交互,强化其对情绪的感知和情感表达,使得数字人交互更像人类,并逐步覆盖其全流程。
也许随着技术发展,有一天当你对数字人说你很疲惫,而数字人联想到人类喝咖啡可能会有精神,那下次当它感知到人类疲惫时,说不定能为人类煮一杯咖啡呢?
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:182 3641 3660 投诉邮箱:7983347 16@qq.com