近年来,开源成为AI技术发展的核心趋势,Soul App坚定践行开源战略,持续向全球开发者开放核心技术成果。近日,Soul AI Lab正式开源实时数字人生成模型SoulXFlashTalk,标志着公司在多模态AI交互领域的布局再进一步,以顶尖技术助力行业生态建设,推动“AI+社交”方向持续创新突破。

SoulXFlashTalk是Soul AI生态的重要组成部分,作为业内首个14B参数量、实现亚秒级延时与32fps高帧率的实时数字人模型,其开源不仅是单一技术的开放,更是为行业提供一套完整的实时交互解决方案。模型配套开放项目页面、技术报告、源代码与HuggingFace模型权重,形成全链路开放体系,方便全球开发者快速接入、使用、二次开发与迭代优化,降低整个行业的技术研发门槛。此次开源延续了Soul的技术开放理念,旨在通过共享顶尖AI能力,推动整个实时数字人与社交交互领域的进步。
在开源布局上,Soul已形成清晰的技术路线。去年10月,Soul开源语音合成模型SoulXPodcast,凭借优异效果快速登顶HuggingFace TTS趋势榜,在GitHub收获超3100星标,成为语音合成领域的热门开源项目。此次开源SoulXFlashTalk视觉数字人模型,与此前的语音模型形成“语音+视觉”双模态开源矩阵,完善Soul多模态AI生态布局,为开发者提供更全面的交互技术支撑。

SoulXFlashTalk的开源,不仅强化自身AI技术壁垒,更为生态伙伴带来巨大价值。开发者可基于该模型快速开发各类实时交互应用,覆盖社交、直播、教育、客服、娱乐等多个领域;企业可直接接入模型降低自研成本,加速产品落地;学术机构可借助模型开展研究,推动技术理论创新。通过多方协同参与,形成技术共享、应用共创、生态共赢的良性循环。
未来,Soul将继续加大AI研发投入,聚焦语音对话合成、实时视觉交互、多模态融合等核心方向,持续推出更高性能、更易用的AI模型,并坚持开源路线,不断向社区开放最新技术成果。Soul将与全球开发者、研究机构、企业伙伴深度合作,共建开放、包容、创新的AI生态,以技术创新驱动社交体验升级,为用户打造更沉浸、更智能、更有温度的AI社交体验,引领AI+社交领域迈向全新发展阶段。
