自从去年大模型热潮兴起之后,国内市场对算力“卡脖子”的担忧就与日俱增。英伟达面向中国市场特供的“阉割版”计算芯片A800价格水涨船高,一芯难求。
10月17日,芯片禁令再度升级。美国商务部工业和安全局(BIS)发布针对芯片的出口禁令新规,对涉华先进计算芯片和半导体行业的出口管制措施进一步升级,要求英伟达在内的美国半导体公司不得再向中国供应A800和H800等先进计算芯片、芯片制造设备和其他产品。
消息一出,国内市场哗然,寻求大模型算力的第二选择至关重要。算力是训练AI大模型的基础,唯有拥有自主可控的算力底座,国产大模型才能够在这场变革未来的AI竞争中取得领先。
国内公司中,科大讯飞最难能可贵的是在美禁令下走出一条自主创新之路。在美芯片禁令升级后不久,科大讯飞在2023全球1024开发者节上发布了讯飞星火认知大模型V3.0,科大讯飞董事长刘庆峰称,讯飞星火V3.0七大能力持续提升,整体超越ChatGPT,医疗领域超越GPT-4。
但这场发布会另一个重要看点,则是科大讯飞与华为联合发布的“飞星一号”大模型算力平台。刘庆峰在接受媒体采访时表示,星火3.0是除了华为内部应用外,第一个真正在国产算力上训练出来的大模型,且能够对标ChatGPT。
今年3季度的财报电话会议上,科大讯飞副总裁江涛也对外明确表态,星火大模型完全架构在自主创新的软硬件基础上。
事实上,早在2019年科大讯飞就被美国列入实体清单。去年10月,美国对包括科大讯飞在内的28家中国人工智能、高性能芯片、超级计算机领域的头部企业和机构再次加码制裁。
刘庆峰在接受媒体采访时对外透露,讯飞的国产化替代从三年前就开始进行,不是因为今天美国出了新政策才开始的,“(新的禁令)更加凸显了我们早做准备的重要性。”
在讯飞星火大模型研发尚未启动前,科大讯飞就与华为确定了合作,5月6日讯飞星火发布之后双方合作进一步深入。刘庆峰说,讯飞和华为组建了“联合特战队”,半年内实现了星火大模型训练和推理效率均翻番。
2023全球1024开发者节上,华为公司副董事长轮值董事长徐直军高度称赞了科大讯飞的技术领先。他透露,华为与科大讯飞的合作不止局限于大模型领域,华为公司在全球所有使用的智能终端的语音技术都是来自于科大讯飞,且不仅仅是中文,而是涉及十几种语言。
在技术迭代以天计算的大模型领域,自主创新并不容易。刘庆峰在接受媒体采访时也坦言,所以假如他们现在不是用国产平台,而是已经成型的英伟达的平台,星火的效果可能会更好,“但这一步你非走不可。”
刘庆峰说,早期任何国产操作系统,都有一个从不好用到好用,最后到整个生态繁荣的过程。但这个过程是值得的,“如果谁都不往前走一步,而且没有能够坚定地提供底座的厂商,这个国家始终是没有办法独立自强。”
科大讯飞选择与华为共同做那个“趟路”的人。刘庆峰觉得,他们在国产算力平台上的探索,将来都能为国内的其他科研单位和企业提供借鉴和参考。也是中国科技企业软硬件一体化联手,强强联合的一个案例。
文渊智库创始人王超在接受媒体采访时认为,“飞星一号”大模型算力平台对于国产AI大模型来说有非常大的意义。如果确实能够在一定程度上达到或接近英伟达的水平,就说明中国的算力平台已经达到一个成熟的地步,所谓芯片制裁和大模型围剿基本上成了马其诺防线,对中国的科技行业来说是一个非常大的利好。
从更广泛的维度来看,“飞星一号”大模型算力平台的推出,也是为全球科技行业提供了第二种选择的可能。刘庆峰在发布会中表示,飞星一号不仅是中国企业相互联合的产物,更是为世界提供了第二种选择。
第二选择的实现尤为不易,它承载着中国企业自主创新的艰辛,更是中国企业面向国际化的抓手。刘庆峰在接受媒体采访时也提到,中国企业要走出去,前提之一就是必须要有实实在在的硬科技。
讯飞星火3.0实现了整体超越ChatGPT之后,刘庆峰宣布,基于“飞星一号”大模型计算平台,将启动对标GPT-4的更大参数规模的星火大模型训练,预计明年上半年将实现对标GPT-4。
他同时强调要正视国产大模型与GPT-4的差距,在他看来,其中的差距主要体现在对复杂知识的推理、对小样本快速在各个领域的学习、对更超常文本的处理以及跨模态的统一理解这4大方向。
OpenAI的先发优势,决定了国产大模型必须要以持之以恒的决心的追赶。就如同刘庆峰所说,大模型赋能千行百业是一场硬仗,绝不是靠吹牛能做成的,只有实事求是的科学精神,才能真正实现超越。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com