◎智谷趋势(ID:zgtrend) | 王延鹤
今年一季度,AI无疑是最大的热潮。
从去年11月30日,ChatGPT正式上线开始,不论国内国外的公司,都像找到了奔向“新世界”的船票,要么在研发AI,要么在业务+AI结合的路上。
彭博做了个图,展示标普500上市公司的财报里,提到AI的次数上升了77%。
微软的AI云一路大胜,英伟达的芯片供不应求,谷歌、亚马逊、Meta都将投资AI当成第一大事。
别问,问就是这次一定,这把all in。
中国A股市场更夸张,ChatGPT概念、AI板块,上百家公司变身大牛股。
AI成了最确定的确定性。
企业是否坚定拥抱AI,也成为市场一个重要参考指标。
过去50天,中国的科技公司、高校、研究机构已发布了30多款AI大模型产品。
谋局落子,各有千秋,平均每天至少有一个AI大新闻。不管是骡子是马,都先出来遛遛,把融资和市值都拉一把。
超60家厂商宣布研发大模型,像字节跳动、小米的大模型就还在路上。
5月6日,“AI国家队”科大讯飞,发布了 讯飞星火认知大模型 。
和30多个同行比起来,讯飞算是姗姗来迟,但搞的事情反而最大。
之前的AI大模型,发布现场都是放PPT,和提前录制好的Demo为主。 大部分人还得乖乖在waitlist排队,等一个内测资格,才能实际上手操作。
讯飞星火胆子很大,现场直接上真机实测,目前全国仅此一例,务实且有建设性。
不仅如此,星火一步到位,直接大规模开放测试。所有人都能上手体验,实际操作加深认知。
虽说发布会现场的演示也出现了一些小瑕疵,但瑕不掩瑜,承认差距,直视不足,一边跑步一边迭代。古书有云: 观敌之变动,后之发,先之至,此用兵之要术。
这样自信又务实的企业,都是有真本事做底气的。否则ChatGPT珠玉在前,一不小心画饼不成,反而不妥。
再者,用少数案例来证实大模型的好坏都是不实事求是的,科大讯飞做语音AI起家, 24年来一直是国内AI行业“学霸”一般的存在,在认知智能上浸润极深。
2011年,首个“语音及语言信息处理国家工程实验室”经国家发改委批复成立,由中国科大与科大讯飞股份有限公司联合共建。2017年,讯飞又获批承建了“认知智能国家重点实验室”,被业内戏称为“AI国家队”。
“1999年,中文语音市场全部被国际巨头控制,中国人被掐住了咽喉;我们创办科大讯飞,提出要让中国语音技术做到全世界最好,要在多语种技术上做到全世界第一。”
如今,24年过去,初心不改,信念终成现实。科大讯飞董事长刘庆峰在发布会上表示, 在10月底的升级后,星火将整体赶超ChatGPT。
实力是拼出来的,不是喊出来的。
大模型能力成色有几分,往往大家上手一试,就有直观体验。
但现在几十个大模型,都号称要和ChatGPT掰手腕。有人说自己只差2个月,有的人说想追上至少等明年。
要知道,OpenAI可不会原地踏步。虽然马斯克搞了万人联名,建议暂停大模型研发6个月,但各大科技公司的投入不减反增。
AI大模型是智能时代最底座的技术。
这不仅是几家巨头争市场,更是争未来的生存权、发展权。中国做大模型务必要以科学的体系来统筹,企业需用正面积极的态度做竞争,市场上部分抹黑、造谣的声音格局太小。拧成一股绳,不愁生产搞不上去。
那么问题来了: 国产大模型和ChatGPT的差距,到底还有多远?如何科学地去评估?
科大讯飞和认知智能全国重点实验室牵头,设计了统一、系统性的评判体系,覆盖7种能力,481个细分指标。
这7个维度的能力,包括:语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。
刘庆峰更是表示, “在文本生成和数学能力(一定程度代表通用认知大模型的智慧水平)上,星火认知大模型已经国内显著领先,且相比ChatGPT也具有一定优势;在语言理解和知识问答方面也达到接近ChatGPT水平,处于国内领先水平。”
智谷之前就注册了讯飞星火,我们也从多个维度,体验了一把星火的能力。
我们首先考验了星火对当下时事的分析能力:
虽然星火没实时接入最新数据,但对淄博烧烤、特斯拉降价的分析角度很全面,可以为大家提供一个研究的大方向。
随后我们尝试用笑话和梗,看能否迷惑星火:
故事创作,我们让它续写《流浪地球3》的大纲。
星火针对不同平台特点加入emoji、话题标签,使文案更加风格化。
一般数学题根本难不住星火,不但给出正确答案,也给了完整的解题步骤。
也可以在几秒钟里,用Python写出计算鸡兔同笼问题的程序。
总体而言,星火在中文文本、数学能力上与ChatGPT 3.5媲美,不过距离GPT-4还有所差距,这个无需否认,出生就对标成熟的ChatGPT也为时过早。就目前国内大模型市场来看,星火实力名列前茅,响应速度也很快,诞生之初即是国内尖子生已经不容易。
并且,科大讯飞公布了时间表,在6月9日、8月15日、10月24日还会进行三次升级。在不断交替迭代中,一步步实现进化,进步空间还有很大。
1024,是2的10次方,也是计算机二进制的基本计量单位,具有特殊的意义。
1024之后赶超ChatGPT,值得我们期待一把。 大家也可以自行体验一下,官网链接:https://xinghuo.xfyun.cn/
现在OpenAI一骑在前,给所有追赶者,留下了大致的追赶路线。
算法、算力、数据,这是AI版三驾马车。
GPT-3规模是1750亿浮点参数,GPT-4规模没公布,但大家估算在5000亿-1万亿参数。
同样是未知数的,是微软到底为OpenAI提供了多少算力,这个数字也会是以 亿美金 为计量单位。
众多追赶者,都在追求“大就是好”,企图用更大参数规模,莽出一个智慧涌现。
而OpenAI的CEO,Sam Altman却站出来说: AI大模型已经发展到头了。
这不是凡尔赛,是OpenAI发现:更大规模,并不等于更强模型能力。
未来的模型发展方向,可能会是参数更小,或者多个子模型协同,从算法上去优化的空间更大。
科大讯飞既致敬OpenAI,又要赶超,走的就是这条更长远的路,也是一条自己的路。
·算法为王
“至少在讯飞,最关键的一定是算法”,科大讯飞研究院院长刘聪表示。
24年的积累,讯飞在Transformer深度神经网络算法拥有丰富经验,在语音识别、图文识别、机器翻译等任务都达到国际领先水平;
针对大模型模糊记忆技术短板,他们提出了知识与大模型融合统一的理解框架X-Reasoner;
截至2022年,讯飞累计斩获了常识阅读理解挑战赛OpenBookQA等13项世界冠军;
目前,讯飞开源了6个大类、超过40个通用领域的系列中文预训练语言模型,相关模型库月均调用量超1000万。
星火虽未公布具体参数规模,但讯飞透露了 模型规模、算力都比GPT小 ,这种情况下,能做到模型能力不比它差,就有赶超的机会。
·数据破壁
国产大模型都遇到的另一个难题是,中文互联网世界的高质量数据,和英文数据有差距。
科大讯飞的解法,一是从全世界抓数据,中文英文都做;
二是通过更快落地AI产品,从行业积累高质量数据;
三是主动推进共建共享,助推政府和各界打通数据流,这也是今年来数字中国规划、组建数据局的核心任务。
科大讯飞的优势,是在教育、医疗等行业垂直领域的数据积累,护城河很深。 在多年认知智能系统研发推广中,积累了超过50TB的行业预料,和每天超10亿人次用户交互的活跃应用,这不可小觑。
·算力自主
更多人的担忧,是在算力和芯片层面。
英伟达的A100/H100两款高性能芯片,是现在研发AI的刚需,但都被美国断供。中国厂商如果不是之前有囤货的,现在很难再摸到了。
即便是特供中国的“阉割版”A800/H800,目前也是供不应求、千金难买。之前流传出一份会议纪要,透露国内几个大型互联网企业,都在上万张地下单。
“只要谁在中国做的最好,代表中国在关键战略领域能提供支持,谁就一定会被美国打压。即便今天不在名单,他只要做好了,明天也会在。”刘庆峰也很感慨。
讯飞很早就上了美国的清单,所以科大讯飞的准备工作做在很前面。
一是自建了业界一流的AI数据中心,在工程技术方面实现了百亿参数大模型推理效率的近千倍加速;
二是与华为、中科曙光、寒武纪这些国产硬件企业深度合作。
1999年,18个中科大的学生挤在出租屋里,创造了语音AI的源头技术。24年过去,信念都在成为现实,好比 星星之火、可以燎原 。
讯飞从源头到整个生态都要自主创新,把AI能力建在自主可控的平台上 ,进一步也推动了中国人工智能产业生态发展。
光有技术还不够,还得有人愿意为你付钱。
很多人可能忘了,大模型已不是第一次AI热潮了。
AlphaGo火到没朋友那几年,正是上一轮人工智能热潮。有统计数据,中国约70%的AI公司都成立于2014-2018年。
但热潮退去,新增公司迅速下降,为什么?
因为大家发现,AI这玩意是真烧钱啊,对资本、人才、技术的门槛都很高,而且这玩意商业落地也是真心困难。
试问,那些公司还活着多少?哪些成功商业化了?哪些赚到钱了?
答案很尴尬。哪怕当初最优秀的四小龙,商业路径也走得不顺遂,亏损年年增加。
一群裸泳者都想上岸,看谁的水分挤完后,干货最足。
OpenAI的成功离不开微软上百亿美金、海量算力的浇灌。
然后,微软的Azure云、新必应这些业务,就靠领先的AI技术抢夺市场,开始挣钱。
而OpenAI还在亏损和烧钱,Sam Altman觉得,未来几年还需筹集1000亿美金。
那是1000亿美金啊,真的是烧出个未来了。
所以,AI大模型最终注定是少数大公司的游戏。
不光因为他们钱、数据多,还因为他们有能直接变现的应用场景、业务、生态。
等这一轮泡沫挤破,还能剩多少玩家,拼的也不仅是技术,还是产品落地、商业模式了。
科大讯飞考虑得很清楚,星火的“1+N架构”就是专门为此设计。
1代表通用认知智能大模型,是技术,是 星星之火 ;
N代表大模型在教育、医疗、办公、汽车、人机交互等领域的落地,是应用生态,也是 星火燎原之势 。
教育是一个很大的市场。 星火的发展离不开生态伙伴的支持,也离不开友商间的良性竞争。 除科大讯飞这个龙头外,网易有道的子曰大模型,学而思的MathGPT,都在争取从教育垂直场景,落地AI产品。
科大讯飞的优势是在智慧教育领域,无人可及的生态构建。
拥有国内最大的智慧硬件业务,比如面向C端消费者的AI学习机、个性化学生手册等产品。未来的学生,可能会与一位无所不知、24小时陪伴、定制化的AI老师共同进步。润物细无声,其对学生的影响和学校老师、父母家庭同样重要。
同时,讯飞又有和高考、学校、 教育 行业合作的B端业务,还牵手 政府 和各地市县,打造G端业务的区域因材施教解决方案,智慧教育平台。
在 医疗 领域,讯飞有国内唯一通过国家执业医师资格考试的AI,已累计为医生提供超5.8亿次AI辅诊,日均诊断70万人次。
在 办公 领域,讯飞办公本、录音笔搭载大模型后,可以将一段录音轻松转化为会议纪要、新闻稿件、宣传文案,这都将是打工人的效率神器。
在 汽车 领域,讯飞打造了“大模型+智能座舱”,实现车内拟人化、跨场景的人车自由交流,其智能语音技术已经进入数千个车型,为4610万车主服务。
未来讯飞也会联合行业伙伴,将大模型能力开放给开发者,一同推动产业变革。
今年是AI大模型元年,也是科技大年。
可以预见,随着人工智能深入各行业,带去爆炸式的效率提升,还会有更多创新涌现。
在医药研发、芯片设计、AIGC等领域,AI已带去数量级的效率提升。
今年也是科技政策频出的大年。
中国在发动新型举国体制,要用一套新的产学研政机制,激发原始创新、攻克“卡脖子”难题、实现科技自立自强。
而几次会议里, AI的站位越来越高 。
4月28日政治局会议,“要重视通用人工智能发展,营造创新生态,重视防范风险”,首次提到通用人工智能。
5月5日中央财经委第一次会议,首次提出了以人口高质量发展支撑中国式现代化,加快建设现代化产业体系。 先进产业体系里,“把握人工智能等新科技革命浪潮”成为关键。
AI在新一轮科技革命中,是起引领作用的战略性技术。
更快普及AI应用,落地商业场景,才会加速这场生产力革命,并为各行业和社会创造正向价值。
企业在这场创新中的主体地位,日益深重。
讯飞星火直接大规模开放,就是在降低AI大模型的应用门槛。目前,讯飞开放平台已经开放了560项AI能力,聚集超过500万生态合作伙伴,首批就有来自36个行业的3000余家企业开发者接入星火大模型。
而随着AI进入千行百业,来自一线场景的宝贵数据和真实反馈,也会帮助讯飞星火更快迭代。
当下的中国,正站在创新大爆发的起始点。
有拿来即用的AI大模型和定制工具,有足够多的技术应用场景和市场需求,有完善的数字新基建,有高校与产业界的人才培养互动……越来越多企业、开发者、学者都参与进科技革命中。
恰如 星火燎原,生生不息 。