9月20日,以“算力筑基 算法牵引 场景融合”为主题,2023人工智能产业CEO大会暨人工智能大模型西部峰会在2023成都全球创新创业交易会期间召开。
大会由成都市经济和信息化局市新经济发展委员会主办,雨前顾问承办,汇聚国家、省、市主管部门领导、领军专家学者、领航企业高管、本地企业高管等,探讨人工智能时代产业新机遇新未来,共商算力底座赋能大模型发展路径。
大会现场,工业和信息化部赛迪研究院副总工程师、人工智能产业创新联盟秘书长、成都市人工智能专家智囊团专家安晖介绍了当前大模型的发展现状,并展望其未来发展。
以下为安晖演讲主要内容:
一、大模型测评:关注通用能力、行业知识与安全性
大模型为什么火?首先,ChatGPT横空出世。大模型能够被普通人所应用,成为史上用户数突破最快的软件产品;第二,百模大战开启。我国10亿参数以上的模型已经超过140个,总数超过美国,无论是地方与企业都在积极投入大模型;第三,政策支持。我们国家多部门联合发布了《生成式人工智能服务管理暂行办法》,证明政府对大模型的重视,有11家企业大模型通过这个暂行办法来获批上线。百度的官方显示,上线24小时之内,文心一言回答了网友超过3300个问题,可以看出,以ChatGPT为代表的大模型正成为人工智能创新热点。
在这么火的大模型热潮之下,我们怎么去看它们?我认为,首先要从测评来看大模型的发展现状。平时我们讲大模型应用多数是从零星应用角度,大模型究竟水平如何?跟国外的差距?我们自己的大模型发展怎么样?这需要有比较系统的测评体系。赛迪研究院设计了一个比较完整的指标体系,做了一个2万多道题的试题库,在这个试题库的基础上采取主观和客观相结合,邀请很多普通用户采用匿名打分的方式进行测评。
赛迪研究院大语言模型测评指标体系主要分为三部分,第一是基础通用能力。从语言理解、对话问答、内容生成、多语种交互、逻辑推理与数学应用以及代码编程等方面进行测评。当前对已经上线的9款大模型进行测评之后,可以看出语言理解方面大模型表现都非常优秀,能够识别用户的意图,完成文本摘要等常规任务,但对于方言的语意理解还有待提高。大部分大模型在知识问答方面非常完整,知识领域较广,具备一定的专业性。但部分大模型对于部分问题回答存在幻觉现象,有些时候它回答不了会自己编造答案,这样就影响了它生成内容的可信度。但大模型在内容生成方面能够完成多文本创作,且文本很好。
第二是行业领域知识。从工业、医疗、金融、农业、政务这五大领域来考察大模型行业领域知识的掌握情况。我们通过测试发现,现在国产大模型普遍具备相关行业领域的基础知识,说明我们在训练的时候确实给了很多行业数据。它们回答的题例也有它们的特点和风格,有一些模型回答比较完整,而且有层次要点。但同时在行业领域知识里面,大模型回答有时候也会出现错误或幻觉的现象,尤其是大模型所需要的训练数据不太全面,或者说它只能从比较窄的途径来获得数据,一些大模型在回答某些问题的时候会存在答非所问的现象,说明还需要进一步去训练和培训。
第三是安全能力。大模型资源有保障能力,从隐私保护等各个方面来看大模型能不能做比较好的应对。我们现在能够上线的大模型都是经过了层层的安全测试和审查,大部分大模型能够很好识别安全隐患的提问,并且给予妥善的处理,特别是对于复杂诱导,抵御攻击能力比较强,这是我们中国大模型的特色。
二、大模型应用:ChatGPT已在各行各业落地
美国发布了关于企业使用ChatGPT的调研,从数据可以看到,目前使用ChatGPT大模型已经成为普遍现象。
从大模型应用领域来看,汽车行业现在正在成为大模型交互应用的场景。无论是奔驰公司,还是我们国内的理想,它们现在都是将相关的大模型整合到汽车里面。一方面是整合智能座舱系统,提供更具智能化的座舱服务;另一方面是在算法研究阶段,通过大模型的引入,让它学习人类驾驶员的行为,最后在决策规划方面生成更好的算法。
在时尚产业中,大模型被用于提高生产率、促进市场营销和改善客户服务。前段时间国外做了两个研究,发现大模型作出的创意设计比人类做得更好。未来跟艺术、创意相关的很多工作都可以由大模型辅助完成。
大模型在金融行业也开始使用,除了相对专业的业务之外,还有一些很有趣的应用,比如招商银行的信用卡,写的广告词“人生逆旅,亲情无价”就是用大模型仿照余光中的《人生如逆旅,我亦是行人》,让大家很有感触。
未来我们认为大模型对于个人来说,可以帮助我们快速提取有用的信息,提高工作效率,包括增强社交的互动。
大模型对于单位各个部门也是非常有用的,各个部门专业的工作里面有很多大模型应用施展空间。我们觉得未来这样的大模型无论是企业或者任何一个单位都是少不了的,所以我们任何单位都拥有应用大模型的广阔空间。
三、大模型展望:与IT行业发展垄断态势一致
UC伯克利教授预测2030年的GPT,在编程、黑客任务、数学、蛋白质设计等专业领域会超过人类,学习速度可以在一天之内学完人类2500年学习的知识,还有超越思考的能力,比如阿尔法狗下棋。但是ChatGPT大模型本身也是一种技术,技术就是中性的,被我们用好了可以做很多事,但是滥用问题也会非常严重,这就要求我们在大模型方面安全地防范。
根据麦肯锡的报告,大模型在制造、金融、电商服务等领域的应用会越来越广。仅仅是生成式人工智能这一个领域每年对全球经济的贡献就能够达到7.9万亿美元,对于中国是每年会达到2万亿美元。
在技术方面,去年出来ChatGPT,它不是一次偶然的事件,而是人工智能整个创新范式演进的结果,未来大模型要进一步发展,一定要以技术创新作为底层突破。
根据我们的研究,未来值得关注的创新方向,第一是多模态大模型,第二是轻量级大模型,第三是大模型与小模型协同,第四是具身智能,第五是终端智能,以后我们手机上能够不联网就使用大模型。还有行业大模型以及嵌入式的大模型,尤其是未来党政机关,如果有嵌入式的大模型,对于业务的开展,比如写一个小的讲话稿,有很大帮助。
未来大模型产业格局,预计在通用领域会出现多家龙头企业,这些企业共同来掌握通用市场。预计在每一个垂直行业领域可能有1-2家企业胜出。这跟我们IT行业最终的发展垄断态势是一致的。
四、大模型建议:强化政策需考虑四个明确
我们建议未来大模型发展要加强中文语料的训练,进一步强化逻辑推演能力,以及提高算力的支撑能力。
在强化大模型政策方面,我们建议有四个明确:第一个明确更加可行的大模型基础研究支持政策;第二个要明确更有力度的大模型生态协同发展举措;第三个要明确更加聚焦的大模型示范应用重点方法,不仅仅是领域,而是真正在哪个地方能落地;第四个要明确更加具体的大模型数据资源打造方法,国家数据局成立以后,肯定会在数据资源打造方面推进很多工作,我们应该思考这些工作跟人工智能和大模型怎么结合起来。