探索AI实践最优解，AISummit全球人工智能技术大会完美落幕

来源：财讯网 2022-08-08 11:50:04

北京时间2022年8月7日下午17：30，由51CTO精心策划以“驱动•创新•数智”为主题的AISummit全球人工智能技术大会2022线上直播活动圆满成功！

本次大会由中国最大的IT技术社区之一51CTO精心策划，专题覆盖“搜索推荐、智能语音、算法与模型、MLOps、机器学习、智慧金融、计算机视觉”等众多技术细分领域，聚焦人工智能领域的技术现状、未来趋势、从业者需要关注的研究发现以及前沿技术在业界所产生的影响等内容，以产业实践为基，加之技术创新，期望加速形成技术与产业融合、创新与效能共存的发展前景。

在今天的直播过程中，大会设置了上、下午各三个分会场，分别为“智能语音的应用与探索”专场、“转型中的智慧金融”专场、“元宇宙下的应用与实践”专场、“算法模型的创新之道”专场、“人工智能前沿探索”专场、“AI赋能产业实践”专场。大会今天在AISummit全球人工智能技术大会官网进行了大会全流程的直播活动，同时在51CTO官方媒体、视频号及各大媒体平台进行同步转播。

本次大会的下半场，共计邀请了 26 位来自字节、微软亚洲研究院、快手、蚂蚁集团、阿里达摩院、西山居、科大讯飞、百度等企业的技术大咖，从技术角度深入解析人工智能技术应用与实践案例，以前沿技术、创新应用、产业融合为基础，为与会者带来一场AI技术探索的”饕餮盛宴“。

跟随会议日程，重温会议亮点！一起来看看有哪些精彩内容？

智能语音的应用与探索

如何在语音识别中实现端到端及数据高效利用，如何在高并发场景中实现语音发音纠错，如何提升模型的因素区分及抗干扰能力，如何实现小数据量语音技术框架开发。作业帮语音技术团队负责人王强强从三个方面，即语音识别技术、语音测评技术、语音合成技术进行分析，解读作业帮是如何进行语音技术实践的。

目前，在办公场景中语音识别技术的应用越发普及，从办公邮件到办公语音助手，从即时通讯中的语音输入到实时字幕&会后转写，语音识别技术的普及除了带来方便外，也产生了许多的技术难点。字节跳动 AI Lab语音识别算法研究员张骏从实际场景中发现的问题出发，即会议智能化和提升效率，通过语音识别任务、下游任务及会议等方向的挑战，进行端到端语音识别系统的算法介绍。

微软亚洲研究院主管研究员谭旭，就高水平语音合成系统背景进行介绍并对技术落地中遇到的难点问题做出了分析。以高水平语音合成系统的设计为案例，展示了从设计的思考到实现的全过程。对实验进行了评估同时对未来工作进行了展望。

近年来，随着元宇宙的兴起，社交场景成为其最重要的应用入口之一，那么，语音技术是如何解决社交元宇宙场景下的安全和交互等复杂问题。SOUL语音算法负责人刘忠亮

主要介绍了SOUL社交元宇宙场景下的端到端语音识别和多模态语音合成技术的构建路线以及在语音安全和语音交互等业务场景下的应用。

AI智能语音已经在多个领域达成了落地，语音对话机器人、语音内容分析平台、语音应用等都是基于AI语音识别技术开发的，那么如何实现端到端语音识别技术呢。58同城 AI Lab语音算法部负责人、算法架构师周维介绍了58同城在WeNet端到端语音识别上的实践经验，包括基于半监督训练提升识别效果、流式/非流式语音识别工程部署方案、基于Efficient Conformer和模型量化的推理性能优化方案等。

转型中的智慧金融

传统金融业面临运营低效、风险管控不力、获客成本高等痛点。通过金融与科技的融合破解传统业务痛点和难点是当前金融业创新发展的重要支撑。中关村科金副总裁、金融事业部总经理邓江带来了中关村科金基于AI人工智能、RTC实时音视频技术、RPA流程自动化、多模态生物防伪等前沿科技应用为金融机构打造适用于多种业务场景的数字化、智能化解决方案，方案支持信贷业务首次风评、远程开户、远程尽调、视频面签、视频客服、远程银行等数十个金融场景。通过技术创新、产品创新拓展金融服务边界，在降本增效的同时多维度提升风控能力，为金融业实现高质量数字化转型搭建坚实的基础。

蚂蚁集团知识图谱高级技术专家桂正科带来了知识图谱及其在金融风控场景下的场景应用。内容包含知识图谱的相关介绍，同时还介绍了一种知识图谱处理方法和系统，所使用图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征，以实现目标数据处理任务。

面对传统银行、保险、证券等金融活动中的诸多痛点，人工智能的发展将如何进行精准赋能、降本增效。中国人工智能开源软件发展联盟副理事长王健宗从新一代AI技术的宏观概览出发，围绕AI生态布局和技术创新，分享了未来新的技术的探索，包括元宇宙、NFT、可信AI、大模型和隐私计算等内容，并介绍了如何实现新技术在端到端流程覆盖、输出智能应用解决方案的过程中所做的核心工作。

金融领域由于存在时变规律，存在难以在真实世界中进行交互训练，可用历史数据少，金融市场噪声大、规律随时间变化，不能预测准确等问题。微软亚洲研究院主管研究员刘炜清在分享中解读了金融、分析领域存在的问题，提出了利用历史数据模拟训练、提高训练效率，避免过拟合历史数据，具备泛化能力，及根据市场情况，进行分析并建模应用等应对办法。

元宇宙下的应用与实践

Rokid一直致力于探索数字世界与物理世界的融合使命，用户对两个世界感知的一致性，是AR在B端和C端产生价值的重要前提条件。而针对用户的一个重要的感知方式-听，Rokid自研了6DoF空间声场。Rokid算法负责人王文兵在分享中带来了Rokid“6DoF空间声场”的相关技术，内容包含6DoF空间声场的概念，主要技术模块、技术难点，与AR结合的发展趋势，以及开发技术的初衷。

快手虚拟化平台技术负责人简伟华分享中带来了快手在元宇宙下的直播技术——元宇宙直播间的虚拟演播助手，分析了当下直播新的趋势，即虚拟人直播与虚拟场，就虚拟人与虚拟场的直播趋势，对快手虚拟演播助手的技术进行了介绍，从技术架构及技术拓展等角度，深度解析虚拟化平台与虚拟演播的技术实质。

北京时域科技联合创始人兼CTO赵文骁带来了虚拟人项目与声音合成在产业实践中的技术落地，分析了目前虚拟人项目的现状，讲解时域科技在声音合成技术上的进展，声音合成的发展和挑战及部署实践，同时对声音合成技术的未来进行了展望。

汽车之家WebGL系统架构师李文辉带来了汽车之家在元宇宙下基于WebGL开发3D网上车展技术演进的分享。汽车之家创新运用AR/VR技术，借助5G、人工智能、云计算、3D/AR/VR等核心技术，为用户带来沉浸式创新体验。采用3D虚拟展馆技术赋能，打造聚合式体验、个性化推荐、多视角引导、多场景互动、线上线下联动的智能展厅，推出“3D元宇宙云车展”，让用户可以足不出户看车展。

算法模型的创新之道

如今机器翻译已经能够应用于信息发布、信息交流等多个场景，人工智能技术提高了信息内容的创作，但机器翻译仍然面临着一些挑战，如稀缺资源的翻译、多语言翻译、篇章翻译等。但是提升数据量、建立统一的表示以及创造新的机器翻译范式等方向依旧是未来需要解决的机器翻译方向的问题。字节跳动 AI Lab机器翻译负责人王明轩带来了字节AI机器翻译技术的应用的分享，同时对未来机器翻译所需面对的挑战进行了分析与解读。

主流的部署在云端的推荐系统，可以做到分钟级的近实时；而部署在端上的推荐系统，得益于其链路特点，可以做到秒级反馈的实时，如何实现端上实时重排呢。快手高级算法专家丁炜杰以端上实时重排在快手短视频推荐系统的落地作为案例，分析在极小的算力和带宽限制下，在极小的参数空间限制下，在极小的候选空间限制下，如何进行端上实时重排的技术落地与实践。

如何将人类知识注入预训练模型，让知识和数据有机融合；一个模型只能解决一项任务，通用性差，这些问题的破解之道可能是预训练模型，它能举一反三，解决多种任务。利用半监督学习来对预训练对话模型注入知识，从而实现知识与数据的有机融合。阿里达摩院资深算法专家、对话智能技术负责人李永彬以阿里大规模与训练对话模型的实践为例，带来如何使用半监督学习将标注的人类知识注入预训练对话模型的分享，就探索知识和数据融合的新路径进行了技术解读及展望。

所有在 AI 领域深耕的人都会发现语义的鸿沟是一个非常具有挑战性的问题，需要借助知识图谱等技术，来帮助整个AI认知取得新进展。腾讯在线视频技术专家谢晓辉带来了有关视频内容理解的前沿探索与发展情况分享。内容包含视频内容理解技术的现状与挑战，以及视频内容理解在腾讯业务的最新实践。

人工智能前沿探索

西山居 AI技术专家黄鸿波带来了游戏中强化学习与行为树融合实战的分享，详尽分析了强化学习在游戏领域能够产生的作用，同时通过对西山居强化学习应用技术的分享，完整诠释了强化学习技术的落地并不在于要把算法改得多牛，而是要将强化学习技术与深度学习、游戏策划相结合，形成一套完备的解决方案，并将其实现的技术思路。

在金融科技的浪潮下，金融机构纷纷启动了智能风控体系的建设，但是金融机构的关注点多在于业务规模、科技系统等硬实力的建设，而忽略了算法能力、智能风控文化等软实力的建设。光大信托信息技术部副总经理、数据中心总经理祝世虎将聚焦智能风控的“算法能力”的建设，用通俗的语言“漫话算法”，讲解算法逻辑、算法理解、算法在智能风控领域的应用，以及如何在实战中通过场景因素、数据因素、算力因素来选择合适的算法。

科大讯飞 AI平台架构师李珍松带来了讯飞在AI引擎托管平台技术上的实践案例，解读讯飞实践开发框架AI Serving的关键挑战与实现、收益分析及未来发展方向。

数字时代的研究方式究竟有什么变化？电影研究是否有新范式？电影时代的变迁是否影响了电影的可计算性分析？计算机视觉技术在电影研究中究竟能有怎样的应用？北京电影学院美术学院副教授薄一航带来了从人文计算到计算人文在数字时代研究方式拓展的分享；浅析电影研究的新范式；基于电影的可计算性分析研究，就手工计算到智能计算进行了计算机视觉技术应用的分析。

AI赋能产业实践

云原生大型在线微服务系统中，故障主要来源于变更和容量，故障的发生可能会引起服务中断和生产事故，进而造成巨大的经济损失和集中客诉。如何应用算法模型构建变更风险识别和容量自动评估，提升系统的可靠性，并且保障高可用。蚂蚁集团技术风险部风险智能高可用算法负责人蒋炜带来了蚂蚁集团在绿色智能容量技术部分的实践，其风险识别和容量评估在系统可靠性和保障上达成了显著效果。

近年来，"AI+医疗"迅速发展，凭借其智能化、自动化的特点，主要应用于公共卫生、医学影像、医疗机器人、药物研发等方面。虽然"AI+医疗"仍处于早期阶段，商业化应用程度相对较低，且整体市场渗透率也较低，但是"AI+医疗"拥有非常广阔的发展空间。百度资深研发工程师、AI+药物发现技术负责人方晓敏带来了百度应用生物计算大模型在药物发现、研究上的新成果，该技术能够完成化合物建模及和蛋白质建模及折叠，并取得了显著成果。

泰凡科技副总经理马国宁从知识图谱这一认知智能领域的重要技术谈起，由欧拉提出的著名的柯尼斯堡七桥问题，延申到如何用图论等领域的前沿理论技术，解决知识图谱实际运用中所面临的实体庞杂、检索困难、更新开销过高等问题；介绍如何打造一个有效落地的平台工具，以低成本、高效率的方式，解决不同的行业问题；展示AI与产业赋能所产生的多种可能性和方向，人工智能行业拥有一个百花齐放的未来。

近些年来，AI在各行各业得到广泛应用，推动了各行业的智能化，大幅提升了管理水平和决策水平，其中也包括IT行业自己。而将AI应用于IT运维，也就是AIOps，就是AI在IT行业里面的应用热点。如何高效运维成为IT部门乃至CIO必须面对的问题。云智慧CTO张博带来了AI2B行业智能运维相关分享，就AI算法如何与行业进行适配并落地以及AI工程化如何进行行业适配与落地进行了讲解，同时分享了企业开发技术在行业的实践案例。

福佑卡车技术合伙人陈冠岭带来了AI赋能干线物流即自动驾驶在物流行业的技术应用，公路货运长期存在诸多痛点，自动驾驶在港口如何封闭场景投入运营的实际应用，就L4级自动驾驶卡车技术的挑战与优势进行分析，分享了面向自动驾驶公司开源商业运营场景，从技术、落地、实践三个角度全方位分析AI与物流的融合发展。

结语

促进AI信息的自由流动，推动技术、产业和开发者的融合发展，AISummit全球人工智能技术大会至此画上了圆满的句号。数智化浪潮已然改变了各行各业，正如５１CTO副总裁兼总编崔康所言，AISummit全球人工智能技术大会是一个跨越技术、产业和开发者的融合性大会。51CTO聚焦最前沿的科技，为技术寻求产业的落地，为产业寻求技术的突破，为开发者寻求职业前进的方向。愿与广大技术朋友共勉！

责任编辑：kj005

文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com