作者:
转发语/摘要:用科技,解决信息孤岛
据美国有线电视新闻网(CNN)报道,今年美国科罗拉多州博览会(Colorado State Fair)艺术比赛中的数字艺术类别,由39岁游戏设计师艾伦(Jason M. Allen)的作品《太空歌剧院》夺下头奖。不过,这幅画作并非由艾伦亲手绘成,而是使用人工智慧(AI)算法绘图工具完成。
这一消息传出后,引发了轩然大波。不少艺术家愤怒地表示反对,理由自然是“我们正目睹艺术在我们眼前死亡”。并且,一个古老的命题被提了出来:“如果创意性质的工作也要受机器影响,那么高技能的工作更将面临被淘汰的危险,届时我们还剩下什么?”
一切似乎都在被技术悄然改变。
王俊也是变革者中的一员,这些年来,他主攻的方向是研究如何将AI技术落地金融领域。技术方面,王俊有着毋庸置疑的实力,他几乎完整经历了这一技术在中国从无到有、从小到大的过程,尽管如今主攻方向是金融,但他的能力其实远远不止此。用金庸小说中的概念来比喻,技术在具体行业内应用的只不过是“招式”,根本的“内功”还是对技术本源的深度理解,以达到千变万化、因地制宜的效果。
技术探索之路
1992年,中国的市场经济改革正进行得如火如荼,许许多多新生事物涌进国门,教人目不暇接,计算机正是其中一项。彼时还未满18岁的王俊被保送到华中科技大学,在专业选择徘徊之际,一位招生老师向他建议了计算机专业,理由是,“随着信息时代的到来,计算机的使用会变得越来越广泛”。
然而那时的王俊根本就没有对计算机的概念,事实上,国内绝大多数人也都没有。按物价来计算,当时一台计算机的价格超过普通人月收入数百倍。出生在湖北省北部一个县级市的王俊,在当地即便算得上家境尚可、父母开明,在当时也的确没有能力负担。“我真正亲手摸到计算机,都是在上大学之后了。”
即便上了大学,王俊的成绩一直名列前茅,每个学年都会收获科系的奖学金,前两年也依然接触不到计算机,都是拿纸和笔在比划。直到大三,他好不容易获得了一次科研锻炼机会,进入了计算机学院院长卢正鼎教授的实验室,才得以穿着鞋套,进入安装有防静电地板的机房,真正意义上把招生老师的话建立起直观的概念来。
那正好是计算机技术发展一日千里的时代,业界言必称微软、IBM,不过相比今天,机器的外观和系统都堪称原始,“没有图形界面,DOS系统,绿色屏幕,只能显示字符,不能显示图像,就像美国老式科幻片里那个样子。内存一共只有640KB。哪像现在,一张照片至少都是几个M。”
但对于一心向学的人来说,这已经足够了。第一次接触计算机集成制造系统的过程中,王俊初步认识到各个系统之间数据集成的重要性:当时尽管武汉邮科院具有国内最先进之一的PCB自动组装生产线,但各个环节上的设备之间依然需要人工输入数据。为此,他开始着手研究PCB自动组装生产线的数据自动集成,消除了设备信息孤岛的状态,学校也为此荣获了1999年度的国际制造工程师协会的“大学领先奖”。
在电子制造领域初尝胜利后,他很快完成了硕士学业。临近千禧年,大批外企纷纷在中国建立研发机构。这波浪潮下,他加入了当时日本最大的的IT解决方案提供商富士通在北京设立的研究机构,主要从事互联网上text mining和social media分析等相关研发工作,在舆情监测和网页自动结构化系统等方面又积累了宝贵经验。
工作的同时,他还参与了和国内多所优秀大学进行的合作研究项目,比如:与复旦大学吴立德和黄萱菁教授合作自然语言处理相关多个合作研究项目、与南京大学武港山教授合作网页信息抽取相关项目,与清华大学陈群秀教授合作舆情监测相关项目,以及与北京大学俞士汶教授合作国内当时最大中文词性标注语料库建设。
一项项来考察,这些经历可谓相当“杂”。但聚合到一起,会发现万变不离其宗:全都是在解决信息孤岛问题。而这些多领域多业态的复合经历,既成了他攻读博士期间的养分,也成了后来创业的基础。
临近博士毕业,王俊去了一趟美国硅谷,沿着硅谷核心地带穿行时,想起了发生在这里一系列 IT工业的传奇故事,深受触动。人的生命是短暂的,与其参与他人建构的既定项目,不如按自己的构想,以自己独特的方式为世界赋能。
因此,虽然后来受到邀请,再次回到了富士通,但创业的种子已经在心中埋下。在职期间,他不仅研发申请了三十多项发明专利,进一步深化了结构化数据的研究工作,他还学会了如何平衡学术研究与技术落地间的关系。技术精进的同时,他的性格也越来越成熟,人格逐渐成为了科学家和企业家的结合。
人生从来没有白走的路。所有的经历,都是为了后来的喷发。
金融行业赋能
融会贯通的“内功”,必须要在某个具体的“招式”上才能体现。王俊选择的“招式”,是金融。
人在海外时,王俊一直关注着国内的发展,为此他每年都会回国,和各行业的朋友们交流一番,以建立自己的认知。一次,和金融界朋友交流时,对方不经意地戏称自己为“金融民工”,还提到前几天还在连续熬夜,准备项目资料。这时,王俊敏锐地意识到,金融业目前的运转效率整体偏低,自己掌握的技术大有可为。
经过一番详细调研后,王俊发现,尽管很多金融机构,如投资银行等员工都招自国内最好的大学,但这些“精英”入行的前几年里,都是在从事一些重复性很强、技术含量较低的资料检索工作,例如人工输入数据,在浩如烟海的文档和网络信息中手动挑拣出所需的资料。
“虽然金融行业听起来是最高大上的行业,但实际上他们整个的工作流程和信息处理方法还是很原始的,都是靠手工,有很多可以提高效率的环节。”王俊认为。
提高效率只是一方面,更关键的意义还在于规避风险。投资人在决定是否对一家公司进行投资之前,对这家公司及其关联方做好尽职调查,梳理清楚所有的财务、法律甚至舆论风险,是必经步骤。但到了信息爆炸的时代,将网络上数以百万计的资料一样样挑出来进行甄别,不光低效,技术上也不可行。如何将这些非结构化信息进行高效地处理和分类,正是行业的重要痛点。王俊发现,自己多年以来掌握的技术正能派上用场,倘若能从海量的各类金融文档中高效抽取出结构化数据,自动构建专业知识图谱,可以极大提高各类决策的效率。
吾道(iWudao)科技便由此诞生,经过多年发展,它已成为了一家金融科技领域领先的大数据产品及服务供应商,基于金融知识图谱和自然语言处理技术,为投资机构、券商、会所、律所等机构提供工作场景产品化、生产方式数字化、业务决策智能化的系统性解决方案。
一直来,iWudao致力于人工智能在资本市场专业领域的深度应用,依靠创新Event-centric金融知识图谱和数据模组,构筑金融数据“最强大脑”,目前公司的人工智能团队已拥有领域内多项海内外专利,集成数百类数据源构建金融专业知识库,并凭借雄厚的大数据积累,积极研发切中行业痛点、提高工作效率的应用工具,现已建立了覆盖股权、债券及投资业务的“资本市场数据分析”、“企业风险预警”、“智能辅助撰写”三大行业标杆性解决方案。
回顾过往,王俊在计算机和人工智能领域上下求索的30年,也恰恰是中国改革开放最为如火如荼的一段时间。这段时间里,计算机和人工智能技术从最初一个模糊不清的概念,逐渐渗透到了军事、科技、工业、金融、艺术等各个领域,重新定义了行业规则甚至人们的生活方式,也成为了中国经济腾飞的一个重要的辅助环节。多年来辗转海内外、一直奋战在业务一线、兼具科学家和企业家特质的王俊在这个过程中积累下了宝贵的思考和经验。
多年之后回头再看,他觉得这一路很多事都是相通的,或许也可以拿“命中注定”来打趣。当年做计算机集成制造系统(CIMS)是为了让信息和数据能在各个制造环节之间自动流动和集成,消除信息孤岛,实现效率更高的智能制造系统。创业后,日常的主要工作也是为了消除金融领域的各个孤岛,将埋藏在各种不同来源中的数据的集成打通连接,以建立更加智能的分析和决策系统。
工作之余,他还拥有一片自己的小世界,或徒步旅行,或野外露营,响应冒险主义的号召,享受每一次和自然的热切相拥。但再怎么奔波,他对工作的热情始终不减。在同事的眼中,他最大的特点就是“随时在线”,即便人在美国,和国内有着十小时以上的时差,“但我们只要有事,几乎在国内任何时间都是可以找得到他。”公司的首席架构师向俊夫感叹道。
从PC时代,到移动互联网,再到人工智能时代,在王俊看来,时代变化尽管很大,但一直是程螺旋上升的。事实上,人工智能技术本身的发展也是如此,最初相关领域科学家试图用程序模拟人脑的思维方式,把世界上所有的知识都归纳成一条条规则,这一端输入数据,另一端就能输出结论。然而世界上知识无穷无尽,尤其在关乎于“人”的领域,变数又实在太多。几十年过去后,这一规则系统至今也没能真正达到可以解决实际问题的地步。
于是后来,科学家们开始转而采用如今流行的大数据深度学习系统。这一系统尽管效率相对前者要高,但推理过程对于人类而言却是一个无法窥探的“黑盒”。如何将两者结合起来,将效率再往前大大提升一步,正是无数顶尖科学家们和王俊一直在思考研究的命题。
而在这场持续的新一代工业革命中,王俊和吾道科技都在不遗余力地前进着。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com