王俊博士
——iWudao吾道科技联合创始人
王俊博士多年来从事机器学习及自然语言处理研究工作,并长期与国内外顶尖人工智能研究人员保持密切交流合作。他是一级市场金融大数据公司 iWudao的创始人,从2017年开始致力于金融+AI 的这一前景广阔的赛道。
ChatGPT是在2022年11月30日发布,当时王俊正在参加NeurIPS-2022会议,并准备现场发布研究论文。NeurIPS2022汇聚了世界顶尖的人工智能研究者,他那几天在会上遇到的人都在讨论ChatGPT,AI社区普遍对ChatGPT展现出的出色语言理解和生成能力感到非常意外。完全颠覆了之前大家之前使用各类chatbot的用户体验,这些chatbot常常戏称为“人工智障”。以前如果听到有人高谈阔论实现AGI(通用人工智能),大家基本上都会认为这种想法不可行或者不靠谱。因为那时业内普遍认为,在可见的未来AGI依然是遥不可及的。现在虽然不能完全确定AGI曙光是否就在前方,但是ChatGPT让业内人士突然看到了一线可能。
ChatGPT代表的一系列大型语言模型(LLM)推动了自然语言处理领域新的范式变迁。之前的传统模型,一个特定模型只擅长某一种自然语言处理任务,而现在ChatGPT等LLM则可以更方便地实现用一个通用模型来完成各种不同类型的自然语言处理任务。
“OpenAI的GPT系列和百度的文心一言等大模型将会被迅速应用到包括金融在内的广大领域。”王俊说道。尽管ChatGPT虽然文字理解很生成能力强大。但其核心仍然只是一个自动文字补全的语言模型,对于金融专业领域而言,还无法直接实现即插即用。这是因为它的后台并不存在一个能够覆盖所有真实世界知识的可靠的知识库,即使ChatGPT理解了问题,也无法保证给出的答案是正确的,往往会产生随机生成的虚假答案(幻觉)。换言之,就像与一个语言能力很好但知识储备有限的门外汉交谈,他能理解你提出问题的意思,但头脑中却不具备相关的知识,所以要回答不熟悉的问题就只能随机胡编乱造。斯坦福大学的Christopher Potts教授在最近的一次演讲中提到,使用ChatGPT等LLM来构建实际应用,最重要的是需要在专业领域进行最后一公里的适配。这也是最依赖专业垂直领域AI公司来填补的空缺。我们需要将LLM与金融专业知识库进行对接,包括利用高质量的领域知识对LLM进行微调,以便让LLM充分理解金融专业领域的相关知识。只有通过垂直领域的适配,才能让LLM给用户提供正确可靠的答案。
关于具体LLM的具体应用,王俊认为利用ChatGPT等LLM具有的自然流畅地生成长文本的能力以及强大的归纳总结能力,可以帮助从业者更高效地完成各种金融文档的撰写工作。目前已经市场上已经有一些基于GPT等LLM的辅助撰写系统,但主要还是应用于市场文案、体育新闻和财经新闻的写作。而金融专业领域对文档质量要求更严格,同时涉及到复杂的多数据源信息整合,后续需要将LLM落地到上述专业场景,让其能根据用户的指示并基于专业金融知识库来灵活高效生成各种文字风格的多类型金融报告和文档。
王俊还提到,对于从非结构化文本中提取结构化数据的信息抽取任务,之前业界通常采用的是对BERT等常规预训练模型进行微调的方法,这需要大量标注数据来训练模型。利用ChatGPT等大型语言模型(LLM)的出色小样本学习能力,我们现在可以极大地提高在某些训练数据获取相对困难的应用场景中的效率。同时,我们也需要考虑实际应用场景和模型训练部署整个生命周期的综合成本,以确定如何让LLM落地。例如,可以利用ChatGPT快速高效地产生一批质量良好的金融专业领域的标注数据,然后用它来微调BERT等常规的预训练模型,以帮助提高构建整个系统的效性价比。
除了前面提到的ChatGPT输出内容很容易一本正经的胡说八道外,目前还存在其他问题,例如缺乏数学计算能力和推理能力有限等。因此,尽管ChatGPT有很强的语言理解能力来理解用户的意图,但往往还需要利用外部工具来完成特定的任务。现在有一些最新的研究聚焦于如何使LLM能够自动选择合适的外部工具来完成整个工作任务。因此,在金融RPA领域,ChatGPT等LLM也能发挥重要作用。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com