3月13日,俄罗斯储蓄银行(Sber)重磅发布GigaChat 2.0全系升级产品。根据俄罗斯MERA基准测试数据,GigaChat 2 MAX模型在人工智能模型中位列榜首,对比国际基准测试,该升级产品线在多项指标上全面超越GPT4o、DeepSeek-V3、LLaMA 70B及Qwen2.5等国际主流模型。Sber介绍,升级产品的发布将极大助力企业客户高效完成现有任务并优质推进大型项目实施。
在系列产品中,GigaChat 2 MAX 性能再获提升,在俄语任务处理方面超越众多海外同类模型;GigaChat 2 Pro 保持上一代MAX版本品质,可胜任需创意发挥与精准执行并重的场景,且模型资源占用更低;GigaChat 2 Lite 作为轻量级基础版,现性能已达上一代Pro水平,能以更快速、更具成本效益的方式处理复杂任务。
Sber高级副总裁、首席技术官兼技术负责人安德烈·别列夫采夫(Andrey Belevtsev)表示:"GigaChat 2.0不仅是技术指标与功能参数的提升,更是俄语大语言模型(LLM)发展的重要里程碑。我们打造出比肩全球顶尖水准的解决方案,其俄语任务处理能力更胜多数国际竞品。对任何在俄运营企业而言,构建强大的本土化神经网络已成为战略要务。目前已有1.5万家外部客户采用GigaChat,此次产品线的全面升级将使更多企业以更高效率应对多元化挑战。借助人工智能优化业务流程,企业将获得保持竞争优势、提升盈利能力、增强客户忠诚度的独特机遇。"
依托GigaChat 2.0的先进架构,企业能够构建起具备认知智能的自主化AI代理系统。此系统借助知识驱动的推理机制、多维度的问题解析能力以及端到端的执行闭环流程,实现商业价值的大幅提升。其得以实现,得益于模型在数学、科学和人文知识储备上的扩充,以及在编程和编写更优质代码方面能力的提升。若要运用Python和JS开发AI代理,可选用广受欢迎的LangChain SDK,GigaChat与之完全兼容。相关兼容性包可在GigaChain存储库中获取 。
新一代模型能够处理四倍以上的文字信息,保留更长时间的对话上下文,回答复杂且冗长的问题,并分析更多文本内容。从之前的单个查询处理约48页的文本内容提升至近200页。这使得借助GigaChat 2.0构建聊天机器人变得更加轻松。此外,在遵循用户指令方面的准确度也提高了一倍,回答问题能力增强25%。
根据俄语独立基准测试MERA的评估结果,GigaChat 2 MAX在人工智能模型中位列前茅。而在俄英双语的MMLU基准测试中,该系列新品与全球顶级模型表现相当甚至更优,其中旗舰型号成绩尤为突出。相较于DeepSeek-V3、Qwen2.5(Qwen-2.5-75b)、GPT4o及LLaMA 70B等模型,GigaChat 2 MAX在俄语事实性问题应答与格式遵循方面表现更佳。同时,在代码生成任务的HumanEval基准测试中,该模型在数理科学领域展现更高专业度。
俄罗斯储蓄银行(PJSC Sberbank)
是俄罗斯最大的银行,也是全球领先的金融机构之一。俄罗斯储蓄银行约占整个俄罗斯银行业资产的三分之一,是俄罗斯的主要贷款机构,同时在存款市场占有最大份额。俄罗斯储蓄银行的最大股东是由财政部代表的俄罗斯政府,拥有该银行50%的法定资本外加一股有表决权的股份,余下的50%减1股表决权份额由俄罗斯和国际投资者持有。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。