近期,2023 年全球机器学习技术大会在北京正式闭幕,本次会议以“拥抱 AGI 变革时代”为主题,聚焦【GPT 与大模型技术演进】、【大模型系统工程实践】、【ML/LLM Ops 大模型运维】、【AI Infra 大模型基础架构】、【大模型应用开发实践】、【AIGC 产品创新探索与实践】、【大模型赋能软件开发变革】等 12 大主题。
Zilliz 连同 OpenAI、百川智能、微软、Amazon、Meta、阿里等一线企业受邀参与,在现场分享最新 AI、大模型技术创新和应用实践。
值得关注的是【AI Infra 大模型基础架构】主题,众所周知,大模型技术落地,AI Infra 的支撑作用必不可少。Zilliz 合伙人兼技术总监栾小凡在该主题下分享了《百亿向量数据库架构创新与优化之路》。
栾小凡阐述了 Zilliz 从全球第一款开源向量数据库 Milvus 1.0 向 Cloud Native& AI Native 架构的演进历程。他表示,AI 1.0 时代,向量数据已经被广泛应用于机器学习应用中,包括推荐、搜索、翻译、图搜、风控、安防,随着大模型时代的到来,向量数据涌现出维度更高、体量更大、用途更广泛的特征。在此背景下,Milvus 也由 1.0 架构升级至 2.0 架构,从而实现了存算分离、功能分离。不止如此,Milvus 还新支持了多种数据类型、支持多种向量数据库、支持多种 API、支持多租户等,可以更好地为 AIGC 时代的开发者服务。
对于向量数据库的未来,栾小凡认为,新的应用场景也为向量数据库带来更多的挑战,例如 RAG (Retrieval Augmented Generation) 场景对于数据体量大,召回准确度要求高;Agent 召回的评价标准不止是相关性,也包含重要性、时间等。为此,Zilliz 计划将带来更加灵活的查询能力,例如类SQL支持、支持 Wildcard Match;更多数据类型支持,例如 BF16 Vector、Sparse Vector、Blob、Text、Date;全新的标量引擎、更强大的数据库功能及更加灵活的离线数据处理。
此外,栾小凡亦阐述了 Zilliz VectorDB 即服务的理念。基于开源向量数据库 Milvus 打造的全托管企业级向量检索服务 Zilliz Cloud (目前已经登陆AWS、GCP、Azure和阿里云),不仅满足不同需求和不同部署环境,还可以提供大量企业级功能,助力用户聚焦业务逻辑。
栾小凡强调,如果说 Milvus 2.0 的诞生初心是做全球领先的向量数据库,是Zilliz 借助开源力量对 AI 民主化的一次尝试,那么 Zilliz Cloud 的诞生初心则是做开箱即用的向量检索云服务。Zilliz Cloud 是 Zilliz 自身对于 AI 民主化的再次探索,向量数据库云服务 + 大模型将构建 AI 的成本大幅降低,使得非互联网传统企业和创业公司具备了构建基于 AI 创新的应用成为可能。
免责声明:市场有风险,选择需谨慎!此文仅供参考,不作买卖依据。
文章投诉热线:156 0057 2229 投诉邮箱:29132 36@qq.com