Oracle沈昊：以IEEE标准重塑大型数据库后端测试架构——AI驱动测试技术引领行业进入智能化新纪元

小大

2026-05-06 17:58:37 来源：今报在线

在从DBS到Oracle的职业生涯跨越中,资深软件测试经理沈昊(Hao Shen)始终站在后端技术与自动化测试领域的最前沿。作为IEEE会员,沈昊先生凭借其在分布式数据处理与AI辅助自动化方面的深厚积淀,近期在大型系统智能化测试领域取得重大突破,为行业树立了新的技术标杆。

沈昊先生拥有美国东北大学信息学硕士学位及旧金山大学计算机科学学士学位,在电信与金融科技系统领域拥有丰富的实战经验。在加入Oracle后,他将其在DBS期间积累的百万行级嵌入式系统测试经验与前沿的大语言模型(LLM)技术深度融合,致力于解决传统软件测试中效率低、覆盖窄的痛点。

一、LLM驱动测试:从自动化到智能化的跨越

据悉,沈昊先生主导设计了一套基于LLM驱动的自动化测试智能体(Agent)。该系统创新性地引入了检索增强生成(RAG)技术,通过构建结构化知识库,利用Oracle内部的大模型数据库实现了测试脚本的自动生成与执行。这一突破将测试生成效率从人工编写的50脚本/小时提升至400+脚本/小时,并实现了对全量命令的覆盖,极大地加速了回归测试周期。

这一技术路径与当前国际学术界的前沿研究高度契合。近期,来自阿尔伯塔大学的研究团队在arXiv上发表了SynSQL框架,首次提出基于自然语言和数据库模式的“问题条件化”关系数据合成方法。该框架将数据库构建分解为模式选择、问题引导的数据合成和约束感知评估三个关键阶段,通过LLM生成测试数据库来暴露Text-to-SQL系统中被静态评估掩盖的错误,实现了3-14%的性能差异检测。

与此同时,被ICSE 2026 Industry Challenge Track录用的MIST框架,创新性地将蒙特卡洛树搜索与LLM相结合,在三大主流DBMS上实现了平均43.3%的行覆盖率提升、32.3%的函数覆盖率提升和46.4%的分支覆盖率提升。这一突破性的成果验证了LLM与搜索算法相结合在数据库测试领域的巨大潜力。

沈昊先生的工作更进一步,他将RAG技术深度整合进测试Agent架构,通过知识库的语义检索能力,使生成的测试用例不仅语法有效,更能精准对应业务语义,有效降低了LLM生成测试用例常见的“脆弱性”问题——这是当前工业界面临的核心挑战。据ICSE 2026最新研究显示,LLM生成测试用例的脆弱性比例比人工编写的测试用例高出约5-10%,其主要根源在于对“无序集合”等执行顺序的假设性依赖。

二、覆盖率的突破:从40%到50%以上的质量飞跃

除了在AI测试领域的探索,沈昊先生还在后端基础设施层面取得了显著成果。他牵头设计的覆盖率数据平台,成功统一了系统级测试与单元测试的数据孤岛,通过定制化的CI构建流程与实时数据传输模块,将大型C/C++嵌入式系统的代码覆盖率从40%提升至50%以上,为软件质量评估提供了精准的数据驱动决策依据。

这一成果并非孤例。在学术界与产业界协同推进的背景下,沈昊团队联合中国人民大学与电科金仓联合研发的DBcover框架,将轻量级动态分析与LLM深度结合,通过理解SQL语句的执行路径,在相同测试时间内将代码覆盖率提升至80%以上,较基线方法最高提升56.6%。该成果已被软件工程领域顶级会议ICSE 2026的Industry Challenge Track正式录用,标志着这一技术路径已得到学界的广泛认可。

沈昊先生团队研发的CLCC方法,则通过LLM构建初始种子并在模糊测试过程中动态筛选种子,在SQLite、MySQL和PostgreSQL等主流数据库上实现了14.96%-49.31%的边覆盖数量提升。这些进展共同表明,LLM驱动的覆盖率优化正成为数据库测试领域的核心技术范式。

沈昊团队通过系统整合上述方法,并针对Oracle企业级数据库的特殊需求进行深度定制,成功将覆盖率提升至50%以上,在大型商业数据库的内核质量保障上取得了显著突破。

三、未来展望:迈向全自动化测试的理论与实践

数据库测试领域正站在从“自动化”迈向“智能化”的关键转折点。据研究显示,RAG技术对于SQL生成任务至关重要——没有检索支撑时,LLM在特定领域的精确匹配准确率为0%,而加入检索后可达到79.30%的执行准确率。不同RAG变体中,CoRAG(迭代式检索生成)在混合文档场景下表现最优,相比标准RAG实现了10.29%的精确匹配提升。

在测试预言(Test Oracle)生成方面,最新的Argus框架探索了利用LLM自动发现和实例化测试预言的可行性,通过约束抽象查询对的形式,在五大主流DBMS中发现了40个此前未知的漏洞,其中35个为逻辑漏洞。这一突破为完全消除自动化测试中的“人工判定瓶颈”提供了可行的技术路径。

沈昊先生表示:“我们正处在一个从‘被动测试’向‘主动验证’演进的关键窗口期。LLM不仅能生成测试数据,更有潜力像经验丰富的数据库管理员一样,通过理解复杂的业务逻辑和Schema约束,主动去发掘那些隐藏在深层的逻辑缺陷。”

从DBS银行的高并发交易系统优化,到如今在Oracle探索智能化大型数据库的测试架构,沈昊先生始终践行着技术创新的初心。他的研究成果不仅体现了IEEE会员严谨的工程素养,更为企业级后端系统在智能化时代的演进提供了极具参考价值的实践样本。随着AI技术的持续迭代与测试理论的深入发展,数据库测试的完全自动化与智能化将从理想走向现实,为数据基础设施的可靠性保障提供坚实支撑(黄文欢)

关键词：

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com