高防CDN服务商Yewsafe成为全球边缘推理新标杆，为AI模型部署提供原生加速

小大

2026-06-12 09:31:21 来源：今日热点网

当内容分发网络(CDN)行业还困在“带宽多便宜、节点多少”的陈旧叙事里,Yewsafe 正在把 CDN 改造成全世界分布最广的推理计算机。

这家以高防CDN 起家的基础设施公司,日前正式将自己定位为全球边缘推理即服务(Edge Inference as a Service)的新标杆。这意味着,AI 模型的推理不再必须返回云端数据中心,而是直接在离用户最近的边缘节点上完成，延迟从数百毫秒压缩到 20 毫秒以内。

对于已经使用 Yewsafe 安全加速服务的超过 10万+企业而言,这个变化来得并不突然。过去两年,Yewsafe 一直以“AI 驱动安全”为核心能力:其边缘节点上的 YewGuardian 引擎能实时识别 DDoS 攻击、Bot 流量和 API 滥用,每 50 毫秒更新一次本地流量基线。这套机制本质上就是推理，将安全模型推到节点上,实时判定流量性质。

“我们不过是把做了两年的东西标准化、产品化、对外开放。”Yewsafe 一位不愿具名的核心工程师这样解释。区别在于,过去推理只用来保护客户的安全,现在开发者可以把自己的模型，推荐、识别、风控、生成，跑在同样的边缘计算资源上。

从安全推理到通用推理

边缘推理不是新概念。Akamai 在今年早些时候与英伟达合作推出了 AI 网格,Cloudflare 的 Workers AI 也允许开发者部署开源模型。但行业内公认的痛点是:绝大多数 CDN 的边缘节点在架构上并未为推理准备。

传统 CDN 节点的核心任务是缓存和转发,计算资源有限,且内存、CPU、网络 I/O 的优先级都围绕“快速命中内容”来设计。要跑推理,需要重新分配计算资源、优化数据路径、解决模型加载延迟，这些是 CDN 厂商过去从不需要操心的事。

Yewsafe 的做法不一样。其边缘架构从一开始就为安全检测保留了充足的计算冗余,且安全模型的运行方式与通用推理高度同构，都是将模型权重加载到节点,对实时流入的数据执行判定。Yewsafe 的工程师在此基础上做了两件事:

第一,将推理引擎从安全模块中解耦,形成独立调用接口,支持 TensorFlow、PyTorch、ONNX 等主流模型格式。第二,重构节点上的数据路径,让内容分发、安全检测、模型推理共享同一套 TCP 会话栈,避免多级跳转带来的额外延迟。

结果是:一个图像分类模型在 Yewsafe 边缘节点上的首次推理延迟(冷启动)约为 45 毫秒,后续热推理可稳定在 8-12 毫秒。作为对比,典型的云端推理在理想网络条件下也需要 80-120 毫秒(不含公网传输)。

开发者为什么选它

位于新加坡的电商公司 Shopmatic 是早期试用客户之一。其技术负责人 Lee Kok Weng 在接受采访时表示,他们原本用 AWS SageMaker 做实时推荐,但东南亚地区复杂的网络环境导致高峰期推荐接口平均延迟高达 320 毫秒,“用户翻三屏就流失了”。

迁移到 Yewsafe 边缘推理后,Lee 的团队将协同过滤模型部署到雅加达、曼谷和马尼拉的边缘节点上。“我们没有任何代码改动,就是把模型文件上传,选了几个区域节点。一周后,p99 延迟降到了 47 毫秒。”Lee 说,他们为此支付的费用比 AWS 低了约 35%，因为 Yewsafe 按实际推理调用次数计费,不收取数据传出费。

更让 Lee 意外的是安全能力的附带效应。原本用于推荐的边缘节点,同时默认运行了 Yewsafe 的 WAF 和 Bot 管理。“我们之前每周都会被爬虫抓走商品价格数据,换了之后,爬虫请求在节点上就直接被挡掉了,源站连日志里都看不到。”

这种“推理+安全”的绑定效果,正在成为 Yewsafe 区别于其他边缘推理服务商的核心差异点。金融科技公司 Finzard 的 CTO Mariam Al-Ghamdi 对此感触更深。Finzard 需要在中东地区实时检测信用卡交易欺诈,其模型要求在 50 毫秒内给出评分,否则交易流程会触发降级。

“我们测试过 Cloudflare Workers AI,延迟达标但安全策略需要另外配置,导致整体架构变复杂。也试过直接租用边缘服务器,但运维成本太高。”Mariam 说,“Yewsafe 的方案最干净，同一个边缘节点同时承担推理和安全,我们少维护一套系统。”

数据主权与合规的意外红利

边缘推理的另一个价值正在被企业重新发现:数据合规。

欧盟 GDPR、东南亚各国数据本地化法律、中国的数据出境评估办法，都要求某种类型的用户数据不得离开其所属司法管辖区。在传统云端推理模式下,企业要么在每一地区自建数据中心(昂贵且缓慢),要么冒险将数据跨境传输(风险极高)。

Yewsafe 超过 4000 个节点覆盖全球 90 多个国家和地区,每个节点都可以独立部署模型、处理本地数据、返回结果,全程数据不离开节点所在区域。一位不愿公开身份的欧盟数据保护律师指出,“对于在多个司法管辖区运营的跨国公司来说,这种架构比任何跨境传输协议都更干净。”

Yewsafe 方面透露,已有三家财富 500 强企业开始将客户支持场景的意图识别模型迁移到其边缘推理平台上。其中一家零售巨头的全球隐私官在内部备忘录中写道:“不再需要讨论数据出口问题——因为数据根本就没有出口。”

竞争格局中的微妙位置

边缘推理赛道正在迅速变挤。

Akamai 拥有最庞大的节点网络(约 4400 个)和最长的客户关系,但其边缘计算的开发者体验长期被诟病“像企业软件而非云服务”。Cloudflare 拥有最活跃的开发者社区和最流畅的开发工具链,但其节点计算资源相对受限,运行稍大规模模型时会遇到内存瓶颈。AWS 的 Wavelength 和 Azure 的边缘 Zone 提供强大的计算能力,但覆盖区域有限,且价格不菲。

Yewsafe 的差异化是清晰的:中等规模的节点网络(4000+),足够覆盖主要市场;充裕的计算冗余(源于高防 CDN 业务对性能的要求);以及将推理与安全深度绑定的架构设计。

“这不是一个赢家通吃的市场。”长期关注边缘计算的分析师 James Crawshaw 表示,“企业会根据延迟要求、数据主权需求、现有技术栈以及安全策略来选择供应商。Yewsafe 会在那些同时关注速度和安全的场景中获得优势，游戏、金融、电商,恰好是他们已有的客户群。”

定价模型与生态建设

在商业化层面,Yewsafe 采用了相对激进的策略。其边缘推理按照“每百万次推理调用”计费,起步价为 0.42 美元/百万次(针对小于 1MB 的模型),超出部分阶梯定价。数据传出不收费，这与多数云厂商形成鲜明对比。

Yewsafe 同时推出了模型适配器工具,可以自动将常见的 Hugging Face 模型转化为其边缘节点可执行的格式。截至上周,该工具已支持超过 8000 个开源模型。

对于已经使用 Yewsafe CDN 和安全服务的客户,边缘推理以“一键开启”的方式提供,无需额外部署节点或修改 DNS 配置。一位测试用户形容:“就像打开一个开关,你的 CDN 突然能跑 AI 了。”

下一步:推理与分发的深度融合

行业内正在讨论一个更深层的问题:当 CDN 不仅能分发内容,还能实时处理内容(通过推理),某些应用形态会被重新定义。

例如,视频流服务可以在边缘节点上实时运行超分辨率模型,将 720p 源流提升为 1080p 输出,节省带宽成本的同时提升用户体验。实时翻译可以和解码在同一节点完成,而不是先解码再传回云端翻译再下发。智能监控摄像头可以直接在 CDN 节点上完成人脸检测和目标识别,只将结构化元数据传回中心。

这些场景距离大规模商用还有距离,但技术可行性已被 Yewsafe 的内部原型验证过。该公司负责边缘计算的产品经理表示,他们正在与三家视频平台和两家物联网方案商进行概念验证,“预计第四季度会有具体的垂直行业解决方案推出”。

市场研究机构 Omdia 在最近的一份报告中预测,到 2028 年,超过 60% 的 CDN 节点将具备通用推理能力,边缘推理即服务将成为 CDN 厂商的标准配置而非差异化卖点。对于 Yewsafe 而言,率先将这一能力以产品化、可消费的方式推向市场,是在为自己争取时间窗口。

“AI 推理的分发网络,本质上就是下一代的 CDN。”James Crawshaw 说,“区别在于,上一代 CDN 分发的是过去产生的静态内容,下一代 CDN 分发的是实时生成的动态智能。Yewsafe 想证明它们已经跑在了这条路上。”

关键词：

责任编辑：kj005

文章投诉热线:157 3889 8464 投诉邮箱:7983347 16@qq.com