互联网

互联网的“脱水”时刻:Cloudflare 正在重写 AI 时代的协议底层

640


Cloudflare 发布“Markdown for Agents”,正式构建 AI 友好型互联网底层

信息来源:The Cloudflare Blog / The Register / Cloudflare Radar

发布日期: 2026年2月12日(最新进展)

摘要(约 300 字)

Cloudflare 正式推出名为 “Markdown for Agents” 的颠覆性功能,旨在解决 AI 智能体(AI Agents)抓取网页信息时面临的“HTML 冗余”难题。传统 HTML 页面包含大量用于渲染样式的标签和脚本,对 AI 模型而言极度浪费 Token 且干扰理解。

该技术利用 HTTP 内容协商机制,当 AI 爬虫(如 Claude Code、OpenCode)在请求头中发送 Accept: text/markdown 时,Cloudflare 边缘网络会自动拦截请求,实时将原始 HTML 转换为精简、结构化的 Markdown 格式返回。

核心价值与数据:

  1. Token 消耗锐减 80%: 实验显示,一个 16,180 Token 的复杂 HTML 页面经转换后仅需 3,150 Token。对于按 Token 计费的 AI 开发者而言,这直接降低了 80% 的推理与训练成本。
  2. 边缘实时处理: 转换发生在离用户最近的边缘节点,无需修改网站后端代码,且不影响普通用户的 HTML 浏览体验。
  3. 内容信号标记(Content Signals): 随 Markdown 返回的还有 ai-train=yes 等信号,让站长能精细化控制内容是否允许被 AI 训练或搜索。

Cloudflare 此举标志着互联网正从“为人设计的 HTML 时代”向“为 AI 设计的 Markdown 时代”演进。

视角:为什么这事儿很重要?

Cloudflare 这次动作,其实是在做 “给 AI 喂饭的标准化”

  • 从“防”变“疏”: 以前网站都在封杀 AI 爬虫,现在 Cloudflare 告诉站长:与其被乱爬,不如我帮你把数据打包成 AI 最爱吃的“脱水干货”(Markdown),既省带宽又提高 AI 回答的准确率。
  • 商业模式闭环: Cloudflare 正在利用其占全球 20% 流量的霸主地位,制定 AI 访问的标准协议。未来,如果一个网站不支持这种 Markdown 转换,可能在 AI 搜索(如 Perplexity 或 OpenAI Search)中的排名会大幅下降。

互联网的“脱水”时刻:Cloudflare 正在重写 AI 时代的协议底层

从“为人设计”到“为机器设计”

在过去的三十年里,互联网是属于人类视觉的。HTML(超文本标记语言)本质上是一张张花哨的“面皮”,填充了大量的广告脚本、跟踪代码和冗余的 CSS 样式。然而,随着 AI 智能体(AI Agents)取代人类浏览器成为互联网的第一大消耗者,这张“面皮”正在成为阻碍效率的垃圾堆。

近日,全球边缘计算巨头 Cloudflare 正式推出了 “Markdown for Agents” 协议。这看似只是一个格式转换工具,实则拉开了互联网“脱水运动”的序幕——它宣告了 HTML 霸权的终结,以及一个“语义优先”时代的到来。


一、 效率的“血税”:被浪费在标签里的 Token

在大模型时代,Token 是流动的金钱。一个典型的现代新闻网页,其实际正文可能不到 1000 字,但其背后的 HTML 源码往往高达 50KB 甚至 100KB。

当 AI 爬虫(Agent)访问这个网页时,它被迫吞下了大量的 <div><span> 和复杂的 JavaScript 逻辑。这导致了两个致命问题:

  1. 成本高昂: 开发者需要为这些毫无意义的标签支付 5 到 10 倍的 Token 费用。
  2. 幻觉风险: 冗余的侧边栏广告、推荐位信息会混淆 AI 的长文本注意力,导致总结出现偏离。

Cloudflare 的介入极具杀伤力。它在边缘节点(Edge)直接“脱水”,将臃肿的网页实时压缩为骨架分明的 Markdown。这意味着 AI 读到的不再是“被装修过的房子”,而是“房子的蓝图”。

二、 逻辑的重构:HTTP 内容协商的“第二次生命”

Cloudflare 并没有发明新的协议,而是巧妙地复活了 HTTP 协议中尘封已久的 “内容协商(Content Negotiation)” 机制。

通过 Accept: text/markdown 这一行简单的请求头,互联网实现了“一屏两制”:

  • 肉眼端: 依然是精美的排版、流动的视频和交互式按钮。
  • 灵魂端(AI): 只有纯粹的标题、列表、引用和核心段落。

这种非侵入式的改造,让数以亿计的老旧网站无需修改一行后端代码,就能一夜之间变成“AI 友好型”站点。

三、 权力重分配:站长、云巨头与 AI 爬虫的博弈

Cloudflare 此举的深层野心在于定义 AI 时代的准入规则

在过去的一年里,内容创作者与 AI 公司的矛盾几近不可调和,Reddit、纽约时报纷纷封禁爬虫。Cloudflare 提供了一个缓冲带:“我可以给你 Markdown,但你必须遵守我的规则。”

通过集成的 AI-Policy-Engine,站长可以精准控制:

  • 允许 AI 总结全文,但不允许 AI 将其用于模型训练。
  • 允许知名 AI(如 OpenAI、Anthropic)访问,拒绝无名小爬虫。
  • 为 Markdown 内容添加数字水印,追踪数据的流向。

四、 结语:互联网正在变“薄”

今天,我们正在见证 AI 如何通过协议“消化”世界。

Cloudflare 的这次尝试,本质上是在为互联网安装一个“数字滤网”。未来的互联网将变得越来越“薄”——人类在厚重的视觉世界里社交、娱乐,而 AI 在极简的语义世界里计算、决策。

当万物皆可 Markdown,互联网将不再是一个混乱的垃圾场,而是一本有条不紊、实时更新的巨型百科全书。

×
正在为您生成精美海报...
互联网的“脱水”时刻:Cloudflare 正在重写 AI 时代的协议底层
Cloudflare 的这次尝试,本质上是在为互联网安装一个“数字滤网”。未来的互联网将变得越来越“薄”——人类在厚重的视觉世界里社...
希望看到您的想法,请您发表评论x