互联网安全和内容分发服务提供商 Cloudflare 公司于 2025 年 11 月 18 日星期二面临技术不稳定问题。该问题于 UTC 时间 12:00 左右开始,影响了全球范围内的多个客户,报告称网站和应用程序存在 500 个错误。巴西和其他国家/地区的用户报告称,访问依赖该公司网络的平台时遇到困难。
根据停电监测数据,投诉高峰发生在巴西利亚时间中午 12 点至 1 点之间。 X(以前称为 Twitter)、Spotify 和 ChatGPT 等服务在多个地区速度缓慢或完全不可用。 Cloudflare 证实了对这一事件的调查,该事件还损害了公司自己的仪表板和 API。
这些错误是在智利圣地亚哥数据中心的定期维护期间出现的,维护时间为世界标准时间中午 12 点到下午 3 点。尽管该公司没有详细说明最初的原因,但专家指出了例行公事与故障之间可能存在的关系。大约 68% 的与服务器连接相关的投诉受到影响。

用户报告在几个小时内增长
中午过后不久,用户开始注意到故障,并出现有关页面未加载的消息。 DownDetector 等断电跟踪平台记录的峰值高于正常水平情况很糟糕,巴西有超过 2000 条通知。
此次中断不仅影响最终消费者,还影响使用 Cloudflare 反向代理来保护其网站的公司。社交网络和生产力工具是投诉最多的。
受影响的服务详细信息
一些网站和应用程序依赖 Cloudflare 基础设施进行日常运营。广泛的故障损害了访问者和主机之间的数据流量。
- X (Twitter):用户无法在多个区域更新时间线或发布内容。
- Spotify:播放音乐和播客时出现加载错误。
- OpenAI (ChatGPT):访问网络界面无法进行实时查询。
- 英雄联盟:多人游戏服务器记录断开连接。
- Canva:在线设计工具在协作编辑期间崩溃。
这些服务仅占受影响的数千个服务的一小部分,因为 Cloudflare 提供了全球 20% 的网络流量。
技术调查取得进展并更新
Cloudflare 于 UTC 时间 12:03 发布初步声明,表示正在审查问题的全部范围。团队与第三方提供商合作,减少后端故障中常见的 500 个错误。
更新随后的更新(世界标准时间 12:17 左右)强调,对客户查询的响应仍然可以通过实时聊天进行操作。该公司计划为付费计划提供电子邮件通知和网络钩子。
之前的维护(例如 2025 年 6 月的维护)持续了长达 2 小时 28 分钟,影响了 Workers KV 和 WARP 等服务。这次的重点是在不长时间中断的情况下恢复稳定。
事件历史揭示模式
2025 年也发生过类似故障,例如 6 月 12 日发生的故障,导致 API 和仪表板瘫痪近三个小时。在那一集中,问题的根源在于服务拓扑的变化。
8 月份,AWS us-east-1 上的客户流量拥堵导致速度严重下降。这些事件凸显了互联网对少数核心基础设施的依赖。
Cloudflare 的季度报告表明,全球中断占年度正常运行时间的比例不到 1%,但每次中断都会影响数百万次点击。
用户应急措施
受影响的公司启动后备计划以尽量减少损失。个人用户可以通过替代 VPN 或浏览器以隐身模式测试连接。
Cloudflare 建议监控官方状态页面以获取实时更新。 DNS 测试等诊断工具有助于确定问题是本地问题还是全局问题。
部分解决恢复访问开始是
世界标准时间 13:00 左右,报告显示欧洲和亚洲部分地区已恢复。在巴西,X 和 Spotify 的流量逐渐改善,投诉数量减少了 40%。
该公司确认企业帐户的仪表板已恢复正常。调查仍在继续,以防止再次发生,重点关注网络冗余。
工程师调整受影响数据中心的配置,优先考虑关键流量。该事件强化了 CDN 提供商多元化的需求。
该行业的重点是预防
软件更新和负载测试是 Cloudflare 避免故障的例程的一部分。与第三方的合作保证 24 小时事件支持。
企业用户可使用专用紧急线路。沟通的透明度有助于在危机期间管理期望。