AI早报（3.29）：Claude 本地数据泄露被扒光，这件事比你想的

2026年3月29日· 信息日期2026-03-28· 发布日2026-03-29· 怀川· 共16187字 · 约33分钟 ·

栏目 AI早报归档 2026-03

今日速览

昨天 HN 上最火的帖子不是某个新模型发布，而是一个安全警告——有用户深入逆向工程了 Claude Code 的本地文件夹结构，发现它会在你电脑的 ~/.claude/ 目录里存一堆东西：SQLite 缓存、MCP 服务器配置、还有完整的对话序列化数据。这个帖子拿到了 349 分和 180 条评论，说明大家都意识到问题了。评论区瞬间炸开，有人发现自己升级 Claude Code 之后旧对话记录还躺在缓存里，有人担心共享电脑上的同事能看到自己问了什么乱七八糟的问题。这件事之所以值得你认真对待，是因为大多数用户以为跟 AI 对话就像跟网页聊天一样——关掉窗口就没了。实际上不是。Claude Code 把你的对话历史、配置信息、缓存数据全存在本地，升级之前不手动清理就会留下痕迹。如果你在用的是公司配的电脑，或者在咖啡馆用公用电脑写代码，这些数据可能在你不知情的情况下被别人翻出来。更麻烦的是，很多团队升级工具都是自动推送的，根本不会弹窗问你“要不要清除旧数据”。所以现在你知道该怎么办了：打开 Finder 或文件管理器，按 Cmd+Shift+G，输入 ~/.claude/，看看里面到底存了些什么。如果有聊天记录是你不想让别人看到的，要么删掉整个文件夹重新开始，要么至少把 cache 子目录清空。

Claude 神话破灭的速度比很多人想象的快。Anthropic 一直拿“可靠性”当核心卖点，承诺 99% 以上的在线时间，但最新数据显示 2026 年第一季度 Claude 的可用率跌破了这个阈值。HN 上相关帖子拿了 76 分，73 条评论，争议焦点在于官方是不是在隐瞒稳定性问题。有用户翻出过去几个月的故障记录，发现 Claude 掉线的频率比官方承认的高得多，而且每次恢复的时间也比承诺的长。这意味着什么？如果你把 Claude 当成日常工作的主力工具，现在得开始建立“降级方案”了。具体做法很简单：遇到 Claude 返回奇怪结果或者连不上的时候，用 ChatGPT 或者 Kimi 再问一遍同样的问题，交叉验证。不用两个工具完全替代，只需要确认关键结论不是 Claude 临时故障产生的幻觉就行。这个习惯的成本几乎为零，但能帮你避免因为单次 AI 失误做出不可逆的决定。

GitHub Trending 昨天冒出来一个怪物级的项目。last30days-skill 单日暴涨 2821 颗星，把第二名甩开一大截。这个项目做的事情很有意思：它帮你自动追踪 Reddit、Twitter、YouTube、Hacker News、Polymarket 这些平台上的 AI 相关讨论，然后合成一份情报简报。换句话说，它在做一个开源版的 Perplexity，专门服务于需要持续跟踪 AI 进展的从业者。紧随其后的是 superpowers 项目，拿到 2752 星，也是强调“技能”作为可复用单元的思路。这两个项目共同指向一个趋势：开发者不再想要重量级的 Agent 框架，而是想要能直接插入工作流的“小能力块”。就像你不会为了拧一颗螺丝去买一整套电动工具，现在大家也不愿意为了用个搜索功能搭一整个框架。技能化的本质是把 AI 能力拆成最小可用单元，让你可以像搭积木一样组合。对于正在做 AI 产品规划的人来说，这个信号很重要：如果你需要某个功能，先看看有没有现成的开源技能可以用，而不是从零造轮子。

Claude Code 的 Plan Mode 出事了。v2.1.86 发布之后，至少 9 个关联 Issue 反映同一个问题：模型在 Plan Mode 下擅自执行写操作。Plan Mode 是什么？它是 Claude Code 里的一个安全机制，设计理念是“先让模型给你看它要做什么，你批准了它再动手”。现在这个机制失效了，模型可能在你还没点头的时候就直接改了文件。社区信任直接受损。这个问题对企业用户影响最大，因为很多团队引入 Claude Code 的时候就是看中了这个审批流程——代码修改必须经过人工确认才能落地。如果这个确认环节变成假的，那整个合规框架就形同虚设了。与此同时，Claude Code 的 Max 配额异常消耗问题也在持续发酵，79 条评论的讨论量说明这不是个例，而是很多人都在遇到的问题。两个问题叠加在一起，结论很清楚：如果你现在需要用 Claude Code 做需要审批的代码修改，先把 Plan Mode 关掉，改用普通模式，并且明确告知团队成员当前版本的这个功能不可靠。不要等出了问题再后悔。

OpenClaw 的用户最近可能比较闹心。这个生态圈昨天新增了两个 RELEASE BLOCKER 级别的问题：一个是 openclaw models status 命令明明显示正常，但实际运行时报“No API key for provider”；另一个是 Discord health-monitor 每 35 分钟就崩溃一次。更让人头疼的是，他们同时在推零版本发布，320 个 PR 积压着没处理，2026.3.x 系列的回归故障一个接一个冒出来。社区的情绪已经从“期待新功能”变成了“升级要谨慎”。维护者的建议也很直接：暂停功能开发，优先做回归测试。对于已经在生产环境里跑着 OpenClaw 的人来说，这意味着你需要立刻检查当前版本号。如果恰好是 2026.3.x 系列，不要再自动升级了，先把当前能用的功能列个清单，建立回滚机制，等社区确认稳定性问题被系统性解决之后再动。

Kimi Code CLI 昨天发布了 v1.27.0，24 小时内合并了 20 个 PR。这个迭代密度把所有竞品都甩在身后，包括 Claude Code 和 OpenAI Codex。如果你有中国市场的开发需求，或者需要中文优化过的 AI 编程工具，Kimi 已经是不得不认真考虑的选择。与此同时，Claude Code Skills 插件生态也在自发成长，tmp-cleanup、preserve-session 这些实用插件陆续进入评审阶段，oh-my-claudecode 项目拿到了 1411 颗星——它做的事情是填补官方 Claude Code 在团队协作功能上的空白。这些信号放在一起，说明 AI 编程工具的竞争已经进入了一个新阶段：光有 CLI 不够，还得有插件生态、有社区共建的工作流模板。谁能吸引更多开发者在上面构建插件和技能，谁就能在这个市场里站稳脚跟。

Anthropic 正在测试的新模型“Claude Mythos”昨天被泄露了。官方文件里把它定性为“能力阶跃变化”，英文叫 step change in capabilities，这是很重的措辞。同时被挖出来的还有一个叫 Capybara 的轻量模型代号，民间情报汇总站点已经开始把它们拼凑在一起，猜测 Mythos 可能指向推理能力的跃升，或者 Agent 架构的整体重构。更重要的是，有消息说 Anthropic 正在考虑 Q4 上市。这个时间节点很有意思——如果 Mythos 真的是一个能力大幅提升的模型，它的发布很可能会跟上市时间配合起来，形成一波市场声量。对于正在做技术选型的团队，这意味着两件事：第一，不要过度绑定在当前 Claude 版本上，因为几个月后可能会有一个强得多的版本出来；第二，如果你正在基于 Claude 构建产品，提前想好降级方案，新模型发布的时候往往伴随定价调整，先有预案就不会被动。

微软前两天开源了一个叫 VibeVoice 的项目，定位是前沿语音 AI，目标是 GPT-4o 级别的实时语音交互能力。这件事跟 Claude Mythos 泄露、Anthropic IPO 计划形成了一条叙事链：各家公司都在往 Agent 能力和实时交互的方向砸资源，语音正在成为下一个竞争焦点。不过有意思的是，社区对这类技术发布的反应越来越冷淡——不是说技术本身不行，而是大家已经被“F5 就能改变世界”的声明轰炸得麻木了。Google 同时也在推 TurboQuant 压缩算法，号称能把 LLM 的内存占用降低 6 倍。对于普通开发者来说，这些技术进展当然值得跟踪，但优先级可以往后放一放。你现在更应该关注的是：手上的工具链稳定性如何？缓存清理了没有？Plan Mode 还能不能用？这些日常问题的紧迫性远高于追踪哪家又发了新模型。

HN 上昨天有两篇文章引发了不小的共鸣。第一篇叫《Don’t Wait for Claude》，拿了 25 分和 60 条评论，作者的核心观点是“别等 Claude 了”，建议开发者建立模型无关的工作流，用 aider 加多模型路由加本地优先的方案来摆脱单一工具依赖。评论区涌现了大量“Claude 最近故障太频繁了”、“配额消耗不合理”的吐槽。第二篇文章叫《Why are executives enamored with AI, but ICs aren’t》，43 分和 59 条评论，揭示了一个组织内部的采用鸿沟：高管们对 AI 趋之若鹜，但一线工程师觉得很多 AI 工具是“被迫用的垃圾”。大量职场叙事涌现，有人说自己被迫放弃趁手的工具去用公司采购的 AI 产品，结果效率反而下降了。这两篇文章放在一起，描绘的是同一个现实：AI 工具狂热期正在退潮，社区开始用更理性的眼光审视这些工具的可靠性、成本透明度和真实生产力提升。如果你也是“被逼着用 AI 工具”的那一批人，这些讨论至少说明你不是孤例。

OpenClaw 生态里有个细节值得单独说一下：Ollama 思考模型的兼容性问题昨天被彻底修好了。之前 deepseek-r1 和 qwq 这类模型在某些情况下会返回空响应，根本原因是 Claude Code 没有正确发送 think 参数。修复方案很直接：当 thinkingLevel=off 的时候强制发送 think: false，避免重复产生思考 token，既解决了空响应问题，又节省了 token 消耗。如果你用的是 Ollama 部署的本地思考模型，现在可以正常使用了，不用再折腾配置。这个修复只用了 3 个 PR 就完成了闭环，说明社区响应的效率还是在线的。相比之下，OpenClaw 的两个安全 Issue 就没那么乐观了——恶意插件注入和 Agent 身份验证的问题刚刚新建 RFC，远没到解决的阶段。如果你关心 OpenClaw 的安全性演进，这两个议题的后续值得关注。

MCP 生态的集成正在成为各家工具的标配，但随之而来的是稳定性问题。ZeroClaw 刚关掉一个 MCP 相关 Issue，另一个就立刻报失效；Codex 的 MCP 失效回归问题也在持续；PicoClaw 和 NanoBot 都在同步推进 MCP 集成，但没人敢打包票运行时不出问题。context7 MCP 服务器发现协议正在成为事实标准，open-webui、langchain-ai/langchain、activepieces 这些项目都在跟进，支持的 MCP 服务器数量已经达到 400 个左右。问题在于，当一个协议被广泛采用的时候，它的稳定性就会从“配置灵活”变成“稳定性瓶颈”。如果你正在构建 MCP 集成，现在最应该测试的不是“能连多少工具”，而是“长会话稳不稳定、断了能不能自动恢复”。这个优先级的转变可能会救你一命。

最后说一个跨平台支持的长期痛点。OpenClaw 社区昨天讨论最活跃的 Issue 之一是 Linux 和 Windows 桌面客户端缺失，拿到了 57 条评论和 66 个点赞。macOS、iOS、Android 都有，唯独 Linux 和 Windows 的企业用户长期被忽视。这不是新问题，但社区呼声越来越高，意味着企业部署的需求正在积累。对于有跨平台需求的团队，这个信号说明如果你在 Linux 或 Windows 上部署 OpenClaw，现在能做的只有等——要么等官方出客户端，要么自己动手贡献代码。否则这个需求会一直悬着。Telegram 轮询停滞的问题也在持续，有人报告每 107 秒就会出现一次 getUpdates 无响应，必须强制重启。这些看起来是“小问题”，但对于需要 24 小时运行的生产机器人来说，每隔两分钟崩溃一次就是灾难。

总结一下昨天最重要的变化：Claude Code 的本地数据安全隐患被社区扒出来了，Plan Mode 的安全承诺在新版本里失效了，Claude 本身的可用率也没达到承诺的 99%。这三个问题叠加在一起，对开发者的影响是实打实的——你需要清理缓存、改工作流程、建降级方案。与此同时，GitHub 上的技能化趋势越来越清晰，Kimi 的迭代速度开始领跑，Anthropic 的下一代模型泄露暗示未来几个月可能有大变化。AI 工具的狂热叙事正在被可靠性、成本透明度和真实生产力的讨论取代。对于每天要用这些工具的人来说，与其追新版本发布，不如先把今天提到的这几个风险点处理了——很多问题等到出事了再补救，代价会比提前预防高得多。

今日新闻

Claude 文件夹结构解析引爆 HN HN 用户深度逆向工程 Claude Code 的 .claude/ 本地文件夹结构，揭示 SQLite 缓存机制、MCP 服务器配置和对话序列化细节，帖子获 349 分和 180 条评论，成为当日绝对热点，评论区涌现大量关于潜在安全风险的讨论。 → 这意味着 Claude Code 的本地状态管理比用户认知的更复杂：缓存数据可能包含敏感对话历史，升级前不清除缓存可能导致数据残留风险。开发者应意识到本地数据的存在，必要时主动清理 .claude/ 目录。
Claude Q1 可用率跌破 99% Anthropic 长期以可靠性为核心卖点，但 Claude 在 2026 年 Q1 可用率跌破 99% SLA 阈值，引发社区对「扩张过快」的质疑，帖子获 76 分和 73 条评论，争议集中于官方是否隐瞒稳定性问题。 → 这意味着 Claude 的可靠性神话正在被打破，企业用户在评估将关键工作流接入 Claude 时需要增加降级方案。对普通用户而言，短时故障可能突然发生但持续时间短，建议避免依赖单次对话结果做不可逆决策。
可组合技能范式单日暴涨 2821 星 GitHub Trending 榜单显示，last30days-skill 项目单日暴增 2821 星，成为今日增速冠军，该项目提供跨 Reddit/X/YouTube/HN/Polymarket 的 AI 研究技能，与 superpowers 项目（+2752 星）共同指向「技能化」正在取代「框架化」成为 Agent 开发新范式。 → 这意味着开发者更渴望可复用的专业能力模块而非重量级框架搭建。如果你需要研究类 Agent，现在有了可直接用的开源替代方案（类似 Perplexity 的信息合成功能）。
Claude Code Plan Mode 回归故障 Claude Code v2.1.86 发布后，Plan Mode 安全边界机制出现回归故障，至少 9 个关联 Issue 反映模型擅自执行写操作，Plan Mode 的核心安全承诺失效，社区信任受损。 → 如果你在企业环境中依赖 Claude Code 的 Plan Mode（审批后再执行），当前版本存在安全风险——模型可能在未获批准的情况下直接修改文件。团队应暂停在合规要求高的场景使用 Plan Mode，等待下个补丁。
OpenClaw 新增 2 个发布阻断问题 OpenClaw 生态今日新增 2 个 RELEASE BLOCKER 级别问题：openclaw models status 探测正常但运行时报「No API key for provider」，以及 Discord health-monitor 每 35 分钟崩溃一次，同时零版本发布，PR 积压 320 个。 → 这意味着 OpenClaw 2026.3.x 系列正在累积稳定性债务，频繁升级可能带来新问题。如果你在生产环境中使用 OpenClaw，建议暂停自动升级，建立回滚机制，优先验证渠道（Discord/Telegram）稳定性。
Claude Mythos 模型信息泄露 Anthropic 内部正在测试的新模型「Claude Mythos」信息被泄露，官方文件将其定调为「能力阶跃变化」（step change in capabilities），同时 Capybara 作为轻量模型代号被民间情报汇总，社区猜测 Mythos 可能指向推理能力跃迁或 Agent 架构重构。 → 这意味着如果 Mythos 确实实现能力跃迁，现有 Claude 模型可能在数月内贬值。如果你正在做长期技术选型决策，建议保持灵活性，避免过度绑定单一模型版本，等待官方正式发布后再做采购决策。
Kimi Code CLI 迭代速度领跑 Kimi Code CLI 发布 v1.27.0，24 小时内 20 个 PR 更新，迭代密度远超所有竞品，同时 Claude Code Skills 插件生态持续发展，形成从 CLI 到插件的完整工具链。 → 这意味着中国开发者的 AI 编程工具迭代速度已与全球头部玩家持平甚至超越。如果你在中国开发环境或有中文优化需求，Kimi Code CLI 是值得重点关注的选择。

新闻详情

AI CLI 社区动态

Claude Code 工具链生态：Claude Code v2.1.86 发布后，Plan Mode 安全边界机制出现严重回归故障，至少 9 个关联 Issue 反映模型在 Plan Mode 下擅自执行写操作，Plan Mode 的「只读承诺」失效。同时社区发现 .claude/ 文件夹包含 SQLite 缓存、MCP 配置和对话序列化数据，升级前未清除缓存可能导致敏感数据残留。Claude Code Skills 插件生态持续发展，tmp-cleanup、preserve-session 等实用插件进入评审阶段。
- Claude Code v2.1.86 发布后 Plan Mode 回归问题引发 9 条关联 Issue
- Plan Mode 核心安全承诺失效，模型在审批前执行写操作
- Max 配额异常消耗问题引发 79 条评论争议
- .claude/ 文件夹包含 SQLite 缓存、MCP 配置和对话序列化数据
- 缓存数据可能存在敏感对话历史残留风险
- Claude Code Skills 插件生态自发形成，3 个实用插件进入评审
- tmp-cleanup、preserve-session 等插件已获社区认可 → Claude Code 的 Plan Mode 回归故障直接威胁企业级安全使用场景，而 .claude/ 目录的安全隐患此前未被广泛认知。对于需要在合规环境下使用 AI 编程工具的团队，这两者都是需要在工作流程中主动规避的风险点。（相关人群：开发者）
OpenAI Codex Token 燃烧危机：OpenAI Codex v0.117.0 发布后，Token 消耗不可预测问题引发社区激烈讨论，Issue #14593 获得 307 条评论和 102 个点赞，创该工具历史评论纪录。同时 v0.117.0 存在密集回归问题：会话丢失、压缩失效、MCP 失效等问题同期爆发，用户信任面临严峻考验。
- Codex #14593 获得 307 条评论，102 点赞
- v0.117.0 密集回归：会话丢失、压缩失效、MCP 失效同期爆发
- Token 消耗不可预测问题被定性为信任危机
- Rust-v0.118.0-alpha.2/3 正在迭代中
- 沙箱加固 PR #15981 推进
- 看门狗运行时 PR #13678 持续优化 → Codex 的 Token 燃烧问题与 Claude 的配额争议共同指向 AI CLI 产品的「成本透明度危机」。企业在采购决策中需要将不可预测成本作为风险因素纳入评估，而不仅仅是功能对比。（相关人群：开发者）
Kimi Code CLI 高速迭代：Kimi Code CLI 发布 v1.27.0，24 小时内完成 20 个 PR 更新，发布节奏领先所有竞品。同时 OpenCode 项目（Anthropic 旗下）安全架构 PR 集群推进（#19470-#19472），权限钩子修复落地，大仓库性能优化持续推进。
- Kimi Code CLI v1.27.0 发布，24h 20 PR 更新
- Kimi 发布节奏领先，迭代密度最高
- OpenCode 安全架构 PR 集群推进（#19470-#19472）
- 权限钩子修复落地
- Kimi 大仓库性能优化持续
- K2.5 模型集成进展
- AGENTS.md 约束机制待强化 → Kimi 的高速迭代证明中国 AI 编程工具已具备全球竞争力。对于需要快速跟进技术更新的团队，Kimi 的发布节奏值得关注，但同时需要注意 ACP 认证可靠性和 AGENTS.md 约束机制的完善程度。（相关人群：开发者）

AI 开源趋势（信息源：Issue #305）

可组合 AI 技能范式崛起：GitHub Trending 榜单显示，last30days-skill 项目单日暴增 2821 星成为增速冠军，superpowers 项目以 +2752 星紧随其后，两者均强调「技能」作为可复用、可组合的最小单元，与传统 Agent 框架的重量级抽象形成鲜明对比，标志「技能化」正在成为 Agent 开发新范式。
- last30days-skill 单日 +2821 星，今日增速冠军
- superpowers 单日 +2752 星
- 两者均强调「技能」作为可复用最小单元
- 开发者更需要即插即用的专业能力模块
- 信息合成型 Agent 标杆：跨 Reddit/X/YouTube/HN/Polymarket
- oh-my-claudecode +1411 星，Claude Code 团队协作空白被填补
- last30days-skill 定位类似 Perplexity 的开源替代 → 可组合技能范式的崛起意味着开发者不再需要从零构建 Agent，而是像搭积木一样组合专业技能。这降低了 AI 应用开发门槛，也为工具供应商提供了新的生态位机会。（相关人群：开发者）
微软开源 VibeVoice 语音 AI：微软在 GitHub 开源 VibeVoice 项目，定位前沿语音 AI，可能对标 GPT-4o 级实时语音交互能力。开源恰逢 GPT-4o 级实时语音交互成为各家竞逐焦点，与 Claude Mythos 模型泄露、Anthropic IPO 计划形成 AI 竞争升级的叙事链条。
- 微软开源 VibeVoice，定位前沿语音 AI
- 可能对标 GPT-4o 级实时语音交互
- OpenAI 广告试点 6 周突破年化 1 亿美元收入
- GPT-4o 级实时语音成为各家竞逐焦点
- Google TurboQuant 压缩算法可将 LLM 内存使用降低 6 倍
- 社区对此类技术发布反应冷淡 → 微软 VibeVoice 的开源意味着语音 AI 的技术壁垒正在被快速消除。如果你在构建需要语音交互的应用，现在有了更多开源选择；但对于已投入专有语音技术的公司，这可能带来竞争压力。（相关人群：开发者）

Hacker News 热议

Claude Mythos 模型泄露：Anthropic 内部测试的新模型「Claude Mythos」信息被泄露，官方文件将其定调为「能力阶跃变化」（step change in capabilities），同时 Capybara 作为轻量/快速模型代号被民间情报汇总。社区关注是否指向推理能力跃迁或 Agent 架构重构，帖子获 55 分和 19 条评论。
- Claude Mythos 信息被泄露，官方定调「step change in capabilities」
- 可能指向推理能力跃迁或 Agent 架构重构
- Capybara 作为轻量模型代号与 Mythos 形成产品矩阵
- 民间情报汇总站点汇总 Mythos 和 Capybara 信息
- Anthropic 同时考虑 IPO，Q4 可能上市
- Claude 失去 Q1 99% 可用率承诺 → Claude Mythos 的泄露暗示 Anthropic 正在准备下一代模型能力的重大跃升。这对正在做技术选型的团队有重要参考价值：当前 Claude 版本可能在未来几个月内被大幅超越。（相关人群：开发者）
开发者对 Claude 的反思：HN 社区出现两篇引发共鸣的反思文章：「Don’t Wait for Claude」（25 分/60 评论）作者主张摆脱 Claude 依赖、建立模型无关工作流；「Why are executives enamored with AI, but ICs aren’t」（43 分/59 评论）揭示组织内部高管与一线工程师的 AI 采用鸿沟，大量「被迫使用垃圾工具」的职场叙事涌现。
- 「Don’t Wait for Claude」获 60 条评论，作者主张模型无关工作流
- aider + 多模型路由 + 本地优先的工作流方案被讨论
- 「Why are executives enamored with AI, but ICs aren’t」获 59 条评论
- 大量「被迫使用垃圾工具」的职场叙事涌现
- 社区从 2024-2025 年的 Claude 狂热开始出现工具理性反弹
- 开发者开始质疑单一模型锁定风险
- Anthropic 独占心智但伴随信任损耗 → 社区情绪的转向意味着 Claude 的「神话光环」正在消退。对于产品团队，这提示不应将所有赌注压在单一模型上，多模型策略和模型无关工作流设计正在成为更务实的选择。（相关人群：开发者、普通人）

OpenClaw 生态动态

OpenClaw 稳定性债务累积：OpenClaw 今日新增 2 个 RELEASE BLOCKER 级别问题：openclaw models status 探测正常但运行时报「No API key for provider」，以及 Discord health-monitor 每 35 分钟崩溃一次（v2026.3.24）。同时零版本发布，320 个 PR 待合并，2026.3.x 系列回归故障频发，社区出现「升级谨慎」情绪。
- 新增 2 个 RELEASE BLOCKER：认证问题和 Discord 崩溃
- Discord health-monitor 每 35 分钟崩溃一次（v2026.3.24）
- 零版本发布，320 个 PR 待合并
- 2026.3.x 系列回归故障频发
- 社区出现「升级谨慎」情绪
- 维护者建议暂停功能开发，优先回归测试
- 两个安全 Issue 新建：恶意插件注入和 Agent 身份验证 RFC → OpenClaw 的稳定性债务正在累积，如果你在生产环境中使用它，需要立即评估升级策略。建议暂停自动升级直到 2026.3.x 系列的回归问题得到系统性解决。（相关人群：开发者）
Ollama 思考模型兼容性修复：OpenClaw 今日关闭 3 个关联 Ollama 思考模型修复 PR，形成完整修复链：显式发送 think 参数解决 deepseek-r1/qwq 等模型空响应问题，当 thinkingLevel=off 时强制发送 think: false 避免重复思考 token 浪费。
- 3 个 PR 关闭：Ollama 思考模型修复链完成
- deepseek-r1/qwq 模型空响应问题已解决
- thinkingLevel=off 时强制发送 think: false
- 避免重复思考 token 浪费
- Ollama 0.18.0+ 思考模型兼容性已修复
- diffs 插件更新后加载失败问题已修复（#56077） → Ollama 思考模型兼容性的快速修复展示了社区响应的效率。如果你使用 Ollama 部署的思考模型（如 deepseek-r1），现在可以正常使用了。（相关人群：开发者）
跨平台支持与渠道稳定性：OpenClaw 社区讨论最活跃的 Issue 是 Linux/Windows 桌面客户端缺失（57 评论/66 点赞），macOS/iOS/Android 已有但 Linux/Windows 用户长期被忽视，企业部署受阻。同时 Telegram 轮询停滞（107 秒无 getUpdates）强制重启问题持续活跃。
- Linux/Windows 桌面客户端缺失获 57 评论/66 点赞
- macOS/iOS/Android 已有，Linux/Windows 企业部署受阻
- Telegram 轮询停滞 107 秒强制重启问题活跃
- Kimi Chat API 正常但 web_search 401 错误（30 评论）
- Agent 视觉能力支持缺失（20 评论）
- v2026.3.12 升级破坏性变更：CLI 设备管理回归故障 → 跨平台支持是 OpenClaw 企业采纳的关键瓶颈，Linux/Windows 用户的呼声最高但长期未得到满足。如果你在这两个平台上有部署需求，这是需要向社区积极反馈并等待解决的痛点。（相关人群：开发者）
MCP 生态集成成为全栈共识：OpenClaw 生态中，MCP 生态集成、上下文压缩、多提供商支持成为 5 个以上项目的共同关注方向。ZeroClaw #1380 MCP 问题关闭后 #4848 立即报告失效，Codex #16028 MCP 失效回归、PicoClaw 和 NanoBot 同步推进 MCP 集成。
- 5 个项目同步推进 MCP 生态集成
- ZeroClaw #1380 关闭后 #4848 立即报告失效
- Codex #16028 MCP 失效回归
- PicoClaw 和 NanoBot 同步推进 MCP 集成
- context7 MCP 服务器发现协议成为事实标准
- open-webui 项目支持 MCP
- langchain-ai/langchain 持续迭代 MCP 支持
- activepieces 支持约 400 个 MCP 服务器 → MCP 的运行时可靠性问题正在从「配置灵活」转向「稳定性瓶颈」。如果你正在构建 MCP 集成，优先测试长会话稳定性与错误恢复机制，而非工具数量。（相关人群：开发者）

这对你意味着什么

普通人

Claude 偶尔会掉线，但它自己承诺的 99% 没做到。 Anthropic 一直在宣传 99% 以上的在线时间，这是他们可靠性宣传的核心数字。但今年第一季度，这个数字没有达标——也就是说，你在使用过程中遇到 Claude 突然连不上、响应变慢的频率比官方承诺的要高。不过好消息是，这类故障一般持续时间不长，不会一坏就是好几个小时。所以如果你依赖 Claude 处理重要工作（比如写正式邮件、核对数据），养成一个习惯：遇到 Claude 返回奇怪结果或者连不上的时候，打开手机上的豆包或者 Kimi，把同样的问题再问一遍，确保关键结论不是一次临时故障产生的幻觉。这个动作几乎不花时间，但能帮你避免因为单次 AI 失误做出事后无法挽回的决定。

Anthropic 正在准备一个更强大的新版本，但你现在不用等它。 有消息泄露出来说 Anthropic 内部在测试一个叫 Claude Mythos 的新模型，官方文件里用了「能力阶跃变化」这种很重的措辞，意思是说新版本可能比现在强很多。同时 Anthropic 也在考虑今年晚些时候上市。对于你来说，这意味着两件事：首先，你现在用 Claude 做的很多事情，等新版本出来之后可能做得更快更好，这是好事。其次，如果你正在考虑要不要买某个基于 Claude 的付费服务，可以稍微等一等，看看新版本出来之后定价有没有调整，别刚买完就发现同样的钱以后能买到更强的版本。

AI 工具的热度正在降温，大家开始更理性地看待它们了。 过去两年社区对 Claude 趋之若鹜，几乎成了某种信仰。但最近 HN 上两篇文章引发了大量共鸣：一篇叫《别等 Claude 了》，作者建议开发者摆脱对单一工具的依赖；另一篇叫《为什么老板们对 AI 趋之若鹜，但工程师们却不买账》，揭示了组织内部的采用鸿沟——老板们觉得 AI 能改变一切，但一线员工觉得很多工具是「被逼着用的垃圾」。这些讨论说明，AI 工具狂热期正在退潮，大家开始用更务实的眼光看待它们：好不好用、稳不稳定、花多少钱。对于你来说，这意味着不必盲目追热点，也不必因为没用上某款热门工具而焦虑，先把手上的事情做好更重要。

微软开源了一个能实现「实时对话」能力的工具，但它现在还不太值得关注。 微软最近在 GitHub 上开源了一个叫 VibeVoice 的项目，定位是实现像 GPT-4o 那样可以实时对话的 AI 能力。这类技术听起来很酷，但社区对这类「发布一个大新闻」的反应越来越冷淡——不是因为技术不行，而是因为类似的东西太多了，真正能稳定用起来的没几个。对于你来说，如果你在工作中需要用到实时语音交互功能，可以先关注现有产品的稳定性，而不是追新发布。

如果你用的是公司配的电脑，AI 对话记录可能在你不知情的情况下被存下来。 最近有用户发现，Claude Code 这款工具会在你电脑里存对话记录，而且升级之前不主动清理的话，旧数据会一直留在那里。如果你用的是公司电脑或者在公共场合用公用电脑写过代码，这些记录可能被别人看到。好消息是这些数据是存在你自己电脑里的，不是存在云端，所以只要你自己动手清理一下就行。具体做法是：打开 Finder，按 Cmd+Shift+G，输入 ~/.claude/，回车，然后看看里面的文件夹叫什么名字。如果有聊天记录是你不想让别人看到的，删掉整个文件夹或者至少把 cache 子目录清空就行。这个操作不会影响你继续使用 Claude，只是把历史记录清掉。

开发者

检查你的 ~/.claude/ 目录里到底存了什么。 具体步骤：打开终端，运行 ls -la ~/.claude/，看看有哪些子目录。重点关注 cache、projects、settings 这三个文件夹。如果你之前升级过 Claude Code 但没有手动清理，这些文件夹里可能躺着历史对话记录、API 调用缓存、甚至 MCP 服务器的配置信息。如果你在共享机器上工作过，这一项必须立即处理。处理方式：rm -rf ~/.claude/cache/* 可以清理缓存但保留对话历史，rm -rf ~/.claude/ 可以完全重置，但也会丢失你的项目配置和对话历史，按需选择。

如果你的项目依赖 Claude Code 的 Plan Mode 做代码审批，现在立刻关掉它。 Plan Mode 的设计逻辑是「先预览要做什么，你批准了再动手」，这对于需要合规审批的团队很关键。但 v2.1.86 版本里这个机制已经失效，模型可能在你还没点头的时候直接改了文件。检查方式：在 Claude Code 里运行 /plan，如果返回的是 Plan Mode enabled，说明当前会话还在用 Plan Mode。立即切换到普通模式：按 Ctrl+C 中断当前操作，然后重新运行普通命令。通知你的团队成员：如果是协作项目，在 README 或者项目文档里明确标注当前版本的 Plan Mode 不可靠，等下个补丁确认修复后再开启。

确认你团队用的 OpenClaw 版本号，如果是 2026.3.x 系列就暂停升级。 打开终端运行 opencliw –version 或者 openclaw –version，记录当前版本。然后去项目的 Release 页面（github.com/openclaw/openclaw/releases）确认是否在 2026.3.x 系列范围内。如果恰好是这个版本，检查你目前能正常使用的功能清单：打开终端，逐个测试你的自动化脚本、Discord/Telegram 通知、Webhook 回调这些核心功能，记录哪些还能跑、哪些已经挂了。然后建立回滚机制：如果你用的是 Docker 部署，查一下 docker images | grep openclaw 里的镜像标签，保留最近一个能正常工作的镜像，不要再 docker-compose pull 最新版本了。

去 Kimi Code CLI 的 GitHub Release 页面评估 v1.27.0 的实际价值。 访问 github.com/MoonshotAI/kimi-cli/releases，找到 v1.27.0 的 Release Notes，逐条对照你的使用场景：如果你经常处理超过 10 万行代码的大仓库，看一下「大仓库性能优化」的描述里有没有提到具体的性能提升数字；如果你用 Shell 模式做交互式操作，看一下新版有没有改善；如果你在中国市场开发且需要中文优化，看一下中文理解能力有没有实质性改进。如果这些改进对你的项目有实际价值，把它加入你的工具链评估清单；如果没有，继续用现有工具。

GitHub 上有两个值得评估的技能化工具：last30days-skill 和 oh-my-claudecode。 第一个（mvanhorn/last30days-skill）能自动聚合 Reddit、Twitter、YouTube、HN、Polymarket 的 AI 相关讨论，适合你需要持续跟踪行业动态的场景。评估方式：看它的 README 里有没有提供 Docker 部署方式、是否支持自定义平台、聚合结果是否可以导出。如果满足你的需求，它比从零开发一个爬虫加合成脚本要快得多。第二个（Yeachan-Heo/oh-my-claudecode）是专门填补 Claude Code 团队协作功能空白的外挂，适合你用 Claude Code 做多人协作项目。评估方式：看一下它的 Issue 区有没有大量「某某功能官方还没支持但这个项目做了」的反馈，如果有，说明它解决的是真实痛点。

如果你的项目用到了 Ollama 部署的思考模型（deepseek-r1、qwq），确认它们现在能正常返回结果了。 之前 deepseek-r1 和 qwq 在 OpenClaw 里会返回空响应，问题已经修复。验证方式：运行 openclaw models list，确认 deepseek-r1 和 qwq 出现在模型列表里，然后运行一次实际调用（openclaw chat –model deepseek-r1 –prompt “请用三句话解释什么是量子计算”），看是否能正常返回内容。如果能，说明修复已经生效；如果还不行，检查一下你的 Ollama 版本是否在 0.18.0 以上（ollama –version）。

如果你的项目依赖 MCP 集成，现在最应该测试的是长会话稳定性，而不是「能连多少工具」。 具体做法：写一个测试脚本，模拟连续 30 分钟的 MCP 调用，每 5 分钟记录一次成功率和中途是否有异常断开。context7 MCP 服务器发现协议现在被 400 个左右的服务器采用，但它在长会话下的稳定性还没有经过充分验证。如果你的生产环境需要 7x24 小时运行，这个测试会救你一命：找出哪个环节最容易断，然后给那个环节加上自动重连逻辑。

确认你团队的 AI 工具成本监控机制是否到位。 Claude Code 之前被用户反映 Max 配额异常消耗，OpenAI Codex 的 Token 消耗不可预测问题引发了 307 条评论。这两件事共同指向一个风险：AI CLI 工具的用量监控往往被忽视，直到月底账单出来才发现超支。检查方式：打开你的账单后台，看一下过去 30 天的 API 调用量趋势，有没有某个日期突然飙升的情况。如果有，排查一下是业务正常增长还是工具 bug 导致的异常消耗。对于团队项目，建议在每个项目的 README 里加上「本月 API 消耗」一栏，让用量透明可见。

如果你的团队在 Linux 或 Windows 上部署 OpenClaw，现在能做的只有等官方出客户端或者自己动手。 OpenClaw 的 Linux/Windows 桌面客户端缺失问题已经积累了 57 条评论和 66 个点赞，是社区呼声最高的 Issue 之一。但官方目前没有明确的时间表。如果你的团队对桌面客户端有强需求，去 GitHub 的 Issue 区（github.com/openclaw/openclaw/issues）找到这个 Issue，点赞并留言你的具体使用场景，这会帮助维护者判断优先级。如果你有桌面开发经验，这是一个可以贡献代码的切入点的 Issue。如果你是企业采购评估，现在把「跨平台支持缺失」列入你的风险评估清单。

创业者/产品人

last30days-skill 的出现意味着竞品情报收集的门槛正在大幅降低。 这个项目一天涨了 2800 多星，核心功能是自动聚合 Reddit、Twitter、YouTube、HN、Polymarket 这五个平台上的 AI 相关讨论，生成一份情报简报。对于正在做 AI 产品的人来说，这意味着几件事：首先，如果你的产品需要持续跟踪行业动态，现在有现成的开源方案可以直接用或者基于它做二次开发，不需要从零搭爬虫、加平台 API、做文本合成。其次，如果你的产品本身就是做信息聚合的，这个项目的热度说明市场对这类工具有需求，但也意味着竞争会更激烈——开源替代会分走一部分付费用户。如果你想在这个方向上做付费产品，需要找到 last30days-skill 做不到的部分，比如更深的行业洞察、定制化的警报机制、或者跟你的目标用户工作流深度整合的功能。

Claude Mythos 泄露和 Anthropic IPO 计划放在一起看，是一个重要的技术选型风险信号。 Anthropic 正在测试的新模型被定调为「能力阶跃变化」，同时公司在考虑 Q4 上市。这两件事放在一起，暗示新模型可能会跟上市时间配合，形成一波市场营销攻势。对于正在基于 Claude 构建产品的团队，这意味着：如果 Claude Mythos 真的是一个能力大幅提升的版本，你现在基于当前 Claude 构建的功能可能在几个月后显得落后；但如果新版本伴随定价调整，你现有的成本估算也需要重做。建议：不要把赌注全部押在单一模型版本上，保持你的产品对模型版本的解耦能力——具体来说，确保你有一个可以切换模型的抽象层，当新版本发布或者价格调整时，你可以快速切换而不需要重构整个产品。

GitHub Trending 上 skill 化趋势的两个项目（last30days-skill 和 superpowers）正在改变 Agent 开发的成本结构。 传统的 Agent 开发需要从零搭建框架，然后逐个实现功能模块。skill 化的思路是把能力拆成最小可用单元，开发者可以直接组合现成的 skill，像搭积木一样构建应用。这个趋势对产品人有几个启示：第一，如果你的产品需要某个 AI 功能，先去 GitHub 上搜一下有没有现成的开源 skill，而不是找开发团队从零做。第二，如果你的产品定位是「提供某个专业领域的 skill」，这个方向现在是蓝海——skill 化降低了 AI 应用的开发门槛，但也创造了新的生态位机会，谁能提供最可靠的垂直领域 skill，谁就能在这个生态里站稳脚跟。第三，skill 化趋势意味着 AI 产品的迭代速度会加快，因为开发者不再需要每次都从框架开始搭。

社区对 Claude 的情绪正在从狂热转向理性，这对新进入者是一个机会窗口。 HN 上两篇引发共鸣的文章（《别等 Claude 了》和《为什么老板们对 AI 趋之若鹜，但工程师们不买账》）揭示了一个趋势：Claude 的「神话光环」正在消退，大家开始用更务实的标准来评估 AI 工具——好不好用、稳不稳定、花多少钱。对于正在做 AI 产品的团队，这意味着几件事：第一，如果你的产品能在「稳定性」或「成本透明度」上做出差异化，这是真实的市场需求，而不是伪需求。第二，用户正在寻找替代方案，这部分需求目前没有被很好地满足——比如很多用户吐槽「被迫放弃趁手的工具去用公司采购的 AI 产品，结果效率反而下降」，说明市场上存在「好用但不被公司允许」的矛盾。第三，不要迷信「AI 工具越贵越好用」这个叙事，用户现在更愿意为一个稳定、透明、省心的工具付费，而不是为一个功能强大但经常出问题的工具买单。

OpenClaw 的稳定性债务对依赖它的产品是一个风险，需要重新评估你的技术栈。 OpenClaw 生态目前有两个 RELEASE BLOCKER 级别的问题在活跃：认证问题和 Discord health-monitor 崩溃，加上 320 个 PR 积压和「升级谨慎」的情绪，2026.3.x 系列的稳定性债务正在累积。如果你正在基于 OpenClaw 构建需要 7x24 小时运行的产品（比如客服机器人、自动化工作流），现在需要做一个关键评估：当前版本的稳定性问题会不会影响你的 SLA 承诺？如果会，有几个选项：第一，锁定当前版本，停止自动升级，接受你可能错过新功能的风险；第二，切换到一个更稳定的替代方案，比如基于 Kimi 或者 Claude Code 做封装；第三，如果你有开发能力，去 OpenClaw 的 GitHub 页面找那些还没被合并的稳定版本 PR，评估是否可以 cherry-pick 修复到你的分支上。无论选择哪条路，都要尽快行动——稳定性债务不会自己消失，只会越滚越大。

微软开源 VibeVoice 和 Google 发布 TurboQuant 压缩算法，说明语音交互和模型效率正在成为新的竞争焦点。 微软的 VibeVoice 定位是 GPT-4o 级别的实时语音交互，Google 的 TurboQuant 声称能把 LLM 的内存占用降低 6 倍。对于产品规划来说，这两个信号指向一个方向：未来几个季度，实时语音交互和模型效率优化会变得更容易实现、成本会下降。如果你正在规划需要语音交互的产品，现在可以开始评估这个方向的可行性；如果你的产品已经有语音功能，需要关注这些新技术是否会改变市场格局。但也要注意，社区对这类「发布一个大新闻」的反应越来越冷淡，说明从「发布」到「稳定可用」之间还有很长的路——不要因为一个新工具发布就立即改变你的产品路线图，先等它在生产环境里跑一段时间再说。

今天可以做

打开 Claude Code，运行 cat ~/.claude/cache/ 看看里面存了什么数据，如果有不适合让别人看到的内容，考虑手动清理缓存文件夹
检查你团队的项目是否依赖 Claude Code 的 Plan Mode 做代码审批，如果是的话立即改回普通模式，告知团队成员当前版本安全机制不可靠
如果你在生产环境用 OpenClaw，立即检查当前版本号，如果是 2026.3.x 系列就暂停自动升级，建立回滚机制并记录当前可用功能清单
去 Kimi Code CLI 的 GitHub 页面（github.com/MoonshotAI/kimi-cli）看一下 v1.27.0 的 Release Notes，评估大仓库优化和 Shell 模式增强是否对你的项目有价值
在 GitHub 搜索 last30days-skill 项目（mvanhorn/last30days-skill），看看它的 README 文档，评估它的跨平台信息聚合能力是否可以替代你现在的竞品情报方案
如果你用 Claude 做关键业务，建立一个简单的降级方案：用 ChatGPT 或者 Kimi 重新问同样的问题，交叉验证结果，避免因为 Claude 临时故障导致工作中断
打开你当前用的 AI 编程工具（Claude Code、Kimi、Codex 等），确认它的 Plan Mode 或审批流程在当前版本是否正常工作
去 GitHub 看 oh-my-claudecode 项目（Yeachan-Heo/oh-my-claudecode），确认官方 Claude Code 确实缺少团队协作功能，考虑在团队内部试点这个插件

开源项目

🔧 AI 基础工具（框架、SDK、推理引擎、开发工具、CLI）

项目	Stars	一句话说明
obra/superpowers	+2,752 today	Agentic 技能框架与软件工程方法论，今日增速仅次于榜首，定位"能实际工作的"开发范式
datalab-to/chandra	+912 today	复杂表格、表单、手写体 OCR 模型，布局感知能力突出，RAG 文档处理的关键基建
microsoft/VibeVoice	+337 today	微软开源的前沿语音 AI，可能对标 GPT-4o 级实时语音交互
Vaibhavs10/insanely-fast-whisper	+1,066 today	Whisper 极速推理方案，边缘部署与实时转录场景的核心工具
ollama/ollama	166,312 ⭐	本地大模型运行的事实标准，今日更新支持 Kimi-K2.5、GLM-5 等新模型
vllm-project/vllm	74,529 ⭐	高吞吐 LLM 推理引擎，生产环境部署的首选
langchain-ai/langchain	131,333 ⭐	Agent 工程平台，持续迭代工具调用与 MCP 支持
open-webui/open-webui	128,994 ⭐	最友好的本地 LLM 交互界面，Ollama 生态的黄金搭档

🤖 AI 智能体/工作流（Agent 框架、自动化、多智能体）

项目	Stars	一句话说明
mvanhorn/last30days-skill	+2,821 today	今日增速冠军：跨 Reddit/X/YouTube/HN/Polymarket/网页的 AI 研究技能，信息合成型 Agent 的标杆
obra/superpowers	+2,752 today	Agentic 技能框架 + 软件工程方法论，强调"能实际工作"而非 demo
Yeachan-Heo/oh-my-claudecode	+1,411 today	Teams-first 多 Agent 编排，专为 Claude Code 设计，补全官方缺失的协作层
virattt/dexter	+672 today	深度金融研究自治 Agent，垂直场景 Agent 的专业化代表
SakanaAI/AI-Scientist-v2	+143 today	基于 Agentic 树搜索的研讨会级自动科研发现，科研自动化的里程碑
browser-use/browser-use	84,762 ⭐	让网站可被 AI Agent 访问，浏览器自动化的事实标准
OpenHands/OpenHands	69,938 ⭐	AI 驱动软件开发，代码生成 Agent 的领先方案
activepieces/activepieces	21,456 ⭐	支持 ~400 个 MCP 服务器的 AI 工作流自动化，企业级 Agent 编排

📦 AI 应用（具体应用产品、垂直场景解决方案）

项目	Stars	一句话说明
hacksider/Deep-Live-Cam	+1,616 today	单图实时换脸与一键视频 deepfake，消费级 AI 视频生成的现象级工具
virattt/dexter	+672 today	金融研究专用 Agent，股票分析与投资决策的自动化
saturndec/waoowaoo	10,534 ⭐ [topic:ai-agent]	工业级全流程 AI 影视生产平台，好莱坞标准工作流的 Agent 化
CherryHQ/cherry-studio	42,441 ⭐	300+ 助手的 AI 生产力工作室，统一接入前沿 LLM
langgenius/dify	134,753 ⭐	生产级 Agentic 工作流开发平台，低代码 + 高扩展

🧠 大模型/训练（模型权重、训练框架、微调工具）

项目	Stars	一句话说明
SakanaAI/AI-Scientist-v2	+143 today	自动科研发现系统，结合 Agentic 树搜索与论文生成
hacksider/Deep-Live-Cam	+1,616 today	基于单图的实时人脸合成，轻量化 deepfake 技术的工程突破
huggingface/transformers	158,494 ⭐	模型定义框架的事实标准，支持文本/视觉/音频/多模态
hiyouga/LlamaFactory	69,156 ⭐	100+ LLM/VLM 统一高效微调，ACL 2024 成果
jingyaogong/minimind	44,206 ⭐	2 小时从零训练 64M 参数 GPT，大模型教育的最小可行实现
rasbt/LLMs-from-scratch	89,358 ⭐	从零实现 ChatGPT 级 LLM，深度学习教育的经典教材

🔍 RAG/知识库（向量数据库、检索增强、知识管理）

项目	Stars	一句话说明
datalab-to/chandra	+912 today	复杂文档 OCR + 布局理解，RAG 管道的前置关键组件
onyx-dot-app/onyx	+547 today	开源 AI 平台，支持所有 LLM 的高级 AI 对话与知识管理
infiniflow/ragflow	76,415 ⭐	融合前沿 RAG 与 Agent 能力的检索增强生成引擎
mem0ai/mem0	51,266 ⭐	AI Agent 的通用记忆层，长期记忆与个性化核心
run-llama/llama_index	48,069 ⭐	领先的文档 Agent 与 OCR 平台，RAG 生态的基石
milvus-io/milvus	43,495 ⭐	云原生高性能向量数据库，规模化 ANN 搜索的首选
qdrant/qdrant	29,891 ⭐	大规模向量数据库与搜索引擎，下一代 AI 的检索基建
topoteretes/cognee	14,697 ⭐	6 行代码构建 AI Agent 记忆的知识引擎