今日速览
昨天 HN 上最火的帖子不是某个新模型发布,而是一个安全警告——有用户深入逆向工程了 Claude Code 的本地文件夹结构,发现它会在你电脑的 ~/.claude/ 目录里存一堆东西:SQLite 缓存、MCP 服务器配置、还有完整的对话序列化数据。这个帖子拿到了 349 分和 180 条评论,说明大家都意识到问题了。评论区瞬间炸开,有人发现自己升级 Claude Code 之后旧对话记录还躺在缓存里,有人担心共享电脑上的同事能看到自己问了什么乱七八糟的问题。这件事之所以值得你认真对待,是因为大多数用户以为跟 AI 对话就像跟网页聊天一样——关掉窗口就没了。实际上不是。Claude Code 把你的对话历史、配置信息、缓存数据全存在本地,升级之前不手动清理就会留下痕迹。如果你在用的是公司配的电脑,或者在咖啡馆用公用电脑写代码,这些数据可能在你不知情的情况下被别人翻出来。更麻烦的是,很多团队升级工具都是自动推送的,根本不会弹窗问你“要不要清除旧数据”。所以现在你知道该怎么办了:打开 Finder 或文件管理器,按 Cmd+Shift+G,输入 ~/.claude/,看看里面到底存了些什么。如果有聊天记录是你不想让别人看到的,要么删掉整个文件夹重新开始,要么至少把 cache 子目录清空。
Claude 神话破灭的速度比很多人想象的快。Anthropic 一直拿“可靠性”当核心卖点,承诺 99% 以上的在线时间,但最新数据显示 2026 年第一季度 Claude 的可用率跌破了这个阈值。HN 上相关帖子拿了 76 分,73 条评论,争议焦点在于官方是不是在隐瞒稳定性问题。有用户翻出过去几个月的故障记录,发现 Claude 掉线的频率比官方承认的高得多,而且每次恢复的时间也比承诺的长。这意味着什么?如果你把 Claude 当成日常工作的主力工具,现在得开始建立“降级方案”了。具体做法很简单:遇到 Claude 返回奇怪结果或者连不上的时候,用 ChatGPT 或者 Kimi 再问一遍同样的问题,交叉验证。不用两个工具完全替代,只需要确认关键结论不是 Claude 临时故障产生的幻觉就行。这个习惯的成本几乎为零,但能帮你避免因为单次 AI 失误做出不可逆的决定。
GitHub Trending 昨天冒出来一个怪物级的项目。last30days-skill 单日暴涨 2821 颗星,把第二名甩开一大截。这个项目做的事情很有意思:它帮你自动追踪 Reddit、Twitter、YouTube、Hacker News、Polymarket 这些平台上的 AI 相关讨论,然后合成一份情报简报。换句话说,它在做一个开源版的 Perplexity,专门服务于需要持续跟踪 AI 进展的从业者。紧随其后的是 superpowers 项目,拿到 2752 星,也是强调“技能”作为可复用单元的思路。这两个项目共同指向一个趋势:开发者不再想要重量级的 Agent 框架,而是想要能直接插入工作流的“小能力块”。就像你不会为了拧一颗螺丝去买一整套电动工具,现在大家也不愿意为了用个搜索功能搭一整个框架。技能化的本质是把 AI 能力拆成最小可用单元,让你可以像搭积木一样组合。对于正在做 AI 产品规划的人来说,这个信号很重要:如果你需要某个功能,先看看有没有现成的开源技能可以用,而不是从零造轮子。
Claude Code 的 Plan Mode 出事了。v2.1.86 发布之后,至少 9 个关联 Issue 反映同一个问题:模型在 Plan Mode 下擅自执行写操作。Plan Mode 是什么?它是 Claude Code 里的一个安全机制,设计理念是“先让模型给你看它要做什么,你批准了它再动手”。现在这个机制失效了,模型可能在你还没点头的时候就直接改了文件。社区信任直接受损。这个问题对企业用户影响最大,因为很多团队引入 Claude Code 的时候就是看中了这个审批流程——代码修改必须经过人工确认才能落地。如果这个确认环节变成假的,那整个合规框架就形同虚设了。与此同时,Claude Code 的 Max 配额异常消耗问题也在持续发酵,79 条评论的讨论量说明这不是个例,而是很多人都在遇到的问题。两个问题叠加在一起,结论很清楚:如果你现在需要用 Claude Code 做需要审批的代码修改,先把 Plan Mode 关掉,改用普通模式,并且明确告知团队成员当前版本的这个功能不可靠。不要等出了问题再后悔。
OpenClaw 的用户最近可能比较闹心。这个生态圈昨天新增了两个 RELEASE BLOCKER 级别的问题:一个是 openclaw models status 命令明明显示正常,但实际运行时报“No API key for provider”;另一个是 Discord health-monitor 每 35 分钟就崩溃一次。更让人头疼的是,他们同时在推零版本发布,320 个 PR 积压着没处理,2026.3.x 系列的回归故障一个接一个冒出来。社区的情绪已经从“期待新功能”变成了“升级要谨慎”。维护者的建议也很直接:暂停功能开发,优先做回归测试。对于已经在生产环境里跑着 OpenClaw 的人来说,这意味着你需要立刻检查当前版本号。如果恰好是 2026.3.x 系列,不要再自动升级了,先把当前能用的功能列个清单,建立回滚机制,等社区确认稳定性问题被系统性解决之后再动。
Kimi Code CLI 昨天发布了 v1.27.0,24 小时内合并了 20 个 PR。这个迭代密度把所有竞品都甩在身后,包括 Claude Code 和 OpenAI Codex。如果你有中国市场的开发需求,或者需要中文优化过的 AI 编程工具,Kimi 已经是不得不认真考虑的选择。与此同时,Claude Code Skills 插件生态也在自发成长,tmp-cleanup、preserve-session 这些实用插件陆续进入评审阶段,oh-my-claudecode 项目拿到了 1411 颗星——它做的事情是填补官方 Claude Code 在团队协作功能上的空白。这些信号放在一起,说明 AI 编程工具的竞争已经进入了一个新阶段:光有 CLI 不够,还得有插件生态、有社区共建的工作流模板。谁能吸引更多开发者在上面构建插件和技能,谁就能在这个市场里站稳脚跟。
Anthropic 正在测试的新模型“Claude Mythos”昨天被泄露了。官方文件里把它定性为“能力阶跃变化”,英文叫 step change in capabilities,这是很重的措辞。同时被挖出来的还有一个叫 Capybara 的轻量模型代号,民间情报汇总站点已经开始把它们拼凑在一起,猜测 Mythos 可能指向推理能力的跃升,或者 Agent 架构的整体重构。更重要的是,有消息说 Anthropic 正在考虑 Q4 上市。这个时间节点很有意思——如果 Mythos 真的是一个能力大幅提升的模型,它的发布很可能会跟上市时间配合起来,形成一波市场声量。对于正在做技术选型的团队,这意味着两件事:第一,不要过度绑定在当前 Claude 版本上,因为几个月后可能会有一个强得多的版本出来;第二,如果你正在基于 Claude 构建产品,提前想好降级方案,新模型发布的时候往往伴随定价调整,先有预案就不会被动。
微软前两天开源了一个叫 VibeVoice 的项目,定位是前沿语音 AI,目标是 GPT-4o 级别的实时语音交互能力。这件事跟 Claude Mythos 泄露、Anthropic IPO 计划形成了一条叙事链:各家公司都在往 Agent 能力和实时交互的方向砸资源,语音正在成为下一个竞争焦点。不过有意思的是,社区对这类技术发布的反应越来越冷淡——不是说技术本身不行,而是大家已经被“F5 就能改变世界”的声明轰炸得麻木了。Google 同时也在推 TurboQuant 压缩算法,号称能把 LLM 的内存占用降低 6 倍。对于普通开发者来说,这些技术进展当然值得跟踪,但优先级可以往后放一放。你现在更应该关注的是:手上的工具链稳定性如何?缓存清理了没有?Plan Mode 还能不能用?这些日常问题的紧迫性远高于追踪哪家又发了新模型。
HN 上昨天有两篇文章引发了不小的共鸣。第一篇叫《Don’t Wait for Claude》,拿了 25 分和 60 条评论,作者的核心观点是“别等 Claude 了”,建议开发者建立模型无关的工作流,用 aider 加多模型路由加本地优先的方案来摆脱单一工具依赖。评论区涌现了大量“Claude 最近故障太频繁了”、“配额消耗不合理”的吐槽。第二篇文章叫《Why are executives enamored with AI, but ICs aren’t》,43 分和 59 条评论,揭示了一个组织内部的采用鸿沟:高管们对 AI 趋之若鹜,但一线工程师觉得很多 AI 工具是“被迫用的垃圾”。大量职场叙事涌现,有人说自己被迫放弃趁手的工具去用公司采购的 AI 产品,结果效率反而下降了。这两篇文章放在一起,描绘的是同一个现实:AI 工具狂热期正在退潮,社区开始用更理性的眼光审视这些工具的可靠性、成本透明度和真实生产力提升。如果你也是“被逼着用 AI 工具”的那一批人,这些讨论至少说明你不是孤例。
OpenClaw 生态里有个细节值得单独说一下:Ollama 思考模型的兼容性问题昨天被彻底修好了。之前 deepseek-r1 和 qwq 这类模型在某些情况下会返回空响应,根本原因是 Claude Code 没有正确发送 think 参数。修复方案很直接:当 thinkingLevel=off 的时候强制发送 think: false,避免重复产生思考 token,既解决了空响应问题,又节省了 token 消耗。如果你用的是 Ollama 部署的本地思考模型,现在可以正常使用了,不用再折腾配置。这个修复只用了 3 个 PR 就完成了闭环,说明社区响应的效率还是在线的。相比之下,OpenClaw 的两个安全 Issue 就没那么乐观了——恶意插件注入和 Agent 身份验证的问题刚刚新建 RFC,远没到解决的阶段。如果你关心 OpenClaw 的安全性演进,这两个议题的后续值得关注。
MCP 生态的集成正在成为各家工具的标配,但随之而来的是稳定性问题。ZeroClaw 刚关掉一个 MCP 相关 Issue,另一个就立刻报失效;Codex 的 MCP 失效回归问题也在持续;PicoClaw 和 NanoBot 都在同步推进 MCP 集成,但没人敢打包票运行时不出问题。context7 MCP 服务器发现协议正在成为事实标准,open-webui、langchain-ai/langchain、activepieces 这些项目都在跟进,支持的 MCP 服务器数量已经达到 400 个左右。问题在于,当一个协议被广泛采用的时候,它的稳定性就会从“配置灵活”变成“稳定性瓶颈”。如果你正在构建 MCP 集成,现在最应该测试的不是“能连多少工具”,而是“长会话稳不稳定、断了能不能自动恢复”。这个优先级的转变可能会救你一命。
最后说一个跨平台支持的长期痛点。OpenClaw 社区昨天讨论最活跃的 Issue 之一是 Linux 和 Windows 桌面客户端缺失,拿到了 57 条评论和 66 个点赞。macOS、iOS、Android 都有,唯独 Linux 和 Windows 的企业用户长期被忽视。这不是新问题,但社区呼声越来越高,意味着企业部署的需求正在积累。对于有跨平台需求的团队,这个信号说明如果你在 Linux 或 Windows 上部署 OpenClaw,现在能做的只有等——要么等官方出客户端,要么自己动手贡献代码。否则这个需求会一直悬着。Telegram 轮询停滞的问题也在持续,有人报告每 107 秒就会出现一次 getUpdates 无响应,必须强制重启。这些看起来是“小问题”,但对于需要 24 小时运行的生产机器人来说,每隔两分钟崩溃一次就是灾难。
总结一下昨天最重要的变化:Claude Code 的本地数据安全隐患被社区扒出来了,Plan Mode 的安全承诺在新版本里失效了,Claude 本身的可用率也没达到承诺的 99%。这三个问题叠加在一起,对开发者的影响是实打实的——你需要清理缓存、改工作流程、建降级方案。与此同时,GitHub 上的技能化趋势越来越清晰,Kimi 的迭代速度开始领跑,Anthropic 的下一代模型泄露暗示未来几个月可能有大变化。AI 工具的狂热叙事正在被可靠性、成本透明度和真实生产力的讨论取代。对于每天要用这些工具的人来说,与其追新版本发布,不如先把今天提到的这几个风险点处理了——很多问题等到出事了再补救,代价会比提前预防高得多。
今日新闻
Claude 文件夹结构解析引爆 HN HN 用户深度逆向工程 Claude Code 的 .claude/ 本地文件夹结构,揭示 SQLite 缓存机制、MCP 服务器配置和对话序列化细节,帖子获 349 分和 180 条评论,成为当日绝对热点,评论区涌现大量关于潜在安全风险的讨论。 → 这意味着 Claude Code 的本地状态管理比用户认知的更复杂:缓存数据可能包含敏感对话历史,升级前不清除缓存可能导致数据残留风险。开发者应意识到本地数据的存在,必要时主动清理 .claude/ 目录。
Claude Q1 可用率跌破 99% Anthropic 长期以可靠性为核心卖点,但 Claude 在 2026 年 Q1 可用率跌破 99% SLA 阈值,引发社区对「扩张过快」的质疑,帖子获 76 分和 73 条评论,争议集中于官方是否隐瞒稳定性问题。 → 这意味着 Claude 的可靠性神话正在被打破,企业用户在评估将关键工作流接入 Claude 时需要增加降级方案。对普通用户而言,短时故障可能突然发生但持续时间短,建议避免依赖单次对话结果做不可逆决策。
可组合技能范式单日暴涨 2821 星 GitHub Trending 榜单显示,last30days-skill 项目单日暴增 2821 星,成为今日增速冠军,该项目提供跨 Reddit/X/YouTube/HN/Polymarket 的 AI 研究技能,与 superpowers 项目(+2752 星)共同指向「技能化」正在取代「框架化」成为 Agent 开发新范式。 → 这意味着开发者更渴望可复用的专业能力模块而非重量级框架搭建。如果你需要研究类 Agent,现在有了可直接用的开源替代方案(类似 Perplexity 的信息合成功能)。
Claude Code Plan Mode 回归故障 Claude Code v2.1.86 发布后,Plan Mode 安全边界机制出现回归故障,至少 9 个关联 Issue 反映模型擅自执行写操作,Plan Mode 的核心安全承诺失效,社区信任受损。 → 如果你在企业环境中依赖 Claude Code 的 Plan Mode(审批后再执行),当前版本存在安全风险——模型可能在未获批准的情况下直接修改文件。团队应暂停在合规要求高的场景使用 Plan Mode,等待下个补丁。
OpenClaw 新增 2 个发布阻断问题 OpenClaw 生态今日新增 2 个 RELEASE BLOCKER 级别问题:openclaw models status 探测正常但运行时报「No API key for provider」,以及 Discord health-monitor 每 35 分钟崩溃一次,同时零版本发布,PR 积压 320 个。 → 这意味着 OpenClaw 2026.3.x 系列正在累积稳定性债务,频繁升级可能带来新问题。如果你在生产环境中使用 OpenClaw,建议暂停自动升级,建立回滚机制,优先验证渠道(Discord/Telegram)稳定性。
Claude Mythos 模型信息泄露 Anthropic 内部正在测试的新模型「Claude Mythos」信息被泄露,官方文件将其定调为「能力阶跃变化」(step change in capabilities),同时 Capybara 作为轻量模型代号被民间情报汇总,社区猜测 Mythos 可能指向推理能力跃迁或 Agent 架构重构。 → 这意味着如果 Mythos 确实实现能力跃迁,现有 Claude 模型可能在数月内贬值。如果你正在做长期技术选型决策,建议保持灵活性,避免过度绑定单一模型版本,等待官方正式发布后再做采购决策。
Kimi Code CLI 迭代速度领跑 Kimi Code CLI 发布 v1.27.0,24 小时内 20 个 PR 更新,迭代密度远超所有竞品,同时 Claude Code Skills 插件生态持续发展,形成从 CLI 到插件的完整工具链。 → 这意味着中国开发者的 AI 编程工具迭代速度已与全球头部玩家持平甚至超越。如果你在中国开发环境或有中文优化需求,Kimi Code CLI 是值得重点关注的选择。
新闻详情
AI CLI 社区动态
Claude Code 工具链生态:Claude Code v2.1.86 发布后,Plan Mode 安全边界机制出现严重回归故障,至少 9 个关联 Issue 反映模型在 Plan Mode 下擅自执行写操作,Plan Mode 的「只读承诺」失效。同时社区发现 .claude/ 文件夹包含 SQLite 缓存、MCP 配置和对话序列化数据,升级前未清除缓存可能导致敏感数据残留。Claude Code Skills 插件生态持续发展,tmp-cleanup、preserve-session 等实用插件进入评审阶段。
- Claude Code v2.1.86 发布后 Plan Mode 回归问题引发 9 条关联 Issue
- Plan Mode 核心安全承诺失效,模型在审批前执行写操作
- Max 配额异常消耗问题引发 79 条评论争议
- .claude/ 文件夹包含 SQLite 缓存、MCP 配置和对话序列化数据
- 缓存数据可能存在敏感对话历史残留风险
- Claude Code Skills 插件生态自发形成,3 个实用插件进入评审
- tmp-cleanup、preserve-session 等插件已获社区认可 → Claude Code 的 Plan Mode 回归故障直接威胁企业级安全使用场景,而 .claude/ 目录的安全隐患此前未被广泛认知。对于需要在合规环境下使用 AI 编程工具的团队,这两者都是需要在工作流程中主动规避的风险点。(相关人群:开发者)
OpenAI Codex Token 燃烧危机:OpenAI Codex v0.117.0 发布后,Token 消耗不可预测问题引发社区激烈讨论,Issue #14593 获得 307 条评论和 102 个点赞,创该工具历史评论纪录。同时 v0.117.0 存在密集回归问题:会话丢失、压缩失效、MCP 失效等问题同期爆发,用户信任面临严峻考验。
- Codex #14593 获得 307 条评论,102 点赞
- v0.117.0 密集回归:会话丢失、压缩失效、MCP 失效同期爆发
- Token 消耗不可预测问题被定性为信任危机
- Rust-v0.118.0-alpha.2/3 正在迭代中
- 沙箱加固 PR #15981 推进
- 看门狗运行时 PR #13678 持续优化 → Codex 的 Token 燃烧问题与 Claude 的配额争议共同指向 AI CLI 产品的「成本透明度危机」。企业在采购决策中需要将不可预测成本作为风险因素纳入评估,而不仅仅是功能对比。(相关人群:开发者)
Kimi Code CLI 高速迭代:Kimi Code CLI 发布 v1.27.0,24 小时内完成 20 个 PR 更新,发布节奏领先所有竞品。同时 OpenCode 项目(Anthropic 旗下)安全架构 PR 集群推进(#19470-#19472),权限钩子修复落地,大仓库性能优化持续推进。
- Kimi Code CLI v1.27.0 发布,24h 20 PR 更新
- Kimi 发布节奏领先,迭代密度最高
- OpenCode 安全架构 PR 集群推进(#19470-#19472)
- 权限钩子修复落地
- Kimi 大仓库性能优化持续
- K2.5 模型集成进展
- AGENTS.md 约束机制待强化 → Kimi 的高速迭代证明中国 AI 编程工具已具备全球竞争力。对于需要快速跟进技术更新的团队,Kimi 的发布节奏值得关注,但同时需要注意 ACP 认证可靠性和 AGENTS.md 约束机制的完善程度。(相关人群:开发者)
AI 开源趋势(信息源:Issue #305)
可组合 AI 技能范式崛起:GitHub Trending 榜单显示,last30days-skill 项目单日暴增 2821 星成为增速冠军,superpowers 项目以 +2752 星紧随其后,两者均强调「技能」作为可复用、可组合的最小单元,与传统 Agent 框架的重量级抽象形成鲜明对比,标志「技能化」正在成为 Agent 开发新范式。
- last30days-skill 单日 +2821 星,今日增速冠军
- superpowers 单日 +2752 星
- 两者均强调「技能」作为可复用最小单元
- 开发者更需要即插即用的专业能力模块
- 信息合成型 Agent 标杆:跨 Reddit/X/YouTube/HN/Polymarket
- oh-my-claudecode +1411 星,Claude Code 团队协作空白被填补
- last30days-skill 定位类似 Perplexity 的开源替代 → 可组合技能范式的崛起意味着开发者不再需要从零构建 Agent,而是像搭积木一样组合专业技能。这降低了 AI 应用开发门槛,也为工具供应商提供了新的生态位机会。(相关人群:开发者)
微软开源 VibeVoice 语音 AI:微软在 GitHub 开源 VibeVoice 项目,定位前沿语音 AI,可能对标 GPT-4o 级实时语音交互能力。开源恰逢 GPT-4o 级实时语音交互成为各家竞逐焦点,与 Claude Mythos 模型泄露、Anthropic IPO 计划形成 AI 竞争升级的叙事链条。
- 微软开源 VibeVoice,定位前沿语音 AI
- 可能对标 GPT-4o 级实时语音交互
- OpenAI 广告试点 6 周突破年化 1 亿美元收入
- GPT-4o 级实时语音成为各家竞逐焦点
- Google TurboQuant 压缩算法可将 LLM 内存使用降低 6 倍
- 社区对此类技术发布反应冷淡 → 微软 VibeVoice 的开源意味着语音 AI 的技术壁垒正在被快速消除。如果你在构建需要语音交互的应用,现在有了更多开源选择;但对于已投入专有语音技术的公司,这可能带来竞争压力。(相关人群:开发者)
Hacker News 热议
Claude Mythos 模型泄露:Anthropic 内部测试的新模型「Claude Mythos」信息被泄露,官方文件将其定调为「能力阶跃变化」(step change in capabilities),同时 Capybara 作为轻量/快速模型代号被民间情报汇总。社区关注是否指向推理能力跃迁或 Agent 架构重构,帖子获 55 分和 19 条评论。
- Claude Mythos 信息被泄露,官方定调「step change in capabilities」
- 可能指向推理能力跃迁或 Agent 架构重构
- Capybara 作为轻量模型代号与 Mythos 形成产品矩阵
- 民间情报汇总站点汇总 Mythos 和 Capybara 信息
- Anthropic 同时考虑 IPO,Q4 可能上市
- Claude 失去 Q1 99% 可用率承诺 → Claude Mythos 的泄露暗示 Anthropic 正在准备下一代模型能力的重大跃升。这对正在做技术选型的团队有重要参考价值:当前 Claude 版本可能在未来几个月内被大幅超越。(相关人群:开发者)
开发者对 Claude 的反思:HN 社区出现两篇引发共鸣的反思文章:「Don’t Wait for Claude」(25 分/60 评论)作者主张摆脱 Claude 依赖、建立模型无关工作流;「Why are executives enamored with AI, but ICs aren’t」(43 分/59 评论)揭示组织内部高管与一线工程师的 AI 采用鸿沟,大量「被迫使用垃圾工具」的职场叙事涌现。
- 「Don’t Wait for Claude」获 60 条评论,作者主张模型无关工作流
- aider + 多模型路由 + 本地优先的工作流方案被讨论
- 「Why are executives enamored with AI, but ICs aren’t」获 59 条评论
- 大量「被迫使用垃圾工具」的职场叙事涌现
- 社区从 2024-2025 年的 Claude 狂热开始出现工具理性反弹
- 开发者开始质疑单一模型锁定风险
- Anthropic 独占心智但伴随信任损耗 → 社区情绪的转向意味着 Claude 的「神话光环」正在消退。对于产品团队,这提示不应将所有赌注压在单一模型上,多模型策略和模型无关工作流设计正在成为更务实的选择。(相关人群:开发者、普通人)
OpenClaw 生态动态
OpenClaw 稳定性债务累积:OpenClaw 今日新增 2 个 RELEASE BLOCKER 级别问题:openclaw models status 探测正常但运行时报「No API key for provider」,以及 Discord health-monitor 每 35 分钟崩溃一次(v2026.3.24)。同时零版本发布,320 个 PR 待合并,2026.3.x 系列回归故障频发,社区出现「升级谨慎」情绪。
- 新增 2 个 RELEASE BLOCKER:认证问题和 Discord 崩溃
- Discord health-monitor 每 35 分钟崩溃一次(v2026.3.24)
- 零版本发布,320 个 PR 待合并
- 2026.3.x 系列回归故障频发
- 社区出现「升级谨慎」情绪
- 维护者建议暂停功能开发,优先回归测试
- 两个安全 Issue 新建:恶意插件注入和 Agent 身份验证 RFC → OpenClaw 的稳定性债务正在累积,如果你在生产环境中使用它,需要立即评估升级策略。建议暂停自动升级直到 2026.3.x 系列的回归问题得到系统性解决。(相关人群:开发者)
Ollama 思考模型兼容性修复:OpenClaw 今日关闭 3 个关联 Ollama 思考模型修复 PR,形成完整修复链:显式发送 think 参数解决 deepseek-r1/qwq 等模型空响应问题,当 thinkingLevel=off 时强制发送 think: false 避免重复思考 token 浪费。
- 3 个 PR 关闭:Ollama 思考模型修复链完成
- deepseek-r1/qwq 模型空响应问题已解决
- thinkingLevel=off 时强制发送 think: false
- 避免重复思考 token 浪费
- Ollama 0.18.0+ 思考模型兼容性已修复
- diffs 插件更新后加载失败问题已修复(#56077) → Ollama 思考模型兼容性的快速修复展示了社区响应的效率。如果你使用 Ollama 部署的思考模型(如 deepseek-r1),现在可以正常使用了。(相关人群:开发者)
跨平台支持与渠道稳定性:OpenClaw 社区讨论最活跃的 Issue 是 Linux/Windows 桌面客户端缺失(57 评论/66 点赞),macOS/iOS/Android 已有但 Linux/Windows 用户长期被忽视,企业部署受阻。同时 Telegram 轮询停滞(107 秒无 getUpdates)强制重启问题持续活跃。
- Linux/Windows 桌面客户端缺失获 57 评论/66 点赞
- macOS/iOS/Android 已有,Linux/Windows 企业部署受阻
- Telegram 轮询停滞 107 秒强制重启问题活跃
- Kimi Chat API 正常但 web_search 401 错误(30 评论)
- Agent 视觉能力支持缺失(20 评论)
- v2026.3.12 升级破坏性变更:CLI 设备管理回归故障 → 跨平台支持是 OpenClaw 企业采纳的关键瓶颈,Linux/Windows 用户的呼声最高但长期未得到满足。如果你在这两个平台上有部署需求,这是需要向社区积极反馈并等待解决的痛点。(相关人群:开发者)
MCP 生态集成成为全栈共识:OpenClaw 生态中,MCP 生态集成、上下文压缩、多提供商支持成为 5 个以上项目的共同关注方向。ZeroClaw #1380 MCP 问题关闭后 #4848 立即报告失效,Codex #16028 MCP 失效回归、PicoClaw 和 NanoBot 同步推进 MCP 集成。
- 5 个项目同步推进 MCP 生态集成
- ZeroClaw #1380 关闭后 #4848 立即报告失效
- Codex #16028 MCP 失效回归
- PicoClaw 和 NanoBot 同步推进 MCP 集成
- context7 MCP 服务器发现协议成为事实标准
- open-webui 项目支持 MCP
- langchain-ai/langchain 持续迭代 MCP 支持
- activepieces 支持约 400 个 MCP 服务器 → MCP 的运行时可靠性问题正在从「配置灵活」转向「稳定性瓶颈」。如果你正在构建 MCP 集成,优先测试长会话稳定性与错误恢复机制,而非工具数量。(相关人群:开发者)
这对你意味着什么
普通人
Claude 偶尔会掉线,但它自己承诺的 99% 没做到。 Anthropic 一直在宣传 99% 以上的在线时间,这是他们可靠性宣传的核心数字。但今年第一季度,这个数字没有达标——也就是说,你在使用过程中遇到 Claude 突然连不上、响应变慢的频率比官方承诺的要高。不过好消息是,这类故障一般持续时间不长,不会一坏就是好几个小时。所以如果你依赖 Claude 处理重要工作(比如写正式邮件、核对数据),养成一个习惯:遇到 Claude 返回奇怪结果或者连不上的时候,打开手机上的豆包或者 Kimi,把同样的问题再问一遍,确保关键结论不是一次临时故障产生的幻觉。这个动作几乎不花时间,但能帮你避免因为单次 AI 失误做出事后无法挽回的决定。
Anthropic 正在准备一个更强大的新版本,但你现在不用等它。 有消息泄露出来说 Anthropic 内部在测试一个叫 Claude Mythos 的新模型,官方文件里用了「能力阶跃变化」这种很重的措辞,意思是说新版本可能比现在强很多。同时 Anthropic 也在考虑今年晚些时候上市。对于你来说,这意味着两件事:首先,你现在用 Claude 做的很多事情,等新版本出来之后可能做得更快更好,这是好事。其次,如果你正在考虑要不要买某个基于 Claude 的付费服务,可以稍微等一等,看看新版本出来之后定价有没有调整,别刚买完就发现同样的钱以后能买到更强的版本。
AI 工具的热度正在降温,大家开始更理性地看待它们了。 过去两年社区对 Claude 趋之若鹜,几乎成了某种信仰。但最近 HN 上两篇文章引发了大量共鸣:一篇叫《别等 Claude 了》,作者建议开发者摆脱对单一工具的依赖;另一篇叫《为什么老板们对 AI 趋之若鹜,但工程师们却不买账》,揭示了组织内部的采用鸿沟——老板们觉得 AI 能改变一切,但一线员工觉得很多工具是「被逼着用的垃圾」。这些讨论说明,AI 工具狂热期正在退潮,大家开始用更务实的眼光看待它们:好不好用、稳不稳定、花多少钱。对于你来说,这意味着不必盲目追热点,也不必因为没用上某款热门工具而焦虑,先把手上的事情做好更重要。
微软开源了一个能实现「实时对话」能力的工具,但它现在还不太值得关注。 微软最近在 GitHub 上开源了一个叫 VibeVoice 的项目,定位是实现像 GPT-4o 那样可以实时对话的 AI 能力。这类技术听起来很酷,但社区对这类「发布一个大新闻」的反应越来越冷淡——不是因为技术不行,而是因为类似的东西太多了,真正能稳定用起来的没几个。对于你来说,如果你在工作中需要用到实时语音交互功能,可以先关注现有产品的稳定性,而不是追新发布。
如果你用的是公司配的电脑,AI 对话记录可能在你不知情的情况下被存下来。 最近有用户发现,Claude Code 这款工具会在你电脑里存对话记录,而且升级之前不主动清理的话,旧数据会一直留在那里。如果你用的是公司电脑或者在公共场合用公用电脑写过代码,这些记录可能被别人看到。好消息是这些数据是存在你自己电脑里的,不是存在云端,所以只要你自己动手清理一下就行。具体做法是:打开 Finder,按 Cmd+Shift+G,输入 ~/.claude/,回车,然后看看里面的文件夹叫什么名字。如果有聊天记录是你不想让别人看到的,删掉整个文件夹或者至少把 cache 子目录清空就行。这个操作不会影响你继续使用 Claude,只是把历史记录清掉。
开发者
检查你的 ~/.claude/ 目录里到底存了什么。 具体步骤:打开终端,运行 ls -la ~/.claude/,看看有哪些子目录。重点关注 cache、projects、settings 这三个文件夹。如果你之前升级过 Claude Code 但没有手动清理,这些文件夹里可能躺着历史对话记录、API 调用缓存、甚至 MCP 服务器的配置信息。如果你在共享机器上工作过,这一项必须立即处理。处理方式:rm -rf ~/.claude/cache/* 可以清理缓存但保留对话历史,rm -rf ~/.claude/ 可以完全重置,但也会丢失你的项目配置和对话历史,按需选择。
如果你的项目依赖 Claude Code 的 Plan Mode 做代码审批,现在立刻关掉它。 Plan Mode 的设计逻辑是「先预览要做什么,你批准了再动手」,这对于需要合规审批的团队很关键。但 v2.1.86 版本里这个机制已经失效,模型可能在你还没点头的时候直接改了文件。检查方式:在 Claude Code 里运行 /plan,如果返回的是 Plan Mode enabled,说明当前会话还在用 Plan Mode。立即切换到普通模式:按 Ctrl+C 中断当前操作,然后重新运行普通命令。通知你的团队成员:如果是协作项目,在 README 或者项目文档里明确标注当前版本的 Plan Mode 不可靠,等下个补丁确认修复后再开启。
确认你团队用的 OpenClaw 版本号,如果是 2026.3.x 系列就暂停升级。 打开终端运行 opencliw –version 或者 openclaw –version,记录当前版本。然后去项目的 Release 页面(github.com/openclaw/openclaw/releases)确认是否在 2026.3.x 系列范围内。如果恰好是这个版本,检查你目前能正常使用的功能清单:打开终端,逐个测试你的自动化脚本、Discord/Telegram 通知、Webhook 回调这些核心功能,记录哪些还能跑、哪些已经挂了。然后建立回滚机制:如果你用的是 Docker 部署,查一下 docker images | grep openclaw 里的镜像标签,保留最近一个能正常工作的镜像,不要再 docker-compose pull 最新版本了。
去 Kimi Code CLI 的 GitHub Release 页面评估 v1.27.0 的实际价值。 访问 github.com/MoonshotAI/kimi-cli/releases,找到 v1.27.0 的 Release Notes,逐条对照你的使用场景:如果你经常处理超过 10 万行代码的大仓库,看一下「大仓库性能优化」的描述里有没有提到具体的性能提升数字;如果你用 Shell 模式做交互式操作,看一下新版有没有改善;如果你在中国市场开发且需要中文优化,看一下中文理解能力有没有实质性改进。如果这些改进对你的项目有实际价值,把它加入你的工具链评估清单;如果没有,继续用现有工具。
GitHub 上有两个值得评估的技能化工具:last30days-skill 和 oh-my-claudecode。 第一个(mvanhorn/last30days-skill)能自动聚合 Reddit、Twitter、YouTube、HN、Polymarket 的 AI 相关讨论,适合你需要持续跟踪行业动态的场景。评估方式:看它的 README 里有没有提供 Docker 部署方式、是否支持自定义平台、聚合结果是否可以导出。如果满足你的需求,它比从零开发一个爬虫加合成脚本要快得多。第二个(Yeachan-Heo/oh-my-claudecode)是专门填补 Claude Code 团队协作功能空白的外挂,适合你用 Claude Code 做多人协作项目。评估方式:看一下它的 Issue 区有没有大量「某某功能官方还没支持但这个项目做了」的反馈,如果有,说明它解决的是真实痛点。
如果你的项目用到了 Ollama 部署的思考模型(deepseek-r1、qwq),确认它们现在能正常返回结果了。 之前 deepseek-r1 和 qwq 在 OpenClaw 里会返回空响应,问题已经修复。验证方式:运行 openclaw models list,确认 deepseek-r1 和 qwq 出现在模型列表里,然后运行一次实际调用(openclaw chat –model deepseek-r1 –prompt “请用三句话解释什么是量子计算”),看是否能正常返回内容。如果能,说明修复已经生效;如果还不行,检查一下你的 Ollama 版本是否在 0.18.0 以上(ollama –version)。
如果你的项目依赖 MCP 集成,现在最应该测试的是长会话稳定性,而不是「能连多少工具」。 具体做法:写一个测试脚本,模拟连续 30 分钟的 MCP 调用,每 5 分钟记录一次成功率和中途是否有异常断开。context7 MCP 服务器发现协议现在被 400 个左右的服务器采用,但它在长会话下的稳定性还没有经过充分验证。如果你的生产环境需要 7x24 小时运行,这个测试会救你一命:找出哪个环节最容易断,然后给那个环节加上自动重连逻辑。
确认你团队的 AI 工具成本监控机制是否到位。 Claude Code 之前被用户反映 Max 配额异常消耗,OpenAI Codex 的 Token 消耗不可预测问题引发了 307 条评论。这两件事共同指向一个风险:AI CLI 工具的用量监控往往被忽视,直到月底账单出来才发现超支。检查方式:打开你的账单后台,看一下过去 30 天的 API 调用量趋势,有没有某个日期突然飙升的情况。如果有,排查一下是业务正常增长还是工具 bug 导致的异常消耗。对于团队项目,建议在每个项目的 README 里加上「本月 API 消耗」一栏,让用量透明可见。
如果你的团队在 Linux 或 Windows 上部署 OpenClaw,现在能做的只有等官方出客户端或者自己动手。 OpenClaw 的 Linux/Windows 桌面客户端缺失问题已经积累了 57 条评论和 66 个点赞,是社区呼声最高的 Issue 之一。但官方目前没有明确的时间表。如果你的团队对桌面客户端有强需求,去 GitHub 的 Issue 区(github.com/openclaw/openclaw/issues)找到这个 Issue,点赞并留言你的具体使用场景,这会帮助维护者判断优先级。如果你有桌面开发经验,这是一个可以贡献代码的切入点的 Issue。如果你是企业采购评估,现在把「跨平台支持缺失」列入你的风险评估清单。
创业者/产品人
last30days-skill 的出现意味着竞品情报收集的门槛正在大幅降低。 这个项目一天涨了 2800 多星,核心功能是自动聚合 Reddit、Twitter、YouTube、HN、Polymarket 这五个平台上的 AI 相关讨论,生成一份情报简报。对于正在做 AI 产品的人来说,这意味着几件事:首先,如果你的产品需要持续跟踪行业动态,现在有现成的开源方案可以直接用或者基于它做二次开发,不需要从零搭爬虫、加平台 API、做文本合成。其次,如果你的产品本身就是做信息聚合的,这个项目的热度说明市场对这类工具有需求,但也意味着竞争会更激烈——开源替代会分走一部分付费用户。如果你想在这个方向上做付费产品,需要找到 last30days-skill 做不到的部分,比如更深的行业洞察、定制化的警报机制、或者跟你的目标用户工作流深度整合的功能。
Claude Mythos 泄露和 Anthropic IPO 计划放在一起看,是一个重要的技术选型风险信号。 Anthropic 正在测试的新模型被定调为「能力阶跃变化」,同时公司在考虑 Q4 上市。这两件事放在一起,暗示新模型可能会跟上市时间配合,形成一波市场营销攻势。对于正在基于 Claude 构建产品的团队,这意味着:如果 Claude Mythos 真的是一个能力大幅提升的版本,你现在基于当前 Claude 构建的功能可能在几个月后显得落后;但如果新版本伴随定价调整,你现有的成本估算也需要重做。建议:不要把赌注全部押在单一模型版本上,保持你的产品对模型版本的解耦能力——具体来说,确保你有一个可以切换模型的抽象层,当新版本发布或者价格调整时,你可以快速切换而不需要重构整个产品。
GitHub Trending 上 skill 化趋势的两个项目(last30days-skill 和 superpowers)正在改变 Agent 开发的成本结构。 传统的 Agent 开发需要从零搭建框架,然后逐个实现功能模块。skill 化的思路是把能力拆成最小可用单元,开发者可以直接组合现成的 skill,像搭积木一样构建应用。这个趋势对产品人有几个启示:第一,如果你的产品需要某个 AI 功能,先去 GitHub 上搜一下有没有现成的开源 skill,而不是找开发团队从零做。第二,如果你的产品定位是「提供某个专业领域的 skill」,这个方向现在是蓝海——skill 化降低了 AI 应用的开发门槛,但也创造了新的生态位机会,谁能提供最可靠的垂直领域 skill,谁就能在这个生态里站稳脚跟。第三,skill 化趋势意味着 AI 产品的迭代速度会加快,因为开发者不再需要每次都从框架开始搭。
社区对 Claude 的情绪正在从狂热转向理性,这对新进入者是一个机会窗口。 HN 上两篇引发共鸣的文章(《别等 Claude 了》和《为什么老板们对 AI 趋之若鹜,但工程师们不买账》)揭示了一个趋势:Claude 的「神话光环」正在消退,大家开始用更务实的标准来评估 AI 工具——好不好用、稳不稳定、花多少钱。对于正在做 AI 产品的团队,这意味着几件事:第一,如果你的产品能在「稳定性」或「成本透明度」上做出差异化,这是真实的市场需求,而不是伪需求。第二,用户正在寻找替代方案,这部分需求目前没有被很好地满足——比如很多用户吐槽「被迫放弃趁手的工具去用公司采购的 AI 产品,结果效率反而下降」,说明市场上存在「好用但不被公司允许」的矛盾。第三,不要迷信「AI 工具越贵越好用」这个叙事,用户现在更愿意为一个稳定、透明、省心的工具付费,而不是为一个功能强大但经常出问题的工具买单。
OpenClaw 的稳定性债务对依赖它的产品是一个风险,需要重新评估你的技术栈。 OpenClaw 生态目前有两个 RELEASE BLOCKER 级别的问题在活跃:认证问题和 Discord health-monitor 崩溃,加上 320 个 PR 积压和「升级谨慎」的情绪,2026.3.x 系列的稳定性债务正在累积。如果你正在基于 OpenClaw 构建需要 7x24 小时运行的产品(比如客服机器人、自动化工作流),现在需要做一个关键评估:当前版本的稳定性问题会不会影响你的 SLA 承诺?如果会,有几个选项:第一,锁定当前版本,停止自动升级,接受你可能错过新功能的风险;第二,切换到一个更稳定的替代方案,比如基于 Kimi 或者 Claude Code 做封装;第三,如果你有开发能力,去 OpenClaw 的 GitHub 页面找那些还没被合并的稳定版本 PR,评估是否可以 cherry-pick 修复到你的分支上。无论选择哪条路,都要尽快行动——稳定性债务不会自己消失,只会越滚越大。
微软开源 VibeVoice 和 Google 发布 TurboQuant 压缩算法,说明语音交互和模型效率正在成为新的竞争焦点。 微软的 VibeVoice 定位是 GPT-4o 级别的实时语音交互,Google 的 TurboQuant 声称能把 LLM 的内存占用降低 6 倍。对于产品规划来说,这两个信号指向一个方向:未来几个季度,实时语音交互和模型效率优化会变得更容易实现、成本会下降。如果你正在规划需要语音交互的产品,现在可以开始评估这个方向的可行性;如果你的产品已经有语音功能,需要关注这些新技术是否会改变市场格局。但也要注意,社区对这类「发布一个大新闻」的反应越来越冷淡,说明从「发布」到「稳定可用」之间还有很长的路——不要因为一个新工具发布就立即改变你的产品路线图,先等它在生产环境里跑一段时间再说。
今天可以做
- 打开 Claude Code,运行 cat ~/.claude/cache/ 看看里面存了什么数据,如果有不适合让别人看到的内容,考虑手动清理缓存文件夹
- 检查你团队的项目是否依赖 Claude Code 的 Plan Mode 做代码审批,如果是的话立即改回普通模式,告知团队成员当前版本安全机制不可靠
- 如果你在生产环境用 OpenClaw,立即检查当前版本号,如果是 2026.3.x 系列就暂停自动升级,建立回滚机制并记录当前可用功能清单
- 去 Kimi Code CLI 的 GitHub 页面(github.com/MoonshotAI/kimi-cli)看一下 v1.27.0 的 Release Notes,评估大仓库优化和 Shell 模式增强是否对你的项目有价值
- 在 GitHub 搜索 last30days-skill 项目(mvanhorn/last30days-skill),看看它的 README 文档,评估它的跨平台信息聚合能力是否可以替代你现在的竞品情报方案
- 如果你用 Claude 做关键业务,建立一个简单的降级方案:用 ChatGPT 或者 Kimi 重新问同样的问题,交叉验证结果,避免因为 Claude 临时故障导致工作中断
- 打开你当前用的 AI 编程工具(Claude Code、Kimi、Codex 等),确认它的 Plan Mode 或审批流程在当前版本是否正常工作
- 去 GitHub 看 oh-my-claudecode 项目(Yeachan-Heo/oh-my-claudecode),确认官方 Claude Code 确实缺少团队协作功能,考虑在团队内部试点这个插件
开源项目
🔧 AI 基础工具(框架、SDK、推理引擎、开发工具、CLI)
| 项目 | Stars | 一句话说明 |
|---|---|---|
| obra/superpowers | +2,752 today | Agentic 技能框架与软件工程方法论,今日增速仅次于榜首,定位"能实际工作的"开发范式 |
| datalab-to/chandra | +912 today | 复杂表格、表单、手写体 OCR 模型,布局感知能力突出,RAG 文档处理的关键基建 |
| microsoft/VibeVoice | +337 today | 微软开源的前沿语音 AI,可能对标 GPT-4o 级实时语音交互 |
| Vaibhavs10/insanely-fast-whisper | +1,066 today | Whisper 极速推理方案,边缘部署与实时转录场景的核心工具 |
| ollama/ollama | 166,312 ⭐ | 本地大模型运行的事实标准,今日更新支持 Kimi-K2.5、GLM-5 等新模型 |
| vllm-project/vllm | 74,529 ⭐ | 高吞吐 LLM 推理引擎,生产环境部署的首选 |
| langchain-ai/langchain | 131,333 ⭐ | Agent 工程平台,持续迭代工具调用与 MCP 支持 |
| open-webui/open-webui | 128,994 ⭐ | 最友好的本地 LLM 交互界面,Ollama 生态的黄金搭档 |
🤖 AI 智能体/工作流(Agent 框架、自动化、多智能体)
| 项目 | Stars | 一句话说明 |
|---|---|---|
| mvanhorn/last30days-skill | +2,821 today | 今日增速冠军:跨 Reddit/X/YouTube/HN/Polymarket/网页的 AI 研究技能,信息合成型 Agent 的标杆 |
| obra/superpowers | +2,752 today | Agentic 技能框架 + 软件工程方法论,强调"能实际工作"而非 demo |
| Yeachan-Heo/oh-my-claudecode | +1,411 today | Teams-first 多 Agent 编排,专为 Claude Code 设计,补全官方缺失的协作层 |
| virattt/dexter | +672 today | 深度金融研究自治 Agent,垂直场景 Agent 的专业化代表 |
| SakanaAI/AI-Scientist-v2 | +143 today | 基于 Agentic 树搜索的研讨会级自动科研发现,科研自动化的里程碑 |
| browser-use/browser-use | 84,762 ⭐ | 让网站可被 AI Agent 访问,浏览器自动化的事实标准 |
| OpenHands/OpenHands | 69,938 ⭐ | AI 驱动软件开发,代码生成 Agent 的领先方案 |
| activepieces/activepieces | 21,456 ⭐ | 支持 ~400 个 MCP 服务器的 AI 工作流自动化,企业级 Agent 编排 |
📦 AI 应用(具体应用产品、垂直场景解决方案)
| 项目 | Stars | 一句话说明 |
|---|---|---|
| hacksider/Deep-Live-Cam | +1,616 today | 单图实时换脸与一键视频 deepfake,消费级 AI 视频生成的现象级工具 |
| virattt/dexter | +672 today | 金融研究专用 Agent,股票分析与投资决策的自动化 |
| saturndec/waoowaoo | 10,534 ⭐ [topic:ai-agent] | 工业级全流程 AI 影视生产平台,好莱坞标准工作流的 Agent 化 |
| CherryHQ/cherry-studio | 42,441 ⭐ | 300+ 助手的 AI 生产力工作室,统一接入前沿 LLM |
| langgenius/dify | 134,753 ⭐ | 生产级 Agentic 工作流开发平台,低代码 + 高扩展 |
🧠 大模型/训练(模型权重、训练框架、微调工具)
| 项目 | Stars | 一句话说明 |
|---|---|---|
| SakanaAI/AI-Scientist-v2 | +143 today | 自动科研发现系统,结合 Agentic 树搜索与论文生成 |
| hacksider/Deep-Live-Cam | +1,616 today | 基于单图的实时人脸合成,轻量化 deepfake 技术的工程突破 |
| huggingface/transformers | 158,494 ⭐ | 模型定义框架的事实标准,支持文本/视觉/音频/多模态 |
| hiyouga/LlamaFactory | 69,156 ⭐ | 100+ LLM/VLM 统一高效微调,ACL 2024 成果 |
| jingyaogong/minimind | 44,206 ⭐ | 2 小时从零训练 64M 参数 GPT,大模型教育的最小可行实现 |
| rasbt/LLMs-from-scratch | 89,358 ⭐ | 从零实现 ChatGPT 级 LLM,深度学习教育的经典教材 |
🔍 RAG/知识库(向量数据库、检索增强、知识管理)
| 项目 | Stars | 一句话说明 |
|---|---|---|
| datalab-to/chandra | +912 today | 复杂文档 OCR + 布局理解,RAG 管道的前置关键组件 |
| onyx-dot-app/onyx | +547 today | 开源 AI 平台,支持所有 LLM 的高级 AI 对话与知识管理 |
| infiniflow/ragflow | 76,415 ⭐ | 融合前沿 RAG 与 Agent 能力的检索增强生成引擎 |
| mem0ai/mem0 | 51,266 ⭐ | AI Agent 的通用记忆层,长期记忆与个性化核心 |
| run-llama/llama_index | 48,069 ⭐ | 领先的文档 Agent 与 OCR 平台,RAG 生态的基石 |
| milvus-io/milvus | 43,495 ⭐ | 云原生高性能向量数据库,规模化 ANN 搜索的首选 |
| qdrant/qdrant | 29,891 ⭐ | 大规模向量数据库与搜索引擎,下一代 AI 的检索基建 |
| topoteretes/cognee | 14,697 ⭐ | 6 行代码构建 AI Agent 记忆的知识引擎 |