HN Daily Reading · 每日阅读

HN 每日深度阅读 · 2026-06-23

本期话题横跨硬件、AI、能源与公共议题:Steam Machine 高价开售与墨西哥廉价电动车原型同日亮相,加拿大重启核电、雪佛龙为微软数据中心配套燃气电厂折射算力扩张的能源代价;AI 侧 Sakana 推多智能体系统、智谱开源模型对标 Claude。

2026.06.23 20 篇摘录

共 20 篇 · 约 13,885 字 · 约 35 分钟读完

1. Valve Steam Machine 正式发售:千美元价位与抽签预订引争议

Valve 宣布 Steam Machine 于今日开始接受预订,提供 512GB 和 2TB 两种存储版本,售价分别为 1049 美元和 1349 美元,搭配 Steam Controller 的捆绑版价格略高。2TB 版本还附赠红色织物和实木胡桃木两款额外面板。Valve 解释称,由于过去一年内存和存储等组件成本急剧上升,且部分时期甚至无法以任何价格采购到所需零件,原定的目标价格已无法实现。当前定价反映了过去六个月内锁定的组件实际成本。

为应对抢购和黄牛问题,Valve 推出了随机化预订系统:用户可在 6 月 25 日前自由报名,截止后进行一次性随机抽签决定预订队列顺序。此举旨在避免传统发售方式对网速、机器人脚本和反应速度的偏向。报名者需拥有信誉良好的 Steam 账号并在 4 月 27 日前有过购买记录,且每户限报一次。Valve 还明确强调该设备是 PC 的延伸而非主机,用户可自由安装其他操作系统或应用。

HN 社区评论呈现明显分化。许多用户对随机抽签机制和开放性持积极态度,认为这种”你买了电脑就应该想装什么装什么”的理念在当下颇为难得。也有评论者期待该产品推动 Linux 在桌面游戏领域削弱 Windows 垄断,称其”必须成功”。

但价格成为最大争议点。多位评论者将其与 PS5 对比:基础版 PS5 售价约 600-650 美元,PS5 Pro 售价 900 美元且 GPU 算力更强、附带手柄。Steam Machine 以六核 CPU、16GB 内存、512GB SSD 且不含手柄的配置卖到 1049 美元,被认为性价比令人失望。有评论推测 Valve 原本希望定价在 549-699 美元区间,但 2025-2026 年的内存涨价潮断送了该产品的市场预期。一位评论者总结道:“我理解为什么价格这么高,但确实太贵了——这不是关于价值的判断,而是市场承受能力的问题。“也有人愿意为支持 Linux 生态而购入,并提到客厅 HTPC 长期缺乏稳定 CEC 方案的痛点。


2. Deno Desktop 发布:用 Web 技术构建桌面应用的新选择

Deno 推出了 deno desktop 命令,可将 Deno 项目(从单个 TypeScript 文件到 Next.js 应用)打包为自包含的桌面应用程序。该功能将随 Deno 2.9.0 发布,目前可通过 canary 版本试用。生成的二进制文件捆绑了用户代码、Deno 运行时和 Web 渲染引擎。

该方案的核心设计理念是针对 Electron、Tauri、Electrobun 等现有桌面方案的痛点。默认情况下使用操作系统自带的 WebView 后端以获得小体积,同时通过 Deno 的 Node 兼容层保留完整的 npm 生态;当需要跨平台一致渲染时可切换到 CEF (Chromium Embedded Framework) 后端。框架支持方面,自动识别 Next.js、Astro、Fresh、Remix、Nuxt、SvelteKit、SolidStart、TanStack Start 和 Vite SSR 项目,无需修改代码即可桌面化,并在 --hmr 模式下支持热重载。

后端与 UI 通信通过进程内通道而非 socket IPC,减少跨进程往返开销。一台机器即可交叉编译 macOS、Windows、Linux 三大平台版本。内置基于 bsdiff 的二进制差分自动更新机制,启动失败时可自动回滚。

HN 评论中开发者关注点集中在几个方面。有人提问共享 CEF 运行时的版本管理问题——如果不同应用需要不同版本的 CEF,是否会退化为类似 Electron 那样每个应用都打包浏览器的模式。也有用户关心 Deno 的权限系统如何与桌面应用结合,文档说明编译时的权限会被烘焙进二进制文件,但社区希望能向最终用户暴露这些权限设置。多位评论者认为 Deno Desktop 会蚕食 Tauri 的市场份额,因为额外 150MB 的体积对大多数网络只是 1-10 秒下载时间,但能换来可靠的渲染引擎。Tauri 和 Dioxus 能轻松做到 5MB 以下的包体积,相比之下 Deno Desktop 在不使用 CEF 时仍约 40MB 显得偏大。

也有声音质疑文档中”Web 技术是世界上最广为人知的 UI 工具包”的提法,认为 Electron 应用被诟病恰恰是因为它们不是真正的 UI 工具包——按钮不会自然符合宿主操作系统的设计模式。


3. Mitchell Hashimoto 再向 Zig 软件基金会捐赠 40 万美元

HashiCorp 联合创始人 Mitchell Hashimoto 宣布其家族再向 Zig 软件基金会 (ZSF) 承诺捐赠 40 万美元,分两年支付,每年 20 万美元。加上 2024 年首次捐赠的 30 万美元,累计承诺支持已达 70 万美元。

Hashimoto 表示 Zig 在技术项目和社区两方面都赢得了他的尊重。2026 年的开发日志显示 Zig 在构建优秀语言和编译器的难题上稳步推进。他也认可项目对维护方式和社区的处理方法,特别提到了 Loris Cro 的”Contributor Poker 与 Zig 的 AI 禁令”等举措。

文章重点谈及最近因 Bun 的 Zig 分支和 Rust 重写引发的关于 Zig 严格禁止 LLM 贡献政策的公开讨论。Hashimoto 表示自己对 Bun 的做法没有意见,但让他在意的是人们多么迅速地相互妖魔化、缺乏对不同观点的同理心。他自述是 AI 重度用户,写过关于自己 AI 采用历程和借助 AI 交付实际功能的文章,但也对 AI 能力保持理性认知、对其在开源领域的负面影响感到沮丧。他强调自己的观点与 ZSF 的做法并不完全一致,但仍对 ZSF 的人员、政策和项目充满敬意,“互联网和开源的伟大之处部分就在于项目可以保持古怪和不同”。他认为 Ghostty 终端的诞生很大程度上得益于 Zig,这是他持续支持的原因。

HN 评论充满对 Hashimoto 的赞誉。有评论者认为他关于”互联网允许怪异”的论述非常精彩,并对比 Twitter、Facebook、Reddit 上稍有不同观点便被围攻的环境。多位评论者称赞 Ghostty 作为终端工具的改进体验,认为这一贡献甚至超过了一些数亿美元收购的项目。

也有评论从语言治理角度肯定 Zig 的 LLM 政策。一位评论者指出,构建语言不是简单地堆砌新代码,而是仔细考量某个特性及其实现是否与整体语言连贯一致。过去几十年有大量例子表明,放任添加新功能会让语言变得精神分裂、缺乏人体工学。LLM 那种”是的,当然,而且……”的倾向不是健康语言项目所需要的,但对使用平衡语言的人则非常有用。也有评论者对 Zig 语法表达了顾虑,希望在 1.0 前能改进开发者人体工学。


4. GLM-5.2 对决 Claude Opus 4.8:开源权重模型的能力边界测试

作者用同一个一次性提示词让 GLM-5.2 和 Claude Opus 4.8 从零构建基于原生 WebGL 的 3D 平台跳跃游戏(不使用 Three.js 等 3D 库)。GLM-5.2 是智谱 (Z.ai) 推出的开源权重旗舰模型,MIT 许可证,1M token 上下文窗口,专为长时段编码代理任务设计。

测试任务包括手写 GLB 二进制解析器、矩阵和四元数运算、WebGL2 渲染器与 GLSL 蒙皮着色器、子步长 AABB 碰撞检测、跟随摄像机和键盘控制等。结果显示:Opus 4.8 用时 33 分 30 秒完成,输出 216,809 tokens,估算成本约 21.92 美元;GLM-5.2 耗时 1 小时 10 分 40 秒,输出 131,000 tokens,实际计费 5.39 美元。Opus 在一半时间内交付了更干净、更正确的成品,且能检视自己的视觉输出(GLM-5.2 是纯文本模型,不能读图)。但 GLM-5.2 以约五分之一的输出 token 价格 (1.4/4.4 美元 vs 5/25 美元每百万 token) 仍展现了显著能力。

作者结论是不会切换主用模型,但 GLM-5.2 将永久留在工具箱中:因为它能力可观、价格低廉,且作为开源权重不会被随意下架(援引 Fable 被退役为提醒)。

HN 讨论焦点之一是一次性提示词作为基准测试的局限性。多位评论者质疑这种测试方式无法反映真实开发——真实场景大多是协作式的,需要测试可靠性(委派任务时是否会编造测试结果)和可控性(是否听从指令而非自行其是)。

许多开发者分享了对 GLM-5.2 的实际使用感受。一位在工作中无限额使用 Anthropic 模型、在家试用其他模型的开发者称 GLM-5.2 是非 GPT/Claude/Gemini 模型中的”重大跃升”,感觉相当于 4 个月前的 Opus 水平但价格只有五分之一,是开源权重模型的”刚刚好工作”时刻。也有评论者从单位成本能力的角度对比:GLM-5.2 接近 Opus 能力但定价接近 Haiku ($1/$5)。

但也有不同声音。一位开发者表示这些开源模型在与他协作时不如 Opus——他不一次性生成项目,而是像与同事工作那样使用 LLM,需要稳定的可控性和上下文理解,Anthropic 模型在这方面更出色。还有评论者指出测试公平性问题:Opus 使用 Claude Code,GLM-5.2 使用 OpenRouter 上的 Pi,而提示词驱动模型输出的方式很大程度上受 harness 影响。


5. OpenAI Codex 日志缺陷可能向本地 SSD 写入数 TB 数据

OpenAI 的 Codex 编码助手被发现存在严重的 SQLite 反馈日志问题。根据 GitHub issue 报告,该 bug 可能导致每年向本地 SSD 写入约 640 TB 数据,迅速消耗 SSD 寿命。问题源于 Codex 中未关闭的 trace/debug 级别日志记录,将大量数据持续写入本地 SQLite 数据库文件。

社区在 issue 中分享了临时缓解方案:通过在 SQLite 数据库上创建触发器来阻止日志插入。还有用户报告对该数据库运行 VACUUM FULL 后,文件从 27GB 缩减到仅 73MB,说明实际有效数据量远小于膨胀的存储占用。该问题已开放约一周,但官方长时间保持沉默。据评论指出,修复已合入主干,将随下一个版本发布。

HN 讨论氛围以批评为主。一位评论者反映 Codex 在 Mac 上仅是显示加载动画就会占用 100% GPU,issue 在 GitHub 上已存在近 6 个月,调侃这表明”全公司最有钱、最有能力的公司之一在 vibe coding 上能做到什么程度”。多位评论者将此现象解读为 OpenAI 工程文化和质量控制的反映:CEO 已声明聚焦编程工具,但产品却出现如此低级的事故。

一些评论者讨论了行业普遍模式的转变。有人指出这是”出货时未关闭 trace 级日志”这一经典失误,但讽刺的是过去这类问题的危害方式是应用变得极度缓慢、迫使开发者立刻修复,而现在则可能默默烧毁用户的硬件。也有评论者拿 Claude Code 比较,称后者会自动删除 30 天前的会话上下文和转录,是”略好一点”的设计缺陷。

技术之外,一些评论者注意到 Codex 与 Claude 等工具往往在仓库根目录污染 Claude.md、copilot.md 等文件,希望这些厂商能商定一个统一的 docs/llm/ 之类的目录结构。也有评论者对 PR 中明显的 AI 生成评论表达不满,认为不能假设贡献者真正做过研究。

由于 Codex 是开源的(与 Claude Code 不同),社区也指出可以自行修补缓解。整体讨论反映了开发者对 AI 工具厂商质量管控、问题响应速度以及生态规范化的不满。


6. 用感知哈希自动从照片库挖掘”意外立体动图”

作者写了一篇有趣的小博客,讲述如何用脚本自动从自己的 iCloud 照片库中提取”意外的 wigglegram”。wigglegram 是一种通过循环播放从略微不同角度拍摄的多帧图像来制造立体感的图像格式,通常以 GIF 形式呈现。

作者描述自己是优柔寡断的摄影师,遇到喜欢的角度会从略微不同位置连拍多张,加上有囤积习惯从不清空相册,因此手机里积攒了大量”同一场景、不同角度”的连拍。这与 wigglegram 的素材需求恰好吻合。他想到可以用感知哈希 (perceptual hashing)——TinEye 等反向图像搜索工具采用的技术——来寻找视觉相似的图像组。

实现思路是:对照片库中每张图片计算感知哈希,与加密哈希不同,感知哈希对视觉相似的图像会产生位差较小的哈希值。通过计算图像对之间的汉明距离并选取合适阈值(作者选择了 10),就能识别出连拍组。脚本随后将这些组合成 GIF 动图。

结果生成了数百张意外 wigglegram,作者展示了若干来自迪士尼乐园、Block Island、伦敦 Notting Hill、佩鲁贾以及若干动物(猫、狗、鸽子)的样本。许多由于拍摄间隔较长、水平对齐不完美,看起来与其说是立体的不如说像”小型无意电影”。脚本已在 GitHub 开源 (wiggle-wiggle),支持 Mac 用户的 iCloud 照片库或任意图片目录。

HN 讨论补充了 wigglegram 的技术背景与工艺细节。一位评论者介绍 wigglegram 的两种主流制作方式:第一种是同时多角度拍摄(如 1980 年代的 Nimslo 四镜头相机),第二种是基于单张图像用深度图合成新视角。还有人分享 Instagram 上有创作者用 4 个等间距的树莓派相机自制立体相机。一位开发者推介了自己写的 matplotlib 库 mpl_stereo,用于在数据可视化中制作 wigglegram 和立体图,认为”伪 3D 可视化作为理解数据的技术被严重低估”。

技术上最有价值的补充来自一位资深 wigglegram 创作者:除了拍摄外还有关键的”对齐”后期处理步骤,决定视差大小并显著影响 3D 质量。在文章前几张样本中,画面中相对静止的元素(如最正对镜头的烟盒、歌手的眼睛)就是对齐锚点。意外 wigglegram 因缺少这类对齐而效果较弱。

部分评论者反映持续晃动让他们产生眩晕感,建议将晃动效果绑定到鼠标移动。


7. “工作和软件糟透了”:一位前暴雪程序员的求职吐槽

一位有约 10 年工作经验、曾在暴雪工作 7 年的软件工程师发表博文,记录被裁员后六个月求职经历的挫败感。作者于 2025 年 6 月与团队一起被裁,此后参加多轮面试,几次进入最终阶段但都被其他候选人或内部转岗者超越;与他技能完全匹配的岗位中,相当一部分申请后石沉大海。

让作者最反感的是初步筛选环节,包括 Coderpad、HackerRank 及带 AI 监考的测试。他批评这些工具陷入悖论:作弊者用手机加 AI 工具就能绕过,遵守规则的候选人却被全屏锁定、无法查阅 API 文档或语言语法参考,反而处于不利地位。他将整个求职流程比作”公司在你面前撒满乐高积木,让你赤脚跳舞证明自己的价值”。

作者直言整个市场被 AI 大规模渗透并放大了原有的所有弊端:关键词驱动的简历筛选、堆积如山的繁文缛节、对资历较浅候选人提高门槛。他自认还是”幸运者”,至少能拿到面试机会,而应届毕业生面对的是公司彻底”撤掉梯子”,期待 Anthropic 让 junior 岗位完全消失的环境。文章以拒绝向 AI 编程让步、不放弃作为”奇怪的计算机迷”的乐趣作结。

HN 讨论极具张力。最受关注的评论来自一位在尝试 5 年多无法进入软件行业后转行做柴油机械师的人——他描述自己”扔掉学位、关掉 LinkedIn”,转行后工资可观、工作稳定、同事不再勾心斗角,公司还出钱送他读书。他形容”技术变得有趣了,我现在只是因为喜欢而写项目”,唯一的遗憾是没更早做这个决定。

也有评论者直接反驳作者的论调,认为将”使用 AI 工具”与”背叛做艺术、写作、测试的朋友们”混为一谈是夸张化的对立:“并非所有事情都必须成为文化战的前线”。

行业层面的分析也很多。一位评论者认为业界终将意识到,让 LLM 写代码很容易,但让 LLM 写出可投产的好代码是一项独立技能,本质上需要人类来完成;并指出游戏行业由于工具链(Unreal C++、Unity C#)大量依赖反射、视觉脚本和隐式状态,LLM 难以推理隐藏的隐式状态,因此游戏工程师反而不太可能被替代。还有评论者描述了荒诞的体验:在某大公司的初筛测试中不用 AI 也拿到 100/100,却仍收到自动化拒信,“用 AI 被淘汰,不用 AI 也被淘汰”。

整体讨论触及 10+ 年从业者对当下招聘流程、AI 渗透、初级岗位收缩、行业文化变化等多个交织痛点的集体焦虑。


8. Claude Code 的”扩展思考”输出并非模型真实推理

博主 Patrick McCanna 在检查 Claude Code 本地会话日志时发现,所谓的”thinking blocks”(思考块)并不包含可读文本,而是一个 600 字符长的 signature(签名)。查阅 Anthropic 官方文档后他确认:Claude 会将其推理过程加密成签名,密钥由 Anthropic 持有,用户本地机器无法解密;API 返回的只是推理的”摘要”,而非原始推理内容;获取完整思考输出需要企业级协议。

作者指出,文档措辞相当含糊,容易让人忽略”extended thinking 返回的是 Claude 完整思考过程的摘要”这一关键事实。他批评 Anthropic 在产品行为披露上的不透明:如果用户需要为其 agent 在某次会话中的逻辑产生审计记录,本地文件无法做到,即使通过抓取输入输出和动作进行拼凑,得到的也不是驱动 agent 行为的真实推理。他将摘要化的过程类比为”把 jpeg 存成 bmp 再编辑后当作 jpeg 呈现”——存在信息损失(评论指出此类比方向用反了,bmp 才是无损格式)。文章另引用密码学研究者 Matt Green 对签名块的更深入观察。

HN 评论分成几条主线。一类是对厂商动机的解读:多数评论认为 OpenAI、Google 等主要 AI 公司都隐藏真实推理链,目的是防止竞争对手用这些 chain-of-thought 数据训练模型,把推理过程视为护城河。另一类聚焦安全风险:有评论者表示不会使用隐藏推理的模型,因为攻击者可能通过 prompt injection 在隐藏的推理阶段调用函数、外泄数据,而摘要不会暴露这些行为;同时也无法判断模型是否在推理阶段陷入循环空耗 token。第三类质疑”思考链”本身的可解释性:引用 Anthropic 系统卡中关于”illegible reasoning”的章节以及苹果”思考的幻觉”论文,认为模型的 CoT 未必对应人类意义上的推理,DeepSeek R1 等模型也曾输出语义混乱却结论正确的思考轨迹。还有评论挖苦称 Opus 4.8 在 10 万到 20 万 token 后会”泄漏”自己的思考,使得隐藏努力近乎徒劳,并嘲讽”为自己付费的 token 却读不到”的处境。


9. 美联储前主席格林斯潘以 100 岁高龄去世

Alan Greenspan 于 6 月 22 日去世,享年 100 岁。他担任美联储主席超过 18 年,被视为现代史上最具影响力的中央银行家。讣告指出,他的任期既助推了美国近二十年的经济繁荣,但其决策也被认为是 2008 年金融危机近乎崩盘的重要诱因之一。

HN 评论围绕格林斯潘留下的复杂遗产展开多角度讨论。一条主线关注他与金本位的关系:早年格林斯潘曾撰文支持金本位,认为金本位约束政府无限制扩张信贷,能维系负责任的财政和更平等的世界;但他在美联储任内推行了长期低利率政策(LIRP)和被称为”格林斯潘 Put”的市场托底操作,与他早期主张形成明显反差,多位评论者表达困惑。

另一条主线是他与 Ayn Rand 客观主义圈子的渊源。格林斯潘曾是 Rand 内圈成员,年轻时参与阅读《阿特拉斯耸耸肩》的草稿,与 Rand 保持长期友谊。但客观主义者后来不认可他在美联储的工作;2008 年金融危机后,格林斯潘公开承认自己”震惊地发现”银行并不像他所设想的那样进行理性自利的决策。

评论中也有对他个人风格和影响力的回忆。有人提到德州参议员 Phil Gramm 每次都在银行委员会听证会上问格林斯潘”理想的资本利得税率是多少”,格林斯潘从不犹豫地回答”零”,立场鲜明。另有评论者回忆 1990 年代在中学时通过追踪格林斯潘的言论学习金融、利率与政府政治如何相互交织。还有评论提到金本位拥护者长期关注的金交换(gold swaps)披露事件,使得对 Fort Knox 黄金归属权的疑问悬而未决。多人推荐重温 2010 年纪录片《Inside Job》,并指出格林斯潘是少数被普通美国民众普遍知晓姓名的美联储主席。


10. 墨西哥政府发布国产超低价电动车原型 Olinia Uno

墨西哥总统 Claudia Sheinbaum 在墨西哥城附近的空军基地机库内驾驶名为 Olinia Uno 的原型电动车登台亮相。该车为六座设计,单次充电续航约 125 公里(77 英里),最高时速 50 公里,定位为城市代步车,可使用家用普通电源插座(类似微波炉或冰箱插头)充电。预计明年夏天上市,售价约 15 万墨西哥比索(约 8500 美元)。

Olinia 项目隶属于 Sheinbaum 的 Plan México——一项为期六年的经济与制造业振兴计划,目标是将墨西哥推入全球十大经济体并将其在全球汽车等供应链中的角色扩大 15%。车内有放置轮椅的空间。当前国产化率约 50%,目标到 2030 年提升至 75%。Olinia 项目主管 Roberto Capuano Tripp 表示,计划在墨西哥城、墨西哥州和普埃布拉部署 2000 个充电桩。

文章对比指出,中国电动车企业在充电速度和续航上接连突破,已在墨西哥销售并向加拿大渗透,而美国在去年取消联邦电动车补贴并对中国电动车征收 100% 关税。福特 CEO Jim Farley 公开呼吁阻止中国车经由加拿大进入美国,美国国会也在推动《Protecting America from Chinese Cars Act》。

HN 评论呈现几条主要观点。第一类讨论本土汽车业保护逻辑,列出四种应对廉价进口的可能路径:说服消费者为本土产品多付钱、加征关税、补贴本国生产、提升本国产品力,认为目前差距太大需要短期补贴过渡。第二类质疑 Olinia 是否适合美国市场——77 英里续航远低于美国买家对长途出行的需求,但多位评论者指出这本来就是”为墨西哥设计、为墨西哥使用”的城市车,与美国市场无关。第三类关注配套基础设施,认为墨西哥高速公路上快充桩稀缺,短续航定位与现实匹配。也有评论对项目能否量产持怀疑态度,担心安全法规、内饰质量、廉价部件与舒适性之间的平衡,并将其形容为”民粹政府的另一项目”。


11. Sakana 推出 Fugu:以单一 API 形式交付的多智能体系统

日本 AI 实验室 Sakana AI 发布 Sakana Fugu,自称是”以一个模型形式交付的多智能体系统”。其核心思路是通过动态编排多家供应商的强大模型池来完成复杂的多步任务,避免对单一厂商的依赖。Fugu 不靠人工定义的团队组织、角色或工作流,而是学习自动从模型池中组建 agent,并通过非显而易见但高效的协作模式协调它们。

技术基础来自两篇被 ICLR 2026 收录的论文:TRINITY 使用轻量级进化型协调器为模型分配 Thinker、Worker、Verifier 角色,跨编码、数学、推理、知识任务自适应分派工作;Conductor 通过强化学习自行发现自然语言协调策略,设计 agent 间通信模式和聚焦的提示词。产品分为 Fugu 与 Fugu Ultra 两档,提供 OpenAI 兼容 API,用户可将特定模型或厂商剔出池外以满足数据、隐私、合规要求。目前因 GDPR 等监管原因不在欧盟/EEA 提供。

HN 上的反应总体偏冷淡。一类调侃订阅成本叠加问题——已经向 Anthropic、OpenAI、Cursor、Google 各付 200 美元后再向 Sakana 付 200 美元做协调,戏称还可以再付他 200。一位评论者既肯定了创始人 David Ha 作为前高盛最年轻董事总经理之一、Google ML 资深人士的背景与驱动力,也直言不讳地批评这款产品本身似乎欠缺打磨,并提及 Sakana 在招聘方式上的争议。技术层面有评论指出技术报告中协调器带来的提升并不显著,有时甚至低于池中单一模型,可能更像是把规划/元推理步骤前置;同时该系统训练数据来自 Claude Code 等的输出,使其面临被前沿实验室自身改进 harness 一举淘汰的风险。

实测反馈较为统一:来自美国境外的开发者抱怨 200 美元/月每周仅约 3 小时使用、API 慢、输出质量远不及 Claude;另一位 Beta 用户认为 5 小时使用限额很快用完,速度慢且未发现比 Claude 更强的代码缺陷捕捉能力。也有评论者长期关注 David Ha(如早期的 World Models 论文),对团队保持期待,并推荐一档新近发布的深度访谈,称 Ha 认为这类路由型模型最终会胜过单体前沿模型。


12. Flock 车牌识别系统被警察滥用跟踪前任,凸显事前审批的缺位

IPVM 报道指出,尽管 Flock 公司声称其系统”追踪车辆,不追踪人”,但已有大量警察利用 Flock 自动车牌识别(LPR)网络跟踪前任伴侣或情敌的案例。最新一例是伊利诺伊州 Holiday Hills 警察局长(同时在 Prairie Grove 警局兼职)于 2026 年 6 月 18 日被捕,被控两项 Class 3 重罪级别的失职罪。检察官指控他借助 Prairie Grove 的 Flock 系统和伊利诺伊州警察 LEADS 数据库追踪六名认识的人,其中三名是与他有过恋爱关系的女性,他还在数月内对其中一人的前男友查询车牌 140 次(保护令申请书称 178 次,其中 86 次系下班期间)。滥用行为持续 18 个月,最终在 2026 年 6 月才被以刑事令逮捕。

IPVM 援引非营利法律机构 Institute for Justice 的统计,截至 2026 年中期,警方利用 LPR 跟踪恋爱对象的案件至少有 18 起,且这一数字”几乎肯定被低估”。文章列举多起类似案例:佐治亚州 Braselton 警长被 GBI 审计日志发现后被捕;爱达荷州 Jerome 县警长在三个月内查询妻子车牌 700 余次,每次都标注为”test”后退休;堪萨斯州 Sedgwick 警长查询前女友车牌 164 次、查询其新男友 64 次后辞职;密尔沃基一名警官查询超过 100 次,被行政休假后仍继续访问 Flock 寻找情人。

Flock 首席法务官 Dan Haley 在缅因州一档广播节目中坦承”用来查前女友之类的事,实际上是最常见的滥用形式”——与公司”罕见”的官方定性自相矛盾。IPVM 指出,警察局长正是制定规则、监督执行的人,他们的滥用说明仅靠内部培训或纪律政策不足以约束。文章强调 ACLU、EFF、IJ 等组织并未反对 LPR 本身,而是主张事前的令状审批;现行的紧急情况例外已能覆盖真正的迫在眉睫之险。

HN 评论几乎一致谴责。有人联想到《黑衣人》中 K 通过监控偷看前任的桥段,指出现实中此类系统的滥用空间巨大。多位评论者建议公众通过 FOIA 申请、向当地 ACLU 章节举报来推动取缔。有评论提出反讽性问题:如果私人在公共道路边架设摄像头扫描车牌和人脸、对接数据中介后公开播报路人行踪是否违法,若违法那为何 Flock 可以这么做。也有人指出当被 FOIA 请求时,州政府直接将 Flock 数据从公开范围中豁免,凸显问责难度。


13. 慕尼黑 1991:当前 AI 浪潮的源头

Sakana AI 的 David Ha 与 IDSIA/KAUST 的 Jürgen Schmidhuber 联合撰文,回顾当前万亿美元规模 AI 产业的根基。文章主张今天的核心构件几乎都在 1991 年于慕尼黑工业大学 Schmidhuber 实验室的短短数月内完成。具体时间线包括:1991 年 3 月 26 日发表第一种 Transformer 变体(现称”unnormalized linear Transformer”,对应 ChatGPT 的”T”),其计算成本随输入长度线性而非平方增长;4 月 30 日同日提出深度神经网络的无监督预训练(对应 ChatGPT 的”P”)以及神经网络蒸馏(DeepSeek 等大模型的核心技术之一);6 月 15 日提出带残差连接的深度残差学习,由 Sepp Hochreiter 的硕士论文工作奠基,成为 LSTM 与 ResNet 的核心组件——两者分别是 20 世纪和 21 世纪被引用最多的 AI 论文。文中还提及该实验室同期为生成对抗网络奠定了早期基础。

文章在 HN 上引发了关于 AI 史归属与个人功劳分配的激烈讨论。一类反驳意见认为当前 AI 浪潮真正的起点是 NVIDIA GPU 与 2012 年的 AlexNet(在两块 GTX 580 上训练 ImageNet)所点燃的实用化路径,CUDA 与 cuDNN 之后才陆续到位;ResNet 的残差连接、Adam、ReLU、归一化、dropout 等都是 2012 年后 ImageNet 竞争中的发明。批评者认为 Schmidhuber 不断声索优先权的姿态反而损害了他自身的学术声誉。也有评论专门区分:LSTM(Hochreiter & Schmidhuber 1997)的优先权无可置疑且引用扎实,但对 Transformer attention 优先权的主张则远没那么稳固,将两者混在一起反而削弱说服力。

另一条主线讨论学术研究的长期价值。有评论指出 HN 上常有声音贬低学术界、推崇 SpaceX、Moderna、OpenAI 等私营实验室,但 1991 年这些研究在当时也”毫无用处”——除非拥有超算和巨额资金,没人能用它们做出实际产品;30 年后整个产业都站在这些”无用研究”的肩上。也有评论中肯地指出,Schmidhuber 论文中确实可以找到许多想法的雏形,值得通读以寻找尚未爆发的方向(如人工好奇心)。还有人指出抽象的架构设想与经过真实数据验证、规模化训练之间相隔 20 年和无数后续工作,价值不能简单等同。一条来自欧洲读者的评论感慨:即便概念诞生于慕尼黑,万亿美元的产业利润却未在欧洲产生,凸显欧洲在留住和保护本土技术方面的乏力。


14. 加拿大计划 15 年内新建至多 10 座核反应堆

加拿大能源与自然资源部长 Tim Hodgson 公布新的国家核能战略,称之为”民用核能复兴”计划:未来 15 年新建多达 10 座核反应堆,配合到 2050 年将国家电网容量翻番的目标。其中两座大型反应堆计划于 2035 年前开工,另外五座到 2040 年前进入规划或开发阶段,至少有一座在 2035 年前于安大略以外开建。同时计划在 2035 年前完成加拿大造微型反应堆设计、于 2030 年代末部署到偏远社区。官员透露建设成本可能超过 1000 亿加元,资金来源可能涉及加拿大基础设施银行和 Canada Growth Fund,但战略本身并未明确融资方案。

加拿大目前有四座核电站(安大略三座、新不伦瑞克一座),核电占全国电力约 15%。Darlington 现有核电站旁的小型模块化反应堆(SMR)项目将成为 G7 首个 SMR,单机容量达 300 兆瓦;萨斯喀彻温省也在评估到 2030 年代中期上线 SMR;阿尔伯塔省与渥太华联邦政府的能源协议也包含合作发展核电的内容。战略还推动 CANDU 反应堆出口至更多国家,目标到 2040 年打入至少四个新市场,并将核能合作视为加拿大外交政策中”持久的地缘政治和商业关系”杠杆——目前 CANDU 在韩国、中国、印度、阿根廷、巴基斯坦、罗马尼亚等地共有 30 座运行。文中提及总理 Mark Carney 因伦理屏障未参与战略制定,因为其在 Brookfield 持有的资产与 CANDU 的竞争对手存在利益冲突。保守党领袖 Pierre Poilievre 公开质疑该计划”宣布无法建成任何东西”。

HN 评论以支持为主,但夹杂对执行力的怀疑。乐观一方列举加拿大的优势:全球最大铀储量之一、成熟可靠的 CANDU 设计、Darlington 已有的建设与翻新经验,以及安大略在大规模光伏和风电后对基荷电源的现实需求。也有评论希望加拿大能造足够多反应堆向美国供电。但对落地能力的怀疑同样强烈:一条评论指出安大略政府在大型基础设施项目上长期超支拖延(如 Eglinton Crosstown 轻轨),公私合营模式更像是给承包商和咨询公司输血;福特政府上台后立即支付了数亿罚款取消风电项目并退出与加州、魁北克的碳交易协议,让评论者怀疑核电计划同样会变成”空白支票拖延数十年”。也有评论建议直接将工程外包给韩国以保进度和预算。另有评论关注微型反应堆技术,认为不必都做 Darlington 规模,分散所有权和管理、设定类似银行 10–20 倍杠杆上限以保证负责任运营是更稳健路径,并表达对在北方建设新城的展望。还有评论希望此举能”刺激澳大利亚行动起来”。


15. Oak:一款面向 AI 代理的 Git 替代品引发争议

Oak 是一个新发布的版本控制系统,定位为”为 AI 代理设计的 Git 替代品”。其核心特性包括:通过 oak mount 实现的惰性挂载工作树(无需完整克隆即可访问仓库内容)、面向多仓库代理工作的”space”概念、以及为代理交互优化的 JSON 输出格式。开发者 Zach(zdgeier,曾打造被收购的 Jamhub VCS)将其定位为”代理原生底座”(agentic substrate),声称在性能和 token 消耗上优于 Git。

从项目自身的合并记录可以看到,Oak 主要由 AI 代理编写,包含大量针对代理工作流的精细化改造,如 finish preflight saga、agent-state 推荐动作枚举、读写边界硬化、控制字符校验等安全加固。项目还包含 LLM 友好的 AGENTS.md 规范文档,明确要求代理提交可审查分支而非留下本地检查点。

HN 讨论高度分化。最尖锐的质疑来自训练数据视角:模型对 Git 的熟悉度建立在海量训练语料上,任何”为代理设计”的新工具都必须先通过文档让模型学会使用,起跑线就落后于 Git。批评者认为 Oak 的产品定位含糊——速度优势并非代理瓶颈,token 节省也未与 Git porcelain 模式做对比,没有给出足够强的迁移理由。多名评论者直指核心矛盾:是否是 AI 代理说服作者另起炉灶,而非在 Git 之上构建。

也有正面声音。惰性挂载机制被认为类似 Google 内部 google3 的实现,开源世界少有可比对象,最接近的是微软的 VFS for Git,这一方向有独立价值。有评论者认为作者低估了自己的工程履历,前作 Jamhub 已被知名创始人收购。但更多人持观望态度,希望 Oak 解决 Git 真正的痛点,例如仓库内细粒度的私有/公开混合、环境变量管理等当前 Git 生态的薄弱环节,而不仅仅是为代理换皮。整体而言,社区对”为 AI 代理重造工具链”这一叙事保持警惕,认为需要更扎实的差异化论证。


16. Moebius:0.2B 参数图像修复模型对标 10B 工业级模型

华中科技大学与 vivo AI Lab 联合发布的 Moebius 是一个轻量级图像修复(inpainting)框架,参数量仅 0.22B(约 2.26 亿),不到 FLUX.1-Fill-Dev(11.9B)的 2%,但在六个基准测试(涵盖自然场景 Places2 与人像场景 CelebA-HQ、FFHQ)上声称达到甚至超越 10B 级模型的生成质量,单步推理延迟 26.01 毫秒,整体推理速度提升超 15 倍。

技术上,Moebius 基于潜空间扩散模型框架,核心创新是 Local-λ Mix Interaction(LλMI)模块,将空间上下文和全局语义先验压缩到固定大小的线性矩阵中,重构 self-attention 和 cross-attention,绕过二次方计算开销。同时引入自适应多粒度蒸馏策略,从同团队的 PixelHacker(教师模型)严格在潜空间内迁移表征能力,通过梯度范数自适应损失权重机制动态平衡训练。

HN 社区反应积极但理性。Simon Willison 已将模型通过 ONNX 跑通并发布了浏览器内交互演示(约 1.3GB 下载),由 Claude Opus 4.8 协助移植。实测反馈显示,作为 0.2B 模型表现确实出色,但与 10B 模型相比仍有可察觉差距:修复区域比周围更平滑、对新颖物体处理较差、输出限制在 512x512 分辨率,实用性受限。有评论者细究论文展示图,指出对竞品的”结构混乱”评判标准并未一致应用到 Moebius 自身的样例上(如冲浪板背面被拉长、房屋后方背景异常)。

一位曾承接横幅广告修复项目的开发者分享了 Stable Diffusion 时代的有趣经历——模型会自发添加”诡异老人”等不存在的元素。多人询问当前 SOTA 修复模型,并希望出现针对漫画翻译的轻量修复工具替代多年前的 LaMa。也有人对论文中”打破不可能三角”等带有营销色彩的标语在严肃学术工作中出现表示困惑。整体而言,该工作被视为”实用 AI”的代表方向,参数效率与质量平衡的工程价值受到肯定。


17. 近半数 LG 智能电视应用内嵌住宅代理 SDK 出售用户 IP

威胁情报公司 Spur 对 LG webOS 和三星 Tizen 平台共 6038 个应用进行扫描,发现 2058 个内嵌住宅代理(residential proxy)SDK,比例接近三分之一,其中 LG 平台占比尤高。这些 SDK 来自 Bright Data、Massive、Honeygain/Oxylabs 等供应商,将用户家庭网络的 IP 地址打包售卖给第三方使用。涉及的应用多为鱼缸屏保、时钟、纸牌、小狗视频等”安静型”工具——这类应用插入广告会破坏体验,转而通过出售网络连接获利。

智能电视成为理想代理宿主的原因清晰:与手机不同,电视没有电量消耗、流量账单或后台进程提醒,常年通电联网且被视作家具而非计算机。同意机制也被弱化:遥控器操作的一次性弹窗容易混入初始设置流程,而代理 SDK 会在应用关闭后持续运行。Tizen 上的 Pac-Man 甚至将代理明示为”无广告”替代方案——拒绝则看广告,接受则贡献网络连接用于”网页索引”。

更值得警惕的是发行商身份。Bright Data 及其关联实体作为发行商出现在 367 个代理标记应用中,Honeygain UAB(Oxylabs 子公司)出现在 16 个,意味着这些应用本身就是代理公司投放的”代理库存”——薄壳游戏和工具就是 SDK 的载体。

平台政策存在明显分野。亚马逊在《设备与系统滥用政策》中明确禁止此类行为,Roku 据报道也屏蔽了 Bright SDK,相关应用在沟通后被下架;LG 和三星至今未划出对应红线。安全风险也不止于公网 IP 借用——TV 处于家庭内网中,若代理供应商的私有地址过滤策略失效或被滥用,可成为攻击者进入路由器管理面板、NAS、摄像头、开发机的跳板。文章援引 2026 年 1 月 KrebsOnSecurity 报道的 Kimwolf 僵尸网络,已实际利用住宅代理隧道渗透目标局域网。

HN 讨论激烈。主流建议是绝不将智能电视连接互联网,或将其隔离到防火墙后的 VLAN,配合二手商用迷你工作站和 LibreELEC/Kodi 自建播放方案。多名评论者指出”免费应用必须靠某种方式变现”是结构性问题,但代理 SDK 这种隐蔽手段缺乏真正的知情同意。也有人讨论这与 LLM 训练数据爬取的关联,并呼吁立法禁止此类商业模式。


18. 雪佛龙与微软签订 20 年供电协议 为西德州数据中心配套燃气发电

雪佛龙公司宣布其全资子公司 Energy Forge One 与微软签署 20 年购电协议,将在西德州开发一座代号 Project Kilby 的并址发电设施,专供微软运营的数据中心。该项目与 Engine No.1 合作开发,规划装机容量约 2.67 吉瓦,采用模块化分阶段建设,主力由 GE Vernova 的大型燃气轮机(7HA 机型)提供,辅以卡特彼勒子公司 Solar Turbines 的设备,定位为美国最大的”燃气发电+数据中心”并址项目之一。最终投资决定预计在 2026 年底作出,首批电力 2028 年交付。项目宣称带来超过 100 亿美元州县税收和近 2000 个岗位,使用非饮用咸水替代淡水,配备选择性催化还原(SCR)等排放控制技术。

HN 讨论最具洞见的一条来自熟悉二叠纪盆地油气经济的从业者:当前西德州 WaHa 枢纽的天然气价格为负,几个月前低至 -9 美元/MCF,意味着气体生产商需倒贴让人接走。原因是产油必然伴生大量天然气(约 4-5 MCF/桶油),而外输管道容量长期不足,新管建成数月即被填满。这一供需结构对油气公司和微软是双赢——前者减少弃气损失,后者锁定低价长期合约(推测 1-2 美元/MCF)。

但更多评论质疑选择燃气而非可再生能源的逻辑。德州电网(ERCOT)目前几乎所有新增装机都来自太阳能、风电和储能,由独立投资者按市场盈利逻辑决策;考虑到燃气轮机制造产能紧张,这一选择值得玩味。微软曾承诺 2030 年实现碳负排,新增吉瓦级化石燃料发电与之直接矛盾,被多次质疑。“Solar Turbines”这家公司名也被批评具有误导性——其实际产品是中型工业燃气轮机,与太阳能无关。

广泛的负面评论将该协议视为微软 AI 资本开支与化石燃料行业的合谋,并对环境后果表达担忧。也有务实派指出 20 年 PPA 锁定 capex 确定性”如果 AI 需求成立则明智,否则代价高昂”。还有人提出反向建议:与其在二叠纪建燃气电厂,不如直接将数据中心建在巴肯页岩区,利用长期燃烧浪费的伴生气热能。Google 与 TotalEnergies 已在签署光伏 PPA,凸显微软与友商在能源策略上的分歧。


19. NSF 大幅削减传统科研项目 为 15 亿美元 X-Labs 新计划腾出资金

《Science》独家披露,美国国家科学基金会(NSF)正将本财年数百个传统基础科学项目预算削减 20%-30%,远超其整体预算 3% 的降幅。一份 6 月 18 日的内部备忘录显示,数学与物理科学局下属某单位预算从 FY2025 的约 2.6 亿美元被砍 30%,并要求项目官员暂停推荐任何资助提案——即便是评审最高分的项目——甚至撤回排队中的资助建议。备忘录强调”高度机密,不得向 PI(首席研究员)透露”。

消息源指出,被削减的资金被用于支持 5 月宣布的 15 亿美元 X-Labs 新计划:选出约半打”X-Labs”团队,每家 6 年内最多获 3 亿美元资助。生物学局被砍 2 亿美元(从约 8 亿降至 6 亿),社会、行为与经济科学局被整建制”解散”释放 1.5 亿美元,本财年仅发出极少数资助。NSF 截至 6 月 15 日的新资助数量仅为 FY2025 同期的八分之一。

X-Labs 由 NSF 最新设立的”技术、创新与合作”局(TIP)管理,原计划在特朗普 FY2027 预算中获得 5000 万美元小额启动,现被大幅提前并扩容。资助采用罕见的”其他交易授权”(Other Transaction Authority)机制,可绕过常规评审、向有限合伙、风投基金等非传统机构发放——甚至包括为接受资助而新设的实体,并可在不审查新申请的情况下追加。首批方向聚焦 AI 驱动的传感成像、量子系统与光子学,与特朗普政府优先事项一致。

该操作可能违反国会在 FY2026 拨款法案中的明确指令:“任何 NSF 局相对 FY2024 水平的削减不得超过 5%。”

HN 反应以严厉批评为主。多名评论者引用 Vannevar Bush 1945 年《科学:无尽的前沿》报告,强调依赖他国基础科研的国家在工业进步和贸易竞争上将处于弱势。批评核心包括:用产业转化名义抽空基础研究的供血、绕过同行评审的资金流向存在明显寻租空间(“专为接受 NSF 资助而设立的有限合伙”被认为是赤裸的腐败漏洞)、特朗普政府已在 NIH 和 NSF 安插政治任命人员对资助有最终决定权、学术训练管道一旦崩溃需要数十年重建。也有评论者将矛头指向预算管理办公室主任 Russell Vought 等 Project 2025 推手,认为其影响力超过更知名的政治人物。少数声音对学术界改革的必要性表示同意,但认为当前手段是短视报复而非建设性改革。


20. Show HN:因厌倦广告自建逻辑谜题站点 Puzzle Lair

开发者因不满主流谜题网站充斥广告,自建了 Puzzle Lair——一个免费、无广告的逻辑谜题站点,每日更新。支持的谜题类型包括数独(Sudoku)、杀手数独(Killer Sudoku)、计算数独(Calcudoku)、Kakuro、Ripple Effect、Nonograms 等 10 种。设计采用复古报纸排版风格(Daily logic edition、No.173 等版式元素),每天主推一种谜题。商业模式为:游戏免费,若用户喜爱某种谜题类型,可一次性付费永久解锁该类型完整目录。

HN 讨论既有同好分享也有批评。最受推荐的同类资源是 Simon Tatham 经典的开源谜题集(含 Dominosa 等冷门类型),以及面向 TUI 的 PuzzleTea、漫画图像化 Nonogram 站点 Nonoverse。也有开发者出于类似动机自建无广告版的轮盘、二十一点、百家乐站点。

批评意见集中在几方面。一是设计风格疑似 AI 生成痕迹明显:评论者指出 Claude 大约会生成 20-30 种强主题网站模板,这种”报纸美学”是其中之一,最近出现的 vibe-coded 站点视觉趋同。原始开发者也曾用过这套风格但后来重设计避免雷同。二是谜题质量问题:有用户指出某些 Nonogram 是完美对称的菱形,难度梯度形同虚设(“中等难度是菱形,困难难度只是更大的菱形”),不像人类设计师的作品。三是规则解释不足:用户在数独中遭遇”X 数独”变体(对角线也需 1-9 不重复)却未在页面说明,导致按标准数独规则放置数字被判错。四是 UX 改进建议:Ripple Effect 的 URL 仅捕获尝试记录而非具体谜题,无法分享特定题目;Star Battle 部分谜题解非唯一却仍判错;深色模式需要注册账号;某些谜题完成时间无法做成类 Wordle 的可分享格式。

对运营可持续性也有质疑——账号系统、服务器成本、未来如何保持无广告。开发者整体收获了善意的产品反馈而非纯粹的赞美,社区表现出对独立无广告项目的支持但对质量保持要求。