HN 每日深度阅读 · 2026-05-28
本期关注AI正在重塑沟通、商业与社会信任的多重裂痕:人们厌倦了同事老板用ChatGPT截图代答,企业则按API原价为Claude与Codex买单,标志大模型已找到付费场景;与此同时CEO群体陷入"AI精神错乱",以裁员换效率却脱离一线现实。
共 20 篇 · 约 13,456 字 · 约 34 分钟读完
1. 厌倦了和 AI 对话:当人们开始用 ChatGPT 截图代替回答
- 原文: https://orchidfiles.com/im-tired-of-ai-generated-answers/
- HN: https://news.ycombinator.com/item?id=48292224
- 得分: 1819
- 评论: 887
作者在博客中记录了几段令其沮丧的经历:他在 GitHub 上举报恶意软件仓库时,连续收到两位用户用同一段 AI 生成文本作为回复;在公司里向老板提出业务问题,得到的回答是一张 ChatGPT 截图,指出内容完全错误后,老板又转发了第二张截图,显然连看都没看;在 Reddit 上与陌生人互动几轮后,才意识到对方其实是个 AI agent。结论是:他想和真人交流,但即便面对真人,对方也会把问题转交给 AI 并把答案原样转回。
HN 讨论区共鸣强烈。最高赞评论指出,这种”把问题转给 AI 回答”的行为像是成年人遇到问题就喊妈妈代答,让人感觉对方不再是一个自足的交流主体。另一位用户分享了被同事用生成式 AI 在 Slack 上”反驳”的经历:对方文风骤变、明显是机器生成的敷衍否定,最终导致团队信任崩塌,所有会议都必须录音和转写,工作几乎停摆。还有开发者描述自家老板用 Gemini “调研”功能并把对话粘进 wiki 作为需求文档,结果库和方案早被 AI 预设,反而妨碍后续实施,并衍生出”为什么计划都有了你还没做完”的质问。
不少评论从更宏观角度反思:2025 年西班牙葡萄牙大停电期间,手机断网后人们涌入公园社交,呈现出久违的”在场感”;有人在欧洲坐火车旅行也有类似体验。一位有五个 Gen-Z 子女的技术老兵表示,年轻一代正在对生成式 AI 反弹,他自己也开始减少 Claude 用量,从”为用而用”转向只在真正必要时使用。也有人主张应当对那种把所有思考都外包给 chatbot 的行为公开”羞辱”以形成社会压力。整体气氛是:工具本身不是问题,但人们用它替代而非辅助思考时,沟通的真实性正在被侵蚀。
2. Simon Willison:Anthropic 和 OpenAI 已经找到 PMF,企业按 API 价格付费
Simon Willison 撰文论证 Anthropic 与 OpenAI 已经找到产品市场匹配点,关键证据是企业定价策略的转变。他指出 Anthropic 在 2025 年 11 月悄然把 Enterprise 计划改为 20 美元/席位/月 + API 用量计费,OpenAI 也在 2026 年 4 月把 Codex 定价从 per-message 改为按 API token 计算,并把存量 Enterprise 客户一并迁移。换言之,过去对企业的大幅折扣消失,企业现在按 API 标价付费。
他用 ccusage 工具估算自己 30 天内的 token 消耗:Claude Code 约 $1,199,Codex 约 $980,合计超过 $2,180 的 token 价值,而他只付了 $200 订阅费。他推断那些重度使用 agent 的企业账单远比这庞大。结合 GPT-5.5 较 GPT-5.4 涨价 2 倍、Opus 4.7 涨价约 1.4 倍,以及两家 IPO 在即,他认为编码 agent 是真正的 PMF 突破口:ChatGPT 虽有 9 亿周活但只有 5.6% 付费,单价 $10-20/月难以覆盖万亿基础设施投入;而编码 agent 面向高薪知识工作者,单用户每月可烧数百到上千美元。两家公司目前 27%-33% 的招聘职位都集中在企业销售支持,进一步印证了路线选择。
HN 讨论分歧明显。最高赞评论从总账角度算账:若要在 5 年内消化 $5-10 万亿硬件投入,需要每年 $1 万亿 token 消费,相当于全球每个知识工作者拿出 5%、开发者拿出 20% 工资买 token——目前 20%-40% 的效率提升不足以支撑这种支出。也有人质疑 Anthropic 的”盈利”只是折扣到期带来的短暂账面效应,引用 Ed Zitron 的分析认为提价幅度不够、个人用户难以接受持续上涨。还有评论指出 GLM-5.1 等开源模型已经在 Cerebras 等推理平台上达到类似效果且便宜得多,一旦企业意识到这点,闭源模型的护城河存疑。也有人批评作者把 “token 价值” 当作客观计价单位,本身就是在替卖方话术背书。
3. 私募股权如何买下美国的基础公共服务
文章以 2025 年 6 月芝加哥一起公寓纵火案为切入点:消防云梯车在现场无法升起,重启耗时约一分钟,最终四人遇难,包括一名孕妇和她的孩子。家属是从记者口中才得知设备故障的。作者由此追溯到背后的私募股权(PE)行业——这一管理 9.4 万亿美元资产、控制约 11,500 家美国公司、雇佣 1,100 万人的产业。
PE 的标准玩法是杠杆收购:50%-90% 的收购款以债务形式压在被收购公司账上,再以 2% 管理费 + 20% carried interest(按资本利得而非普通收入征税)获利。参议院联合经济委员会 2024 年 7 月的报告将其概括为”买入、剥离、转售”模式,PE 收购的上市公司破产概率约为对照组的 10 倍。
消防车行业被作为典型案例展开。20 年前美国有 20 多家独立制造商,如今 REV Group、Pierce、Rosenbauer 三家控制约 80% 市场,其中 REV Group 由 American Industrial Partners 持有,通过收购 E-One、Ferrara、KME 等品牌完成整合。结果是订单积压达 45 亿美元、定制消防车交付周期长达 4 年、价格 10 年翻倍(云梯车超 200 万美元)、行业利润率从 4-5% 升至 13% 以上。REV Group CEO 在投资者电话会议中明确把积压订单形容为”由市政税收支撑的优质资产”。同时该公司关闭了宾州和弗吉尼亚的多个工厂,却花费 5.3 亿美元用于股票回购和分红,包括 IPO 前向 PE 股东支付的 1.8 亿美元特别股息。参议员 Josh Hawley 在 2025 年 9 月听证会上将其直接定性为”抢劫”。同样的剧本在救护车(KKR 旗下 Envision、GMR)等行业上演。
HN 讨论延伸到结构性根源。最高赞评论指出讽刺之处:PE 之所以存在,很大程度是因为养老金需要 7% 回报率才能维持账面偿付能力,PE 把高回报输送给养老金体系,本质是把当代生活质量转移给退休群体。有人引用罗马时代 Crassus 私人消防队趁火打劫低价收购房产的典故作比。多位 PE 内部从业者现身说法,称自己公司 10 年换了 5 任 PE 老板,所谓”价值创造”基本是为下一轮转售做表面装饰。另有评论呼吁回到 1980 年代之前的反垄断政策,也有人质疑为何 LBO 这种”用被收购公司的钱买它自己”的结构在法律上被允许。
4. 谷歌力推 AI 模式后,DuckDuckGo 访问量上涨 28%
PC Gamer 报道,在谷歌高调宣称用户喜爱 AI Mode 后的一周内,DuckDuckGo 的无 AI 搜索页 noai.duckduckgo.com(5 月 20 日至 25 日)周环比平均增长 22.7%,5 月 24 日峰值达 27.7%;DuckDuckGo 移动 App 美国安装量平均环比增长 18.1%,TechCrunch 称连续 6 天保持增长,5 月 25 日达到 30.5%。iOS 安装量的周环比平均增长 33%,峰值 69.9%。
HN 讨论的主基调是冷静看待这一数字。最高赞评论提醒,谷歌占据约 90% 全球搜索份额,DuckDuckGo 不到 1%,30% 的增幅折算到全网仅约 0.3%,对谷歌而言是统计噪声;而且过去一年里多个 AI 搜索引擎在体量上早已多次超越 DDG。也有评论批评原报道只给相对数字、不给绝对基数,属于”懒惰报道”。
但另一些评论提供了人群层面的观察:一些原本毫不关心科技的朋友因为反感 AI 被强推而开始主动寻找替代品、下载 DDG;小型搜索/工具站点作者反馈自己最近一周查询量增长近 10 倍,显示存在一股可观察的”逃离潮”。对 Google AI Mode 本身评价两极:有用户称地址栏直接得到答案的速度体验比登录 ChatGPT/Claude 更快、很喜欢;也有人详细吐槽其 UI 设计——头部和输入栏过大、回答区域过窄、字号偏大、渲染笨拙、隐藏模型选择等,称其有”AI 界的 Yahoo”之感,反映出谷歌一贯在产品 UX 上的弱势。还有人指出 DDG 本质上是 Bing 的代理,不算真正的差异化选择,而 Perplexity 在产品层面才与谷歌真正不同。整体共识是:这次波动象征意义大于实际威胁,但确实是用户开始用脚投票的早期信号。
5. Box 创始人 Aaron Levie:科技 CEO 们正陷入”AI 精神错乱”
TechCrunch 报道 Box 创始人 Aaron Levie 在 X 上的观点:CEO 群体特别容易陷入”AI psychosis”,因为他们距离最后一公里的实际工作太远——他们玩玩 AI、生成一个原型或一份合同,就跃迁到”agent 可以包办整个工作”的结论;但真正负责审 code、抓 bug、识别幻觉库引用、训练模型理解公司特定合同条款的,并不是他们。Levie 本人是 AI 乐观派和积极投资人,他的建议是 CEO 应该”大量”使用 AI 以理解其上下限。
文章用数据佐证这种脱节的代价:2026 年前 5 个月,152 家科技公司裁员 115,430 人,几乎追平 2025 年全年的 124,636 人,大多数公司把 AI 列为理由。ClickUp CEO Zeb Evans 宣布裁员 22% 同时部署 3000 个内部 AI agent,声称要建设”100x 组织”。但 UC Berkeley California Management Review 2025 年 10 月的元分析得出”AI 采用与总体生产力提升之间没有稳健关系”;NBER 3 月研究虽确认有提升但存在”感知的生产力远大于实测生产力”的悖论;MIT 评估数千 agent 后预测,按当前 LLM 改进速度,要到 2029 年才能在大多数文本任务上达到 80%-95% 的最低可用质量。HBR 还指出当所有人都用 AI 多产时,瓶颈反而转移到必须审批所有产出的高管。
HN 讨论提出几条主要反驳。一是”CEO 不懂前线”并非 AI 时代独有,《Undercover Boss》等节目早就在讲同一个故事,Levie 的”理论”只是新瓶装旧酒。二是把这种心态称作”psychosis”过于刻薄,更准确的概括应是”CEO 高估 LLM 一次性解决难题的能力,低估随后的人类维护成本”——标题党。三是有评论从亲历角度承认 AI 工具确实”上头”:原本看似遥不可及的事情几分钟内就有 65% 的成品,这种快感本身就足够蛊惑人,跨越”最后 35%“的难度则常被低估。也有 CEO 亲自下场 vibe coding 后碰到数据架构和部署墙,反而意识到人工设计的核心基础设施才是让 AI 不脱缰的前提。还有评论从大组织运作角度给出辩护:管理 500 人以上的 CEO 本来就是在”不完全理解下属做什么”的状态下设方向,agent 只是把这种委托关系延伸——区别在于人类员工有声誉、有后果预测能力、会拒绝不合理要求,而 AI agent 没有这些”有用的冲突”。
6. Last.fm 宣布独立运营
Last.fm 在官方支持社区发布简短公告:所有权发生变更,公司从今日起作为独立公司运营。账号、scrobble 历史、数据、隐私设置、Pro 订阅与计费均保持不变,团队也未变动。配套 FAQ 强调:服务不会关停、不是被另一家公司收购、用户数据不会被出售、API 功能照常并继续支持开发者生态、目前没有定价变动。公告没有透露原所有者(2007 年起为 CBS / Paramount 持有)退出的具体方式,也未披露新股东信息。
HN 讨论以怀旧情绪为主。许多用户表示,虽然 Spotify 的推荐算法在大众层面已经”超越”了 Last.fm,但 Last.fm 仍承载着 2000 年代独立音乐圈、微博客和早期社交网络的独特气质,是他们用了 10-20 年的服务,看自己的听歌历史像是回顾人生阶段。社区里有人分享了基于 Last.fm API 的第三方可视化项目:lastfmviz(专辑封面网格)、lastfmstats(艺人连听记录、独立艺人数等深度统计)、last.timer(按小时/分钟而非 scrobble 次数排名)。一位独立开发者提到,自己原本基于 Spotify API 的项目因后者突然收紧权限而废掉,迁移到 Last.fm API 后毫无障碍——这次公告明确 API 政策不变令开发者颇为安心。
也有不少批评和疑问。有人指出公告只单方面宣布”独立”却没说明卖方/买方,缺乏关键背景,戏称像《办公室》里 Michael Scott “宣布破产”。一些老用户尝试重新登录后发现产品早已退化为纯粹的 scrobble 追踪器,过去能听音乐、评论、社交的时代一去不返。也有人吐槽 URL 路径中用 ”+” 代替常见的连字符或 kebab-case 这一不寻常的设计。Apple Music 用户希望了解如何在不同设备上保持 scrobble 的体面方案。整体氛围是审慎乐观:希望脱离上市公司体系后,团队能回归社区初心,重新开放 API、恢复个人主页自定义等老功能。
7. YouTube 将自动检测并标注 AI 生成视频
YouTube 官方博客宣布对 AI 生成内容披露机制做两项更新。一是把”写实型或经过显著 AI 改动/生成”的视频标签放到更显眼位置:长视频中标签将出现在播放器正下方、描述之上;Shorts 中作为视频上的悬浮覆盖层。对于”非写实、动画或仅轻微改动”的内容,披露仍保留在展开描述中。二是从 2026 年 5 月起引入自动检测:仍要求创作者主动声明,但如果创作者未声明而系统检测到”显著的写实 AI 使用”,平台将自动加上标签。创作者若认为被误判可在 YouTube Studio 修改披露状态,但有两种情形标签将永久保留——使用 Veo、Dream Screen 等 YouTube 自家 AI 工具生成的内容,以及包含 C2PA 元数据标记为完全生成式 AI 的内容。YouTube 强调披露标签本身不影响推荐和盈利资格。
HN 讨论的核心担忧是检测的可靠性。多位评论拿”ZeroGPT 把《独立宣言》判定为 AI 生成”作类比,认为文本领域的 AI 检测器至今仍频繁犯错,视频检测大概率也会出现大量假阳性和假阴性,而 YouTube 的申诉流程本身又长期被诟病由 AI 自动驳回,担心普通创作者的收入来源因此受损。也有人列出一系列灰色场景拷问标准在哪儿:解释类视频中偶尔穿插的 AI B-roll、AI 生成的背景音乐、短片中夹杂少量 AI 镜头、以及专门展示/评论 AI 能力的视频——这些是否都要打同一个标签?
另一个讨论焦点是音乐。许多用户指出 YouTube 上的”focus music”等搜索结果已被 AI 生成长音轨占领,创作者每隔几天就发布 1 小时新曲、却从不披露来源,评论区一片赞美(评论者可能本身也是 bot),呼吁规则也能覆盖音乐内容。还有评论呼吁 Spotify 跟进——某些”艺术家”无任何 bio 却在 2025 年发布 7 张专辑,让付费用户感觉受骗,并希望平台至少提供”过滤 AI 内容”的选项。也有人指出 Google 自身的尴尬:一边推销 Veo、Flow、Gemini 鼓励大家创作 AI 视频,一边在最自然的分发平台上给这些作品贴”红字”,商业逻辑上自相矛盾。最后还有人建议把同样的自动标注用在 Google 网页搜索上,标注 AI 生成的文章。
8. 加拿大转向瑞典萨博采购军用预警机,远离美国供应商
据《卫报》报道,加拿大计划向瑞典萨博公司订购 GlobalEye 预警机机队,这是其军购重心从美国转向欧洲的明显信号。报道指出,萨博也正在竞争向加拿大出售 Gripen 战斗机;加拿大此前已签约购买 88 架 F-35,但在美国对加拿大主要出口商品加征关税后,总理卡尼要求军方研究削减订单、改向其他制造商采购的可能性。GlobalEye 的基础平台部分在加拿大制造,加方领导人也在 2025 年 11 月对瑞典国王作出过相关承诺。
HN 评论从多个角度展开讨论。一种观点认为这未必纯粹是政治决定:美国并未提供真正可比的预警机产品,波音 E-7 Wedgetail 项目本身在美国国防部经历了取消又恢复的反复,对外销售前景不明;萨博的装备在乌克兰战场也得到了验证,因此加拿大的选择更多是”合适尺寸”的务实采购。另一种观点强调政治因素不可忽视,列举了美国对加拿大商品任意加征高关税(同时豁免俄罗斯和白俄罗斯)、威胁动用武力吞并加拿大、暂停美加常设联合防务委员会等事件,认为依赖一个不可靠的”盟友”已经成为风险。
不少加拿大评论者表达了对卡尼政府推动与欧洲建立更紧密关系的认同感。美国评论者中也有人反思,称过去 15 年中美国”软实力”的损耗将需要数十年才能修复,并把当前供应链外移视为合理反应。还有评论提到意大利等国近期也出现类似的远离美国军购的动向。另有较为冷静的声音指出,Gripen 战斗机长期被各国作为对美谈判的筹码,最终是否成交需等到合同落地,目前公开放话本身就是施压手段。在产能层面,有人指出波音和空客的商用机积压订单都已接近 10 年产能,欧洲军工复兴和供应链重新洗牌正在跨行业铺开。
9. 把 Claude Code 当成日常工具:CLAUDE.md、Skills、子代理与 MCP 的实战配置
- 原文: https://arps18.github.io/posts/claude-code-mastery/
- HN: https://news.ycombinator.com/item?id=48289950
- 得分: 345
- 评论: 217
这篇文章面向已经熟悉 Claude Code 基本用法的用户,系统介绍如何把它当作”可编程代理”而非高级自动补全来使用。作者引用 Anthropic 团队 Boris Cherny 与 Cat Wu 的观点,强调几个核心原则:给 Claude 一种自我验证工作的方法可带来 2-3 倍的质量提升;先用 Plan 模式(Shift+Tab 两次)做只读探索和规划,再执行;用 @文件路径 精确引用代替模糊描述;把它当作要委派任务的工程师而非结对编程伙伴。
文章详细拆解了 .claude/ 目录结构,区分了项目级(提交到 git 共享)与全局级(描述使用者本人)两种作用域,列表对比了 CLAUDE.md、settings.json、.mcp.json、skills/、commands/、agents/、rules/ 等文件的职责。其中 CLAUDE.md 在 monorepo 中会按目录层级叠加加载,rules/*.md 支持按路径 glob 限定作用范围,避免在每次会话中污染上下文。作者推荐新功能优先用 Skills 而非 Commands,因为 Skills 支持附属文件、工具白名单和代理覆盖。
关于 CLAUDE.md 的写法,作者引用 Boris 公开的 Anthropic 团队内部版本:内容极其精简,只包含 Claude 无法猜到的构建命令、运行顺序、单测调用方式和 PR 前的检查仪式,没有风格偏好和代码库导览。核心方法是”Compounding Engineering”——每当 Claude 犯错,就让它把教训写进 CLAUDE.md,长期积累成项目专属的踩坑清单。
HN 讨论的核心质疑集中在 commands、skills、subagents、plugins 之间的边界混乱:几乎所有都是”插入预设 prompt”的变体,差别仅在安装位置和运行上下文,至今没有公认的最佳实践。多位评论者抱怨此类 LLM 工具配置文章正在大量涌现,但内容浮于表面、可能本身就由 LLM 生成、读起来”像嚼沙子”。也有从业者分享了实用经验:把所有确定性检查放进 pre-commit 钩子强制执行,因为代理常常跳过文档中描述的步骤;用 Nix 统一开发、CI 和部署环境;用沙箱(如 bubblebox)隔离 Claude 的执行环境。另一位用户在 10 万行级代码库上验证了精心编写 AGENTS 文件能显著提升效果,但仍保留 3-4 轮人工审查,不愿放手完全自治。也有人直言 Skills 不过是”定义很糟糕的工作流”。
10. Epicure:把多语种菜谱压缩成 1790 个食材的嵌入向量
- 原文: https://arxiv.org/abs/2605.22391
- HN: https://news.ycombinator.com/item?id=48291225
- 得分: 348
- 评论: 140
这篇 arXiv 论文提出了 Epicure,一组从零训练的 skip-gram 食材嵌入模型。作者从 11 个来源、覆盖英语、中文、俄语、越南语、西班牙语、土耳其语、印尼语、德语和印度英语等约 7 种语言的 414 万份菜谱中聚合数据,通过 LLM 辅助管线将原始食材字符串归一化为 1790 个标准条目。在此基础上构建了一个含 20.35 万条边的食材共现 NPMI 图,以及基于 FlavorDB 的 8 万条边、2247 个化合物节点(覆盖 15 个类别)的食材-化合物类型图。
论文训练了三个 Metapath2Vec 变体,架构与超参完全相同,仅在随机游走策略上有差异:Cooc 只走共现图,Chem 只走化合物 metapath,Core 则按可控比例混合两者,从而在”化学相似”与”菜谱语境相似”两端之间形成连续谱。HN 标题所说的”全部人类烹饪压缩到 2MB”指的是这组嵌入向量本身的体积。
HN 讨论对标题的夸张表述提出了多项质疑。最获赞同的观点是:更准确的描述应为”把人类食材压缩到 1790 个原语”,因为论文几乎不涉及实际烹饪——准备方法、用量比例、技法都没有被建模;但”番茄全球都搭配牛肉”这类跨文化食材搭配规律本身仍是有趣且实用的发现。有评论者指出语言覆盖存在明显偏差:包含了英语和德语却没有意大利语和法语,对一个声称代表”人类烹饪”的食物模型来说很奇怪。也有人试用该模型早期演示版(含 1032 种食材),发现它在选择”米”时会智能区分炒饭用冷藏茉莉香米、抓饭用浸泡过的印度香米,选择”羊肉”时会根据搭配蔬菜推荐肩肉或小腿肉等细节,表现出超出简单共现的领域知识。也有人质疑 2MB 的体量根本不可能承载真正意义上的全球烹饪文化,并把它类比为”勉强能跑的 1GB 编码模型”。论文由伦敦自动化餐饮初创公司 Kaikaku 发布。
11. GitHub 再次出现 PR、Issues、Git 操作和 API 大范围故障
- 原文: https://www.githubstatus.com/incidents/xy1tt3hs572m
- HN: https://news.ycombinator.com/item?id=48293080
- 得分: 245
- 评论: 187
GitHub 状态页报告,在 UTC 时间 5 月 27 日 12:10 左右开始调查 API 请求、Git 操作、Issues 和 Pull Requests 的性能下降问题,约一小时后仍在排查 Git 操作、Issues 和 PR 的退化,最终在 13:16 标记为已解决,并承诺后续会发布详细的根因分析。受影响组件包括 Git 操作、API 请求、Issues 和 Pull Requests。
HN 评论几乎一致地表达了对 GitHub 近期可靠性的不满。多人指出过去一个月即便过滤掉 sev-2 和 sev-3 等较低严重级别,GitHub 关键组件的故障频率也已经”按其自身标准”明显异常,并互相分享了 isgithubcooked.com 和一份社区维护的”诚实状态页” mrshu.github.io/github-statuses 作为更贴近真实体验的替代信息源。一位评论者点出了一个具体且严重的隐患:在故障期间,Web UI 和 API 上的 PR 并未一致地反映所有提交和分支变更,可能导致用户在没有看到完整 diff 的情况下合并代码。也有人对状态页的处置不满,指出 GitHub 把事件标记为”已解决”时其实仍有余波(如提交未显示、Actions 未触发),与几天前那次事件相似,但状态页没有在顶部明示缓存仍需刷新等问题。
部分评论将矛头指向公司治理和优先级,调侃应该回滚到 2018 年的代码、暂停新用户注册半年,或将三个九可用性写入全公司 KPI。还有一种较有代表性的观察是:自从 AI 编程兴起以来,原本可靠的服务(Supabase、Cloudflare、GitHub)的宕机似乎都变得更频繁,怀疑是 LLM 相关负载或基础设施改造带来的副作用。也有人讽刺称”账单功能仍维持三个九""LLM 还在满功率运行”,反映了用户对资源优先级的不信任。少数评论借机推广 GiveUpGithub.org 或 GitLab。
12. 屠龙者的忧郁:电子游戏如何把”杀怪”变成伦理困境
这篇 MIT Press Reader 的文章改编自 Jaroslav Švelch 的著作 Player vs. Monster。作者从自己在《血源》中的一次经历讲起:在一个看似 Boss 战房间的洞穴里,他遇到了沉睡中的 Ebrietas——“宇宙之女”。在杀死过数百只怪物后,他破天荒地选择只静静观察几分钟后离开。文章以此切入电子游戏中长期存在的张力:英雄理应凭借力量和智慧击败怪物,但如果英雄并不想杀,或者杀死它带来的耻辱多于荣耀,叙事该如何展开。
作者把这种思路追溯到早期基督教传统乃至托尔金的论文《贝奥武夫:怪物与批评家》。托尔金认为怪物提供了一种超越时代的崇高感,并不赞同把”以武勇为目的本身”视为美德——贝奥武夫虽然杀死巨龙,却也命丧其下。Tanya Krzywinska 指出”虚假英雄”主题从哥特文学和电影传入了恐怖与奇幻游戏,赋予 player-versus-environment 模式一种挽歌式色彩。
文章以《旺达与巨像》为重点案例。游戏制作人上田文人和海道贤仁有意识地:取消了小怪,只让玩家面对 16 只巨像,剥夺了”无脑砍杀”的廉价快感;要求玩家攀爬、抓握巨像的毛发,让英雄在身体上与怪物短暂融合;把击杀框架化为伦理上可疑的行为——巨像本是和平的,被刺中后会痛苦哀嚎、流出黑血,伴随哀伤而非凯旋的配乐。上田回忆首次播放该配乐时,团队以为是 bug 而发笑,因为习惯了击败怪物时的庆祝号角。人类学家 Miguel César 将其解读为日本民俗中关于生死边界”本质性越界”的现代表达。
HN 评论补充了大量个人化的同类体验。一位玩家讲述在《天际》中冲入一个山洞屠杀”普通强盗”,事后从信件中得知他们是被迫流离失所、试图重建生活的一家人,模型虽是通用 NPC 但被设计师与叙事对应起来,让他重新审视自己作为高等级法师的暴力。另有评论细致辨析《战神》中阿特柔斯面对巨魔时的”我们要打那个?!“——认为这并非对游戏惯例的元批评,而是一个自认普通人类、体弱多病的男孩面对未知巨敌的自然恐惧。还有玩家批评传统 hack’n’slash 中智能人形敌人面对压倒性强大主角时既不投降也不逃跑、不组织战术、排队送死的设计已经不再可信。多人提到《It Takes Two》中被迫”处决”求饶的玩具大象的桥段、SOMA 中关于结束生命的沉默处理、《辐射》系列道德上的灰色选择,以及《薄伽梵歌》中阿周那与黑天关于责任与杀戮的对话,把这一主题延伸至更广的文学与宗教传统。
13. PostHog 宣布用客户数据训练自家 AI 模型,美区默认 opt-in 引发反弹
- 原文: https://posthog.com/blog/training-ai-models
- HN: https://news.ycombinator.com/item?id=48296359
- 得分: 189
- 评论: 131
PostHog 在博客中宣布将开始用客户在其平台上的数据训练自有 AI 模型,目标是让现有产品(如 AI 安装向导、PostHog AI、MCP)更主动智能,并构建新产品如 PostHog Code。第一批训练方向包括:会话回放(session replay)分析的规模化,目前由 PostHog AI 完成但成本高、不可扩展;合成用户测试,即在发布前预测用户可能困惑或流程可能崩溃的位置;以及预测用户行为,从而自动建议可提升转化率、减少挫败感的修改。
PostHog 公布了 9 条政策要点:欧盟 cloud 用户默认 opt-out;签有 BAA、MSA 等限制训练的合约用户也默认 opt-out;美国 cloud 上的其他用户默认 opt-in;所有用于训练的数据将被匿名化;仅使用 PostHog 实例中已有的数据;模型由 PostHog 自己训练,不会出售或发送给第三方模型提供商;可在组织设置中随时关闭;训练 6 月 29 日才开始。文章作者强调”选择透明而非悄悄上线”,并直接回应”为什么是 opt-out 而不是 opt-in”——“否则我们无法获得足够数据训练有用的模型”。
HN 评论几乎一边倒地批评。最高赞观点直接指出 “opt-in by default” 在语义上是自相矛盾的,本质就是默认启用、用户从未主动同意。许多自述为现有客户的评论者表示 PostHog 原本是”装好就不太用想,偶尔提供价值,留着无害”的系统,现在却需要时刻保持戒备,干脆决定迁移到自托管方案或寻找开源替代品,并征集推荐。多人指出 PostHog 完全可以选择 opt-in 邮件征询,但他们的做法暴露出对自身用户群体的判断缺失。另一类批评聚焦在公司”风趣文化”与商业行为之间的反差:操作系统主题设计、“性感”法律文档、刺猬梗、CEO 周边玩偶等品牌包装在公司做有利于用户的事时显得可爱,但在做反用户决策时反而让侮辱倍增。还有人讽刺地引用作者的解释——“否则数据不够用”——指出当被要求自愿提供数据时人们不愿意,这本身就说明了问题。多条评论提到这是”又一次庆幸欧盟立法”的时刻。
14. 在 4K 屏幕上运行 SimCity 3000:一份现代化兼容指南
作者认为 SimCity 3000 是 SimCity 系列的巅峰:基于 SC2K 引擎升级而来,逐像素手绘的等距艺术风格,特性与复杂度平衡得当,配有高水准的爵士/新世纪原声带。文章在 Windows 10 LTSC 2021、Ryzen 5 3600、RX 7600、48GB 内存、4K 显示器的现代配置下,把这款老游戏跑到了 3840×2160 全屏。
整理出的六步流程为:1) 安装 GOG 提供的官方补丁 EXE,启用宽屏支持并去除光盘检查;2) 编辑 SC3U.ini 调整 ScrollMarginFactor = 0.005787 修复鼠标加速过头的问题;3) 安装 D3D Wrapper 替代方案修复在分辨率含 8 的因子时的画面歪斜,并在 dxwrapper.ini 中把 EnableWindowMode 设为 0、FullScreen 设为 1 强制真全屏,避免任务栏遮挡,并可启用 VSync;4) 对 SC3K.exe 应用 NTCore 的 4GB 补丁缓解滚动时瓦片延迟加载;5) 替换 UpdateSettings.ini 禁用试图连接早已失效的更新服务器导致的启动卡顿;6) 安装重新整理的音乐补丁,并把 CD 中 APPS/RES/SOUND/MUSIC 下的 .xa 文件拷贝到硬盘。作者明确表示自己拒绝在家中使用 Windows 11,因此未在该系统上验证。
HN 评论充满怀旧与设计反思。一位独立开发者正在制作城市建造游戏 microlandia.city,他认为现代城市建造游戏过度追求照片级真实感反而牺牲了”留给想象的空间”——Will Wright 曾说真正的模拟运行在玩家脑中;Cities: Skylines 等作品因为渲染复杂度高,反而在交通、经济、分区、犯罪、污染等核心模拟上比 SC3000 退步。多位评论者参与了”哪部 SimCity 最佳”的讨论,SC2K 也有大量拥趸,理由是复杂度平衡更好、能在老 Mac 上流畅运行。一条勘误指出文章关于”逐像素手绘”的说法不准确:SC3K 美术其实是用 3DS Max 渲染的,Maxis 还发布过基于 G-Max 的 Building Architect Tool,附带与官方资产相同的灯光配置模板,可输出各缩放层级和朝向。也有人称赞 SC3K 顾问系统在格调与亲和力上拿捏精准,而 SC4 把顾问换成 3D 渲染的 Sims 是退步。还有评论提到 SC3K Unlimited 中部分音乐其实是低码率单声道版本,最好用 1.0 原版 CD 中的同名立体声文件替换,并指出数据挖掘显示 Unlimited 几乎实现了类似 SC2K Network Edition 的多人模式。文章配图说明中关于 1WTC/2WTC 的玩笑也引发了一段关于英语文化圈灾难梗的讨论。
15. Go 语言提案:为方法引入类型参数
- 原文: https://github.com/golang/go/issues/77273
- HN: https://news.ycombinator.com/item?id=48291575
- 得分: 164
- 评论: 134
该提案由 Go 团队提出,计划允许具体方法(concrete method)像函数一样声明自己的类型参数,从而真正支持”泛型方法”。在当前 Go 规范中,函数可以是泛型的,但方法只能借用接收者类型的类型参数,自身不能再引入新的类型参数。提案对方法声明语法做了小幅调整,将 TypeParameters 加入 MethodDecl,并相应修改了主表达式语法,使类型实参可以作用于任意能产生方法值的表达式,而不仅限于带包名的标识符。
提案的核心论证是一次”视角转换”。过去 Go 团队拒绝泛型方法的主要理由是:方法的根本作用是实现接口,而泛型接口方法在 Go 的隐式接口实现模型下难以高效编译——编译器无法在编译期得知运行时将被实例化的所有具体类型。原始泛型提案因此明确将参数化方法列为”暂不支持”,Go FAQ 甚至写过”我们不预期 Go 将来会加入泛型方法”。新提案主张:具体方法本身就是有价值的语言构造,它用于组织代码、支持链式调用 x.a().b().c() 的可读性,并不必然要服务于接口。既然接口方法在语法上无法带类型参数,那么泛型具体方法就天然不参与接口实现匹配,这一矛盾被绕过而非解决。提案也明确,泛型方法将不能通过反射按名或按索引访问。
HN 讨论整体偏正面。许多评论者表示这是他们初学 Go 泛型时最意外的缺口,过去常被迫把本应作为方法的 API 写成包级泛型函数,绕出别扭的设计;数据访问层、库作者尤其欢迎。一部分评论强调 Go 团队历来采取渐进策略,当年的”暂不”并非”永不”,此次落地符合预期路径。也有反对声音认为,Go 正在逐步实现自己曾宣称”不需要”的特性,担心语言走向复杂化,称”简洁性正在死去”;还有人调侃将借此构造 monad 库。整体上社区将其视为补齐泛型体系的一块重要拼图,但对其与接口语义解耦的取舍仍存分歧。
16. Mini Micro:一台面向学习的”幻想电脑”
- 原文: https://miniscript.org/MiniMicro/index.html#about
- HN: https://news.ycombinator.com/item?id=48291947
- 得分: 227
- 评论: 80
Mini Micro 是一台由 Joe Strout 开发的”新复古”虚拟计算机,定位介于真实复古机器与现代开发环境之间。它提供 960×640 全彩显示、68×26 文本模式、像素/精灵/瓦片图形、合成与采样立体声、键鼠及手柄输入,并内置 REPL 与代码编辑器。编程语言使用作者设计的 MiniScript——一门为易学性而生的脚本语言,相关设计已发表于 IEEE 教育类论文。
项目强调”陪伴成长”:初学者可以从命令行输出和简单像素图形入门,逐步过渡到使用精灵、瓦片地图、REST 网络请求的多层游戏;Control-C 可中断任意程序并检查变量与堆栈。Mini Micro 完全免费、无广告,提供 macOS、Windows、Linux 下载,也有可嵌入网页的 WebGL 模板。配套资源包括速查表、用户手册、Rosetta Code 上的大量示例、面向儿童的入门书《Introduction to Computer Programming》以及更深入的《Learn to Code in 30 Days》。当前版本 v1.2.6 使用 MiniScript 1.6.2。文档示例从 demos、desktop、lcars 等内置命令到加载特定 .ms 文件都很直观,并提供了若干内置 demo 和 itch.io 上的第三方游戏。
HN 讨论涉及多个角度。有评论者翻阅 MiniScript 快速参考后指出,该语言是基于原型的(类即带有 __isa 指针的 map),但文档同时使用 class 与 object 的措辞,对教学语言而言略显混淆;也有人发现论文中”求字符串列表最长公共前缀”的示例代码存在 bug。多位评论者将其与 PICO-8、Picotron 等已有 fantasy console 比较,认为生态与社区是后者的优势。另有声音质疑:为何不直接用 PWA + WASM 的网页形式发布,省去安装器与手册;以及为何”免费但不开源”。也有人建议直接给孩子买 Arduino 或带 OLED 的小硬件,认为面对真实硬件约束的学习体验更扎实;反对者则认为完整 Linux 或现成开发板会让初学者失去”完全掌控机器”的感觉,而 Mini Micro 这种受限沙盒恰好提供了 8 位机时代的那种掌控感。还有用户希望出现 ESP32 版本或将界面本地化为非英语语言,方便不会英文的孩子使用。
17. Apple 与 Google 正在重塑推送通知
文章接续作者此前关于邮件被四大平台中介化的讨论,转而分析推送通知:这条管道由 Apple 与 Google 两家垄断,所有发给 iPhone 与 Android 的通知都必须经过 APNs 或 FCM。推送最初是为解决电池问题而生——2009 年 Apple 推出 APNs,2010 年起 Google 历经 C2DM、GCM 直至 2016 年的 FCM,以一条持久 TLS 连接替代每个 app 自行轮询。架构从第一天起就允许平台节流、丢弃、降级或拒绝消息,只是早年很少行使。
文章梳理了过去十五年平台介入的演进。Android 8(2017)引入通知渠道(channel),将优先级从单条消息层级上移到渠道层级,并赋予用户对渠道独立静音、降级、屏蔽角标的权利;一旦渠道重要性被设定就不能再被开发者上调。iOS 15(2021)以 Focus、定时摘要和 passive/active/time-sensitive/critical 四级打断分类重构推送处理,Apple 明确禁止将 time-sensitive 用于营销。Android 13(2022)把 POST_NOTIFICATIONS 改为运行时权限,opt-in 率随之大幅下滑:Pushwoosh 在 1600 万设备样本中观察到游戏类 app 流失近三分之一订阅,新闻类下降 19%;Batch 基于 8000 亿条消息的 2025 基准报告显示 Android 的 opt-in 率一年内从 85% 跌至 67%,跨平台平均为 61%。如今设备端模型还会进一步对通知进行摘要、重排乃至改写,营销与广播类推送受影响最大。作者认为发送者正站在平台”保护用户注意力”这一假设的对立面。
HN 讨论几乎一边倒地站在用户和平台一侧。许多评论者表示自己只允许电话、短信、WhatsApp、银行等极少数 app 推送,认为推送应仅用于真正需要立即处理的事务性通知,而非营销、推荐、连续打卡或物流更新。多位读者觉得文章作者作为”发送方”代言人,把平台对垃圾推送的限制描述为问题,本身就显出立场偏差,纷纷表示”听起来挺好的”。也有评论指出 Android 在通知项上的细粒度即时控制比 iOS 更友好。前 WhatsApp 工程师补充称,平台对推送的延迟、抑制、合并从早期就存在,并非近年才有。还有人希望两大平台提供更彻底的”关闭所有营销类通知”和更好的摘要格式选项。
18. GPU 上的矩阵乘法在数据”可预测”时跑得更快
作者在 2022 年对比 PyTorch 调用 cuBLAS 与 NVIDIA CUTLASS 自带 profiler 跑 8192³ 矩阵乘的性能,发现 CUTLASS 报出 288 TFLOPS,比 cuBLAS 高出约 10%。但当他把 CUTLASS kernel 绑进 Python 重新测,性能立刻回落到 257 TFLOPS。逐项排查后定位到一个意外原因:CUTLASS profiler 默认用整数初始化输入,而 PyTorch 用的是 randn。进一步实验显示,在 A100 上对全零矩阵做 matmul 可达约 295 TFLOPS,均匀分布次之,标准正态分布最慢,仅 257 TFLOPS。
这违反直觉,因为矩阵乘法 kernel 无论输入数值是什么都执行相同次数、相同顺序的计算,访问相同的内存地址,没有任何数据依赖分支。作者排除了 NVIDIA 的可压缩显存等机制后,将原因归于半导体的动态/开关功耗。A100 标称功耗上限 400W,空闲也要约 88W(静态/漏电功耗)。一旦负载使整片 GPU 接近功耗墙,VRM 会降低电压并下调时钟频率以保持在功率限制内。动态功耗与晶体管翻转次数成正比:当输入全为零时,乘法链路与累加器中的位几乎不翻转;全一时每次 tensor core 指令结果都相同;均匀正值分布累加器不需要在正负间频繁切换;标准正态分布则导致最多的位翻转和最高的动态功耗,从而触发更严的频率限制。换言之,数据分布通过功耗墙间接影响了矩阵乘的实测算力。
HN 讨论中,有人最初以为答案会是分支预测,结果发现是更底层的物理机制。多位评论者指出,本地 LLM 推理社区早已观察到适当下调功耗上限反而能提升整体吞吐,原因正是避免频繁触发频率回退。也有人提醒这其实是潜在的侧信道攻击面:通过功耗或时序可能反推输入数据特征。有评论者好奇是否存在硬件层面针对乘 0、乘 1 的特殊化快路径,但作者的解释更倾向于物理层而非逻辑层。还有人感叹 88W 的空闲功耗本身就相当夸张,并联想到 Tenstorrent 等强调可预测执行流的架构在这种场景下可能更具优势。亦有人调侃未来或许会出现”用 AI 选择对当前数据更省功耗路径”的硅上控制器。
19. 什么是 DAC(直连铜缆)
ServeTheHome 这篇 2021 年的入门文章解释了数据中心常见的 DAC(Direct Attach Copper)线缆。DAC 是一段两端预装好特定光模块外形(如 SFP+、QSFP+、QSFP28)的固定长度 26–28 AWG 双轴铜缆,两端通过铜线直接电气连接,绕开了光电转换。速率越高,所需电磁屏蔽越厚,因此高速 DAC 更粗、更硬、可达距离更短。常见品类按速率分为 10G/40G 代(SFP+、QSFP+)、25G/100G 代(SFP28、QSFP28)等。
文章重点介绍了 breakout DAC:QSFP+ 中的”Q”代表 Quad,可看作 4 路 SFP+;因此可用一端 QSFP+/QSFP28、另一端分出 4 路 SFP+/SFP28 的线缆,将高密度端口拆成多条低速链路。但并非所有交换机、网卡都支持 breakout,需查文档;像 HPE 620QSFP28 这类网卡甚至专门以单 QSFP28 口对外、内部以 4×25GbE 出现。DAC 距离一般限制在数米内,进入 100G 以上时代后通常不超过 5m,更长距离需要 AOC(有源光缆)或光模块。DAC 又分有源与无源两种,前者距离稍远但功耗更高。相比光模块方案,DAC 不需要电光互转,硬件成本和功耗更低,可靠性高,因此机架内连接仍大量采用 DAC,而跨机架以上的连接更倾向使用光纤。
HN 讨论补充了不少实践细节。有评论者指出文章已偏旧,如今 OSFP/QSFP-DD 已发展到 8 通道、单通道 100G/200G,单根 DAC 可达 1.6Tbps,但代价是最大长度被压到约 1m。一名曾从事广播网络集成的工程师对比了铜缆与光纤的现场端接体验:铜缆端接像艺术,几秒钟即可完成、可靠性强;光纤端接和熔接则更难、对环境与设备依赖更高,但客户出于延迟和体积考虑往往仍偏好光纤。还有读者分享如何”黑掉”某些 10G DAC 让其跑 25G,以及用 X520-DA2 网卡和二手 UniFi 聚合交换机搭建家庭 10G 网络的经验。多位评论者偏好光纤,理由是距离更长、发热更低、外观更美观,并提到一种”几乎隐形”的细径光纤适合家用走线。批评意见集中于 DAC 在满架部署时容易变成沉重的”鼠窝”,以及两端 EEPROM 标识若与设备厂商白名单不匹配会带来不必要的兼容性折腾。有人提问 DAC 是否电气隔离,也有人提醒它发热低、不占功耗预算是关键卖点之一。
20. “我们是波兰人,所以我们当然用拉丁文印刷”
这篇来自 USTC(Universal Short Title Catalogue)项目的文章探讨了一个早期现代欧洲的特殊语言现象:当宗教改革与行政现代化推动各地母语取代拉丁文时,波兰–立陶宛联邦却让拉丁文一直保留为官方语言,直到 1795 年国家终结。作者 Paweł Pietrowcew 引用了 1575 年威尼斯驻克拉科夫大使 Girolamo Lippomano 和约 150 年后 Daniel Defoe 的观察:在波兰,不仅贵族,连市民、工匠也能流利地说拉丁文,旅行者只要会拉丁文即可走遍全境。作者指出这些说法带有夸张,但确实反映出拉丁文在波兰社会中的不寻常地位。
借助 USTC 的统计数据,文章展示了一条非线性曲线:16 世纪中叶波兰语开始进入官方印刷,1534 年贵族甚至要求允许用波兰文印刷法律、编年史与圣经。但当无法说斯拉夫语的外国君主(1574 年的瓦卢瓦的亨利、1576 年的巴托里·斯特凡)被选为国王后,拉丁文在官方印刷中重新占据上风。直到 17 世纪末,整个联邦境内的波兰语出版物总数仅有一次超过拉丁语出版物。更关键的是,单看”纯拉丁文书籍”会严重低估拉丁文的存在感——大量波兰语印刷品其实是”macaronic”的混合文体,在波兰语句子里密集嵌入拉丁词与拉丁短语。这种语言交错并非诗意装饰,而是政治与文化精英的日常表达:议会立法用 nemine contradicente,私下议论叫 liberius,罚款写作 poenam,任何场合的演说都离不开塔西佗、塞涅卡的引文和拉丁谚语。排版工人因此必须在 Schwabacher 与 Italic 字体间频繁切换。
HN 讨论延伸出多条有趣的线索。有读者回忆 17 世纪荷兰外交官用法语写家信,但谈及金钱时切换到拉丁文,因为”严肃事务需要更高级的语言”。一位波兰评论者的祖父移民美国后仍能找到至今坚持拉丁弥撒的教堂;另一位读者借助波兰教会档案的拉丁化人名追溯了 19 世纪祖先。也有波兰人指出医学领域在波兰已基本本地化,而美国医疗节目仍大量使用拉丁术语;其物理学教授通晓拉丁与希腊文。多名评论者强调 macaronic 写法是普遍现象,今天西方法律与科学界仍保留大量拉丁术语,是旧语言以专门词汇形式延续的自然阶段。有评论者半开玩笑地建议把拉丁文作为欧盟官方语言,因其”已死”对所有成员国都公平。也有较为沉重的声音回忆 1990 年代初波兰诊断书仍写拉丁文,让普通家庭难以理解病情。