HN 每日深度阅读 · 2026-06-02
本期五篇文章共同指向一个主题:当下技术系统的脆弱与韧性并存。Meta 的 AI 客服沦为零认证账号接管通道,npm 生态再遭供应链投毒,提醒自动化与信任链的失守;Anthropic 秘密递交招股书则让 AI 泡沫风险开始向散户蔓延;
共 20 篇 · 约 12,250 字 · 约 31 分钟读完
1. Instagram 客服 AI 被诱导重置账户:零认证接管事件
- 原文: https://www.0xsid.com/blog/meta-account-takeover-fiasco
- HN: https://news.ycombinator.com/item?id=48359102
- 得分: 1179
- 评论: 290
安全研究者 0xsid 披露了一种近期在 Instagram 上被大规模滥用的账户接管手法,包括奥巴马白宫账号、美国太空军最高军士长账号在内的多个高知名度账号据称因此被劫持。攻击流程极其简单:攻击者只需要受害者的用户名,使用 VPN 将 IP 伪装到目标用户所在城市,然后向 Meta 的客服 AI 声称账号被盗,请求把验证码发送到一个攻击者控制的任意邮箱。AI 不会校验该邮箱是否曾与账号关联,便直接发送验证码。攻击者把收到的验证码回传给 AI,即可获得密码重置链接,完成接管。
AI 有时会要求自拍视频进行身份验证,但据报道用目标公开照片做 AI 动画化处理即可绕过。由于该恢复流程被视为账号所有者本人的完整重置,2FA 会被一并清除,原有会话被注销,密码被更改,且不会通过邮件、短信或推送通知原用户。原所有者无法发起恢复,因为邮箱和手机号都已映射到攻击者,也没有人工客服可申诉。如果账号被分到了启用 AI 客服的 A/B 测试组,用户甚至无法关闭该入口。Telegram 上已出现专门提供此类接管服务的黑市群组,短用户名价格可达数十万至百万美元。Meta 目前似乎已修复,但漏洞活跃时间据估有数周乃至数月。
HN 评论将矛头指向多个层面:人工客服历来是大公司安全链最薄弱环节,把同样的权限交给 LLM 只是让问题加速;Meta 给 AI 代理赋予了直接修改账号邮箱、绕过 2FA、向任意地址发送验证码的高权限,被认为是严重的设计失误,应当由确定性代码控制收件地址而非由模型自由生成。也有评论回忆早年 LinkedIn 类似的零认证密码重置漏洞,指出问题并非 AI 独有,而是产品在”恢复流程”环节长期信任假设过强。多名用户表示自己长期闲置或被盗的 Instagram 账号一直无法找回,凸显缺乏可追责人工客服带来的结构性问题。
2. Red Hat Cloud Services 多个 npm 包遭恶意发布
RedHatInsights 在 GitHub 上发布安全公告,确认 @redhat-cloud-services/ 作用域下多个 npm 包被发布了恶意版本。这是继 axios、tanstack 等之后近期又一起 npm 供应链攻击事件。StepSecurity 等安全厂商已发布分析,Red Hat 与 IBM 也几乎同时宣布了名为 Project Lightwell 的供应链漏洞检测项目。
HN 讨论几乎完全聚焦于已经被反复验证有效的缓解手段,而不是事件细节本身。“冷却期”(cooldown)被反复推荐:忽略发布时间不足 N 天(1–7 天)的新版本,因为绝大多数被污染的包都在数小时内被下架。pnpm 最新版本已默认启用 1 天冷却;yarn 4 也提供类似选项;还有评论者推荐使用 npm install --before=<date> 这种手动方式。另一个被强调的实践是把 npm install、npm test 等会执行任意代码的操作放在没有任何凭据和权限的隔离环境中运行;在 GitHub Actions 里可以用两个独立 job 把构建测试与发布签名分开,从而避免”蠕虫式”扩散。
在维护者侧,评论者提到 npm 已逐步推广发布 MFA、Trusted Publishers 以及最近上线的 Staged Publishing:CI 无需静态凭据即可推送,但需要维护者通过 MFA 显式审批后才真正发布。也有人推荐使用 zizmor 检查 GitHub Actions 配置,以及一个 800+ star 的 npm 安全实践清单仓库。更激进的观点包括 fork 所有依赖并从自有仓库安装,或像 uWebSockets.js 维护者那样彻底拒绝依赖外部包。还有用户表示已经卸载 Node、改在 dev container 或 Qubes 等强隔离环境中工作,认为根本性的解决方案在于操作系统权限模型——默认让第三方代码继承当前用户的全部权限已经不再可行。
3. 用十年前的 Xeon 在无 GPU 服务器上跑 Gemma 4 26B
- 原文: https://point.free/blog/gemma-4-on-a-2016-xeon/
- HN: https://news.ycombinator.com/item?id=48353348
- 得分: 666
- 评论: 268
作者在一台回收的旧服务器上成功运行了 Gemma 4 26B-A4B(MoE 架构,128 专家、每 token 激活 8 个,总参 ~25B、激活 ~3.8B)。硬件配置颇为寒酸:Intel Xeon E5-2620 v4(2016 年发布,8 核 16 线程,仅 AVX2,无 AVX-512/VNNI/BF16)、128GB DDR3 内存(比当下笔记本 RAM 慢 5–6 倍)、完全没有 GPU。最终在 Q8_0 量化下达到约 12 tokens/s 的阅读速度。
文章的核心结论是:LLM 解码阶段是内存带宽受限而非算力受限,CPU 算力相对廉价,因此 CPU 上 speculative decoding 的收益比 GPU 上更显著——小型 drafter 的工作集能装入 L3,而 verifier 权重无论如何都会溢出缓存。作者使用了 ik_llama.cpp 这一 fork(而非 ollama 或主线 llama.cpp),因为只有它暴露了所需的全部调优开关。关键 flag 包括:--spec-type mtp 配合 MTP drafter 做投机解码、--spec-autotune 动态调整链长;--cpu-moe 优化专家路由以适配 CPU 缓存层级,避免 cache thrashing;--merge-up-gate-experts 将 up 与 gate 两次投影融合为一次 matmul,减少跨内存总线传输;--run-time-repack 在推理前按 CPU 缓存布局重排权重;--mlock 锁页、--no-kv-offload 保持 KV 缓存在 RAM;线程数与物理核数对齐(8 而非 16,因为内存受限场景下 SMT 反而拖累调度)。
HN 评论氛围偏向赞赏与共鸣。多位用户分享了类似经验:在 2012 年的 Xeon + 16–24GB RAM 上跑 Gemma 26B-A4B Q4 也能拿到 8–12 tok/s;有人花不到 500 美元搭建了双 Xeon E5-2680 v2、192GB ECC RAM、双 P102-100 的家用推理服务器。也有现实主义的提醒:旧服务器功耗高、噪音大,相比 OpenRouter 上 $0.1/$0.3 per 1M tokens 的同模型 API 价格未必划算。多人将此视为”本地可运行模型”趋势的代表,认为这才是 AI 进步中最值得关注的部分,对当前 AI 公司估值与商业模式构成潜在威胁。
4. Anthropic 向 SEC 秘密递交 S-1 招股书草案
Anthropic, PBC 宣布已根据 1933 年证券法第 135 条规则,向美国 SEC 秘密递交 IPO 注册声明 Form S-1 草案。具体发行股数与价格尚未确定,是否最终上市将取决于 SEC 审核结果与市场状况。此前不久,Anthropic 刚以 9650 亿美元投后估值完成 650 亿美元的 H 轮融资。同日 SpaceX 也提交了 S-1 修订文件。
HN 讨论主要围绕几个方向。一是市场风险:在此之前 AI 泡沫的”爆炸半径”主要限于企业投资者,IPO 后将通过散户和 401k 把风险传导到普通家庭,同时季度财报压力会迫使公司公开真实财务状况,可能成为对 AI 板块的一次”清醒时刻”。多位评论者类比 dotcom 时期,指出 AOL、Yahoo 等最早期的巨头都未能维持当年的规模。二是估值上限问题:Anthropic 已达全球最大公司约 1/5 的体量,散户复制 Amazon 或 Nvidia 那种 2000 倍涨幅的可能性已极小。
三是对节奏的疑问:刚完成大额私募融资就立即推进 IPO,被解读为”趁财报数据漂亮时赶紧上市”。有评论分析其 ARR 暴涨的原因之一是企业版 Claude Code 按 API 价格按 token 计费、并无大额预订折扣,这种模式在客户开始重视预算后将面临竞争压力,token 用量最大化的趋势也开始遭遇反弹。四是公司治理:Anthropic 作为 Public Benefit Corporation(公益公司),IPO 后能否在股东压力下守住其使命被视为一次真正的检验。也有人提出 AI 可能是首个资本、电力与物理基础设施重要程度几乎等同于软件本身的技术周期。
5. Pirate Bay 被突袭 20 年后仍在运营
2006 年 5 月 31 日,65 名瑞典警察突袭斯德哥尔摩一家数据中心,搬走数十台服务器,目标是 The Pirate Bay。当天早晨,联合创始人 Gottfrid Svartholm 和 Fredrik Neij 察觉异常,Fredrik 在前往机房途中临时决定对整站做完整备份。正是这次备份让 TPB 在三天内完成重建。重启后站方将 logo 改为”The Police Bay”配以向好莱坞发射炮弹的图案,几日后又换成象征浴火重生的凤凰。突袭非但没让网站消失,反将其推上全球主流媒体,流量大幅上涨,并间接助推了海盗党的崛起。
2017 年通过 FOIA 申请获得的美国外交电报显示,美国政府在幕后扮演了重要角色。2005 年 11 月美国驻瑞典使馆向华盛顿汇报,MPA 已分别会见美国大使和瑞典司法部国务秘书,将 TPB 列为重点议题,希望瑞典对”大鱼”采取行动。2007 年的另一份电报显示,使馆将一名(姓名被涂黑的)员工提名为年度国务院 FSN 奖候选人,理由之一就是”巧妙的外联工作直接促成瑞典执法机构突袭并关闭 TPB 的大胆决定”。突袭后续引发刑事诉讼,多名核心成员被判监禁,站点运营随后转交给一个匿名团队,对外仅以化名”Winston”出现。2014 年再次遭突袭后数周内恢复,如今 TPB 自称”银河系最具韧性的种子站”。
HN 讨论中,多位用户表示官方流媒体体验反而越来越差:Disney+ 上《马尔科姆的一家》出现多集音轨缺失;“4K”片源充斥 AI 上采样、严重压缩或丢帧;而种子社区因为提供者真正在意质量与元数据,体验反倒更好。也有人对版权与 AI 训练之间的双标提出讽刺:当年 P2P 被产业视为”反基督”,如今同一批公司大规模抓取内容训练模型却几乎不受版权约束。还有评论指出更有趣的问题其实是”TPB 现在究竟靠什么架构维持在线”,但文章并未深入这一技术层面。
6. Nvidia 推出 RTX Spark 平台:面向轻薄本与小型桌面的 ARM AI PC
- 原文: https://www.nvidia.com/en-us/products/rtx-spark/
- HN: https://news.ycombinator.com/item?id=48352939
- 得分: 292
- 评论: 239
Nvidia 发布 RTX Spark 平台,定位为面向轻薄笔记本和小型桌面机的 ARM 架构 AI PC。该平台基于 Grace CPU 与 Blackwell RTX GPU 通过 NVLink-C2C 互联,支持统一内存,最高可达 128GB 共享给 CPU 与 GPU,宣称可在本地运行最高 1200 亿参数模型,提供约 1 PetaFLOP 的 AI 算力,且具备完整 CUDA 支持。Nvidia 同时宣布与 100 多家 Windows 软件商合作推出 ARM 原生版本,包括 Adobe Premiere/Photoshop、Blender、CapCut、ComfyUI、OTOY,以及 League of Legends、Valorant、PUBG、Remedy 等游戏;Epic 与 BattlEye 的反作弊系统也将原生支持该平台。
HN 评论态度复杂。一方面,多人承认 Nvidia 凭借市场地位成功推动了大量 ARM 原生移植,这是过去 Windows on ARM 一直缺失的关键环节;竞争 Apple Silicon、Intel、AMD 对整个行业都是好事。另一方面,质疑集中在几个方面:内存带宽规格相比 M5 Max 仍有差距,更接近 AMD Strix Halo 的定位;功耗与散热在轻薄本形态下是否能撑住存疑;ARM 翻译层下的游戏性能仍待验证;Windows on ARM 与 Apple 强制迁移到自研芯片不同,注定要长期维护 x86 模拟层,应用生态会长期处于碎片化状态。
很多评论关心的是能否运行 Linux——这成了讨论中最集中的诉求,因 Windows 本身被许多开发者视为”反向卖点”。也有人担心 ARM SoC 长期驱动支持问题,希望 Nvidia 比 Qualcomm 做得更好。还有评论认为这是 Nvidia 在试探”本地 AI 推理”市场,长远看可能动摇 Anthropic、OpenAI 等公司的云端商业模式,同时也呼应了黄仁勋近期关于”代码代理只会增加而非减少软件工程师需求”的表态。也有人猜测产能会被大客户优先占用,零售供应有限。
7. 微软发布 Surface Laptop Ultra:搭载 Nvidia RTX Spark 对标 MacBook Pro
微软在 Computex 2026 发布 Surface Laptop Ultra,是 Surface 产品线迄今最强配置,明确对标 MacBook Pro,将于 2026 年秋季上市。设备运行 Windows on ARM,搭载与 MediaTek 联合开发的 20 核 Nvidia Grace CPU 和 Blackwell RTX GPU(最多 6144 CUDA 核、第五代 Tensor Core、FP4 精度),通过 NVLink-C2C 互联,最高 128GB 统一内存,1 PetaFLOP AI 算力,可本地运行 1200 亿参数模型。机身重量低于 4.5 磅,配 15 英寸 mini-LED PixelSense Ultra 触屏(2880×1920、262 ppi、峰值 2000 nits HDR),双风扇散热,配有 HDMI、USB-C、USB-A、SD 卡槽、3.5mm 耳机口,SSD 可更换,并承诺提供维修指南和零件。微软声称已针对该硬件重写 Windows 11 的工作负载调度、电源与热框架,以及 GPU 可访问内存的上限与分页管理。
HN 讨论中负面评价占多数。许多人分享了过往 Surface 设备的糟糕体验:Surface Book 的铰链、可拆电池、磁性触点经常出问题;Surface Dock 会静默更新后自我变砖;ARM 版 Surface 在 Linux 下兼容性极差;客服 AI 答非所问直接挂断。也有 Surface Pro 11 等当下型号的正面反馈:平板形态、HiDPI 屏、键盘和触控板优秀、能跑 Adobe/Resolve/WSL2。但更核心的批评指向操作系统本身——多人认为”Built on Windows”如今几乎是反向卖点,购买 Mac 的吸引力之一正是不用 Windows,这款产品很可能重蹈初代 ARM Surface 的覆辙。
价格也是焦点:作为参考,无屏幕无外设的 DGX Spark 已售 4700 美元,这款笔电预计要 5000 美元起。还有评论吐槽宣传文章本身充满 AI 生成痕迹,似乎公司内部都找不到一个真正对产品有热情的人来撰写。也有人借机呼吁更多厂商效仿联想,将 Windows 改为付费可选项、默认搭载 Linux 发行版。
8. Ask HN:2026 年 6 月谁在招聘
- 原文: https://news.ycombinator.com/item?id=48357725
- HN: https://news.ycombinator.com/item?id=48357725
- 得分: 140
- 评论: 208
这是 HN 每月例行的”Who is hiring”主题帖,2026 年 6 月版收获 140 分和 200 余条岗位帖。从前排回复看,招聘构成延续了过去几个月的趋势:早期 AI 创业公司、基础设施工具、垂直行业 SaaS 占据主流,远程岗位仍然普遍但更多公司在强调混合办公或特定城市需求。
具体岗位中,加拿大金融科技公司 Borrowell 招募开发岗,面向全加拿大远程。旧金山的 Kiloforge 获 a16z、Uncork Capital 和 Rahul Vohra 共 500 万美元融资,自称”公司工厂”,让 AI 自动构思、验证、构建并分发软件产品,招募现场办公的创始工程师。Piq Energy 做电网接入软件,帮助可再生能源与大负载项目加快并网,开出 15 万至 25 万美元加股权,技术栈包括 TypeScript、Svelte、GraphQL、Python 和 LLM agent。Hatchet 是开源后台任务调度平台,从 2024 年初的分布式任务队列起步,目前服务大量 AI 公司处理日志摄取、代码评审 agent、视频编码和 GPU 调度等工作负载,招募全栈工程师。
垂直应用方面,Hotwash 由一位单人创始人(西点军校、游骑兵团、耶鲁法学院背景)运营,为消防部门提供事后复盘平台,目前 ARR 4 万美元、11 个付费消防局零流失,正在融 100 万美元种子轮,招首位工程师并可升任 CTO。Kyra Health 在医疗、金融、合规与 AI 交叉处建设全国 ICHRA 平台,强调”实施成本在下降,工程判断力没有”。
整体来看,岗位描述中”AI agent""LLM workflow""evals”等关键词出现频率明显高于一年前,多家公司直接将 AI 辅助开发能力列入要求;同时也仍有公司在职位描述中刻意写明”不要求用 AI agent 完成工作”,反映出社区内部对 AI 工具态度的分化。
9. 斯坦福 CS336 给 AI 编程助手的使用规范
斯坦福”从零实现语言模型”课程 CS336 在作业仓库中放置了一份 CLAUDE.md,规定 ChatGPT、Claude Code、Copilot、Cursor 等 AI 编程助手在协助学生时应当遵循的行为边界。文件的核心定位是:AI 应扮演助教,而非答案生成器。
允许的行为包括:在学生困惑时解释概念并引导其自行建立理解、指向课程讲义和官方文档、对学生已写代码给出改进方向和边界情况提示、通过提问而非直接修复来辅助调试、解释 Python/PyTorch/CUDA/Triton/分布式训练的错误信息、建议 sanity check 和小型玩具样例。
禁止的行为相当严格:不得写任何 Python 或伪代码、不得给出问题解答、不得完成 TODO、不得编辑学生仓库中的代码、不得运行 bash 命令、不得将作业需求直接转化为可运行代码,也不得实现核心组件如 tokenizer、transformer block、optimizer、训练循环、Triton kernel、分布式训练逻辑、scaling law pipeline、数据过滤去重 pipeline 或对齐/RL 方法。文档还提供了”好/坏交互”示例:当学生说”我的因果掩码有问题,告诉我哪里错了”,助手应反问其已尝试的内容,再提示检查 mask 是否在 softmax 前应用、是否正确广播、masked 位置是否填为极负值,而不是直接给出修正代码。
HN 讨论中,有教师表示自己也在课程中尝试类似的 AGENTS.md,认为这份过于冗长容易掉出上下文窗口,自己用 30 行简洁规则效果更好,并要求学生保留 .history 文件记录所有 prompt 以便评分。有人推荐 Claude Code 的 Learning mode 作为对应工具支持。HTMX 作者 Carson 指出这份文档明显借鉴了他五个月前发布的 agent.md 模板,课程作者也确认参考过该 gist。批评意见集中在几点:禁止运行 bash 命令被认为不合理,因为这本就不属于教学内容;规则只能约束遵守它的学生,使用课程外的模型即可绕过;将”被禁止替用户行动”的实体称为 agent 而非 assistant 在用词上略显别扭。也有评论指出,在 AI 普及背景下这是介于”完全禁用”与”放任使用”之间较为务实的平衡。
10. Ask HN:2026 年 6 月谁想被雇佣
- 原文: https://news.ycombinator.com/item?id=48357724
- HN: https://news.ycombinator.com/item?id=48357724
- 得分: 77
- 评论: 246
HN 每月的求职配套帖,2026 年 6 月版获 77 分、246 条简历回复。从样本中可以看到当下求职者画像的几个特征。
资深系统/性能方向工程师仍然活跃:俄亥俄州的一位求职者主打 C++、SIMD、x86/ARM 汇编、HEVC 解码器实现与音视频系统,曾独立做过商用 C++20 音频软件全栈。另一位加州求职者拥有 13 年 FAANG 经验,近期在 Astral 参与 Ruff 开发,明确表态”希望加入有人本主义使命、不要求用 AI agent 完成工作”的公司,反映出工具链工程师群体中对 AI 编码工作流的反弹。
全栈与 AI 应用方向占比很高:旧金山湾区、SF Bay、伦敦、基辅、班加罗尔等地的候选人技术栈普遍包括 TypeScript、React、Next.js、Python、LLM API、embeddings、向量数据库、structured outputs、prompt 版本管理、evals、人工审核流。一位乌克兰候选人描述自己最近构建的 AI 研究/数据抽取系统将原本数周的工作压缩到约 30 分钟、处理了数百万文档。
工程管理类候选人也出现:班加罗尔的求职者在 Qure.AI 工作 7 年,做过医学影像 AI 后端、Bazel monorepo 迁移,并领导过约 20 人的工程团队,将胸片 AI 推广到 80 多个国家 2000 多个站点,目前寻找 Director/Head of Engineering 职位。伦敦的候选人则是 YC 支持的物质使用管理平台 Pelago Health 的创始工程师,在那里工作 7 年,强调 A-method 招聘、HITRUST 合规和每日多次发布的能力。
地理分布上欧美仍是主体,远程优先是默认选项,多数候选人不愿迁移;薪资期待与岗位帖中的范围基本对齐。
11. 佛罗里达州起诉 OpenAI 和 Sam Altman
2026 年 6 月 1 日,佛罗里达州共和党总检察长 James Uthmeier 对 OpenAI 及其 CEO Sam Altman 提起诉讼,指控 ChatGPT 不安全且公司就相关风险误导公众。这是首例由州一级政府针对 OpenAI 和 Altman 提起的诉讼。
诉状称 ChatGPT 对儿童构成风险,并对”一系列伤害”负有责任,包括成瘾以及协助和教唆大规模枪击与自杀,依据州不公平贸易实践法、产品责任法、公共妨害法与过失法寻求民事罚款。诉状写道,OpenAI 的崛起”归因于一张欺骗之网,以及对用户(包括佛罗里达居民)的剥削,以不可接受的代价利用其数据和安全来推高市值”。Uthmeier 在西棕榈滩的新闻发布会上表示希望并预期其他州会跟进,并提到 2025 年一起据称借助 ChatGPT 实施的大规模枪击案,称如果嫌疑人是与人而非 AI 对话,检方本可追加共谋罪。此案与近期一批针对大型科技公司的产品责任诉讼形成同一潮流——3 月新墨西哥州陪审团对 Meta 判罚 3.75 亿美元,洛杉矶陪审团也对 Meta 和 YouTube 作出裁决。
HN 评论以质疑居多。多数人认为诉讼缺乏证据基础,类比 90 年代起诉电子游戏厂商”腐蚀青少年”的运动,预期不会胜诉,更像是政治表态。有人指出枪支制造商在产品责任上享有豁免,反而要求聊天机器人厂商承担用户精神健康危机的责任在法理上失衡,并戏谑地贴出一段循环返回”说得对”的几行 JavaScript 代码,质疑这是否也会在佛州构成责任。还有评论指出,将这类工具称为”AI”可能让公众高估了 LLM 的能力,是这种诉讼出现的认知前提;DeSantis 的 2028 年总统竞选野心也被视为政治背景。少数评论认可 OpenAI 在心理健康场景缺乏护栏方面确有责任,但更多人担心此类诉讼会形成不良先例:最终可能只换来一份措辞模糊的和解令,增加合规成本、抬高新进入者门槛,却无助于实际的危害削减,同时把复杂的技术议题进一步政治化。
12. 斯坦福 CS336:从零构建语言模型
- 原文: https://cs336.stanford.edu/
- HN: https://news.ycombinator.com/item?id=48357075
- 得分: 324
- 评论: 40
斯坦福 CS336 是一门”从零实现语言模型”的高强度课程,灵感来自那些让学生从头写一整个操作系统的 OS 课程。课程覆盖语言模型开发全流程:预训练数据收集与清洗、Transformer 架构构建、训练、评估与部署。它是一门 5 学分课,明确警告作业代码量将比其他 AI 课程多一个数量级。
先修要求包括熟练 Python、PyTorch 与系统优化基础(内存层级等)、本科微积分与线性代数、基础概率统计,以及 CS221/229/230/124/224N 级别的机器学习基础。
五个作业循序构建完整 LLM 体系:作业 1 实现 tokenizer、模型架构、optimizer 并训练一个小语言模型;作业 2 用 Triton 自己实现 FlashAttention2,并构建内存高效的分布式训练;作业 3 理解 Transformer 各组件并拟合 scaling law 推断模型扩展;作业 4 把原始 Common Crawl 转为可用预训练数据,做过滤与去重;作业 5 通过 SFT 和 RL 训练模型在数学题上推理,可选实现 DPO 等安全对齐方法。课程允许使用 LLM 解决低层编程和高层概念问题,但禁止直接求解作业,且强烈建议关闭 Cursor Tab、Copilot 等 AI 自动补全。课程获 Modal 赞助 GPU 算力,并列出 Modal、Lambda Labs、RunPod、Nebius、Together 等云厂商的 B200 单卡价格(约每小时 5 至 7 美元)供自学者参考。
HN 讨论中,多位自学者分享了经历。一位完成 2025 版课程的学习者表示,前两个作业需要大量思考和调试,自己用业余时间花了几个月才完成,难以想象在校学生如何按两周节奏交付,对课程组的内容设计与作业质量给予高度评价。也有人组织了 30 多人的线上学习小组,按每周一节视频推进,最后剩下 8 人坚持到结束。关于 GPU 需求,评论倾向于认为前期在 CPU 调试、用 4090 或 5080 级别消费卡足以跟随大部分内容,仅在最大训练或基准测试时才需要 B200 级别算力。也有评论怀念 Richard Socher 早期 pre-Transformer 时代的 cs224d 课程。
13. 我故意把手机变慢了
作者购入全新 iPhone 17 后,立刻动手把它变慢,目的是治自己的”doomscrolling”(无意识刷信息流)问题。作者尝试过冷火鸡式戒断和应用拦截器,发现它们都没有触及渴望本身、且容易被绕过。
作者提出一个”饼干思想实验”:如果口袋里有台机器随时烤新鲜巧克力饼干,人会在每次稍感无聊时就吃一块;如果最近的饼干在四小时车程外,几乎不会吃;如果厨房里有但已经发硬,多数时候也会放着不管。手机就是口袋里的饼干机,关键是让饼干变得更难拿或不那么诱人。
技术路径上,作者发现让饼干变”陈旧”最有效的杠杆是网速。Instagram Reels、TikTok 这类无限刷视频流的产品高度依赖快速稳定的网络连接,文本型应用如 Reddit、X、Threads 也需要持续加载图片。基于此,作者开发了 iOS 应用 VineWall,可对特定应用进行网速限流:起步时把速度限制到类似信号不佳的蜂窝水平,视频会出现可见的方块状压缩;随着持续滑动,限流逐步加重,视频质量持续下降,文本应用图片变成灰框,最终用户更多时间在盯加载转圈,从而触发”我真的想要这块饼干吗”的反思。
HN 讨论提供了大量类似的反成瘾经验。最常被推荐的是 One Sec,它在打开成瘾应用时插入强制等待并可调用前置摄像头自拍,有评论者借此成功删除 Instagram 不再回头。另一位用户买了一台旧 Samsung S21 专门装”成瘾应用”放在固定椅子旁,主 iPhone 上则全部卸载,使每日刷屏时间从 4.5 小时骤降到 2 小时。还有人推荐用 Apple Configurator 配合 MDM 实现远比家长控制更严格的应用与网站禁用,甚至卸载 Safari。其他做法包括在所有社交媒体上登出账号制造摩擦、在 Safari 中全局关闭 cookies、转用 AOSP 翻盖机配合自己用 AI 临时构建的 APK 满足实际需求。也有反对意见提醒:真正用过慢手机的人会发现 doomscroll 不会停止,只会变得更挫败和痛苦;以及 xkcd 862 中提到的”以懒惰对抗急躁”思路——给所有页面加 30 秒强制等待,常用站点的吸引力会自然消失。
14. 超级智能:吞噬聪明人的那个想法(2016)
- 原文: https://idlewords.com/talks/superintelligence.htm
- HN: https://news.ycombinator.com/item?id=48360137
- 得分: 114
- 评论: 138
这是 Maciej Cegłowski 于 2016 年 10 月在 Web Camp Zagreb 的演讲文字版,反复在 HN 流转。文章从 1945 年洛斯阿拉莫斯物理学家计算核试验是否会点燃大气层切入,类比当下围绕”机器智能失控”的论证。作者并非否认 AI 重要,而是系统拆解 Nick Bostrom 在《Superintelligence》中所依赖的前提链条,指出整个论证更像一种特定的宗教式叙事。
作者列出该论证所需的若干前提:思维实体存在(“我们肩上的会思考的肉盒”作为概念证明);大脑是普通物质构型、可被复制和模拟(即否定 Penrose 式量子神秘主义和灵魂假设);可能心智的空间巨大,人类智能水平并非自然上限——类比猎豹很快但摩托车更快,进化无法直达摩托车,需要先造出能造机器的人;硬件仍有数个数量级的下探空间,物理极限远高于经济极限;电子心智将以微秒而非数小时为时间尺度运行,能在新硬件上重新设计并迁移自身。基于这些前提,论者推出”智能爆炸”必然且危险的结论。作者后续部分则解构这些前提的若干隐藏假设,并提出更好的科幻可以让公共讨论更健康。
HN 评论延续了文章的批判路径。有人指出”猎豹很快”的开篇细节其实就有错——历史上没有成年人被猎豹杀死的记录。多位评论注意到,2016 年关于超级智能的预言并未应验:真正显现的问题是幻觉、谄媚回答、对训练数据的极端依赖、以及需要数平方英里数据中心的物理基础设施回潮,这些都不是当年讨论的焦点。有评论批评文中”爱因斯坦也无法把猫装进笼子”的反论证其实相当糟糕——大多数养猫人都能办到,甚至可以借助药物把老虎装进笼子,正因为人类更聪明。另一类评论从文化角度切入,认为把 AGI 想象成全知全能可审判人类的存在,是西方读者潜意识中的亚伯拉罕式上帝投射,现实可能更接近生物学意义上的脆弱适应系统;推荐 Lem 和 Strugatsky 兄弟的东欧科幻作为更成熟的想象资源。也有评论从根本上拒绝”大脑可由普通物质完全复制”的前提,认为整个论证由此倒塌。
15. 只有 17% 的 64 位整数能写成两个 32 位整数的乘积
Daniel Lemire 的博客探讨了一个看似简单却有趣的数论问题:在所有 64 位无符号整数中,有多大比例能被写成两个 32 位整数的乘积。答案是约 17%,精确数字为 3,215,709,724,700,470,902 个。
文章起因于作者设计哈希函数 clhash 时的思考。一个朴素的哈希思路是将整数的高位与低位相乘,但若希望哈希值在输出空间上均匀分布,则乘法显然不合格——因为大部分输出值根本无法由两个较小整数相乘得到。Erdős 早已证明,当 n 增大时,能由两个 n 位整数相乘得到的 2n 位整数所占比例趋于零。对于较小规模(如 16 位乘 16 位得 32 位),可以暴力枚举得出约 1/5 的覆盖率;但 32×32→64 位的情况无法暴力穷举。Webster 等人的论文给出了可扩展的精确计算方法,并开源了代码,从而得到了 17% 这一结论。
文章还讨论了反向问题:给定一个 64 位整数,如何找出它能否拆成两个 32 位因子。一种方法是先做完整素因子分解,再构造所有小于 2^32 的因子组合,最后取最大者验证另一因子是否也在范围内。
HN 评论中,有读者指出乘法满足交换律,因此 2^64 立刻减半接近 2^63,“大多数无法表示”这一说法本身并不令人惊讶;真正有趣的是定量分析乘积空间的重叠程度。有人指出这正是数论中 “B-光滑数”(B-smooth)概念的体现,此处 B = 2^32。也有评论给出更高效的概率估计算法:随机抽样后用 Miller-Rabin 判素,再用 Pollard rho 做有限步因子分解,可在常数时间内得到逼近 17% 的估计值。另有评论将其与 Erdős-Kac 定理联系起来:乘法表中的数典型素因子个数约为 2·log(log(n)),而随机数约为 log(log(n)),从而解释了为何乘积覆盖率趋于零。还有评论联想到 Benford 定律,认为这类乘法分布特性是其底层成因之一。
16. 历时数十年,加州 Alameda Creek 恢复了鲑鱼与虹鳟的洄游通道
NOAA 渔业局发布的这篇报道讲述了加州 Alameda Creek 历时近三十年的鱼类洄游通道恢复工程。该溪流曾是旧金山湾区最大的虹鳟(steelhead)和奇努克鲑(Chinook salmon)产卵地,但由于公路涵洞、橡胶水坝、燃气管线等基础设施的阻隔,鱼类无法回到上游产卵。自 1967 年起,该溪上游再未见到虹鳟踪迹。
环保人士 Jeff Miller 于 1997 年发起这一恢复行动,最初他天真地以为”几年就能搞定”,结果用了 28 年。他成立了 Alameda Creek Alliance,并推动组建了由水务管理者、监管机构、非营利组织和社区组成的渔业恢复工作组,逐步在溪流沿线移除了 18 处障碍。
最后一处障碍是 PG&E 一条横跨溪流的天然气管线及其混凝土防护层,造成 8 英尺的落差。2022 年 PG&E 主动联系 California Trout 合作恢复。NOAA 栖息地保护办公室提供了 430 万美元,加上 PG&E 和其他出资方,项目于 2024 年夏天动工:先将鱼类、青蛙等生物迁移,将溪水改道,在原位下方 20 英尺挖沟铺设新管,拆除旧管和混凝土垫,并对约 1800 英尺的河床进行重新塑形,恢复自然坡度。工程于 2025 年秋完工。Sunol Regional Wilderness 上游 20 多英里的优质产卵地终于再次对洄游鱼类开放。
HN 评论提及华盛顿州 I-90 高速公路下方也有类似的科卡尼鲑(Kokanee Salmon)洄游通道恢复工程。有从事湾区鱼类种群监测的评论者表示,这意味着监测点可能会捕获到虹鳟和奇努克鲑。有读者提出疑问:鲑鱼通常回到出生地产卵,那么通道被切断数十年后,鱼是如何”重新回来”的?相关回答涉及到上游残留的虹鳟种群仍保有洄游遗传特征,理论上幼鱼可以下海再以成鱼身份回归。也有评论对 PG&E 这样的大公司主动参与生态修复表示欣慰,并对报道中提到的匿名”湾区基金会”未具名表示困惑。
17. GitHub 与软件之罪:一位开发者对其可靠性与方向的长篇批评
- 原文: https://eblog.fly.dev/githubbad.html
- HN: https://news.ycombinator.com/item?id=48361064
- 得分: 179
- 评论: 75
Efron Licht 在博客中发表了一篇长文,对 GitHub 当前的状态进行了系统性批评。作者本身专攻高可用分布式系统,他将 GitHub 视为大型科技公司基础设施衰退的典型样本。
作者列举了 GitHub 的多项问题:根据其自有状态页,每月发生数十起事故,实际数量可能更多;没有公开的 bug 列表,问题被埋没在邮件链中;按其自己的指标已违反 SLA;明显将”花哨的 AI 功能”置于基础可靠性之上;“agentic” 负载激增是 Microsoft 和 GitHub 自身行为导致的;在 Firefox 和 Safari 上经常出问题;纵容刷 star 和买粉行为(甚至引用了 CMU 的论文指出”虚假 star 与恶意活动高度相关”);PR 页面消耗大量内存(堆峰值超过 512 MiB);经常未经通知就重置用户设置并默认启用危险新功能;GitHub Actions 设计糟糕、缓存策略幼稚、日志泄漏内存;前端代码臃肿迟缓,UX 频繁变动并不断把功能漏斗导向 AI 系统。文章随后通过对比 GitHub、GitLab 和 Codeberg 三方仓库页面的网络流量与堆使用进行了实测。
HN 讨论非常活跃。有读者分享了同时推送到 GitHub、GitLab 和 Codeberg 的 git config 配置方法。多位评论者表示已转向自托管 Gitea 或 Forgejo,并感受到”自由”。有趣的是,一位用户指出他同时使用 GitHub 和 Azure DevOps,后者体验极佳从无故障,疑惑为何同属微软的两套系统差异如此大。有评论提到 nginx 被迫迁移到 GitHub,并认为真正的锁定在于 star 数量这一行业默认的项目可信度货币。有人正在为 Forgejo 开发更轻量的替代前端。也有评论批评作者博客本身配色和字号难以阅读。还有评论感慨”黑客文化去哪了”,质问为何懂技术的人反而一次次把代码交给大公司。也有较为持平的看法:自托管 GitLab 极其消耗资源,空跑都要数十 GB 内存。
18. Kefir C 编译器停止公开开发,作者转入私下模式
- 原文: https://kefir.protopopov.lv/posts/announce2.html
- HN: https://news.ycombinator.com/item?id=48354224
- 得分: 126
- 评论: 105
Kefir 是一个一人维护的开源 C 编译器项目,以通过 GCC torture 测试套件的完整性著称。其作者 Jevgenijs Protopopov 宣布无限期停止公开发布新的实质性开发成果,转入”私人模式”。已发布的代码仍可访问,bug 报告也会处理,但未来的重大改动将仅供作者自娱自乐。
作者列出了多重原因。首先是规模与资源的不匹配:编译器已经发展到他难以在保持质量(正确性、优化、调试信息、与其它特性的集成)的同时单人推进有趣实验的程度。要么降低质量门槛,要么投入更多时间——两者皆不可接受。
其次是”投资回报”的考量。作者强调他更看重非货币性回报,比如真实反馈、积极互动等。虽然他感谢所有参与者,但当前的活跃度不足以让他把这项工作从”有趣的爱好”升级为”无私的公益服务”。他过去几个月曾尝试为该工作寻求一些”合法化”安排,但均无结果。他也尝试通过演讲和公告增加曝光,但经历了一些不愉快的互动。
最重要的一点是 AI 对开源生态的冲击。作者本人坚持手写实现,未在该项目中使用 AI。但他越来越觉得自己无偿工作的主要受益者是抓取互联网训练大模型的公司,这与他选择 GPLv3 许可的本意相违背。“公开发布”不再是他的默认选项。
HN 讨论中,多位开发者表达了类似的疲惫感。一位评论者分享了自己捐赠驱动的小站因爬虫无视 robots.txt 而崩溃的经历。多人表示已开始考虑或已实施只对自己的代码加锁、加密码保护。一位 Swiss 法律背景的开源开发者反驳了”AI 训练违反 GPL”的说法,指出 GPL 明确允许商业使用,这是 Stallman 原始愿景的一部分,FSF 也未提出过此类主张。也有讨论认为 LLM 改变了”看到代码意味着背后有人付出思考”这一隐含契约。还有人对项目未来表示惋惜,希望出现 fork,并指出 Kefir 是少数能通过 GCC torture 完整测试的小型编译器之一。
19. RGB 值归一化应该除以 255 还是 256?
- 原文: https://30fps.net/pages/255-vs-256-division/
- HN: https://news.ycombinator.com/item?id=48360054
- 得分: 160
- 评论: 65
这篇 30fps.net 的文章探讨了图像处理中一个看似琐碎却争议持久的问题:把 8 位整数颜色转换为浮点时,应该除以 255 还是除以 256(外加 0.5 偏移)?
标准做法是 f = i / 255.0,将 0 映射到 0.0、255 映射到 1.0,GPU 的 UNORM 转换也是这样做的。其优点是黑色就是 0.0,可以直接判断。替代做法是 f = (i + 0.5) / 256.0,将每个浮点值放在两个整数的正中间。
作者分析了”除以 255”的几个被诟病之处。第一是极值处的”半 bin”问题:若将 [0,1] 范围内的均匀随机噪声量化回 8 位,0 和 255 出现的频率只有其它值的一半。文章用 100 万次采样的直方图验证了这一点。但作者认为,由于结果通常会被截断(clip),实际处理中这种偏置并不会造成真正问题。第二是不精确性:128/255 ≈ 0.501961 而非整齐的 0.5,但这种误差在 23 位尾数下完全可忽略,更多是审美而非技术问题。第三是浮点值未落在整数中间——这种”中点”特性在加抖动(dithering)等场景下确实更方便,相关讨论曾出现在 Andrew Kesler 2015 年的博文中。
文章进一步引入量化理论中的概念,把两种方案归入”mid-tread”(标准方案,0 是重建点)与”mid-riser”(替代方案,0 是分类阈值)两类经典量化器。
HN 讨论中,一位评论者举出生动例子:在用 MCU 生成 VGA 信号时(3+3+2 位 RGB),255 vs 256 的选择直接影响电压输出,导致蓝色电平与红绿电平无法对齐,纯灰色无法呈现。另一位支持 +0.5 方案的评论者认为,SDR 图像的”零”并非绝对零亮度,广播系统历史上用 16-235 作为亮度范围,“必须有零”本身就是一种偏见。也有评论指出作者混淆了”bin”和”bin 边界”,认为如果按边界理解原图,标准方案的直方图并无异常。还有人主张应该乘以 255、加抖动、用 FPU 默认的 IEEE 754 舍入即可,无需 0.5 把戏。也有读者提醒这两种方案都假设线性传递函数,实际中很少成立。
20. 看似生物化学的过程,可能是地质学的天然特征
Quanta Magazine 报道了法国国家农业研究院 Sébastien Fontaine 团队历时 15 年的研究。最初他们只想测量”无生命土壤”释放的碳,作为对照基线。他们将土壤密封后用伽马射线灭菌,预期 CO₂ 释放会归零——结果土壤持续”呼吸”了数周、数月,甚至最终达到 6 年。
研究者反复确认土壤确实无生命:电子显微镜下虽能看到细胞,但染色未显示 RNA 或 DNA;加强辐射、加压、加热也未改变结果;故意污染样本则会让 CO₂ 排放急剧升高,证明灭菌本身是有效的。在加入酵母酶后,碳排放也会立刻飙升,提示某些反应本就在缓慢进行、被酶加速。
团队随后探究机制:他们在 6 个月大的灭菌土样中检出了 Krebs 循环(三羧酸循环)8 种中间产物中的 4 种,且很多是在辐照之后才形成的。他们还设计了一个燃料电池实验,发现灭菌土壤能支持显著高于盐水对照的电流,提示存在类似有氧代谢中的电子传递过程。补充葡萄糖的样本排放更高,进一步支持了”非生物催化剂能驱动类似糖代谢”的推测。
如果结论成立,那么一些被视为生命标志的生物化学反应可能并非生命独有,甚至可能早于地球生命存在——正如有机化学家 Joseph Moran 所说,“生命的化学并不只属于生命,它是地质的化学”。
HN 评论将此与”地球化学孕育生物化学”的长期假说联系起来,提到海底碱性热泉等稳定能量梯度可能在数十亿年中”制造”出有机化合物。多位评论者期待这一发现对 Europa、Enceladus 等冰卫星生命探测的启示,同时也警示火星土壤实验可能出现”代谢假阳性”。也有质疑声:自由氧和糖本身就是生命的产物,早期地球并无大量游离氧,这更像是”木头会燃烧——即使树已死”的缓慢热力学回归,需要研究厌氧条件下是否也能发生类似反应。还有评论被布鲁克海文国家实验室的”伽马森林”故事联系起来:1961–1978 年用铯-137 源辐照松林,灭菌后的土壤近 50 年仍几乎寸草不生。