HN Daily Reading · 每日阅读

HN 每日深度阅读 · 2026-04-15

本期从 Backblaze 改变备份范围和 Google 打击搜索劫持讲起,延伸到 Flock 监控、客户文件泄露、版本控制新工具和媒体档案保存。核心看点是服务商、平台和用户之间那些默认假设,一旦被改写,普通人很难第一时间发现。

2026.04.15 20 篇摘录

共 20 篇 · 约 8,649 字 · 约 23 分钟读完

1. Backblaze 悄悄停止备份你的 OneDrive 和 Dropbox 文件夹

一位使用 Backblaze 近十年的老用户 Robert Reese 发现,这家以”无限制备份所有用户数据”为卖点的云备份服务,在近期的客户端更新中悄悄将 OneDrive、Dropbox、Google Drive、Box、iDrive 等主流云存储服务的文件夹从备份范围中排除了——而且没有通过任何邮件或通知告知用户。

事件的发现过程颇具戏剧性。作者最初是在 2025 年因误操作 git push -f 丢失了 Git 历史记录,想从 Backblaze 恢复时发现 .git 文件夹已被静默排除。随后在 Reddit 上看到有用户反映 Dropbox 文件夹不再被备份,他立刻检查自己的账户,发现 383GB 的 OneDrive 文件夹同样消失了。

作者犀利地指出了几个核心问题:第一,同步不等于备份。OneDrive 和 Dropbox 仅保留删除文件 30 天,而 Backblaze 提供一年甚至无限期文件保留。如果云账户被封禁,用户可能彻底丧失数据。第二,信任的崩塌。Backblaze 将这一重大政策变更藏在软件发布说明的”改进”类别下,声称是为了”防止性能问题和过度数据使用”,但在官方的文件排除列表页面上却完全没有提及 OneDrive 或 Dropbox。第三,滑坡效应。既然 Backblaze 可以今天排除 Git 和云存储文件夹,明天就可能排除任何他们认为”不必要”的文件格式或目录。当一个备份服务不再承诺备份所有内容时,它实际上等于什么都没有备份。

这篇文章在 HN 上引发了大量讨论,许多用户分享了类似的发现经历。对于依赖 Backblaze 进行个人备份的用户来说,这是一个重要的警醒:永远不要假设你的备份服务正在备份你认为它在备份的东西。定期验证备份完整性,以及考虑多重备份策略,从来都不是多余的。


2. 谷歌搜索新增反垃圾政策:打击”返回按钮劫持”

谷歌搜索中心于 2026 年 4 月 13 日宣布扩展其垃圾网站政策,将”返回按钮劫持”(Back Button Hijacking)正式列为违反”恶意行为”政策的行为,违规网站将面临人工处罚或自动降权。

所谓返回按钮劫持,是指网站通过脚本或技术手段干扰浏览器的历史记录导航功能,当用户按下浏览器返回键时,不是回到之前访问的页面,而是被导向从未访问过的页面、被迫观看广告或推荐内容,或者被阻止正常浏览。这种行为严重破坏了用户对浏览器基本功能的预期。

谷歌表示,近年来这类行为呈上升趋势,因此决定将其明确列为政策违规。值得注意的是,谷歌早在 2013 年就已经声明,向用户浏览器历史中插入欺骗性或操纵性页面违反了 Google Search Essentials 的要求。此次政策更新更多是将既有立场正式化和明确化。

谷歌给网站所有者留出了两个月的过渡期——新政策将于 2026 年 6 月 15 日正式执行。谷歌还特别提醒,某些返回按钮劫持行为可能源自网站引入的第三方库或广告平台,建议网站所有者全面审查技术实现,移除或禁用任何导致此类行为的代码、引入或配置。

这一政策变化对 SEO 和网站运营领域意义重大。长期以来,部分网站利用 history.pushState() 等 API 在用户浏览历史中注入虚假记录,以此延长用户停留时间或增加广告曝光。谷歌此举既是对用户体验的保护,也是对搜索生态质量的维护。对于正规网站运营者来说,这是一个自查技术栈的好时机。


3. DaVinci Resolve 新增照片编辑功能

Blackmagic Design 为其旗舰后期制作软件 DaVinci Resolve 21 新增了一个全新的”照片”页面(Photo Page),首次将好莱坞级别的专业调色工具引入静态摄影领域。这一举措标志着 DaVinci Resolve 从视频后期制作工具向全能影像处理平台的转型。

新增的 Photo 页面具备几个核心能力:首先,专业级调色系统。摄影师可以使用与电影调色完全相同的节点式工作流程(node-based workflow),包括一次调色(primary color correction)、曲线、限定器(qualifiers)和 Power Windows 等工具。这远远超越了传统照片处理软件的图层式方法。专业示波器如波形图、矢量示波器和直方图也一应俱全。

其次,原生 RAW 支持。Photo 页面支持佳能、富士、尼康、索尼甚至 iPhone ProRAW 格式,所有图像处理在源分辨率下进行,最高支持 32K(超过 4 亿像素),不受项目分辨率限制。非破坏性处理意味着用户可以随时重新解读原始传感器数据。

第三,云端协作。DaVinci Resolve 是唯一支持多人同时在同一项目上协作的后期制作软件。通过 Blackmagic Cloud,可以共享相册、元数据、标签和调色效果。好莱坞调色师甚至可以远程为时尚摄影棚内正在拍摄的照片进行实时调色。

第四,AI 和 GPU 加速。AI IntelliSearch 让用户可以在整个图片库中搜索特定对象、人物或动物。GPU 加速使批量导出速度远超传统照片应用。

这一消息在 HN 上获得了超过 1000 分的高关注度,社区讨论集中在它对 Adobe Lightroom 和 Capture One 的潜在冲击上。考虑到 DaVinci Resolve 的免费版本已经功能极其强大,Photo 页面的加入无疑会让更多摄影师考虑将其纳入工作流程。


4. jj——Jujutsu 版本控制系统教程

Steve Klabnik(Rust 编程语言和 Ruby on Rails 的知名贡献者)发布了一份全面的 Jujutsu(jj)版本控制系统教程,在 HN 上引发了超过 400 条讨论。jj 是一个新一代的分布式版本控制系统(DVCS),它的核心理念是:比 Git 更简单、更易用,同时更强大。

Jujutsu 的关键创新在于它融合了 Git 和 Mercurial(hg)的最佳特性,形成了一种既新颖又似曾相识的体验。教程涵盖了从基础概念到高级工作流程的完整学习路径:创建仓库(jj git init)、查看状态(jj st)、描述提交(jj describe)、创建变更(jj new)、查看日志(jj log)等基础操作;以及 Squash 工作流、Edit 工作流、匿名分支、revset 查询、合并和冲突处理等进阶主题。

jj 相较于 Git 的核心优势包括:更少但更强大的核心命令集,命令之间以更干净的方式协同工作;支持匿名分支,可以同时在多个分支上工作;以及操作日志(Operation Log)提供的强大撤销能力。

尤其值得注意的是 jj 的零风险试用特性:由于它提供了兼容 Git 的后端,用户可以在自己的 Git 仓库上独立使用 jj,无需团队其他成员一起切换。如果不适合,可以随时返回 Git,不会丢失任何历史记录。这极大地降低了尝试新工具的门槛。

社区讨论热烈,许多已转向 jj 的用户分享了他们的正面体验,尤其在处理复杂的变基(rebase)和多分支并行开发场景时,jj 的表现远优于 Git。


5. 我给 Flock Safety 写信要求退出他们的国内监控计划

一位加州居民 Kirk Strauser 依据《加州消费者隐私法》(CCPA)向 Flock Safety 公司发送了数据删除请求,要求删除关于他本人、车辆和家庭成员的所有信息,并拒绝未来的数据收集。Flock Safety 是美国最大的车牌识别(LPR)监控公司之一,其摄像头遍布全美社区和街道,自动捕获过往车辆的车牌信息。

然而,Flock Safety 拒绝了这一请求。他们的回复充满了法律术语上的推诿:声称自己只是”服务提供商和数据处理者”,数据的所有权和控制权属于他们的客户(通常是地方执法部门或社区物业管理公司),因此建议 Strauser 直接联系聘用 Flock Safety 服务的组织来提交请求。

这一回复引发了广泛争议。从法律角度看,Flock Safety 是实际收集和处理个人可识别信息的实体——他们的摄像头部署在公共空间,拍摄公共道路上的车辆,生成的数据流经他们的系统。CCPA 的适用对象应当包括数据的实际收集者和处理者。Strauser 表示他正在考虑是否聘请律师进行进一步维权。

Flock Safety 还在回复中列出了若干”安慰性”条款:数据默认仅保留 30 天、不出售数据、LPR 只采集车辆特征而非姓名地址等。但批评者指出,这些说辞回避了核心问题——一个遍布全国的监控网络在居民未知情、未同意的情况下持续追踪他们的行踪,无论数据保留多久,这本身就是对隐私权的侵犯。

这一事件折射出美国隐私法执行中的深层困境:当监控技术公司以”数据处理者”身份自居,将责任推给政府或企业客户时,个人几乎无法有效行使自己的数据权利。


6. 数千份珍贵演唱会录音登陆互联网档案馆

芝加哥的超级乐迷 Aadam Jacobs 自 1980 年代以来一直在录制他参加的每一场演唱会,积累了超过 10,000 盘磁带的惊人收藏。如今 59 岁的 Jacobs 意识到这些磁带终将随时间降解,于是同意让互联网档案馆(Internet Archive)的志愿者团队将它们数字化。

目前已有约 2,500 盘磁带被上传到互联网档案馆,其中包含许多极为珍贵的录音。最引人注目的是一场 1989 年的 Nirvana 演出录音——那时距离他们凭借《Smells Like Teen Spirit》一炮走红还有两年。此外还有 Sonic Youth、R.E.M.、Phish、Liz Phair、Pavement、Neutral Milk Hotel 等有影响力的乐队此前从未流出的现场录音,以及大量朋克乐队的演出记录。

数字化工作本身就是一项了不起的社区协作。志愿者 Brian Emerick 每月开车到 Jacobs 家取回几箱磁带,使用老式卡带播放器将其转录为数字文件。其他志愿者则负责清理音频、组织分类和标注曲目信息——甚至要追踪那些已被遗忘的朋克乐队的歌曲名称。

虽然 Jacobs 当年使用的录音设备相当简陋,但互联网档案馆的志愿者音频工程师们通过专业处理,让这些录音焕发了新的生命力。这个项目是互联网最美好一面的缩影:一个人几十年的热爱,加上一群志愿者的无私付出,为全人类保存了不可替代的文化遗产。


7. Claude Code Routines:让 AI 编程助手自动化运行

Anthropic 为其 AI 编程工具 Claude Code 推出了一项名为”Routines”(例程)的新功能,目前处于研究预览阶段。这一功能的核心理念是将 Claude Code 从一个需要人工交互的编程助手,变为一个可以在 Anthropic 托管的云基础设施上自动运行的自动化代理。

Routines 的设计包含三种触发方式:定时触发,支持每小时、每晚或每周等定期执行计划;API 触发,通过向特定端点发送 HTTP POST 请求按需启动;GitHub 事件触发,可以自动响应 Pull Request、Push、Issue 或 CI/CD 工作流等代码仓库事件。一个 Routine 可以组合多种触发方式。

官方文档列举了几个典型应用场景:自动化待办事项管理(每晚读取新 Issue、分配标签和负责人、发送 Slack 摘要);告警分类(监控系统触发时自动关联堆栈跟踪与最近提交,生成修复 PR);定制化代码审查(按团队特定的检查清单自动审核 PR,留下行内评论);部署验证等。

Routines 可通过 Web 界面(claude.ai/code/routines)、CLI 命令(/schedule)或桌面应用创建和管理。该功能对 Pro、Max、Team 和 Enterprise 计划用户开放。

这一发布在 HN 社区引发了关于 AI 自动化编程的热烈讨论。支持者认为这标志着 AI 编程工具从”辅助工具”向”自主代理”的重要转变;怀疑者则担忧自动化代码修改可能带来的质量和安全风险。无论如何,Routines 代表了 AI 编程工具演进的一个重要方向:从人机对话走向无人值守的自动化工作流。


8. YouTube 超越迪士尼成为全球最大媒体公司

据金融研究机构 MoffettNathanson 的最新分析,YouTube 在 2025 年以估计 620 亿美元的营收超越了华特迪士尼公司的媒体业务(609 亿美元,不含迪士尼体验部门),正式成为全球最大的媒体公司。

这一里程碑背后是 YouTube 多元化的收入结构。广告收入方面,YouTube 仅在 2025 年第四季度就达到了 114 亿美元,全年广告收入超过 400 亿美元。但 YouTube 的商业版图远不止广告:YouTube Premium、YouTube Music、NFL Sunday Ticket 和 YouTube TV 组成了庞大的订阅业务。其中 YouTube TV 已有约 1,000 万订阅用户,预计将在未来几年超越 Charter 和 Comcast 等传统付费电视巨头。

MoffettNathanson 将 YouTube 评估在 5,000 至 5,600 亿美元之间,远超任何传统媒体竞争对手(Netflix 市值约 4,090 亿美元,排名最近的传统媒体公司)。YouTube 已累计向创作者、音乐公司和媒体合作伙伴支付了超过 1,000 亿美元。

YouTube CEO Neal Mohan 表示,YouTube 为创作者做两件根本性的事:帮助他们建立全球受众并连接粉丝,以及帮助他们建立商业模式。MoffettNathanson 认为,YouTube 将是 AI 浪潮的主要受益者——AI 工具将帮助创作者以更快的节奏制作更多内容。在几乎所有其他媒体公司原地踏步甚至倒退的时代,YouTube 和 Netflix 是仅有的仍在加速增长的玩家。2024 年营收突破 500 亿,2025 年突破 600 亿——YouTube 的天花板在哪里?


9. 加州审查 3D 打印立法的危险

电子前沿基金会(EFF)发文强烈反对加州提出的 A.B. 2047 法案,该法案要求所有 3D 打印机强制安装”审查软件”(censorware),以阻止用户打印被认定为危险物品(主要是所谓的”幽灵枪”)的文件。更令人担忧的是,该法案将使用开源固件替代方案定为轻罪——这意味着仅仅因为在自己的 3D 打印机上安装第三方固件就可能面临刑事指控。

EFF 从多个角度分析了这一法案的危害。首先,技术上行不通。算法打印阻止(algorithmic print-blocking)永远无法有效识别所有可能的武器设计,但它会误拦合法用途的打印。其次,消费者权利受损。这一法案实质上是将 HP 在 2D 打印机领域的垄断策略合法化——厂商可以锁定用户使用一方耗材和工具、强制通过一方商店购买、并通过停止更新打印阻止系统来实施计划报废。第三,竞争环境恶化。小型制造商和开源社区将承受不成比例的合规成本,而大型厂商反而因此获得更多市场控制力。第四,二手市场受创。转售不合规的 3D 打印机可能面临轻罪处罚。

EFF 将这一法案与数字版权管理(DRM)的历史教训相提并论:DRM 不仅未能阻止盗版,反而造成了维修障碍、消费者浪费和网络安全研究的困境。这篇文章呼吁加州立法者在为时已晚之前否决这一法案。


10. Fiverr 将客户文件公开且可搜索

这是一篇 HN 上的”Tell HN”帖子,揭露了自由职业平台 Fiverr 存在的严重安全漏洞:客户上传的文件被设置为公开且可被搜索引擎索引的状态。这意味着用户上传给自由职业者的私密文件——可能包含商业机密、个人信息、合同文档等——任何人都可以通过搜索引擎找到并访问。

这一发现对 Fiverr 的信誉构成严重打击。作为一个每天处理数百万次文件传输的平台,确保客户数据的隐私性和安全性应当是最基本的要求。将用户文件暴露在公开网络上不仅违反了用户的合理隐私预期,也可能违反了多个国家和地区的数据保护法规(如 GDPR、CCPA 等)。

该帖子虽然评论数不多(37 条),但获得了 227 分的高关注,表明社区对平台安全问题的高度关切。对于使用 Fiverr 或类似自由职业平台的用户来说,这是一个重要的安全提醒:在向任何第三方平台上传敏感文件之前,务必了解其数据存储和访问控制策略。


11. 内省式扩散语言模型:首个匹配同规模自回归模型质量的扩散语言模型

来自 Together AI、UIUC、普林斯顿和斯坦福等机构的研究团队发布了 I-DLM(Introspective Diffusion Language Models),这是首个在质量上与同规模自回归(AR)模型匹敌的扩散语言模型(DLM)。

扩散语言模型长期以来承载着一个诱人的愿景:通过并行生成 token 来打破自回归解码的顺序瓶颈。然而实践中,DLM 在生成质量上一直落后于 AR 模型。研究团队发现,这一差距源于**“内省一致性”的根本缺失**——AR 模型与自己生成的内容保持一致,而 DLM 却往往不然。

I-DLM 的核心创新是”内省跨步解码”(Introspective Strided Decoding, ISD):在同一次前向传播中,模型在生成新 token 的同时验证之前生成的 token。这种设计使得生成过程既保持了并行性,又通过自我验证确保了质量。

实验结果令人瞩目:I-DLM-8B 以仅 80 亿参数在 AIME-24 数学推理上得分 69.6(击败了 160 亿参数的 LLaDA-2.1-mini 的 43.3),在 LiveCodeBench-v6 编程测试上得分 45.7(对比 30.4),同时在高并发场景下实现了 2.9-4.1 倍的吞吐量提升。通过门控 LoRA 技术,ISD 甚至可以实现”逐比特无损”加速——生成的输出与基础 AR 模型完全相同。

I-DLM 还具有一个重要的工程优势:它使用严格的因果注意力机制,可以直接集成到现有的 AR 模型推理基础设施(如 SGLang)中,无需自定义基础设施。这意味着 I-DLM 可以作为现有 AR 模型的”即插即用”替代方案。


12. OpenSSL 4.0.0 发布

互联网安全基础设施的核心组件 OpenSSL 发布了 4.0.0 大版本更新,这是一次重大的功能发布,包含了大量不兼容变更和新功能。

重要移除项方面:完全移除了 SSLv3 支持(自 2015 年就已标记弃用,2016 年起默认禁用);完全移除了引擎(engine)支持,标志着向 Provider 架构的彻底转型;移除了 SSLv2 Client Hello 支持;移除了 c_rehash 脚本(改用 openssl rehash 命令);以及移除了多个已弃用的自定义 EVP_CIPHER、EVP_MD、EVP_PKEY 方法。

重大新功能方面:最引人注目的是对**加密客户端 Hello(ECH,RFC 9849)**的支持——这是一项重要的隐私增强技术,可以防止网络中间人看到用户正在访问哪个网站(即使是通过 SNI 字段)。此外还新增了 RFC 8998 中的 SM2 签名算法和后量子密钥交换组 curveSM2MLKEM768 的支持、cSHAKE 函数支持,以及 ML-DSA-MU 摘要算法支持。

不兼容变更方面:ASN1_STRING 结构体被设为不透明(opaque);大量 API 函数签名添加了 const 限定符;libcrypto 不再通过 atexit() 清理全局分配数据;OPENSSL_cleanup() 现在默认在全局析构函数中运行。

这一版本对整个互联网生态系统的影响深远。任何依赖 OpenSSL 的项目都需要评估这些不兼容变更对自身的影响,特别是那些仍在使用已弃用 API 的项目。ECH 支持的加入则为互联网隐私保护添加了重要一环。


13. Gas Town:从混乱到 v1.0

Steve Yegge(前 Google/Amazon 工程师、知名技术博主)宣布 Gas Town 和 Beads 双双发布 1.0.0 版本。Gas Town 是一个专为 AI 编程代理设计的协作框架,于三个月前推出,经历了一段”小丑秀”般的混乱期后趋于稳定。

文章最有趣的部分是关于 Beads —— Gas Town 的核心依赖,一个通用的、无偏见的编程代理记忆系统和知识图谱。Yegge 将其描述为”代理的 Adderall(注意力药物)“,它为任何编程代理提供即时的认知升级、工作记忆和长期规划能力。

Beads 的核心洞见来自 Chris Sells 的观察:Beads 是”缺失的为什么”。Git 的提交历史记录了你的代码发生了什么(What)、在哪里(Where)、谁做的(Who)以及如何做的(How),但缺少了”为什么”(Why)。Beads 中每个工作项(“珠子”)都是一个轻量级的 issue 报告,存储在 Git 中、版本化、互相链接成多图(multi-graph),并可用 SQL 查询。整个生命周期——从规划设计到实现再到关闭——都被完整记录在账本上。

Yegge 还分享了一个令人惊叹的案例:一位通信学专业毕业仅四年的非技术人员,使用 Gas Town 构建了一个替代公司正在付费使用的 SaaS 产品的方案,而且效果好到公司准备全面切换。这印证了 Gas Town 降低软件开发门槛的愿景。

Gas Town 目前拥有 13,000 GitHub Stars 和数百名活跃贡献者,团队已开始将创作精力转向继任者 Gas City(目前处于 Alpha 测试阶段)。


14. OpenDuck:分布式 DuckDB 开源实现

OpenDuck 是 MotherDuck(DuckDB 的商业化云服务)核心架构思想的开源实现,包括差异化存储(differential storage)、混合执行(dual execution)和透明远程数据库。

OpenDuck 解决的核心问题是:如何让 DuckDB 的查询无缝跨越本地和云端?其设计包含几个关键组件:

差异化存储:采用追加式的不可变层(immutable sealed layers),数据可寻址存储于对象存储中。PostgreSQL 负责元数据管理,快照机制提供一致性读取。写入路径是序列化的,但支持多并发读取。

双重执行:一个查询可以部分在用户的本地机器上运行,部分在远程工作节点上运行。网关(Gateway)负责分割执行计划,将每个算子标记为 LOCAL 或 REMOTE,并在边界处插入桥接算子。只有中间结果需要跨网络传输。

开放协议:仅包含两个 gRPC RPC 定义——一个执行查询、一个以 Arrow IPC 批次流式返回结果。任何实现了 gRPC 并返回 Arrow 的服务都可以作为 OpenDuck 兼容后端。你可以运行内置的 Rust 网关,也可以替换为自己的实现。

使用方式极其简单:加载扩展、ATTACH 远程数据库,然后像操作本地表一样查询远程表。远程表完全参与 DuckDB 的 JOIN、CTE 和查询优化器。

这一项目为 DuckDB 的分布式应用场景开辟了开源道路,对于需要在边缘计算与云端之间灵活切换数据查询的场景尤其有价值。


15. 第五范式与数据库设计

Alexey Makhotkin 撰写了一篇关于关系数据库第五范式(5NF)的深度解构文章,目标是打破传统教学中对 5NF 不必要的困惑。

文章首先对现有教学资源进行了系统性的批评。以 Wikipedia 的经典”旅行推销员/品牌/产品类型”示例为例,作者指出其前提——“如果推销员销售某品牌和某产品类型,那么他必须销售该品牌的该产品类型”——在现实中几乎不存在,因此学生无法从中理解 5NF 的实际意义。

作者的核心论点是:你实际上不需要特意考虑 5NF 来设计表结构。正确的方法是:(1)从业务需求出发,(2)创建逻辑模型,(3)应用教科书式的表设计策略得出物理表结构——这样得到的结果自然是完美规范化的,没有冗余和异常。

文章识别出两种围绕 5NF 自然出现的逻辑设计模式:AB-BC-AC 三角模式(以”冰淇淋”示例说明:品牌提供口味、朋友喜欢口味、朋友喜欢品牌三组关系形成三角形)和 ABC+D 星型模式(以”音乐家”示例说明:音乐家参加音乐会、音乐家能演奏乐器、音乐家在音乐会上演奏特定乐器)。通过良好的逻辑建模,这些模式自然浮现,无需刻意套用范式理论。

这篇文章对数据库设计教学提出了有价值的反思:与其教授抽象的范式规则,不如教会学生如何正确进行逻辑建模。


16. 工具调用、开源模型与 M×N 问题

dottxt CEO Rémi Louf 撰文剖析了开源大语言模型生态中工具调用(tool calling)面临的碎片化问题。

在闭源模型(如 GPT)中,工具调用体验无缝顺畅——你传入函数列表,模型返回结构化 JSON。但一旦切换到开源模型,你会发现每个模型家族都用完全不同的线路格式编码工具调用。文章展示了同一个语义操作 search(query="GPU") 在三种线路格式下的表现:gpt-oss 使用 <|channel|> 标记和 <|constrain|>json 约束;DeepSeek 使用 <|tool▁calls▁begin|> 系列特殊 token;GLM5 则用 <arg_key>/<arg_value> 标签对代替 JSON 序列化。

这造成了一个 M×N 问题:M 个推理引擎(vLLM、SGLang、TensorRT-LLM 等)× N 个模型,每一种组合都需要独立实现格式解析。更糟的是,同一份模型格式知识需要在两个完全独立的地方重复实现——语法引擎(生成时施加约束)和输出解析器(生成后提取结果)。

以 Gemma 4 为例:它的 <|channel> 推理 token 被解码器在解析器看到之前就先行剥离;推理内容会泄漏到工具调用参数中;其非标准格式迫使 llama.cpp 放弃通用自动解析器,转而构建专用实现。

作者提出的解决方案方向是:将模型特定的线路格式知识从代码提取为声明式配置——模型的边界 token、参数序列化方式、推理 token 行为都应该成为语法引擎和解析器共同消费的规范。模型变化时只需更新规范,引擎无需改动。这类似于 Hugging Face 生态已经通过共享聊天模板实现的提示格式标准化。


17. Orange Pi 6 Plus 深度评测

技术博客 Tao of Mac 的 Rui Carmo 发布了一篇长达 24 分钟阅读量的 Orange Pi 6 Plus 深度评测。与大多数快速上手评测不同,作者花了两个多月时间从底层开始构建自己的操作系统镜像,并进行了全面的基准测试和遥测数据收集。

这款板卡最大的亮点在于其 SoC——CIX P1(CD8180/CD8160),而非常见的 RK3588。CIX P1 拥有 12 个 CPU 核心(4 个 Cortex-A520 + 8 个 Cortex-A720),Mali G720/Immortalis 级 GPU,以及一个三核 Zhouyi NPU,官称合计 45 TOPS 的 AI 算力。配合 16GB RAM、双路 Realtek RTL8126 5GbE 网口和 Wi-Fi 6 支持,硬件规格在 SBC 领域堪称豪华。

然而,评测的核心故事是软件生态的不成熟。作者放弃使用厂商提供的镜像,转而 fork 了 orangepi-build 构建系统,从零构建一个完全可复现的 Debian 13 (Trixie) 服务器镜像。过程中遇到了供应商 GPU 驱动 blob、推理运行时兼容性、启动链问题等一系列挑战。

对于家庭实验室爱好者来说,双 5GbE 网口这一特性本身就比大多数爱好者 SBC 更具吸引力。但正如作者所述,这类硬件的真正价值取决于软件是否能”让路”,而不是成为障碍。这篇评测为任何考虑非 RK3588 平台 ARM SBC 的用户提供了极其宝贵的第一手经验。


18. 聊聊太空马桶

Maciej Cegłowski(知名技术博主、Pinboard 创始人)撰写了一篇关于太空如厕问题的精彩文章,从航天史的角度追溯了人类在零重力环境下解决”排泄”这一基本生理需求的艰难历程。

文章以传统宇航员的”低残渣”早餐——牛排和鸡蛋——为引子,指出这是航天界最古老也最明智的太空如厕策略:尽一切可能避免在太空中上厕所。在双子座 7 号任务中,Frank Borman 在一个电话亭大小的双人太空舱里坚持了 9 天才”投降”。

文章从物理学原理出发,分析了地球上重力为如厕提供的三大服务:(1)将身体压在马桶上保持稳定位置;(2)将排泄物从身体拉离,轻松克服表面张力等接触力;(3)通过水封隔绝气味。在零重力环境中,这三项功能都必须找到替代方案。

身体定位的解决方案经历了橡胶吸盘鞋、大腿绑带等失败尝试后,最终采用了提供多种辅助设施让宇航员自行摸索的策略。排泄物分离则依靠空气抽吸——这意味着马桶口不能太宽(标准是 4-6 英寸),宇航员需要在地面特训厕上练习对准(训练设备中央安装了摄像头!)。气味控制至今仍是难题,长期的下水道气味是宇航员在空间站上长期食欲不振的理论之一。

从 Skylab 时代”像蜘蛛侠一样”竖着排便的马桶设计,到航天飞机时代因加热器故障在船体外形成”黄色冰柱”的趣闻,这篇文章以令人捧腹的笔触讲述了一段严肃的工程史。


19. H.R.8250 法案:要求操作系统提供商验证用户年龄

美国第 119 届国会提出了 H.R.8250 号法案,其全称为”要求操作系统提供商验证任何操作系统用户年龄及其他目的的法案”。这项立法提案标志着美国在儿童在线保护方面的又一次重大立法尝试,但其方式引发了广泛争议。

该法案的核心要求极其激进:操作系统提供商(而非网站或应用开发者)必须对其操作系统的每一位用户进行年龄验证。这意味着 Apple(iOS/macOS)、Google(Android/ChromeOS)、微软(Windows)以及各 Linux 发行版都将承担法律义务,在操作系统层面实施年龄验证机制。

这一立法方向引发了 HN 社区的激烈讨论(178 条评论),争论主要集中在几个方面:

隐私担忧:在操作系统层面进行年龄验证意味着创建一个普遍性的身份验证基础设施。无论技术实现方式如何(身份证扫描、面部识别年龄估算、第三方验证服务),都不可避免地收集和存储敏感个人数据。这本质上是在为全民数字身份证铺路。

技术可行性:对于开源操作系统(如各种 Linux 发行版),如何实施和执行年龄验证?对于自行编译内核或使用定制操作系统的用户呢?法案似乎优先考虑了主流商业操作系统的场景,而忽略了技术边缘情况。

责任错位:批评者指出,将年龄验证责任放在操作系统层而非应用/网站层,是一种责任错位。操作系统是通用工具,不应该承担内容审核的角色。这就像要求水龙头制造商确保未成年人不会用水做危险的事情一样。

言论自由影响:反对者担忧这实际上创建了一个数字”看门人”层,可能被滥用于超越儿童保护范畴的审查目的。一旦年龄验证基础设施就位,将其扩展到其他用途在技术上几乎没有障碍。

这项法案目前仍处于委员会审议阶段,通过前景不明,但它代表了全球范围内”操作系统级管控”趋势的一个重要信号。


20. LangAlpha:金融领域的 AI 代理框架

LangAlpha 自称”金融领域的 Claude Code”,是一个基于 LangChain 构建的开源投资分析 AI 代理框架(Apache 2.0 许可),诞生于 Gemini 3 Hackathon。

LangAlpha 的核心理念是:投资是贝叶斯式的——你从一个论点出发,新数据每天到来,你不断更新你的信念。而当前所有 AI 金融工具都将投资视为一次性问答:提问、获答、继续。LangAlpha 试图改变这一范式。

项目架构包含多个组件:核心代理引擎(ptc_agent)、后端服务器、Web 前端、终端界面(TUI)、技能系统和 MCP 服务器。当代理被技能激活后,它会调度并行子代理分别收集市场数据、新闻和宏观背景,然后呈现一份包含内联交互式可视化的早间笔记。

该项目要求 Python 3.12+,采用了 LangChain 作为底层 AI 框架。对于对 AI 辅助投资分析感兴趣的开发者和投资者来说,这是一个值得关注的开源项目,尽管其处于早期阶段,社区规模尚小。