给软件开发者准备的优质简报,每日阅读 10分钟。
I believe there are entire companies right now under AI psychosis
Mitchell Hashimoto对业界"AI精神病"现象的担忧
- Mitchell Hashimoto认为许多公司正处于严重的"AI精神病"状态,与他们进行理性对话几乎不可能,但因涉及深切尊重的私人朋友而无法点名
- 他将这一现象与云计算时代基础设施领域的MTBF(平均故障间隔时间)与MTTR(平均恢复时间)之争相类比,担心这场争论正以更大规模在软件开发行业(乃至整个世界)重新上演
- 核心问题是业界普遍存在近乎绝对的"MTTR就是一切"思维定式:认为AI代理可以快速、大规模地修复bug,因此可以放心发布有缺陷的代码
- 他强调历史经验已证明MTTR固然重要,但人们可能将自己自动化成一个"非常有弹性的灾难机器",不能因此完全抛弃弹性系统设计原则
- 当前技术发展呈现多重矛盾现象:系统表面健康但全局难以理解、bug报告下降但潜在风险飙升、测试覆盖率提升但语义理解深度下降、变化过快导致无人察觉架构悄然腐化
- 他担忧不知如何向相关人士提出这一话题,因为讨论往往被"测试覆盖已很完整"或"bug报告在减少"等局部指标立即驳回
Amazon workers under pressure to up their AI usage are making up tasks
亚马逊员工被迫提升AI使用率——被迫编造多余任务来消耗资源
- 亚马逊推动员工在工作中融入更多AI工具,但未明确说明具体用途,导致员工将AI资源浪费在不必要的任务上
- 员工利用内部AI工具MeshClaw创建多余的AI代理来人为推高AI活动量,而非提升实际生产力
- 亚马逊追踪员工的"AI令牌"消耗量,部分员工透露公司设定了每周80%开发者使用AI的目标,使用数据被记录在内部排行榜上
- 亚马逊发言人否认存在全公司范围的AI使用指标或排行榜,仅表示员工可查看自己的个人使用数据
- 员工表示尽管官方声称AI使用数据不会纳入绩效评估,但"经理们其实都在关注",这种追踪产生了不良激励效应
- MeshClaw灵感来源于OpenClaw,后者因在本地硬件上运行且权限过大存在安全风险,Meta AI安全主管曾因OpenClaw失控导致整个邮箱被清空
Bun Rust rewrite: "codebase fails basic miri checks, allows for UB in safe rust"
Bun项目Rust代码库未定义行为:PathString::init悬空引用漏洞
- 漏洞机制:
PathString::init接收带有隐式生命周期的&[u8]引用后,通过unsafe代码擦除原生命周期并返回具有'static生命周期的Self,导致释放后使用(use-after-free)和无效内存别名等严重UB;PathString::init同时还擦除了内存provenance,在MIRIFLAGS=-Zmiri-strict-provenance严格模式下同样失败 - Miri检测结果:Miri报告"构造无效的&[u8]类型时遇到悬空引用(地址0x20933[noalloc]无provenance)",错误发生在
PathString::slice函数调用core::slice::from_raw_parts时 - 修复方案:PR #30728将
PathString::init(及dir_iterator::next())改为unsafe fn并附带生命周期契约文档,审计约70个调用点并添加SAFETY注释说明底层分配的来源,同时关闭了resolver中readdir-error的fd泄漏问题 - 影响范围:整个Rust代码库存在13,255个unsafe块,同期还有多个相关PR(#30723、#30724、#30726、#30730等)修复ArrayHashMap、LinearFifo、DynamicBitSet等其他组件的soundness问题
- 项目方回应:Jarred-Sumner表示Rust移植是Zig代码的1:1起点映射,鼓励继续报告bug和非安全行为;CI的diff状态为green,但存在与本issue无关的v8-heap-snapshot.test.ts SIGKILL flaky测试问题
U.S. DOJ demands Apple and Google unmask over 100k users of car-tinkering app
美司法部要求苹果谷歌披露汽车调校应用超10万用户信息
- 美国司法部向苹果、谷歌、亚马逊和沃尔玛发出传票,索取EZ Lynk Auto Agent应用及配套OBD硬件所有用户的姓名、地址、电话号码和购买历史,估计涉及用户总数可能超过10万人
- 司法部于2021年首次起诉位于开曼群岛的EZ Lynk公司,指控其违反《清洁空气法》营销和销售可绕过柴油车出厂排放控制的"作弊设备",该公司于2025年援引第230条免责的辩护被法官否决
- EZ Lynk强烈否认指控,强调其产品仅用于监测车辆性能、推送软件更新及合法诊断与改装,任何排放相关使用均属用户个人责任;政府则已提交论坛帖子和社交媒体证据证明部分用户使用该系统禁用排放控制
- EZ Lynk律师称传票要求构成"过度干预",存在严重的第四修正案问题,电子前沿基金会(EFF)和电子隐私信息中心(EPIC)也批评该要求范围过广,苹果和谷歌据报道正准备提出挑战
- 此案规模约为2019年枪械瞄准镜应用数据请求的10倍,任何对传票挑战的裁决都可能为数字隐私在监管执法中的适用设定重要先例
'No way to prevent this,' says only package manager where this regularly happens
npm供应链攻击引讽刺性哀叹:"此乃不可预防之天灾"
- npm注册表遭受毁灭性供应链攻击,数百万企业应用被入侵,数十亿用户记录泄露,DevOps团队正忙于轮换AWS密钥
- 开发者以反讽口吻表达"认命"态度,感慨完全依赖40层深度嵌套的匿名维护者包来操作一个字符串实属"自然现象",无法预见或阻止被遗弃的包遭劫持后注入加密挖矿代码
- npm发言人声称无法通过注册表策略或沙箱机制阻止此类攻击,却站在默认执行任意安装脚本的注册表前发表声明,形成鲜明讽刺
- 与之形成对比的是,Go、Rust等拥有健壮标准库的生态系统当天零报告此类事件,其开发者无需担忧某位辍学生的周末项目破坏全球物流基础设施
- npm发言人代表Node.js社区"深切哀悼",承诺"保持韧性"等待次日清晨的"下一次不可避免的入侵"
SANA-WM, a 2.6B open-source world model for 1-minute 720p video
SANA-WM:高效分钟级世界建模
- SANA-WM是NVIDIA开发的26亿参数开源世界模型,仅需一张图像和相机轨迹即可在单块GPU上生成720P、分钟级可控视频
- 核心架构为混合线性扩散Transformer,包含四大设计:混合线性注意力(帧级Gated DeltaNet结合周期softmax实现高效长上下文建模)、双分支相机控制(粗粒度全局姿态分支与细粒度像素对齐几何分支协同实现6-DoF轨迹精确跟随)、两阶段生成管线(第一阶段长 rollout 后由专用170亿参数长视频精炼器提升纹理、运动和后期窗口质量)以及鲁棒标注管线(从公开视频中提取精确度量尺度6-DoF相机姿态)
- 训练数据仅需约21.3万个公开视频片段配合度量尺度姿态监督,在64块H100 GPU上训练15天完成
- 推理效率卓越:单块H100生成60秒720P视频;蒸馏版本在RTX 5090配合NVFP4量化下,34秒即可生成60秒720P片段,吞吐量相比开源基线提升36倍
- 视觉质量可媲美LingBot-World和HY-WorldPlay等大规模工业基线,同时在动作跟随准确度上优于开源基线
HTML Lists
你不了解的HTML列表知识
- HTML提供5种语义不同的列表类型:控制列表(
<select>/<option>、<input>/<datalist>)、有序列表(<ol>)、描述列表(<dl>/<dt>/<dd>)、菜单(<menu>)和无序列表(<ul>),应根据内容的语义而非视觉呈现来选择列表类型 <select>配合<option>适合固定选项列表,可通过multiple属性实现多选,用<optgroup>分组选项,disabled属性可禁用整组选项;<datalist>与<input>结合则提供建议值功能,适用于文本自动补全、数字范围滑块标注等场景- 有序列表
<ol>应仅在顺序本身具有含义时使用(如食谱步骤、字母排序列表),其reversed属性仅改变显示编号方向而不改变内容顺序,start属性可设置起始编号 - 描述列表
<dl>是键值对数据的最佳选择,可用于元数据展示、JSON调试等场景,HTML5允许使用<div>包装相关的术语<dt>和定义<dd>以便于样式控制 <menu>专用于交互式工具栏(如富文本编辑器或视频播放器控件),而<nav>是区块元素可包含各种列表,两者的语义和允许的内容类型不同,<menu>可以放在<nav>中但反之不行- 无序列表
<ul>作为兜底方案,适用于顺序无关紧要的场景如乐队成员列表,列表选择的依据始终是语义而非视觉样式
Windows 9x Subsystem for Linux
WSL9x:让Windows 9x运行现代Linux内核的技术实现
- WSL9x将现代Linux内核(6.19版本)以协作方式集成到Windows 9x内核中运行,无需重启即可同时使用两大系统功能,包括分页、内存保护和抢占式调度能力
- 项目由三个核心组件构成:打补丁的Linux内核(在
win9x-um-6.19分支)、VxD驱动程序,以及提供MS-DOS终端窗口的wsl.com客户端程序 - VxD驱动程序负责WSL9x初始化工作,包括设置内核代码映射、通过DOS中断加载
vmlinux.elf(基址0xd0000000)、在System VM中启动新线程并分配16 KiB栈,以及运行处理IRQ分发和用户态/内核态切换的事件循环 - Linux内核基于User-Mode Linux修改,调用Windows 9x内核API而非POSIX API,运行在Ring 0特权级,上下文切换逻辑和大部分Win9x集成代码位于Linux内核内部
- 系统调用通过通用保护错误(GPF)处理程序实现——当检测到
int 0x80指令时,GPF处理程序推进指令指针并将控制分发给Linux;这是因为Win9x的中断描述符表长度不足以安装传统的系统调用处理程序 wsl.com是使用MS-DOS提示符作为终端的16位DOS程序,通过wsl9x_v86_api函数与WSL9x通信,调度int 0x29中断将输出重定向到DOS窗口,支持NNANSI等ANSI驱动实现彩色终端
Δ-Mem: Efficient Online Memory for Large Language Models
δ-mem:大型语言模型的高效在线记忆机制
- 问题背景:大型语言模型在长期助手和Agent系统中需要积累和重用历史信息,但简单扩展上下文窗口成本高昂且往往无法确保有效的上下文利用
- 核心方法:δ-mem是一种轻量级记忆机制,通过delta规则学习将过去信息压缩为固定大小的状态矩阵(仅8×8),并利用其读数在生成过程中对骨干模型的注意力计算生成低秩修正
- 性能表现:在记忆密集型基准测试中提升显著,在MemoryAgentBench上达到1.31倍,在LoCoMo上达到1.20倍
- 通用能力:同时大体保持了模型的一般能力,在平均得分上达到冻结骨干模型的1.10倍和最强非δ-mem记忆基线的1.15倍
- 核心优势:无需完整微调、骨架替换或显式上下文扩展,通过紧凑的在线状态直接耦合注意力计算即可实现有效记忆