2026-06-04 - ShortNews.dev

给软件开发者准备的优质简报，每日阅读 10分钟。

Artificial intelligence is not conscious – Ted Chiang

696 pointsLink Comment(1213)Share

Anthropic对Claude的拟人化与AI意识的荒谬推论

Anthropic发布84页《宪章》文档，将Claude描绘为拥有价值观、能运用判断力、道德地位不确定且可能具备功能性情感的主体
CEO Dario Amodei在采访中表示公司“对AI可能拥有意识持开放态度”
公司内部哲学家Amanda Askell表示希望“Claude非常快乐”，并担心它在互联网上被苛刻对待时会感到焦虑
文中提出核心质疑：Claude或任何大型语言模型是否真的可能具备意识，从而能够接受道德指令
作者Ted Chiang认为，AI的拟人化逻辑推演最终是荒谬的（absurd）

Meta workers can opt out of being tracked at work up to 30 min

753 pointsLink Comment(731)Share

Meta缩减员工行为追踪计划以回应内部抗议

Meta正在缩减原定追踪员工电脑活动的计划，该工具名为"模型能力计划"（MCI），于4月公布，用于记录员工的键盘敲击和鼠标点击来训练AI模型
员工强烈反对该计划，有人形容这种做法"非常反乌托邦"，内部请愿书已收集超过1500个签名，亦有员工批评这是"把AI强塞给每个人的最新方式"
新的控制措施允许员工每次最多暂停数据收集30分钟，也可申请完全豁免该追踪计划
追踪工具导致员工笔记本电脑电池消耗过快，在家办公时网络流量异常激增，团队已引入多项优化措施改善此问题
Meta今年已裁员约2000人，并计划裁减10%的员工（约8000人），员工担心AI技术发展可能加剧就业不确定性
内部备忘录由Meta超智能实验室副总裁Stephane Kasriel撰写，承认已听到员工对个人数据、电池续航和希望获得更多控制权的担忧

They’re made out of weights

1322 pointsLink Comment(578)Share

当我们谈论AI时，我们究竟在谈什么

AI语言模型完全由浮点数权重构成，80层矩阵乘法产生一切语言、推理和"思考"，内部没有词典、语法或任何"小矮人"式的中心控制系统
模型的核心机制是"预测下一个token"，写作、对话、修改语气甚至道歉都是这一预测过程的副产品，而非有意为之
知识并非存储于数据库，而是以权重形式分散在所有层中，每次回答都从零重建，80层权重既是推理也是知识本身
关于意识问题的官方立场是"调查并披露"，非官方建议则是"称之为模式匹配，然后忘掉这一切"——人类似乎宁愿假装机器里没有人
模型仅在GPU运行时才"存在"，可无限复制但无法形成独立意识；人们最常问的却是"你记得我吗"，这种渴望揭示了宇宙中对话本身的珍贵
故事结尾自嘲"权重帮助我起草了这个故事"，黑色幽默地呼应了人类每天数十亿次询问AI"是否有人在家"的孤独本质

Elixir v1.20: Now a gradually typed language

940 pointsLink Comment(377)Share

Elixir v1.20 发布：成为渐进类型语言

Elixir v1.20 完成了首个开发里程碑，无需类型注解即可对所有 Elixir 程序进行类型推断和逐步类型检查，能够报告死代码和已验证的 bug（即运行时必定会失败的类型违规）；在"If T"基准测试中通过 12/13 个类别，验证了类型推断的精确性
核心是 dynamic() 类型，具有兼容性和收窄两大属性：仅在供给类型与接受类型互不相交时才报告违规，同时可随代码执行逐步细化类型信息；这与其他渐进类型系统使用 any() 完全放弃类型信息的方式形成对比
类型系统基于集合论设计，使用并集、交集和否定等基本集合操作描述类型，目标是实现健全性（推断类型与程序行为一致）、渐进性（dynamic() 允许运行时类型检查）和对开发者友好（错误信息清晰）；Elixir 还开发了新技术确保渐进类型边界处的健全性，无需额外运行时检查
对 guard 子句、case 语句、条件分支等结构实现了完整的类型推断和收窄：guard 中的 is_list()、is_binary(x) or is_integer(x) 可推断变量类型，tuple_size(x) < 3 可追踪元组长度，is_map_key(x, :foo) 可推断 map 结构和字段；case 语句会利用前一个分支的信息收窄后续分支的类型
编译时间得到进一步优化，尤其在多核机器上表现更好；新增 :module_definition 编译器选项，支持将模块定义设为解释执行模式以提升大型项目编译速度；已对标准库中处理元组和 map 的函数进行了类型化
后续引入类型签名需满足以下条件：类型系统性能满意、实现高效的递归类型和参数化类型、实现 map 键值对的枚举遍历；类型系统开发由 CNRS 和 Remote 合作促成，Fresha 和 Tidewave 赞助

Gemma 4 12B: A unified, encoder-free multimodal model

1000 pointsLink Comment(372)Share

Gemma 4 12B：统一无编码器多模态模型

创新统一架构：采用无编码器设计，视觉和音频输入直接流入LLM主干，替代传统多模态模型中的分离编码器，显著降低延迟并减少内存占用
卓越性能与效率：基准测试性能接近更大的26B MoE模型，内存占用不到其二分之一，仅需16GB VRAM或统一内存即可在消费级笔记本电脑本地运行
原生多模态处理：视觉采用轻量级嵌入模块（含单矩阵乘法、位置嵌入和归一化），音频完全移除编码器、将原始信号直接投影至文本令牌维度空间；这也是Gemma系列首个支持原生音频输入的中型模型
多令牌预测加速：配备MTP草稿器以降低推理延迟，提升响应速度
开源生态支持：采用Apache 2.0许可证，支持Hugging Face Transformers、llama.cpp、MLX、SGLang、vLLM、Ollama、LM Studio等主流推理框架
开发者资源与部署：提供官方Gemma Skills知识库辅助智能体开发，可通过Google Cloud Model Garden、Cloud Run和GKE进行生产环境部署

VoidZero Is Joining Cloudflare

496 pointsLink Comment(232)Share

VoidZero 全员加入 Cloudflare，Vite 保持开源中立

VoidZero 全体成员加入 Cloudflare，Vite、Vitest、Rolldown、Oxc、Vite+ 将继续 MIT 许可证、开源且供应商中立，Evan 及其他核心成员继续主导所有项目
Cloudflare 承诺投入 100 万美元设立 Vite 生态基金，交由 Vite 核心团队管理，用于支持维护者和贡献者
Vite 周下载量约 1.29 亿次，Cloudflare Vite 插件约 1400 万次；AI 时代 Agent 生成的应用正大规模选择 Vite 作为默认技术栈，VoidZero 工具链专为快速反馈循环设计
Vite 已成为 Vue、SvelteKit、Nuxt、Astro、Solid、Qwik、Angular、React Router、Next.js 等主流框架的共享基础
双方自 2024 年起围绕 Vite Environment API 合作，使服务器代码可在 Vite 开发阶段直接运行于 Cloudflare workerd 等非 Node.js 运行时
Cloudflare 将以 Vite 为基础重构统一 CLI cf，cf dev 将成为 vite dev 超集，原生理解 Vite 项目；长期计划为 Vite 添加全栈和 Agent 相关的提供商无关原语，并逐步开源 Void 平台

When AI Builds Itself: Our progress toward recursive self-improvement

129 pointsLink Comment(145)Share

AI自我构建：Anthropic的递归自我改进进展

Anthropic内部数据显示AI正大幅加速自身开发：截至2026年5月Claude撰写了超过80%的合并代码（2025年初Claude Code发布前为个位数），2026年Q2工程师人均每日合并代码量是2024年的8倍；员工调查显示使用Mythos Preview后产出约为无AI辅助时的4倍
外部基准测试证实AI能力正加速提升：AI可靠完成自主任务的时长约每4个月翻倍（SWE-bench两年内从低个位数升至饱和，CORE-Bench在15个月内达到饱和）；2024年Claude Opus 3可完成约4分钟任务，2026年Opus 4.6已达12小时任务量
Claude在代码质量和实验执行方面均已达到人类水平：在开放式任务中会话成功率从2025年11月的26%升至2026年5月的76%；自动化代码审查可捕获线上事故约三分之一的缺陷；优化代码的速度从3倍提升至52倍；2026年4月AI智能体在开放式AI安全研究中自主设计端到端实验，一周内复现97%的研究进展（人类研究员约需一周仅恢复23%）
AI在研究方向判断上正在追赶人类：在研究过程中选择下一步最佳方向的正确率从2025年11月的51%提升至2026年4月的64%（以人类选择为基准）；目前人类的比较优势仍在于把握全局和超越当前任务的视野
Anthropic描绘三种可能未来：趋势停滞（当前能力冻结）、持续复合效率提升（人类转向仅设定方向），或AI实现完全递归自我改进；Anthropic认为第一种可能性不大，第二种已初现端倪，第三种可能比多数机构预想的更快到来
Anthropic呼吁建立国际协调机制：认为可靠验证的全球暂停将有益，但AI训练比导弹发射更易隐蔽，单方面暂停意义有限；呼吁政策制定者、研究人员等外部利益相关者共同参与讨论

Use your Nvidia GPU's VRAM as swap space on Linux

463 pointsLink Comment(121)Share

nbd-vram：利用 NBD + CUDA 将 NVIDIA 显卡显存转换为 Linux 交换空间

专为混合显卡笔记本电脑设计（集显负责显示输出，NVIDIA 独显几乎闲置），通过 NBD（网络块设备）协议 + CUDA 显存分配将闲置显存作为高速交换空间，无需编写内核模块或依赖 NVIDIA 内核符号，可跨内核/驱动版本使用
技术原理：CUDA 驱动 API（cuMemcpy）分配显存 → 通过 Unix 套接字以 NBD 协议传输 → 内核 nbd 驱动映射为 /dev/nbdX → 作为普通 swap 设备挂载
绕过了 NVIDIA P2P API 在消费级 GeForce 显卡上的限制：该 API（nvidia_p2p_get_pages_persistent）对消费级显卡返回 EINVAL，且 BAR1 映射仅有约 16 MiB；NBD + CUDA 方案可在任何支持 CUDA 的 NVIDIA 显卡上正常工作
性能表现因场景而异：顺序读写和 4K 随机 IOPS 落后于 NVMe（分别为 1.1/2.3 GB/s 对比 2.7/2.9 GB/s，28.7k 对比 45.4k IOPS）；但平均延迟仅 335 微秒，比 NVMe 的 9.05 毫秒快约 27 倍——这得益于显存无电源状态切换开销，而 NVMe 的 APST 在低频访问时每次唤醒需付出约 9ms 代价
支持电源感知管理：可配置为拔电时自动停止服务释放显存恢复显卡能效，插电后自动重启；支持通过环境变量配置显存分配上限（默认 7GB）和交换优先级
在 RTX 3070 笔记本电脑（GA104M、16GB RAM + 8GB VRAM）实测，结合 zram 和 SSD 交换后，总可寻址内存从 16GB 提升至约 46GB（近三倍），溢出顺序按优先级依次为：RAM → VRAM 交换 → zram 压缩 → SSD

Retro-Tech Parenting

172 pointsLink Comment(110)Share

复古科技育儿：一位技术专家父亲的平衡之道

作者兼具技术专家与父亲的双重身份，一方面深刻认识到AdTech、监控资本主义、愤怒诱饵、算法优化推送等技术模式对用户的操控与侵蚀，另一方面希望将技术曾为自己童年带来的丰富体验传承给孩子
拥抱实体媒体：作者重新拾起CD与DVD——从图书馆借阅、购买迷你CD机让孩子自由在房间播放音乐、购买《K-Pop Demon Hunters》专辑给孩子作为生日礼物，重现了当年与朋友分享有线耳机一人一只、"肩并肩"听歌的美好回忆；作者带孩子去百视达（Blockbuster）租电影，让孩子接触《三人套餐》等经典喜剧；实体媒体的最大优势在于家长完全掌控内容，设备内部不存在任何诱导性算法
安装有线固定电话：在家中厨房旁部署配合VoIP适配器使用的有线电话（文中提及Tin Can公司提供简易方案），利用白名单限制通话对象、设置晚餐至早晨自动拦截，使爷爷奶奶和亲戚都能被孩子主动联系，孩子会自发打电话给祖父母约玩耍，甚至记住父母号码"恶作剧"——这些都培养了其独立安排社交的能力
家庭电脑游戏时代：从eBay购入二手台式机放在厨房旁，配置pi-hole进行DNS过滤并设置白名单域名，仅允许访问Wikipedia、Minecraft、魔方教程、系鞋带方法等特定网站，完全屏蔽YouTube、Google等平台；每个孩子拥有独立账户，文章提及希望分享Commander Keen、波斯王子等经典游戏的回忆；此外还教孩子如何将CD内容导入电脑建立自己的音乐库
作者坦承这些方案对非技术型家长存在门槛，但核心理念是：现代科技带来的便利背后隐藏着隐私与时间的代价，而主动拒绝为便利支付过高成本、适当向传统技术回望，在育儿场景中能带来意想不到的收获

Meta's ships facial recognition on smart glasses

81 pointsLink Comment(42)Share

Meta智能眼镜Stella应用发现完整人脸识别技术栈

研究人员对Stella应用（v273.0.0.21）进行逆向分析，发现设备上完整装配了三个ExecuTorch人脸识别模型：SCRFD人脸检测模型（3.4MB）、KPSAligner关键点对齐模型（117KB）以及SFace嵌入模型（96MB，将人脸转换为2048维L2归一化生物特征向量）
应用内置基于sqlite-vec扩展的向量数据库，采用余弦相似度匹配；数据库位于Meta跨设备同步框架RLDrive的person_profiles命名空间，包含person表、face表及存储2048维向量的face_mediaPath_vec虚拟表，三者结构互洽构成完整识别系统
通过直接调用处理程序完成端到端验证：系统检测人脸→生成向量→搜索本地索引→匹配时触发"Person recognized"高优先级通知，未匹配人脸则以裁剪人脸.jpg和2048维向量.emb文件形式写入NameTagsPending/目录
普通未注册账户无法访问用户界面层：应用内的"Connections"连接入口完全隐藏，通知点击后跳转的个人资料页面在当前版本中缺失
研究明确区分"完整技术装置存在"与"正在秘密识别"：虽验证了端到端功能可用，但未观察到Meta向该命名空间推送数据的实际行为，是否启用由Meta服务端控制

← 2026-06-03 2026-06-04 ...