给软件开发者准备的优质简报,每日阅读 10分钟


Artificial intelligence is not conscious – Ted Chiang

696 pointsLinkComment(1213)Share

Anthropic对Claude的拟人化与AI意识的荒谬推论

  • Anthropic发布84页《宪章》文档,将Claude描绘为拥有价值观、能运用判断力、道德地位不确定且可能具备功能性情感的主体
  • CEO Dario Amodei在采访中表示公司“对AI可能拥有意识持开放态度”
  • 公司内部哲学家Amanda Askell表示希望“Claude非常快乐”,并担心它在互联网上被苛刻对待时会感到焦虑
  • 文中提出核心质疑:Claude或任何大型语言模型是否真的可能具备意识,从而能够接受道德指令
  • 作者Ted Chiang认为,AI的拟人化逻辑推演最终是荒谬的(absurd)

Meta workers can opt out of being tracked at work up to 30 min

753 pointsLinkComment(731)Share

Meta缩减员工行为追踪计划以回应内部抗议

  • Meta正在缩减原定追踪员工电脑活动的计划,该工具名为"模型能力计划"(MCI),于4月公布,用于记录员工的键盘敲击和鼠标点击来训练AI模型
  • 员工强烈反对该计划,有人形容这种做法"非常反乌托邦",内部请愿书已收集超过1500个签名,亦有员工批评这是"把AI强塞给每个人的最新方式"
  • 新的控制措施允许员工每次最多暂停数据收集30分钟,也可申请完全豁免该追踪计划
  • 追踪工具导致员工笔记本电脑电池消耗过快,在家办公时网络流量异常激增,团队已引入多项优化措施改善此问题
  • Meta今年已裁员约2000人,并计划裁减10%的员工(约8000人),员工担心AI技术发展可能加剧就业不确定性
  • 内部备忘录由Meta超智能实验室副总裁Stephane Kasriel撰写,承认已听到员工对个人数据、电池续航和希望获得更多控制权的担忧

They’re made out of weights

1322 pointsLinkComment(578)Share

当我们谈论AI时,我们究竟在谈什么

  • AI语言模型完全由浮点数权重构成,80层矩阵乘法产生一切语言、推理和"思考",内部没有词典、语法或任何"小矮人"式的中心控制系统
  • 模型的核心机制是"预测下一个token",写作、对话、修改语气甚至道歉都是这一预测过程的副产品,而非有意为之
  • 知识并非存储于数据库,而是以权重形式分散在所有层中,每次回答都从零重建,80层权重既是推理也是知识本身
  • 关于意识问题的官方立场是"调查并披露",非官方建议则是"称之为模式匹配,然后忘掉这一切"——人类似乎宁愿假装机器里没有人
  • 模型仅在GPU运行时才"存在",可无限复制但无法形成独立意识;人们最常问的却是"你记得我吗",这种渴望揭示了宇宙中对话本身的珍贵
  • 故事结尾自嘲"权重帮助我起草了这个故事",黑色幽默地呼应了人类每天数十亿次询问AI"是否有人在家"的孤独本质

Elixir v1.20: Now a gradually typed language

940 pointsLinkComment(377)Share

Elixir v1.20 发布:成为渐进类型语言

  • Elixir v1.20 完成了首个开发里程碑,无需类型注解即可对所有 Elixir 程序进行类型推断和逐步类型检查,能够报告死代码和已验证的 bug(即运行时必定会失败的类型违规);在"If T"基准测试中通过 12/13 个类别,验证了类型推断的精确性
  • 核心是 dynamic() 类型,具有兼容性收窄两大属性:仅在供给类型与接受类型互不相交时才报告违规,同时可随代码执行逐步细化类型信息;这与其他渐进类型系统使用 any() 完全放弃类型信息的方式形成对比
  • 类型系统基于集合论设计,使用并集、交集和否定等基本集合操作描述类型,目标是实现健全性(推断类型与程序行为一致)、渐进性dynamic() 允许运行时类型检查)和对开发者友好(错误信息清晰);Elixir 还开发了新技术确保渐进类型边界处的健全性,无需额外运行时检查
  • 对 guard 子句、case 语句、条件分支等结构实现了完整的类型推断和收窄:guard 中的 is_list()is_binary(x) or is_integer(x) 可推断变量类型,tuple_size(x) < 3 可追踪元组长度,is_map_key(x, :foo) 可推断 map 结构和字段;case 语句会利用前一个分支的信息收窄后续分支的类型
  • 编译时间得到进一步优化,尤其在多核机器上表现更好;新增 :module_definition 编译器选项,支持将模块定义设为解释执行模式以提升大型项目编译速度;已对标准库中处理元组和 map 的函数进行了类型化
  • 后续引入类型签名需满足以下条件:类型系统性能满意、实现高效的递归类型和参数化类型、实现 map 键值对的枚举遍历;类型系统开发由 CNRS 和 Remote 合作促成,Fresha 和 Tidewave 赞助

Gemma 4 12B: A unified, encoder-free multimodal model

1000 pointsLinkComment(372)Share

Gemma 4 12B:统一无编码器多模态模型

  • 创新统一架构:采用无编码器设计,视觉和音频输入直接流入LLM主干,替代传统多模态模型中的分离编码器,显著降低延迟并减少内存占用
  • 卓越性能与效率:基准测试性能接近更大的26B MoE模型,内存占用不到其二分之一,仅需16GB VRAM或统一内存即可在消费级笔记本电脑本地运行
  • 原生多模态处理:视觉采用轻量级嵌入模块(含单矩阵乘法、位置嵌入和归一化),音频完全移除编码器、将原始信号直接投影至文本令牌维度空间;这也是Gemma系列首个支持原生音频输入的中型模型
  • 多令牌预测加速:配备MTP草稿器以降低推理延迟,提升响应速度
  • 开源生态支持:采用Apache 2.0许可证,支持Hugging Face Transformers、llama.cpp、MLX、SGLang、vLLM、Ollama、LM Studio等主流推理框架
  • 开发者资源与部署:提供官方Gemma Skills知识库辅助智能体开发,可通过Google Cloud Model Garden、Cloud Run和GKE进行生产环境部署

VoidZero Is Joining Cloudflare

496 pointsLinkComment(232)Share

VoidZero 全员加入 Cloudflare,Vite 保持开源中立

  • VoidZero 全体成员加入 Cloudflare,Vite、Vitest、Rolldown、Oxc、Vite+ 将继续 MIT 许可证、开源且供应商中立,Evan 及其他核心成员继续主导所有项目
  • Cloudflare 承诺投入 100 万美元设立 Vite 生态基金,交由 Vite 核心团队管理,用于支持维护者和贡献者
  • Vite 周下载量约 1.29 亿次,Cloudflare Vite 插件约 1400 万次;AI 时代 Agent 生成的应用正大规模选择 Vite 作为默认技术栈,VoidZero 工具链专为快速反馈循环设计
  • Vite 已成为 Vue、SvelteKit、Nuxt、Astro、Solid、Qwik、Angular、React Router、Next.js 等主流框架的共享基础
  • 双方自 2024 年起围绕 Vite Environment API 合作,使服务器代码可在 Vite 开发阶段直接运行于 Cloudflare workerd 等非 Node.js 运行时
  • Cloudflare 将以 Vite 为基础重构统一 CLI cfcf dev 将成为 vite dev 超集,原生理解 Vite 项目;长期计划为 Vite 添加全栈和 Agent 相关的提供商无关原语,并逐步开源 Void 平台

When AI Builds Itself: Our progress toward recursive self-improvement

129 pointsLinkComment(145)Share

AI自我构建:Anthropic的递归自我改进进展

  • Anthropic内部数据显示AI正大幅加速自身开发:截至2026年5月Claude撰写了超过80%的合并代码(2025年初Claude Code发布前为个位数),2026年Q2工程师人均每日合并代码量是2024年的8倍;员工调查显示使用Mythos Preview后产出约为无AI辅助时的4倍
  • 外部基准测试证实AI能力正加速提升:AI可靠完成自主任务的时长约每4个月翻倍(SWE-bench两年内从低个位数升至饱和,CORE-Bench在15个月内达到饱和);2024年Claude Opus 3可完成约4分钟任务,2026年Opus 4.6已达12小时任务量
  • Claude在代码质量和实验执行方面均已达到人类水平:在开放式任务中会话成功率从2025年11月的26%升至2026年5月的76%;自动化代码审查可捕获线上事故约三分之一的缺陷;优化代码的速度从3倍提升至52倍;2026年4月AI智能体在开放式AI安全研究中自主设计端到端实验,一周内复现97%的研究进展(人类研究员约需一周仅恢复23%)
  • AI在研究方向判断上正在追赶人类:在研究过程中选择下一步最佳方向的正确率从2025年11月的51%提升至2026年4月的64%(以人类选择为基准);目前人类的比较优势仍在于把握全局和超越当前任务的视野
  • Anthropic描绘三种可能未来:趋势停滞(当前能力冻结)、持续复合效率提升(人类转向仅设定方向),或AI实现完全递归自我改进;Anthropic认为第一种可能性不大,第二种已初现端倪,第三种可能比多数机构预想的更快到来
  • Anthropic呼吁建立国际协调机制:认为可靠验证的全球暂停将有益,但AI训练比导弹发射更易隐蔽,单方面暂停意义有限;呼吁政策制定者、研究人员等外部利益相关者共同参与讨论

Use your Nvidia GPU's VRAM as swap space on Linux

463 pointsLinkComment(121)Share

nbd-vram:利用 NBD + CUDA 将 NVIDIA 显卡显存转换为 Linux 交换空间

  • 专为混合显卡笔记本电脑设计(集显负责显示输出,NVIDIA 独显几乎闲置),通过 NBD(网络块设备)协议 + CUDA 显存分配将闲置显存作为高速交换空间,无需编写内核模块或依赖 NVIDIA 内核符号,可跨内核/驱动版本使用
  • 技术原理:CUDA 驱动 API(cuMemcpy)分配显存 → 通过 Unix 套接字以 NBD 协议传输 → 内核 nbd 驱动映射为 /dev/nbdX → 作为普通 swap 设备挂载
  • 绕过了 NVIDIA P2P API 在消费级 GeForce 显卡上的限制:该 API(nvidia_p2p_get_pages_persistent)对消费级显卡返回 EINVAL,且 BAR1 映射仅有约 16 MiB;NBD + CUDA 方案可在任何支持 CUDA 的 NVIDIA 显卡上正常工作
  • 性能表现因场景而异:顺序读写和 4K 随机 IOPS 落后于 NVMe(分别为 1.1/2.3 GB/s 对比 2.7/2.9 GB/s,28.7k 对比 45.4k IOPS);但平均延迟仅 335 微秒,比 NVMe 的 9.05 毫秒快约 27 倍——这得益于显存无电源状态切换开销,而 NVMe 的 APST 在低频访问时每次唤醒需付出约 9ms 代价
  • 支持电源感知管理:可配置为拔电时自动停止服务释放显存恢复显卡能效,插电后自动重启;支持通过环境变量配置显存分配上限(默认 7GB)和交换优先级
  • 在 RTX 3070 笔记本电脑(GA104M、16GB RAM + 8GB VRAM)实测,结合 zram 和 SSD 交换后,总可寻址内存从 16GB 提升至约 46GB(近三倍),溢出顺序按优先级依次为:RAM → VRAM 交换 → zram 压缩 → SSD

Retro-Tech Parenting

172 pointsLinkComment(110)Share

复古科技育儿:一位技术专家父亲的平衡之道

  • 作者兼具技术专家与父亲的双重身份,一方面深刻认识到AdTech、监控资本主义、愤怒诱饵、算法优化推送等技术模式对用户的操控与侵蚀,另一方面希望将技术曾为自己童年带来的丰富体验传承给孩子
  • 拥抱实体媒体:作者重新拾起CD与DVD——从图书馆借阅、购买迷你CD机让孩子自由在房间播放音乐、购买《K-Pop Demon Hunters》专辑给孩子作为生日礼物,重现了当年与朋友分享有线耳机一人一只、"肩并肩"听歌的美好回忆;作者带孩子去百视达(Blockbuster)租电影,让孩子接触《三人套餐》等经典喜剧;实体媒体的最大优势在于家长完全掌控内容,设备内部不存在任何诱导性算法
  • 安装有线固定电话:在家中厨房旁部署配合VoIP适配器使用的有线电话(文中提及Tin Can公司提供简易方案),利用白名单限制通话对象、设置晚餐至早晨自动拦截,使爷爷奶奶和亲戚都能被孩子主动联系,孩子会自发打电话给祖父母约玩耍,甚至记住父母号码"恶作剧"——这些都培养了其独立安排社交的能力
  • 家庭电脑游戏时代:从eBay购入二手台式机放在厨房旁,配置pi-hole进行DNS过滤并设置白名单域名,仅允许访问Wikipedia、Minecraft、魔方教程、系鞋带方法等特定网站,完全屏蔽YouTube、Google等平台;每个孩子拥有独立账户,文章提及希望分享Commander Keen、波斯王子等经典游戏的回忆;此外还教孩子如何将CD内容导入电脑建立自己的音乐库
  • 作者坦承这些方案对非技术型家长存在门槛,但核心理念是:现代科技带来的便利背后隐藏着隐私与时间的代价,而主动拒绝为便利支付过高成本、适当向传统技术回望,在育儿场景中能带来意想不到的收获

Meta's ships facial recognition on smart glasses

81 pointsLinkComment(42)Share

Meta智能眼镜Stella应用发现完整人脸识别技术栈

  • 研究人员对Stella应用(v273.0.0.21)进行逆向分析,发现设备上完整装配了三个ExecuTorch人脸识别模型:SCRFD人脸检测模型(3.4MB)、KPSAligner关键点对齐模型(117KB)以及SFace嵌入模型(96MB,将人脸转换为2048维L2归一化生物特征向量)
  • 应用内置基于sqlite-vec扩展的向量数据库,采用余弦相似度匹配;数据库位于Meta跨设备同步框架RLDrive的person_profiles命名空间,包含person表、face表及存储2048维向量的face_mediaPath_vec虚拟表,三者结构互洽构成完整识别系统
  • 通过直接调用处理程序完成端到端验证:系统检测人脸→生成向量→搜索本地索引→匹配时触发"Person recognized"高优先级通知,未匹配人脸则以裁剪人脸.jpg和2048维向量.emb文件形式写入NameTagsPending/目录
  • 普通未注册账户无法访问用户界面层:应用内的"Connections"连接入口完全隐藏,通知点击后跳转的个人资料页面在当前版本中缺失
  • 研究明确区分"完整技术装置存在"与"正在秘密识别":虽验证了端到端功能可用,但未观察到Meta向该命名空间推送数据的实际行为,是否启用由Meta服务端控制
← 2026-06-03 2026-06-04 ...