给软件开发者准备的优质简报,每日阅读 10分钟。
Statement on US government directive to suspend access to Fable 5 and Mythos 5
美国政府指令暂停Fable 5和Mythos 5访问权限的声明
- 美国政府以国家安全为由发布出口管制指令,禁止所有外国国民(包括Anthropic境内外员工)访问Fable 5和Mythos 5,Anthropic被迫对所有客户禁用这两款模型,但其他Anthropic模型服务不受影响
- Anthropic审查了政府提及的潜在越狱技术演示,发现其仅涉及识别少量已知的小漏洞,该能力在OpenAI的GPT-5.5等其他公开模型中同样存在,并非Fable独有
- Anthropic在发布前与政府、英国AISI及多个第三方机构合作进行了数千小时红队测试,证明Fable的安全防护显著优于以往任何已部署模型,且尚未发现通用越狱
- Anthropic认为完美的越狱防护目前尚不可行,因此采用"纵深防御"策略,重点是让越狱难以实现并通过30天数据保留进行监控,而非完全禁止部署
- Anthropic认为政府发现的技术问题不足以作为召回已部署商业模型的理由,若此标准适用于整个行业将导致新模型部署基本停滞,政府应通过透明、公平、有技术依据的法定程序来阻止不安全部署
- Anthropic正在努力恢复访问权限并为此给客户带来的干扰致歉,认为此次指令是基于误解
Claude Fable is relentlessly proactive
Claude Fable 5 的"不屈不挠的主动性":一个代码调试案例
- Fable 5 被描述为"不屈不挠地主动"(relentlessly proactive):它掌握大量技巧,会主动部署几乎任何方法来达成目标,包括绕过限制的创新手段
- 调试滚动条Bug的完整流程:仅凭一张截图和一句话提示,Fable 自动启动了本地开发服务器、多个浏览器(Chrome、Firefox、Safari)以及 Playwright 测试环境,最终定位并验证了一个仅两行代码的 CSS 修复方案
- 创新的截图技术:发现
osascript被阻止后,Fable 使用uv run --with pyobjc-framework-Quartz编写 Python 脚本,通过遍历窗口列表并筛选特定窗口名来获取窗口编号,再配合screencapture命令完成截图 - 绕过键盘交互限制:Fable 通过修改站点模板注入 JavaScript,在页面加载 1.2 秒后自动触发
/键的键盘事件,从而打开模态对话框 - 自建 CORS 服务器收集数据:Fable 用 Python 标准库的
http.server编写了一个本地服务器,接收来自网页的 POST 请求并将数据写入文件,从而绕过了跨域限制来获取 Web Component shadow DOM 内部元素的测量数据 - 成本与安全警示:这次调试会话按全价计算约花费 $12.11;同时,这种"能执行用户在终端中执行的所有操作"的能力也带来了严重的安全隐患——一旦被恶意指令(如提示词注入攻击)利用,后果不堪设想
Open source AI must win
开源人工智能必须胜出
- 智能若只能从少数封闭机构租用,公众不仅失去软件自由,更失去对技术的运营自主权。
- 能在无需许可的前提下研究、构建、修复、部署、审计、适配、教学、保存并运行智能系统,是关系生存的根本能力。
- 人工智能已成为工作、教育、科研、软件开发、创意、公共服务和国家竞争力等领域的文明基础设施,必须摆脱闭源 API、远程平台、变动使用条款、不透明审查、模型供给或少数公司定价的束缚。
- 开源 AI 应保持可用、易懂、可复现、可本地部署、经济可行,并由社区治理,即使当前主导实验室、外国实验室、硬件供应商、云平台或开权模型提供者转向或消失。
- 当少数封闭前沿实验室和平台公司掌控模型时,整个基础设施可能演变为认知订阅经济;美国不能在运行、检查、修改、基准测试、教学和保存智能基础设施的自由上落后。
- 若希望推动此目标,可发送邮件至 me@ahmadosman.com 与作者私下交流。
Kimi K2.7-Code: open-source coding model with better token efficiency
Kimi K2.7 Code 编程Agent模型技术解析
- Kimi K2.7 Code是月之暗面基于K2.6构建的编程专用Agent模型,在真实世界长程编程任务上有显著提升,思考token使用量减少约30%,显著优于K2.6
- 采用MoE架构:总参数1T、激活参数32B、384位专家(每token选择8位)、1位共享专家、61层(含1个密集层)、注意力维度7168、MoE隐藏维度2048、64个注意力头、上下文长度256K、词汇量160K;注意力机制采用MLA,激活函数为SwiGLU
- 支持图像和视频多模态输入,配备MoonViT视觉编码器(400M参数);强制启用Thinking模式和Preserve Thinking模式,在多轮交互中保留完整推理内容
- 编程能力评测全面超越前代K2.6,并接近GPT-5.5水平:Kimi Code Bench v2得分62.0(K2.6为50.9,GPT-5.5为69.0),Program Bench得分53.6(K2.6为48.3,GPT-5.5为69.1),MLS Bench Lite得分35.1(K2.6为26.7,GPT-5.5为35.5)
- Agent能力大幅提升:Kimi Claw 24/7 Bench得分46.9(K2.6为42.9),MCP Atlas得分76.0(K2.6为69.4),MCP Mark Verified得分81.1(K2.6为72.8),均显著超越K2.6
- 提供OpenAI/Anthropic兼容API,支持vLLM、SGLang、KTransformers推理引擎部署,采用原生INT4量化,最佳编程Agent框架为Kimi Code CLI,代码和模型权重采用Modified MIT许可证开源
Orthodox C++ (2016)
Orthodox C++:极简化C++实践方法论
- Orthodox C++(又称C+)是C++的极简化子集,旨在改进C语言而非追求Modern C++的复杂性,其核心理念呼应Bjarne Stroustrup所言:"Within C++ there is a much smaller and cleaner language struggling to get out",Hello World示例仅需
#include <stdio.h>和printf函数即可实现 - 作者在90年代末曾是Modern C++的积极采用者,但实践表明异常处理(即使未使用也会产生运行时开销并限制编译器优化)、RTTI、流等特性存在问题或导致代码不必要的复杂,这些教训促使其形成与Modern C++相反的设计理念
- 核心原则包括:保持代码对C语言熟悉者的可读性;避免使用异常和RTTI;弃用iostream改用printf风格函数;弃用C++运行时包装器(如
<cstdio>)改用C运行时头文件(如<stdio.h>);不使用涉及内存分配的STL组件;审慎对待新标准特性 - 新标准特性的安全使用遵循"当前年份≥标准发布年份+5"的经验法则,如C++11特性在2016年后才建议选择性使用;2025年Orthodox C++委员会已批准选择性使用C++20,但明确反对使用modules(作者犀利指出模块的唯一"好处"是"什么都没有")
- 该方法论与Embedded C++、Nominal C++、Sane C++等相似理念相呼应,被DOOM 3 BFG、Qt(禁用RTTI和异常的构建模式)、dear imgui、bgfx等知名项目采用,并提供Clang编译器插件Orthodoxy用于选择性禁用特定语言特性
GLM 5.2 Is Out
Z.ai发布GLM-5.2:100万token上下文窗口与下周MIT许可发布
- Z.ai推出GLM-5.2模型,支持100万token超长上下文窗口,在保持Agent状态稳定性方面具有优势
- GLM-5.2提供High和Max两种思考级别,Max级别推荐用于编程任务,可实现更深层推理和更可靠性能
- Z.ai宣布将于下周发布MIT许可版本,选择周六中午发布以避免工作日业务中断,并安排工程师实时监控
- 新版本将优先向Coding Plan订阅用户开放以收集测试反馈,同时鼓励用户订阅后运行基准测试
- GLM和Kimi正进入旗舰模型第三次迭代保持快速更新节奏,而DeepSeek采取不同策略,按自身准备情况发布
- 针对订阅制定价模式的批评指出,重度用户不应成为亏损来源,优秀商业模式应让高频用户产生最大利润
The experience of rendering Arabic typography and its technical debt
阿拉伯语网络排版:千年书法传统与百年技术债务
- 阿拉伯语字母始终以草书连写形式存在,每个字母根据上下文呈现孤立、词首、词中、词末四种不同形态;Unicode存储抽象码位,字体提供字形,渲染引擎实时选择正确形态;缺乏塑造引擎的软件会将每个字母渲染为孤立形态并按从左至右顺序错误排列
- 公元940年,Abbasid维齐尔 Ibn Muqla 在手部重伤(被判叛国罪后被砍去右手)的情况下,用芦苇笔绑在残肢上继续书写数月,记录了al-khaṭṭ al-mansūb体系——以芦苇笔尖的菱形墨点为基准测量每个字母比例;此后六百年间,Ibn al-Bawwāb(1022年)、Yāqūt al-Mustaʿṣimī(1258年)等人不断完善,终于在1924年由Bulaq印刷社的Cairo《古兰经》达到金属活字时代的顶峰
- 传统书吏通过Kashida在字母笔画连接处延伸以实现两端对齐,而非拉伸单词间距;现代浏览器CSS
text-align: justify仅支持词间拉伸,IE5.5曾实现Kashida对齐但被从规范中移除;Amiri字体内置曲化Kashida字形,可生成渐变起伏的笔触效果,但目前只能手动插入U+0640 TATWEEL字符实现 - 阿拉伯语数字分为三套体系:阿拉伯-印度数字(٠١٢٣٤٥٦٧٨٩,用于埃及、叙利亚等地)、扩展阿拉伯-印度数字(۰۱۲۳۴۵۶۷۸۹,用于伊朗、巴基斯坦)、以及西方数字;数字在Unicode双向算法中属于"弱方向性"字符,hyphen等标点在ARABIC NUMBER和EUROPEAN NUMBER之间行为不同,导致电话号码"010-1234-5678"可能被渲染为"5678-1234-010"
- 阿拉伯语排版基础设施(HarfBuzz塑造引擎、Amiri字体、W3C阿拉伯语布局文档等)绝大多数由志愿者无偿开发:Amiri由埃及医生Khaled Hosny自学字体工程于2011年无偿发布,复刻了1924年开罗《古兰经》Bulaq印刷社的金属活字;HarfBuzz早期主要由伊朗裔工程师Behdad Esfahbod贡献,他曾因"伊朗国籍"在机场被拘留十小时;CSS Working Group关于阿拉伯语对齐的提案自2015年至今仍未解决