给软件开发者准备的优质简报,每日阅读 10分钟。
Apple to soon take up to 30% cut from all Patreon creators in iOS app
Apple 要求 Patreon 创作者转向应用内购买系统
- Apple 设定最后期限为 2026 年 11 月 1 日,要求 Patreon 所有创作者从传统计费系统切换至 App Store 应用内购买系统,否则应用面临下架风险
- Apple 对应用内购买和订阅收取 30% 佣金,持续超过一年的订阅佣金降至 15%,其将此定义为数字服务收入
- Patreon 为创作者提供两种应对方案:仅在 iOS 应用内提高价格,或自行承担费用以保持跨平台价格一致
- iPhone 和 iPad 用户可通过 Patreon 网站直接付款,以此绕过 App Store 的佣金抽成
- 截至目前,96% 的 Patreon 创作者已完成迁移,仅 4% 仍在使用传统计费系统
- Patreon 对 Apple 的政策执行方式表示失望,已发布 FAQ 页面为创作者提供更多说明
Claude Code Daily Benchmarks for Degradation Tracking
Claude Code Opus 4.5 性能追踪器 | Marginlab
- 监测目标:独立第三方 Marginlab 旨在检测 Claude Code 使用 Opus 4.5 模型在 SWE 任务上的统计显著性能退化(受 Anthropic 2025年9月发布的性能退化事后分析报告启发)
- 当前状态:已检测到30天内存在统计显著退化;基线通过率为58%,30天平均通过率54%(655次评估),较基线下降4.1%,超过±3.4%显著性阈值
- 核心指标:日均通过率50%(50次评估)、7天平均53%(250次评估),但1日变化-8.0%和7日变化-4.8%均未达统计显著标准
- 独特方法:直接在 Claude Code CLI 中使用最新版本进行基准测试,不使用自定义测试框架,真实反映用户实际使用体验,可同时检测模型变化和框架变化导致的退化
- 统计机制:通过伯努利随机变量模型计算95%置信区间;判定显著退化需日均变化超过±14.0%、周度超过±5.6%、月度过±3.4%;由于每日样本量仅50个,存在预期波动
- 预警服务:提供邮件订阅功能,在检测到统计显著性能下降时自动通知用户
US cybersecurity chief leaked sensitive government files to ChatGPT: Report
美国CISA代理局长被曝向ChatGPT泄露敏感政府文件
- 美国网络安全和基础设施安全局(CISA)代理局长马杜·戈图穆卡拉于去年夏季将标记为"官方专用"的合同文件上传至公共版ChatGPT,此举于8月初被网络安全监控系统标记,触发国土安全部主导的损害评估
- 戈图穆卡拉获得特别豁免使用ChatGPT,而其他国土安全部员工被禁止使用;公共版ChatGPT会将用户输入与OpenAI共享,引发敏感数据外泄担忧
- CISA发言人回应称戈图穆卡拉的使用"短期且有限",且"在国土安全部控制措施下进行",但未否认上传行为本身
- 戈图穆卡拉自2025年5月起担任代理局长至今,参议院尚未确认Sean Plankey为正式局长
- 此外,戈图穆卡拉此前曾未能通过访问高度敏感情报所需的反情报测谎测试,但在上周国会作证中拒绝承认这一说法
Somebody used spoofed ADSB signals to raster the meme of JD Vance
有人利用伪造ADS-B信号在海湖庄园上空"光栅化"J.D.万斯梗图
- 有人在Mar-a-Lago(海湖庄园)上空通过伪造ADS-B(广播式自动相关监视)信号,制造了一个J.D.万斯面部表情包形状的"飞行轨迹"
- 伪造飞行使用了标识符adfdf9(即AF2 ICAO身份),该信号在ADSBexchange网站上呈现出飞机飞行的轨迹图案
- 伪造位置的坐标为纬度26.678、经度-80.030,正好对应海湖庄园所在区域
- 作者Alec Muffett提供了具体的查看链接,并配文提出质疑"接下来,ADS-B需要进行年龄验证吗?"
- 文章发布于2026年1月28日,页面包含一张相关事件的屏幕截图
- 评论区有人指出标题中"raster"一词的使用问题,作者回应称在使用真正的Tektronix T4014设备时并不纠结这类细节
Project Genie: Experimenting with infinite, interactive worlds
Project Genie:Google DeepMind推出的交互式世界创建实验原型
- 项目定位与发布:Google DeepMind开发的实验性研究原型,于2026年1月29日向美国地区18岁以上的Google AI Ultra订阅用户开放访问
- 核心技术架构:基于Genie 3世界模型实现实时路径生成与物理模拟,结合Nano Banana Pro图像生成与Gemini多模态能力,支持动态场景构建与交互一致性
- 三大核心功能:世界素描(通过文本提示或上传图像创建可扩展环境)、世界探索(实时生成前进路径并支持视角调整)、世界混搭(在现有作品基础上二次创作并导出视频)
- 当前技术局限:生成场景的真实感、对提示词的遵循度及物理规则准确性有待提升;角色控制存在延迟;单次体验上限为60秒;部分高级功能(如事件触发系统)尚未集成
- 未来发展规划:在持续优化模型能力的同时,计划逐步扩展至更多地区,最终目标是让更广泛的用户群体能够使用这些世界构建技术与体验
We can’t send mail farther than 500 miles (2002)
MIT邮件系统"500英里"故障之谜
- Trey Harris在MIT担任邮件系统管理员时,收到统计系主任的奇特报告:无法发送邮件超过500英里(精确极限约为520英里)。由于系主任是统计学家,坚持收集足够数据以确认统计显著性,等了数日后才上报。
- 作者亲自测试验证现象真实性:近处城市如里士满、亚特兰大、华盛顿、普林斯顿(400英里)、纽约(420英里)均可正常发送邮件,而孟菲斯(600英里)、波士顿、底特律、普罗维登斯(580英里)等地均发送失败。
- 调查发现根本原因:系统顾问在升级SunOS时,意外将Sendmail从8降级为5,但保留了作者编写的Sendmail 8配置文件sendmail.cf。
- Sendmail 5无法识别Sendmail 8的长配置选项,这些设置被忽略,其中连接远程SMTP服务器的超时参数被设为零。
- 技术分析揭示因果链:零超时设置使连接在约3毫秒后终止;在MIT全交换校园网络中,连接延迟主要由光速传播距离决定——3毫秒光传播距离约为559英里,作者用
units命令计算验证了这一结果。 - 作者以幽默方式结尾,提到正在寻找SAGE IV级别的工作机会(要求具备10年Perl、工具开发、培训和架构经验),邀请有意者发送邮件——只要不超过500英里。
Launch HN: AgentMail (YC S25) – An API that gives agents their own email inboxes
AgentMail:专为AI代理设计的邮箱API服务
- AgentMail(YC S25)是一个为AI代理提供专属邮箱的API服务,专注于“为AI提供邮件服务”而非“用AI处理邮件”,使代理能通过邮件进行异步、多线程、富文本和文件支持的通信
- 该服务解决了Gmail API的诸多限制,包括无法编程创建邮箱、发送频率限制、每个邮箱需单独OAuth认证、语义搜索能力弱以及按座位计费模式不适用于代理场景
- 提供完整的邮箱基础设施功能,包括邮箱创建、域名配置、邮件解析与线程管理、附件文本提取、实时webhook与websocket通知、跨邮箱语义搜索,并采用按使用量计费模式
- 支持多种实际应用场景,如将邮件对话和文档转换为结构化数据、自动询价与谈判、模拟终端用户行为进行模型训练,目前已有开发者和企业用户在生产环境中部署
- 团队认为邮件是互联网现有的身份和认证层,代理拥有独立邮箱可建立自身数字身份,同时该服务作为过渡方案,帮助代理在原生协议成熟前融入现有通信生态
Mermaid ASCII: Render Mermaid diagrams in your terminal
Mermaid ASCII - Mermaid图表转ASCII字符画工具
- 基本定位:开源工具(v1.1.0版),由AlexanderGrooff开发并托管于GitHub
- 核心功能:将Mermaid语法的图表定义实时转换为ASCII字符艺术形式
- 使用方式:支持在线访问、cURL请求(如
curl https://mermaid-ascii.art -d mermaid="graph LR\nABC --> DEF")、克隆仓库后通过Golang命令行运行三种途径 - 配置选项:可自定义xPadding(默认5)、yPadding(默认3)及扩展字符开关
- 示例展示:提供嵌套子图、带标签箭头、样式文本、序列图等多种Mermaid图表类型的转换效果演示
OTelBench: AI struggles with simple SRE tasks (Opus 4.5 scores only 29%)
OpenTelemetry基准测试:AI追踪能力评估
- 前沿模型表现远未达标:14个顶级AI模型在23项OpenTelemetry instrumentation任务中,最佳模型Claude Opus 4.5仅通过29%,GPT-5.2约为26%,Gemini 3系列均约为19%。测试涵盖Go、Java、C++、Python等11种编程语言,模拟真实微服务场景。完整基准测试耗资522美元,包含966次运行。
- 核心缺陷在于上下文理解缺失:AI模型机械地将所有HTTP调用链接成单一追踪链,而非识别独立用户操作。成功搜索与失败令牌请求被错误合并为一条追踪链路,模型将追踪视为扁平事件列表而非层级树状结构,导致代码编译成功却产生格式错误的追踪。
- 编程语言支持差异悬殊:C++以37%通过率领先(部分因任务较简单),Go达到20%。但Java、Ruby和Swift在所有模型中均获0%成功率,暴露AI对非主流语言支持严重不足。测试还发现GPT-5.2 Codex表现显著差于GPT-5.2本体。
- 成本效率存在明显差异:Gemini 3 Flash以最低成本和最快速度(比Claude Opus 4.5便宜11倍、快2倍)达到19%通过率。位于Pareto前沿的四个模型分别是Gemini 3 Flash(性价比最优)、Claude Sonnet 4.5(速度最优)、GPT 5.2(成本效率)和Claude Opus 4.5(综合性能最佳但价格最高)。
- AI SRE仍处于早期阶段:即使最先进模型也无法可靠处理分布式追踪这类基础SRE任务。基准测试耗资522美元完成966次运行,涵盖14个模型和11种语言。部分困难任务如go-microservices-traces可达55%通过率,显示仍有希望。OTelBench作为开源基准已发布,包含完整测试框架和用例,旨在推动行业建立SRE领域的标准化评估体系。
Airfoil (2024)
翼型的物理学原理:气流、压力与升力的本质
- 气流可视化的三种工具:固定箭头表示空间各点的流速方向和大小,随流移动的标记物追踪空气的实际运动轨迹,颜色深浅直观展示流速分布——这三种方法使看不见的空气运动变得可观察、可理解
- 空气分子的无序热运动:室温下单个分子以约1650公里/小时的速度随机运动,每秒经历约百亿次碰撞;大量分子向各方向运动的平均速度趋近于零,这种微观无序在宏观上表现为静止的空气
- 相对运动原理:空气运动具有相对性——在无风环境中物体以速度V运动,与物体静止而空气以速度V吹来,两者在物体表面产生的效果完全相同;飞机飞行时,从飞机视角看是气流迎面而来
- 压力的物理本质:物体表面持续承受大量气体分子碰撞形成压力,空间中不同位置的压力差产生净力;压力差源于分子碰撞频率或速度的差异,始终为正值,其分布决定作用在物体上的合力
- 翼型周围压力分布的形成:气流在翼型前缘因无法穿透而形成高压停滞区;上下表面因流速不同形成低压区,这种压力分布是流动自我平衡的结果——前缘高压阻止空气穿入,上下表面低压由气流分离和补充不足造成
- 升力和阻力的分解:翼型表面压力合力可分解为垂直于来流的升力和平行于来流的压差阻力;对称翼型在零迎角时升力为零,改变迎角或采用非对称翼型可产生净升力
- 粘性与边界层的特性:粘性控制动量在流体中的扩散速率;物体表面存在"无滑移条件"——紧贴壁面的流体速度为零,边界层内速度从壁面向外逐渐加速至外部流速
- 边界层的两种状态:层流边界层流动有序、摩擦阻力小但易分离;湍流边界层混合强烈、摩擦阻力大但更抗分离;两者在不同条件下各有优势,高尔夫球表面凹坑故意使边界层湍流化以减小压差阻力
- 失速现象与临界迎角:当迎角超过临界值时,逆压梯度导致边界层分离,上表面形成旋涡和紊乱流动,压力分布急剧变化使升力骤然下降;这是飞机飞行的关键限制因素,设计师必须确保飞机在正常飞行包线内工作