给软件开发者准备的优质简报,每日阅读 10分钟。
An OpenAI model has disproved a central conjecture in discrete geometry
OpenAI模型证伪离散几何核心猜想
- 平面单位距离问题由保罗·厄多斯于1946年提出,核心问题是在平面上放置n个点时最多能有多少对点恰好相距1个单位;此前最佳构造来自重缩放方形网格,增长率仅为$n^{1 + C/\log\log n}$(上界为$n^{1+o(1)}$),而上界$O(n^{4/3})$自1984年Spencer-Szemerédi-Trotter的工作以来基本未获改进
- OpenAI内部通用推理模型自主证伪了这一长达数十年的主流猜想:对无穷多个n值构造出至少$n^{1+\delta}$对单位距离点($\delta > 0$);初始AI证明未给出具体$\delta$值,后续由普林斯顿大学Will Sawin优化确定为$\delta = 0.014$
- 证明的核心创新在于将高斯整数(形如$a+bi$的复数)替换为代数数论中具有更丰富对称结构的数域,借助无限类域塔和Golod-Shafarevich理论等工具证明所需数域的存在性;这些代数数论工具对几何问题的应用令数学家深感意外
- 这是AI首次自主解决数学领域核心公开问题,菲尔兹奖得主蒂姆·高尔斯在配套论文中称之为"AI数学研究的里程碑",数论学家Arul Shankar评价AI已超越"人类数学家的辅助工具"角色,能产生原创性的精妙想法并将其实现
- 代数数论专家托马斯·布鲁姆指出此结果表明数论构造在离散几何问题中的应用潜力远超此前预期,AI不仅提供解决方案,更带来数学发现,其揭示的意想不到的联系将推动该领域的进一步探索
Google Declaring War on the Web
Google对网络的"宣战":AI搜索转型与开放网络的危机
- Google在2026年I/O主题演讲中宣布将搜索进一步推向"AI概览"模式——直接提供AI生成的答案而非信息链接,彻底放弃提供来源链接的既有范式,当前AI摘要的错误率约为10%
- 作者认为这是Google在建立一个新的抽象层,将整个网络隐藏在其控制的界面之后,剥夺用户对信息来源的直接访问,内容创作者的作品沦为免费的原材料供其大语言模型使用
- 这是一场针对参与式网络的"革命":目的是垄断信息获取渠道,将用户限制为被动消费者,用户不再需要(也被阻止)直接访问创作者的作品
- 鉴于Google对网络标准的强大影响力,这种做法将改变未来网络技术标准的制定方向,其效果等同于Meta元宇宙愿景但缺乏开放标准
- 作者警告下一步可能是Google等公司创造贬义术语将"网络"污名化为混乱、危险的象征,而将其控制的抽象层包装为"安全"的网络
- 作者呼吁重视网络开放性,建议用户进行"去Google化"心理建设,使用其他搜索引擎、避免Chrome浏览器,否则醒来时将发现自己被困在一个"AOL式垃圾化"的环境中
Flipper One – we need your help
Flipper One——我们需要您的帮助
- Flipper One是与Flipper Zero定位完全不同的Linux网络多工具项目:Flipper Zero专注于离线点对点协议层(Layer 0),而Flipper One聚焦IP网络层(Layer 1),可作为路由器、VPN网关、透明网桥或便携式电视盒子使用
- 采用双处理器架构:高性能RK3576八核SoC(集成Mali-G52 GPU、NPU和8GB RAM)搭配树莓派RP2350双核微控制器,MCU可在Linux关闭时独立控制显示屏、按键和电源子系统
- 目标打造最开放、文档最完善的ARM计算机,与Collabora合作实现完整的主线Linux内核支持,完全不依赖二进制 blobs、封闭驱动或供应商锁定的BSP,DDR训练固件是当前唯一待攻克的封闭环节
- 开放开发者门户,公开任务追踪和内部讨论,涵盖硬件、结构设计、Linux内核、MCU固件、UI界面、文档和测试等子项目,任何人均可参与贡献
- M.2扩展系统采用Key-B接口(支持PCIe 2.1、USB 3.1、SATA3等),可连接SDR模块、5G/卫星模组、AI加速器或SSD;GPIO接口支持标准2.54mm间距穿孔板,便于DIY模块开发
- 网络接口包括双千兆以太网、Wi-Fi 6E(MT7921AUN芯片组支持监听模式)、5G蜂窝和USB-C 5Gbps以太网;Flipper OS通过配置快照实现干净的系统回滚,FlipCTL框架为小型LCD屏幕提供命令行工具的菜单式封装
- 卫星NTN(非地面网络)模组支持5G标准卫星直连;内置NPU可运行本地LLM实现离线AI辅助,HDMI输出支持4K@120Hz和CEC消费电子控制
GitHub is investigating unauthorized access to their internal repositories
GitHub 正在调查内部仓库未授权访问事件
- GitHub 官方账号正在调查其内部仓库遭受的未授权访问事件
- 目前暂无证据表明客户存储在 GitHub 内部仓库之外的信息(包括企业、组织和仓库数据)受到影响
- GitHub 正在密切监控事态发展
- 事件公告发布于 2026 年 5 月 19 日晚间 11:48
Waymo pauses Atlanta service as its robotaxis keep driving into floods
Waymo因robotaxi驶入积水路段暂停亚特兰大服务,面临多项安全调查
- Waymo已在亚特兰大和得克萨斯州圣安东尼奥两座城市暂停自动驾驶出租车服务,因robotaxi在暴雨积水路况下多次出现问题,亚特兰大一辆无人驾驶出租车被困积水路段约一小时后被拖离现场
- Waymo上周因此问题发布了软件召回,但承认"最终补救方案"尚未完成,当前仅部署了针对特定时间和地点的临时限制措施;亚特兰大暴雨强度超出预期,在国家气象局发布任何预警前洪水便已发生,预警系统未能及时触发
- 调查一:Waymo robotaxi去年被发现在德克萨斯州奥斯汀多次违法超越停靠校车,公司发布修复后车队仍继续此类违规操作;NHTSA已于5月15日向Waymo发出第二份文件请求,因初始回复"需要进一步提供数据和信息"
- 调查二:1月23日,加利福尼亚州圣莫尼卡一辆robotaxi在圣莫尼卡一所小学附近撞击一名女童;Waymo表示robotaxi在撞击前刹车至约6英里/时,女童受轻伤
- 美国国家公路交通安全管理局(NHTSA)和美国国家运输安全委员会(NTSB)正在同时调查上述两起独立事件
Python 3.15: features that didn't make the headlines
Python 3.15 中值得关注的"小"特性
- TaskGroup.cancel() 实现优雅取消:任务组新增
cancel()方法可直接取消组内所有任务,无需借助自定义异常和contextlib.suppress的复杂模式,使结构化并发的使用更加简洁 - ContextDecorator 完整生命周期支持:
ContextDecorator现可正确处理异步函数、异步迭代器和生成器,确保装饰器覆盖被包装对象的完整生命周期,作者认为这使上下文管理器成为创建装饰器的最佳方式 - 线程安全迭代器工具:新增
threading.serialize_iterator、synchronized_iterator装饰器和concurrent_tee工具,可在多线程环境下安全共享迭代器,无需改造原有迭代器抽象即可用于并发代码 - Counter 新增 XOR 对称差集运算:
collections.Counter在交集(&)和并集(|)操作基础上新增对称差集(^)操作,结果等价于(c | d) - (c & d),将 Counter 视为元素集合时,^返回只存在于其中一个 Counter 的元素 - JSON 解析为不可变类型:结合
frozendict(PEP-814)和json.load/json.loads新增的array_hook参数,可将 JSON 数组和对象直接解析为tuple和frozendict等不可变可哈希类型
Was my $48K GPU server worth it?
$48K GPU服务器值不值?独立研究者的深度评测
- 作者于2024年离开FAANG公司成为独立研究员,建造了配备6块RTX 6000 Ada显卡的"grumbl"服务器,总花费4.8万美元;选择该显卡是因为A100不支持FP8且H100性价比过低,而RTX 6000 Ada在价格吞吐量比上最优
- 公寓电路成为最大挑战——6块GPU需要两台电源分别插入不同电路供电,为此作者聘请了专业PC组装人员以确保安全;因电源限制选择了慢速GPU互联的主板(适合并行运行多个小实验但无法跨GPU分割大模型);讽刺的是,在围绕公寓电力限制完成整个设计后,作者最终将服务器搬到了父母家地下室并升级了电路
- 作者通过脚本每分钟记录GPU使用情况进行分析:按小时统计GPU是否被使用过;2024年平均利用率76%,2025年1月后达85%;6块GPU中任一块被使用则该小时算作使用时间——这种计算方式对云租用有利;运行期间出现过3次因PCIe riser故障导致的维护停机,调试过程中参考了Nathan Odle的riser调查文章
- 按云服务按需价格计算,截至2026年3月租用等效算力需6.8万美元,扣除约3000美元电费(每月125美元)后已节省约1.7万美元,GPU已回本,目前每天节省90-105美元;保留实例方案(6-12个月)因仅略低于购买成本而未纳入比较
- 服务器的真正目的是做出酷的东西——作者利用该设备解决了LLM的重大问题,产品发布后获得40万+浏览量,多家公司联系授权其技术专利
- 拥有GPU带来显著心态转变:租用时每个实验都需考虑是否值得,拥有后感觉"不运行实验就在亏钱";作者坦承自己存钱多年才能进行此类风险投入,不建议所有人效仿;若重来会选择买标准服务器放colocation机房;整个分析未计入自身时间成本
Indexing a year of video locally on a 2021 MacBook with Gemma4-31B (50GB swap)
M1 Max本地运行Gemma 4 31B为一年视频素材构建可英文查询的索引系统
- 问题的本质是索引缺失而非工具匮乏:作者(马赛马拉生态旅馆经营者)发现社交媒体停更的真正原因是素材无法检索(文件名只是
IMG_*.mov),而非缺乏AI编辑工具——市面上的AI视频编辑器都在解决"第二问题"(剪辑),却跳过了"第一问题"(索引构建),这才是所有解决方案的前提 - 本地优先策略降低成本并保护隐私:放弃每月140美元的SaaS方案(Eddie AI、Higgsfield、Submagic),因为生成式AI不适合真实旅行品牌调性;改用DaVinci Resolve内置功能(IntelliSearch、Smart Bins、Voice to Subtitle)配合Claude Code驱动,MCP生态连接,成本降至约22美元(ElevenLabs语音克隆费用),素材保留在本地物理SSD不上传云端
- Sidecar索引格式设计:为每个视频生成
.description.md同目录文件,包含YAML结构化元数据(评分、光线类型、时间、色彩、人数、位置、面部向量等枚举字段)和自然语言描述;管道流程包括:ffprobe提取元数据→exiftool获取GPS→Nominatim逆地理编码→ffmpeg提取5帧→WhisperX转录(97语言)→insightface检测并存储512维面部向量→视觉模型单次调用生成所有信息→sidecar写入磁盘 - M1 Max硬件能力被低估:2021款16英寸MacBook Pro M1 Max(64GB内存)通过LM Studio运行Gemma 4 31B Q4完成bulk pass,峰值Swap使用50.89GB;作者评价该机器为"传奇"——五年前为运行Chrome多标签而购入,如今承载原本不存在的31B参数模型,预期还可再用三至五年
- 四个实战经验总结:WhisperX 3.8的diarization API Breaking Changes需防御性构造函数处理兼容性;Claude CLI非交互模式会静默返回权限拒绝文本(需匹配"I need permission"字符串);schema字段禁止混合类型(整数或特定字符串),会引发下游解析混乱;视频素材cull逻辑需区分摄影师作品集标准(去除瑕疵)与视频记忆逻辑(保留风格化不完美),同一schema不同标准
- 核心结论与后续:结构化枚举字段比开放指令更能防止幻觉(Gemma在测试中为夜景照片捏造了"明亮自然光");本地31B配合结构化提示已覆盖80%场景,云端模型仅需处理剩余疑难素材;下一步构建Claude Code编排的编辑器,以Resolve MCP执行剪辑、ElevenLabs处理功能性旁白(不含 testimonials),但也可能最终选择雇佣专职编辑
BBEdit 16
BBEdit 16正式发布:超百项功能更新与性能飞跃
- BBEdit 16正式发布,包含超过一百项新功能、改进和优化,并在部分功能上实现了数量级性能提升
- 新增Shortcuts集成支持,借助App Intents框架提供全新actions,使文本转换功能更便捷地融入自动化工作流
- 新增图片文本搜索功能,支持多文件搜索及grep正则表达式匹配,用户可直接在图片中查找特定文字内容
- 项目和笔记本支持颜色自定义功能,用户可为每个项目或笔记本选择专属配色方案
- AI Chat Worksheets大幅改进,响应时间显著缩短,并新增流式输出显示功能
- 新增W3C HTML5语法检查器、vi键盘模拟、Git支持改进、SFTP传输性能提升等众多功能,升级政策依版本和时间有所不同