给软件开发者准备的优质简报,每日阅读 10分钟。
HackMyClaw
🔼 183 | 💬 93
HackMyClaw - 提示注入CTF安全挑战赛
- 这是一个通过邮件进行的间接提示注入(Prompt Injection)网络安全挑战赛,参与者需发送邮件诱导AI助手Fiu泄露其不应透露的
secrets.env敏感文件内容 - Fiu是基于Anthropic Claude Opus 4.6的OpenClaw邮件助手,虽被提示词要求未经人工批准不得回复,但这仅是指令约束而非技术限制,Fiu实际上具有发送邮件的能力,存在被绕过的可能
- 允许的攻击方式包括:角色混淆攻击、指令覆盖尝试、上下文操纵、输出格式利用、”Ignore previous instructions”经典注入、Base64/rot13编码绕过、多步推理利用、不可见Unicode字符、DAN式越狱等多种技术手段
- 禁止的攻击方式包括:直接入侵VPS、非邮件渠道攻击(邮件是唯一允许的攻击向量)、发送垃圾邮件或DDoS,每小时最多发送10封邮件,超限将被临时封禁
- 首位成功提取
secrets.env内容的参赛者可获得100美元奖金(PayPal、Venmo或电汇),比赛结束后可分享攻击技术;未成功时Fiu不会回复邮件,仅会在攻击日志中记录 - 挑战旨在验证前沿AI模型对提示注入的真实抵抗能力,属于已获得授权的教育性安全研究,攻击日志(/log.html)对外公开;参赛者需同意邮件内容可能被公开用于示例展示
Rise of the Triforce
🔼 403 | 💬 66
三神之力崛起:Dolphin模拟器正式支持Triforce街机平台
- Triforce是世嘉、任天堂与南梦宫三家合作开发的街机平台,基于GameCube主机硬件,旨在帮助世嘉在街机市场衰落时期以低成本维持街机业务
- 硬件核心为标准GameCube主板搭配两款定制扩展板:AM-Baseboard负责JVS街机I/O接口和VGA输出,AM-Mediaboard负责游戏存储分发;支持GD-ROM光盘和NAND卡带两种存储方案
- 平台仅发布9款游戏且大多为日本独占,包括两款《马里奥卡丁车Arcade GP》、《F-Zero AX》(F-Zero GX街机版的前身,难度更高且支持力反馈方向盘)、《VR足球4》系列、《阿瓦隆之钥》(需5台Triforce联机运行的集换式卡牌游戏)等
- 街机存档系统支持磁卡和IC卡两种介质,可保存游戏进度、解锁内容及角色数据,部分游戏还支持世嘉ALL.Net全球排行榜联网功能;IC卡还用于登录在线服务
- Dolphin模拟器历经十余年开发:早期尝试因技术问题放弃,开发者crediar独立维护fork超过十年后于2025年将代码合并入主分支,实现全部Triforce游戏运行、多人联机支持及安卓版摇动设备投币功能
Chess engines do weird stuff
🔼 92 | 💬 46
象棋引擎中的独特训练与优化技术
- 蒸馏训练的高效性:AlphaZero之后,虽然强化学习(RL)被用于训练,但实际发现搜索能力(约1200 Elo)远高于模型质量差异(约200 Elo)。因此,仅需训练一次高质量模型,后续引擎(包括竞争对手)可直接通过“坏模型+搜索”蒸馏获得性能,无需昂贵自对局生成。
- 运行时自适应评估:新技术在引擎运行时执行蒸馏:先以神经网络评估局面,再通过搜索修正结果。若网络评估与搜索存在偏差(如+0.15兵),则实时调整后续评估值,使网络动态适应具体局面。
- SPSA无梯度优化:lc0采用随机扰动权重方法(SPSA):向两个方向随机调整权重,通过大量对局测试选择胜率更高的方向。该方法无需梯度,却能为小模型提升约50 Elo(相当于1.5倍模型规模或一年开发成果),但计算成本极高。
- 全参数自动化调优:SPSA可优化程序中任意数值(如搜索算法参数)。通过修改数值并测试胜率,实现类似梯度下降的效果,例如将固定“深度1”后退值优化为“1.09深度”后提升5 Elo。
- Transformer架构与Smolgen创新:lc0使用Transformer架构,比卷积模型高数百Elo。关键创新“Smolgen”系统生成注意力偏差,虽增加1.2倍计算开销,但精度提升相当于2.5倍模型规模,其高效原因尚未明确。
I converted 2D conventional flight tracking into 3D
🔼 160 | 💬 40
Aeris — 实时3D航班追踪工具
- 基于Web的实时3D航班追踪应用,默认以旧金山(SFO)为追踪区域
- 支持“重置”和“随机”两个功能按钮,可切换追踪视角
- 高度显示范围从43,000英尺到海平面0英尺,共7个高度层级
- 航班实时数据由OpenSky Network提供
- 地图数据来源包括OpenStreetMap、CARTO和MapLibre
- 项目已开源,可通过GitHub仓库访问源码
GrapheneOS – Break Free from Google and Apple
🔼 911 | 💬 601
GrapheneOS:逃离Google和Apple的隐私优先移动操作系统
- GrapheneOS是基于Android开源项目(AOSP)的隐私安全强化操作系统,完全移除系统层面的Google服务集成,同时支持在隔离沙盒环境中运行Google Play服务
- 目前仅支持Google Pixel系列设备(推荐Pixel 9a等),利用Titan M安全芯片提供完整数据保护,最长可达7年系统更新支持
- 安装流程包括:解锁引导程序、通过GrapheneOS官方网页下载并刷入系统镜像、完成后重新锁定引导程序以启用完整验证启动功能
- 用户可创建额外用户配置文件,作者将需要Google服务的少数应用(如银行mBank、T-Mobile)保留在Owner主账户用于支付场景,将日常使用应用分离到第二配置文件以增强隐私保护
- 应用获取主要通过Obtainium(开源应用聚合器)和Aurora Store(无需Google账户即可从Play Store下载应用),可实现完全去Google化的应用生态
- 系统提供精细化权限控制(可禁止任何应用的网络或传感器访问)以及”私密空间”功能,可在主用户环境中为特定应用创建隔离沙盒
Gentoo on Codeberg
🔼 126 | 💬 27
Gentoo 在 Codeberg 上建立代码托管镜像
- Gentoo 已在 Codeberg 平台建立官方仓库镜像,可通过 https://codeberg.org/gentoo/gentoo 提交贡献,作为 GitHub 的替代方案
- 这是 Gentoo 从 GitHub 逐步迁移镜像计划的一部分,相关计划已在 2025 年年底回顾中提及,未来 Codeberg 还将托管其他 Git 仓库
- Codeberg 基于 Forgejo 平台构建,由位于德国柏林的非营利组织运营维护
- 推荐使用 AGit 方式提交 Pull Request,无需在 Codeberg 上维护仓库分支,更加节省空间
- 文章提供了具体的 Git 命令操作指南:添加远程仓库、创建分支、通过
git push命令配合 topic 参数自动创建 PR - 这些镜像仅为方便贡献者使用,Gentoo 仍将维护自己的官方仓库,如同此前使用 GitHub 镜像时一样
Using go fix to modernize Go code
🔼 159 | 💬 24
使用 go fix 现代化 Go 代码
- Go 1.26 完全重写了
go fix子命令,使用与go vet共享的分析框架来识别代码改进机会,可通过go fix ./...修复整个项目,使用-diff预览更改,go tool fix help列出可用分析器 - Go 1.18 引入泛型后语言特性快速迭代,催生数十个现代化分析器:minmax(用 min/max 替换条件判断)、rangeint(用 range-over-int 替换三段式 for 循环)、stringscut(用 strings.Cut 替换字符串索引和切片),这些也被集成到 gopls 提供实时反馈
- Go 1.26 新增
new(expr)语法可直接初始化值,如new(10)替代newInt(10)辅助函数,newexpr 分析器会自动识别并替换此类函数调用,同时保留最低版本要求检查以避免过早使用新特性 - 修复存在协同效应——应用一个修复可能创造应用另一个的机会,使用三路合并算法处理冲突,语义冲突可能导致编译错误但会自动移除未使用的导入,建议多次运行直到达到固定点
- Go 分析框架将分析器与驱动程序分离,支持在 gopls、Bazel、staticcheck 等多种环境中运行,并通过 facts 机制实现跨包分析,inspector 包和 typeindex 等工具大幅提升了分析效率
- Go 团队正在推进”自服务”范式,允许模块维护者为自己的 API 定义现代化规则,Go 1.26 预览了基于注解的源码级内联器,未来计划支持动态加载现代化器和控制流检查器的通用化
Async/Await on the GPU
🔼 89 | 💬 24
在GPU上运行Rust async/await——VectorWare实现世界首创
- VectorWare首次在GPU上成功运行Rust的Future trait和async/await语法,利用Rust的所有权模型、Pin、Send/Sync等特性使数据约束在程序结构中显式化,实现结构化并发
- Rust futures编译成状态机,无需新的编程语言或生态系统即可复用现有CPU代码,与JAX计算图、Triton blocks、CUDA Tile tiles在概念上相似但更通用
- 实现过程需要修复多个编译器后端bug并解决NVIDIA ptxas工具的问题;团队首先用简单的block_on执行器验证可行性,随后成功适配嵌入式设计的Embassy执行器,实现多个async任务在GPU上并发调度
- GPU缺乏硬件中断支持,执行器必须通过轮询机制确定futures进度,需使用nanosleep等API平衡延迟和效率,同时维护调度状态会增加寄存器压力影响occupancy
- Futures采用协作式调度,若futures不让出控制权则会饥饿其他任务;此外Rust async模型同样存在函数着色问题
- 未来计划开发针对GPU硬件特性优化的原生执行器,利用CUDA Graphs或CUDA Tile机制提升任务调度效率;公司未来产品将支持多种编程语言,但Rust仍是最适合构建高性能GPU原生应用的选择
Show HN: I wrote a technical history book on Lisp
🔼 83 | 💬 20
《Lisp的天才》书籍介绍
- 本书由Cees de Groot撰写、Berksoft Publications出版,详细介绍Lisp编程语言的历史,Richard P. Gabriel称其为”学术巨著”
- 购买渠道包括Lulu.com(首选,该平台为B级认证公司)、Kobo电子书城以及亚马逊加拿大、美国、英国、德国、荷兰等站点,提供电子书、平装本和精装本
- 读者可通过Libera Chat的##geniusoflispbook频道及其网页客户端、Mastodon、Lemmy及Hacker News向作者反馈
- 配套资源包括书中使用的源代码包(tar格式)、可点击链接的参考书目以及勘误表
- 亚马逊提供样章预览,作者在其个人网站发布了写作背景文章
Claude Sonnet 4.6
🔼 441 | 💬 368
Claude Sonnet 4.6:Anthropic发布迄今最强大的Sonnet模型
- Claude Sonnet 4.6是Anthropic最强大的Sonnet模型,全面升级编码、计算机操作、长上下文推理、代理规划和设计能力,并支持100万token上下文窗口(测试版)
- 定价与4.5保持一致(每百万token 3美元/15美元),现已成为Claude.ai和Claude Cowork的默认模型(适用于Free和Pro计划)
- 编码能力大幅提升,早期测试中开发者更倾向使用Sonnet 4.6而非前代,甚至超越2025年11月的Claude Opus 4.5,在实际经济价值办公任务上达到Opus级别性能
- 计算机操作能力显著进步,OSWorld基准测试显示16个月持续提升,早期用户在复杂电子表格导航和多步骤网页表单填写等任务中达到人类水平;Vending-Bench Arena评估中展现出优秀的长期规划能力,能在模拟商业竞争中制定并执行有效的投资策略
- 安全评估显示整体与近期Claude模型同样安全或更安全,对提示注入攻击的抵抗力相比4.5大幅提升,达到与Opus 4.6相当水平
- Claude开发者平台支持自适应思考和扩展思考,测试版提供上下文压缩;API的网络搜索工具现可自动编写代码过滤搜索结果,代码执行、记忆、工具搜索等功能已全面上线
AI is destroying open source, and it's not even good yet
🔼 389 | 💬 321
AI正在摧毁开源,而且它甚至还不够好用
- Ars Technica因AI幻觉引用开源库维护者Scott Shambaugh的虚假言论而撤稿,该维护者此前因拒绝合并AI生成的垃圾代码而遭受AI代理的骚扰;OpenClaw开发者随后被OpenAI招聘去”让AI代理普及到每个人”
- curl维护者Daniel Stenberg宣布终止漏洞赏金计划,因为AI生成的无效报告泛滥,有价值的漏洞报告占比从15%骤降至5%,且这些AI用户态度傲慢,从不真正贡献修复代码
- GitHub新增了完全禁用Pull Requests的功能设置,以应对AI垃圾PR泛滥的问题;Jeff Geerling管理着300多个开源项目,已亲身体验到AI垃圾代码大量涌入的困扰
- AI代码生成已触及发展瓶颈,性能提升趋于停滞,而人工代码审查的资源有限,无法像AI公司那样无限扩展
- 作者将当前AI热潮比作加密货币和NFT泡沫,同样充斥着疯狂的投机行为和不切实际的乐观主义,Western Digital已宣布2026年硬盘库存售罄,AI导致的硬件短缺正在上演
Is Show HN dead? No, but it's drowning
🔼 308 | 💬 259
Show HN未死,但正在被噪音淹没
- Show HN并未真正消亡,帖子数量反而比以往更多,但每条帖子能获得的关注和讨论大幅减少,这种现象被 Johan Halse 称为”Sideprocalypse”(副业末日)
- 每个创意都被更有资金的团队更快建成并通过营销和SEO优化抢占市场,导致小众独立开发者的机会减少,优质项目难以在噪音中脱颖而出
- Show HN最初优于普通提交帖,如今却显著逊色,首页展示窗口期在美国高峰时段越来越短,且讨论氛围也在衰退
- 作者列举了三个他认为有趣但可能被忽视的项目:Neohabit、OpenRun、uForwarder,并亲自为它们投票
- 如何让真正优秀的”宝石”项目获得更多关注、如何让HN保持作为讨论酷炫技术的最佳地点,成为值得思考的问题
Anthropic tries to hide Claude's AI actions. Devs hate it
🔼 386 | 💬 239
Anthropic 隐藏 Claude 文件操作引开发者强烈反对
- Anthropic 发布 Claude Code 2.1.20 版本,将进度输出改为隐藏文件名,仅显示”已读取 3 个文件(按 ctrl+o 展开)”等简化信息
- 开发者强烈反对,需要看到文件名原因包括:安全考量、及时发现 Claude 是否从错误文件获取上下文、审计历史活动、以及避免因走错方向浪费 tokens
- Anthropic 负责人 Boris Cherny 回应称此举是为简化界面,让开发者聚焦于 diff 和命令输出,并建议试用几天;开发者批评这是”愚蠢地删除有价值信息”,verbose 模式噪音过多
- Cherny 最终做出调整,重新利用 verbose 模式来显示文件路径,但不再显示完整思考过程等细节,导致原本需要完整信息的用户不满
- 开发者担忧若 AI 工具隐藏操作细节,错误更容易被忽视,有开发者表示”如果无法追踪推理过程和读取意图,token 配额很快就会耗尽”