给软件开发者准备的优质简报,每日阅读 10分钟。
AI is just unauthorised plagiarism at a bigger scale
AI只是未授权的大规模抄袭
- AI在未经原作者同意的情况下收集数据进行“学习”,并将学习成果出售给用户,却不向原创者支付任何报酬。
- 更糟的是,AI工具的用户将生成的内容转售给其他客户,从复制内容中实现双重获利。
- 作者以撰写电商相关教程为业,是原创内容生产者。
- 一些网站作者直接让ChatGPT复制网络上的热门教程后以原创名义发布。
- 作者发现抄袭是因为这些网站在Google排名更高,且文章中保留了指向其网站的原始链接和精确链接文字。
- 作者强烈批评Google将抄袭网站排在原创者之前,并质疑“这是人类的巅峰吗?懒惰且贪婪?”
Throwing AI-generated walls of text into conversations
no slop grenade:拒绝AI长文轰炸,回归人类沟通本质
- 核心定义:将大段AI生成内容粘贴到对话中被称为"slop grenade"——这破坏了沟通媒介本身,因为"没有人会在Slack里写论文"
- 直观对比:以Redis与Memcached选型为例,展示AI长文(罗列所有技术细节)与人类回复("Redis,我们需要pub/sub实现通知功能")的差异
- 双重危害:不仅窃取接收者时间(一句话能说清的事需对方花20分钟消化),更扼杀对话——长文没有回应空间,对方无法反驳、无法澄清,实质是"伪装成助人的敌意"
- 根本症结:人们向你提问是寻求人类判断,而非AIessay;若需要AI生成内容,他们自己会直接去问ChatGPT
- 核心原则:用AI让表达更清晰、更锋利,而非更长;用它磨练思维,而非取代人类判断。引用鲍德里亚警示:"我们生活在一个信息越来越多、意义却越来越少的世界"
Google's Antigravity bait and switch
Google Antigravity 强制更新引发的用户困扰
- 自动更新将作者使用数月的 IDE 替换为单一对话式聊天界面,完全破坏了原有的工作流程
- Google 在下载页面底部提供了旧版 IDE 独立安装包,但 2.0 版本会强制重写默认应用路径,导致两个版本无法并存运行
- 唯一解决方案是完全清除系统中的所有 Antigravity 相关文件后重新安装
- 卸载重装导致聊天记录和设置全部丢失,仅留下一个
antigravity-backup备份文件夹,作者因缺乏时间和 token 暂未处理 - 作者批评这种强制更新方式,认为后台更新应仅用于性能修复和版本升级,而非秘密替换整个软件功能
- 作为 Google 生态深度用户,作者表示将寻找禁用自动更新的方法
Bun support is now limited and deprecated
yt-dlp 宣布 Bun 支持范围收窄并正式弃用
- 从下一个 yt-dlp 和/或 ejs 版本起,仅支持 Bun 1.2.11 至 1.3.14 版本
- 最低版本从 1.0.31 提高至 1.2.11,原因有二:低于 1.2.0 的版本构建 ejs 时会忽略 lockfile,带来 npm 供应链攻击风险;ejs 测试套件无法在低于 1.2.11 的版本正常运行
- 最高版本限定为 1.3.14,因为该版本是 Bun 最后一个基于 Zig 原生代码库的发布版本,此后 Bun 宣布全面改用 Rust 重写并主要依赖 Claude 生成代码
- 项目方将 Bun 支持正式标记为弃用状态,保留在维护负担过重时完全移除支持的权利
- yt-dlp 已支持插件系统,用户可开发 rustbun 等插件为新版 Bun 提供支持;项目方认为主动限制比先支持后撤除更具前瞻性
- EJS Wiki 尚未更新以反映本次公告中的版本变更
Antigravity 2.0 Tops the OpenSCAD Architectural 3D LLM Benchmark
OpenSCAD LLM基准测试:六款AI工具建模帕提农神庙能力评测
- 基准测试由ModelRift发起,六款AI工具(Cursor Composer 2.5、Codex 5.5 High、Claude Code配合Opus 4.7/Sonnet 4.6、Google Antigravity 2.0配合Gemini 3.5 Flash、ModelRift配合Gemini Flash 3.0)接受同一视觉提示,以两张参考图(正立面与鸟瞰图)自主生成OpenSCAD帕提农神庙模型,并使用OpenSCAD CLI渲染PNG预览进行迭代
- Google Antigravity 2.0配合Gemini 3.5 Flash是最佳纯自主生成结果(质量4.5/5),唯一采用真实建筑尺寸参数建模,并实现了穹顶内部5圈28个方格藻井这一标志性天花结构,展示了Gemini 3.5 Flash在空间代码生成上的潜力
- ModelRift配合Gemini Flash 3.0的人工标注迭代工作流获得最高质量评分(3.8/5),用户在渲染图上直接绘制箭头和批注反馈给AI,比纯文本描述能更精准修正柱子错位、穹顶比例等空间几何问题
- 速度与质量无相关性:Cursor Composer运行最快但输出最弱(质量1.4/5),Claude Sonnet耗时最长但原始自主模型最整洁(质量3.4/5),Codex渲染预览表现优秀但STL导出在门廊与穹顶连接处产生几何缺陷,验证了"预览正确不等于导出正确"的风险
- 客户端工作流设计影响显著:Codex Desktop在对话线程中同时展示参考图与预览图使视觉对齐更明确,Claude Code纯终端交互缺乏显式视觉上下文但稳定性良好,ModelRift的标注模式将反馈从文字描述升级为直观的视觉指正
- OpenSCAD作为目标语言的核心优势得到验证——LLM可直接表达"沿半径重复28根柱子""从穹顶减去穹顶眼"等几何意图,工具调用本身未成为瓶颈,但几何判断能力仍是各系统的共同短板
DeepSeek makes the V4 Pro price discount permanent
DeepSeek API模型与定价
- Token定义与计费基础:Token是模型识别的最小文本单位,可以是单词、数字或标点符号;按输入和输出token总数计费,缓存命中价格仅为正常输入的十分之一(2026年4月26日起生效)
- 模型规格:提供deepseek-v4-flash和deepseek-v4-pro两款模型,支持推理与非推理两种模式,兼容OpenAI和Anthropic两种API格式,上下文长度1M,最大输出384K;旧模型名称deepseek-chat和deepseek-reasoner未来将弃用
- 功能与并发限制:两款模型均支持JSON输出、工具调用、聊天前缀完成(Beta);FIM完成仅限非推理模式;并发限制分别为2500和500
- 定价对比:deepseek-v4-flash输入$0.14(缓存命中$0.0028)/百万tokens,输出$0.28;deepseek-v4-pro现75%折扣输入$0.435(缓存命中$0.003625),输出$0.87
- 促销与后续调整:deepseek-v4-pro 75%折扣促销截止(2026年5月31日)后,价格将正式调整为原价的1/4(原输入$1.74、输出$3.48)
- 计费规则:费用=消耗token数量×单价,优先扣除赠送余额,产品价格可能调整,建议根据实际用量充值并定期查看最新定价
Launch HN: Superset (YC P26) – IDE for the agents era
Superset:AI 编程 Agent 时代的并行代码编排工具
- 并行执行与工作区隔离:在独立的 git worktree 中同时运行 10+ 个 CLI 编程 agent,每个任务独占分支和工作目录,避免 agent 间相互干扰,实现零上下文切换开销
- 统一监控与快速上下文切换:内置终端、差异查看器和编辑器,单一界面监控所有 agent 状态,支持 ⌘1-9 等快捷键在各工作区间一键跳转
- 广泛兼容主流 AI 编程工具:全面支持 Amp Code、Claude Code、OpenAI Codex CLI、Cursor Agent、Gemini CLI、GitHub Copilot、OpenCode、Pi 等 CLI 工具,任何终端可运行的 agent 均可适配
- 自动化工作区配置:通过
.superset/config.json定义 setup/teardown 脚本,自动完成环境变量复制、依赖安装等初始化工作,支持 SUPERSET_WORKSPACE_NAME 等内置环境变量 - 运行环境要求:仅 macOS(Windows/Linux 未测试),需安装 Bun v1.0+、Git 2.20+、GitHub CLI(gh)及 Caddy(开发服务器反向代理)
- 技术栈与开源许可:基于 Electron + React + TailwindCSS 构建,使用 Turborepo + Vite 管理构建、Drizzle ORM + Neon 数据库持久化、tRPC 通信;采用 Elastic License 2.0(ELv2)开源协议
Open source Kanban desktop app that runs parallel agents on every card
KanBots — 支持并行调度 AI 代理的看板工具
- 并行代理与独立工作树:支持在多张卡片上同时调度 Claude Code 或 Codex 代理,每个代理在独立的 git worktree(kanbots/issue-N 分支)中运行,看板实时显示运行进度、决策结果和成本累积
- 本地优先架构:所有数据存储在本地的
.kanbots/目录(SQLite 数据库、配置文件、工作树),零字节数据离开设备,无云账户、无遥测、无 HTTP 服务器 - Autopilot 自主开发模式:配置产品经理、工程师、审查员、测试员等角色(内置可自定义),设置 1-4 个并行槽位,代理轮询执行并自动将父任务拆分为子卡片,新卡片后续自动被拾取执行,角色可派生子角色持续演化待办列表
- 决策交互机制:代理在关键节点暂停并显示编号选项,用户可点击选择、编辑后重新提交或使用
/spec、/review、/split等斜杠命令响应,确保所有决策可审查而非静默执行 - 内置 MCP 服务器与工具链集成:提供 MCP 服务器供 Cursor、Claude Desktop 等工具调用,支持 GitHub 个人令牌操作 Issues 和创建草稿 PR,预提交钩子确保代理无法自行发布代码
- 成本管控与 QA 模式:实时显示每张卡片、每次运行、每个项目的费用,支持设置单次运行和会话预算上限;QA 模式在工作树中执行类型检查、测试、lint、构建、端到端测试,失败项自动派生修复任务
Project Glasswing: An Initial Update
Project Glasswing首月成果:AI漏洞发现效率提升十倍,但修复能力成为网络安全新瓶颈
- Anthropic与约50个合作伙伴使用Claude Mythos Preview在一个月内发现超过10,000个高危或严重级别漏洞,合作伙伴的漏洞发现速度普遍提升十倍以上;Cloudflare发现2,000个漏洞(其中400个为高危或严重级别),误报率优于人工测试人员
- Mythos Preview获多方独立验证:英国AI安全研究院报告其为首个全程完成两项网络攻防模拟的模型;Mozilla在Firefox 150测试中发现271个漏洞(相比使用Claude Opus 4.6的Firefox 148提升十倍以上);XBOW称其"显著超越所有现有模型";ExploitBench和ExploitGym学术基准测试均显示其表现最强
- Anthropic已扫描超过1,000个开源项目,估计发现6,202个高危或严重漏洞;其中1,752个经六家独立安全公司审核,90.6%确认为真实漏洞,62.4%确认为高危或严重级别;在当前验证率下,预计开源代码中将累计发现约3,900个高危或严重漏洞
- 漏洞发现与修复之间存在巨大鸿沟:当前瓶颈已从漏洞发现转变为人工验证、披露和补丁设计;已披露530个高危/严重漏洞但仅修补75个,部分开源维护者因处理能力超负荷请求放缓披露节奏
- Anthropic发布Claude Security公开测试版并推出Cyber Verification Program、技能库、扫描工具集和威胁模型构建器等资源,帮助更多防御者利用AI提升安全能力;与OpenSSF Alpha-Omega项目建立合作支持开源维护者处理漏洞报告