给软件开发者准备的优质简报,每日阅读 10分钟


Never Give Them Your Face

725 pointsLinkComment(430)Share

拒绝以“保护儿童”为名的强制面部识别监控

  • 此类系统表面上是为保护未成年人而设的年龄验证,但实际上强制所有互联网用户提交身份证件或进行面部扫描,演变为对所有人的普遍身份审查。
  • 其本质已从“是否成年”的简易核查,转变为强制性的身份追踪,旨在集中收集用户的全名、出生日期、证件号码及面部生物特征等不可更改的永久标识。
  • 用户的面部生物信息具有唯一性且无法重置,一旦被第三方数据库泄露或窃取,将永久暴露于风险之中,无法像密码一样进行更改。
  • 系统实际效果低下,青少年能轻易绕过验证机制,反而可能将他们推向更缺乏监管、更不安全的网络空间,而监控数据本身却得以存留。
  • 建立的集中式身份数据库会随时间推移产生长期风险,可能在未来被不同政权利用,成为监控、追踪甚至打压公民的工具。
  • 只有通过广泛的个体拒绝参与——不上传照片、不配合验证——才能瓦解该系统依赖的普遍合规基础,从而有效抵制这种监控架构。

What we call "age verification" is actually mass surveillance

670 pointsLinkComment(350)Share

对“年龄验证”立法的批判及其危害

  • “年龄验证”实际上是对所有网民实施细粒度追踪的“大规模监视”,而非真正的未成年人保护手段。
  • 反大科技的活动家与保守派文化战争者共同推动此类立法,却不自知这正帮助技术公司收集数据;他们甚至先让儿童学会使用 VPN,然后再计划禁止 VPN。
  • 在线监控使儿童和大众成为算法精准投放的目标,导致误导性内容、价格上涨、就业和租房歧视等多重负面后果。
  • 作者指出,解决儿童网络危害的唯一途径是首先终止对全体用户的在线监视,而当前的立法正走向相反方向。
  • 文末列出本周精选链接、即将举行的全球巡演以及《Enshittification》续作、《AI 批评指南》和《后美国互联网》等新书计划。

There is minimal downside to switching to open models

397 pointsLinkComment(316)Share

转向开源大语言模型的代价已非常有限

  • 作者因 Claude 推出身份验证等新限制,决定放弃使用专有大语言模型(LLM),并评估了转向开源模型的代价。
  • 类比 Linux 的发展历程,他认为当前开源 LLM 的生态已足够成熟,与领先者的性能差距通常仅有数月,切换的专业损失可控。
  • 专有模型(如 Claude、GPT)的 API 便捷可靠,且被业界广泛信任;而通过 OpenRouter 等第三方使用开源模型,在隐私和数据安全方面存在顾虑。
  • 自行部署模型虽能保障隐私,但普遍面临成本高昂、配置复杂、速度较慢等问题。
  • 作者已具备本地或云端运行多种开源模型的环境,预计生产力仅会短期下降,并认为为规避专有平台限制而承受此代价是值得的。

GLM-5.2 – How to Run Locally

571 pointsLinkComment(269)Share

GLM‑5.2 本地运行全指南

  • GLM‑5.2 为 Z.ai 开源大模型,拥有 744 B 总参数、40 B 活跃参数、1 M 长上下文,在多项基准上可媲美 Claude 4.8 Opus、GPT‑5.5 与 Gemini 3.1 Pro。
  • 通过 Unsloth 动态量化 可生成 1‑bit、2‑bit、4‑bit、5‑bit GGUF 文件;2‑bit 版 (UD‑IQ2_M) 大小 239 GB,压缩 84% 并保持约 82% top‑1% 精度,1‑bit 版压缩 86% 仍保 76% 精度
  • 运行时所需内存随量化不同:1‑bit ≈ 223 GB、2‑bit ≈ 245 GB、8‑bit ≈ 810 GB;2‑bit 版可在 256 GB 统一内存 Mac、或 1×24 GB GPU + 256 GB RAM 环境下流畅运行。
  • 模型提供 三种思考模式(非思考、High、Max),可在 Unsloth Studio UI 或使用 --chat-template-kwargs 参数切换;推荐设置为 temperature=1.0top_p=0.95(High)或 top_p=1.0(Max),最大上下文长度 1,048,576
  • 启动方式:① 用 llama.cpp 加载相应 GGUF(如 UD‑IQ2_M)并可通过 --cache-type-k/q4_1 等 KV‑cache 量化延长上下文;② 在 Unsloth Studio(跨平台)搜索、下载并直接运行,软件自动处理 RAM offload 与多 GPU 检测,提供完整的图形界面与可视化设置。

Codex logging bug may write TBs to local SSDs

498 pointsLinkComment(267)Share

Codex SQLite 反馈日志每年写入约640TB,可快速耗尽SSD寿命

  • 在21天运行中,~/.codex/logs_2.sqlite及其WAL/SHM文件共写入约37 TB,折合年均约640 TB,足以在一年内耗尽一块1 TB SSD的典型600 TBW写入寿命。
  • 数据库保留行仅约50万条,但自增主键已超过55亿,插入后立即删除的“写入放大”比率高达约10 000 倍,这是产生持续高频写入的根本机制。
  • 主要写入来源是SQLite日志接收器默认全局TRACE级别,其中codex_api::endpoint::responses_websocket(TRACE)占70.7%,codex_otel.log_onlycodex_otel.trace_safe(INFO)占25.3%,二者合计约96%的保留字节。
  • 官方已合并三个PR(0.142.0/0.143.0版):阻止记录每个WebSocket事件、过滤噪声日志目标、停止持久化桥接事件,预计削减约85%的写入量;但残留的hyper_util等TRACE日志仍需后续优化。
  • 临时缓解方法包括:使用SQLite触发器拦截所有插入(CREATE TRIGGER ... RAISE(IGNORE)),定期执行PRAGMA wal_checkpoint(TRUNCATE)截断WAL,或紧急时终止Codex进程并删除logs_2.sqlite*文件以释放空间。

F3

504 pointsLinkComment(120)Share

F3:面向未来的开源列式数据文件格式

  • 以效率、互操作性和可扩展性为核心,采用全新数据组织结构,克服 Parquet 等旧格式的布局缺陷,并通过在文件中嵌入 WebAssembly(Wasm)解码器实现跨平台兼容。
  • 每个 F3 文件自描述,内部同时保存数据、元数据和仅占几千字节的 Wasm 解码二进制,开发者可在文件内直接添加自定义编码,无需重新设计文件格式。
  • 项目为研究原型(不建议生产使用),仅在 Intel CPU 的 Debian 12 环境下验证,构建、测试和基准实验均使用 cargo 命令及提供的 Bash 脚本完成。
  • 代码库关键目录包括:format(FlatBuffer 格式定义),fff-poc(核心实现及子模块),fff-bench(论文中的微观与端到端基准),fff-ude*(用户自定义编码的 Wasm 解码实现),以及 scripts/exp_scripts(实验运行脚本)。
  • 论文实验复现步骤详见 doc/paper_reproduction.md;项目采用 MIT 许可证发布,使用时请在文献中引用 2025 年 SIGMOD 论文的完整参考信息。

Show HN: TikZ Editor – WYSIWYG editor for figures in LaTeX

274 pointsLinkComment(56)Share

TikZ 编辑器 v0.4.0 功能概览

  • 实时可视化编辑:拖拽节点、路径或形状即刻更新对应 TikZ 代码,且保持原有换行、空格等排版不变,省去重新编译的步骤。
  • 丰富绘图工具与多选操作:提供节点、形状、矩阵、直线、箭头、贝塞尔曲线、自由手绘、网格、矩形、圆、椭圆等工具,支持多选、基于 TikZ scope 的分组以及捕捉、对齐、等距分布、可定制标尺与指南线。
  • 完整源码面板与错误诊断:具备 TikZ 语法高亮、代码折叠、实时错误提示、内置颜色拾取器、数值滑块和自动格式化,桌面版还能调用 OpenAI Codex 进行 AI 辅助编辑。
  • 多文件与导入导出支持:可直接打开完整 .tex 文档并通过底部缩略图切换多个 tikzpicture,识别自定义宏;支持从 SVG、Ipe、PowerPoint 等格式导入,导出为 SVG、PNG、PDF 或独立 LaTeX,且支持多标签页并行编辑。
  • 开源与技术实现:代码以 MIT 许可证发布于 GitHub,前端使用 TypeScript,桌面版基于 Tauri 与轻量 Rust 后端,渲染采用 SVG 与 MathJax,并实现 Knuth‑Plass 换行算法与自研 xcolor‑rgb‑convert 色彩映射。

Swift Package Index joins Apple

99 pointsLinkComment(30)Share

Swift Package Index 加入 Apple,携手打造更强大的 Swift 包注册中心

  • Swift Package Index 正式成为 Apple 的一员,双方将在保留原有愿景和专业知识的基础上,共同构建面向 Swift 社区的综合、可信赖的包注册中心。
  • 平台已收录超 10,000 个 Swift 包,并在 macOS、iOS、tvOS、watchOS、Linux、visionOS、WebAssembly 与 Android 等多平台自动执行兼容性测试,去年完成 350 万余次构建。
  • 对包消费者而言,服务方式保持不变,仍可用于搜索、检查兼容性和浏览文档,Apple 的支持将加速新功能研发,提升发现与评估体验。
  • 对包作者来说,当前的索引、展示和文档托管流程不受影响,未来计划引入包签名和身份识别等安全特性,以增强生态系统的可靠性。
  • 项目继续保持开源,Apple 工程师将与社区贡献者共同开发新功能,后续将在博客持续发布进展与未来计划,并感谢所有贡献者对生态的推动。

AI Hiring Tools Yield Racial Bias and Systemic Rejection; 26% Black & 15% Asian

51 pointsLinkComment(25)Share

AI招聘工具在大规模实证中暴露种族偏见与系统性全拒风险

  • 90% 的美国雇主使用 AI 筛选,且大多依赖同一家第三方供应商;本研究追踪 340 万求职者、400 万份申请,覆盖 1 700 个岗位、150 家企业、11 个行业,全部由该供应商的模型评估。
  • 按 EEOC “四分之五法则”,26% 的黑人和 15% 的亚裔申请者在被 AI 歧视的岗位投递;若推荐率与白人持平,将额外有约 4 万份申请进入下一轮。
  • 歧视在岗位层面显著——整体汇总会掩盖差异;同一算法可能在仓储岗位倾向推荐黑人,却在金融岗位几乎不推荐,导致职位间的偏差相互抵消。
  • 共享同一算法导致“系统性全拒”:提交多份申请的求职者被同一供应商筛选的所有职位全部拒绝的概率显著高于独立决策预期,四次投递约 10% 的人全部被拒。
  • 与此前对 108 家财富 500 强、未使用 AI 的 83 000 份申请的研究相比,本研究的全被拒率更高,表明市场对单一 AI 供应商的集中使用会放大排斥效应,凸显独立研究与基于证据的 AI 政策的必要性。
← 2026-06-22 2026-06-23 ...