给软件开发者准备的优质简报,每日阅读 10分钟。
Hacker News
Study identifies weaknesses in how AI systems are evaluated
🔼 398 | 💬 188
研究发现AI系统评估方法存在重大缺陷
- 牛津大学牵头、42名国际研究人员参与的研究发现,用于衡量大语言模型能力与安全性的445项基准测试普遍缺乏科学严谨性
- 仅16%的评估研究采用了统计方法比较模型性能,导致报告的性能差异可能源于随机性而非真实改进
- 近半数基准测试试图测量“推理”或“无害性”等抽象概念,但缺乏对这些术语的明确定义和共识
- 研究提出八项改进建议,包括明确操作定义、构建代表真实场景的测试项目,并开发了可公开使用的“结构效度检查表”
- 该研究已获NeurIPS 2025会议接收,将于12月以同行评审论文形式正式发布
Marko – A declarative, HTML‑based language
🔼 344 | 💬 166
Marko:让Web应用开发变得有趣的声明式HTML语言
- 基于HTML的声明式语言,扩展了HTML语法以支持构建动态和响应式用户界面,几乎任何有效HTML都是有效Marko
- 采用流式渲染技术,内容就绪后立即推送给用户,无需等待JavaScript包或数据请求即可开始渲染
- 通过细粒度打包设计,仅加载必要代码,跳过水合过程并在子模板级别剥离未使用代码,实现极致性能
- 针对服务器和浏览器环境分别进行编译优化,生成环境特定的高性能代码(服务器端流式HTML/浏览器端响应式DOM)
- 内置TypeScript支持,提供强大的类型推断和完整的编辑器功能(自动补全、跳转定义、语法高亮和格式化)
Montana Becomes First State to Enshrine 'Right to Compute' into Law
🔼 213 | 💬 106
蒙大拿州成为全美首个将“计算权”写入法律的州
- 蒙大拿州通过《蒙大拿计算权法案》(MRTCA),成为美国首个立法保障公民获取和使用计算工具及人工智能技术的权利
- 法案明确将拥有和操作计算资源(包括硬件、软件和AI工具)纳入州宪法对财产和言论自由的保护范围
- 法律允许基于公共健康和安全理由实施监管,但任何限制必须被证明为“明确必要”且“严格量身定制”,并服务于重大公共利益
- 法案要求AI控制的关键基础设施配备“停机机制”以实现人工干预,并实施年度安全审查,以兼顾创新与公共安全
- 该法案已激励新罕布什尔州推动类似立法,并获得全国性“计算权运动”及多家科技组织的支持,被视为数字权利保障的标志性进展
Ironclad – formally verified, real-time capable, Unix-like OS kernel
🔼 334 | 💬 96
Ironclad:部分形式化验证的实时操作系统内核
- 采用 SPARK 和 Ada 语言编写,是部分经过形式化验证、支持实时处理、类 UNIX 的开源内核,适用于通用和嵌入式用途。
- 提供 POSIX 兼容接口、真正的同步抢占式多任务、强制访问控制(MAC)和硬实时调度支持。
- 完全遵循 GPLv3 许可证,不含任何私有固件,确保整个软件栈完全开源且自由可用。
- 运用 SPARK 的形式化验证技术,确保加密、强制访问控制及用户功能等大部分核心模块的正确性与无错误性。
- 已移植到多种平台和开发板,设计便于进一步移植,仅依赖 GNU 工具链,简化跨平台编译流程。
- 提供包括 Gloire 在内的多种架构发行版,完全依赖捐赠和资助支持项目的持续开发和维护。
How did I get here?
🔼 380 | 💬 63
数据包的网络旅程:一次反向追踪解析
- 网站使用自定义 traceroute 程序 ktr 实时执行从服务器到你设备的反向路径追踪(而非实际数据包发送方向),并通过逐步更新的 CSS 效果模拟动态加载
- traceroute 利用 ICMP 协议的 TTL 字段特性:发送 TTL 递增的数据包,根据超时错误反馈逐级识别路径中的路由器 IP,部分节点可能不响应
- 互联网由自治系统(AS)构成,边界路由器使用 BGP 协议交换路由表信息,基于对等协议决定数据包在不同网络间的传输路径
- 通过 WHOIS 查询和 PeeringDB 数据库解析 IP 所属的自治系统及运营商,但 WHOIS 响应格式缺乏统一标准,需自定义解析逻辑
- BGP 自 1989 年发布以来历经多次修订,现行 v4 版本通过自治系统间的路由传播构成互联网骨干,但内部路径可能由其他协议决定
- 路径中出现的自治系统序列(如 AS15169 → AS24940)反映了数据包经过的网络边界,而同一 AS 内的多跳属于内部路由优化
Drilling Down on Uncle Sam's Proposed TP-Link Ban
🔼 51 | 💬 41
美国政府拟禁售TP-Link网络设备的核心解析
- 美国多个联邦部门支持禁止TP-Link设备在美销售,主因其中国关联被认定构成数据安全风险,尽管该公司否认受中国政府管辖或影响。
- TP-Link声称已完全脱离中国母公司,总部位于加州,生产基地位于越南,并自主掌控研发设计(芯片组除外),市场份额存在争议(自称30% vs. 行业估测50%)。
- 低价策略使TP-Link成为家用及中小企业市场主流,但其设备屡被中国APT组织(如Camaro Dragon)利用,包括恶意固件植入及密码喷洒攻击,引发安全担忧。
- 消费级路由器普遍存在出厂安全隐患(如默认密码、过时固件),近年厂商通过强制注册或移动应用引导改善基础安全,但用户仍需主动维护更新。
- 用户可刷入开源固件(如OpenWrt)提升安全性和功能,但需自行管理更新;较旧设备建议更换,尤其依赖WiFi的场景。
- 通过运营商获取的路由器由ISP远程管理,切勿自行修改;安全担忧者可考虑其他品牌设备,但成本更高且漏洞仅略少。
Reviving Classic Unix Games: A 20-Year Journey Through Software Archaeology
🔼 107 | 💬 36
复兴经典Unix游戏:一场穿越20年的软件考古之旅
- 作者耗时20年追踪1987年USENET游戏《Conquer》的创作者,最终获得Edward Barlow、Adam Bryant及PostScript工具开发者MaF的明确许可,将代码重新授权为GPLv3
- 游戏最初通过USENET新闻组以分卷文本形式分发,支持多人在中土世界背景下进行资源管理、军队调度和外交策略
- 2025年发现完全重写的《Conquer Version 5》,新增自动数据转换、增强稳定性及高级管理工具等现代化功能
- 使用Melange和GitHub CI/CD等现代工具实现自动化打包,支持Alpine Linux和Debian系统,并通过ttyd实现Web端游玩
- 尽管因法律限制无法重新授权已故开发者Richard Caley的代码,但完整记录并致敬了其技术贡献与独特幽默人格
- 项目体现了开源软件保护中社区协作、法律框架清晰化及技术遗产传承的核心价值
Zensical – A modern static site generator built by the Material for MkDocs team
🔼 83 | 💬 30
Zensical:由 Material for MkDocs 团队开发的下一代静态站点生成器
- 为彻底解决 MkDocs 长期无人维护、架构限制及供应链风险问题,团队历时数千小时从零开发,集成静态站点生成、主题与自定义功能
- 完全兼容现有 Material for MkDocs 项目,原生支持读取
mkdocs.yml配置,迁移仅需最小改动,当前已支持部分插件 - 采用 MIT 开源协议,永久免费商用,同时推出企业级服务 Zensical Spark,提供专业技术支持并让用户参与产品发展方向
- 搭载全新客户端搜索引擎 Disco,显著提升搜索速度与结果相关性,支持高级过滤和聚合功能,计划2026年作为独立项目开源
- 基于 ZRX 差分构建引擎实现 4-5 倍重建速度提升,未来将采用 Rust 编写的 CommonMark 解析器进一步优化处理性能
Ticker: Don't die of heart disease
🔼 535 | 💬 440
如何避免死于心脏病:主动管理心脏健康的实用指南
- 心脏病是全球首要死因,约25%的心脏病发作发生在55岁以下人群,且疾病常无症状发展多年,首次症状即可能是致命性心脏病发作
- 常规医疗检测(如标准血脂面板)存在不足,需主动要求检测关键生物标志物(ApoB、Lp(a)、hsCRP等)及影像检查(CT或CTA扫描)以准确评估动脉斑块
- 预防性检测成本可控:年度两次扩展血脂检测约80美元/次,周期性影像检查(如CT扫描)约150美元,年总费用约300美元,无需依赖昂贵高端医疗服务
- 医疗体系偏向治疗而非预防,患者需自我倡导,坚持要求医生开具必要检测,并可使用工具(如ChatGPT)辅助解读结果
- 综合管理策略包括药物治疗(如他汀类控制ApoB)、坚持地中海饮食、结合力量训练与有氧运动(如Zone 2训练),并重视睡眠、压力管理及戒烟限酒
U.S. Tech Layoffs Hit Two-Decade High in October
🔼 66 | 💬 25
美国科技业十月份裁员人数创二十年新高
- 2025年10月美国雇主宣布裁员153,074人,创下二十多年来10月份裁员人数的最高纪录
- 科技行业单月裁员33,281人,较9月的5,639人大幅上升
- 截至10月底,科技公司年内累计裁员141,159人,较2024年同期增长约17%
- 裁员潮的主要驱动因素包括成本削减、自动化技术应用和人工智能的快速部署
- 这一趋势反映出就业市场的结构性转变,标志着低裁员环境的结束
Marble Fountain
🔼 213 | 💬 23
大理石喷泉:复杂弹珠轨道的算法生成与3D打印实践
- 作者利用Formlabs工业级3D打印机,设计出高度复杂的算法生成艺术结构,充分发挥了3D打印中几何复杂度近乎免费的优势
- 轨道系统通过路径求解器生成,初始为随机线段,经多项约束优化形成可行路径,包括边界保持、等距分布、固定斜率、最小转弯半径等
- 速度控制依赖设置最小转弯半径和过度倾斜轨道,强制弹珠蛇形前进以消耗动能,解决高速脱轨与低速停滞问题
- 提升机构采用滚珠丝杠原理,依靠四周弹珠约束实现无顶端轴承运行,但单侧弹珠缺失会导致剧烈晃动及脱轨
- 支撑结构采用自上而下的粒子系统生成,支柱受多种力约束(距离加权吸引、相互排斥、边界保持、向心拉力),惯性作用形成自然弧线
- 项目耗时7个月开发,曾在画廊展出,虽存在每小时丢失2-3个弹珠和电机过热问题,但实现了可靠运行
GitHub Trending
librespot-org / librespot
⭐ 5911 | 🔀 765 | Rust 98.3%
librespot 开源 Spotify 客户端库核心特性与使用
- 开源 Spotify 客户端库,可作为 Spotify Connect 接收器,通过多种音频后端播放和控制音乐,是官方已弃用闭源
libspotify的替代方案 - 仅支持 Spotify Premium 账户,明确不兼容免费账户功能(如广告播放或跳过限制)
- 可通过 Rust 的 Cargo 包管理器安装,命令行支持配置设备名、比特率、缓存路径及音量标准化等选项
- 由 librespot-org 组织维护,提供多种音频后端(包括默认的 Rodio、ALSA、PulseAudio 等),Linux 系统需额外安装音频依赖库
- 提供详细编译指南和贡献规范,通过 GitHub Discussions 收集功能请求,Issues 汇报程序缺陷
- 已通过多种操作系统官方包分发,并拥有丰富衍生项目(如 raspotify、Spotifyd、ncspot 等)
MoonshotAI / Kimi-K2
⭐ 8857 | 🔀 589
Kimi K2:基于混合专家架构的开源智能体大语言模型
- 采用混合专家(MoE)架构,总参数量1万亿,激活参数量320亿,支持128K上下文长度,使用MLA注意力机制与SwiGLU激活函数
- 使用Muon优化器在15.5万亿token上完成训练,全程无训练不稳定性,专门优化工具调用、推理与自主问题解决能力
- 提供两个版本:Kimi-K2-Base(基础模型,适合微调和定制)和Kimi-K2-Instruct(指令微调版,适用于通用对话和智能体任务)
- 在多项基准测试中表现卓越,编程任务(LiveCodeBench v6达53.7%)、数学推理(AIME 2024达69.6%)和工具使用(Tau2零售场景达70.6%)领先同类模型
- 支持vLLM、SGLang等主流推理引擎,模型权重与代码以修改版MIT许可证在Hugging Face开源发布
WerWolv / ImHex
⭐ 51246 | 🔀 2271 | C++ 95.1%, CMake 3.6%
ImHex:专为逆向工程师和程序员设计的高级十六进制编辑器
- 专为逆向工程师、程序员及深夜工作者设计,提供视网膜友好的暗色主题,减轻长时间工作的视觉疲劳
- 支持强大的字节修补、自定义高亮规则、多编码解码(如UTF-8、UTF-16、ShiftJIS)及数据可视化(包括图像、音频和3D模型)
- 内置独特的类C模式语言(Pattern Language),可自动基于MIME类型和魔术值解析文件结构,支持数组、指针、枚举、联合等复杂类型
- 支持多种数据源,包括本地文件、原始磁盘、GDB服务器、进程内存、远程SSH文件及UDP数据包,适应多样化的分析需求
- 完全跨平台(Windows、macOS、Linux、FreeBSD),提供GPU加速版本和纯软件渲染版本,兼容不同硬件配置
ziglang / zig
⭐ 42128 | 🔀 3101 | Zig 98.3%, C 1.1%
Zig编程语言与工具链的核心特性
- Zig是一种通用编程语言和工具链,专注于构建健壮、高效和可复用的软件
- 支持下载预编译二进制包、通过包管理器安装或从源码引导安装,解压后即可使用,无需全局安装
- 标准构建需满足CMake≥3.15、系统C/C++工具链及LLVM/Clang/LLD 21.x开发库,遵循标准CMake流程
- 无LLVM构建仅依赖C编译器,但会缺失发行版优化、多种格式链接功能及对C/C++/ObjC等语言的编译支持
- 项目采用BDFN(Benevolent Dictator For Now)治理模式,创始人Andrew Kelley拥有最终决定权
- 社区完全去中心化,无官方与非官方区分,各社交空间自主管理,完整列表可在社区Wiki页面查看
mui / material-ui
⭐ 97061 | 🔀 32707 | JavaScript 49.9%, TypeScript 49.8%
Material UI:基于 React 的 Material Design 组件库
- 提供完整的 React 组件库,独立实现了 Google 的 Material Design 系统,经过十年开发和数千名贡献者严格测试
- 采用 MIT 许可证,通过 npm 分发稳定版本(@latest)和预发布版本(@next)
- 核心功能由 MUI X 扩展,提供适用于高级用例的复杂组件套件
- 文档包含入门指南、旧版本升级路径及示例项目,并得到钻石级(如 Doit)和黄金级赞助商支持
- 同时包含实验性组件库 Joy UI(目前开发暂停),但推荐新项目优先使用 Material UI 以确保持续支持
google / adk-go
⭐ 560 | 🔀 31 | Go 95.0%, HTML 4.8%
Go语言Agent开发套件(ADK)核心介绍
- 这是一款开源、代码优先的Go工具包,用于构建、评估和部署复杂AI智能体,强调灵活性和控制性
- 框架采用模块化设计,应用软件开发原则于AI智能体创建,支持从简单任务到复杂系统的工作流编排
- 提供丰富的工具生态,包括预置工具、自定义函数集成和现有工具兼容,支持模块化多智能体系统构建
- 专为云原生应用优化,充分利用Go语言的并发和性能优势,支持轻松容器化部署及Google Cloud Run等云环境
- 采用Apache 2.0许可证,支持模型无关和部署无关设计,兼容多种框架,并特别针对Gemini进行优化
axios / axios
⭐ 108135 | 🔀 11399 | JavaScript 86.6%, TypeScript 10.1%, HTML 3.0%
Axios HTTP 客户端黄金赞助商与核心特性
- 黄金赞助商包括 Stytch(API 优先身份验证、授权与欺诈防护)、Principal Financial Group(金融工具与资源服务)及社交媒体增长服务商(如 Twicsy、Buzzoid)
- 赞助商涵盖身份验证开发工具(Descope)、路线优化软件(Route4Me)及社交媒体服务(如 Poprey 和 Requestly)
- 所有赞助商均提供官方网站链接,部分提供 SDK 文档(如 Node.js)、社区入口或免费试用入口
- Axios 是基于 Promise 的跨平台 HTTP 客户端,支持浏览器和 Node.js 环境
- 核心功能包括请求/响应拦截、自动 JSON 处理、请求取消、XSRF 防护及自动多格式数据序列化
HyDE-Project / HyDE
⭐ 6875 | 🔀 490 | Shell 63.2%, Python 25.9%, GLSL 4.3%, CSS 4.0%, Vim Script 2.3%
HyDE 项目桌面环境配置详解
- 安装脚本专为最小化 Arch Linux 设计,兼容部分 Arch 衍生发行版,但会与现有 GTK/Qt 主题、Shell、SDDM 和 GRUB 配置产生冲突
- 自动检测 NVIDIA 显卡并安装 nvidia-dkms 驱动,同时修改 grub 或 systemd-boot 配置以启用 NVIDIA DRM
- 提供 12 种官方主题(如 Catppuccin、Decay、Edge-Runner 等),可通过 themepatcher 安装,并支持用户创建和分享自定义主题
- 包含完整的社区支持:Discord 社区、YouTube 教程、详细 Wiki 文档以及明确的贡献指南
- 支持多语言 README 文档,包括西班牙语、德语、荷兰语、简体中文、法语、阿拉伯语、巴西葡萄牙语和土耳其语版本
AUTOMATIC1111 / stable-diffusion-webui
⭐ 157983 | 🔀 29328 | Python 87.5%, JavaScript 8.4%, CSS 2.1%, HTML 1.3%
Stable Diffusion Web UI 核心功能与特性
- 基于 Gradio 库构建的 Web 界面,支持文本生成图像(txt2img)、图像生成图像(img2img)、外绘(outpainting)、修复(inpainting)、颜色草图及提示词矩阵等多种生成与编辑模式
- 提供无标记数量限制的提示词输入,支持通过
((关键词))或(关键词:权重)语法调节注意力权重,并集成组合生成(AND 连接多提示词)和提示词编辑(中途切换生成内容)功能 - 集成多种图像修复与增强工具,包括面部修复(GFPGAN/CodeFormer)、超分辨率放大(RealESRGAN/ESRGAN/SwinIR/LDSR),并支持通过扩展插件实现美学梯度生成与历史图像管理
- 支持完整的模型训练与管理功能,包括自定义嵌入(Textual Inversion)、超网络(Hypernetworks)、LoRA 模块,可动态加载/合并检查点,兼容多种模型格式(Stable Diffusion 2.0/Alt-Diffusion/Segmind SSD-1B)
- 具备丰富的参数控制(采样方法/负向提示/种子调整)、实时预览、批量处理与元数据保存功能,支持通过 API 调用,兼容多硬件平台(NVIDIA/AMD/Intel/Ascend NPU/Apple Silicon),最低支持 4GB 显存(部分报告 2GB 可用)
Indie Hacker
After burning through his savings and going into debt, this founder built a $42k MRR portfolio IH+ Subscribers Only Rashid Khasanov built a portfolio of database products to $42k MRR. Here's how he di...
从破产到月入4.2万美元:创始人的SaaS产品组合逆袭之路
- 首次创业失败耗尽积蓄、刷爆信用卡并陷入深度债务,但坚持不放弃,持续构建小型互联网工具并通过失败迭代学习
- 核心产品AngelMatch.io源自个人寻找投资者的挫败经历,目前月经常性收入3.73万美元(曾达4.1万美元),目标10万美元
- 另运营三个盈利产品:Investor Hunt(月收入4557美元)、Pur Social(社交调度工具,月收入491美元)和Journalist Hunt(10万记者数据库,月收入180美元)
- 专注解决创始人真实痛点,擅长构建具有持久竞争壁垒的精选数据库产品(非技术型创始人,六年SaaS开发经验)
- 采用有机增长与付费渠道混合策略,曾暂停Meta广告一个月评估效益并更换运营人员,计划11月重启新广告策略并优化客户留存
Building a successful niche product as a wedge into a bigger market Neel Bhattacharya saw an opportunity before AI was ready to handle it. So she waited and, when the tech caught up, she built a wedge...
以利基产品为楔子撬动更大市场的成功策略
- 创始人Neel Bhattacharya基于20年企业营销自动化经验,观察到太阳能行业因响应速度慢而流失客户,于2023年推出TheSolarAI,通过语音+短信+邮件多渠道系统在60秒内响应潜在客户
- 采用100%按效果付费模式,客户仅在潜在客户转化为预约后支付费用,目前月收入超8000美元,客户留存率达18个月,转化率提升30-90%,且近5个月零客户流失
- 技术栈注重可靠性而非新奇,整合OpenAI GPT-4 Turbo、Twilio等成熟工具,创新点在于基于行业经验设计的多渠道工作流,每日处理超1200次交互
- 增长依赖长期行业人脉和LinkedIn内容营销,50条个性化消息带来30%付费客户转化,而谷歌广告、Facebook广告和冷邮件的效果均不佳
- 关键经验包括:尽早采用混合定价模式缓解现金流压力,从第一天起公开构建以积累受众,35岁以上创业者的领域专业知识是年轻创始人无法比拟的优势
Vibe-coding? Here is how to research app ideas and generate proper prompts for AI.
如何通过Vibe-coding研究应用创意并生成精准AI提示
- 识别AI编码用户常面临两大困境:“验证恐惧”(担心产品开发后无人需要)和“翻译恐惧”(担心AI因提示模糊而无法理解需求)
- 推出新工具,旨在将原始创意转化为已验证的可执行计划,并生成结构化AI提示以弥合创意与执行间的鸿沟
- 工具首先通过分析社交媒体和论坛验证需求真实性,识别竞争对手,并基于实际用户反馈建议核心功能以确立独特优势
- 随后生成包含用户故事、功能需求和技术规格的优化提示,适配包括Avery by GoodGist在内的各类AI编码平台
- 强调工具自身使用Avery平台开发,证明其流程有效性,旨在消除猜测并确保构建出真正符合市场需求的产品
ConnectMachine-fix the chaos of networking: Anyone else meet 50 amazing people at events… and then forget who’s who next week?
ConnectMachine:解决社交网络混乱的AI原生联系人管理工具
- 旨在解决当前联系人管理中的问题,包括应用过多、二维码泛滥和信息噪音
- 通过单一二维码和统一网络实现快速、自主且私密的联系人管理
- 自动记录与某人相遇的地点与时间,帮助用户避免遗忘重要社交信息
- 强调非社交性(anti-social)和主权性(sovereign),专注于用户对信息的完全控制
- 目前月收入为1万美元,由创始人madktech开发并运营
SourceZen.ai: Today, SourceZen is problem hunting
SourceZen.ai创始人分享从咨询转向SaaS的创业历程
- 创始人最初通过Revenue VIP业务提供高价位AI蓝图路线图($1,995+),帮助企业优化业务并整合AI工具,后因追求更自由的生活方式转向微SaaS
- SourceZen.ai几乎完全由AI代理构建,使用Gemini作为“商业顾问”提供创意验证和编码建议,Airtable用作数据库后端和AI引擎开发
- 产品是全球首个AI驱动的供应商管道工具,一键自动生成供应商网站URL、产品类别、MOQ、代发货政策和联系信息,可自动化90%的全职工作量
- 面临AI信用消耗过高的问题,通过移除“AI顾问洞察”功能将每次运行成本从55信用降至32信用,月费定为$49并限制200家供应商
- 营销策略包括在Reddit上进行问题挖掘,用Gemini构建高价值回复,已获得2个有机注册,并强调解决真实痛点比开发时长更重要