Hacker News 每日热门 - 2025年10月22日
1. Neural audio codecs: how to get audio into LLMs
分数: 292 | 评论数: 90
中文总结: 本文探讨如何通过神经音频编解码器将音频数据输入大语言模型,以实现真正的语音理解和生成。当前语音LLM通常只是语音转文本再转语音的包装,无法感知语调、情感或 sarcasm。作者指出,直接像处理文本那样处理音频(如WaveNet逐样本预测)效...
2. Build Your Own Database
分数: 254 | 评论数: 53
中文总结: 本文介绍了从零构建键值数据库的方法。核心思路是使用文件进行数据持久化存储,通过键值对实现数据的增删改查。文章重点探讨了原地更新效率低的问题,并提出"仅追加"文件的解决方案——通过追加新记录和墓碑标记来处理更新和删除,同时指出该方法会导致文件...
3. Foreign hackers breached a US nuclear weapons plant via SharePoint flaws
分数: 244 | 评论数: 146
中文总结: 外国黑客利用微软SharePoint漏洞入侵了美国国家核安全管理局堪萨斯城国家安全园区。该基地生产美国核武器80%的非核部件,属高度敏感设施。攻击者通过两个SharePoint漏洞(CVE-2025-53770和CVE-2025-49704...
4. LLMs can get "brain rot"
分数: 214 | 评论数: 116
中文总结: 研究提出"大语言模型脑退化"假说:持续接触低质量网络文本会导致模型认知能力持续下降。实验通过对推特语料进行对照训练发现,接触垃圾数据的模型在推理、长文本理解、安全性等关键能力上显著衰退(Hedges‘ g>0.3),并显现心理变态等黑暗特质...
5. Wikipedia says traffic is falling due to AI search summaries and social video
分数: 147 | 评论数: 155
中文总结: 维基百科基金会报告显示,由于生成式AI搜索摘要和社交视频平台的兴起,其人类用户访问量同比下降8%。AI搜索直接提供答案取代传统链接,年轻一代更倾向通过视频平台获取信息,导致传统百科站点流量下滑。尽管知识传播形式变化,但维基百科仍通过内容溯源...
6. NASA chief suggests SpaceX may be booted from moon mission
分数: 116 | 评论数: 394
中文总结: NASA代理局长达菲表示,由于SpaceX星舰研发进度滞后,可能无法按计划执行2027年的阿尔忒弥斯III登月任务。他宣布将开放竞标,允许其他航天企业参与竞争,以确保美国在中国之前实现重返月球。目前SpaceX和蓝色起源均持有月球着陆器合同...
7. Our modular, high-performance Merkle Tree library for Rust
分数: 107 | 评论数: 26
中文总结: Rust版高性能模块化Merkle树库发布,具备固定深度、只增不改特性,支持多存储后端与哈希算法。内存存储证明生成仅560纳秒,sled存储吞吐量达4.3万叶/秒。提供Keccak256、Poseidon等哈希选项,兼容sled/rocks...
8. Ilo – a Forth system running on UEFI
分数: 92 | 评论数: 31
中文总结: 一款名为Ilo的Forth系统可在UEFI环境下运行。开发者crc发布了包含启动演示、测试记录和操作界面的多段终端录屏,支持通过脚本嵌入网页或转换为GIF动画。该系统兼容GNU/Linux环境,提供了完整的终端录制下载及回放方案。
9. Getting DeepSeek-OCR working on an Nvidia Spark via brute force with Claude Code
分数: 74 | 评论数: 3
中文总结: 西蒙·威尔逊通过Claude Code工具,在NVIDIA Spark设备上成功部署运行DeepSeek-OCR模型。该6.6GB专用OCR模型需PyTorch和CUDA环境,但因硬件兼容性问题,他采用代理循环技术,让Claude Code...
10. Show HN: Katakate – Dozens of VMs per node for safe code exec
分数: 67 | 评论数: 27
中文总结: Katakate是一款开源自托管平台,用于大规模安全执行不可信代码。它基于Kubernetes、Kata和Firecracker技术构建轻量级VM沙箱,支持AI智能体、无服务器计算和CI/CD等场景。当前处于测试阶段,需在配备硬件虚拟化的x...