GitHub 每日趋势 - 2025年09月16日
1. rasbt/LLMs-from-scratch
星标数: 71.2K | Fork数: 10.2K | 语言: Jupyter Notebook
描述: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step
翻译: 使用PyTorch从零开始逐步实现类似ChatGPT的大型语言模型
主要特性:
- 从零实现GPT架构LLM
- 包含预训练和微调完整流程
- 提供教育性代码示例和解释
- 支持加载预训练权重进行微调
- 配套书籍提供理论指导
应用场景:
自然语言处理课程教学材料、开发者入门大语言模型的实践指南。
2. microsoft/markitdown
星标数: 74.3K | Fork数: 4.1K | 语言: Python
描述: Python tool for converting files and office documents to Markdown.
翻译: 用于将文件和办公文档转换为Markdown的Python工具。
主要特性:
- 支持多种文件格式转换(PDF/Office/图像/音频等)
- 保留文档结构(标题/列表/表格等)为Markdown
- 提供MCP服务器集成LLM应用
- 模块化依赖管理(可选功能组)
- 无需创建临时文件的内存高效处理
应用场景:
LLM文本分析流水线、知识库构建与数字化、AI辅助内容分析。
3. PowerShell/PowerShell
星标数: 49.8K | Fork数: 7.9K | 语言: C#
描述: PowerShell for every system!
翻译: 适用于所有系统的PowerShell!
主要特性:
- 跨平台支持(Windows、Linux、macOS)
- 结构化数据处理(JSON/CSV/XML等)
- 命令行Shell与脚本语言
- REST API集成能力
- 模块化cmdlet框架
应用场景:
自动化运维与配置管理、云服务集成与API调用、跨平台数据处理与管道操作。
4. x1xhlol/system-prompts-and-models-of-ai-tools
星标数: 85.2K | Fork数: 23.5K | 语言: Unknown
描述: FULL v0, Cursor, Manus, Augment Code, Same.dev, Lovable, Devin, Replit Agent, Windsurf Agent, VSCode Agent, Dia Browser, Xcode, Trae AI, Cluely & Orchids.app (And other Open Sourced) System Prompts, Tools & AI Models.
翻译: 完整版v0、Cursor、Manus、Augment Code、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent、VSCode Agent、Dia Browser、Xcode、Trae AI、Cluely及Orchids.app(以及其他开源)系统提示词、工具与AI模型。
主要特性:
- AI工具系统提示词集合
- 超过20,000行结构化数据
- 多平台AI开发工具覆盖
- 开源与商业模型整合
- 实时社区更新支持
应用场景:
模型提示工程研究、自动化开发流程设计、AI教育案例参考
5. virattt/ai-hedge-fund
星标数: 40.3K | Fork数: 7.1K | 语言: Python
描述: An AI Hedge Fund Team
翻译: 一支人工智能对冲基金团队
主要特性:
- 多智能体协作系统
- 多种投资策略模拟
- 基本面与技术面分析
- 风险管理模块
- 教育研究导向设计
应用场景:
学术机构AI交易策略实验、开发者学习多智能体系统设计、金融从业者模拟投资策略表现...
6. SoftFever/OrcaSlicer
星标数: 10.8K | Fork数: 1.4K | 语言: C++
描述: G-code generator for 3D printers (Bambu, Prusa, Voron, VzBot, RatRig, Creality, etc.)
翻译: 3D打印机G代码生成器(支持Bambu、Prusa、Voron、VzBot、RatRig、Creality等品牌)
主要特性:
- 高级校准工具(温度塔、流量、回抽等)
- 精确壁厚和接缝控制
- 三明治模式和Polyholes支持
- 超快速切片算法
- 多品牌3D打印机兼容性
应用场景:
高精度模型制作与原型开发、教育场景教学实践、批量生产与快速迭代。
7. simdjson/simdjson
星标数: 22.0K | Fork数: 1.1K | 语言: C++
描述: Parsing gigabytes of JSON per second : used by Facebook/Meta Velox, the Node.js runtime, ClickHouse, WatermelonDB, Apache Doris, Milvus, StarRocks
翻译: 每秒解析千兆字节JSON数据:被Facebook/Meta Velox、Node.js运行时、ClickHouse、WatermelonDB、Apache Doris、Milvus、StarRocks等采用
主要特性:
- 极高性能(每秒解析GB级JSON数据)
- 完整的JSON和UTF-8验证
- 自动选择CPU优化的解析器
- 易于使用且文档完善的API
- 无依赖的单头文件库
应用场景:
数据库系统(如ClickHouse)、实时数据处理平台、Node.js运行时。
8. ItzCrazyKns/Perplexica
星标数: 24.6K | Fork数: 2.6K | 语言: TypeScript
描述: Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI
翻译: Perplexica是一款人工智能驱动的搜索引擎,作为Perplexity AI的开源替代方案而存在。
主要特性:
- 支持本地LLM(如Qwen、DeepSeek、Llama、Mistral)
- 双模式搜索(Copilot模式增强搜索/普通模式网页搜索)
- 6种专注模式(全网络/写作助手/学术等)
- 基于SearxNG的隐私保护开源搜索
- 提供API接口和Docker部署
应用场景:
学术研究的可信信息获取、内容创作的智能辅助、开发者的API集成应用。
9. sst/opencode
星标数: 23.4K | Fork数: 1.6K | 语言: TypeScript
描述: AI coding agent, built for the terminal.
翻译: AI编程代理,专为终端打造。
主要特性:
- 终端集成AI编程助手
- 多包管理器支持安装
- 跨平台兼容性
- 可配置安装路径
- 实时开发环境调试
应用场景:
本地开发调试、快速原型构建、命令行工作流集成。
10. Zie619/n8n-workflows
星标数: 30.3K | Fork数: 1.4K | 语言: HTML
描述: all of the workflows of n8n i could find (also from the site itself)
翻译: 我所找到的所有n8n工作流程(包括来自该网站本身的)
主要特性:
- 2053个n8n工作流集合
- 高性能全文搜索与文档系统
- 智能分类与命名系统
- Mermaid图表可视化
- 多平台集成支持(365种集成)
应用场景:
开发者快速集成第三方服务、企业低代码平台自动化流程搭建、IT团队学习复用标准化解...
11. ccxt/ccxt
星标数: 38.4K | Fork数: 8.2K | 语言: Python
描述: A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go
翻译: 支持JavaScript、TypeScript、Python、C#、PHP及Go语言的加密货币交易API,覆盖100余家交易所
主要特性:
- 支持超过100家加密货币交易所的API
- 提供统一且标准化的数据接口
- 支持多种编程语言(JavaScript/TypeScript/Python/C#/PHP/Go)
- 包含完整的公共和私有API实现
- 支持浏览器和Node.js等多平台运行
应用场景:
跨交易所套利、自动化交易机器人构建、市场数据分析与策略回测。
12. midday-ai/midday
星标数: 12.2K | Fork数: 1.1K | 语言: TypeScript
描述: Invoicing, Time tracking, File reconciliation, Storage, Financial Overview & your own Assistant made for Freelancers
翻译: 发票管理、时间追踪、文件核对、存储服务、财务总览及专为自由职业者打造的私人助理。
主要特性:
- 时间追踪
- 神奇收件箱
- 保险库
- 无缝导出
- 助手
应用场景:
自由职业者时间与发票管理、独立工作者财务流程整合、多业务功能一站式处理。
13. unclecode/crawl4ai
星标数: 53.2K | Fork数: 5.3K | 语言: Python
描述: 🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Don't be shy, join here: https://discord.gg/jP8KfhDhyN
翻译: 🚀🤖 Crawl4AI:开源LLM友好型网络爬虫与抓取工具。无需犹豫,立即加入:https://discord.gg/jP8KfhDhyN
主要特性:
- 网页转Markdown
- 智能表格提取
- 并发爬取控制
- 内存管理优化
- 无头浏览器支持
应用场景:
RAG系统数据预处理、AI智能体数据管道构建、大规模网页信息结构化采集。
14. ml-explore/mlx-lm
星标数: 2.1K | Fork数: 237 | 语言: Python
描述: Run LLMs with MLX
翻译: 使用MLX运行LLMs
主要特性:
- 支持Hugging Face Hub集成,可轻松使用数千个大语言模型(LLM)
- 支持量化模型和上传至Hugging Face Hub
- 支持低秩和全模型微调(包括量化模型)
- 提供分布式推理和微调功能
- 提供命令行工具和Python API两种使用方式
应用场景:
Mac设备离线文本生成与对话、研究人员本地模型量化优化实验。
15. CorentinJ/Real-Time-Voice-Cloning
星标数: 55.7K | Fork数: 9.2K | 语言: Python
描述: Clone a voice in 5 seconds to generate arbitrary speech in real-time
翻译: 5秒内克隆声音并实时生成任意语音
主要特性:
- 实时语音克隆
- 三阶段深度学习框架(SV2TTS)
- 支持多说话人合成
- 基于PyTorch实现
- 预训练模型自动下载
应用场景:
虚拟助手语音定制、有声内容创作、实时语音转换。
16. mnh-jansson/open-battery-information
星标数: 428 | Fork数: 104 | 语言: C++
描述:
翻译:
主要特性:
- 提供电池管理系统的解锁工具
- 支持通过Arduino与BMS通信
- 提供Windows预编译二进制文件
- 包含Python实现的图形界面软件
- 旨在修复误触发保护的电池
应用场景:
笔记本电脑电池修复、电动工具电池维修。
17. HKUDS/DeepCode
星标数: 6.3K | Fork数: 861 | 语言: Python
描述: "DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"
翻译: DeepCode:开放式智能编码(论文转代码与文本转网页及文本转后端)
主要特性:
- 多智能体协作系统
- 文本到代码生成(Text2Code)
- 文本到网页生成(Text2Web)
- 文本到后端生成(Text2Backend)
- 开放式代理编程框架
应用场景:
快速原型开发、教育编程辅助、企业级应用搭建。