跳转至

GitHub 每日趋势 - 2025年09月16日

1. rasbt/LLMs-from-scratch

星标数: 71.2K | Fork数: 10.2K | 语言: Jupyter Notebook

描述: Implement a ChatGPT-like LLM in PyTorch from scratch, step by step

翻译: 使用PyTorch从零开始逐步实现类似ChatGPT的大型语言模型

主要特性:

  • 从零实现GPT架构LLM
  • 包含预训练和微调完整流程
  • 提供教育性代码示例和解释
  • 支持加载预训练权重进行微调
  • 配套书籍提供理论指导

应用场景:

自然语言处理课程教学材料、开发者入门大语言模型的实践指南。


2. microsoft/markitdown

星标数: 74.3K | Fork数: 4.1K | 语言: Python

描述: Python tool for converting files and office documents to Markdown.

翻译: 用于将文件和办公文档转换为Markdown的Python工具。

主要特性:

  • 支持多种文件格式转换(PDF/Office/图像/音频等)
  • 保留文档结构(标题/列表/表格等)为Markdown
  • 提供MCP服务器集成LLM应用
  • 模块化依赖管理(可选功能组)
  • 无需创建临时文件的内存高效处理

应用场景:

LLM文本分析流水线、知识库构建与数字化、AI辅助内容分析。


3. PowerShell/PowerShell

星标数: 49.8K | Fork数: 7.9K | 语言: C#

描述: PowerShell for every system!

翻译: 适用于所有系统的PowerShell!

主要特性:

  • 跨平台支持(Windows、Linux、macOS)
  • 结构化数据处理(JSON/CSV/XML等)
  • 命令行Shell与脚本语言
  • REST API集成能力
  • 模块化cmdlet框架

应用场景:

自动化运维与配置管理、云服务集成与API调用、跨平台数据处理与管道操作。


4. x1xhlol/system-prompts-and-models-of-ai-tools

星标数: 85.2K | Fork数: 23.5K | 语言: Unknown

描述: FULL v0, Cursor, Manus, Augment Code, Same.dev, Lovable, Devin, Replit Agent, Windsurf Agent, VSCode Agent, Dia Browser, Xcode, Trae AI, Cluely & Orchids.app (And other Open Sourced) System Prompts, Tools & AI Models.

翻译: 完整版v0、Cursor、Manus、Augment Code、Same.dev、Lovable、Devin、Replit Agent、Windsurf Agent、VSCode Agent、Dia Browser、Xcode、Trae AI、Cluely及Orchids.app(以及其他开源)系统提示词、工具与AI模型。

主要特性:

  • AI工具系统提示词集合
  • 超过20,000行结构化数据
  • 多平台AI开发工具覆盖
  • 开源与商业模型整合
  • 实时社区更新支持

应用场景:

模型提示工程研究、自动化开发流程设计、AI教育案例参考


5. virattt/ai-hedge-fund

星标数: 40.3K | Fork数: 7.1K | 语言: Python

描述: An AI Hedge Fund Team

翻译: 一支人工智能对冲基金团队

主要特性:

  • 多智能体协作系统
  • 多种投资策略模拟
  • 基本面与技术面分析
  • 风险管理模块
  • 教育研究导向设计

应用场景:

学术机构AI交易策略实验、开发者学习多智能体系统设计、金融从业者模拟投资策略表现...


6. SoftFever/OrcaSlicer

星标数: 10.8K | Fork数: 1.4K | 语言: C++

描述: G-code generator for 3D printers (Bambu, Prusa, Voron, VzBot, RatRig, Creality, etc.)

翻译: 3D打印机G代码生成器(支持Bambu、Prusa、Voron、VzBot、RatRig、Creality等品牌)

主要特性:

  • 高级校准工具(温度塔、流量、回抽等)
  • 精确壁厚和接缝控制
  • 三明治模式和Polyholes支持
  • 超快速切片算法
  • 多品牌3D打印机兼容性

应用场景:

高精度模型制作与原型开发、教育场景教学实践、批量生产与快速迭代。


7. simdjson/simdjson

星标数: 22.0K | Fork数: 1.1K | 语言: C++

描述: Parsing gigabytes of JSON per second : used by Facebook/Meta Velox, the Node.js runtime, ClickHouse, WatermelonDB, Apache Doris, Milvus, StarRocks

翻译: 每秒解析千兆字节JSON数据:被Facebook/Meta Velox、Node.js运行时、ClickHouse、WatermelonDB、Apache Doris、Milvus、StarRocks等采用

主要特性:

  • 极高性能(每秒解析GB级JSON数据)
  • 完整的JSON和UTF-8验证
  • 自动选择CPU优化的解析器
  • 易于使用且文档完善的API
  • 无依赖的单头文件库

应用场景:

数据库系统(如ClickHouse)、实时数据处理平台、Node.js运行时。


8. ItzCrazyKns/Perplexica

星标数: 24.6K | Fork数: 2.6K | 语言: TypeScript

描述: Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI

翻译: Perplexica是一款人工智能驱动的搜索引擎,作为Perplexity AI的开源替代方案而存在。

主要特性:

  • 支持本地LLM(如Qwen、DeepSeek、Llama、Mistral)
  • 双模式搜索(Copilot模式增强搜索/普通模式网页搜索)
  • 6种专注模式(全网络/写作助手/学术等)
  • 基于SearxNG的隐私保护开源搜索
  • 提供API接口和Docker部署

应用场景:

学术研究的可信信息获取、内容创作的智能辅助、开发者的API集成应用。


9. sst/opencode

星标数: 23.4K | Fork数: 1.6K | 语言: TypeScript

描述: AI coding agent, built for the terminal.

翻译: AI编程代理,专为终端打造。

主要特性:

  • 终端集成AI编程助手
  • 多包管理器支持安装
  • 跨平台兼容性
  • 可配置安装路径
  • 实时开发环境调试

应用场景:

本地开发调试、快速原型构建、命令行工作流集成。


10. Zie619/n8n-workflows

星标数: 30.3K | Fork数: 1.4K | 语言: HTML

描述: all of the workflows of n8n i could find (also from the site itself)

翻译: 我所找到的所有n8n工作流程(包括来自该网站本身的)

主要特性:

  • 2053个n8n工作流集合
  • 高性能全文搜索与文档系统
  • 智能分类与命名系统
  • Mermaid图表可视化
  • 多平台集成支持(365种集成)

应用场景:

开发者快速集成第三方服务、企业低代码平台自动化流程搭建、IT团队学习复用标准化解...


11. ccxt/ccxt

星标数: 38.4K | Fork数: 8.2K | 语言: Python

描述: A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go

翻译: 支持JavaScript、TypeScript、Python、C#、PHP及Go语言的加密货币交易API,覆盖100余家交易所

主要特性:

  • 支持超过100家加密货币交易所的API
  • 提供统一且标准化的数据接口
  • 支持多种编程语言(JavaScript/TypeScript/Python/C#/PHP/Go)
  • 包含完整的公共和私有API实现
  • 支持浏览器和Node.js等多平台运行

应用场景:

跨交易所套利、自动化交易机器人构建、市场数据分析与策略回测。


12. midday-ai/midday

星标数: 12.2K | Fork数: 1.1K | 语言: TypeScript

描述: Invoicing, Time tracking, File reconciliation, Storage, Financial Overview & your own Assistant made for Freelancers

翻译: 发票管理、时间追踪、文件核对、存储服务、财务总览及专为自由职业者打造的私人助理。

主要特性:

  • 时间追踪
  • 神奇收件箱
  • 保险库
  • 无缝导出
  • 助手

应用场景:

自由职业者时间与发票管理、独立工作者财务流程整合、多业务功能一站式处理。


13. unclecode/crawl4ai

星标数: 53.2K | Fork数: 5.3K | 语言: Python

描述: 🚀🤖 Crawl4AI: Open-source LLM Friendly Web Crawler & Scraper. Don't be shy, join here: https://discord.gg/jP8KfhDhyN

翻译: 🚀🤖 Crawl4AI:开源LLM友好型网络爬虫与抓取工具。无需犹豫,立即加入:https://discord.gg/jP8KfhDhyN

主要特性:

  • 网页转Markdown
  • 智能表格提取
  • 并发爬取控制
  • 内存管理优化
  • 无头浏览器支持

应用场景:

RAG系统数据预处理、AI智能体数据管道构建、大规模网页信息结构化采集。


14. ml-explore/mlx-lm

星标数: 2.1K | Fork数: 237 | 语言: Python

描述: Run LLMs with MLX

翻译: 使用MLX运行LLMs

主要特性:

  • 支持Hugging Face Hub集成,可轻松使用数千个大语言模型(LLM)
  • 支持量化模型和上传至Hugging Face Hub
  • 支持低秩和全模型微调(包括量化模型)
  • 提供分布式推理和微调功能
  • 提供命令行工具和Python API两种使用方式

应用场景:

Mac设备离线文本生成与对话、研究人员本地模型量化优化实验。


15. CorentinJ/Real-Time-Voice-Cloning

星标数: 55.7K | Fork数: 9.2K | 语言: Python

描述: Clone a voice in 5 seconds to generate arbitrary speech in real-time

翻译: 5秒内克隆声音并实时生成任意语音

主要特性:

  • 实时语音克隆
  • 三阶段深度学习框架(SV2TTS)
  • 支持多说话人合成
  • 基于PyTorch实现
  • 预训练模型自动下载

应用场景:

虚拟助手语音定制、有声内容创作、实时语音转换。


16. mnh-jansson/open-battery-information

星标数: 428 | Fork数: 104 | 语言: C++

描述:

翻译:

主要特性:

  • 提供电池管理系统的解锁工具
  • 支持通过Arduino与BMS通信
  • 提供Windows预编译二进制文件
  • 包含Python实现的图形界面软件
  • 旨在修复误触发保护的电池

应用场景:

笔记本电脑电池修复、电动工具电池维修。


17. HKUDS/DeepCode

星标数: 6.3K | Fork数: 861 | 语言: Python

描述: "DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"

翻译: DeepCode:开放式智能编码(论文转代码与文本转网页及文本转后端)

主要特性:

  • 多智能体协作系统
  • 文本到代码生成(Text2Code)
  • 文本到网页生成(Text2Web)
  • 文本到后端生成(Text2Backend)
  • 开放式代理编程框架

应用场景:

快速原型开发、教育编程辅助、企业级应用搭建。