跳转至

GitHub 每日趋势 - 2025年09月17日

1. microsoft/markitdown

星标数: 75.6K | Fork数: 4.2K | 语言: Python

描述: Python tool for converting files and office documents to Markdown.

翻译: 用于将文件和办公文档转换为Markdown的Python工具。

主要特性:

  • 支持多种文件格式转换(PDF/Office/图像/音频/HTML等)
  • 保留文档结构(标题/列表/表格/链接等)
  • 提供MCP服务器集成LLM应用
  • 模块化依赖管理(可选功能组)
  • 无临时文件创建,直接处理二进制流

应用场景:

LLM文本分析预处理、知识库构建、多模态数据解析


2. ml-explore/mlx-lm

星标数: 2.2K | Fork数: 242 | 语言: Python

描述: Run LLMs with MLX

翻译: 使用MLX运行LLMs

主要特性:

  • 集成Hugging Face Hub,支持数千种大型语言模型(LLM)。
  • 支持量化模型和模型上传至Hugging Face
  • 支持低秩和全模型微调(包括量化模型)
  • 支持分布式推理和微调(mx.distributed)
  • 提供命令行工具和Python API两种使用方式

应用场景:

开发者本地AI应用开发、隐私敏感用户安全对话交互、研究人员低门槛模型微调实验。


3. dataease/SQLBot

星标数: 1.8K | Fork数: 214 | 语言: Python

描述: 基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.

翻译: 基于大模型和RAG的智能问数系统。通过大语言模型与RAG技术实现文本到SQL的生成。

主要特性:

  • 基于RAG的Text-to-SQL生成
  • 开箱即用的数据源配置
  • 工作空间资源隔离机制
  • 第三方系统集成能力
  • Docker容器化部署

应用场景:

嵌入BI系统辅助决策、集成客服平台自动答疑、内部管理系统快速查数。


4. SkyworkAI/DeepResearchAgent

星标数: 2.3K | Fork数: 321 | 语言: JavaScript

描述: DeepResearchAgent is a hierarchical multi-agent system designed not only for deep research tasks but also for general-purpose task solving. The framework leverages a top-level planning agent to coordinate multiple specialized lower-level agents, enabling automated task decomposition and efficient execution across diverse and complex domains.

翻译: DeepResearchAgent是一种分层多智能体系统,不仅专为深度研究任务设计,还能胜任通用问题求解。该框架利用顶层规划智能体协调多个专业化的底层智能体,实现自动化任务分解,并能跨多样复杂领域高效执行任务。

主要特性:

  • 分层多智能体协作架构
  • 自动化任务分解与规划
  • 深度信息分析与研究能力
  • 浏览器自动化与网络交互
  • 可扩展工具集成与管理

应用场景:

学术研究、市场分析、技术调研


5. virattt/ai-hedge-fund

星标数: 40.5K | Fork数: 7.1K | 语言: Python

描述: An AI Hedge Fund Team

翻译: 一支人工智能对冲基金团队

主要特性:

  • 多代理AI系统模拟知名投资策略
  • 集成基本面、技术、估值和情绪分析
  • 包含风险管理和投资组合管理模块
  • 提供命令行和Web应用两种交互界面
  • 纯教育研究用途不执行真实交易

应用场景:

金融科技教学、多智能体系统开发、投资策略效果模拟。


6. ccxt/ccxt

星标数: 38.6K | Fork数: 8.2K | 语言: Python

描述: A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go

翻译: 支持JavaScript/TypeScript/Python/C#/PHP/Go语言的加密货币交易API,覆盖100余家交易所

主要特性:

  • 支持超过100家加密货币交易所的API
  • 提供统一且标准化的数据接口
  • 多语言支持(JavaScript/TypeScript/Python/C#/PHP/Go)
  • 完整的公共API和私有API实现
  • 支持跨交易所数据分析和套利

应用场景:

自动化交易系统构建、跨交易所套利策略实施、多平台市场数据分析。


7. HKUDS/DeepCode

星标数: 6.5K | Fork数: 883 | 语言: Python

描述: "DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"

翻译: DeepCode:开放式智能编码(论文转代码与文本转网页及文本转后端)

主要特性:

  • 多智能体协作代码生成
  • 支持Paper2Code/Text2Web/Text2Backend三种模式
  • 基于大语言模型的自主决策能力
  • 开源可扩展的架构设计
  • 端到端的自动化开发流程

应用场景:

快速原型开发、教育研究演示、企业级应用后端生成


8. PaddlePaddle/PaddleOCR

星标数: 54.1K | Fork数: 8.6K | 语言: Python

描述: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages.

翻译: 将任意PDF或图像文档转换为结构化数据,供AI使用。一个强大轻量的OCR工具包,架起图像/PDF与大型语言模型之间的桥梁。支持80多种语言。

主要特性:

  • 支持80多种语言的多语言OCR
  • 高精度文本识别与文档结构化输出
  • 端到端解决方案(从检测到识别)
  • 支持多种硬件(CPU/GPU/XPU/NPU)
  • 轻量级且生产就绪的引擎

应用场景:

文档数字化与自动化处理、RAG系统多语言数据提取、企业流程智能化集成。


9. Plachtaa/seed-vc

星标数: 3.1K | Fork数: 368 | 语言: Python

描述: zero-shot voice conversion & singing voice conversion, with real-time support

翻译: 零样本语音转换与歌唱语音转换,支持实时处理。

主要特性:

  • 无需训练的零样本语音转换
  • 低延迟(约400毫秒)实时转换
  • 歌声转换支持
  • 最少数据微调(1个话语)
  • 训练速度快(在T4上仅需2分钟)

应用场景:

在线会议变声、游戏语音互动、直播与歌唱声音实时转换。


10. BasedHardware/omi

星标数: 6.5K | Fork数: 965 | 语言: C

描述: AI wearables. Put it on, speak, transcribe, automatically

翻译: AI穿戴设备。戴上它,说话,自动转录。

主要特性:

  • 实时AI音频处理
  • 低功耗蓝牙连接
  • 自动转录与摘要生成
  • 可穿戴轻量设计
  • 开源软件栈

应用场景:

商务会议记录、课堂笔记整理、日常对话转录与摘要生成。


11. mnh-jansson/open-battery-information

星标数: 521 | Fork数: 107 | 语言: C++

描述:

翻译:

主要特性:

  • 提供电池管理系统的解锁工具
  • 支持通过Arduino与BMS通信
  • 提供Windows预编译二进制文件
  • 包含Python实现的图形界面软件
  • 旨在修复误触发保护的电池

应用场景:

BMS误报故障修复、废旧电池组恢复、电子维修DIY。


12. ArthurBrussee/brush

星标数: 2.4K | Fork数: 107 | 语言: Rust

描述: 3D Reconstruction for all

翻译: 全民3D重建

主要特性:

  • 跨平台3D重建(支持macOS/Windows/Linux/Android/浏览器)
  • 基于WebGPU和Burn框架的硬件兼容性(AMD/Nvidia/Intel)
  • 支持COLMAP和Nerfstudio格式数据训练
  • 实时训练可视化与交互式场景查看
  • 支持动态4D高斯溅落动画(.zip与差值帧加载)

应用场景:

浏览器端实时3D可视化、移动设备轻量化建模、学术研究动态4D重建。


13. PowerShell/PowerShell

星标数: 49.9K | Fork数: 7.9K | 语言: C#

描述: PowerShell for every system!

翻译: 适用于所有系统的PowerShell!

主要特性:

  • 跨平台支持(Windows、Linux、macOS)
  • 结构化数据处理(JSON/CSV/XML等)
  • 命令行Shell与脚本语言集成
  • REST API与对象模型优化
  • 模块化cmdlets处理框架

应用场景:

自动化运维与配置管理、云端资源编排、跨平台数据提取与API集成。


14. ItzCrazyKns/Perplexica

星标数: 24.9K | Fork数: 2.6K | 语言: TypeScript

描述: Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI

翻译: Perplexica是一款基于人工智能的搜索引擎,作为Perplexity AI的开源替代方案而存在。

主要特性:

  • 支持本地LLM(如Qwen、DeepSeek、Llama、Mistral)
  • 双模式搜索(Copilot模式增强搜索/普通模式网页搜索)
  • 6种专注模式(全网络/写作助手/学术等)
  • 基于SearxNG的隐私保护开源搜索
  • 提供API接口和Docker部署

应用场景:

学术研究、内容创作、技术查询


15. TheAlgorithms/Python

星标数: 207.2K | Fork数: 47.8K | 语言: Python

描述: All Algorithms implemented in Python

翻译: 所有用Python实现的算法

主要特性:

  • 涵盖多种算法实现
  • 教育导向的代码示例
  • 社区驱动与贡献友好
  • 代码质量与风格统一
  • 持续集成与自动化测试

应用场景:

计算机科学教育、算法学习参考、编程面试准备。