GitHub 每日趋势 - 2025年09月17日
1. microsoft/markitdown
星标数: 75.6K | Fork数: 4.2K | 语言: Python
描述: Python tool for converting files and office documents to Markdown.
翻译: 用于将文件和办公文档转换为Markdown的Python工具。
主要特性:
- 支持多种文件格式转换(PDF/Office/图像/音频/HTML等)
- 保留文档结构(标题/列表/表格/链接等)
- 提供MCP服务器集成LLM应用
- 模块化依赖管理(可选功能组)
- 无临时文件创建,直接处理二进制流
应用场景:
LLM文本分析预处理、知识库构建、多模态数据解析
2. ml-explore/mlx-lm
星标数: 2.2K | Fork数: 242 | 语言: Python
描述: Run LLMs with MLX
翻译: 使用MLX运行LLMs
主要特性:
- 集成Hugging Face Hub,支持数千种大型语言模型(LLM)。
- 支持量化模型和模型上传至Hugging Face
- 支持低秩和全模型微调(包括量化模型)
- 支持分布式推理和微调(mx.distributed)
- 提供命令行工具和Python API两种使用方式
应用场景:
开发者本地AI应用开发、隐私敏感用户安全对话交互、研究人员低门槛模型微调实验。
3. dataease/SQLBot
星标数: 1.8K | Fork数: 214 | 语言: Python
描述: 基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.
翻译: 基于大模型和RAG的智能问数系统。通过大语言模型与RAG技术实现文本到SQL的生成。
主要特性:
- 基于RAG的Text-to-SQL生成
- 开箱即用的数据源配置
- 工作空间资源隔离机制
- 第三方系统集成能力
- Docker容器化部署
应用场景:
嵌入BI系统辅助决策、集成客服平台自动答疑、内部管理系统快速查数。
4. SkyworkAI/DeepResearchAgent
星标数: 2.3K | Fork数: 321 | 语言: JavaScript
描述: DeepResearchAgent is a hierarchical multi-agent system designed not only for deep research tasks but also for general-purpose task solving. The framework leverages a top-level planning agent to coordinate multiple specialized lower-level agents, enabling automated task decomposition and efficient execution across diverse and complex domains.
翻译: DeepResearchAgent是一种分层多智能体系统,不仅专为深度研究任务设计,还能胜任通用问题求解。该框架利用顶层规划智能体协调多个专业化的底层智能体,实现自动化任务分解,并能跨多样复杂领域高效执行任务。
主要特性:
- 分层多智能体协作架构
- 自动化任务分解与规划
- 深度信息分析与研究能力
- 浏览器自动化与网络交互
- 可扩展工具集成与管理
应用场景:
学术研究、市场分析、技术调研
5. virattt/ai-hedge-fund
星标数: 40.5K | Fork数: 7.1K | 语言: Python
描述: An AI Hedge Fund Team
翻译: 一支人工智能对冲基金团队
主要特性:
- 多代理AI系统模拟知名投资策略
- 集成基本面、技术、估值和情绪分析
- 包含风险管理和投资组合管理模块
- 提供命令行和Web应用两种交互界面
- 纯教育研究用途不执行真实交易
应用场景:
金融科技教学、多智能体系统开发、投资策略效果模拟。
6. ccxt/ccxt
星标数: 38.6K | Fork数: 8.2K | 语言: Python
描述: A cryptocurrency trading API with more than 100 exchanges in JavaScript / TypeScript / Python / C# / PHP / Go
翻译: 支持JavaScript/TypeScript/Python/C#/PHP/Go语言的加密货币交易API,覆盖100余家交易所
主要特性:
- 支持超过100家加密货币交易所的API
- 提供统一且标准化的数据接口
- 多语言支持(JavaScript/TypeScript/Python/C#/PHP/Go)
- 完整的公共API和私有API实现
- 支持跨交易所数据分析和套利
应用场景:
自动化交易系统构建、跨交易所套利策略实施、多平台市场数据分析。
7. HKUDS/DeepCode
星标数: 6.5K | Fork数: 883 | 语言: Python
描述: "DeepCode: Open Agentic Coding (Paper2Code & Text2Web & Text2Backend)"
翻译: DeepCode:开放式智能编码(论文转代码与文本转网页及文本转后端)
主要特性:
- 多智能体协作代码生成
- 支持Paper2Code/Text2Web/Text2Backend三种模式
- 基于大语言模型的自主决策能力
- 开源可扩展的架构设计
- 端到端的自动化开发流程
应用场景:
快速原型开发、教育研究演示、企业级应用后端生成
8. PaddlePaddle/PaddleOCR
星标数: 54.1K | Fork数: 8.6K | 语言: Python
描述: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages.
翻译: 将任意PDF或图像文档转换为结构化数据,供AI使用。一个强大轻量的OCR工具包,架起图像/PDF与大型语言模型之间的桥梁。支持80多种语言。
主要特性:
- 支持80多种语言的多语言OCR
- 高精度文本识别与文档结构化输出
- 端到端解决方案(从检测到识别)
- 支持多种硬件(CPU/GPU/XPU/NPU)
- 轻量级且生产就绪的引擎
应用场景:
文档数字化与自动化处理、RAG系统多语言数据提取、企业流程智能化集成。
9. Plachtaa/seed-vc
星标数: 3.1K | Fork数: 368 | 语言: Python
描述: zero-shot voice conversion & singing voice conversion, with real-time support
翻译: 零样本语音转换与歌唱语音转换,支持实时处理。
主要特性:
- 无需训练的零样本语音转换
- 低延迟(约400毫秒)实时转换
- 歌声转换支持
- 最少数据微调(1个话语)
- 训练速度快(在T4上仅需2分钟)
应用场景:
在线会议变声、游戏语音互动、直播与歌唱声音实时转换。
10. BasedHardware/omi
星标数: 6.5K | Fork数: 965 | 语言: C
描述: AI wearables. Put it on, speak, transcribe, automatically
翻译: AI穿戴设备。戴上它,说话,自动转录。
主要特性:
- 实时AI音频处理
- 低功耗蓝牙连接
- 自动转录与摘要生成
- 可穿戴轻量设计
- 开源软件栈
应用场景:
商务会议记录、课堂笔记整理、日常对话转录与摘要生成。
11. mnh-jansson/open-battery-information
星标数: 521 | Fork数: 107 | 语言: C++
描述:
翻译:
主要特性:
- 提供电池管理系统的解锁工具
- 支持通过Arduino与BMS通信
- 提供Windows预编译二进制文件
- 包含Python实现的图形界面软件
- 旨在修复误触发保护的电池
应用场景:
BMS误报故障修复、废旧电池组恢复、电子维修DIY。
12. ArthurBrussee/brush
星标数: 2.4K | Fork数: 107 | 语言: Rust
描述: 3D Reconstruction for all
翻译: 全民3D重建
主要特性:
- 跨平台3D重建(支持macOS/Windows/Linux/Android/浏览器)
- 基于WebGPU和Burn框架的硬件兼容性(AMD/Nvidia/Intel)
- 支持COLMAP和Nerfstudio格式数据训练
- 实时训练可视化与交互式场景查看
- 支持动态4D高斯溅落动画(.zip与差值帧加载)
应用场景:
浏览器端实时3D可视化、移动设备轻量化建模、学术研究动态4D重建。
13. PowerShell/PowerShell
星标数: 49.9K | Fork数: 7.9K | 语言: C#
描述: PowerShell for every system!
翻译: 适用于所有系统的PowerShell!
主要特性:
- 跨平台支持(Windows、Linux、macOS)
- 结构化数据处理(JSON/CSV/XML等)
- 命令行Shell与脚本语言集成
- REST API与对象模型优化
- 模块化cmdlets处理框架
应用场景:
自动化运维与配置管理、云端资源编排、跨平台数据提取与API集成。
14. ItzCrazyKns/Perplexica
星标数: 24.9K | Fork数: 2.6K | 语言: TypeScript
描述: Perplexica is an AI-powered search engine. It is an Open source alternative to Perplexity AI
翻译: Perplexica是一款基于人工智能的搜索引擎,作为Perplexity AI的开源替代方案而存在。
主要特性:
- 支持本地LLM(如Qwen、DeepSeek、Llama、Mistral)
- 双模式搜索(Copilot模式增强搜索/普通模式网页搜索)
- 6种专注模式(全网络/写作助手/学术等)
- 基于SearxNG的隐私保护开源搜索
- 提供API接口和Docker部署
应用场景:
学术研究、内容创作、技术查询
15. TheAlgorithms/Python
星标数: 207.2K | Fork数: 47.8K | 语言: Python
描述: All Algorithms implemented in Python
翻译: 所有用Python实现的算法
主要特性:
- 涵盖多种算法实现
- 教育导向的代码示例
- 社区驱动与贡献友好
- 代码质量与风格统一
- 持续集成与自动化测试
应用场景:
计算机科学教育、算法学习参考、编程面试准备。