GitHub 每日趋势 - 2025年09月19日
1. microsoft/markitdown
星标数: 78.5K | Fork数: 4.3K | 语言: Python
描述: Python tool for converting files and office documents to Markdown.
翻译: 用于将文件和办公文档转换为Markdown的Python工具。
主要特性:
- 支持多种文件格式转换(PDF/Office/图像/音频/HTML等)
- 保留文档结构(标题/列表/表格/链接等)
- 提供MCP服务器集成LLM应用
- 模块化依赖管理(可选功能组)
- 无临时文件的内存流处理
应用场景:
知识库构建、文档自动化处理、AI助手内容理解
2. TheAlgorithms/Python
星标数: 207.6K | Fork数: 47.9K | 语言: Python
描述: All Algorithms implemented in Python
翻译: 所有用Python实现的算法
主要特性:
- 涵盖多种算法实现
- 纯教育目的设计
- 完善的贡献指南
- 活跃社区支持
- 代码质量规范
应用场景:
计算机科学教育、算法学习参考、编程面试准备。
3. curl/curl
星标数: 39.2K | Fork数: 6.9K | 语言: C
描述: A command line tool and library for transferring data with URL syntax, supporting DICT, FILE, FTP, FTPS, GOPHER, GOPHERS, HTTP, HTTPS, IMAP, IMAPS, LDAP, LDAPS, MQTT, POP3, POP3S, RTMP, RTMPS, RTSP, SCP, SFTP, SMB, SMBS, SMTP, SMTPS, TELNET, TFTP, WS and WSS. libcurl offers a myriad of powerful features
翻译: 一个用于通过URL语法传输数据的命令行工具和库,支持DICT、FILE、FTP、FTPS、GOPHER、GOPHERS、HTTP、HTTPS、IMAP、IMAPS、LDAP、LDAPS、MQTT、POP3、POP3S、RTMP、RTMPS、RTSP、SCP、SFTP、SMB、SMBS、SMTP、SMTPS、TELNET、TFTP、WS及WSS协议。libcurl提供了大量强大功能。
主要特性:
- 支持多种网络协议(HTTP/HTTPS/FTP/SFTP等20余种)
- 命令行工具与库(libcurl)双重形态
- 跨平台兼容(支持Windows/Linux/macOS等操作系统)
- 开源且采用MIT许可证
- 提供安全传输支持(SSL/TLS)
应用场景:
API测试与自动化脚本、文件传输与协议调试、嵌入式设备网络通信。
4. flutter/flutter
星标数: 172.7K | Fork数: 29.2K | 语言: Dart
描述: Flutter makes it easy and fast to build beautiful apps for mobile and beyond
翻译: Flutter 能够轻松快捷地构建精美的移动及其他跨平台应用。
主要特性:
- 跨平台开发(移动、Web、桌面)
- 单一代码库
- 丰富的UI组件和控件
- 高性能渲染和动画
- 开源且免费
应用场景:
企业跨平台应用开发、个人开发者快速构建多端产品、追求UI一致性的项目。
5. Alibaba-NLP/DeepResearch
星标数: 8.8K | Fork数: 647 | 语言: Python
描述: Tongyi DeepResearch, the Leading Open-source DeepResearch Agent
翻译: 通义深研,领先的开源深度研究智能体
主要特性:
- 全自动合成数据生成管道
- 大规模持续代理数据预训练
- 端到端强化学习框架
- 多代理推理范式兼容性
- 30.5B参数高效稀疏激活
应用场景:
学术研究、市场分析、复杂问题调查
6. category-labs/monad
星标数: 748 | Fork数: 179 | 语言: C++
描述:
翻译:
主要特性:
- 自定义EVM实现
- 高性能MonadDB数据库
- 并行交易调度
- x86-64-v3架构优化
- 共识与执行分离架构
应用场景:
高吞吐DeFi协议、交易所链上清算、Web3应用实时交易处理。
7. TEN-framework/ten-framework
星标数: 7.7K | Fork数: 888 | 语言: C
描述: Open-source framework for conversational voice AI agents.
翻译: 开源对话式语音AI代理框架。
主要特性:
- 开源对话语音AI框架
- 多语言支持(中英日等)
- 活跃的社区讨论与贡献
- Apache 2.0许可证(带特定条件)
- 集成DeepWiki问答支持
应用场景:
智能语音助手、客服机器人、多语言对话系统。
8. jwasham/coding-interview-university
星标数: 328.4K | Fork数: 80.5K | 语言: Unknown
描述: A complete computer science study plan to become a software engineer.
翻译: 成为软件工程师的完整计算机科学学习计划。
9. BasedHardware/omi
星标数: 6.8K | Fork数: 985 | 语言: C
描述: AI wearables. Put it on, speak, transcribe, automatically
翻译: AI穿戴设备。戴上它,说话,自动转录。
主要特性:
- 实时AI音频转录
- 24小时以上蓝牙低功耗录音
- 开源软件栈
- 可穿戴轻量设计
- 自动生成摘要和待办事项
应用场景:
商务会议记录、学术访谈转录、个人语音备忘录整理。
10. linera-io/linera-protocol
星标数: 29.1K | Fork数: 2.0K | 语言: Rust
描述: Main repository for the Linera protocol
翻译: Linera协议主代码库
主要特性:
- 高可扩展性区块链架构
- 低延迟Web3应用支持
- 跨链消息传递机制
- 键值存储数据映射
- 模块化协议设计
应用场景:
去中心化金融(DeFi)、高性能游戏、高频交易等对实时性要求苛刻的dApp场景。
11. dataease/SQLBot
星标数: 2.4K | Fork数: 259 | 语言: Python
描述: 基于大模型和 RAG 的智能问数系统。Text-to-SQL Generation via LLMs using RAG.
翻译: 基于大模型和RAG的智能问数系统。通过大语言模型与RAG实现文本到SQL的生成。
主要特性:
- 基于RAG的Text-to-SQL生成
- 开箱即用的数据源配置
- 工作空间资源隔离机制
- 第三方系统集成支持
- Docker容器化部署
应用场景:
集成BI工具辅助决策、嵌入客服系统自动答疑、内部管理平台快速查数。
12. ArthurBrussee/brush
星标数: 2.6K | Fork数: 115 | 语言: Rust
描述: 3D Reconstruction for all
翻译: 全民3D重建
主要特性:
- 跨平台3D高斯溅射重建(支持macOS/Windows/Linux/Android/浏览器)
- 支持COLMAP和Nerfstudio格式数据训练
- 实时训练可视化与交互式场景查看
- 支持透明图像和掩码训练
- 支持加载PLY文件和动态4D动画(ZIP序列)
应用场景:
数字文化遗产保护、网页端3D展示、动态场景实时渲染。
13. PaddlePaddle/PaddleOCR
星标数: 54.7K | Fork数: 8.7K | 语言: Python
描述: Turn any PDF or image document into structured data for your AI. A powerful, lightweight OCR toolkit that bridges the gap between images/PDFs and LLMs. Supports 80+ languages.
翻译: 将任意PDF或图像文档转换为结构化数据,供AI使用。这款功能强大、轻量级的OCR工具包,有效弥合了图像/PDF与大型语言模型之间的鸿沟,支持80余种语言识别。
主要特性:
- 支持80多种语言的OCR识别
- 高精度文本检测与识别
- 端到端文档结构化输出
- 支持多种硬件平台(CPU/GPU/XPU/NPU)
- 提供MCP服务器与AI代理集成
应用场景:
企业文档数字化、金融票据处理、跨语言RAG系统构建
14. unslothai/unsloth
星标数: 45.7K | Fork数: 3.7K | 语言: Python
描述: Fine-tuning & Reinforcement Learning for LLMs. 🦥 Train OpenAI gpt-oss, Qwen3, Llama 4, DeepSeek-R1, Gemma 3, TTS 2x faster with 70% less VRAM.
翻译: 大语言模型的微调与强化学习。🦥 以节省70%显存且2倍速的效率训练OpenAI gpt-oss、Qwen3、Llama 4、DeepSeek-R1、Gemma 3及TTS模型。
主要特性:
- 训练速度提升2倍
- 显存使用减少70-80%
- 支持多种主流大模型(如GPT-OSS、Llama、Gemma等)
- 提供免费Colab笔记本和详细指南
- 支持模型导出到GGUF/Ollama/vLLM等多种格式。
应用场景:
资源受限的开发者高效微调对话AI、快速定制视觉语言模型与推理系统部署。
15. openai/codex
星标数: 42.5K | Fork数: 4.9K | 语言: Rust
描述: Lightweight coding agent that runs in your terminal
翻译: 轻量级编码代理,在您的终端中运行
主要特性:
- 终端本地运行的轻量级AI编程助手
- 支持ChatGPT账户登录及API密钥认证
- 提供npm和Homebrew等多种安装方式。
- 支持Model Context Protocol (MCP) 服务器
- 丰富的配置文件选项(~/.codex/config.toml)
应用场景:
快速获取代码建议、自动化编程任务、调试代码。
16. tenstorrent/tt-metal
星标数: 1.2K | Fork数: 267 | 语言: C++
描述: 🤘 TT-NN operator library, and TT-Metalium low level kernel programming model.
翻译: 🤘 TT-NN算子库,以及TT-Metalium底层内核编程模型。
主要特性:
- 低层级内核编程模型
- Python与C++神经网络算子库
- 多设备并行计算支持
- 高性能推理优化
- 与主流AI框架集成
应用场景:
大规模LLM(如Llama)云端推理、张量并行的分布式训练、高吞吐AI计算服务。
17. virattt/ai-hedge-fund
星标数: 41.0K | Fork数: 7.2K | 语言: Python
描述: An AI Hedge Fund Team
翻译: 一支人工智能对冲基金团队
主要特性:
- 多代理协作系统(18个专业投资角色AI代理)
- 多种投资策略融合(价值投资、成长投资、技术分析等)
- 多维度信号生成(估值、情绪、基本面、技术面)
- 集成风险管理模块
- 教育研究导向设计(无实际交易功能)
应用场景:
金融科技量化投资教学、多智能体系统开发学习、AI投资决策应用探索。
18. cypress-io/cypress
星标数: 49.0K | Fork数: 3.3K | 语言: TypeScript
描述: Fast, easy and reliable testing for anything that runs in a browser.
翻译: 对任何在浏览器中运行的内容进行快速、简便且可靠的测试。
主要特性:
- 快速安装与配置
- 跨平台支持(Mac/Linux/Windows)
- 实时重载测试运行
- 集成测试结果云服务
- 多包管理器支持(npm/yarn/pnpm)
应用场景:
现代Web应用端到端测试、组件测试和API测试、持续集成流程验证。