GitHub精选|tokenspeed

评分81.5分的tokenspeed深度解析,含功能详解、安装指南与推荐理由

2026年05月12日 周二

tokenspeed

lightseekorg/tokenspeed
| 综合评分 81.5

Python license last commit

这是一个专注于大语言模型高性能推理的开源项目。它的核心目标是降低 LLM 推理延迟、提升吞吐量,为生产环境中的 Agent 工作负载提供极致的推理性能。

项目在设计上兼顾了 TensorRT-LLM 级别的性能和 vLLM 级别的易用性,采用本地 SPMD(单程序多数据)设计范式,通过静态编译器生成优化的计算图,实现了高效的并行推理。

项目主要使用 Python 开发,代码质量高,结构清晰。

该项目已获得 952 Stars,正在快速成长,社区关注度持续上升。

开发团队保持高频更新,近一周内有 67 次提交,项目生命力旺盛。

Python ⭐ 952 stars ⑂ 74 🆕 本周新项目 ⚡ 周更新67次 📜 MIT blackwell deepseek gpt-oss kimi

📈 正在快速成长中 ⚡ 更新非常频繁,开发活跃 📜 使用 MIT 开源许可

✨ 核心功能

🔹 极速推理引擎,支持 TensorRT-LLM 级别的性能

🔹 灵活的调度器,C++ 控制面 + Python 执行面

🔹 可插拔核函数系统,支持自定义算子

🔹 支持 SMG 集成,低开销 CPU 侧请求管理

🔹 高性能推理加速

🔹 流式输出与长上下文支持

💡 推荐理由

优质项目,社区反馈良好,值得一试

🎯 适用场景:适合需要高性能 AI 推理部署的团队

📊 项目信息

编程语言 Python
Stars ⭐ 952
Forks ⑂ 74
许可证 MIT
周更新 67 次提交
开发者 lightseekorg
starsforkslast commit
📂 查看完整源码
https://github.com/lightseekorg/tokenspeed
👆 长按上方链接复制后,在浏览器中打开


数据来源:GitHub API · 综合评分推荐

Leave a Reply

Your email address will not be published. Required fields are marked *