aszerW 4a8de8925e feat: implement MVP LLM router service
实现基于 token 长度的简单规则路由服务:
- FastAPI 基础服务 (/v1/chat/completions)
- 根据 token 长度自动选择模型 (gpt-3.5/gpt-4o-mini/gpt-4o)
- 成本追踪和统计 (/stats)
- 健康检查端点 (/health)
- 总计 224 行代码
2026-04-17 23:33:43 +08:00
2026-04-17 23:33:43 +08:00
Description
No description provided
139 KiB
Languages
Python 92.2%
Dockerfile 4.6%
Shell 3.2%