4a8de8925e553e1102338656e4841d93a8e9a351
实现基于 token 长度的简单规则路由服务: - FastAPI 基础服务 (/v1/chat/completions) - 根据 token 长度自动选择模型 (gpt-3.5/gpt-4o-mini/gpt-4o) - 成本追踪和统计 (/stats) - 健康检查端点 (/health) - 总计 224 行代码
Description
No description provided
Languages
Python
92.2%
Dockerfile
4.6%
Shell
3.2%