- 添加 Qwen flash/plus/max 三个等级模型 - 设置 Qwen 为默认路由策略 - 配置 DashScope API 接口 - 更新 .env.example 包含 Qwen API Key
使用 LiteLLM 统一接口支持多 LLM 提供商: - 支持 OpenAI, Anthropic, Gemini, Ollama 等 100+ 提供商 - 统一模型配置 (MODEL_CONFIG) - 新增 /models 端点列出可用模型 - 统计增加提供商分布 - 简化代码,移除 OpenAI 客户端初始化
实现基于 token 长度的简单规则路由服务: - FastAPI 基础服务 (/v1/chat/completions) - 根据 token 长度自动选择模型 (gpt-3.5/gpt-4o-mini/gpt-4o) - 成本追踪和统计 (/stats) - 健康检查端点 (/health) - 总计 224 行代码