llm-compass

Author	SHA1	Message	Date
aszerW	59c03516e4	feat(router): 集成NVIDIA多头分类器实现3-tier智能路由 - 新增nvidia_router.py: 手动加载NVIDIA prompt-task-and-complexity-classifier模型 - DeBERTa-v3-base backbone + 8个分类头(task_type/creativity/reasoning/domain等) - 综合多维度评分实现simple/medium/complex三级路由 - 映射: simple->qwen-flash, medium->qwen-plus, complex->qwen-max - main.py切换到NVIDIA路由替代RouteLLM BERT二分类 - 移除LiteLLM依赖解决版本冲突,使用原生httpx调用 - 版本升级至v0.3.0	2026-04-18 01:21:31 +08:00
aszerW	f9cc7973b9	feat: integrate RouteLLM BERT router for intelligent query classification - 添加 transformers 和 torch 依赖 - 创建 bert_router.py 封装 RouteLLM BERT 分类器 - 新增 select_model_by_bert() 函数替代 token 长度路由 - BERT 输出映射: strong->qwen-max, weak->qwen-flash - 保留 token 长度路由作为 fallback	2026-04-18 00:12:51 +08:00
aszerW	4259478a37	feat: integrate LiteLLM for multi-provider support 使用 LiteLLM 统一接口支持多 LLM 提供商： - 支持 OpenAI, Anthropic, Gemini, Ollama 等 100+ 提供商 - 统一模型配置 (MODEL_CONFIG) - 新增 /models 端点列出可用模型 - 统计增加提供商分布 - 简化代码，移除 OpenAI 客户端初始化	2026-04-17 23:42:31 +08:00
aszerW	2380dd4617	feat: add python-dotenv support for local .env files - 添加 python-dotenv 依赖 - 在 config.py 中加载 .env 文件 - 添加 .env.example 示例文件	2026-04-17 23:35:37 +08:00
aszerW	4a8de8925e	feat: implement MVP LLM router service 实现基于 token 长度的简单规则路由服务： - FastAPI 基础服务 (/v1/chat/completions) - 根据 token 长度自动选择模型 (gpt-3.5/gpt-4o-mini/gpt-4o) - 成本追踪和统计 (/stats) - 健康检查端点 (/health) - 总计 224 行代码	2026-04-17 23:33:43 +08:00

5 Commits