f9cc7973b93c9e7e0f98ff5130124687c8940fa0
- 添加 transformers 和 torch 依赖 - 创建 bert_router.py 封装 RouteLLM BERT 分类器 - 新增 select_model_by_bert() 函数替代 token 长度路由 - BERT 输出映射: strong->qwen-max, weak->qwen-flash - 保留 token 长度路由作为 fallback
Description
No description provided
Languages
Python
92.2%
Dockerfile
4.6%
Shell
3.2%