aszerW 508118cc50 fix: 修复 max_tokens 为 0 或 None 时响应内容被截断的问题
问题: Swagger UI 测试时 max_tokens 默认值为 0,导致 DashScope API
      返回的响应内容只有 1 个 token(被截断)

修复:
- 非流式和流式响应中,当 max_tokens 为 None 或 ≤0 时不传给后端 API
- 让 DashScope 使用自己的默认 max_tokens 值(通常 2048/4096)
- 使用 completion_kwargs 字典动态构建请求参数

效果:
- Swagger UI 中 max_tokens 留空或设为 0 都能返回完整响应
- 需要限制输出时可手动设置合理的 max_tokens 值
2026-04-19 00:58:51 +08:00
2026-04-18 09:32:58 +08:00
2026-04-18 09:32:58 +08:00
Description
No description provided
139 KiB
Languages
Python 92.2%
Dockerfile 4.6%
Shell 3.2%