fix: 修正 Swagger UI 中 max_tokens 默认值从 1 改为 2048
问题: max_tokens 设置了 ge=1 约束,导致 Swagger UI 自动生成默认值 1,
响应内容被严重截断
修复:
- 移除 ge=1 约束,允许 null 值
- example 改为 2048,符合常规使用场景
- 描述更新为'留空时使用模型默认值'
效果: Swagger UI 测试时 max_tokens 默认显示 2048,可返回完整响应
This commit is contained in:
2
main.py
2
main.py
@@ -77,7 +77,7 @@ class ChatCompletionRequest(BaseModel):
|
||||
example=[{"role": "user", "content": "你好,介绍一下你自己"}]
|
||||
)
|
||||
temperature: Optional[float] = Field(0.7, ge=0, le=2, description="随机性 (0-2)")
|
||||
max_tokens: Optional[int] = Field(None, ge=1, description="最大生成 token 数")
|
||||
max_tokens: Optional[int] = Field(None, description="最大生成 token 数(留空时使用模型默认值)", example=2048)
|
||||
stream: Optional[bool] = Field(False, description="是否使用流式输出")
|
||||
top_p: Optional[float] = Field(1.0, ge=0, le=1, description="核采样参数")
|
||||
n: Optional[int] = Field(1, ge=1, le=10, description="生成回复数量")
|
||||
|
||||
Reference in New Issue
Block a user