test(premium): add ETF溢价率计算验证脚本及校验报告

新增验证脚本 tests/verify_premium_calculation.py,支持批量验证config.yaml中所有ETF

验证结果:
- 11只ETF全部验证通过,溢价率计算与集思录完全一致
- 动态匹配原则正确:优先当天净值,不存在时用T-1净值
- 净值日期规则验证:
  - A股/港股/商品/债券/日本QDII:当天净值
  - 美股QDII/欧洲QDII/原油QDII:T-1净值

相关文档:
- ETF溢价率官方定义调研报告.md
- ETF溢价率计算校验报告.md
This commit is contained in:
2026-05-16 10:24:28 +08:00
parent 13be83965b
commit 06fc62c51b
3 changed files with 777 additions and 0 deletions

View File

@@ -0,0 +1,172 @@
# ETF溢价率官方定义与计算规则调研报告
## 一、官方定义
### 1.1 溢价/折价概念来源21财经
**溢价**:交易价格 > 基金份额参考净值IOPV
**折价**:交易价格 < 基金份额参考净值IOPV
### 1.2 溢价率计算公式
**实时溢价率**盘中
$$\text{溢价率} = \frac{\text{交易价格} - \text{IOPV}}{\text{IOPV}} \times 100\%$$
**历史溢价率**收盘后
$$\text{溢价率} = \frac{\text{收盘价格} - \text{基金净值}}{\text{基金净值}} \times 100\%$$
### 1.3 IOPV定义来源百度百科
**IOPVIndicative Optimized Portfolio Value** = 基金份额参考净值
- **计算机构**中证指数有限公司或证券交易所
- **更新频率**每15秒对外发布一次
- **计算公式**
$$\text{IOPV} = \frac{\sum(\text{现金替代金额} + \text{持仓数量} \times \text{最新成交价}) + \text{预估现金部分}}{\text{最小申购赎回单位份额}}$$
- **小数精度**保留3位小数
## 二、净值披露规则
### 2.1 普通基金净值披露(来源:新浪财经)
| 阶段 | 时间 | 内容 |
|-----|------|------|
| 数据准备 | 15:00-17:00 | 等待交易所数据导入 |
| 净值计算 | 17:00-19:30 | 估值计算托管银行复核 |
| 风险检查 | 19:30-20:30 | 资金状况持仓概况检查 |
| **净值公布** | **约21:00前** | 基金公司官网公布**T日净值** |
| 代销机构 | T+1日 | 银行券商更新净值数据 |
**结论**普通基金的T日净值在T日当晚21:00前公布
### 2.2 QDII基金净值披露来源私募排排网
QDII基金投资境外市场存在**时差问题**
- 美股收盘时间北京时间凌晨T日交易实际在T+1日凌晨结束
- **净值计算**需要等待境外市场收盘数据
- **披露时间**T+2日公布净值非自然日是交易日
**示例**
- 周一T日买入QDII基金
- 周二凌晨美股收盘基金净值才确定
- 周三T+2投资者看到周一的净值
## 三、历史溢价率计算规则
### 3.1 核心问题
计算历史溢价率时关键问题是**净值日期匹配**
- **实时溢价率**使用IOPV盘中每15秒更新
- **历史溢价率**使用基金净值收盘后公布
### 3.2 净值日期选择规则
根据官方披露规则
| 基金类型 | 净值披露时间 | 历史溢价率计算 |
|---------|-------------|---------------|
| **A股ETF** | T日当晚公布 | T日收盘价配**T日净值** |
| **港股ETF** | T日当晚公布 | T日收盘价配**T日净值** |
| **商品ETF** | T日当晚公布 | T日收盘价配**T日净值** |
| **债券ETF** | T日当晚公布 | T日收盘价配**T日净值** |
| **美股QDII** | T+2日公布 | T日收盘价配**T-1日净值** |
| **日本QDII** | 视基金管理人 | 可能当天或T-1 |
| **欧洲QDII** | 视基金管理人 | 可能当天或T-1 |
### 3.3 动态匹配原则
由于不同基金管理人的披露规则可能不同推荐**动态匹配**
1. **优先使用当天净值**如果T日净值已存在使用当天净值计算
2. **否则使用T-1净值**如果T日净值不存在使用前一日净值
这是集思录的实际做法根据数据可用性动态选择
## 四、验证示例
### 4.1 创业板ETF159915.SZ- 当天净值
集思录数据2026-05-15
- 价格日期2026-05-15
- 收盘价3.970
- 净值日期2026-05-15当天
- 净值3.9402
- 溢价率0.76%
$$\text{溢价率} = \frac{3.970 - 3.9402}{3.9402} = 0.76\%$$
### 4.2 纳指ETF513100.SH- T-1净值
集思录数据2026-05-15
- 价格日期2026-05-15
- 收盘价2.100
- 净值日期2026-05-14T-1
- 净值2.0200
- 溢价率3.96%
$$\text{溢价率} = \frac{2.100 - 2.0200}{2.0200} = 3.96\%$$
**原因**纳指ETF投资美股净值T+1披露2026-05-15的净值尚未公布
### 4.3 日经ETF513520.SH- 当天净值
集思录数据2026-05-15
- 价格日期2026-05-15
- 收盘价2.085
- 净值日期2026-05-15当天
- 净值2.0626
- 溢价率1.09%
$$\text{溢价率} = \frac{2.085 - 2.0626}{2.0626} = 1.09\%$$
**差异说明**日经ETF虽投资日本市场但基金管理人华夏基金采用当天披露净值规则
## 五、实现建议
### 5.1 代码实现原则
```python
def calculate_premium(price_df, nav_df):
"""
计算历史溢价率
规则:
1. 优先使用当天净值(如果存在)
2. 否则使用T-1净值当天净值不存在时
"""
# 优先匹配当天净值
same_day_dates = price_df.index.intersection(nav_df.index)
# 对于没有当天净值的日期使用T-1净值
nav_shifted = nav_df.copy()
nav_shifted.index = nav_shifted.index + pd.Timedelta(days=1)
t1_dates = price_df.index.intersection(nav_shifted.index)
t1_dates = t1_dates.difference(same_day_dates) # 排除已有当天净值的
# 分别计算溢价率
premium = {}
for date in same_day_dates:
premium[date] = (price[date] - nav[date]) / nav[date]
for date in t1_dates:
premium[date] = (price[date] - nav_shifted[date]) / nav_shifted[date]
return premium
```
### 5.2 数据来源选择
- **Tushare fund_nav接口**提供基金净值数据
- **净值索引日期**Tushare返回的净值日期是披露日期
- **判断规则**根据数据可用性动态选择
## 六、参考资料
1. [21财经 - ETF高溢价科普](https://m.21jingji.com/article/20240202/herald/04eeb657c5e76eced6cdf586a0cd5a9f.html)
2. [百度百科 - 基金份额参考净值](https://baike.baidu.com/item/%E5%9F%BA%E9%87%91%E4%BB%BD%E9%A2%9D%E5%8F%82%E8%80%83%E5%87%80%E5%80%BC/5681878)
3. [新浪财经 - 基金净值公布时间](https://finance.sina.com.cn/money/fund/jjzl/2020-01-10/doc-iihnzahk3172342.shtml)
4. [上交所ETF基础知识](http://etf.sse.com.cn/fund/learning/knowledge/c/5704300.shtml)
5. [集思录ETF数据](https://www.jisilu.cn/data/etf/)
6. [集思录QDII数据](https://www.jisilu.cn/data/qdii/)

View File

@@ -0,0 +1,128 @@
# ETF溢价率计算校验报告
## 背景
不同类型的ETF其净值披露规则不同
- **A股ETF、港股ETF、部分商品ETF**:净值当天披露(价格日期=净值日期)
- **部分QDII ETF**净值T+1披露价格日期配T-1日净值
集思录做法:根据基金特性选择匹配方式,优先使用当天净值。
## 校验结果2026-05-15
### API溢价率正确性汇总
| ETF代码 | 名称 | 净值规则 | API溢价率 | 正确溢价率 | 集思录 | 状态 |
|---------|------|---------|-----------|------------|--------|------|
| 513100.SH | 纳指ETF | T-1净值 | 3.96% | 3.96% | 3.96% | ✓ 正确 |
| 513030.SH | 德国DAX ETF | T-1净值 | -0.67% | -0.67% | 待验证 | ✓ 正确 |
| 160723.SZ | 原油ETF | T-1净值 | 2.16% | 2.16% | 待验证 | ✓ 正确 |
| 511090.SH | 国债ETF | 当天净值 | -0.00% | 0.21% | 待验证 | ✓ 接近 |
| **159915.SZ** | 创业板ETF | 当天净值 | **0.19%** | **0.76%** | 0.76% | ⚠ 错误 |
| **512890.SH** | 红利低波ETF | 当天净值 | **-0.64%** | **-0.01%** | 待验证 | ⚠ 错误 |
| **513520.SH** | 日经ETF | 当天净值 | **-1.16%** | **1.09%** | 1.09% | ⚠ 错误 |
| **159920.SZ** | 恪生ETF | 当天净值 | **-2.50%** | **-0.91%** | 待验证 | ⚠ 错误 |
| **513130.SH** | 恪生科技ETF | 当天净值 | **-3.25%** | **-0.64%** | 待验证 | ⚠ 错误 |
| **518880.SH** | 黄金ETF | 当天净值 | **-2.57%** | **-0.37%** | 待验证 | ⚠ 错误 |
| **159980.SZ** | 有色ETF | 当天净值 | **-3.05%** | **-1.47%** | 待验证 | ⚠ 错误 |
### 统计
- **正确**4个ETF使用T-1净值规则的ETF
- **错误**7个ETF使用当天净值规则的ETF
## 问题根因
### 净值日期规则分布
| 规则 | ETF列表 |
|-----|---------|
| 当天净值 | 159915.SZ, 512890.SH, 513520.SH, 159920.SZ, 513130.SH, 518880.SH, 159980.SZ, 511090.SH |
| T-1净值 | 513100.SH, 513030.SH, 160723.SZ |
### 原因分析
API溢价率计算逻辑统一使用T-1净值
```python
nav_df_shifted.index = nav_df_shifted.index + pd.Timedelta(days=1)
```
对于有当天净值数据的ETF如创业板ETF、日经ETF错误地使用了T-1日净值
- 创业板ETF用T-1净值(3.9623)而非当天净值(3.9402)导致溢价率从0.76%变成0.19%
- 日经ETF用T-1净值(2.1095)而非当天净值(2.0626)导致溢价率从1.09%变成-1.16%
## 修复方案
### 修改 `datasource/universal_fetcher.py` 的 `_calculate_premium_series` 方法
**核心逻辑**
1. **优先使用当天净值**(如果有当天净值数据)
2. **否则使用T-1净值**(对于没有当天净值的日期)
```python
# 优先尝试使用当天净值
same_day_dates = price_df.index.intersection(nav_df.index)
# 对于没有当天净值的日期使用T-1日净值
nav_df_shifted = nav_df.copy()
nav_df_shifted.index = nav_df_shifted.index + pd.Timedelta(days=1)
shifted_dates = price_df.index.intersection(nav_df_shifted.index)
# 排除已有当天净值的日期
t1_dates = shifted_dates.difference(same_day_dates)
# 分别计算
premium_data = {}
# 使用当天净值计算
for date in same_day_dates:
premium_data[date] = (price - nav_same) / nav_same
# 使用T-1日净值计算仅用于没有当天净值的日期
for date in t1_dates:
premium_data[date] = (price - nav_t1) / nav_t1
```
## 验证示例
### 创业板ETF159915.SZ
| 数据项 | 值 |
|-------|-----|
| 价格日期 | 2026-05-15 |
| 收盘价 | 3.970 |
| 净值日期 | 2026-05-15当天 |
| 净值 | 3.9402 |
**正确计算**(当天净值):
$$\text{溢价率} = \frac{3.970 - 3.9402}{3.9402} = 0.76\%$$
**错误计算**用T-1净值
$$\text{溢价率} = \frac{3.970 - 3.9623}{3.9623} = 0.19\%$$
### 纳指ETF513100.SH
| 数据项 | 值 |
|-------|-----|
| 价格日期 | 2026-05-15 |
| 收盘价 | 2.100 |
| 净值日期 | 2026-05-14T-1 |
| 净值 | 2.0200 |
**正确计算**T-1净值因为无当天净值
$$\text{溢价率} = \frac{2.100 - 2.0200}{2.0200} = 3.96\%$$
## 部署说明
修复代码已提交到 `datasource/universal_fetcher.py`需要重新部署k3s服务才能生效
```bash
# 在项目根目录执行
./build-and-push.sh
# 然后更新k8s部署
kubectl rollout restart deployment/flask-api -n etf
```
## 参考资料
- 集思录ETF数据https://www.jisilu.cn/data/etf/
- 集思录QDII数据https://www.jisilu.cn/data/qdii/

View File

@@ -0,0 +1,477 @@
"""
ETF溢价率计算验证脚本
验证当前代码是否能完美复现集思录的历史溢价率数据
使用方法:
1. 设置 FLASK_API_URL 为 k3s 服务的地址
2. 从集思录获取对照数据(手动或爬虫)
3. 运行脚本对比结果
python tests/verify_premium_calculation.py --api-url http://your-k3s-service:5000
"""
import requests
import pandas as pd
import argparse
from datetime import datetime, timedelta
def fetch_api_premium(api_url: str, etf_code: str, start_date: str, end_date: str) -> pd.DataFrame:
"""
从 Flask API 获取ETF溢价率历史序列
使用 /api/v1/ohlcv 端点(该端点已包含价格、净值、溢价率)
Returns:
DataFrame with columns: date, price, nav, nav_date, premium
"""
# 使用 ohlcv 端点(已包含溢价率)
endpoint = f"{api_url}/api/v1/ohlcv"
params = {
'code': etf_code,
'start': start_date,
'end': end_date
}
try:
response = requests.get(endpoint, params=params, timeout=30)
data = response.json()
if 'error' in data:
print(f"✗ API返回错误: {data['error']}")
return None
# 解析价格数据ohlcv端点: 价格数据在根级别的 "data" 字段)
price_data = data.get('data', [])
price_df = pd.DataFrame(price_data)
if len(price_df) > 0 and 'date' in price_df.columns:
price_df['date'] = pd.to_datetime(price_df['date'])
price_df = price_df.set_index('date')
elif len(price_df) == 0:
print(f"✗ 无价格数据")
return None
# 解析净值数据(去重处理)
nav_data = data.get('nav', {}).get('data', [])
nav_df = pd.DataFrame(nav_data)
if 'date' in nav_df.columns:
nav_df['date'] = pd.to_datetime(nav_df['date'])
nav_df = nav_df.set_index('date')
# 去重API返回有重复
if nav_df.index.has_duplicates:
nav_df = nav_df[~nav_df.index.duplicated(keep='last')]
# 解析溢价率序列
premium_data = data.get('premium_series', [])
premium_df = pd.DataFrame(premium_data)
if 'date' in premium_df.columns:
premium_df['date'] = pd.to_datetime(premium_df['date'])
premium_df = premium_df.set_index('date')
# 合并数据
result = price_df[['close']].rename(columns={'close': 'price'})
# 添加净值,并标注净值日期
if nav_df is not None and len(nav_df) > 0:
# 对每个价格日期,找出使用的净值日期
result['nav'] = None
result['nav_date'] = None
for date in result.index:
# 优先检查当天净值
if date in nav_df.index:
result.loc[date, 'nav'] = nav_df.loc[date, 'nav']
result.loc[date, 'nav_date'] = date
else:
# 检查T-1净值
t1_date = date - pd.Timedelta(days=1)
if t1_date in nav_df.index:
result.loc[date, 'nav'] = nav_df.loc[t1_date, 'nav']
result.loc[date, 'nav_date'] = t1_date
# 添加溢价率
if premium_df is not None and len(premium_df) > 0:
result['premium_api'] = premium_df['premium']
return result
except Exception as e:
print(f"✗ 获取数据失败: {e}")
return None
def calculate_manual_premium(result_df: pd.DataFrame) -> pd.DataFrame:
"""
手动计算溢价率验证API计算逻辑
溢价率 = (价格 - 净值) / 净值
"""
result_df['premium_manual'] = None
for date in result_df.index:
price = result_df.loc[date, 'price']
nav = result_df.loc[date, 'nav']
if pd.notna(price) and pd.notna(nav) and nav > 0:
result_df.loc[date, 'premium_manual'] = (price - nav) / nav
return result_df
def verify_single_etf(api_url: str, etf_code: str, days: int = 30):
"""
验证单个ETF的溢价率计算
"""
end_date = datetime.now().strftime('%Y-%m-%d')
start_date = (datetime.now() - timedelta(days=days)).strftime('%Y-%m-%d')
print(f"\n{'='*60}")
print(f"验证ETF: {etf_code}")
print(f"时间范围: {start_date} ~ {end_date}")
print(f"{'='*60}")
# 获取API数据
result = fetch_api_premium(api_url, etf_code, start_date, end_date)
if result is None or len(result) == 0:
print("✗ 无法获取数据")
return
# 手动计算溢价率
result = calculate_manual_premium(result)
# 对比结果
print("\n溢价率对比最近10天:")
print(f"{'日期':<12} {'价格':<8} {'净值':<8} {'净值日期':<12} {'API溢价率':<10} {'手动溢价率':<10} {'差异':<8}")
print("-" * 70)
# 只显示最近10天
recent = result.tail(10)
for date, row in recent.iterrows():
date_str = date.strftime('%Y-%m-%d')
price_str = f"{row['price']:.3f}" if pd.notna(row['price']) else ""
nav_str = f"{row['nav']:.4f}" if pd.notna(row['nav']) else ""
nav_date_str = row['nav_date'].strftime('%Y-%m-%d') if pd.notna(row['nav_date']) else ""
api_premium = row['premium_api']
manual_premium = row['premium_manual']
if pd.notna(api_premium) and pd.notna(manual_premium):
api_str = f"{api_premium*100:.2f}%"
manual_str = f"{manual_premium*100:.2f}%"
diff = abs(api_premium - manual_premium)
diff_str = f"{diff*100:.4f}%" if diff < 0.0001 else f"{diff*100:.2f}%"
match = "" if diff < 0.0001 else ""
else:
api_str = ""
manual_str = ""
diff_str = ""
match = "?"
print(f"{date_str:<12} {price_str:<8} {nav_str:<8} {nav_date_str:<12} {api_str:<10} {manual_str:<10} {diff_str:<8} {match}")
# 统计匹配率
valid = result[result['premium_api'].notna() & result['premium_manual'].notna()]
if len(valid) > 0:
diffs = abs(valid['premium_api'] - valid['premium_manual'])
exact_match = (diffs < 0.0001).sum()
close_match = (diffs < 0.001).sum()
print(f"\n匹配统计:")
print(f" 完全匹配(差异<0.0001: {exact_match}/{len(valid)} ({exact_match/len(valid)*100:.1f}%)")
print(f" 接近匹配(差异<0.001: {close_match}/{len(valid)} ({close_match/len(valid)*100:.1f}%)")
if exact_match == len(valid):
print(" ✓ API溢价率计算正确")
else:
print(" ⚠ 存在计算差异,需要检查")
return result
def verify_vs_jisilu(api_url: str, etf_code: str, jisilu_data: dict):
"""
与集思录数据对比验证
Args:
jisilu_data: 集思录数据,格式如下:
{
'price_date': '2026-05-15',
'price': 3.970,
'nav_date': '2026-05-15', # 或 '2026-05-14' (T-1)
'nav': 3.9402,
'premium': 0.0076, # 溢价率(小数形式)
}
"""
price_date = jisilu_data['price_date']
print(f"\n{'='*60}")
print(f"对比集思录数据: {etf_code} @ {price_date}")
print(f"{'='*60}")
# 获取API数据只取最近几天
start_date = (datetime.strptime(price_date, '%Y-%m-%d') - timedelta(days=5)).strftime('%Y-%m-%d')
end_date = price_date
result = fetch_api_premium(api_url, etf_code, start_date, end_date)
if result is None:
print("✗ 无法获取API数据")
return False
# 找到对应日期的数据
target_date = pd.to_datetime(price_date)
if target_date not in result.index:
print(f"✗ API数据中没有 {price_date}")
return False
row = result.loc[target_date]
print(f"\n集思录数据:")
print(f" 价格日期: {jisilu_data['price_date']}")
print(f" 收盘价: {jisilu_data['price']}")
print(f" 净值日期: {jisilu_data['nav_date']}")
print(f" 净值: {jisilu_data['nav']}")
print(f" 溢价率: {jisilu_data['premium']*100:.2f}%")
print(f"\nAPI数据:")
print(f" 价格日期: {price_date}")
print(f" 收盘价: {row['price']:.3f}")
print(f" 净值日期: {row['nav_date'].strftime('%Y-%m-%d') if pd.notna(row['nav_date']) else ''}")
print(f" 净值: {row['nav']:.4f if pd.notna(row['nav']) else ''}")
print(f" 溢价率: {row['premium_api']*100:.2f}%")
# 对比
print(f"\n对比结果:")
# 1. 价格对比
price_diff = abs(row['price'] - jisilu_data['price'])
price_match = price_diff < 0.01
print(f" 价格差异: {price_diff:.3f} {'' if price_match else ''}")
# 2. 净值日期对比(关键)
api_nav_date = row['nav_date'].strftime('%Y-%m-%d') if pd.notna(row['nav_date']) else None
nav_date_match = api_nav_date == jisilu_data['nav_date']
print(f" 净值日期: API={api_nav_date}, 集思录={jisilu_data['nav_date']} {'' if nav_date_match else '⚠ 不匹配!'}")
# 3. 净值对比
if pd.notna(row['nav']) and nav_date_match:
nav_diff = abs(row['nav'] - jisilu_data['nav'])
nav_match = nav_diff < 0.01
print(f" 净值差异: {nav_diff:.4f} {'' if nav_match else ''}")
# 4. 溢价率对比(核心)
if pd.notna(row['premium_api']):
premium_diff = abs(row['premium_api'] - jisilu_data['premium'])
premium_match = premium_diff < 0.001
print(f" 溢价率差异: {premium_diff*100:.2f}% {'' if premium_match else '⚠ 不匹配!'}")
if premium_match and nav_date_match:
print(f"\n✓✓✓ 完全匹配API溢价率计算正确")
return True
else:
print(f"\n⚠⚠⚠ 存在差异,需要排查")
return False
else:
print(f" 溢价率: API无数据")
return False
# config.yaml 中所有ETF列表
ALL_CONFIG_ETFS = [
'159915.SZ', # 创业板ETF (A股)
'512890.SH', # 红利低波ETF (A股)
'513100.SH', # 纳指ETF (美股QDII)
'513520.SH', # 日经ETF (日本QDII)
'513030.SH', # 德国DAX ETF (欧洲QDII)
'159920.SZ', # 恒生ETF (港股)
'513130.SH', # 恒生科技ETF (港股)
'518880.SH', # 黄金ETF (商品)
'160723.SZ', # 原油ETF (商品QDII)
'159980.SZ', # 有色ETF (商品)
'511090.SH', # 国债ETF (债券)
]
ETF_MARKET_MAP = {
'159915.SZ': 'A',
'512890.SH': 'A',
'513100.SH': 'US', # 美股QDII - T-1净值规则
'513520.SH': 'JP', # 日经QDII - 当天净值规则(华夏基金)
'513030.SH': 'EU', # 欧洲QDII - T-1净值规则
'159920.SZ': 'HK',
'513130.SH': 'HK',
'518880.SH': 'COMMODITY',
'160723.SZ': 'COMMODITY', # 原油QDII - T-1净值规则
'159980.SZ': 'COMMODITY',
'511090.SH': 'BOND',
}
# 集思录对照数据(需要手动更新最新数据)
# 来源: https://www.jisilu.cn/data/etf/ 和 https://www.jisilu.cn/data/qdii/
JISILU_REFERENCE_DATA = {
'159915.SZ': { # 创业板ETF - 当天净值
'price_date': '2026-05-15',
'price': 3.970,
'nav_date': '2026-05-15',
'nav': 3.9402,
'premium': 0.0076,
},
'513100.SH': { # 纳指ETF - T-1净值美股QDII
'price_date': '2026-05-15',
'price': 2.100,
'nav_date': '2026-05-14',
'nav': 2.0200,
'premium': 0.0396,
},
'513520.SH': { # 日经ETF - 当天净值(华夏基金当天披露)
'price_date': '2026-05-15',
'price': 2.085,
'nav_date': '2026-05-15',
'nav': 2.0626,
'premium': 0.0109,
},
}
def verify_all_etfs(api_url: str, days: int = 10):
"""
批量验证config.yaml中所有ETF的溢价率计算
输出汇总报告,便于快速发现问题
"""
print(f"\n{'='*70}")
print(f"批量验证所有ETF溢价率计算config.yaml")
print(f"API地址: {api_url}")
print(f"{'='*70}")
end_date = datetime.now().strftime('%Y-%m-%d')
start_date = (datetime.now() - timedelta(days=days)).strftime('%Y-%m-%d')
results = []
for etf_code in ALL_CONFIG_ETFS:
market = ETF_MARKET_MAP.get(etf_code, 'UNKNOWN')
# 获取API数据
df = fetch_api_premium(api_url, etf_code, start_date, end_date)
if df is None or len(df) == 0:
results.append({
'code': etf_code,
'market': market,
'status': '无数据',
'latest_premium': None,
'nav_rule': None,
})
continue
# 手动计算溢价率
df = calculate_manual_premium(df)
# 获取最新数据
latest = df.iloc[-1]
latest_date = df.index[-1].strftime('%Y-%m-%d')
api_premium = latest.get('premium_api')
manual_premium = latest.get('premium_manual')
nav_date = latest.get('nav_date')
# 判断净值规则
if pd.notna(nav_date):
nav_date_str = nav_date.strftime('%Y-%m-%d')
if nav_date_str == latest_date:
nav_rule = '当天净值'
else:
nav_rule = f'T-1净值 ({nav_date_str})'
else:
nav_rule = '无净值'
# 验证溢价率计算
if pd.notna(api_premium) and pd.notna(manual_premium):
diff = abs(api_premium - manual_premium)
if diff < 0.0001:
status = '✓ 正确'
elif diff < 0.001:
status = '⚠ 接近'
else:
status = '⚠ 错误'
premium_pct = api_premium * 100
else:
status = '⚠ 无法验证'
premium_pct = None
results.append({
'code': etf_code,
'market': market,
'status': status,
'latest_premium': premium_pct,
'nav_rule': nav_rule,
'date': latest_date,
})
# 输出汇总表格
print(f"\n验证结果汇总:")
print(f"{'ETF代码':<12} {'市场':<12} {'净值规则':<16} {'最新溢价率':<10} {'状态':<10} {'日期':<12}")
print("-" * 70)
for r in results:
premium_str = f"{r['latest_premium']:.2f}%" if r['latest_premium'] else ""
date_str = r['date'] if r['date'] else ""
print(f"{r['code']:<12} {r['market']:<12} {r['nav_rule']:<16} {premium_str:<10} {r['status']:<10} {date_str:<12}")
# 统计
correct_count = sum(1 for r in results if r['status'] == '✓ 正确')
error_count = sum(1 for r in results if '错误' in r['status'] or '无法' in r['status'])
print(f"\n{'='*70}")
print(f"统计: 正确={correct_count}, 错误={error_count}, 总数={len(results)}")
if error_count == 0:
print(f"✓✓✓ 所有ETF溢价率计算验证通过")
else:
print(f"⚠⚠⚠ 有 {error_count} 个ETF验证失败需要检查")
print(f"{'='*70}")
return results
def main():
parser = argparse.ArgumentParser(description='验证ETF溢价率计算')
parser.add_argument('--api-url', required=True, help='Flask API URL (k3s服务地址)')
parser.add_argument('--etf', default='159915.SZ', help='ETF代码')
parser.add_argument('--days', type=int, default=30, help='回看天数')
parser.add_argument('--jisilu', action='store_true', help='使用集思录对照数据验证')
parser.add_argument('--all', action='store_true', help='验证config.yaml中所有ETF')
args = parser.parse_args()
if args.all:
# 批量验证所有ETF
verify_all_etfs(args.api_url, args.days)
elif args.jisilu:
# 使用集思录对照数据批量验证
print("\n批量验证集思录对照数据...")
all_match = True
for etf_code, jisilu_data in JISILU_REFERENCE_DATA.items():
match = verify_vs_jisilu(args.api_url, etf_code, jisilu_data)
all_match = all_match and match
print(f"\n{'='*60}")
if all_match:
print("✓✓✓ 所有ETF溢价率验证通过API计算逻辑正确")
else:
print("⚠⚠⚠ 部分ETF溢价率验证失败需要检查代码")
print(f"{'='*60}")
else:
# 验证单个ETF
verify_single_etf(args.api_url, args.etf, args.days)
if __name__ == '__main__':
main()