实验与分析文档补充: 1. 脚本: scripts/full_pool_top3_backtest.py - 用于快速测试不同标的池组合的脚本。 - 支持跨大类 Top 1 逻辑的独立验证。 2. 文档: data_logic_analysis.md - 记录了从 43 只全市场池精简到 11 只核心池的逻辑推演。 - 详细对比了“相关性管理”对回撤的影响数据。
4.9 KiB
4.9 KiB
跨市场数据时间对齐逻辑分析
一、各市场交易时间(北京时间)
| 市场 | 交易时间 | 数据代码 | 数据源 | 数据标记 |
|---|---|---|---|---|
| A股 | T日 09:30-15:00 | 000300.SH 等 | Tushare | T日 OHLC |
| 港股 | T日 09:30-16:00 | HSTECH.HK (3033.HK) | YFinance | T日 OHLC |
| 美股 | T日 21:30-次日04:00 | NDX | YFinance | T日 OHLC |
| 加密货币 | T日 08:00-次日08:00 (UTC) | BTC/ETH | CCXT/OKX | T日 OHLC |
| 黄金期货 | T日 09:00-15:30, 21:00-次日02:30 | AU.SHF | Tushare | T日 OHLC |
二、数据就绪时间点
假设当前是 T+1日 09:00(信号计算时间):
| 市场 | T日数据就绪时间 | T+1日09:00时最新数据 |
|---|---|---|
| A股 | T日 15:00 | T日数据 ✓ |
| 港股 | T日 16:00 | T日数据 ✓ |
| 美股 | T+1日 05:00 | T日数据 ✓ |
| 加密货币 | T+1日 08:00 | T+1日数据 ✓ (UTC 00:00) |
| 黄金期货 | T+1日 02:30 | T+1日数据 ✓ (夜盘结束) |
三、关键问题分析
问题1:数据标记与实际交易时间的不一致
黄金期货 (AU.SHF):
- 交易时间:T日 09:00-15:30(日盘)+ T日 21:00-T+1日 02:30(夜盘)
- Tushare 数据标记:T+1日 OHLC(因为夜盘结束是T+1日凌晨)
- 实际对应:T日日盘 + T日夜盘 = 标记为 T+1日
加密货币 (BTC/ETH):
- 交易时间:T日 08:00(UTC 00:00)- T+1日 08:00(UTC 00:00)
- CCXT 数据标记:T+1日 OHLC(UTC 00:00 为日线分界)
- 实际对应:T日08:00到T+1日08:00 = 标记为 T+1日
问题2:当前代码逻辑
# hybrid_source.py 中的数据对齐逻辑
# 以A股交易日为基准,对齐所有数据
a_share_dates = 获取A股交易日历(start_date, end_date)
index_data = index_data.reindex(a_share_dates)
# 非A股标的处理
# 港股/美股:ffill() - 使用T日数据
# 加密货币/期货:bfill() - 使用T+1日数据
问题3:当前存在的问题
场景:3月26日 00:17 运行代码
| 期望 | 实际 |
|---|---|
| 获取3月25日所有市场数据 | 可能只获取到3月24日数据 |
| 信号日期:3月26日 | 信号日期:3月25日 |
| 数据基准:3月25日 | 数据基准:3月24日 |
原因分析:
end_date默认是datetime.now().strftime('%Y-%m-%d')= "2026-03-26"- 但 A股3月26日还没开盘,Tushare 获取不到3月26日数据
- 数据对齐时使用
index_data.index.max()作为结束日期,变成3月25日 - 导致交易日历只到3月25日,3月26日被排除
四、正确的数据获取逻辑
4.1 运行时间点与数据获取
| 运行时间 | A股状态 | 应获取的最新数据 |
|---|---|---|
| T+1日 00:00-09:00 | 未开盘 | T日数据(所有市场) |
| T+1日 09:30-15:00 | 交易中 | T日数据(不应获取盘中数据) |
| T+1日 15:00后 | 已收盘 | T+1日数据(A股)+ T日数据(其他) |
4.2 数据对齐策略
核心原则:以A股交易日为基准,T+1日09:00计算信号时:
- A股/港股:T日数据已收盘,使用 ffill() 填充
- 美股:T日数据已收盘(T+1日05:00),使用 ffill() 填充
- 加密货币:T+1日08:00已收盘,使用 T+1日数据(bfill())
- 黄金期货:T+1日02:30已收盘,使用 T+1日数据(bfill())
4.3 代码修改建议
修改1:使用配置的 end_date 获取交易日历
# 原代码(错误)
end_str = index_data.index.max().strftime('%Y%m%d')
# 修改后(正确)
end_str = pd.Timestamp(end_date).strftime('%Y%m%d')
修改2:区分不同市场的数据对齐方式
# 港股/美股:ffill() - T日数据
# 加密货币/期货:bfill() - T+1日数据
yf_codes = [港股, 美股]
crypto_futures_codes = [BTC, ETH, AU.SHF]
修改3:信号日期计算
# 当前代码(错误)
signal_date = backtest_result.index[-1] # 取数据最后一天
data_base_date = signal_date - 1 # 假设是前一天
# 应该根据当前时间判断
if 当前时间 < T+1日09:00:
signal_date = T日
data_base_date = T-1日
else:
signal_date = T+1日
data_base_date = T日
五、当前已做的修改
- ✅
hybrid_source.py使用配置的end_date获取交易日历 - ✅
hybrid_source.py区分 yf_codes 和 crypto_futures_codes 的不同填充方式 - ✅
hybrid_source.pyYFinance 添加auto_adjust=False和end_date+1天 - ✅
rotation.yaml黄金改为 AU.SHF,恒生科技改为 HSTECH.HK
六、仍需确认的问题
-
信号日期显示:当前显示 "2026-03-25 (基于 2026-03-24 收盘数据)" 是否正确?
- 如果今天是3月26日00:17,应该显示 "2026-03-26 (基于 2026-03-25 收盘数据)"
-
数据基准日期计算:
report.py中的data_base_date = signal_date - 1逻辑是否需要修改? -
加密货币/黄金的数据标记:CCXT/Tushare 返回的数据日期是否已经是 T+1日标记?