回测层设计

定位

验证 Agent 分析质量的闭环系统。通过多截面回测 → 前瞻收益采集 → 多基准绩效评估，量化评估投资框架和 Agent 的分析能力。

核心问题：Agent 的分析结论在事后看来有多准确？筛选策略相比大盘有多少 alpha？

三步独立 Pipeline

backtest-screen                 backtest-agent                 backtest-eval
┌─────────────────┐            ┌─────────────────┐            ┌─────────────────┐
│ ① 截面筛选       │            │ ② Agent 分析     │            │ ③ 绩效评估       │
│                  │            │                  │            │                  │
│ strategy.yaml    │    CSV     │ 读取筛选 CSV      │  reports   │ 读取报告+CSV     │
│ → 生成截面日期    │───────────→│ → 并发 Agent      │──────────→│ → 采集前向收益    │
│ → 逐截面筛选     │            │ → 进度/重试/增量   │            │ → 五基准评估      │
│ → 保存 CSV       │            │ → 保存 JSON+MD    │            │ → 输出报告        │
└─────────────────┘            └─────────────────┘            └─────────────────┘
      秒级                           小时级                         分钟级
      可反复跑                        可中断/续跑                     可反复跑

每步独立，可以随时中断、重跑，互不影响。

调用方式

# Step 1: 生成截面日期 + 逐截面筛选 + 保存 CSV
python -m src.engine.launcher strategies/v6_value/strategy.yaml backtest-screen

# Step 2: 并发 Agent 分析 (增量/重试/进度)
python -m src.engine.launcher strategies/v6_value/strategy.yaml backtest-agent
python -m src.engine.launcher strategies/v6_value/strategy.yaml backtest-agent --dry-run   # 仅查看任务量和成本估算
python -m src.engine.launcher strategies/v6_value/strategy.yaml backtest-agent --retry 2   # 失败自动重试2轮

# Step 3: 采集前向收益 + 多基准绩效评估
python -m src.engine.launcher strategies/v6_value/strategy.yaml backtest-eval

配置 (strategy.yaml)

backtest:
  start_date: '2020-06-30'           # 起始截面 (决定日期对齐: 06-30→06-30/12-31)
  end_date: '2025-12-31'             # 结束截面
  cross_section_interval: 6m         # 间隔 (6m/3m/1y/2w)
  top_n: 50                          # 每截面筛选候选数
  agent_concurrency: 10              # Agent 并发数
  forward_periods:                   # 前向收益评估窗口
  - {months: 1, label: 1个月}
  - {months: 3, label: 3个月}
  - {months: 6, label: 6个月}
  - {months: 12, label: 12个月}

五基准绩效体系

基准	来源	含义
沪深300	tushare 指数日线	全市场基准，衡量被动投资收益
筛选池等权	backtest-screen CSV	全部通过量化筛选的候选等权，衡量筛选策略 alpha
筛选池 Top	CSV 中最高评级	最高评级等权，衡量分级的区分度
Agent 买入	Agent 报告中建议买入 (≥70分)	衡量 Agent 判断力
Agent Top5	Agent 报告中评分最高 5 只	衡量 Agent 精选能力

Alpha 分析输出三层对比：

筛选池 vs 沪深300（量化筛选的 alpha）
Agent 买入 vs 筛选池（Agent 的增量 alpha）
Agent 买入 vs 沪深300（端到端 alpha）

模块详解

pipeline.py — 三步 Pipeline 编排

核心模块，包含三个独立入口函数：

函数	职责
`step_screen(config)`	日期生成（月末对齐）→ 逐截面筛选 → 保存 CSV
`step_agent(config)`	读 CSV → 并发 Agent → 进度/重试/增量 → 保存报告
`step_eval(config)`	读 CSV + 报告 → 采集前向收益（带缓存）→ 五基准评估

Agent 批量分析特性

增量：自动跳过已有报告的股票，再次运行只补缺失的
进度：✓ [3/119 3%] 601288.SH | 68分 | 观望 | 312s | ETA 45min
重试：--retry N 失败后自动重试 N 轮
dry-run：--dry-run 仅统计任务量、预估耗时和成本

前向收益缓存

outcomes_cache/outcomes_{date}.json 缓存每截面的收益数据，二次运行 eval 秒完。

outcome_collector.py — 前瞻收益采集

采集分析截止日期之后的实际市场表现，作为质量评估的 ground truth。

@dataclass
class ForwardOutcome:
    cutoff_price: float          # 基准价格
    return_1m/3m/6m/12m: float   # 各窗口收益率
    max_drawdown_6m: float       # 6个月最大回撤
    max_gain_6m: float           # 6个月最大涨幅
    volatility_6m: float         # 日收益波动率
    actual_dividends: float      # 12个月内每股分红
    data_available_months: int   # 可用数据月数

回看窗口 15 天，覆盖春节/国庆等长假。

quality_scorer.py — 5 维质量评分

维度	权重	评估内容
方向判断	40%	AI 看多/空 vs 实际涨跌
推荐质量	25%	买入→赚钱? 回避→跌了?
风险识别	15%	有回撤时是否提前预警?
安全边际	10%	声称的安全边际是否兜住?
分红准确度	10%	分红预测 vs 实际分红

可评分条件：data_available_months >= 3

batch_backtest.py — 量化筛选回测（独立）

在多截面运行量化筛选，评估筛选策略本身的历史表现。不涉及 Agent，可独立使用。

batch_live.py — 模拟盘批量分析

src/desktop/batch_live.py — 对多只股票进行实时批量分析，生成组合级汇总。用于模拟盘场景：选定一组候选股票后，批量运行 live-analyze 并汇总为组合视图。与回测模块独立，使用免费公开数据（CrawlerProvider）。

crosssection.py — 跨截面对比

三种模式：plan（规划）、prepare（准备快照）、compare（纵向对比分析结论变化）。

数据存储

{strategy_dir}/backtest/
├── screen_results/                        # Step 1 输出
│   ├── screen_2020-06-30.csv
│   ├── screen_2020-12-31.csv
│   └── ...
├── agent_reports/                         # Step 2 输出
│   ├── 601288.SH_2024-06-30_report.md
│   ├── 601288.SH_2024-06-30_structured.json
│   └── ...
├── outcomes_cache/                        # Step 3 缓存
│   ├── outcomes_2020-06-30.json
│   └── ...
├── backtest_report_20260316_1143.md       # Step 3 输出 (Markdown)
└── backtest_summary_20260316_1143.json    # Step 3 输出 (JSON)

设计约束

无前视偏差：分析基于 cutoff_date 之前的数据，收益采集基于之后的数据
可复现：相同样本 + 策略 + LLM → 可重现（temperature=0.1）
渐进式：可先 dry-run 看任务量，再小批量跑，最后全量
增量安全：每步可中断重跑，Agent 自动跳过已完成的
配置驱动：所有参数从 strategy.yaml 读取

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

回测层设计

定位

三步独立 Pipeline

调用方式

配置 (strategy.yaml)

五基准绩效体系

模块详解

pipeline.py — 三步 Pipeline 编排

Agent 批量分析特性

前向收益缓存

outcome_collector.py — 前瞻收益采集

quality_scorer.py — 5 维质量评分

batch_backtest.py — 量化筛选回测（独立）

batch_live.py — 模拟盘批量分析

crosssection.py — 跨截面对比

数据存储

设计约束

FilesExpand file tree

backtest.md

Latest commit

History

backtest.md

File metadata and controls

回测层设计

定位

三步独立 Pipeline

调用方式

配置 (strategy.yaml)

五基准绩效体系

模块详解

pipeline.py — 三步 Pipeline 编排

Agent 批量分析特性

前向收益缓存

outcome_collector.py — 前瞻收益采集

quality_scorer.py — 5 维质量评分

batch_backtest.py — 量化筛选回测（独立）

batch_live.py — 模拟盘批量分析

crosssection.py — 跨截面对比

数据存储

设计约束