icon	lucide/folder-open

实验包总览

本目录记录仓库中所有可运行的实验包。它们共享同一套 PCVR 训练、评估、推理、checkpoint sidecar 和 bundle 打包流程；差异集中在输入 tokenization、交互主干、默认训练策略和少量实验私有 hook 上。

如果把仓库看成一个统一推荐系统实验台，那么 src/taac2026 是稳定运行时，experiments/ 是可替换的研究假设。每个实验包都应回答四个问题：

它要验证什么建模假设。
它如何组织用户静态特征、候选物品特征和行为序列。
它的训练默认值是否会影响公平对照。
它的输出和 checkpoint 是否仍满足共享 PCVR 契约。

一、怎么选

目标	从这里开始	适合回答的问题
需要一个干净参照	Baseline	HyFormer 原始路线在当前 runtime 下的最低复杂度表现。
想看增强版训练配置	Baseline+	数据增强、OPT cache、Muon 和 accelerator backend 对同类结构的影响。
想做用户-物品交互	InterFormer	用户上下文、物品候选和序列行为是否应在双分支中交替融合。
想做统一 Transformer	OneTrans	序列 token 与非序列 token 进入同一 causal 主干后，逐层压缩是否有效。
想试 TokenFormer	TokenFormer	BFTS 分层注意力和 NLIR 门控能否缓解统一 token 流里的序列坍塌传播。
想试 UniRec 融合	UniRec	MoT、target-aware interest、Hybrid SiLU attention 和 block residual 的组合贡献。
想试分布感知统一流	Symbiosis	缺失、风险、序列 memory、metadata mask 和 candidate readout 如何服务线上泛化。
想试高有效秩表征	RankUp	随机稀疏重组、多 embedding、global token 和 effective-rank 诊断能否避免深层低秩化。
想知道线上机器	Host Device Info	线上 CPU/GPU/CUDA/Python/网络/依赖源到底是什么状态。
想看线上数据分布	Online Dataset EDA	train 和 infer 数据的 schema、缺失率、基数、序列长度、dense 分布是否漂移。

二、模型谱系

当前模型实验大致分为四类。

参照与增强。 Baseline 和 Baseline+ 共享 HyFormer 问题设定。Baseline 用最少默认增强保留干净参照；Baseline+ 把 cache、轻量增强、Muon 和 backend 选项打开，用来观察工程配置带来的真实性能变化。

异构交互。 InterFormer 仍把非序列上下文和序列上下文视作不同类型的信息流，只是在 block 内加强两者交互。它适合做“分支结构是否比全量拼接更稳”的对照。

统一 token 流。 OneTrans、TokenFormer、Symbiosis 和 UniRec 都把多域特征与行为序列放到更统一的 token 空间。它们的差别在于如何控制长序列计算、如何处理静态特征与序列的互相污染，以及 readout 是否围绕候选物品展开。

表示容量与诊断。 RankUp 不主要追求新的交互范式，而是把问题放在深层表征是否低秩坍塌上。它适合和 TokenFormer/Symbiosis 配合观察 effective rank、AUC 与稳定性之间的关系。

三、统一运行方式

模型实验本地训练：

bash run.sh train \
  --experiment experiments/baseline \
  --run-dir outputs/baseline_smoke

评估同一个 run 目录：

bash run.sh val \
  --experiment experiments/baseline \
  --run-dir outputs/baseline_smoke

推理需要 checkpoint 和结果目录：

bash run.sh infer \
  --experiment experiments/baseline \
  --checkpoint outputs/baseline_smoke \
  --result-dir outputs/baseline_infer

线上上传物由独立打包命令生成：

uv run taac-package-train --experiment experiments/baseline --output-dir outputs/bundles/baseline_training
uv run taac-package-infer --experiment experiments/baseline --output-dir outputs/bundles/baseline_inference

维护类实验也复用 run.sh train 入口，但不一定支持推理 bundle。host_device_info 不需要数据集；online_dataset_eda 需要平台或本地显式提供 parquet/schema。

四、包结构契约

普通 PCVR 模型实验通常只有两个必需文件：

experiments/<name>/
├── __init__.py
└── model.py

__init__.py 声明 EXPERIMENT、实验名、模型类、默认训练配置和必要 hooks。model.py 实现模型类，至少满足：

forward(inputs) 返回 (B,) 或 (B, action_num) logits。
predict(inputs) 返回 (logits, embeddings)。
num_ns 能表达非序列 token 数，供 runtime 日志和契约测试使用。
sparse embedding 参数能通过 EmbeddingParameterMixin 与 dense 参数分组。
checkpoint sidecar 中的 schema.json 和 train_config.json 能重建模型。

维护工具包更轻：

experiments/<tool>/
├── __init__.py
└── runner.py

它们导出 ExperimentSpec，可以没有模型类、checkpoint sidecar 或预测 hooks。

五、改实验时先看哪里

实验入口：experiments/<name>/__init__.py
模型实现：experiments/<name>/model.py
实验发现与装载：src/taac2026/application/experiments/
模型输入契约：src/taac2026/infrastructure/modeling/model_contract.py
新增实验流程：新增实验包
测试选择：测试

不要从 docs/archive/files/... 推断当前契约；那里是历史快照。新增或修改实验后，优先跑实验包 contract tests，再根据是否动到数据、checkpoint、bundle 或 accelerator 扩大验证范围。

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

实验包总览

一、怎么选

二、模型谱系

三、统一运行方式

四、包结构契约

五、改实验时先看哪里

FilesExpand file tree

index.md

Latest commit

History

index.md

File metadata and controls

实验包总览

一、怎么选

二、模型谱系

三、统一运行方式

四、包结构契约

五、改实验时先看哪里