语言 / Language: 中文 | English
这个目录保存 PCBench-LLM-Distilled ground-truth 数据, DictOnly 版本。
主数据目录,按 library / api@version_range / sample 的层级组织。
当前统计:
- 29 个库目录
- 284 个 JSON 文件
每个 JSON 文件都是一个数组,数组中的每个元素是一个修复字典:
[
{
"(param, idx)": { "...": "..." }
}
]这个数据集适合只关心修复内容本身的场景。
对比规则:
- 直接按 JSON 数组顺序逐项比较
- 第
i个元素对应第i个元素
也就是说,这个目录中的 ground truth 默认采用“按顺序比较”的方式。
multi_entry_files.txt记录了 8 个包含多个修复条目的样例,以及每个样例对应的条目数量。Semantic-Related-contains_delete_or_rename.json记录语义相关样例中命中delete或rename的统计与文件清单,可用于后续分组分析。
本期望结果中,包含aiohttp.ClientSession@1.3.5-2.0.0,其中的这条表示变更为新增关键字参数,由于该参数默认值会发生变化,使用者要自行修复。
"(json_serialize, 7)": {
"addKey": "json_serialize=<functiondumpsat0x7af4f31667b8>"
},