Skip to content

BIRD-dev测试的prompt疑问 #225

@kero-ly

Description

@kero-ly

你好,我看到最近官方更新了Claude Opus 4.6在BIRD-dev上的测试分数,我想复现一下结果,最好使用的prompt跟官方测试时保持一致。

我在github仓库里找到了一个https://github.com/AlibabaResearch/DAMO-ConvAI/blob/main/bird/llm/src/gpt_request.py

他是官方使用的测试prompt吗?但感觉有点久远了(3年前),请问官方可以给我一个参考看看测试prompt是怎么写的吗?非常感谢 😀

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Milestone

    No milestone

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions