harness-python-react/.github/ISSUE_TEMPLATE/eval-regression.md at bfd19c74adf7498cb2675e73a4d12264b82463c8 · constk/harness-python-react

name

Eval regression

about

A golden-dataset question that used to pass now fails (often auto-filed by eval-nightly).

title

eval: regression on [case_id]

labels

bug

test

Case

uv run pytest eval/test_golden_qa.py -k "<case_id>" -v