Define the metrics #1

Open

opened

on Jul 16, 2025

What metrics do we collect for each (model * query)?

One quick proposal:

Wall-clock time
Parse succeeded
Number of check failures (use checks as evals)
Output tokens

Metadata

Assignees

No one assigned

Labels

No labels

No labels

Type

No type

Fields

No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests