MarkusNeusinger
diff --git a/‎plots/calibration-curve/implementations/.gitkeep‎ b/‎plots/calibration-curve/implementations/.gitkeep‎
diff --git a/‎plots/calibration-curve/metadata/.gitkeep‎ b/‎plots/calibration-curve/metadata/.gitkeep‎
diff --git a/‎plots/calibration-curve/specification.md‎
Lines changed: 27 additions & 0 deletions b/‎plots/calibration-curve/specification.md‎
Lines changed: 27 additions & 0 deletions
diff --git a/‎plots/calibration-curve/specification.yaml‎
Lines changed: 32 additions & 0 deletions b/‎plots/calibration-curve/specification.yaml‎
Lines changed: 32 additions & 0 deletions
@@ -0,0 +1,27 @@
+# calibration-curve: Calibration Curve
+
+## Description
+
+A calibration curve (reliability diagram) visualizes how well the predicted probabilities of a binary classifier match actual outcomes. By plotting the fraction of positives against mean predicted probability in binned intervals, it reveals whether a model is well-calibrated, overconfident, or underconfident. A perfectly calibrated model follows the diagonal line where predicted probability equals observed frequency.
+
+## Applications
+
+- Evaluating probability predictions in credit scoring models where accurate risk estimates determine loan pricing
+- Assessing diagnostic confidence in medical screening systems where probability calibration affects treatment decisions
+- Comparing calibration across multiple classifiers to select models that produce reliable probability estimates
+- Validating risk assessment models in insurance and fraud detection where miscalibrated probabilities lead to financial losses
+
+## Data
+
+- `y_true` (binary array) - Ground truth binary labels (0 or 1)
+- `y_prob` (numeric array) - Predicted probabilities from classifier (0 to 1)
+- Size: 500-10000 samples recommended for reliable binning
+- Example: Binary classification predictions from sklearn classifier with `predict_proba()` output
+
+## Notes
+
+- Include a diagonal reference line representing perfect calibration (predicted probability = observed frequency)
+- Use 10 bins by default, with bin edges at equal probability intervals (0.0-0.1, 0.1-0.2, etc.)
+- Display Brier score or Expected Calibration Error (ECE) as a summary metric
+- Optional: include histogram of predicted probabilities as a secondary subplot to show prediction distribution
+- For multiple models comparison, use distinct colors with clear legend
@@ -0,0 +1,32 @@
+# Specification-level metadata for calibration-curve
+# Auto-synced to PostgreSQL on push to main
+
+spec_id: calibration-curve
+title: Calibration Curve
+
+# Specification tracking
+created: 2025-12-26T19:28:20Z
+updated: null
+issue: 2331
+suggested: MarkusNeusinger
+
+# Classification tags (applies to all library implementations)
+# See docs/concepts/tagging-system.md for detailed guidelines
+tags:
+  plot_type:
+    - calibration
+    - line
+    - reliability-diagram
+  data_type:
+    - numeric
+    - probability
+    - binary
+  domain:
+    - statistics
+    - machine-learning
+    - finance
+    - healthcare
+  features:
+    - basic
+    - model-evaluation
+    - reference-line