@@ -73,7 +73,7 @@ published figures without manual intervention.
7373┌─────────────────────────────────────────────────────────────┐
7474│ DATA PIPELINE │
7575│ │
76- │ data.gouv.fr ──► load_data() ──► detect_columns() │
76+ │ data.gouv.fr ──► load_data() ──► detect_columns() │
7777│ │ │
7878│ ┌────────▼────────┐ │
7979│ │ Preprocessing │ │
@@ -84,7 +84,7 @@ published figures without manual intervention.
8484└─────────────────────────────────────────┼───────────────────┘
8585 │
8686┌─────────────────────────────────────────▼───────────────────┐
87- │ FEATURE ENGINEERING │
87+ │ FEATURE ENGINEERING │
8888│ │
8989│ · Cyclic temporal features (year_sin, year_cos) │
9090│ · Trend normalisation (year_trend) │
@@ -95,25 +95,25 @@ published figures without manual intervention.
9595└─────────────────────────────────────────┬───────────────────┘
9696 │
9797┌─────────────────────────────────────────▼───────────────────┐
98- │ MODELLING LAYER │
98+ │ MODELLING LAYER │
9999│ │
100100│ ┌───────────────────┐ ┌───────────────────────────┐ │
101101│ │ Train set │ │ Test set (held out) │ │
102102│ │ 2016 → 2023 │─────►│ 2024–2025 │ │
103103│ └─────────┬─────────┘ └───────────────────────────┘ │
104- │ │ │
104+ │ │ │
105105│ ┌─────────▼──────────────────────────────────────────┐ │
106106│ │ Gradient Boosting · XGBoost · Random Forest │ │
107107│ │ Ridge · LightGBM · Prophet · Holt-Winters │ │
108108│ └─────────────────────────┬──────────────────────────┘ │
109- │ │ │
110- │ TimeSeriesSplit cross-validation (n=3) │
111- │ MLflow experiment tracking (12 runs) │
109+ │ │ │
110+ │ TimeSeriesSplit cross-validation (n=3) │
111+ │ MLflow experiment tracking (12 runs) │
112112│ → Champion: Gradient Boosting (R²=0.979) │
113113└─────────────────────────────────────────┬───────────────────┘
114114 │
115115┌─────────────────────────────────────────▼───────────────────┐
116- │ SERVING LAYER │
116+ │ SERVING LAYER │
117117│ │
118118│ ┌────────────────────────┐ ┌────────────────────────┐ │
119119│ │ Streamlit Dashboard │ │ FastAPI REST API │ │
@@ -336,6 +336,12 @@ Data: [Licence Ouverte v2.0](https://www.etalab.gouv.fr/licence-ouverte-open-lic
336336
337337Code: MIT
338338
339+ ---
340+ ## Author
341+ Frédéric Tellier
342+ [ LinkedIn] ( [url](https://www.linkedin.com/in/fr%C3%A9d%C3%A9ric-tellier-8a9170283/) ) / [ Portfolio] ( [url](https://github.com/Dreipfelt) )
343+ Data Scientist wanabee
344+
339345---
340346
341347* CDSD Certification Project — Data Science Designer & Developer (RNCP35288)*
0 commit comments