Skip to content

Commit 8a52180

Browse files
committed
split cit
1 parent df6447a commit 8a52180

File tree

5 files changed

+154
-27
lines changed

5 files changed

+154
-27
lines changed

.github/workflows/ci-example.yml

Lines changed: 47 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,47 @@
1+
name: ci
2+
3+
on:
4+
push:
5+
pull_request:
6+
types:
7+
- closed
8+
branches:
9+
- main
10+
11+
jobs:
12+
run:
13+
name: ci ${{ matrix.os }}-${{ matrix.python }}
14+
runs-on: ${{ matrix.os }}
15+
strategy:
16+
matrix:
17+
os: [ubuntu-latest]
18+
python: ['3.12']
19+
steps:
20+
- uses: actions/checkout@v3
21+
22+
- uses: actions/setup-python@v4
23+
with:
24+
python-version: ${{ matrix.python }}
25+
26+
- name: Install requirements
27+
run: python -m pip install -r requirements.txt
28+
29+
- name: Install requirements dev
30+
run: python -m pip install -r requirements-dev.txt
31+
32+
- name: Cache pip
33+
uses: actions/cache@v4
34+
with:
35+
path: ~/.cache/pip
36+
key: ${{ runner.os }}-pip-${{ hashFiles('requirements-dev.txt') }}
37+
restore-keys: |
38+
${{ runner.os }}-pip-
39+
${{ runner.os }}-
40+
41+
- name: pip freeze
42+
run: python -m pip freeze
43+
44+
- name: run tests examples
45+
run: |
46+
pip install pytest
47+
PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests/ut_xrun_doc/test_documentation_examples.py -v

.github/workflows/ci-notebook.yml

Lines changed: 47 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,47 @@
1+
name: ci
2+
3+
on:
4+
push:
5+
pull_request:
6+
types:
7+
- closed
8+
branches:
9+
- main
10+
11+
jobs:
12+
run:
13+
name: ci ${{ matrix.os }}-${{ matrix.python }}
14+
runs-on: ${{ matrix.os }}
15+
strategy:
16+
matrix:
17+
os: [ubuntu-latest]
18+
python: ['3.12']
19+
steps:
20+
- uses: actions/checkout@v3
21+
22+
- uses: actions/setup-python@v4
23+
with:
24+
python-version: ${{ matrix.python }}
25+
26+
- name: Install requirements
27+
run: python -m pip install -r requirements.txt
28+
29+
- name: Install requirements dev
30+
run: python -m pip install -r requirements-dev.txt
31+
32+
- name: Cache pip
33+
uses: actions/cache@v4
34+
with:
35+
path: ~/.cache/pip
36+
key: ${{ runner.os }}-pip-${{ hashFiles('requirements-dev.txt') }}
37+
restore-keys: |
38+
${{ runner.os }}-pip-
39+
${{ runner.os }}-
40+
41+
- name: pip freeze
42+
run: python -m pip freeze
43+
44+
- name: run tests notebooks
45+
run: |
46+
pip install pytest
47+
PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests/ut_xrun_doc/test_documentation_notebook.py -v

.github/workflows/ci.yml

Lines changed: 1 addition & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -10,7 +10,7 @@ on:
1010

1111
jobs:
1212
run:
13-
name: to-${{ matrix.torch }}-tr-${{ matrix.transformers }}-ci ${{ matrix.os }}-${{ matrix.python }}
13+
name: ci ${{ matrix.os }}-${{ matrix.python }}
1414
runs-on: ${{ matrix.os }}
1515
strategy:
1616
matrix:
@@ -45,9 +45,3 @@ jobs:
4545
run: |
4646
pip install pytest
4747
PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests --ignore-glob=**pygame*.py --ignore _unittests/ut_xrun_doc/test_documentation_examples.py --ignore _unittests/ut_xrun_doc/test_documentation_notebook.py
48-
49-
- name: run tests examples
50-
run: PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests/ut_xrun_doc/test_documentation_examples.py -v
51-
52-
- name: run tests notebooks
53-
run: PYTHONPATH=. UNITTEST_GOING=1 pytest --durations=10 _unittests/ut_xrun_doc/test_documentation_notebook.py -v

_doc/articles/2026/2026-03-15-route2026-ml.rst

Lines changed: 47 additions & 20 deletions
Original file line numberDiff line numberDiff line change
@@ -9,25 +9,9 @@ site web : `sdpython.github.io <https://sdpython.github.io/>`_
99
`Apprendre la programmation avec Python
1010
<https://sdpython.github.io/doc/teachpyx/dev/>`_
1111

12-
Quelques jeux de données :
12+
Autres sites :
1313

14-
* `Parcoursup 2025 - vœux de poursuite d'études et de réorientation dans l'enseignement supérieur et réponses des établissements
15-
<https://www.data.gouv.fr/datasets/parcoursup-2025-voeux-de-poursuite-detudes-et-de-reorientation-dans-lenseignement-superieur-et-reponses-des-etablissements>`_
16-
* `Patrimoine immobilier des opérateurs de l’Enseignement supérieur
17-
<https://www.data.gouv.fr/datasets/patrimoine-immobilier-des-operateurs-de-lenseignement-superieur>`_
18-
* `Prix des carburants en France - Flux quotidien
19-
<https://www.data.gouv.fr/datasets/prix-des-carburants-en-france-flux-quotidien-1>`_
20-
* `Prix des carburants en France - Flux instantané - v2
21-
<https://www.data.gouv.fr/datasets/prix-des-carburants-en-france-flux-instantane-v2-amelioree>`_
22-
* `Séries sur les surfaces, rendements, production céréales
23-
<https://visionet.franceagrimer.fr/Pages/SeriesChronologiques.aspx?menuurl=SeriesChronologiques/productions%20vegetales/grandes%20cultures/surfaces,productions,rendements>`_
24-
* `Effectifs d'étudiants inscrits dans les établissements et les formations de l'enseignement supérieur - détail par établissements
25-
<https://www.data.gouv.fr/datasets/effectifs-detudiants-inscrits-dans-les-etablissements-et-les-formations-de-lenseignement-superieur-detail-par-etablissements>`_
26-
* `Résultats du contrôle sanitaire de l'eau distribuée commune par commune
27-
<https://www.data.gouv.fr/datasets/resultats-du-controle-sanitaire-de-leau-distribuee-commune-par-commune>`_
28-
* `Résultats du contrôle sanitaire de l'eau du robinet <https://www.data.gouv.fr/datasets/resultats-du-controle-sanitaire-de-leau-du-robinet>`_
29-
* `Données climatologiques de base - horaires <https://www.data.gouv.fr/datasets/donnees-climatologiques-de-base-horaires>`_
30-
* `Données climatologiques de base - mensuelles <https://www.data.gouv.fr/datasets/donnees-climatologiques-de-base-mensuelles>`_
14+
* Python pour la data science <https://pythonds.linogaliana.fr/>`_ (Lino Galiana - ENSAE)
3115

3216
Fonctions utiles:
3317

@@ -36,9 +20,30 @@ Fonctions utiles:
3620
Séance 1 (6/2)
3721
==============
3822

23+
* rappels sur la régression, classification, clustering, ACP, prétraitements
24+
* train test, validation croisée
25+
* rappels sur l'apprentissage d'un arbre de régression
26+
27+
*présentation de modules*
28+
29+
* données : :epkg:`pandas`
30+
* graphes : :epkg:`matplotlib`, :epkg:`seaborn`, :epkg:`bokeh`, :epkg:`altair`
31+
* cartes : :epkg:`geopandas`, :epkg:`folium`
32+
* machine learning : :epkg:`scikit-learn`, :epkg:`skrub`, :epkg:`skore`, :epkg:`imbalanced-learn`, :epkg:`hazardous`, :epkg:`fairlearn`,
33+
:epkg:`xgboost`, :epkg:`lightgbm`, :epkg:`catboost`
34+
* deep learning : :epkg:`pytorch`, :epkg:`transformers`, :epkg:`diffusers` et aussi :epkg:`HuggingFace Hub`
35+
36+
*demain*
37+
38+
* utilisation de ChatGPT, Gemini (et autres...), retour d'expérience
39+
* et ensuite...
40+
3941
Séance 2 (13/2)
4042
===============
4143

44+
* tests unitaires
45+
* pipelines : pourquoi en faire
46+
4247
Séance 3 (27/2)
4348
===============
4449

@@ -54,7 +59,29 @@ Séance 6 (20/3)
5459
Evaluation
5560
==========
5661

57-
* https://defis.data.gouv.fr/
62+
* `https://defis.data.gouv.fr/ <https://defis.data.gouv.fr/>`_
5863
* le projet doit inclure au moins un graphe
5964
*Partial Dependence* ou *Permutation Importance* (voir liens ci-dessus)
60-
* soutenance 11 avril 9h-13h
65+
* soutenance ?
66+
67+
Quelques jeux de données
68+
========================
69+
70+
* `Parcoursup 2025 - vœux de poursuite d'études et de réorientation dans l'enseignement supérieur et réponses des établissements
71+
<https://www.data.gouv.fr/datasets/parcoursup-2025-voeux-de-poursuite-detudes-et-de-reorientation-dans-lenseignement-superieur-et-reponses-des-etablissements>`_
72+
* `Patrimoine immobilier des opérateurs de l’Enseignement supérieur
73+
<https://www.data.gouv.fr/datasets/patrimoine-immobilier-des-operateurs-de-lenseignement-superieur>`_
74+
* `Prix des carburants en France - Flux quotidien
75+
<https://www.data.gouv.fr/datasets/prix-des-carburants-en-france-flux-quotidien-1>`_
76+
* `Prix des carburants en France - Flux instantané - v2
77+
<https://www.data.gouv.fr/datasets/prix-des-carburants-en-france-flux-instantane-v2-amelioree>`_
78+
* `Séries sur les surfaces, rendements, production céréales
79+
<https://visionet.franceagrimer.fr/Pages/SeriesChronologiques.aspx?menuurl=SeriesChronologiques/productions%20vegetales/grandes%20cultures/surfaces,productions,rendements>`_
80+
* `Effectifs d'étudiants inscrits dans les établissements et les formations de l'enseignement supérieur - détail par établissements
81+
<https://www.data.gouv.fr/datasets/effectifs-detudiants-inscrits-dans-les-etablissements-et-les-formations-de-lenseignement-superieur-detail-par-etablissements>`_
82+
* `Résultats du contrôle sanitaire de l'eau distribuée commune par commune
83+
<https://www.data.gouv.fr/datasets/resultats-du-controle-sanitaire-de-leau-distribuee-commune-par-commune>`_
84+
* `Résultats du contrôle sanitaire de l'eau du robinet <https://www.data.gouv.fr/datasets/resultats-du-controle-sanitaire-de-leau-du-robinet>`_
85+
* `Données climatologiques de base - horaires <https://www.data.gouv.fr/datasets/donnees-climatologiques-de-base-horaires>`_
86+
* `Données climatologiques de base - mensuelles <https://www.data.gouv.fr/datasets/donnees-climatologiques-de-base-mensuelles>`_
87+

_doc/conf.py

Lines changed: 12 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -189,6 +189,7 @@ def linkcode_resolve(domain, info):
189189
"_repr_html_": "https://ipython.readthedocs.io/en/stable/config/integrating.html#custom-methods",
190190
"Algorithme de Strassen": "https://fr.wikipedia.org/wiki/Algorithme_de_Strassen",
191191
"algorithme de Strassen": "https://fr.wikipedia.org/wiki/Algorithme_de_Strassen",
192+
"altair": "https://altair-viz.github.io/",
192193
"ACP": "https://fr.wikipedia.org/wiki/Analyse_en_composantes_principales",
193194
"AESA": "https://tavianator.com/aesa/",
194195
"algorithme": "https://fr.wikipedia.org/wiki/Algorithme",
@@ -206,6 +207,7 @@ def linkcode_resolve(domain, info):
206207
"C++": "https://fr.wikipedia.org/wiki/C%2B%2B",
207208
"cloudpickle": "https://github.com/cloudpipe/cloudpickle",
208209
"Bresenham": "https://fr.wikipedia.org/wiki/Algorithme_de_trac%C3%A9_de_segment_de_Bresenham",
210+
"bokeh": "https://bokeh.org/",
209211
"category_encoders": "https://contrib.scikit-learn.org/category_encoders/",
210212
"copy": "https://docs.python.org/3/library/copy.html?highlight=copy#copy.copy",
211213
"cProfile.Profile": "https://docs.python.org/3/library/profile.html#profile.Profile",
@@ -221,14 +223,18 @@ def linkcode_resolve(domain, info):
221223
"encoding": "https://fr.wikipedia.org/wiki/Codage_des_caract%C3%A8res",
222224
"eval": "https://docs.python.org/3/library/functions.html?highlight=id#eval",
223225
"Excel": "https://fr.wikipedia.org/wiki/Microsoft_Excel",
226+
"fairlearn": "https://fairlearn.org/",
224227
"folium": "https://python-visualization.github.io/folium/latest/",
225228
"format": "https://pyformat.info/",
226229
"format style": "https://pyformat.info/",
227230
"garbage collector": "https://fr.wikipedia.org/wiki/Ramasse-miettes_(informatique)",
231+
"geopandas": "https://geopandas.org/en/",
228232
"Graphviz": "https://graphviz.org/",
233+
"hazardous": "https://soda-inria.github.io/hazardous/",
229234
"Holm-Bonferroni method": "https://en.wikipedia.org/wiki/Holm%E2%80%93Bonferroni_method",
230235
"HTML": "https://fr.wikipedia.org/wiki/Hypertext_Markup_Language",
231236
"ICML 2016": "https://icml.cc/2016/index.html",
237+
"imbalanced-learn": "https://imbalanced-learn.org/",
232238
"indentation": "https://fr.wikipedia.org/wiki/Style_d%27indentation",
233239
"issubclass": "https://docs.python.org/3/library/functions.html?highlight=issubclass#issubclass",
234240
"joblib": "https://joblib.readthedocs.io/en/stable/",
@@ -284,6 +290,7 @@ def linkcode_resolve(domain, info):
284290
"PyPi": "https://pypi.org/",
285291
"python": "https://www.python.org/",
286292
"Python": "https://www.python.org/",
293+
"pytorch": "https://pytorch.org/",
287294
"QuantileLinearRegression": "https://sdpython.github.io/doc/mlinsights/dev/api/mlmodel.html#quantilelinearregression",
288295
"R-tree": "https://en.wikipedia.org/wiki/R-tree",
289296
"R* tree": "https://en.wikipedia.org/wiki/R*_tree",
@@ -296,10 +303,12 @@ def linkcode_resolve(domain, info):
296303
"scikit-learn": "https://scikit-learn.org/stable/index.html",
297304
"scikit-survival": "https://scikit-survival.readthedocs.io/en/stable/index.html",
298305
"scipy": "https://scipy.org/",
306+
"seaborn": "https://seaborn.pydata.org/",
299307
"sérialisation": "https://fr.wikipedia.org/wiki/S%C3%A9rialisation",
300308
"skforecast": "https://skforecast.org/",
301309
"sklearn": "https://scikit-learn.org/stable/index.html",
302310
"sklearn-onnx": "https://onnx.ai/sklearn-onnx/",
311+
"skore": "https://docs.skore.probabl.ai/",
303312
"sktime": "https://www.sktime.net/en/stable/index.html",
304313
"skrub": "https://skrub-data.org/stable/",
305314
"SQLite": "https://www.sqlite.org/",
@@ -405,11 +414,13 @@ def linkcode_resolve(domain, info):
405414
"cartopy": "https://scitools.org.uk/cartopy/docs/latest/",
406415
"catboost": "https://catboost.ai/",
407416
"csv": "https://fr.wikipedia.org/wiki/Comma-separated_values",
417+
"diffusers": "https://github.com/huggingface/diffusers",
408418
"Enedis": "https://data.enedis.fr/",
409419
"fonction": "https://fr.wikipedia.org/wiki/Fonction_(math%C3%A9matiques)",
410420
"fonction continue": "https://fr.wikipedia.org/wiki/Continuit%C3%A9_(math%C3%A9matiques)",
411421
"fortran": "https://en.wikipedia.org/wiki/Fortran",
412422
"GEOFLA": "https://www.data.gouv.fr/en/datasets/geofla-r/",
423+
"HuggingFace Hub": "https://huggingface.co/",
413424
"lightgtbm": "https://lightgbm.readthedocs.io/en/stable/",
414425
"machine learning": "https://en.wikipedia.org/wiki/Machine_learning",
415426
"matrice de confusion": "https://fr.wikipedia.org/wiki/Matrice_de_confusion",
@@ -418,6 +429,7 @@ def linkcode_resolve(domain, info):
418429
"R": "https://www.r-project.org/",
419430
"recherche dichotomique": "https://fr.wikipedia.org/wiki/Recherche_dichotomique",
420431
"seaborn": "https://seaborn.pydata.org/",
432+
"transformers": "https://github.com/huggingface/transformers",
421433
"UCI": "https://archive.ics.uci.edu/datasets",
422434
"variable aléatoire": "https://fr.wikipedia.org/wiki/Variable_al%C3%A9atoire",
423435
"voyageur de commerce": "https://fr.wikipedia.org/wiki/Probl%C3%A8me_du_voyageur_de_commerce",

0 commit comments

Comments
 (0)