Skip to content

Commit f9860e6

Browse files
committed
rst
1 parent 0b54bc2 commit f9860e6

File tree

4 files changed

+27
-11
lines changed

4 files changed

+27
-11
lines changed

_doc/articles/2025/2025-03-01-route2025.rst

Lines changed: 1 addition & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -131,7 +131,7 @@ Séance 4 (21/2)
131131

132132
**Prétraitement**
133133

134-
* Dates, Catégories : :epkg:`category_encoders`, `skrub <https://skrub-data.org/stable/>`_,
134+
* Dates, Catégories : :epkg:`category_encoders`, :epkg:`skrub`,
135135
:ref:`Prétraitement des catégories <nbl-practice-ml-pretraitement_cat>`
136136
* Son : :epkg:`librosa`, voir :ref:`Prétraitement du son <nbl-practice-ml-pretraitement_son>`
137137
* Image : :epkg:`scikit-image`, voir :ref:`Prétraitement d'une image <nbl-practice-ml-pretraitement_image>`

_doc/articles/2025/2025-04-01-route2025.rst

Lines changed: 21 additions & 10 deletions
Original file line numberDiff line numberDiff line change
@@ -124,30 +124,33 @@ Journée 3 (3/3)
124124

125125
**Partie 1**
126126

127-
* retour sur la syntaxe du langage python, boucle, test, fonctions et classes
127+
* retour sur la syntaxe du langage python, boucle, test, fonctions et classes,
128+
:ref:`Tracer une pyramide bigarrée <nbl-practice-tds-base-pyramide_bigarree>`
128129
* exceptions
129-
* expressions régulières
130-
* pickle, fichiers pickle
131-
* tests unitaires
130+
* :ref:`l-regex`, :ref:`Expressions régulières <nbl-practice-py-base-exercice_regex>`
131+
* :mod:`pickle`, fichiers pickle (voir :ref:`chap_serialization`)
132+
* :ref:`Tests unitaires <nbl-practice-py-base-tests_unitaires>`
132133
* récupération des fichiers préparés pour la formation avec pandas
133-
* utilisation de skrub pour avoir un premier aperçu
134+
* utilisation de `:epkg:`skrub` pour avoir un premier aperçu ou
135+
:epkg:`pandas-profiling`, :epkg:`orange3`
134136

135137
**Partie 2**
136138

137139
* rappel pandas: group by, jointure, inner, outer, left, right, pivot
138-
* gestion des doublons
140+
* gestion des doublons avec :meth:`pandas.DataFrame.duplicated`
139141
* une fois la base complète obtenue, analyse de nouveau
140-
* même opérations en SQL
141-
* identification des valeurs aberrantes
142-
* valeurs manquantes, remplacement simple (moyenne), corrélations (KNNImputer)
142+
* mêmes opérations en SQL, :func:`pandas.read_sql`, :meth:`pandas.DataFrame.to_sql`
143+
* identification des valeurs aberrantes, voir :meth:`pandas.DataFrame.quantile`
144+
* valeurs manquantes, remplacement simple (moyenne),
145+
corrélations (:class:`sklearn.impute.KNNImputer`), prédictions
143146
* premières impressions
144147

145148
Journée 4 (4/3)
146149
===============
147150

148151
**Partie 1**
149152

150-
* retour sur les graphes matplotlib, seaborn, plotly, skrub
153+
* retour sur les graphes matplotlib, seaborn, plotly, :epkg:`skrub`
151154
* cartographie, cartopy, folium encore
152155
* corrélations, pairplots
153156
* gestion des dates
@@ -162,3 +165,11 @@ Journée 4 (4/3)
162165
* découpage d'une base en deux, apprentissage, respecter le temps et les identifiants
163166
* calcul du prix d'un contrat d'assurance pour un an en fonction de
164167
variables choisies
168+
169+
**Prétraitements simples**
170+
171+
* Dates, Catégories : :epkg:`category_encoders`, :epkg:`skrub`,
172+
:ref:`Prétraitement des catégories <nbl-practice-ml-pretraitement_cat>`
173+
* Son : :epkg:`librosa`, voir :ref:`Prétraitement du son <nbl-practice-ml-pretraitement_son>`
174+
* Image : :epkg:`scikit-image`, voir :ref:`Prétraitement d'une image <nbl-practice-ml-pretraitement_image>`
175+
* Texte : :ref:`Prétraitement du texte <nbl-practice-ml-pretraitement_texte>`

_doc/conf.py

Lines changed: 3 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -252,6 +252,7 @@
252252
),
253253
"OneHotEncoder": "https://scikit-learn.org/stable/modules/generated/sklearn.preprocessing.OneHotEncoder.html",
254254
"OpenMP": "https://www.openmp.org/",
255+
"orange3": "https://orangedatamining.com/",
255256
"pandas": (
256257
"https://pandas.pydata.org/pandas-docs/stable/",
257258
("https://pandas.pydata.org/pandas-docs/stable/generated/pandas.{0}.html", 1),
@@ -260,6 +261,7 @@
260261
2,
261262
),
262263
),
264+
"pandas-profiling": "https://docs.profiling.ydata.ai/latest/",
263265
"PiecewiseTreeRegressor": "https://sdpython.github.io/doc/mlinsights/dev/api/mlmodel_tree.html#piecewisetreeregressor",
264266
"Pillow": "https://pillow.readthedocs.io/en/stable/",
265267
"pip": "https://pip.pypa.io/en/stable/",
@@ -290,6 +292,7 @@
290292
"sérialisation": "https://fr.wikipedia.org/wiki/S%C3%A9rialisation",
291293
"sklearn": "https://scikit-learn.org/stable/index.html",
292294
"sklearn-onnx": "https://onnx.ai/sklearn-onnx/",
295+
"skrub": "https://skrub-data.org/stable/",
293296
"statsmodels": "http://www.statsmodels.org/stable/index.html",
294297
"SVD": "https://fr.wikipedia.org/wiki/D%C3%A9composition_en_valeurs_singuli%C3%A8res",
295298
"sys.modules": "https://docs.python.org/3/library/sys.html?highlight=modules#sys.modules",

requirements-dev.txt

Lines changed: 2 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -24,6 +24,7 @@ nbsphinx
2424
networkx
2525
openpyxl
2626
pandas
27+
pandas-profiling
2728
patsy
2829
pillow
2930
protobuf<4
@@ -48,3 +49,4 @@ transformers
4849
ujson
4950
xgboost
5051
wheel
52+
ydata-profiling

0 commit comments

Comments
 (0)