@@ -124,30 +124,33 @@ Journée 3 (3/3)
124124
125125**Partie 1 **
126126
127- * retour sur la syntaxe du langage python, boucle, test, fonctions et classes
127+ * retour sur la syntaxe du langage python, boucle, test, fonctions et classes,
128+ :ref: `Tracer une pyramide bigarrée <nbl-practice-tds-base-pyramide_bigarree >`
128129* exceptions
129- * expressions régulières
130- * pickle, fichiers pickle
131- * tests unitaires
130+ * :ref: ` l-regex `, :ref: ` Expressions régulières < nbl-practice-py-base-exercice_regex >`
131+ * :mod: ` pickle ` , fichiers pickle (voir :ref: ` chap_serialization `)
132+ * :ref: ` Tests unitaires < nbl-practice-py-base-tests_unitaires >`
132133* récupération des fichiers préparés pour la formation avec pandas
133- * utilisation de skrub pour avoir un premier aperçu
134+ * utilisation de `:epkg: `skrub ` pour avoir un premier aperçu ou
135+ :epkg: `pandas-profiling `, :epkg: `orange3 `
134136
135137**Partie 2 **
136138
137139* rappel pandas: group by, jointure, inner, outer, left, right, pivot
138- * gestion des doublons
140+ * gestion des doublons avec :meth: ` pandas.DataFrame.duplicated `
139141* une fois la base complète obtenue, analyse de nouveau
140- * même opérations en SQL
141- * identification des valeurs aberrantes
142- * valeurs manquantes, remplacement simple (moyenne), corrélations (KNNImputer)
142+ * mêmes opérations en SQL, :func: `pandas.read_sql `, :meth: `pandas.DataFrame.to_sql `
143+ * identification des valeurs aberrantes, voir :meth: `pandas.DataFrame.quantile `
144+ * valeurs manquantes, remplacement simple (moyenne),
145+ corrélations (:class: `sklearn.impute.KNNImputer `), prédictions
143146* premières impressions
144147
145148Journée 4 (4/3)
146149===============
147150
148151**Partie 1 **
149152
150- * retour sur les graphes matplotlib, seaborn, plotly, skrub
153+ * retour sur les graphes matplotlib, seaborn, plotly, :epkg: ` skrub `
151154* cartographie, cartopy, folium encore
152155* corrélations, pairplots
153156* gestion des dates
@@ -162,3 +165,11 @@ Journée 4 (4/3)
162165* découpage d'une base en deux, apprentissage, respecter le temps et les identifiants
163166* calcul du prix d'un contrat d'assurance pour un an en fonction de
164167 variables choisies
168+
169+ **Prétraitements simples **
170+
171+ * Dates, Catégories : :epkg: `category_encoders `, :epkg: `skrub `,
172+ :ref: `Prétraitement des catégories <nbl-practice-ml-pretraitement_cat >`
173+ * Son : :epkg: `librosa `, voir :ref: `Prétraitement du son <nbl-practice-ml-pretraitement_son >`
174+ * Image : :epkg: `scikit-image `, voir :ref: `Prétraitement d'une image <nbl-practice-ml-pretraitement_image >`
175+ * Texte : :ref: `Prétraitement du texte <nbl-practice-ml-pretraitement_texte >`
0 commit comments