OpenSyndrome
diff --git a/‎filter_engine.py‎
Lines changed: 44 additions & 42 deletions b/‎filter_engine.py‎
Lines changed: 44 additions & 42 deletions
diff --git a/‎fake_dataset.csv‎ ‎toy_dataset.csv‎fake_dataset.csv renamed to toy_dataset.csv b/‎fake_dataset.csv‎ ‎toy_dataset.csv‎fake_dataset.csv renamed to toy_dataset.csv
@@ -18,7 +18,7 @@ def _():
 
     import yaml
     from opensyndrome.filter import OSDEngine, load_profile
-    from opensyndrome.artifacts import get_schema_filepath, download_definitions, get_definition_dir
+    from opensyndrome.artifacts import get_definition_dir
 
     return (
         OSDEngine,
@@ -35,13 +35,19 @@ def _():
 
 @app.cell
 def _(go, pl):
-    def plot_cases(_df_filtered, definitions, date_column="date", date_format="%Y-%m-%d %H:%M:%S"):
+    def plot_cases(
+        _df_filtered, definitions, date_column="date", date_format="%Y-%m-%d %H:%M:%S"
+    ):
         _definitions_columns_sum = [
             pl.col(definition).sum().alias(definition) for definition in definitions
         ]
         _agg_df = (
             _df_filtered.with_columns(
-                pl.col(date_column).str.to_datetime(format=date_format, strict=False).cast(pl.Date).dt.truncate("1mo").alias("_month")
+                pl.col(date_column)
+                .str.to_datetime(format=date_format, strict=False)
+                .cast(pl.Date)
+                .dt.truncate("1mo")
+                .alias("_month")
             )
             .group_by("_month")
             .agg(_definitions_columns_sum)
@@ -115,8 +121,8 @@ def _(mo):
 @app.cell
 def _(Path):
     EXAMPLE_DATASETS = {
-        "Fake dataset - generated with ChatGPT": {
-            "csv": Path("fake_dataset.csv"),
+        "Toy dataset": {
+            "csv": Path("toy_dataset.csv"),
             "mapping": Path("mapping.yaml"),
             "date_column": "recording_ts",
         },
@@ -160,11 +166,7 @@ def _(EXAMPLE_DATASETS, data_source, example_picker, pl, sample_file):
             else None
         )
     else:
-        df_selected = (
-            pl.read_csv(sample_file.contents())
-            if sample_file.value
-            else None
-        )
+        df_selected = pl.read_csv(sample_file.contents()) if sample_file.value else None
     return (df_selected,)
 
 
@@ -230,7 +232,11 @@ def _(df_selected, initial_date_column, initial_yaml, mo):
                 "Select the date column separately for the time-series view.\n\n"
                 f"Your dataset columns: `{_cols_hint}`"
             ),
-            mo.hstack([yaml_editor, mo.vstack([date_column_picker, date_format_input])], widths=[3, 1], align="start"),
+            mo.hstack(
+                [yaml_editor, mo.vstack([date_column_picker, date_format_input])],
+                widths=[3, 1],
+                align="start",
+            ),
         ]
     )
     return date_column_picker, date_format_input, yaml_editor
@@ -246,15 +252,23 @@ def _(df_selected, load_profile, mo, yaml, yaml_editor):
         mo.stop(True, mo.callout(mo.md(f"**Invalid YAML:** {_e}"), kind="danger"))
 
     if not _parsed["profiles"][0]["columns"]:
-        mo.stop(True, mo.callout(mo.md(f"You need to map **at least one column**"), kind="danger"))
+        mo.stop(
+            True,
+            mo.callout(mo.md("You need to map **at least one column**"), kind="danger"),
+        )
 
     not_found = []
     for declared_column in _parsed["profiles"][0]["columns"]:
         if declared_column not in df_selected.columns:
             not_found.append(declared_column)
 
     if not_found:
-        mo.stop(True, mo.callout(mo.md(f"**Columns not found:** {', '.join(not_found)}"), kind="danger"))
+        mo.stop(
+            True,
+            mo.callout(
+                mo.md(f"**Columns not found:** {', '.join(not_found)}"), kind="danger"
+            ),
+        )
 
     try:
         _profile_name = _parsed["profiles"][0]["name"]
@@ -285,7 +299,6 @@ def _(get_definition_dir):
 @app.cell
 def _(definition_options, json):
     def load_definition(name: str) -> dict:
-        letter_dir = name[0].lower()
         return json.loads(definition_options[name].read_text())
 
     return (load_definition,)
@@ -316,9 +329,7 @@ def _(
     profile,
 ):
     mo.stop(
-        df_selected is None
-        or df_selected.is_empty()
-        or not definitions_dropdown.value
+        df_selected is None or df_selected.is_empty() or not definitions_dropdown.value
     )
 
     definitions = definitions_dropdown.value
@@ -327,8 +338,7 @@ def _(
     engine = OSDEngine(profile, skip_unresolvable=True)
 
     defs_dict = {
-        name: json.loads(definition_options[name].read_text())
-        for name in definitions
+        name: json.loads(definition_options[name].read_text()) for name in definitions
     }
     df_filtered = engine.label(df_selected, defs_dict)
     return definitions, df_filtered
@@ -340,19 +350,19 @@ def _(definitions, df_filtered, df_selected, mo):
 
     _cards = [
         mo.stat(
-            label="Rows & columns",
+            label="Syndromic Indicators",
+            value=len(definitions),
+            caption=", ".join([definition for definition in definitions]),
+            bordered=True,
+        ),
+        mo.stat(
+            label="Rows",
             value=df_selected.shape[0],
         ),
         mo.stat(
             label="Columns",
             value=df_selected.shape[1],
         ),
-        mo.stat(
-            label="Syndromic Indicators",
-            value=len(definitions),
-            caption=", ".join([definition for definition in definitions]),
-            bordered=True,
-        ),
     ]
 
     _title = "## Data with Open Syndrome Definitions"
@@ -376,7 +386,7 @@ def _(definitions, load_definition, mo):
             mo.md(
                 "This section shows the definitions used to filter the data. You can use them to understand how the data was filtered and what criteria were applied. 🔎"
             ),
-            mo.ui.tabs(
+            mo.accordion(
                 {
                     "JSONs": mo.accordion(
                         {
@@ -429,21 +439,13 @@ def _(
     mo.vstack(
         [
             mo.md("## Time series"),
-            plot_cases(df_filtered, definitions, date_column=date_column, date_format=date_format_input.value),
-            *diagnosis_chart
-        ]
-    )
-    return
-
-
-@app.cell
-def _(definitions, df_filtered, df_selected, mo):
-    mo.stop(df_selected is None or definitions is None or df_filtered is None)
-
-    mo.vstack(
-        [
-            mo.md("### **Data**"),
-            mo.ui.dataframe(df_selected),
+            plot_cases(
+                df_filtered,
+                definitions,
+                date_column=date_column,
+                date_format=date_format_input.value,
+            ),
+            *diagnosis_chart,
         ]
     )
     return