attempt to fix lint

ShreyeshArangath · ShreyeshArangath · commit afe8df8ae59f · 2026-04-03T14:45:57.000-07:00
diff --git a/crates/core/src/dataframe.rs b/crates/core/src/dataframe.rs
@@ -41,6 +41,11 @@ use datafusion::execution::context::TaskContext;
 use datafusion::logical_expr::SortExpr;
 use datafusion::logical_expr::dml::InsertOp;
 use datafusion::parquet::basic::{BrotliLevel, Compression, GzipLevel, ZstdLevel};
+use datafusion::physical_plan::{
+    ExecutionPlan as DFExecutionPlan, collect as df_collect,
+    collect_partitioned as df_collect_partitioned, execute_stream as df_execute_stream,
+    execute_stream_partitioned as df_execute_stream_partitioned,
+};
 use datafusion::prelude::*;
 use datafusion_python_util::{is_ipython_env, spawn_future, wait_for_future};
 use futures::{StreamExt, TryStreamExt};
@@ -52,13 +57,6 @@ use pyo3::pybacked::PyBackedStr;
 use pyo3::types::{PyCapsule, PyList, PyTuple, PyTupleMethods};
 
 use crate::common::data_type::PyScalarValue;
-use datafusion::physical_plan::{
-    ExecutionPlan as DFExecutionPlan,
-    collect as df_collect,
-    collect_partitioned as df_collect_partitioned,
-    execute_stream as df_execute_stream,
-    execute_stream_partitioned as df_execute_stream_partitioned,
-};
 use crate::errors::{PyDataFusionError, PyDataFusionResult, py_datafusion_err};
 use crate::expr::PyExpr;
 use crate::expr::sort_expr::{PySortExpr, to_sort_expressions};
@@ -672,8 +670,8 @@ impl PyDataFrame {
     /// guarantee of the order of the result.
     fn collect<'py>(&self, py: Python<'py>) -> PyResult<Vec<Bound<'py, PyAny>>> {
         let (plan, task_ctx) = self.create_and_cache_plan(py)?;
-        let batches = wait_for_future(py, df_collect(plan, task_ctx))?
-            .map_err(PyDataFusionError::from)?;
+        let batches =
+            wait_for_future(py, df_collect(plan, task_ctx))?.map_err(PyDataFusionError::from)?;
         // cannot use PyResult<Vec<RecordBatch>> return type due to
         // https://github.com/PyO3/pyo3/issues/1813
         batches.into_iter().map(|rb| rb.to_pyarrow(py)).collect()
@@ -1187,9 +1185,10 @@ impl PyDataFrame {
 
     fn execute_stream_partitioned(&self, py: Python) -> PyResult<Vec<PyRecordBatchStream>> {
         let (plan, task_ctx) = self.create_and_cache_plan(py)?;
-        let streams = spawn_future(py, async move {
-            df_execute_stream_partitioned(plan, task_ctx)
-        })?;
+        let streams = spawn_future(
+            py,
+            async move { df_execute_stream_partitioned(plan, task_ctx) },
+        )?;
         Ok(streams.into_iter().map(PyRecordBatchStream::new).collect())
     }
 
diff --git a/crates/core/src/metrics.rs b/crates/core/src/metrics.rs
@@ -18,7 +18,7 @@
 use std::collections::HashMap;
 use std::sync::Arc;
 
-use datafusion::physical_plan::metrics::{MetricValue, MetricsSet, Metric, Timestamp};
+use datafusion::physical_plan::metrics::{Metric, MetricValue, MetricsSet, Timestamp};
 use pyo3::prelude::*;
 
 #[pyclass(frozen, name = "MetricsSet", module = "datafusion")]
diff --git a/python/tests/test_plans.py b/python/tests/test_plans.py
@@ -92,7 +92,7 @@ def test_metric_properties() -> None:
             assert len(metric.name) > 0
             assert metric.partition is None or isinstance(metric.partition, int)
             assert metric.value is None or isinstance(
-                metric.value, (int, datetime.datetime)
+                metric.value, int | datetime.datetime
             )
             assert isinstance(metric.labels(), dict)
             mr = repr(metric)
@@ -136,9 +136,7 @@ def test_collect_partitioned_metrics() -> None:
     plan = df.execution_plan()
 
     output_rows_values = [
-        ms.output_rows
-        for _, ms in plan.collect_metrics()
-        if ms.output_rows is not None
+        ms.output_rows for _, ms in plan.collect_metrics() if ms.output_rows is not None
     ]
     assert 2 in output_rows_values, f"Expected 2 in {output_rows_values}"
 
@@ -153,9 +151,7 @@ def test_execute_stream_metrics() -> None:
 
     plan = df.execution_plan()
     output_rows_values = [
-        ms.output_rows
-        for _, ms in plan.collect_metrics()
-        if ms.output_rows is not None
+        ms.output_rows for _, ms in plan.collect_metrics() if ms.output_rows is not None
     ]
     assert 2 in output_rows_values, f"Expected 2 in {output_rows_values}"
 
@@ -171,9 +167,7 @@ def test_execute_stream_partitioned_metrics() -> None:
 
     plan = df.execution_plan()
     output_rows_values = [
-        ms.output_rows
-        for _, ms in plan.collect_metrics()
-        if ms.output_rows is not None
+        ms.output_rows for _, ms in plan.collect_metrics() if ms.output_rows is not None
     ]
     assert 2 in output_rows_values, f"Expected 2 in {output_rows_values}"
 
@@ -233,8 +227,6 @@ def test_collect_twice_has_metrics() -> None:
 
     plan = df.execution_plan()
     output_rows_values = [
-        ms.output_rows
-        for _, ms in plan.collect_metrics()
-        if ms.output_rows is not None
+        ms.output_rows for _, ms in plan.collect_metrics() if ms.output_rows is not None
     ]
     assert len(output_rows_values) > 0