Fix long line and B008 error in ArrowScan

sumedhsakdeo · claude · sumedhsakdeo · commit de9f3c2e3726 · 2026-02-18T17:29:55.000-08:00
- Break long line in _iter_batches_arrival call for better readability - Fix B008 error by moving TaskOrder() call from function default to inside function - Sort imports alphabetically 🤖 Generated with [Claude Code](https://claude.ai/code) Co-Authored-By: Claude <noreply@anthropic.com>
diff --git a/pyiceberg/io/pyarrow.py b/pyiceberg/io/pyarrow.py
@@ -144,7 +144,7 @@
     visit,
     visit_with_partner,
 )
-from pyiceberg.table import DOWNCAST_NS_TIMESTAMP_TO_US_ON_WRITE, ScanOrder, TaskOrder, ArrivalOrder, TableProperties
+from pyiceberg.table import DOWNCAST_NS_TIMESTAMP_TO_US_ON_WRITE, ArrivalOrder, ScanOrder, TableProperties, TaskOrder
 from pyiceberg.table.locations import load_location_provider
 from pyiceberg.table.metadata import TableMetadata
 from pyiceberg.table.name_mapping import NameMapping, apply_name_mapping
@@ -1838,7 +1838,7 @@ def to_record_batches(
         self,
         tasks: Iterable[FileScanTask],
         batch_size: int | None = None,
-        order: ScanOrder = TaskOrder(),
+        order: ScanOrder | None = None,
     ) -> Iterator[pa.RecordBatch]:
         """Scan the Iceberg table and return an Iterator[pa.RecordBatch].
 
@@ -1868,6 +1868,9 @@ def to_record_batches(
             ValueError: When a field type in the file cannot be projected to the schema type,
                 or when an invalid order value is provided, or when concurrent_streams < 1.
         """
+        if order is None:
+            order = TaskOrder()
+
         if not isinstance(order, ScanOrder):
             raise ValueError(f"Invalid order: {order!r}. Must be a ScanOrder instance (TaskOrder() or ArrivalOrder()).")
 
@@ -1876,7 +1879,11 @@ def to_record_batches(
         if isinstance(order, ArrivalOrder):
             if order.concurrent_streams < 1:
                 raise ValueError(f"concurrent_streams must be >= 1, got {order.concurrent_streams}")
-            return self._apply_limit(self._iter_batches_arrival(task_list, deletes_per_file, batch_size, order.concurrent_streams, order.max_buffered_batches))
+            return self._apply_limit(
+                self._iter_batches_arrival(
+                    task_list, deletes_per_file, batch_size, order.concurrent_streams, order.max_buffered_batches
+                )
+            )
 
         return self._apply_limit(self._iter_batches_materialized(task_list, deletes_per_file, batch_size))