snowflakedb · sfc-gh-aling · Sep 26, 2025 · Sep 24, 2025 · Sep 24, 2025 · Sep 25, 2025
@@ -207,6 +207,14 @@ jobs:
           SNOWPARK_PYTHON_API_S3_STORAGE_INTEGRATION: ${{ vars.SNOWPARK_PYTHON_API_S3_STORAGE_INTEGRATION }}
           TOX_PARALLEL_NO_SPINNER: 1
         shell: bash
+      - name: Install MS ODBC Driver (Ubuntu only)
+        if: ${{ contains(matrix.os, 'ubuntu') }}
+        run: |
+          curl https://packages.microsoft.com/keys/microsoft.asc | sudo apt-key add -
+          curl https://packages.microsoft.com/config/ubuntu/$(lsb_release -rs)/prod.list | sudo tee /etc/apt/sources.list.d/mssql-release.list
+          sudo apt-get update
+          sudo ACCEPT_EULA=Y apt-get install -y msodbcsql18 unixodbc-dev
+        shell: bash
       - name: Run data source tests
         # psycopg2 is not supported on macos 3.9
         # SNOW-2213578: Re-enable the test for 3.13

diff --git a/CHANGELOG.md b/CHANGELOG.md
@@ -77,6 +77,16 @@
   - `st_asgeojson`
   - `st_aswkb`
 
+#### Bug Fixes
+
+- Fixed multiple bugs in `DataFrameReader.dbapi` (PuPr):
+  - Fixed UDTF ingestion failure with `pyodbc` driver caused by unprocessed row data.
+  - Fixed SQL Server query input failure due to incorrect select query generation.
+  - Fixed UDTF ingestion not preserving column nullability in the output schema.
+
+#### Improvements
+
+- Improved `DataFrameReader.dbapi` (PuPr) reading performance by setting the default `fetch_size` parameter value to 100000.
 
 ### Snowpark pandas API Updates
 

@@ -1,8 +1,37 @@
 #
 # Copyright (c) 2012-2025 Snowflake Computing Inc. All rights reserved.
 #
+from typing import List
+
 from snowflake.snowpark._internal.data_source.dbms_dialects import BaseDialect
+from snowflake.snowpark._internal.data_source.dbms_dialects.base_dialect import (
+    QUERY_TEMPLATE,
+)
+from snowflake.snowpark._internal.utils import quote_name
+from snowflake.snowpark.types import StructType
 
 
 class SqlServerDialect(BaseDialect):
-    pass
+    def generate_select_query(
+        self,
+        table_or_query: str,
+        schema: StructType,
+        raw_schema: List[tuple],
+        is_query: bool,
+        query_input_alias: str,
+    ) -> str:
+        cols = []
+        for _field, raw_field in zip(schema.fields, raw_schema):
+            field_name = (
+                f"{query_input_alias}.{quote_name(raw_field[0], keep_case=True)}"
+                if is_query
+                else f"{quote_name(raw_field[0], keep_case=True)}"
+            )
+            cols.append(f"{field_name} AS {raw_field[0]}") if is_query else cols.append(
+                field_name
+            )
+        return QUERY_TEMPLATE.format(
+            cols=", ".join(cols),
+            table_or_query=f"({table_or_query})" if is_query else table_or_query,
+            query_input_alias=query_input_alias if is_query else "",
+        )
@@ -274,7 +274,10 @@ def to_result_snowpark_df_udtf(
             res_df[field.name].cast(field.datatype).alias(field.name)
             for field in schema.fields
         ]
-        return res_df.select(cols, _emit_ast=_emit_ast)
+        selected_df = res_df.select(cols, _emit_ast=_emit_ast)
+        for attr, source_field in zip(selected_df._plan.attributes, schema.fields):
+            attr.nullable = source_field.nullable
+        return selected_df
 
     def get_server_cursor_if_supported(self, conn: "Connection") -> "Cursor":
         """

@@ -114,7 +114,7 @@ def process(self, query: str):
                     rows = cursor.fetchmany(fetch_size)
                     if not rows:
                         break
-                    yield from rows
+                    yield from map(tuple, rows)
 
         return UDTFIngestion
 

@@ -1695,7 +1695,7 @@ def dbapi(
         num_partitions: Optional[int] = None,
         max_workers: Optional[int] = None,
         query_timeout: Optional[int] = 0,
-        fetch_size: Optional[int] = 1000,
+        fetch_size: Optional[int] = 100000,
         custom_schema: Optional[Union[str, StructType]] = None,
         predicates: Optional[List[str]] = None,
         session_init_statement: Optional[Union[str, List[str]]] = None,