(paimon-python) branch main updated: Don't import duckdb and ray if not used (#33)

lzljs3620320 Tue, 03 Dec 2024 05:17:15 -0800

This is an automated email from the ASF dual-hosted git repository.

lzljs3620320 pushed a commit to branch main
in repository https://gitbox.apache.org/repos/asf/paimon-python.git



The following commit(s) were added to refs/heads/main by this push:
     new 7f6a1d4  Don't import duckdb and ray if not used (#33)
7f6a1d4 is described below

commit 7f6a1d4e4b44e6a31481a8be72470a40a9f30feb
Author: yuzelin <[email protected]>
AuthorDate: Tue Dec 3 21:16:52 2024 +0800

    Don't import duckdb and ray if not used (#33)
---
 pypaimon/api/table_read.py           | 12 +++++++-----
 pypaimon/py4j/java_implementation.py | 17 +++++++++++------
 2 files changed, 18 insertions(+), 11 deletions(-)

diff --git a/pypaimon/api/table_read.py b/pypaimon/api/table_read.py
index 9fcb78c..60b31e7 100644
--- a/pypaimon/api/table_read.py
+++ b/pypaimon/api/table_read.py
@@ -18,12 +18,14 @@
 
 import pandas as pd
 import pyarrow as pa
-import ray
 
 from abc import ABC, abstractmethod
-from duckdb.duckdb import DuckDBPyConnection
 from pypaimon.api import Split
-from typing import List, Optional
+from typing import List, Optional, TYPE_CHECKING
+
+if TYPE_CHECKING:
+    import ray
+    from duckdb.duckdb import DuckDBPyConnection
 
 
 class TableRead(ABC):
@@ -46,9 +48,9 @@ class TableRead(ABC):
             self,
             splits: List[Split],
             table_name: str,
-            connection: Optional[DuckDBPyConnection] = None) -> 
DuckDBPyConnection:
+            connection: Optional["DuckDBPyConnection"] = None) -> 
"DuckDBPyConnection":
         """Convert splits into an in-memory DuckDB table which can be 
queried."""
 
     @abstractmethod
-    def to_ray(self, splits: List[Split]) -> ray.data.dataset.Dataset:
+    def to_ray(self, splits: List[Split]) -> "ray.data.dataset.Dataset":
         """Convert splits into a Ray dataset format."""
diff --git a/pypaimon/py4j/java_implementation.py 
b/pypaimon/py4j/java_implementation.py
index 17c6eda..ce90bc5 100644
--- a/pypaimon/py4j/java_implementation.py
+++ b/pypaimon/py4j/java_implementation.py
@@ -18,19 +18,20 @@
 
 # pypaimon.api implementation based on Java code & py4j lib
 
-import duckdb
 import pandas as pd
 import pyarrow as pa
-import ray
 
-from duckdb.duckdb import DuckDBPyConnection
 from pypaimon.py4j.java_gateway import get_gateway
 from pypaimon.py4j.util import java_utils, constants
 from pypaimon.api import \
     (catalog, table, read_builder, table_scan, split,
      table_read, write_builder, table_write, commit_message,
      table_commit, Schema, predicate)
-from typing import List, Iterator, Optional, Any
+from typing import List, Iterator, Optional, Any, TYPE_CHECKING
+
+if TYPE_CHECKING:
+    import ray
+    from duckdb.duckdb import DuckDBPyConnection
 
 
 class Catalog(catalog.Catalog):
@@ -171,12 +172,16 @@ class TableRead(table_read.TableRead):
             self,
             splits: List[Split],
             table_name: str,
-            connection: Optional[DuckDBPyConnection] = None) -> 
DuckDBPyConnection:
+            connection: Optional["DuckDBPyConnection"] = None) -> 
"DuckDBPyConnection":
+        import duckdb
+
         con = connection or duckdb.connect(database=":memory:")
         con.register(table_name, self.to_arrow(splits))
         return con
 
-    def to_ray(self, splits: List[Split]) -> ray.data.dataset.Dataset:
+    def to_ray(self, splits: List[Split]) -> "ray.data.dataset.Dataset":
+        import ray
+
         return ray.data.from_arrow(self.to_arrow(splits))
 
     def _init(self):

(paimon-python) branch main updated: Don't import duckdb and ray if not used (#33)

Reply via email to