github

Messages by Thread

- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
- Re: [PR] Feat: add dictionaries as a supported group column type [datafusion] via GitHub
Re: [PR] Test: add more aggregation focused dictionary sql logic test [datafusion] via GitHub
- Re: [PR] Test: add more aggregation focused dictionary sql logic test [datafusion] via GitHub
- Re: [PR] Test: add more aggregation focused dictionary sql logic test [datafusion] via GitHub
- Re: [PR] Test: add more aggregation focused dictionary sql logic test [datafusion] via GitHub
[PR] Add shuffle-read fetch metrics and surface per-operator metrics in plan display [datafusion-ballista] via GitHub
- Re: [PR] Add shuffle-read fetch metrics and surface per-operator metrics in plan display [datafusion-ballista] via GitHub
[PR] Push xlzmxnmwvkmz [datafusion] via GitHub
[PR] feat: support `WindowGroupLimitExec` [datafusion-comet] via GitHub
[I] feat: analyze memory usage for `size` functions [datafusion] via GitHub
- Re: [I] feat: analyze memory usage for `size` functions [datafusion] via GitHub
- Re: [I] feat: analyze memory usage for `size` functions [datafusion] via GitHub
- Re: [I] feat: analyze memory usage for `size` functions [datafusion] via GitHub
[I] UnresolvedShuffleExec should display the input stage number [datafusion-ballista] via GitHub
- Re: [I] UnresolvedShuffleExec should display the input stage number [datafusion-ballista] via GitHub
Re: [I] Support physical execution of Range repartitioning [datafusion] via GitHub
Re: [PR] feat: Add experimental support for accelerated PyArrow UDFs [datafusion-comet] via GitHub
- Re: [PR] feat: Add experimental support for accelerated PyArrow UDFs [datafusion-comet] via GitHub
- Re: [PR] feat: Add experimental support for accelerated PyArrow UDFs [datafusion-comet] via GitHub
Re: [I] Panic when casting `[]` to `FixedSizeList(0, Null)` [datafusion] via GitHub
[PR] fix: register partitioning scalar subqueries for native shuffle to avoid "Subquery N not found" [datafusion-comet] via GitHub
- Re: [PR] fix: register partitioning scalar subqueries for native shuffle to avoid "Subquery N not found" [datafusion-comet] via GitHub
- Re: [PR] fix: register partitioning scalar subqueries for native shuffle to avoid "Subquery N not found" [datafusion-comet] via GitHub
- Re: [PR] fix: register partitioning scalar subqueries for native shuffle to avoid "Subquery N not found" [datafusion-comet] via GitHub
[PR] Prune unread nested parquet leaves when a projected column is cast to a narrower type (nested schema pruning) [datafusion] via GitHub
- Re: [PR] Prune unread nested parquet leaves when a projected column is cast to a narrower type (nested schema pruning) [datafusion] via GitHub
- Re: [PR] Prune unread nested parquet leaves when a projected column is cast to a narrower type (nested schema pruning) [datafusion] via GitHub
- Re: [PR] Prune unread nested parquet leaves when a projected column is cast to a narrower type (nested schema pruning) [datafusion] via GitHub
- [PR] Prune unread nested parquet leaves when a projected column is cast to a narrower type (nested schema pruning) [datafusion] via GitHub
- Re: [PR] Prune unread nested parquet leaves when a projected column is cast to a narrower type (nested schema pruning) [datafusion] via GitHub
[PR] Add TPC-H distributed plan-stability test suite [datafusion-ballista] via GitHub
- Re: [PR] Add TPC-H distributed plan-stability test suite [datafusion-ballista] via GitHub
- Re: [PR] Add TPC-H distributed plan-stability test suite [datafusion-ballista] via GitHub
[PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
- Re: [PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
- Re: [PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
- Re: [PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
- Re: [PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
- Re: [PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
- Re: [PR] fix: emit JDK libjvm search path from core build script to fix -ljvm CI link failures [datafusion-comet] via GitHub
[I] Remove legacy native HDFS client crates and standardize on OpenDAL HDFS [datafusion-comet] via GitHub
- Re: [I] Remove legacy native HDFS client crates and standardize on OpenDAL HDFS [datafusion-comet] via GitHub
[I] Support per-SessionContext object store credentials without os.environ (thread-safety) [datafusion-python] via GitHub
- Re: [I] Support per-SessionContext object store credentials without os.environ (thread-safety) [datafusion-python] via GitHub
- Re: [I] Support per-SessionContext object store credentials without os.environ (thread-safety) [datafusion-python] via GitHub
- [I] Support per-SessionContext object store credentials without os.environ (thread-safety) [datafusion-python] via GitHub
Re: [I] [Feature] Support external Remote Shuffle Service (e.g., Apache Celeborn / Apache Uniffle) [datafusion-ballista] via GitHub
- Re: [I] [Feature] Support external Remote Shuffle Service (e.g., Apache Celeborn / Apache Uniffle) [datafusion-ballista] via GitHub
Re: [PR] feat: implement native empty2null spark inner function [datafusion-comet] via GitHub
Re: [I] CometHashAggregateExec doesn't participate in Spark's AQEPropagateEmptyRelation optimization [datafusion-comet] via GitHub
Re: [PR] feat: add native distinct-combined collect_list aggregate support [datafusion-comet] via GitHub
Re: [PR] feat: ADBC-backed Spark DataSource for DataFusion table providers [datafusion-java] via GitHub
[PR] fix: [DO NOT MERGE] [datafusion-comet] via GitHub
[PR] feat: prune nested Parquet leaves when the projected schema narrows a nested column [datafusion] via GitHub
- Re: [PR] feat: prune nested Parquet leaves when the projected schema narrows a nested column [datafusion] via GitHub
- Re: [PR] feat: prune nested Parquet leaves when the projected schema narrows a nested column [datafusion] via GitHub
[I] chore: DataFusion 54.0.0 [datafusion-comet] via GitHub
[PR] chore: use Datafusion `substring` [datafusion-comet] via GitHub
- Re: [PR] chore: use Datafusion `substring` [datafusion-comet] via GitHub
Re: [I] [Bug] map_from_arrays / map_from_entries do not enforce null-key rejection or spark.sql.mapKeyDedupPolicy [datafusion-comet] via GitHub
- Re: [I] [Bug] map_from_arrays / map_from_entries do not enforce null-key rejection or spark.sql.mapKeyDedupPolicy [datafusion-comet] via GitHub
[PR] chore: move CometCollationSuite to spark-4.1+ test shim [datafusion-comet] via GitHub
[PR] chore: fallback for non-default `spark.sql.mapKeyDedupPolicy` [datafusion-comet] via GitHub
- Re: [PR] chore: fallback for non-default `spark.sql.mapKeyDedupPolicy` [datafusion-comet] via GitHub
- Re: [PR] chore: fallback for `spark.sql.mapKeyDedupPolicy` == `LAST_WIN` [datafusion-comet] via GitHub
- Re: [PR] chore: fallback for `spark.sql.mapKeyDedupPolicy` == `LAST_WIN` [datafusion-comet] via GitHub
- Re: [PR] chore: fallback for `spark.sql.mapKeyDedupPolicy` == `LAST_WIN` [datafusion-comet] via GitHub
- Re: [PR] chore: fallback for `spark.sql.mapKeyDedupPolicy` == `LAST_WIN` [datafusion-comet] via GitHub
Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
- Re: [PR] Use `concat_elements_dyn` from `arrow-rs` [datafusion] via GitHub
Re: [I] Move CometCollationSuite into the spark-4.1+ test shim to avoid per-version duplication [datafusion-comet] via GitHub
[PR] docs: remove duplicate String to TimestampNTZ section from cast guide [datafusion-comet] via GitHub
- Re: [PR] docs: remove duplicate String to TimestampNTZ section from cast guide [datafusion-comet] via GitHub
Re: [PR] feat: name incompatible aggregate functions in mixed-execution fallback reason [datafusion-comet] via GitHub
[PR] feat: enable mixed partial/final execution for sum and non-decimal avg [datafusion-comet] via GitHub
- Re: [PR] feat: enable mixed partial/final execution for sum and non-decimal avg [datafusion-comet] via GitHub
- Re: [PR] feat: enable mixed partial/final execution for sum and non-decimal avg [datafusion-comet] via GitHub
[PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
- Re: [PR] feat: add BatchNormalizer: re-chunk data source batches by rows and bytes (target_batch_size_bytes) [datafusion] via GitHub
Re: [I] `= ANY` / `<> ALL` subquery fails to plan: `Schema contains duplicate unqualified field name mark` [datafusion] via GitHub
Re: [I] CometFromUnixTime reports unsupported format patterns as Incompatible instead of Unsupported [datafusion-comet] via GitHub
[PR] fix(sort): can have OOM when the largest batch is smaller than batch size [datafusion] via GitHub
- Re: [PR] fix(sort): can have OOM when the largest batch is smaller than batch size [datafusion] via GitHub
- Re: [PR] fix(sort): can have OOM when the largest batch is smaller than batch size [datafusion] via GitHub
- Re: [PR] fix(sort): can have OOM when the largest batch is smaller than batch size [datafusion] via GitHub
Re: [I] Scalar subquery (`Expr::ScalarSubquery`) does not fail when subquery is not scalar [datafusion] via GitHub
[PR] fix: Make FilePruner support constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner support constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner support constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner support constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner support constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
[PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
- Re: [PR] Move datafusion-cli main_inner impl into the datafusion-cli lib. [datafusion] via GitHub
[I] Registering custom udf in datafusion-cli could be easier [datafusion] via GitHub
- Re: [I] Registering custom udf in datafusion-cli could be easier [datafusion] via GitHub
- Re: [I] Registering custom udf in datafusion-cli could be easier [datafusion] via GitHub
Re: [I] Misleading error message when `CREATE EXTERNAL TABLE` with invalid path [datafusion] via GitHub
- Re: [I] Misleading error message when `CREATE EXTERNAL TABLE` with invalid path [datafusion] via GitHub
- Re: [I] Misleading error message when `CREATE EXTERNAL TABLE` with invalid path [datafusion] via GitHub
- Re: [I] Misleading error message when `CREATE EXTERNAL TABLE` with invalid path [datafusion] via GitHub
[I] Untracked memory in `FilterExec`, `RepartitionExec`, `HashJoinExec` and `AsyncFuncExec` and more due to `LimitedBatchCoalescer` and arrow `BatchCoalescer` usage [datafusion] via GitHub
- Re: [I] Untracked memory in `FilterExec`, `RepartitionExec`, `HashJoinExec` and `AsyncFuncExec` and more due to `LimitedBatchCoalescer` and arrow `BatchCoalescer` usage [datafusion] via GitHub
- Re: [I] Untracked memory in `FilterExec`, `RepartitionExec`, `HashJoinExec` and `AsyncFuncExec` and more due to `LimitedBatchCoalescer` and arrow `BatchCoalescer` usage [datafusion] via GitHub
- Re: [I] Untracked memory in `FilterExec`, `RepartitionExec`, `HashJoinExec` and `AsyncFuncExec` and more due to `LimitedBatchCoalescer` and arrow `BatchCoalescer` usage [datafusion] via GitHub
- Re: [I] Untracked memory in `FilterExec`, `RepartitionExec`, `HashJoinExec` and `AsyncFuncExec` and more due to `LimitedBatchCoalescer` and arrow `BatchCoalescer` usage [datafusion] via GitHub
[PR] Optimize near-unique string view group values [datafusion] via GitHub
- Re: [PR] Optimize near-unique string view group values [datafusion] via GitHub
- Re: [PR] POC Optimize near-unique string view group values [datafusion] via GitHub
- Re: [PR] POC Optimize near-unique string view group values [datafusion] via GitHub
- Re: [PR] POC Optimize near-unique string view group values [datafusion] via GitHub
- Re: [PR] POC Optimize near-unique string view group values [datafusion] via GitHub