github

Messages by Thread

Re: [I] Grouped first_value/last_value FILTER Incorrectly Includes NULL Predicate Rows [datafusion] via GitHub
[PR] fix: grouped first_value/last_value FILTER excludes NULL predicate rows [datafusion] via GitHub
[PR] fix: prevent LEAD/LAG IGNORE NULLS panic without null bitmap [datafusion] via GitHub
- Re: [PR] fix: prevent LEAD/LAG IGNORE NULLS panic without null bitmap [datafusion] via GitHub
[I] LEAD/LAG IGNORE NULLS panics without a null bitmap [datafusion] via GitHub
Re: [PR] feat: TopK stats init + cumulative RG pruning for pure-TopK parquet scans (no-WHERE) [datafusion] via GitHub
Re: [PR] [PoC] perf: optimize group-only group-by case for primitive cases (clickbench q4) [datafusion] via GitHub
Re: [I] SIMILAR TO panics ('failed to downcast array') when operand types differ (e.g. NULL pattern, Utf8View vs Utf8) [datafusion] via GitHub
Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
- Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
- Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
- Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
- Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
- Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
- Re: [PR] feat: add `poll_now_notify` to `poll_loop` and `on_work_available` callback [datafusion-ballista] via GitHub
Re: [PR] feat: add a broadcast channel for job state event notifications [datafusion-ballista] via GitHub
- Re: [PR] feat: add a broadcast channel for job state event notifications [datafusion-ballista] via GitHub
[PR] feat(core): BufferExec — generic flow-control op with a memory-pool Dam mode [datafusion-ballista] via GitHub
- Re: [PR] feat(core): BufferExec — generic flow-control op with a memory-pool Dam mode [datafusion-ballista] via GitHub
- Re: [PR] feat(core): BufferExec — generic flow-control op with a memory-pool Dam mode [datafusion-ballista] via GitHub
[PR] fix: tighten scalar UDF return type hints [datafusion-python] via GitHub
[PR] feat(core): RuntimeStatsExec — passthrough tap for row counts + quantile sketches [datafusion-ballista] via GitHub
- Re: [PR] feat(core): RuntimeStatsExec — passthrough tap for row counts + quantile sketches [datafusion-ballista] via GitHub
- Re: [PR] feat(core): RuntimeStatsExec — passthrough tap for row counts + quantile sketches [datafusion-ballista] via GitHub
[PR] docs(config): rewrite max_partitions_per_task description to be timeless [datafusion-ballista] via GitHub
- Re: [PR] docs(config): rewrite max_partitions_per_task description to be timeless [datafusion-ballista] via GitHub
[PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
- Re: [PR] fix: Make FilePruner work with constant columns [datafusion] via GitHub
[PR] refactor: move catalog traits to session crate [datafusion] via GitHub
- Re: [PR] refactor: move catalog traits to session crate [datafusion] via GitHub
- Re: [PR] refactor: move catalog traits to session crate [datafusion] via GitHub
[PR] build(deps): bump github/codeql-action/analyze from 4.36.2 to 4.37.1 [datafusion-python] via GitHub
[PR] build(deps): bump github/codeql-action/init from 4.36.2 to 4.37.1 [datafusion-python] via GitHub
[PR] feat: native RANGE window frames with explicit offset on DATE ORDER BY [datafusion-comet] via GitHub
Re: [PR] Improvement: keep order-preserving repartitions for streaming aggregates [datafusion] via GitHub
[PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
- Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
- Re: [PR] chore: simplify SortPreservingMergeStream to be as textbook-like as possible [datafusion] via GitHub
Re: [I] [EPIC]: Make `PiecewiseMergeJoin` work in Datafusion [datafusion] via GitHub
- Re: [I] [EPIC]: Make `PiecewiseMergeJoin` work in Datafusion [datafusion] via GitHub
[PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
- Re: [PR] WIP: rebase #22384 + tactical split-membership fix for HashJoin dynamic filter [datafusion] via GitHub
[I] Move lambda evaluation into Physical Planning Context [datafusion] via GitHub
[PR] perf: passthrough last stream is `SortPreservingMergeStream` [datafusion] via GitHub
[PR] fix: track the time takes to init loser tree and build last in progress batches [datafusion] via GitHub
- Re: [PR] fix: track the time takes to init loser tree and build last in progress batches [datafusion] via GitHub
[I] non-deterministic roundtripping through sessionstatebuilder [datafusion] via GitHub
[PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
- Re: [PR] perf(parquet): skip RowFilter on statically fully-matched row groups [datafusion] via GitHub
Re: [PR] perf: fast path for date_part('minute', Timestamp(Second)) [datafusion] via GitHub
Re: [PR] Implement eager aggregation [datafusion] via GitHub
Re: [PR] POC: Window function intra-operator parallelism and vectorization (up to 50× faster) [datafusion] via GitHub
Re: [PR] Js/cherry pick dynamic filter pushdown through aggregations [datafusion] via GitHub
Re: [PR] feat: DuckDB-compatible glob expressions in listing-table paths (filesystem + s3/gs/http URLs) [datafusion] via GitHub
[PR] Aggregate byte types internally with i64 offsets [datafusion] via GitHub
- Re: [PR] Aggregate byte types internally with i64 offsets [datafusion] via GitHub
[I] Grouping operations on large datasets can overflow i32 offsets [datafusion] via GitHub
[I] [EPIC] Enable Adaptive Query Execution (AQE) by default [datafusion-ballista] via GitHub
Re: [PR] Share per-chunk JoinLeftData across right partitions in NLJ memory-limited fallback [datafusion] via GitHub
- Re: [PR] Share per-chunk JoinLeftData across right partitions in NLJ memory-limited fallback [datafusion] via GitHub
- Re: [PR] Share per-chunk JoinLeftData across right partitions in NLJ memory-limited fallback [datafusion] via GitHub
Re: [I] Support more types for `approx_distinct` function [datafusion] via GitHub
- Re: [I] Support more types for `approx_distinct` function [datafusion] via GitHub
- Re: [I] Support more types for `approx_distinct` function [datafusion] via GitHub
[PR] feat: improve sort shuffle write and spill INFO logging [datafusion-ballista] via GitHub
- Re: [PR] feat: improve sort shuffle write and spill INFO logging [datafusion-ballista] via GitHub
- Re: [PR] feat: improve sort shuffle write and spill INFO logging [datafusion-ballista] via GitHub
- Re: [PR] feat: log sort shuffle spills at WARN, keep write completion at DEBUG [datafusion-ballista] via GitHub
- Re: [PR] feat: log sort shuffle spills at WARN, keep write completion at DEBUG [datafusion-ballista] via GitHub
[PR] build(deps): bump tokio from 1.52.3 to 1.53.0 [datafusion-python] via GitHub
[PR] build(deps): bump uuid from 1.23.3 to 1.24.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump uuid from 1.23.3 to 1.23.4 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump uuid from 1.23.3 to 1.23.4 [datafusion-python] via GitHub
[PR] chore: bump `object_store` to `0.14.1` [datafusion] via GitHub
- Re: [PR] chore: bump `object_store` to `0.14.1` [datafusion] via GitHub
[PR] fix: propagate sort shuffle memory_limit_per_task_bytes to executors [datafusion-ballista] via GitHub
- Re: [PR] fix: propagate sort shuffle memory_limit_per_task_bytes to executors [datafusion-ballista] via GitHub
- Re: [PR] fix: propagate sort shuffle memory_limit_per_task_bytes to executors [datafusion-ballista] via GitHub
[I] Sort shuffle writer's memory_limit_per_task_bytes config is not propagated to executors [datafusion-ballista] via GitHub
- Re: [I] Sort shuffle writer's memory_limit_per_task_bytes config is not propagated to executors [datafusion-ballista] via GitHub
[I] type_coercion error: multi-condition IS NOT DISTINCT FROM in JOIN ON clause fails [datafusion] via GitHub
- Re: [I] type_coercion error: multi-condition IS NOT DISTINCT FROM in JOIN ON clause fails [datafusion] via GitHub
- Re: [I] type_coercion error: multi-condition IS NOT DISTINCT FROM in JOIN ON clause fails [datafusion] via GitHub
[PR] fix: evaluate struct-returning UDFs once across repeated field accesses [datafusion] via GitHub
Re: [PR] fix: NOT IN with NULL subquery returns wrong results under SortMergeJoin [datafusion] via GitHub
Re: [PR] bench: parquet scan with a table schema narrower than a nested column [datafusion] via GitHub
- Re: [PR] bench: parquet scan with a table schema narrower than a nested column [datafusion] via GitHub
Re: [PR] fix: avoid panic in array_position start_from near i64::MIN [datafusion] via GitHub
Re: [I] Add `any_value` aggregate function [datafusion] via GitHub
[PR] perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] experiment perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] experiment perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] experiment perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] experiment perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] experiment perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
- Re: [PR] experiment perf(coalesce): make BatchCoalescer bypass threshold configurable (SIGMOD 2025 Binary Compaction) [datafusion] via GitHub
[PR] [branch-54] chore: Update version 54.1.0, add changelog [datafusion] via GitHub
- Re: [PR] [branch-54] chore: Update version 54.1.0, add changelog [datafusion] via GitHub
[PR] Optimize Spark hex null handling [datafusion] via GitHub
- Re: [PR] Optimize Spark hex null handling [datafusion] via GitHub
[PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] experiment feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] experiment feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] experiment feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] experiment feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] experiment feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
- Re: [PR] experiment feat(agg): TopK aggregation for count(*)/count(col) DESC/ASC LIMIT K [datafusion] via GitHub
[PR] Add schema-aware optimizer child rewrites [datafusion] via GitHub
[PR] Document decimal AVG wrapping arithmetic [datafusion] via GitHub
Re: [I] DataFusion drops grouped MIN/MAX rows with NULL sort keys under ORDER BY + LIMIT [datafusion] via GitHub
[PR] fix: TopK aggregation drops groups whose MIN/MAX value is NULL [datafusion] via GitHub
[PR] Add DataSource/FileSource proto hooks and FileScanConfig serde [datafusion] via GitHub
- Re: [PR] Add DataSource/FileSource proto hooks and FileScanConfig serde [datafusion] via GitHub
Re: [PR] Add any_value aggregate function [datafusion] via GitHub
- Re: [PR] Add any_value aggregate function [datafusion] via GitHub
- Re: [PR] Add any_value aggregate function [datafusion] via GitHub
- Re: [PR] Add any_value aggregate function [datafusion] via GitHub
Re: [PR] Support lower and upper scalar udf on dict arrays [datafusion] via GitHub
- Re: [PR] Support lower and upper scalar udf on dict arrays [datafusion] via GitHub
[PR] test: promote `try_to_date`/`try_to_timestamp` SQL tests to native coverage [datafusion-comet] via GitHub
Re: [PR] fix(spark-expr): handle array length mismatch in datediff for dictionary-backed timestamps [datafusion-comet] via GitHub
Re: [PR] CI: Add workflow to verify release candidate on multiple systems [datafusion-comet] via GitHub
Re: [PR] fix: multi-insert with native writer in Spark 4.x (#3430) [datafusion-comet] via GitHub
Re: [PR] Query graph for Join reordering [datafusion] via GitHub
Re: [PR] feat: Add `FFI_QueryPlanner` to support foreign query planners across shared-library boundaries [datafusion] via GitHub
- Re: [PR] feat: Add `FFI_QueryPlanner` to support foreign query planners across shared-library boundaries [datafusion] via GitHub
Re: [PR] [Experiment] Adaptive filter pushdown [datafusion] via GitHub
[PR] perf: vectorize `spark_unscaled_value` (9x faster) [datafusion-comet] via GitHub
[PR] fix: `get_json_object` returns first value for duplicate keys to match Spark [datafusion-comet] via GitHub
Re: [I] Support Substrait exchange output for range repartitioning [datafusion] via GitHub
[PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
- Re: [PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
- Re: [PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
- Re: [PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
- Re: [PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
- Re: [PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
- Re: [PR] feat: add BALLISTA_PROTOCOL_VERSION + k8s health probes [datafusion-ballista] via GitHub
[PR] feat(optimizer): coalesce peer first_value / last_value into a single struct aggregate [datafusion] via GitHub
- Re: [PR] feat(optimizer): coalesce peer first_value / last_value into a single struct aggregate [datafusion] via GitHub
- [PR] feat(optimizer): coalesce peer first_value / last_value into a single struct aggregate [datafusion] via GitHub

Earlier messages