github

Messages by Thread

Re: [D] DISCUSSION: Apache DataFusion New York Meetup May 2026 [datafusion] via GitHub
- Re: [D] DISCUSSION: Apache DataFusion New York Meetup May 2026 [datafusion] via GitHub
[D] DataFusion-Federation: Union Flattening Across Executors [datafusion] via GitHub
[PR] feat(dataframe): add executeStream(allocator) for incremental batch iteration [datafusion-java] via GitHub
[PR] fix: REST API does not show running jobs [datafusion-ballista] via GitHub
[I] feat(dataframe): add executeStream(allocator) for incremental batch iteration [datafusion-java] via GitHub
[I] CREATE TABLE AS not checking column unicity [datafusion] via GitHub
- Re: [I] CREATE TABLE AS not checking column unicity [datafusion] via GitHub
[PR] Refactor Spark `format_string` numeric `%c` conversion dispatch [datafusion] via GitHub
[PR] fix: reduce memory allocation overhead during partial aggregation ear… [datafusion] via GitHub
[I] Extra memory allocated during partial aggregation early emit during OOM handling [datafusion] via GitHub
[I] Refactor: Centralize numeric `%c` formatting dispatch in format_string.rs [datafusion] via GitHub
[PR] Add blog: Sort Pushdown in DataFusion: Skip Sorts, Skip I/O [datafusion-site] via GitHub
[PR] feat(builder): expose ConfigOptions.set/get as setOption / setOptions / getOption [datafusion-java] via GitHub
[I] feat: expose ConfigOptions.set as a generic SessionContextBuilder.setOption(key, value) [datafusion-java] via GitHub
Re: [PR] Split proto serialization to encapsulate private state (#21835) [datafusion] via GitHub
[PR] chore(deps): bump pytest from 9.0.2 to 9.0.3 in /python [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump pytest from 9.0.2 to 9.0.3 in /python [datafusion-ballista] via GitHub
[PR] Fix extension type metadata propagation through casts [datafusion] via GitHub
[PR] Optimize away unused `UNNEST` under duplicate-insensitive aggregates [datafusion] via GitHub
[PR] build(deps): bump pyjwt from 2.10.1 to 2.12.0 [datafusion-python] via GitHub
[PR] feat(parquet): two-stage access-plan hooks with shared async reader [datafusion] via GitHub
[PR] feat(json): expose NdJsonReadOptions via registerJson and readJson [datafusion-java] via GitHub
Re: [PR] feat: support optional threshold parameter for levenshtein function [datafusion] via GitHub
[I] KEDA scaler `pending_jobs` metric appears insufficient for scaling due to rapid task assignment by scheduler [datafusion-ballista] via GitHub
[PR] feat: add Java scalar UDF support [datafusion-java] via GitHub
Re: [PR] test: add SQL test coverage for spark.sql.legacy.timeParserPolicy [datafusion-comet] via GitHub
- Re: [PR] test: add SQL test coverage for spark.sql.legacy.timeParserPolicy [datafusion-comet] via GitHub
[PR] build(deps): bump pygments from 2.19.1 to 2.20.0 [datafusion-python] via GitHub
[PR] chore(deps): bump pyjwt from 2.10.1 to 2.12.0 in /python [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump pyjwt from 2.10.1 to 2.12.0 in /python [datafusion-ballista] via GitHub
[PR] build(deps): bump requests from 2.32.3 to 2.33.0 [datafusion-python] via GitHub
Re: [I] [Spark 4.0] Add string collation support [datafusion-comet] via GitHub
[I] feat(dataframe): expose withColumn and unnestColumns [datafusion-java] via GitHub
[I] feat(dataframe): expose introspection methods (schema, explain, cache, describe) [datafusion-java] via GitHub
[I] design: DataFrame joins (join, joinOn) and the Java Expr question [datafusion-java] via GitHub
[I] feat(dataframe): expose set operations (union, intersect, except) [datafusion-java] via GitHub
[I] feat(dataframe): expose sort and repartition [datafusion-java] via GitHub
[I] native_datafusion: ParquetSchemaConvert error does not include the file path [datafusion-comet] via GitHub
- Re: [I] native_datafusion: ParquetSchemaConvert error does not include the file path [datafusion-comet] via GitHub
[I] feat: add DataFrame.writeCsv with CsvWriteOptions [datafusion-java] via GitHub
[I] feat: expose Avro reader via registerAvro and readAvro [datafusion-java] via GitHub
[I] bug: SessionContext.close() / DataFrame.close() race with concurrent JNI calls (use-after-free) [datafusion-java] via GitHub
[I] feat: add DataFrame.writeJson with JsonWriteOptions [datafusion-java] via GitHub
[I] feat: expose JSON reader via registerJson and readJson [datafusion-java] via GitHub
[I] feat: expose Arrow IPC reader via registerArrow and readArrow [datafusion-java] via GitHub
[PR] docs: remove project-status checklist [datafusion-java] via GitHub
- Re: [PR] docs: remove project-status checklist [datafusion-java] via GitHub
[PR] build(deps): bump urllib3 from 2.3.0 to 2.7.0 [datafusion-python] via GitHub
Re: [PR] feat: Native Delta Lake scan via delta-kernel-rs [datafusion-comet] via GitHub
- Re: [PR] feat: Native Delta Lake scan via delta-kernel-rs [datafusion-comet] via GitHub
[I] Publish fat JAR with platform-specific native libraries to Maven Central [datafusion-java] via GitHub
[PR] build(deps): bump pynacl from 1.5.0 to 1.6.2 [datafusion-python] via GitHub
[PR] build: add examples module on a multi-module Maven build [datafusion-java] via GitHub
- Re: [PR] build: add examples module on a multi-module Maven build [datafusion-java] via GitHub
[PR] docs: publish Javadoc as part of the User Guide [datafusion-java] via GitHub
- Re: [PR] docs: publish Javadoc as part of the User Guide [datafusion-java] via GitHub
[PR] build(deps): bump cryptography from 44.0.0 to 46.0.7 [datafusion-python] via GitHub
Re: [I] Automate breaking change detection [datafusion] via GitHub
- Re: [I] Automate breaking change detection [datafusion] via GitHub
[PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] [WIP] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
- Re: [PR] Call take arrays once per repartitioned input batch [datafusion] via GitHub
[PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
- Re: [PR] perf: reuse mask in `truncate_list_nulls` and avoid counting all true bits [datafusion] via GitHub
[PR] Expose `ExecutionPlan` statistics across the FFI boundary [datafusion] via GitHub
- Re: [PR] Expose `ExecutionPlan` statistics across the FFI boundary [datafusion] via GitHub
Re: [PR] Add internal repartition metrics [datafusion] via GitHub
- Re: [PR] Add internal repartition metrics [datafusion] via GitHub
[PR] chore(deps): bump urllib3 from 2.6.3 to 2.7.0 in /python [datafusion-ballista] via GitHub
- Re: [PR] chore(deps): bump urllib3 from 2.6.3 to 2.7.0 in /python [datafusion-ballista] via GitHub
Re: [I] chore: Publish specific documentation for each supported Spark version [datafusion-comet] via GitHub
[PR] feat: Support Spark Expression Encode [datafusion-comet] via GitHub
- Re: [PR] feat: Support Spark Expression Encode [datafusion-comet] via GitHub
- Re: [PR] feat: Support Spark Expression Encode [datafusion-comet] via GitHub
- Re: [PR] feat: Support Spark Expression Encode [datafusion-comet] via GitHub
- Re: [PR] feat: Support Spark Expression Encode [datafusion-comet] via GitHub
- Re: [PR] feat: Support Spark Expression Encode [datafusion-comet] via GitHub
[PR] feat(dataframe): add limit, distinct, dropColumns, withColumnRenamed [datafusion-java] via GitHub
- Re: [PR] feat(dataframe): add limit, distinct, dropColumns, withColumnRenamed [datafusion-java] via GitHub
[PR] refactor(parquet): split opener.rs into module + add ParquetAccessPlanOptimizer trait [datafusion] via GitHub
- Re: [PR] refactor(parquet): split opener.rs into module + add ParquetAccessPlanOptimizer trait [datafusion] via GitHub
- Re: [PR] refactor(parquet-datasource): mechanical cleanup of opener / file_format / row_group_filter [datafusion] via GitHub
[I] Add internal EXPLAIN ANALYZE metric level [datafusion] via GitHub
Re: [I] Improve integration tests to test push scheduler mode as well [datafusion-ballista] via GitHub
- Re: [I] Improve integration tests to test push scheduler mode as well [datafusion-ballista] via GitHub
- Re: [I] Improve integration tests to test push scheduler mode as well [datafusion-ballista] via GitHub
[PR] Fix no executor warning, correct prometheus feature name in TUI, expose pending tasks in metrics [datafusion-ballista] via GitHub
- Re: [PR] Fix no executor warning, correct prometheus feature name in TUI, expose pending tasks in metrics [datafusion-ballista] via GitHub
- Re: [PR] Fix no executor warning, correct prometheus feature name in TUI, expose pending tasks in metrics [datafusion-ballista] via GitHub
- Re: [PR] Fix no executor warning, correct prometheus feature name in TUI, expose pending tasks in metrics [datafusion-ballista] via GitHub
- Re: [PR] Fix no executor warning, correct prometheus feature name in TUI, expose pending tasks in metrics [datafusion-ballista] via GitHub
[I] Suggestion: enable `unreachable_pub` lint at workspace level [datafusion] via GitHub
[I] Incorrect "Fix bad UTF-8 char " actually corrupts the input [datafusion-benchmarks] via GitHub
[PR] chore: enable `unreachable_pub` lint at workspace level [datafusion] via GitHub
- Re: [PR] chore: enable `unreachable_pub` lint at workspace level [datafusion] via GitHub
[I] Expose `ExecutionPlan` statistics across the FFI boundary [datafusion] via GitHub
[PR] refactor: pass csv and parquet read options via protobuf [datafusion-java] via GitHub
- Re: [PR] refactor: pass csv and parquet read options via protobuf [datafusion-java] via GitHub
[PR] chore: update documentation links for 0.16.0 release [datafusion-comet] via GitHub
- Re: [PR] chore: update documentation links for 0.16.0 release [datafusion-comet] via GitHub
[I] Column name cannot be `key` when use `GenericDialect`. [datafusion-sqlparser-rs] via GitHub
[D] Apache DataFusion Comet 0.16.0 Release - Apache DataFusion Blog [datafusion-site] via GitHub
[PR] feat(ffi): Add `FFI_QueryPlanner` to support foreign query planners across shared-library boundaries [datafusion] via GitHub
- Re: [PR] feat: Add `FFI_QueryPlanner` to support foreign query planners across shared-library boundaries [datafusion] via GitHub
[PR] feat: eliminate GlobalLimitExec when input statistics prove limit is already satisfied [datafusion] via GitHub
- Re: [PR] feat: eliminate GlobalLimitExec when input statistics prove limit is already satisfied [datafusion] via GitHub
- Re: [PR] feat: eliminate GlobalLimitExec when input statistics prove limit is already satisfied [datafusion] via GitHub
[I] Implement JVM UDFs for JSON expressions [datafusion-comet] via GitHub
- Re: [I] Implement JVM UDFs for JSON expressions [datafusion-comet] via GitHub
Re: [I] [EPIC] Improve awslabs published results for Comet w/ TPC-DS [datafusion-comet] via GitHub
- Re: [I] [EPIC] Improve awslabs published results for Comet w/ TPC-DS [datafusion-comet] via GitHub
[I] Add support for native custom scalar UDFs [datafusion-comet] via GitHub
[PR] feat: configure SessionContext and RuntimeEnv via builder [datafusion-java] via GitHub
- Re: [PR] feat: configure SessionContext and RuntimeEnv via builder [datafusion-java] via GitHub
[I] Implement JVM UDFs for all date/time expressions [datafusion-comet] via GitHub
- Re: [I] Implement JVM UDFs for all date/time expressions [datafusion-comet] via GitHub
Re: [I] impl Any for MemoryPool [datafusion] via GitHub
Re: [PR] draft: testing transition from abi_stable to stabby [datafusion] via GitHub
[PR] feat(write): add DataFrame.writeParquet with ParquetWriteOptions [datafusion-java] via GitHub
- Re: [PR] feat(write): add DataFrame.writeParquet with ParquetWriteOptions [datafusion-java] via GitHub
Re: [PR] build(deps): bump astral-sh/setup-uv from 7.3.1 to 8.1.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump astral-sh/setup-uv from 7.3.1 to 8.1.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump uuid from 1.23.0 to 1.23.1 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump uuid from 1.23.0 to 1.23.1 [datafusion-python] via GitHub
Re: [PR] build(deps): bump mimalloc from 0.1.48 to 0.1.50 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump mimalloc from 0.1.48 to 0.1.50 [datafusion-python] via GitHub
Re: [PR] build(deps): bump rand from 0.9.2 to 0.9.4 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump rand from 0.9.2 to 0.9.4 [datafusion-python] via GitHub
Re: [PR] build(deps): bump rustls-webpki from 0.103.10 to 0.103.13 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump rustls-webpki from 0.103.10 to 0.103.13 [datafusion-python] via GitHub
Re: [PR] build(deps): bump datafusion-common from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump datafusion-common from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump datafusion-proto from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump datafusion-proto from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump datafusion-ffi from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump datafusion-ffi from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump datafusion-catalog from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump datafusion-catalog from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump datafusion from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump datafusion from 53.0.0 to 53.1.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump arrow-schema from 58.1.0 to 58.2.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump arrow-schema from 58.1.0 to 58.2.0 [datafusion-python] via GitHub
Re: [PR] build(deps): bump arrow-array from 58.1.0 to 58.2.0 [datafusion-python] via GitHub
- Re: [PR] build(deps): bump arrow-array from 58.1.0 to 58.2.0 [datafusion-python] via GitHub
[PR] docs: add DataFusion Java to subproject listings [datafusion] via GitHub
- Re: [PR] docs: add DataFusion Java to subproject listings [datafusion] via GitHub
- Re: [PR] docs: add DataFusion Java to subproject listings [datafusion] via GitHub
[PR] ci: publish docs site to datafusion.apache.org/java/ [datafusion-java] via GitHub
- Re: [PR] ci: publish docs site to datafusion.apache.org/java/ [datafusion-java] via GitHub
[I] Use optimized StringBuilders / BulkNullStringArrayBuilder in more places [datafusion] via GitHub
- Re: [I] Use optimized StringBuilders / BulkNullStringArrayBuilder in more places [datafusion] via GitHub
- Re: [I] Use optimized StringBuilders / BulkNullStringArrayBuilder in more places [datafusion] via GitHub
Re: [PR] Add ASYNC keyword support for CREATE INDEX [datafusion-sqlparser-rs] via GitHub
[I] Decide on sync vs async DataFrame methods [datafusion-java] via GitHub
- Re: [I] Decide on sync vs async DataFrame methods [datafusion-java] via GitHub
- Re: [I] Decide on sync vs async DataFrame methods [datafusion-java] via GitHub
[PR] build(deps): combined dependabot bumps (Cargo + workflows) [datafusion-python] via GitHub
- Re: [PR] build(deps): combined dependabot bumps (Cargo + workflows) [datafusion-python] via GitHub
[PR] Add rand() alias for random() [datafusion] via GitHub
[PR] docs: add Sphinx documentation site with user and contributor guides [datafusion-java] via GitHub
- Re: [PR] docs: add Sphinx documentation site with user and contributor guides [datafusion-java] via GitHub
[PR] docs: add GitHub issue and PR templates [datafusion-java] via GitHub
- Re: [PR] docs: add GitHub issue and PR templates [datafusion-java] via GitHub
[I] [DISCUSS] Simplify regex engine + incompatibility config model [datafusion-comet] via GitHub
[PR] fix: preserve Inexact precision in Statistics::with_fetch when nr <= skip [datafusion] via GitHub
- Re: [PR] fix: preserve Inexact precision in Statistics [datafusion] via GitHub
- Re: [PR] fix: preserve Inexact precision in Statistics [datafusion] via GitHub
[PR] [CLI/TUI] Use only tracing crate for logging in CLI and TUI [datafusion-ballista] via GitHub
- Re: [PR] [CLI/TUI] Use only tracing crate for logging in CLI and TUI [datafusion-ballista] via GitHub
Re: [I] Do not evaluate parquet predicates if they can be proven to be false [datafusion] via GitHub
Re: [PR] feat: initial seed of Apache DataFusion Java bindings [datafusion-java] via GitHub
[I] Expose CsvReadOptions via registerCsv and readCsv [datafusion-java] via GitHub
- Re: [I] Expose CsvReadOptions via registerCsv and readCsv [datafusion-java] via GitHub

Earlier messages