Apache Arrow 12.0.0 (2023年5月2日)
這是一個主要版本,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 97 位不同貢獻者的 531 次提交。
$ git shortlog -sn apache-arrow-11.0.0..apache-arrow-12.0.0
62 Sutou Kouhei
44 Weston Pace
26 Gang Wu
26 Matt Topol
23 Nic Crane
23 mwish
22 Joris Van den Bossche
22 Raúl Cumplido
20 Alenka Frim
19 David Li
19 Felipe Oliveira Carvalho
15 Will Jones
11 Jin Shang
11 rtpsw
9 Rok Mihevc
9 Yevgeny Pats
8 Ben Harkins
7 Fokko Driesprong
7 Jacob Wujciak-Jens
7 eitsupi
6 Bryce Mecum
6 Neal Richardson
6 dependabot[bot]
5 Li Jin
4 Adam Reeve
4 Dewey Dunnington
4 Hirokazu SUZUKI
4 rtadepalli
3 Abe Tomoaki
3 Antoine Pitrou
3 Carlos O'Ryan
3 Danyaal Khan
3 Davide Pasetto
3 Diego Fernández Giraldo
3 Dominik Moritz
3 Fatemah Panahi
3 Haocheng Liu
3 Igor Izvekov
3 Patrick Hoefler
3 Sanjiban Sengupta
3 Vibhatha Lakmal Abeykoon
2 Dinir Imameev
2 Herman Schaaf
2 Min-Young Wu
2 Noah Treuhaft
2 Sven Rebhan
2 Yibo Cai
2 coldWater
1 0x26res
1 Aaron Gorenstein
1 Alexander Diemand
1 Aliaksei Makarau
1 Andrew Lamb
1 Andy Chang
1 Brett Buddin
1 Carl Boettiger
1 Chris Chua
1 Christopher Akiki
1 Curt Hagenlocher
1 Dane Pitkin
1 David Sisson
1 Dmitry Kolmakov
1 Dongjoon Hyun
1 Edward Visel
1 Hongze Zhang
1 Ian Cook
1 Igor Suhorukov
1 Jacob Marble
1 Jie Zhang
1 Jinpeng
1 Judah Rand
1 Junming Chen
1 Laurent Quérel
1 Leo Shklovskii
1 Lubo Slivka
1 Marco Edward Gorelli
1 Martin Hilton
1 Matthijs Brobbel
1 Michael Hancock
1 Michael Lui
1 NoahFournier
1 Rob Sharp
1 Sagnik Dutta
1 Shaheer Ahmad
1 Simon Perkins
1 Theodore Tsirpanis
1 Twice
1 Zaharid
1 abandy
1 cluster
1 david dali susanibar arce
1 flynn
1 gf2121
1 h-vetinari
1 lafiona
1 sunpeng
1 zagto
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到儲存庫。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-11.0.0..apache-arrow-12.0.0
123 Sutou Kouhei
77 Weston Pace
71 Matt Topol
50 Joris Van den Bossche
43 Will Jones
35 David Li
22 Jacob Wujciak-Jens
19 Nic Crane
17 Antoine Pitrou
17 Raúl Cumplido
12 Dewey Dunnington
5 Alenka Frim
5 Eric Erhardt
5 Yibo Cai
4 Rok Mihevc
3 Li Jin
3 Neal Richardson
2 Dominik Moritz
2 Micah Kornfield
1 Matthew Topol
1 dependabot[bot]
變更日誌
Apache Arrow 12.0.0 (2023-04-30 07:00:00)
錯誤修正
- GH-14779 - [C++] 在 Mac M1 上編譯失敗
- GH-14917 - [C++] 當 GTest 使用低於 17 的 C++ 標準編譯時,會發生錯誤 (#34765)
- GH-14923 - [C++][Parquet] 修正 DELTA_BINARY_PACKED 在讀取具有錯誤位元寬度的最後一個區塊時的問題 (#15241)
- GH-15054 - [C++] 變更 s3 最終化在 arrow 執行緒完成後發生,新增 pyarrow 退出掛鉤 (#33858)
- GH-15098 - [C++] 修正 util::EqualityComparable 以在 clang 15 上編譯 (#33940)
- GH-15102 - [C++] 無法解壓縮從 Java arrow SDK 發送的 arrow stream (#15194)
- GH-15109 - [Python] 允許創建具有零欄位的非空 struct 陣列 (#33764)
- GH-15137 - [C++][CI] 修正串流 JSON 讀取器測試中的 ASAN 錯誤 (#33772)
- GH-15139 - [C++] 改進 arrow.pc 的 bzip2 靜態函式庫路徑偵測 (#33712)
- GH-15173 - [C++][Parquet] 修正 ByteStreamSplit Standard 損壞 (#34140)
- GH-15212 - [C++] 修正 ORC 中 sliced list 陣列寫入 (#15213)
- GH-15247 - [R] 嘗試儲存具有 NULL 欄位名稱的 data.frame 時發生錯誤 (#34798)
- GH-15256 - [C++][Dataset] 新增支援使用 Partitioning::Default() 寫入 (#33674)
- GH-28074 - [C++][Dataset] 正確處理 Parquet 謂詞下推中的 NaN (#15125)
- GH-31880 - [Python] Table.filter 與表達式現在使用 use_threads=True 保留順序 (#34766)
- GH-31905 - [DevTools] 新增 Cython 檔案的程式碼檢查 (#14662)
- GH-32512 - [Docs][R] 更新 conda 安裝命令 (#34298)
- GH-32954 - [Java][FlightRPC] 移除 FlightTestUtil#getStartedServer 並直接綁定到 port 0 (#34357)
- GH-33287 - [R] 無法在 http URL 上 read_parquet (#34708)
- GH-33336 - [C++][Parquet] 避免未對齊載入時的 UB (#14488)
- GH-33466 - [Go][Parquet] 新增 Dictionary 陣列對 pqarrow 的支援 (#34342)
- GH-33501 - [Packaging][Release] 新增發行後腳本以新增新版本到 conan (#34022)
- GH-33566 - [C++] 新增對 nullary 和 n-ary 聚合函式的支援 (#15083)
- GH-33600 - [Go][Parquet] bitmap writer 中的 Panic (#14989)
- GH-33616 - [C++] 重新排序 group_by,使 keys/segment keys 在 aggregates 之前 (#34551)
- GH-33689 - [Python][CI] 在 dask nightly tests 上重新啟用 fsspec 測試 (#34925)
- GH-33697 - [CI][Python] PySpark 3.2.0 的 Nightly 測試在 numpy.bool 上失敗並出現 AttributeError (#33714)
- GH-33699 - [C++] 增加在 valgrind 下執行時 c++ 測試的超時時間,並縮短長時間測試 (#33886)
- GH-33701 - [C++] 新增對 LTO (連結時間最佳化) 建置的支援 (#33847)
- GH-33709 - [R] 從 semi_join 和 anti_join 移除 suffix 參數 (#34030)
- GH-33717 - [Go] Flight SQL Server 處理 StreamChunk 錯誤 (#33718)
- GH-33721 - [CI][R] 在 test-r-install-local macOS 上停用 sccache (#34713)
- GH-33726 - [CI][Go] 在 Go 基準測試中設定主機名稱 (#33728)
- GH-33727 - [Python] 如果 pandas categorical 欄位具有字典作為字串而不是物件,則 array() 錯誤 (#34289)
- GH-33754 - [CI] 為 M1 上的驗證任務工作安裝 brewfile 相依性 (#33755)
- GH-33767 - [Go] 清除 ArrowArrayStream.get_next 中的參數 (#33768)
- GH-33777 - [R] Nightly builds 因未在沒有 datasets 模組的建置上跳過 dataset 測試而失敗 (#33778)
- GH-33779 - [R] Nightly builds (R 3.5 和 3.6) 因欄位參考測試而失敗 (#33780)
- GH-33782 - [Release] 投票電子郵件問題編號正在查詢 JIRA 並產生錯誤的數字 (#33791)
- GH-33783 - [C#] 更新發行驗證以使用 .NET 7.0 (#33799)
- GH-33786 - [C++] 忽略舊系統 xsimd (#33811)
- GH-33796 - [C++] 使用系統 GoogleTest 修正錯誤的 arrow-testing.pc 設定 (#33812)
- GH-33801 - [Python] 在 pyarrow 中公開 C++ ExtensionTypes/ExtensionArrays (#33802)
- GH-33813 - [CI][GLib] 使用 Ruby 3.2 更新捆綁的 MSYS2 (#33815)
- GH-33816 - [CI][Conan] 使用 TARGET_FILE 以提高可移植性 (#33817)
- GH-33820 - [CI][Release] 不要在 Ubuntu 20.04 上 libxsimd-dev (#33821)
- GH-33824 - [C++] 改進 diescovery 失敗時的錯誤訊息 (#33848)
- GH-33830 - 澄清 REE 編碼中 Null 值的處理方式 (#33831)
- GH-33849 - [C++] 修正 ARROW_BUILD_SHARED=OFF 和 ARROW_BUILD_EXAMPLES=ON 的建置 (#34350)
- GH-33864 - [Go] 不要直接將 cgo.Handle 強制轉換為 unsafe.Pointer (#33865)
- GH-33876 - [C++][Windows] 為每個設定使用不同的 .pc 路徑 (#33907)
- GH-33882 - [C++] 不要尋找 ARROW_BUILD_STATIC=OFF 的 .pc 檔案 (#34019)
- GH-33887 - [Go] cdata 套件洩漏句柄,難以偵錯 (#33889)
- GH-33904 - [R] 改進 s3_bucket 的行為 - 解決方法 (#34009)
- GH-33911 - [C++] 將遺失的 std::forward 新增至 Result::ValueOrElse (#33912)
- GH-33914 - [Release] 強制 brew install build-from-source 不要從 API 安裝 (#33915)
- GH-33920 - [C++][CI] 在 sanitizer job 中停用 Flight SQL (#34014)
- GH-33932 - [Go] 修正使用不可為 null 的項目 map 欄位建置 RecordBuilder (#33906)
- GH-33934 - [Packaging][Linux] 為 arm64 啟用 Flight (#34717)
- GH-33953 - [Java] 在每個請求上傳遞自訂標頭 (#33967)
- GH-33954 - [C++][Parquet] 為巢狀類型保留 field-id (#33955)
- GH-33963 - [C++] 新增遺失的 arrow/engine 標頭 (#33964)
- GH-33970 - [C#] 使 schema 欄位名稱區分大小寫 (#33978)
- GH-33971 - [C++] 修正 AdaptiveIntBuilder 始終填充資料緩衝區 (#33994)
- GH-33973 - [Python][Docs] 更新 Parquet filter 關鍵字的文件 (#33974)
- GH-34023 - [Docs] 關於檢視舊文件的版本警告不適用於版本 >= 10 (#34178)
- GH-34029 - [Docs] 新增 Ninja 到要安裝的套件 (#34040)
- GH-34035 - [C++] 從公用標頭檔案包含的內部標頭檔案中斷外部專案的建置 (#34036)
- GH-34037 - [Python][Docs] 修正 Table.drop 文件字串 (#34038)
- GH-34044 - [Go] 修正沒有 noasm 標籤的建置 (#34045)
- GH-34047 - [C++][FlightRPC] 使 DoAction 警告不太顯眼 (#34182)
- GH-34076 - [C#] 允許具有重複名稱的 schema 欄位 (#34125)
- GH-34080 - [Python] 新增對 python 的 round_binary 支援 (#34084)
- GH-34082 - [Packaging][deb] 遵循 Debian bookworm 映像變更 (#34091)
- GH-34086 - [C++][Parquet] 修正將 num_rows 寫入資料頁面 v2 (#34096)
- GH-34088 - [Python] : 修正 get_writer 中的錯字 (#34089)
- GH-34092 - [R] 如果提供了 schema 且 col_names 保留為 TRUE (預設值),則 open_csv_dataset() 錯誤 (#34217)
- GH-34098 - [Python][Docs] 修正 dataset 文件字串 (#34099)
- GH-34101 - [Go][Parquet] NewSchemaManifest 建立錯誤的 schema 欄位 (#34127)
- GH-34104 - [Python] 更新 deduplicate_objects 預設值在文件中以符合實作 (#34128)
- GH-34106 - [C++][Parquet] 修正更新 WriteArrowDictionary 的頁面統計資訊 (#34107)
- GH-34138 - [C++][Parquet] 修正從 min_value/max_value 解析統計資訊 (#34112)
- GH-34143 - [Python][Docs] 將 fill_null 新增回 API 參考 (#34144)
- GH-34148 - [C++] 將 zstd 還原回 1.5.2 (#34190)
- GH-34150 - [C++] 修正由於轉換選項預設值初始化不當而導致的錯誤 (#34209)
- GH-34150 - [C++][Python] 修正 ConversionOptions 初始化不當 (#34156)
- GH-34163 - [C++][CI] 確保與捆綁的 ORC 使用相同的 Zstandard (#34164)
- GH-34165 - [Python] 如果未實作 to_pandas_dtype,Extension array 資料類型應預設為儲存類型 (#34559)
- GH-34175 - [Docs] 從 .github/CONTRIBUTING.md 移除 Jira (#34205)
- GH-34188 - [C++][Benchmark] 為捆綁的 gbenchmark 新增遺失的 BENCHMARK_STATIC_DEFINE (#34194)
- GH-34191 - [C++] 確保在捆綁的 ORC 中使用相同的 ProtoBuf (#34192)
- GH-34206 - [C++] 不要讓 jemalloc 定義影響 unity builds (#34185)
- GH-34210 - [C++] 當 TimeUnit 匹配時,使轉換時間戳記和持續時間為零複製 (#34270)
- GH-34211 - [R] 確保 Arrow 陣列在嘗試存取底層 ChunkedArray 之前未實體化 (#34489)
- GH-34214 - [C++] 將 OPENSSL_ROOT_HINT 傳遞到捆綁 AWS 的 CMAKE_PREFIX_PATH (#34215)
- GH-34228 - [R] 當透過 pkg-config 找到 Arrow 時,新增 LIB_DIR (#34229)
- GH-34230 - [Java] 在 BaseAllocator#wrapForeignAllocation 上呼叫分配監聽器 (#34231)
- GH-34238 - [C++][Python] 在具有未對齊區塊的表格上呼叫 groupby 時發生 Segfault
- GH-34241 - [C++] 修正 ExecSpanIterator 以正確初始化空字典陣列 (#34246)
- GH-34244 - [Go][FlightRPC] SQLite 範例報告交易支援 (#34245)
- GH-34256 - [Dev] 使用 main 作為新的預設分支更新發行腳本 (#34413)
- GH-34269 - [C++] 修正包含檔案名稱 (#34285)
- GH-34271 - [C++] 移除 Thrift GitHub 歸檔來源 url (#34273)
- GH-34283 - [Python] 為 to_pandas 的索引新增 types_mapper 支援 (#34445)
- GH-34284 - [Java][FlightRPC] 修正了準備好的語句被發送兩次的問題 (#34358)
- GH-34296 - [C++][CI] 強制 appveyor 建置使用 conda-forge 並忽略預設通道 (#34297)
- GH-34301 - [CI][Packaging][RPM][arm64] 使用 closer.lua 下載 KEYS (#34302)
- GH-34303 - [CI][Packaging][deb] 在 Debian GNU/Linux bookworm 上使用系統 Meson (#34304)
- GH-34306 - [CI][Packaging][RPM] 不要在 CentOS Stream 8 上安裝 utf8proc-devel (#34307)
- GH-34308 - [CI][C++] 使用 str("") 重設舊 g++ 的 std::stringstream (#34317)
- GH-34309 - [C++] 為 aws_lc 和 s2n-tls 停用 LTO (#34349)
- GH-34324 - [CI][C++] 為舊 g++ 明確指定集合元素類型 (#34325)
- GH-34326 - [C++][Parquet] 如果停用了統計資訊,頁面 null_count 不正確 (#34327)
- GH-34366 - [R] 不要 getFromNamespace() dplyr:::check_name() 輔助函數 (#34369)
- GH-34367 - [Java] 修正來自循序合併的建置錯誤 (#34368)
- GH-34381 - [Dev] 從 arrow-site committers.yml 檢索提交者,而不是依賴 author_association (#34557)
- GH-34385 - [Go] 讀取啟用壓縮但未壓縮緩衝區的 IPC 檔案 (#34476)
- GH-34395 - [Python] 新增對符號連結 Arrow 相關包含目錄的支援 (#34674)
- GH-34404 - [Python] 測試失敗,因為 pandas.Index 現在可以儲存所有數值 dtype (不僅僅是 64 位元版本) (#34498)
- GH-34410 - [Python] 允許使用大於預設值的區塊大小 (#34435)
- GH-34432 - [Java] NoCompressionCodec 為不支援的編碼解碼器類型拋出異常 (#34580)
- GH-34446 - [C++][Parquet] 修正 RecordReaderPrimitveTypeTests 測試 (#34447)
- GH-34464 - [R] 遺失 rlang import - inform (#34465)
- GH-34467 - [R] 在 R 版本 < 4.0.0 上停用 DuckDB 測試 (#34468)
- GH-34472 - [Go][FlightRPC] 排空 Flight SQL 用戶端中 DoAction 的結果 (#34473)
- GH-34474 - [C++] 偵測並在聯結需要過多金鑰資料時引發錯誤 (#35087)
- GH-34479 - [Java] java-jars 因衝突的 slf4j 綁定而失敗 (#34480)
- GH-34492 - [Go] 修正遺失的布林值 plain 編碼器狀態更新 (#34493)
- GH-34496 - [C++][Parquet] 當 num_values = 0 時,修正在
MakePages
中的 parquet 單元測試 (#34497) - GH-34513 - [CI][Python] 從 _acero.pyx 移除未使用的 imports 以修正程式碼檢查失敗 (#34514)
- GH-34519 - [C++][R] 修正在專案與欄位同名的資料集掃描 (#34576)
- GH-34539 - [C++] 修正 throttled scheduler 以避免資料集寫入器中的堆疊溢位 (#35075)
- GH-34540 - [C++] 移除已設定但未使用的變數 (#34541)
- GH-34546 - [C++] 支援從 large string 轉換為 string 純量 (#34549)
- GH-34568 - [C++][Python] 在 Python Arrow 中公開 Run-End Encoded 陣列 (#34570)
- GH-34579 - [Python][Docs] TableGroupBy.aggregate 選項 (#34759)
- GH-34597 - [Packaging][RPM] 不要使用 glog (#34598)
- GH-34603 - [Go][Parquet] 使用空字串寫入字典時出現問題 (#34709)
- GH-34605 - [C++] 當將 shared_ptr 傳遞到命名表格時,不要使用 std::move … (#34606)
- GH-34619 - [C++] 新增擴充陣列處理到 ArraySpan 轉換 (#34684)
- GH-34621 - [GLib] 不要使用 “g_strdup(XXX->ToString().c_str())” (#34624)
- GH-34622 - [CI][GLib] 使用 “meson setup …” (#34623)
- GH-34629 - [Go] 修正 transpose_ints 以在 riscv64-freebsd 上工作 (#34647)
- GH-34633 - [C++][Parquet] 修正 StreamReader 以讀取 decimals (#34720)
- GH-34639 - [C++] 支援 RecordBatch::FromStructArray,即使 struct 陣列具有 nulls/offsets (#34691)
- GH-34641 - [CI][Python] 將 test_acero.py 上的 test_scan 標記為需要 dataset (#34642)
- GH-34643 - [CI] 修正用於測試不可壓縮資料的檔案 (#34646)
- GH-34653 - [CI][C++] 修正 alpine-linux-cpp 上 arrow-dataset-file-json-test segfault (#35047)
- GH-34655 - [CI][C++] arrow-compute-internals-test 在 test-cuda-cpp 上失敗,並顯示 `No function registered with name: equal`
- GH-34661 - [CI][C#] 更新 Ubuntu C# jobs 以使用具有 .NET 7.0 的映像 (#34662)
- GH-34667 - [C++][Parquet] 使用無效輸入測試 DeltaLengthByteArrayDecoder (#34668)
- GH-34670 - [Packaging][C++] 新增自訂 GDB 外掛程式安裝目錄的支援 (#34672)
- GH-34696 - [C++] 檢查 REE 陣列在 Validate() 中沒有 null 緩衝區 (#34697)
- GH-34731 - [Python] 在建立 RecordBatchReader 時釋放 GIL (#34732)
- GH-34743 - [Python] 放寬不穩定的 Flight 測試中的條件 (#34747)
- GH-34753 - [C++] Nightly builds 在 EnsureAlignment 中失敗 (#34754)
- GH-34771 - [C++] 新增在 FreeBSD/amd64 上編譯的支援 (#34772)
- GH-34786 - [C++] 修正 Substrait 消費者為 AggregateRel 計算的輸出 schema (#34904)
- GH-34801 - [C++] 從 arrow.pc 移除不必要的 “Requires.private: libcurl openssl” (#34810)
- GH-34807 - [Go] 處理讀取 parquet 頁腳大小和 magic bytes 時的
io.EOF
(#34808) - GH-34823 - [C++][ORC] 修正 ORC CHAR 類型映射 (#34836)
- GH-34831 - [C++] 在其他檢查之前檢查 REE 子緩衝區是否有效 (#34833)
- GH-34843 - [R] 修正 R 建置因 Acero 重構而失敗 (#34844)
- GH-34862 - [C++] 修正 ArrowDataset 相依性 (#34866)
- GH-34869 - [C++] 設定 alpine linux nightly job 從原始碼建置 gtest (#34870)
- GH-34871 - [C++] 修正 add_dataset_test 函數以正確參考測試檔案 (#34872)
- GH-34906 - [C++] 如果從已關閉的 ArrayStreamBatchReader 讀取,則傳回無效狀態而不是 segfault (#35016)
- GH-34933 - [Python] 提高最低 cython 版本 (#34935)
- GH-34937 - [R] Minimal 建置因依賴 snappy 安裝的新測試而失敗 (#34938)
- GH-34944 - [Python] 修正當轉換具有 getitem 的非序列物件在 pa.array() 中時崩潰 (#34958)
- GH-34953 - [Ruby] 變更
Table.slice
中的 null 選擇行為為:drop
(#34954) - GH-34960 - [C++] test util 修正 arrow Random Generator 遺失的可為 null 資訊 (#34961)
- GH-34973 - [CI][Packaging] 修正 wheel-clean 中的腳本路徑 (#34974)
- GH-34977 - [C++] 修正 arrow-dataset.pc 中的 “Requires” 格式 (#34978)
- GH-34983 - [C++] 在 C 資料介面匯入時保留 map 值的可為 null 性 (#35013)
- GH-34988 - [C#] 修正 CDataSchemaPythonTest 中的 Windows 特定測試問題 (#34989)
- GH-34995 - [C++] 改進 SYSTEM 案例的可用 GTest 檢查 (#34997)
- GH-35008 - [C++] 為 REETestData 和 PageIndexReaderParam 新增印表機以安撫 Valgrind (#35011)
- GH-35014 - [Python] 確保單元測試可以在沒有 acero 的情況下執行 (#35017)
- GH-35018 - [CI][Java][C++] 為 LLVM 使用 ARROW_ZSTD_USE_SHARED=OFF (#35023)
- GH-35021 - [Python][CI] 在 test-conda-python 中使用 conda 的 gdb (#35024)
- GH-35029 - [CI][C#] 在 ubuntu-csharp 映像上安裝 python 以修正 nuget CI 建置 (#35030)
- GH-35038 - [R] arrow_table 中的參數順序影響物件回傳類型 (#35039)
- GH-35056 - [Python][CI] 不要在 Windows 上安裝 gdb (#35057)
- GH-35060 - [C#][CI] 更新 dotnet 下載連結 regex (#35061)
- GH-35062 - [Go][CI] 修正驗證失敗 (#35077)
- GH-35063 - [CI] 修正 C# 測試中的 Python 需求 (#35091)
- GH-35066 - [CI][Packaging][Linux] 釋放更多磁碟空間 (#35128)
- GH-35069 - [Archery][Release] 移除在 Archery 發行版本上從遷移註解中檢索 ARROW 問題 (#35070)
- GH-35073 - [R] Minimal 建置失敗 (未定義 acero 符號) (#35074)
- GH-35086 - [Java][CI] 升級 CycloneDX Maven 外掛程式版本 (#35092)
- GH-35089 - [CI][C++][Flight] macos 發行驗證 nightly 中的測試失敗 (#35090)
- GH-35115 - [C++] 將 util_avx2.cc 從 acero 移動到 compute (#35117)
- GH-35133 - [Go] 修正在 32 位元架構中
math.MaxUint32 overflows int
錯誤 (#35159) - GH-35143 - [R][C++] 修正 shape tensor 導致 OSX 上建置中斷 (#35154)
- GH-35170 - [CI][Packaging][Conan] 建置 grpc-proto (#35203)
- GH-35181 - [R] 在 versions.json 中 Bump R 套件版本號碼 (#35132)
- GH-35186 - [CI][C++] 改進 Windows + vcpkg 上的 GoogleTest 偵測 (#35200)
- GH-35187 - [CI][C++] 使用最新的 arrow-testing (#35227)
- GH-35192 - [Docs] 從
logo
切換到logo_url
以支援 sphinx >= 6 (#35194) - GH-35205 - [C++][Gandiva] 當我們使用捆綁的版本時,不要尋找系統 Zstandard (#35220)
- GH-35206 - [C++] 在 Windows 驗證中尋找 Conda OpenSSL (#35225)
- GH-35235 - [CI][Python] Pandas upstream_devel 和 nightlies 正在失敗 (#35248)
- GH-35252 - [C++] 使用 ArrowTesting 的 FindGTestAlt.cmake (#35253)
新功能與改進
- GH-14863 - [C++] 將 appender 函數新增至可以接受 optionals 的陣列建構器 (#24372)
- GH-14866 - [C++] 移除內部 GroupBy 實作 (#14867)
- GH-14912 - [Java] 移除 arrow-vector、arrow-jdbc 和 arrow-algorithm 中 PlatformDependent 的用法 (#14913)
- GH-14939 - [C++] 支援 FieldRef 和 FieldPath 中的 Table 查找 (#34537)
- GH-15059 - [C++][Acero] 從表達式而不是 fragment 填充 guarantee 欄位 (#15129)
- GH-15070 - [Python][CI] 更新 pandas 測試以應對 pandas 2.0.1 中空的欄位 dtype 變更 (#35031)
- GH-15070 - [Python][CI] 與 pandas 2.0 相容性 (#34878)
- GH-15107 - [C++][Parquet] Parquet 編碼器: 支援 Boolean 的 RLE (#34526)
- GH-15164 - [C++][Parquet] 實作目前版本的 BloomFilter 規格 (#33776)
- GH-15171 - [C++] 透過值傳遞 std::string_view (#33684)
- GH-15193 - [C++][Parquet] Parquet FuzzReader 新增一些固定批次大小 (#33942)
- GH-15195 - [C++][FlightRPC][Python] 為 Flight 類型新增 ToString/Equals (#15196)
- GH-15203 - [Java] 實作寫入壓縮檔案 (#15223)
- GH-15209 - [C++][Gandiva] 新增 abs 函數 (#15208)
- GH-15231 - [C++][Benchmarking] 新增新的記憶體池指標並在基準測試中追蹤 (#33731)
- GH-15280 - [C++][Python][GLib] 新增 libarrow_acero,其中包含先前在 compute/exec 中的所有內容 (#34711)
- GH-15280 - [C++] 重構以重新組織相依性,作為將 acero 移出 libarrow 的前奏 (#34518)
- GH-15284 - [C++] 在 Acero 計劃測試中使用 DeclarationToExecBatches (#15288)
- GH-15285 - [GLib] 新增 GArrowMatchSubstringOptions (#34725)
- GH-15286 - [GLib] 新增 GArrowIndexOptions (#34679)
- GH-15287 - [Ruby] 在 Table#join 中合併欄位並新增後綴 (#33654)
- GH-15483 - [C++] 新增固定形狀張量標準擴充類型 (#8510)
- GH-18481 - [C++] 偏好轉換常值而非轉換欄位參考 (#15180)
- GH-18487 - [R] 從字元向量讀取文字 (CSV/JSON) (#33968)
- GH-18818 - [R] 建立 struct 中欄位的欄位參考 (#19706)
- GH-20117 - [Dev] 要求 INFRA 將預設分支切換至 main
- GH-20272 - [C++] 提升捆綁 AWS SDK 的版本 (#33808)
- GH-20351 - [C++] 執行長度編碼類型的核心輸入類型匹配器 (#34503)
- GH-20407 - [Go] REE 陣列的陣列建構器 (#14114)
- GH-20408 - [Go] 實作 REE 的編碼和解碼函數 (#34534)
- GH-20415 - [Go] RLE 的核心輸入類型 (#14146)
- GH-20484 - [Swift] 初始 Arrow 實作 (#14561)
- GH-21429 - [GLib] 新增 GArrowDenseUnionArrayBuilder (#34981)
- GH-21430 - [GLib] GArrowSparseUnionArrayBuilder (#34992)
- GH-25163 - [C#] 支援半精度浮點陣列。 (#34618)
- GH-25986 - [C++] 為加密金鑰啟用外部材料和旋轉 (#34181)
- GH-29705 - [Python] 移除已棄用的 pyarrow.serialization 功能 (#34926)
- GH-30774 - [Python] 移除已棄用的
use_async
(#34034) - GH-31148 - [Dev] 更新儲存庫中的 URL 以指向 main (#34218)
- GH-31506 - [Python] 處理串流和檔案存取 (Factory Functions) 中的文件字串 (#33609)
- GH-31507 - [Python] 處理串流和檔案存取 (Stream Classes) 中的文件字串 (#33698)
- GH-31548 - [Python] 測試在類型推斷期間是否接受 zoneinfo 時區 (#34394)
- GH-31715 - [Python] 改善類別和方法文件字串 - 串流和檔案存取
- GH-31809 - [Docs] 新增關於如何收集產生的遙測資料的指示 (#33873)
- GH-31868 - [C++] 支援串連擴充陣列 (#14463)
- GH-31910 - [C++] 新增對 Substrait cast 運算式的支援 (#34050)
- GH-32050 - [C++] 在分塊陣列上實作 Rank 核心 (#33846)
- GH-32104 - [C++] 新增對 Arrow 的執行長度編碼資料的支援 (#33641)
- GH-32105 - [C++] 編碼和解碼執行長度編碼向量 (#34195)
- GH-32240 - [C#] 新增 Apache.Arrow.Compression 套件以實作 IPC 解壓縮 (#33893)
- GH-32240 - [C#] 支援從 ReadOnlyMemory 讀取 IPC 串流時的解壓縮 (#34108)
- GH-32240 - [C#] 支援 IPC 格式緩衝區的解壓縮 (#33603)
- GH-32292 - [R][Packaging] 針對 Ubuntu < 22.04 使用在 CentOS 7 上建置的二進位檔 (#34048)
- GH-32338 - [C++] 新增對執行長度編碼陣列的 IPC 支援 (#34550)
- GH-32613 - [C++] 簡化 dense union 的 IPC writer (#33822)
- GH-32619 - [Python][Docs] 明確包含 PyArrow 建置的選項 (#34463)
- GH-32653 - [C++] 清理執行引擎中的錯誤處理 (#15253)
- GH-32747 - [C++] Substrait To Arrow Emit 功能測試 (#14174)
- GH-32801 - [C++][Docs] 刪除過時的 .md 檔案 (#33829)
- GH-32804 - [Dev] 在遷移到 “main” 作為預設 Git 分支後,從 core.py 中 Target 類別的 default_branch 屬性移除 “master”
- GH-32916 - [C++][Python] 使用者定義的表格函數 (#14682)
- GH-32946 - [Go] 實作 REE 陣列和 Compare (#14111)
- GH-32947 - [Go] 實作 REE 陣列的 Concatenate (#14126)
- GH-32949 - [Go] REE 陣列 IPC 讀取/寫入 (#14223)
- GH-33024 - [C++][Parquet] 將 DELTA_LENGTH_BYTE_ARRAY 編碼器新增至 Parquet writer (#14293)
- GH-33115 - [C++] Parquet 實作 DATA_PAGE (v1) 的 Page 讀取和寫入中的 crc (#14351)
- GH-33143 - [C++] local_time 計算核心的命名和文件/測試變更 (#34263)
- GH-33143 - [C++] 將具有時區的時間戳記轉換為本地時間的核心 (#34208)
- GH-33209 - [C++] 支援讀取 JSON 資料集 (#33732)
- GH-33215 - [Dev] 在預設分支遷移後,將 dev/archery/archery/crossbow/core.py 中的硬編碼字串 “master” 替換為 “main”
- GH-33243 - [Plasma] 移除 (#34718)
- GH-33317 - [C++] 確保陣列物件符合對齊要求的公用程式方法 (#14758)
- GH-33377 - [Python] Table.drop 應支援傳遞單一欄位 (#33810)
- GH-33439 - [CI] Substrait 整合測試 (#14596)
- GH-33580 - [C++] 支援 Substrait 擴充多重和 AsOfJoin 中的 emit 資訊 (#14799)
- GH-33588 - [Substrait] 為 round operationMajor 新增 Substrait→Acero 映射 (#33775)
- GH-33596 - [C++][Parquet] Parquet 頁面索引讀取支援 (#14964)
- GH-33621 - [Documentation][Developer Tools] 新增 CODEOWNERS 檔案 (#33622)
- GH-33631 - [R] 在 pkgdown 文件中將 Jira 票證號碼重寫為 GitHub issue 號碼 (#34260)
- GH-33640 - [C++] 將背壓新增至 asof join 節點 (#33648)
- GH-33652 - [C++][Parquet] 新增介面 total_compressed_bytes_written (#33897)
- GH-33655 - [C++][Parquet] 修正 TestArrowReadWrite.MultithreadedWrite 中的偶發性失敗 (#33739)
- GH-33655 - [C++][Parquet] 並行寫入 parquet 欄位 (#33656)
- GH-33659 - [Developer Tools] 新增重大變更和關鍵修復的定義 (#33660)
- GH-33673 - [C++] 標準化 as-of-join 過去和未來容差的慣例 (#33676)
- GH-33679 - [JS] 更新相依性 (#33680)
- GH-33681 - [JS] 更新 flatbuffers (#33682)
- GH-33723 - [C++] 必須檢查 re2::RE2::RE2() 的結果 (#33806)
- GH-33724 - [Doc] 使用最新的支援更新 substrait 一致性文件 (#33725)
- GH-33734 - [Go] 使與 grpc < 1.45 相容 (#33735)
- GH-33737 - [C++] 簡化 exec 計劃追蹤 (#33738)
- GH-33741 - [Python] 處理資料類型 Factory Functions 中的文件字串 (#33785)
- GH-33742 - [Python] 處理資料類型類別中的文件字串 (#34380)
- GH-33746 - [R] 更新 11.0.0 的 NEWS.md (#33748)
- GH-33750 - [GLib] 新增 garrow_table_batch_reader_set_max_chunk_size() (#34601)
- GH-33760 - [R][C++] 處理掃描器中的巢狀欄位參考 (#33770)
- GH-33787 - [C++] 抑制 s390x 上 LinuxParseCpuFlags() 的 unused-value 警告 (#33828)
- GH-33789 - [Go] 將 Err() 新增至 RecordReader (#33792)
- GH-33794 - [Go] 將 SetRecordReader 新增至 PreparedStatement (#33795)
- GH-33800 - [Packaging] 移除對 Ubuntu 18.04 的支援 (#34020)
- GH-33825 - [Python] 公開 pyarrow.dataset.get_partition_keys (從分割區運算式取得金鑰/值) (#33862)
- GH-33835 - [Doc][Release] 改善發佈指南指示 (#33836)
- GH-33840 - [Go] 改善 SQLite Flight SQL 範例並提供 mainprog (#33841)
- GH-33850 - [C++] 允許設定 Substrait 的預設擴充提供者 (修正) (#34075)
- GH-33850 - [C++] 允許設定 Substrait 的預設擴充提供者 (#34042)
- GH-33851 - [C++] 更新捆綁的 boost 版本 (#33890)
- GH-33852 - [Go] 從 Flight SQL 範例伺服器傳回目錄/結構描述 (#33853)
- GH-33859 - [C++][Java] 將 Apache ORC 提升至 v1.8.2 (#33860)
- GH-33867 - [Go][FlightSQL] 允許將 grpc 呼叫選項傳遞至 PreparedStatement 方法 (#33868)
- GH-33872 - [C++] 移除 AppendScalar 中 hacky shared_ptr 建構 (#33866)
- GH-33874 - [Java] 確保在 JDBC 驗證握手期間包含自訂標頭 (#33946)
- GH-33875 - [Go] 處理寫入 LargeString 和 LargeBinary 類型 (#33965)
- GH-33892 - [R] 將
dplyr::n()
映射到count_all
核心 (#33917) - GH-33895 - [Release] 新增腳本以新增 RubyGems 的新擁有者 (#33896)
- GH-33899 - [C++] 將 NamedTapRel 關係新增為 Substrait 擴充 (#33909)
- GH-33901 - [Go] 新增基於 malloc 的分配器 (#33902)
- GH-33923 - [Docs] 張量標準擴充類型規格 (#33925)
- GH-33924 - [Format] 固定形狀張量作為標準擴充類型
- GH-33926 - [Python] pyarrow.RecordBatch 的 DataFrame 交換協定 (#34294)
- GH-33935 - [Go][FlightRPC] 實作 Flight SQL 擴充 (#34039)
- GH-33936 - [Go] C 資料介面:匯出 nil 緩衝區的虛擬緩衝區 (#33951)
- GH-33957 - [C++] 新增 Rank 分塊陣列基準測試 (#34602)
- GH-33972 - [C++] 將 metadata 傳遞至 ParquetReader (#34015)
- GH-33977 - [Dev] PR 工作流程自動化機器人 (#34161)
- GH-33990 - [C++] 我知道 NAN != NAN 但 literal(NAN) == literal(NAN) 不應該成立嗎?
- GH-33993 - [Java] 在建立 Flight 伺服器時讓作業系統指派測試中的埠 (#33992)
- GH-33998 - [R] 更新 vignettes 以參考新的 open_*_dataset 函數 (#34710)
- GH-34003 - [C++][nodiscard] (#34006)
- GH-34004 - [C++] 新增 benchmarks-maximal CMake 預設集 (#34005)
- GH-34007 - [C++] 將 array_span_mutable 介面新增至 ExecResult (#34008)
- GH-34011 - [Doc] 確保在完整文件建置中啟用 substrait (#34024)
- GH-34011 - [Python][Doc] 將 pyarrow.substrait 新增至 pyarrow 的 API 參考文件 (#34012)
- GH-34051 - [C++] GcsFileSystem 延遲啟動循序讀取 (#34052)
- GH-34053 - [C++][Parquet] 寫入 parquet 頁面索引 (#34054)
- GH-34055 - [Go][CI] 在 CI 中新增使用 noasm 標籤的測試執行 (#34167)
- GH-34056 - [C++] 新增公用程式函數,以簡化將任何基於列的結構轉換為
arrow::RecordBatchReader
或arrow::Table
(#34057) - GH-34059 - [C++] 新增基於批次索引的 fetch 節點 (#34060)
- GH-34063 - [C++] 避免
GcsFileSystem::ReadAt()
中的浪費 (#34065) - GH-34074 - [GLib][FlightRPC] 新增對驗證的支援 (#34090)
- GH-34077 - [Go] 實作 RunEndEncoded Scalar (#34079)
- GH-34078 - [C++][Parquet] BloomFilter 的次要 API 改善 (#33995)
- GH-34094 - [C++] 針對 clang >= 16 增加 Boost 最小版本 (#34100)
- GH-34113 - [C++][Thirdparty] 將 zstd 提升至 v1.5.4 (#34114)
- GH-34118 - [C++][Python] 使 S3 事件迴圈執行緒的數量可配置 (#34134)
- GH-34119 - [C#] 運算子至 Schema (#34126)
- GH-34122 - [C++] 允許在不需要 Substrait 映射的情況下呼叫函數註冊表函數 (#34288)
- GH-34136 - [C++] 將排序的概念新增至 ExecPlan (#34137)
- GH-34142 - [C++][Parquet] 修正記錄不跨越多個頁面 (#34193)
- GH-34147 - [C++][Parquet] 支援 DICTIONARY_PAGE 上的 crc 計數和檢查 (#34254)
- GH-34154 - [Python] 將
is_nan
方法新增至 Array 和 Expression (#34184) - GH-34157 - [C++] 設定捆綁的 AWS SDK 以使用 aws-lc 而非 OpenSSL (#34159)
- GH-34171 - [Go][Compute] 實作 “Unique” 核心 (#34172)
- GH-34174 - [Docs][Release] 將 Twitter 新增至發佈後任務 (#34202)
- GH-34186 - [Go] 新增 arrow.MapOfWithMetadata 以支援 (#34207)
- GH-34197 - [R][CI] 將先前的 R 套件版本新增至向後相容性 CI 工作 (#34198)
- GH-34199 - [R] 遞增 NEWS.md 中的 R 套件版本 (#34200)
- GH-34219 - [Go][FlightRPC] 將交易新增至 Sqlite FlightSQL 範例 (#34220)
- GH-34242 - [C++][Parquet] 最佳化 parquet 結構描述中 shared_ptr 的註解和移動 (#34243)
- GH-34248 - [Python] 公開 order_by 節點 (#34654)
- GH-34248 - [C++] 新增 order_by 節點 (#34249)
- GH-34257 - [Docs] 更新外部專案的 git 連結/分支,從 master 變更為 main (#34502)
- GH-34262 - [C++][ORC] 支援 union 類型 (#34416)
- GH-34266 - [C++] 新增 pivot_longer 節點 (#34267)
- GH-34278 - [C++] 在命名表格提供者中公開結構描述 (#34279)
- GH-34280 - [C++][Python] 釐清 row_group_size 的含義並將預設值變更為 1Mi (#34281)
- GH-34322 - [C++][Parquet] ByteArray 的編碼微基準測試 (#34323)
- GH-34330 - [Go][Parquet] : 新增擴充類型支援 (#34631)
- GH-34332 - [Go][FlightRPC] 為
database/sql
框架新增驅動程式 (#34331) - GH-34334 - [Go][CSV] 支援 list 欄位 (#34343)
- GH-34335 - [C++][Parquet] 最佳化 DELTA_LENGTH_BYTE_ARRAY 的解碼 (#34955)
- GH-34339 - [R] 將
skip_rows_after_names
選項新增至read_csv_arrow
的選項 (#34340) - GH-34359 - [Python] 將 select 方法新增至 pyarrow.RecordBatch (#34360)
- GH-34361 - [C++] 修正沒有點陣圖的類型 (例如 Unions 和執行長度編碼) 的邏輯 null 處理 (#34408)
- GH-34382 - [C++] 在 run_end_encode 和 run_end_decode 函數中支援更多類型 (#34761)
- GH-34388 - [C++] 無條件建置核心計算核心 (#34295)
- GH-34398 - [R] 更新 11.0.0.3 的 NEWS.md (#34399)
- GH-34405 - [C++] 在 QueryOptions 中新增對自訂名稱的支援。將其連接到 Substrait (#34406)
- GH-34411 - [Python] 變更陣列建構子以接受 pyarrow 陣列 (#34275)
- GH-34417 - [C++][Flight] 升級 OpenTelemetry SemanticConventions 標頭 (#34419)
- GH-34421 - [R] 讓 GcsFileSystem 取得 json_credentials 的路徑 (#34524)
- GH-34422 - [R] 公開 GcsFileSystem$options (#34477)
- GH-34425 - [GLib] 新增 GArrowRankOptions (#34458)
- GH-34428 - [Python][Docs] 為
make_fragment
新增文件字串 (#34429) - GH-34437 - [R] 使用 FetchNode 和 OrderByNode (#34685)
- GH-34440 - [Ruby] 新增對沒有區塊的
RecordBatch{File,Stream}Reader#each
的支援 (#34441) - GH-34442 - [Ruby][FlightRPC] 新增
ArrowFlight::RecordBatchReader#each
(#34444) - GH-34453 - [Go] 支援使用者定義擴充的建構器 (#34454)
- GH-34481 - [CI] 將 ARM 工作從 Travis 遷移至自架主機執行器 (#34482)
- GH-34499 - [R] 在發佈後提升 NEWS.md 中的版本 (#34500)
- GH-34536 - [Parquet][C++] 覆寫 DeltaBitPackEncoder 的預設組態 (#34632)
- GH-34543 - [CI] 自架主機 ARM 工作流程改進 (#34512)
- GH-34547 - [C++][ORC] 移除已棄用的 ORC_UNIQUE_PTR (#34548)
- GH-34552 - [C++][Parquet] 從上游同步 parquet.thrift (#34553)
- GH-34561 - [C++] 實作 RunEndEncodedBuilder::AppendEmptyValues() (#34562)
- GH-34564 - [Python][C++] 更新程式碼以使用 cython 3 編譯 (#34726)
- GH-34565 - [C++] 教導 dataset_writer 接受自訂檔案名稱函子 (#34984)
- GH-34572 - [Go][CSV] 新增 CSV 的二進位支援 (#34558)
- GH-34581 - [C++][Java] 將 Apache ORC 提升至 v1.8.3 (#34582)
- GH-34584 - [Go][CSV] 新增擴充類型支援 (#34585)
- GH-34590 - [C++][ORC] 修正 orc 和 arrow 之間的 timestamp 類型映射 (#34591)
- GH-34595 - [C++] 更新 google-cloud-cpp 至 v2.8.0 (#34707)
- GH-34615 - [CI][C++] 為沒有 ARROW_COMPUTE 的基本格式支援新增 CI 工作 (#34617)
- GH-34626 - [C++] 新增已排序/分段聚合 Substrait 擴充 (#34627)
- GH-34630 - [C++] 第二個重構區塊,將 acero 移出 libarrow (#34575)
- GH-34638 - [C++][Docs] 新增最小建置旗標的文件 (#34693)
- GH-34644 - [C++] 預設在 Substrait 中偏好不安全轉換 (#34645)
- GH-34650 - [GLib] 新增 GArrowFilterNodeOptions (#34663)
- GH-34659 - [C++] 檢閱圍繞執行長度編碼陣列的驗證流程,以改善 Python 整合 (#34628)
- GH-34665 - [Parquet][C++] 允許讀取 BloomFilter (#34728)
- GH-34669 - [Packaging][Conda] 更新 arrow feedstock 相依性 (#34652)
- GH-34673 - [C++][Parquet] 為 parquet 新增布林編碼基準測試 (#34676)
- GH-34686 - [Python] 新增 RunEndEncodedScalar 類別 (#34924)
- GH-34687 - [CI][Python] 建立工作以從 gemfury 移除舊的 nightly wheels (#34705)
- GH-34692 - [Java] 公開 Location.toSocketAddress (#34648)
- GH-34700 - [Packaging][RPM] 在 AlmaLinux 8+ 上使用 lz4-libs 而非 lz4 (#34716)
- GH-34703 - [Python] 在建立 pandas Series 時明確設定 copy=False (#34593)
- GH-34737 - [C#] Schema 和類型的 C 資料介面 (#34133)
- GH-34742 - [Java] 分割 flight-sql-jdbc-driver 以方便重複使用 (#34678)
- GH-34768 - [C++][Gandiva] 移除 LLVM<16 pin (#34922)
- GH-34768 - [C++][Gandiva] 接受 LLVM 16 (#34916)
- GH-34778 - [Java] 僅將 ServerInterceptorAdapter 邏輯套用至 Flight 服務請求 (#34815)
- GH-34790 - [Go] : 新增 array.Edits.UnifiedDiff (#34827)
- GH-34790 - [Go] : 新增 array.Diff() (#34806)
- GH-34796 - [C++] 將 FromTensor、ToTensor 和 strides 方法新增至 FixedShapeTensorArray (#34797)
- GH-34802 - [C++][Parquet] 允許將 pool 傳遞至解碼器 (#34803)
- GH-34805 - [CI][Python] Cython 測試在 conda 套件建置中失敗
- GH-34812 - [Packaging][Python] 針對 Linux arm64 wheels 使用自架主機 arm64 Linux 執行器,而非 Travis CI (#34835)
- GH-34813 - [C++] 改善 GoogleTest 偵測 (#34920)
- GH-34819 - [Ruby] 新增 Slicer::ColumnCondition#match_substring (#34902)
- GH-34821 - [DOC][ORC] 更新 ORC 的文件 (#34822)
- GH-34832 - [Go] 新增 Record SetColumn 方法 (#34794)
- GH-34837 - [GLib][Ruby] 新增 Arrow::{Sparse,Dense}UnionArray#get_value (#34838)
- GH-34839 - [Go] 建置 compute 而不在非 amd64 GOARCH 的情況下使用 noasm (#34840)
- GH-34853 - [Go] 新增 TotalRecordSize, TotalArraySize (#34854)
- GH-34855 - [Go] 將 GetValue 函數新增至 Metadata (#34856)
- GH-34863 - [Go] Decimal 資料類型的 Pow 方法 (#34864)
- GH-34879 - [Python][CI] 使用最新 dask 的 nightly 整合測試失敗 (test_null_partition_pyarrow)
- GH-34880 - [Python][CI] 修正 Windows 測試在使用最新 pandas 2.0 時失敗的問題 (#34881)
- GH-34882 - [Python] FixedShapeTensorType 的繫結 (#34883)
- GH-34888 - [C++][Parquet] Writer 支援新增額外的 kv meta (#34889)
- GH-34893 - [C++] 修正以反向迭代 manifest 的執行長度編碼陣列迭代器問題 (#34896)
- GH-34899 - [C++] 相依性:將 zstd 提升至 v1.5.5 (#34900)
- GH-34914 - [Packaging][Linux] 新增對 Acero 的支援 (#34915)
- GH-34945 - [C++][Docs] 將遺失的 cmake_minimum_required() 新增至範例 (#34969)
- GH-34946 - [Ruby] 移除 DictionaryArrayBuilder 相關的遺漏 (#34947)
- GH-34951 - [Ruby] 新增使用 MatchSubStringFamilyCondition 的方法 (#34952)
- GH-34956 - [Docs][Python] 將 FixedShapeTensorType 的用法新增至文件 (#34957)
- GH-34962 - [Go] 使 Array 介面上的 GetOneForMarshal 公開 (#34964)
- GH-34968 - [C++] 將 Equal Options 新增至 RecordBatch (#34970)
- GH-35025 - [Python] 移除已棄用的 pandas.Categorical fastpath 關鍵字 (#35026)
- GH-35042 - [Go][FlightSQL driver] 新增 TLS 組態 (#35051)
- GH-35078 - [Python][CI] Windows 上的測試執行非常緩慢
- GH-35218 - [R] 更新 R 组件/版本 12.0.0 的 NEWS (#35219)
- PARQUET-2201 - [parquet-cpp] 為 RecordReader ReadRecords 和 SkipRecords 新增壓力測試。 (#14879)
- PARQUET-2225 - [C++][Parquet] 允許使用 RecordReader 讀取 dense (#17877)
- PARQUET-2232 - [C++] 新增 ColumnChunkMetaData 的 api 以指示欄位區塊是否使用 bloom filter (#33736)
- PARQUET-2250 - [C++][Parquet] 透過 RecordReader 公開欄位描述符 (#34318)