Apache Arrow 15.0.0 (2024年1月21日)
這是一個主要版本發布,涵蓋超過 1 個月的開發。
下載
貢獻者
此版本包含來自 101 位不同貢獻者的 536 個提交。
$ git shortlog -sn apache-arrow-14.0.2..apache-arrow-15.0.0
67 dependabot[bot]
42 Sutou Kouhei
31 Raúl Cumplido
27 Josh Soref
20 Antoine Pitrou
19 Felipe Oliveira Carvalho
19 mwish
18 Dewey Dunnington
17 James Duong
16 Curt Hagenlocher
16 Dominik Moritz
16 Joris Van den Bossche
15 Jacob Wujciak-Jens
14 Hyunseok Seo
12 Alenka Frim
10 Yue
10 sgilmore10
9 Matt Topol
8 Dane Pitkin
8 Diego Fernández Giraldo
8 Thomas Newton
6 Bryce Mecum
5 Jin Shang
5 Jonathan Keane
5 Kevin Gurney
4 Benjamin Kietzman
4 Gang Wu
3 Ben Harkins
3 Ivan Chesnov
3 Judah Rand
3 Lei Hou
3 Rossi(Ruoxi) Sun
3 Tim Schaub
3 abandy
2 Alfonso Subiotto Marqués
2 David Li
2 Divyansh200102
2 Eero Lihavainen
2 Francis
2 Gavin Murrison
2 JB Onofré
2 Jeremy Aguilon
2 John
2 Junming Chen
2 Laurent Goujon
2 Nic Crane
2 Peter Andreas Entschev
2 Rok Mihevc
2 Stas Stepanov
2 Tsutomu Katsube
2 Vibhatha Lakmal Abeykoon
1 Abram Fleishman
1 Anja Kefala
1 Atheel Massalha
1 Benjamin Schmidt
1 Bob Plotts
1 Bryan Cutler
1 Carl Jackson
1 ChinYikMing
1 Chris Larsen
1 Christian Holm Christensen
1 Dan Homola
1 Dan Stone
1 Danyaal Khan
1 Diogo Teles Sant'Anna
1 Dongjoon Hyun
1 Fatemah Panahi
1 Fernando Mayer
1 Fokko Driesprong
1 Hattonuri
1 Hendrik Makait
1 Jiaxing Liang
1 Jinpeng
1 John Garland
1 Kyle Barron
1 LucasG0
1 Maximilian Muecke
1 Miguel Pragier
1 Miles
1 Neal Richardson
1 Nick Hughes
1 Paul Spangler
1 Phillip LeBlanc
1 Pierre Moulon
1 Quang Hoang
1 Ravjot Brar
1 Tammy DiPrima
1 Will Jones
1 William Ayd
1 Yifeng-Sigma
1 david dali susanibar arce
1 davidhcoe
1 frazar
1 jiawei liang
1 loicalleyne
1 orgadish
1 panbingkun
1 prmoore77
1 shibei
1 zhipeng
1 谢天
補丁提交者
以下 Apache 提交者合併了貢獻的補丁到儲存庫。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-14.0.2..apache-arrow-15.0.0
154 Sutou Kouhei
56 David Li
50 Antoine Pitrou
35 Joris Van den Bossche
30 Jacob Wujciak-Jens
24 Raúl Cumplido
22 Matt Topol
19 Curt Hagenlocher
18 Kevin Gurney
16 Benjamin Kietzman
16 Felipe Oliveira Carvalho
14 mwish
13 Dewey Dunnington
12 AlenkaF
7 Nic Crane
3 Weston Pace
2 Gang Wu
2 Jonathan Keane
1 Josh Soref
1 Rok Mihevc
1 Will Jones
1 dependabot[bot]
變更日誌
Apache Arrow 15.0.0 (2024-01-21 08:00:00)
錯誤修正
- GH-15192 - [C++] 恢復
case_when
union 類型的測試 (#39308) - GH-32570 - [C++] 修正當附加具有相同 ID 的連續尾部列時,
ExecBatchBuilder
可能超出緩衝區邊界的問題 (#39234) - GH-32662 - [C#] 使檔案和記憶體實作中的字典正確運作,並支援整合測試 (#39146)
- GH-33475 - [Java] 在 JDBC 驅動程式中為 Prepared Statements 新增參數綁定 (#38404)
- GH-34532 - [Java][FlightSQL] 更改 JDBC 以處理多個端點 (#38521)
- GH-34610 - [Java] 修正載入/傳輸 NullVector 時的 valueCount 和欄位名稱 (#38973)
- GH-34890 - [C++][Python] 為
dictionary_encode(dictionary)
新增一個 no-op 核心 (#38349) - GH-35497 - [C++] 使用最新標記版本的 flatbuffers (#38192)
- GH-36588 - [C#] 支援空白欄位名稱並啟用更多整合測試。 (#39167)
- GH-36594 - [C++] 請勿使用 MSVC_VERSION 來決定 -fms-compatibility-version (#36595)
- GH-36912 - [Java] JDBC 驅動程式在看到空的 root 時停止消耗 roots (#38590)
- GH-37055 - [C++] 優化 Dictionary ChunkedArrays 的雜湊核心 (#38394)
- GH-37657 - [JS] 使用 ts-node 執行 bin 腳本 (#38500)
- GH-37726 - [Swift][FlightSQL] 更新行為以類似於現有的實作 (#37764)
- GH-37751 - [C++][Gandiva] 避免在 gandiva 中多次註冊匯出的函數 (#37752)
- GH-37796 - [C++][Acero] 修正 as-of-join 節點中因延遲輸入引起的競爭條件 (#37839)
- GH-37884 - [Swift] 允許讀取未對齊的 FlatBuffers 緩衝區 (#38635)
- GH-37969 - [C++][Parquet] 為 ParquetFileWriter 新增更多關閉檔案檢查 (#38390)
- GH-38096 - [Java] 帶有 metadata 的 FlightStream 在關閉時可能會導致錯誤 (#38110)
- GH-38198 - [Go] 修正 AuthenticateBasicToken 在代理伺服器後端變得不可靠的問題 (#38199)
- GH-38210 - [C++][FlightRPC] 新增遺失的 app_metadata 參數 (#38231)
- GH-38216 - [R] open_dataset(format = “json”) 未記錄 (#38258)
- GH-38242 - [Java] 修正 DenseUnionVector#getBufferSizeFor 的不正確內部結構會計 (#38305)
- GH-38254 - [Java] 為 char/binary 向量新增可重複使用的緩衝區 getter (#38266)
- GH-38268 - [Java] 停用不穩定的 TestFlightSqlStreams (#38319)
- GH-38281 - [Go] 確保 CData 匯入的陣列在釋放時被釋放 (#38314)
- GH-38297 - [C#] 修正 .NET 4.7.2 的建置 (#38299)
- GH-38304 - [C++][Parquet] 修正 arrow-dataset-file-parquet-encryption-test 中的 Valgrind 記憶體洩漏 (#38306)
- GH-38307 - [CI] 移除 gemfury_clean.rb (#38308)
- GH-38318 - [Java][FlightRPC] 啟用洩漏的測試 (#38719)
- GH-38323 - [CI][Python] 在 test-conda-python 上使用系統 gdb (#38324)
- GH-38363 - [Release][CI] 在 RC 分支上省略 main/maintenance 分支的測試 (#38365)
- GH-38366 - [Java] 修正小於 4 位元組的緩衝區上的 Murmur 雜湊 (#38368)
- GH-38378 - [C++][Parquet] 請勿使用 OpenSSL 1.1 明確初始化 OpenSSL (#38379)
- GH-38382 - [R] 在退出時明確清理
arrow_duck_connection()
(#38495) - GH-38387 - [Java] 修正 JDK8 編譯 TestAllTypes 的問題 (#38388)
- GH-38395 - [Go] 修正 decimal256 字串函數中的四捨五入錯誤 (#38426)
- GH-38399 - [Go][Parquet] DeltaBitPack 解碼器在 SetData 後重設 usedFirst (#38413)
- GH-38401 - [C++] 為 Skyhook 重新產生 flatbuffers C++ (#38405)
- GH-38436 - [R] 測試讀取具有非 UTF-8 編碼的 CSV 時的區段錯誤
- GH-38439 - [Java][CI] 對於所有 Java CI linux 工作,使用 Eclipse Temurin (#38440)
-
GH-38447 - [CI][Release] 請勿使用 “ {exit,continue}” (#38486) - GH-38458 - [Go] 將 ValueLen 新增至 BinaryLike 介面 (#39242)
- GH-38470 - [CI][Integration] 安裝 jpype 並建置 JNI c-data 以執行整合測試 (#39502)
- GH-38477 - [Go] 修正 decimal 128 四捨五入問題 (#38478)
- GH-38479 - [C++] 避免將空指標傳遞給 LZ4 框架解壓縮器 (#39125)
- GH-38503 - [Go][Parquet] 使 arrow 欄位寫入器成為內部 (#38727)
- GH-38503 - [Go][Parquet] 使用 ArrowColumnWriter 的樣式改進 (#38581)
- GH-38516 - [Go][Parquet] 在附加新的列組時,增加寫入的列數 (#38517)
- GH-38535 - [Python] 修正 S3FileSystem 等於 None 的區段錯誤 (#39276)
- GH-38554 - [Release][Website] post-03-website.sh 沒有引用 current.date (#38555)
- GH-38556 - [C++] 為 i386 新增遺失的明確 size_t 轉換 (#38557)
- GH-38594 - [Docs][C++][Gandiva] 記錄如何註冊 Gandiva 外部函數 (#38763)
- GH-38599 - [Docs] 更新 Headers (#38696)
- GH-38614 - [Java] 為更多寫入器新增 VarBinary 和 VarCharWriter 輔助方法 (#38631)
- GH-38624 - [C++] 修正:為 gtest 函數新增 TestingEqualOptions。 (#38642)
- GH-38630 - [MATLAB] arrow.array.BooleanArray 的
toMATLAB
方法未將切片偏移量納入考量 (#38636) - GH-38653 - [Packaging][Java][Python][Ruby] 將最低 macOS 版本提高到 10.15 catalina,以允許在 C++17 中使用新的 API (#38677)
- GH-38683 - [Python][Docs] 更新 Time32Type 和 Time64Type 的文件字串 (#39059)
- GH-38684 - [Integration] 嘗試加強 C Data Interface 測試 (#38846)
- GH-38697 - [C++][Gandiva] 在 gandiva 中使用 arrow io util 替換 std::filesystem::path (#38698)
- GH-38709 - [C++] 防止在 macOS 上定義的 PREALLOCATE 前處理器 (#38760)
- GH-38711 - [CI] 回滾 aws-cli 以進行預覽文件 (#38723)
- GH-38725 - [Java] Lz4CompressionCodec.java 中的解壓縮未設定寫入器索引 (#38840)
- GH-38728 - [Go] ipc:將 lz4 解壓縮緩衝區放回 sync.Pool (#38729)
- GH-38737 - [Java] 修正 JDBC SqlInfo 值的快取 (#38739)
- GH-38738 - [C++] 檢查變數緩衝區計數是否在界限內 (#38740)
- GH-38745 - [Integration] 修正巨大的整合測試 (#38746)
- GH-38762 - [R] CI 設定中 R 和 RTools 的版本已不再是最新版本
- GH-38764 - [Java] 澄清關於
--add-opens=java.base/java.nio=ALL-UNNAMED
的警告 (#38765) - GH-38782 - [C++][FS][Azure] 對於 CreateDir(“/container”, true) 不執行任何操作 (#38783)
- GH-38795 - [Go] 修正 Timestamp 的 race GetToTimeFunc (#38797)
- GH-38811 - [R] 實際上在 macos 上使用獲取的 cmake (#39453)
- GH-38816 - [C#] 修正 StructArray 上的 IArrowRecord 實作 (#38827)
- GH-38823 - 修正 TestArrowReaderAdHoc.ReadFloat16Files 以使用新的未壓縮檔案 (#38825)
- GH-38832 - [Java] 避免在
ci/scripts/java_build.sh
中建置兩次 (#38829) - GH-38844 - [C++] S3FileSystem 將 s3 sdk config “use_virtual_addressing” 匯出到 arrow::fs::S3Options (#38858)
- GH-38851 - 網站:貢獻連結無法運作
- GH-38879 - [C++][Gandiva] 修正 Gandiva to_date 函數對 supress errors 參數的驗證 (#38987)
- GH-38883 - [Docs] 修正 struct 範例以顯示隱藏子項的條目 (#38898)
- GH-38906 - [R] 改善 Windows CI 組態 (#38927)
- GH-38921 - [CI] 修正拼字 (#38922)
- GH-38925 - [CI] 修正拼字 (#38926)
- GH-38928 - [R] 修正拼字 (#38929)
- GH-38930 - [Java] 修正拼字 (#38931)
- GH-38932 - [GO] 修正拼字 (#38933)
- GH-38938 - [FlightRPC] 修正拼字 (#38939)
- GH-38940 - [Ruby] 修正拼字 (#38941)
- GH-38942 - [C#] 修正拼字 (#38943)
- GH-38944 - [Python] 修正拼字 (#38945)
- GH-38946 - [MATLAB] 修正拼字 (#38947)
- GH-38948 - [Swift] 修正拼字 (#38949)
- GH-38950 - [Docs] 修正拼字 (#38951)
- GH-38952 - [Format] 修正拼字 (#38953)
- GH-38954 - [Dev] 修正拼字 (#38955)
- GH-38956 - [Gandiva] 修正拼字 (#38957)
- GH-38960 - [C++] 修正拼字 (acero) (#38961)
- GH-38964 - [C++] 修正拼字 (compute) (#38965)
- GH-38966 - [C++] 修正拼字 (util) (#38967)
- GH-38968 - [C++] 修正拼字 (dataset) (#38969)
- GH-38971 - [C++] 修正拼字 (filesystem) (#38972)
- GH-38975 - [Dev] 修正拼字 (#38976)
- GH-38977 - [C++] 修正拼字 (#38978)
- GH-38979 - [C++] 修正拼字 (#38980)
- GH-38981 - [R][Release] 在相容版本發布時,請勿更新 version.json (#38982)
- GH-39014 - [Java] 在 Mac 系統上時,除了 KeychainStore 之外,還新增預設 truststore (#39235)
- GH-39031 - [Docs] 從 contrib css 中移除拼字錯誤的規則 (#39032)
- GH-39045 - [C++][Acero] union 節點輸出批次應該是無序的 (#39046)
- GH-39113 - [Integration][Flight][Java] 修正偶爾啟動 Java 伺服器失敗的問題 (#39115)
- GH-39116 - [Go] 修正 CI Staticcheck (#39117)
- GH-39126 - [C++][CI] 修正 Valgrind 失敗 (#39127)
- GH-39130 - [CI][GLib][Windows] 使用舊版 Ruby 作為載入錯誤的變通方案 (#39168)
- GH-39136 - [C++] 使用 -DARROW_HDFS=ON 移除不必要的系統 Protobuf 依賴 (#39137)
- GH-39138 - [R] 修正隱含轉換警告 (#39250)
- GH-39156 - [C++][Compute] 修正負持續時間除法 (#39158)
- GH-39163 - [C++] 在 StreamDecoder::Consume(data) 中新增遺失的資料複製 (#39164)
- GH-39185 - [C++] 在公開標頭中,使用 -Wconversion -Wno-sign-conversion 移除編譯器警告 (#39186)
- GH-39191 - [R] 當
string_replace
在pattern
中傳遞值向量時,拋出錯誤 (#39219) - GH-39238 - [Go] PATCH 防止將空記錄附加到空的結果集 (#39239)
- GH-39288 - [Java][FlightSQL] 將 Apache Avatica 更新至 1.24.0 版本 (#39325)
- GH-39306 - [C++][Benchmarking] 移除硬編碼的最小時間 (#39307)
- GH-39327 - [Java] 為新的自訂 maven 外掛程式專案定義組裝描述符 (#39331)
- GH-39333 - [C++] 請勿在 lambda 中使用 “if constexpr” (#39334)
- GH-39359 - [CI][C++] 移除 MinGW MINGW32 C++ 工作 (#39376)
- GH-39384 - [C++] 為 Azure SDK 的 identity.hpp 停用 -Werror=attributes (#39448)
- GH-39387 - [C++] 修正編譯警告 (#39389)
- GH-39421 - [CI][Ruby] 更新為在 test-ruby 和 test-c-glib 夜間工作中使用 Ubuntu 22.04 (#39422)
- GH-39423 - [CI][JS] TypeScript:多個 CI 工作的 yarn 建置編譯失敗
- GH-39425 - [CI] 修正匯入以符合新的 substrait 儲存庫結構 (#39426)
- GH-39433 - [Ruby] 新增對 Table.load(format: json) 選項的支援 (#39464)
- GH-39437 - [CI][Python] 更新在 pandas 夜間 CI 建置中失敗的 pandas 測試 (#39498)
- GH-39468 - [Java] 修正文件網站建置 (#39471)
- GH-39469 - [CI][JS] 在 arm64 上的 JS 建置中強制使用 node 20,以修正建置問題 (#39499)
- GH-39488 - [Ruby] 在 Ractor 中新增對 ChunkedArray 的支援 (#39490)
- GH-39517 - [C++] 為 jemalloc 外部專案停用平行處理 (#39522)
- GH-39562 - [C++][Parquet] 修正 test_parquet_dataset_lazy_filtering 中的崩潰 (#39632)
- GH-39564 - [CI][Java] 在 Java BOM 上設定正確的版本 (#39580)
- GH-39584 - [R] 優雅地回退到來源 (#39587)
- GH-39588 - [CI][Go] 將 CGO_ENABLED=1 新增到 cdata_integration 建置,以修正使用 conda 的 macOS 建置 (#39589)
- GH-39598 - [C#] 修正驗證腳本 (#39605)
- GH-39604 - [JS] 尚未使用可調整大小的緩衝區 (#39607)
- GH-39628 - [C++] 當使用 CMake >= 3.28 時,為所有基於 `make` 的 externalProjects 停用平行處理
新功能與改進
- GH-14936 - [Java] 從 arrow-vector 中移除 netty 依賴 (#38493)
- GH-28994 - [C++][JSON] 將最大列數變更為 Unlimited(int_32) (#38582)
- GH-30117 - [C++][Python] 當定義時區時,在時間戳記列印字串的末尾新增 “Z” (#39272)
- GH-30717 - [C#] 為 Arrow 類別新增 ToString() 方法 (#36566)
- GH-31303 - [Python] 移除舊版 ParquetDataset 自訂基於 python 的實作 (#39112)
- GH-31579 - [C#]:移除不再支援的 .NET 版本並更新 C# README (#39165)
- GH-33500 - [Python] 新增
Table.to/from_struct_array
(#38520) - GH-33984 - [C++][Python] Arrow 陣列的 DLPack 實作 (producer) (#38472)
- GH-34316 - [Python] FixedSizeListArray.from_arrays 支援 mask 參數 (#39396)
- GH-34569 - [C++] Run-End Encoded 陣列的差異比較 (#35003)
- GH-34636 - [C#] 在使用 ArrayPool 時減少分配 (#39166)
- GH-35260 - [C++][Python][R] 允許使用者透過環境變數調整 S3 日誌層級 (#38267)
- GH-35331 - [Python] 公開 Parquet 排序 metadata (#37665)
- GH-35344 - [C++][Format] LIST_VIEW 和 LARGE_LIST_VIEW 陣列格式的實作 (#35345)
- GH-35560 - [C++] 在測試中,Scalar 使用 Cast() 而不是 CastTo() (#39044)
- GH-36036 - [C++][Python][Parquet] 實作 Float16 邏輯類型 (#36073)
- GH-36044 - [Python][Docs] 將 ParquetFileFragment 新增到 API 參考文件 (#38277)
- GH-36099 - [C++] 將 Utf8View 和 BinaryView 新增到 c ABI (#38443)
- GH-36441 - [Python] 使 CacheOptions 可從 Python 設定 (#36627)
- GH-36760 - [Go] 新增 Avro OCF 讀取器 (#37115)
- GH-36815 - [C#]:在 Windows 下啟用 net472 測試 (#36818)
- GH-36898 - [CI] Hashpin 敏感 GitHub Actions (#37676)
- GH-37002 - [C++][Parquet] 新增 API 以從 RowGroupReader 取得 RecordReader (#37003)
- GH-37061 - [Docs][Format] 澄清 FSQL 中 GetSchema 的語義 (#38549)
- GH-37199 - [C++] 公開 Buffer 和 ArraySpan 的 span 轉換器 (#38027)
- GH-37242 - [Python][Parquet] Parquet 支援寫入和驗證 Page CRC (#38360)
- GH-37312 - [Python][Docs] 更新 Python 文件字串以反映新的 parquet 編碼選項 (#38070)
- GH-37359 - [C#] 為 Decimal128Array 和 Decimal256Array 新增 ToList() (#37383)
- GH-37378 - [C++] 為 DictionaryArray 新增字典壓縮函數 (#37418)
- GH-37429 - [C++] 新增 arrow::ipc::StreamDecoder::Reset() (#37970)
- GH-37511 - [C++] 實作 Azure 檔案系統的檔案讀取 (#38269)
- GH-37582 - [Go][Parquet] 實作 Float16 邏輯類型 (#37599)
- GH-37592 - [MATLAB] 為 arrow.tabular.RecordBatch 新增 NumRows 屬性 (#38215)
- GH-37710 - [C++][Integration] 新增 C++ Utf8View 實作 (#37792)
- GH-37753 - [C++][Gandiva] 新增外部函數註冊表支援 (#38116)
- GH-37812 - [MATLAB] 新增 arrow.type.ListType MATLAB 類別 (#38189)
- GH-37815 - [MATLAB] 新增 arrow.array.ListArray MATLAB 類別 (#38357)
- GH-37848 - [C++][Gandiva] 將 LLVM JIT 引擎從 MCJIT 遷移到 ORC v2/LLJIT (#39098)
- GH-37857 - [Python][Dataset] 將檔案大小公開給 python 資料集 (#37868)
- GH-37889 - [Java][Doc] 改善 JDBC 驅動程式文件 (#38469)
- GH-37895 - [C++] 功能:支援串連 recordbatches。 (#37896)
- GH-37910 - [Java][Integration] 實作 C Data Interface 整合測試 (#38248)
- GH-37943 - [Java] 新增包含所有支援類型的 parquet 檔案 (#38249)
- GH-37979 - [C++] 新增支援指定自訂陣列開頭和結尾分隔符到
arrow::PrettyPrintDelimiters
(#38187) - GH-38022 - [Java][FlightRPC] 在 FlightInfo 和 FlightEndpoint 上公開 app_metadata (#38331)
- GH-38024 - [Java][FlightRPC] 透過 JDBC ResultSet 公開 appMetadata (#38781)
- GH-38033 - [R] 允許
code()
傳回套件名稱前綴。 (#38144) - GH-38042 - [C++][Benchmark] 新增非串流 Codec 壓縮/解壓縮 (#38067)
- GH-38117 - [C++][Parquet] 將 DictEncoder dtor 檢查變更為警告日誌 (#38118)
- GH-38131 - [Swift][CI] 新增 linting 並修正 linting 錯誤 (#38133)
- GH-38153 - [C#] 公開
ArrayDataConcatenator.Concatenate
(#38154) - GH-38164 - [MATLAB] 將
arrow.array.Array
和arrow.array.ChunkedArray
上的 Length 屬性重新命名為 NumElements (#38190) - GH-38166 - [MATLAB] 改善表格物件顯示 (#38482)
- GH-38246 - [JAVA] 新增了新的
getTransferPair()
函數,該函數接受 Complex Type Vectors 的 Field 類型 (#38261) - GH-38264 - [Java][Packaging] 新增 BOM 檔案 (#38336)
- GH-38271 - [C++][Parquet] 支援讀取具有多個 gzip 成員的 parquet 檔案 (#38272)
- GH-38300 - [Dev][Docs] 為目前的
merge_arrow_pr.py
更新 dev/README.md (#38301) - GH-38310 - [MATLAB] 建立用於測試 MATLAB 介面的測試指南文件 (#38459)
- GH-38316 - [C#] 實作間隔類型 (#39043)
- GH-38326 - [C++][Parquet] 檢查解壓縮的頁面大小是否與頁面標頭中的大小相同 (#38327)
- GH-38330 - [C++][Azure] 對於輸入串流 metadata 使用屬性 (#38524)
- GH-38333 - [C++][FS][Azure] 實作檔案寫入 (#38780)
- GH-38335 - [C++] 為 Azure 檔案系統中的單個檔案實作 GetFileInfo (#38505)
- GH-38339 - [C++][CMake] 對於系統 GoogleTest 使用遞移依賴 (#38340)
- GH-38341 - [Python] 移除 pandas 內部 DatetimeTZBlock 的用法 (#38321)
- GH-38346 - [C++][Parquet] 為頁面索引加密測試使用新的加密檔案 (#38347)
- GH-38348 - [C#] 使 PrimitiveArray 支援 IReadOnlyList<T?> (#38680)
support IReadOnlyList<T?> (#38680) - GH-38351 - [C#] 為 Decimal128Array 新增 SqlDecimal 支援 (#38481)
- GH-38354 - [MATLAB] 為 arrow.array.ListArray 實作 fromMATLAB 方法 (#38561)
- GH-38361 - 為
arrow.array.ListArray.fromArrays
的 offsets 和 values 新增驗證邏輯 (#38531) - GH-38376 - [R]:為 Dataset 類別新增 dimnames 方法 (#38377)
- GH-38381 - [C++][Acero] 建立排序合併節點 (#38380)
- GH-38398 - [MATLAB] 改善陣列顯示 (#38400)
- GH-38402 - [CI][Integration] 為整合測試提供包裝腳本 (#38403)
- GH-38415 - [MATLAB] 為 C++ Array Proxy 類別新增索引 “slice” 方法 (#38674)
- GH-38417 - [MATLAB] 實作 TableTypeValidator 類別,該類別驗證 MATLAB cell 陣列僅包含共享相同 schema 的 tables (#38551)
- GH-38418 - [MATLAB] 新增將
arrow.tabular.Table
的一行提取為字串的方法 (#38463) - GH-38419 - [MATLAB] 實作 ClassTypeValidator 類別,該類別驗證 MATLAB cell 陣列僅包含相同類別類型的值。 (#38530)
- GH-38420 - [MATLAB] 實作 DatetimeValidator 類別,該類別驗證 MATLAB cell 陣列僅包含 zoned 或 unzoned datetimes 的值 (#38533)
- GH-38424 - [CI][C++] 使用 Fedora 38 而不是 35 (#38425)
- GH-38452 - [C++][Benchmark] 新增 LZ4/Snappy 壓縮的基準測試 (#38453)
- GH-38457 - [C++] 支援 DictionaryArray 的 LogicalNullCount (#38681)
- GH-38460 - [Java][FlightRPC] 為 Flight SQL JDBC 驅動程式新增 mTLS 支援 (#38461)
- GH-38462 - [Go][Parquet] 處理 Boolean RLE 編碼/解碼 (#38367)
- GH-38483 - [C#] 新增對更多 decimal 轉換的支援 (#38508)
- GH-38506 - [Go][Parquet] 將 NumRows 和 RowGroupNumRows 新增到 pqarrow.FileWriter (#38507)
- GH-38511 - [Java] 為 StructVector 和 MapVector 新增
getTransferPair(Field, BufferAllocator, CallBack)
(#38512) - GH-38528 - [Python][Compute] 描述 strptime 格式語義 (#38665)
- GH-38537 - [Java] 升級到 netty 4.1.100.Final (#38538)
- GH-38541 - [MATLAB] 為 arrow 表格物件顯示新增剩餘的測試 (#38564)
- GH-38542 - [C++][Parquet] 更快的純量 BYTE_STREAM_SPLIT (#38529)
- GH-38562 - [Packaging] 新增對 Ubuntu 23.10 的支援 (#38563)
- GH-38576 - [Java] 更改 JDBC 驅動程式以在取得串流時選擇性地保留 cookies 和 auth tokens (#38580)
- GH-38578 - [Java][FlightSQL] 從 flight-sql 函式庫中移除 joda 的使用 (#38579)
- GH-38589 - [C++][Gandiva] 支援註冊外部 C 函數 (#38632)
- GH-38597 - [C++] 為 Azure 檔案系統實作 GetFileInfo(selector) (#39009)
- GH-38602 - [R] 為 summarize 新增遺失的
prod
(#38601) - GH-38627 - [Java][FlightRPC] 處理 null 參數值 (#38628)
- GH-38648 - [Java] 重新產生 Flatbuffers (#38650)
- GH-38652 - [MATLAB] 新增關於將 MATLAB duration 轉換為
arrow.array.Time32Array
和arrow.array.Time64Array
時,時間精確度保存的測試 (#38661) - GH-38662 - [Java] 新增比較器 (#38669)
- GH-38699 - [C++][FS][Azure] 實作
CreateDir()
(#38708) - GH-38700 - [C++][FS][Azure] 實作
DeleteDir()
(#38793) - GH-38701 - [C++][FS][Azure] 實作
DeleteDirContents()
(#38888) - GH-38702 - [C++]:實作 AzureFileSystem::DeleteRootDirContents (#39151)
- GH-38705 - [C++][FS][Azure] 實作 CopyFile() (#39058)
- GH-38712 - [Python] 移除 _reconstruct_block 中的無效程式碼 (#38714)
- GH-38718 - [Go][Format][Integration] 將 StringView/BinaryView 新增至 Go 實作 (#35769)
- GH-38732 - [Java][FlightRPC] 在 JDBC 中新增 Array 參數綁定支援 (#38733)
- GH-38751 - [C++][Go][Parquet] 為 parquet-testing 中讀取 Float16 檔案新增測試 (#38753)
- GH-38757 - [C#] 為結構陣列和記錄批次實作通用介面 (#38759)
- GH-38758 - [C++][FS][Azure] 將 AzurePath 重新命名為 AzureLocation (#38773)
- GH-38772 - [C++] 即使儲存體帳戶不支援 HNS,仍實作目錄語意 (#39361)
- GH-38798 - [Integration] 在 Rust 上啟用 C 資料介面整合測試 (#38799)
- GH-38814 - [C++][Parquet] 更新 parquet.thrift 以與 2.10.0 同步 (#38815)
- GH-38824 - [Go] 啟用 GC 檢查 (#38826)
- GH-38836 - [Go] 為 ArrayData 新增 Size() (#38839)
- GH-38852 - [C++] 將資料集測試中的 “#ifdef ARROW_WITH_GZIP” 取代為 ARROW_WITH_ZLIB (#38853)
- GH-38857 - [Python] 修復 cython 2 的附加模式 (#39027)
- GH-38857 - [Python] 為 pyarrow.OsFile 新增附加模式 (#38820)
- GH-38860 - [C++][Parquet] 使用長度來最佳化 Bloom Filter 讀取 (#38863)
- GH-38870 - [Documentation] 將 List View 和 Large List View 新增至 status.rst (#38871)
- GH-38874 - [C++][Parquet] 次要:將 parquet TypedComparator 操作設為 const 方法 (#38875)
- GH-38884 - [C++] DatasetWriter 在配置寫入失敗時釋放 rows_in_flight_throttle (#38885)
- GH-38887 - [C++][Parquet] 將 EstimatedBufferedValueBytes 從 TypedColumnWriter 移至 ColumnWriter (#39055)
- GH-38907 - [C++] 停止安裝內部 bpacking_simd* 標頭 (#38908)
- GH-38909 - [Packaging] 停止支援 Ubuntu 23.04 (#38910)
- GH-38918 - [Go] 避免在某些地方配置 schema.Fields (#38919)
- GH-38920 - [C++][Gandiva] 重構函數持有者以傳回 arrow Result (#38873)
- GH-38958 - [C++][Parquet] 修復拼寫錯誤 (#38959)
- GH-38990 - [Java] 升級至 flatc 版本 23.5.26 (#38991)
- GH-38996 - [Java] 更新 JPMS 模組的相依性和外掛程式 (#38994)
- GH-39006 - [Python] 將 libparquet 需求從 libarrow_python.so 提取到新的 libarrow_python_parquet_encryption.so (#39316)
- GH-39013 - [Go][Integration] 支援 StringView 的 cABI 匯入/匯出 (#39019)
- GH-39020 - [CI][Release][JS] 使用 Node.js 18 而非 16 (#39021)
- GH-39028 - [Python][CI] 透過暫時跳過 test_categorize_info 來修復 dask 整合建置 (#39029)
- GH-39037 - [Java] 移除 Flight SQL 中的 (Contrib/Experimental) 提及 (#39040)
- GH-39049 - [C++] 在測試中針對 Dictionary Scalar 使用 Cast() 而非 CastTo() (#39362)
- GH-39050 - [C++] 在測試中針對 Timestamp Scalar 使用 Cast() 而非 CastTo() (#39060)
- GH-39051 - [C++] 在測試中針對 List Scalar 使用 Cast() 而非 CastTo() (#39353)
- GH-39064 - [C++][Parquet] 支援巢狀路徑的列群組篩選,適用於 struct 欄位 (#39065)
- GH-39088 - [Dev][Java] 為 Java 新增 Dependabot 配置 (#39089)
- GH-39096 - [Python] 在
.nbytes
中釋放 GIL (#39097) - GH-39119 - [C++] 重構 Azure FS 測試和檔案系統類別的實例化 (#39207)
- GH-39122 - [C++][Parquet] 最佳化 FLBA 記錄讀取器 (#39124)
- GH-39134 - 建立模組資訊編譯器外掛程式 (#39135)
- GH-39159 - [C++]:嘗試使 Buffer::device_type_ 成為非選用 (#39150)
- GH-39170 - [Java] 改善解釋 TestTls 可能失敗原因的錯誤訊息 (#39171)
- GH-39189 - [Java] 在 /java 中將 com.h2database:h2 從 1.4.196 升級到 2.2.224 (#39188)
- GH-39196 - [Python][Docs] 在 Python 文件中的「擴展 pyarrow」章節中記錄 Arrow PyCapsule 協定 (#39199)
- GH-39208 - [C++][Parquet] 移除已棄用的 AppendRowGroup(int64_t num_rows) (#39209)
- GH-39210 - [C++][Parquet] 避免 WriteRecordBatch 從產生零大小的 RowGroup (#39211)
- GH-39217 - [Python] 實作 Arrow PyCapsule 協定的物件的 RecordBatchReader.from_stream 建構子 (#39218)
- GH-39223 - [C#] 支援其餘純量類型的 IReadOnlyList<T?> (#39224)
- GH-39225 - [GLib] 使用 Cast() 而非 CastTo() (#39228)
- GH-39232 - [C++] 支援二進位到 fixed_size_binary 的轉換 (#39236)
- GH-39243 - [R][CI] 移除 r-arrow conda nightly 版本 (#39244)
- GH-39246 - [CI][GLib][Ruby] 使用 Ubuntu 22.04 而非 20.04 (#39247)
- GH-39262 - [C++][Azure][FS] 新增預設認證驗證配置 (#39263)
- GH-39265 - [Java] 使其與 Netty 最新版本 4.1.104 良好運行 (#39266)
- GH-39268 - [C++] 請勿使用 CMake 3.28+ 安裝捆綁的 Azure SDK for C++ (#39269)
- GH-39292 - [C++][FS]:移除 AzureBackend 列舉並新增更彈性的連線選項 (#39293)
- GH-39297 - [C++][FS]:在檢查 HNS 支援時通知呼叫者容器不存在 (#39298)
- GH-39299 - [Java] 升級至 Avro 1.11.3 (#39300)
- GH-39303 - [Archery][Benchmarking] 允許設定 C++ 重複最小時間 (#39324)
- GH-39318 - [C++][FS][Azure] 新增工作負載身分驗證配置 (#39319)
- GH-39320 - [C++][FS][Azure] 新增受管理身分驗證配置 (#39321)
- GH-39322 - [C++] 將引數轉發到 ExceptionToStatus,一路傳遞到 Status::FromArgs (#39323)
- GH-39326 - [C++] 不穩定的 DatasetWriterTestFixture.MaxRowsOneWriteBackpresure 測試 (#39379)
- GH-39328 - [Java] 將預設 getConsumer 設為 public (#39329)
- GH-39335 - [C#] 支援使用 Grpc.Core.Channel 建立 FlightClient (#39348)
- GH-39339 - [C++] 新增 ForceCachedHierarchicalNamespaceSupport 以協助測試 (#39340)
- GH-39341 - [C#] 支援 Utf8View、BinaryView 和 ListView (#39342)
- GH-39343 - [C++][FS][Azure] 新增用戶端密碼驗證配置 (#39346)
- GH-39355 - [Java] 改善 JdbcConsumer 例外狀況 (#39356)
- GH-39357 - [C++] 減少 function.h 包含 (#39312)
- GH-39363 - [C++] 針對 Parquet 使用 Cast() 而非 CastTo() (#39364)
- GH-39413 - [C++][Parquet] 將 FLBA 上的純文字解碼向量化 (#39414)
- GH-39419 - [C++][Parquet] 風格:使用 arrow::Buffer data_as API 而非 reinterpret_cast (#39420)
- GH-39430 - [C++][ORC] 將 ORC 升級至 1.9.2 (#39431)
- GH-39449 - [C++] 隱含地使用預設 Azure 認證,並明確地支援匿名認證 (#39450)
- GH-39484 - [Java] 在 JdbcToArrowUtils 中支援 256 位元小數 (#39485)
- GH-39500 - [Docs] 將 pydata-sphinx-theme 固定為 0.14 (#39501)
- GH-39515 - [Python] 將類型傳遞至
MapType.from_arrays
(#39516) - GH-39531 - [Python][CI] 跳過失敗的 dask 測試:test_describe_empty 和 test_view (#39534)
- GH-39533 - [Python] NumPy 2.0 相容性:移除 np.core 的用法 (#39535)
- GH-39537 - [Packaging][Python] 為 15.x 發行分支的安裝需求新增 numpy<2 pin (#39538)
- GH-39601 - [R] 當 TEST_OFFLINE_BUILD=true 時,請勿下載 cmake (#39602)
- GH-39624 - [R][CI] 將 CMake 新增至 docker 檔案並更新 envvars (#39625)
- GH-39626 - [Docs][R] 更新 15.0.0 的 NEWS.md
- PARQUET-2411 - [C++][Parquet] 允許讀取字典,而無需透過 ByteArrayDictionaryRecordReader 讀取資料 (#39153)