Apache Arrow 17.0.0 (2024 年 7 月 16 日)
這是一個主要版本,涵蓋超過 2 個月的開發。
下載
貢獻者
此版本包含來自 92 位不同貢獻者的 529 個提交。
$ git shortlog -sn apache-arrow-16.1.0..apache-arrow-17.0.0
84 dependabot[bot]
47 Sutou Kouhei
25 Hyunseok Seo
25 Joris Van den Bossche
22 Raúl Cumplido
21 Adam Reeve
21 Vibhatha Lakmal Abeykoon
20 mwish
18 Laurent Goujon
15 Felipe Oliveira Carvalho
14 abandy
13 Sarah Gilmore
12 Rossi Sun
11 Neal Richardson
10 Alenka Frim
10 Antoine Pitrou
10 Bryce Mecum
9 ZhangHuiGui
8 Jonathan Keane
6 Dewey Dunnington
6 Dominik Moritz
6 Matt Topol
5 Gang Wu
5 William Ayd
4 Curt Hagenlocher
4 Dane Pitkin
4 David Li
4 Tai Le Manh
4 h-vetinari
3 Ian Cook
3 Jacob Wujciak-Jens
3 Kevin Gurney
3 Rok Mihevc
3 Thomas A Caswell
3 Wyatt Alt
2 Ben Harkins
2 Benjamin Kietzman
2 Haocheng Liu
2 JB Onofré
2 Joe Marshall
2 Joel Lubinitsky
2 Nic Crane
2 Steve Lord
2 Thomas Newton
2 Tom Scott-Coombes
2 Weston Pace
1 Adam Curtis
1 Alan Stoate
1 AlbertXingZhang
1 Alex Shcherbakov
1 Anja Kefala
1 Austin Dickey
1 Calvin Kirs
1 Clif Houck
1 David Schlosnagle
1 David Sisson
1 DenisTarasyuk
1 Ed
1 Even Rouault
1 Finn Völkel
1 Francis
1 Gavin Murrison
1 Ivan Chesnov
1 Jaap Versteegh
1 Jacek Stania
1 Jacob Hayes
1 James Duong
1 Joshua MacDonald
1 Judah Rand
1 Kartik Verma
1 Kelvin Wu
1 Kirill Khramkov
1 Konstantin Malanchev
1 Lei (Alexandra) Wang
1 LucasG0
1 Mike Bostock
1 Noam Ross
1 Nozomi Isozaki
1 PHILO-HE
1 PJ Fanning
1 Paul Taylor
1 Stephan T. Lavavej
1 Tao He
1 Tom McTiernan
1 Wenbo Li
1 Yifeng-Sigma
1 a-reich
1 andyfan
1 feik
1 hemidark
1 keshen-msft
1 normanj-bitquill
修補程式提交者
以下 Apache 提交者將貢獻的修補程式合併到儲存庫中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-16.1.0..apache-arrow-17.0.0
130 Sutou Kouhei
89 David Li
39 Curt Hagenlocher
38 Antoine Pitrou
37 Joris Van den Bossche
22 Felipe Oliveira Carvalho
22 Raúl Cumplido
20 Matt Topol
14 mwish
11 Jacob Wujciak-Jens
11 Sarah Gilmore
8 AlenkaF
6 Bryce Mecum
6 Jonathan Keane
5 Benjamin Kietzman
5 Gang Wu
4 Dane Pitkin
4 Dewey Dunnington
4 Rok Mihevc
4 Weston Pace
3 Kevin Gurney
3 Nic Crane
3 dependabot[bot]
2 Will Jones
變更日誌
Apache Arrow 17.0.0 (2024-07-16 07:00:00+00:00)
錯誤修復
- GH-15053 - [C++] 新增選項到字串 ‘center’ 核心,以控制奇數填充的左右對齊方式 (#41449)
- GH-30866 - [Java] 修復當向量為空時 SplitAndTransfer 對 (0,0) 拋出異常的問題 (#41066)
- GH-34484 - [Substrait] 新增選項以停用擴增欄位 (#41583)
- GH-37669 - [C++][Python] 修復使用固定大小列表儲存類型轉換為擴展類型的問題 (#42219)
- GH-38553 - [C++] 在 ListArrayFromArray 和 MapArray 中將 null_count 替換為 MayHaveNulls (#41957)
- GH-38575 - [Python] 從 PyCapsule 建立 pa.schema 時包含元數據 (#41538)
- GH-38770 - [C++][Python] 如果傳遞 ChunkedArray,RecordBatch.filter() 會發生區段錯誤 (#40971)
- GH-39129 - [Python] pa.array:新增檢查 Python 物件內部的位元組交換 numpy 陣列 (#41549)
- GH-39489 - [C++][Parquet] 從 Parquet 到 Arrow 的時間戳記轉換不遵循 convertedType 的相容性指南
- GH-39645 - [Python] 修復加密 Parquet 的 read_table 問題 (#39438)
- GH-40270 - [C++] 在將表格寫入 CSV 時使用 LargeStringArray 進行轉換 (#40271)
- GH-40560 - [Python] RunEndEncodedArray.from_arrays:Array 引數的錯誤修復 (#40560) (#41093)
- GH-40750 - [C++][Python] 從鍵和項目建構的 Map 子陣列不應具有偏移量 (#40871)
- GH-40913 - [C++] 修復編譯警告,編碼基準測試中 ‘implicitly-defined constructor does not initialize’ (#41060)
- GH-40997 - [C++] 根據 NullUpdateColumnToRow_avx2 中的 are_cols_in_encoding_order 取得 null_bit_id (#40998)
- GH-41112 - [C++] 清理未使用的參數警告 (#41111)
- GH-41149 - [C++][Acero] 修復 asof join 競爭條件 (#41614)
- GH-41164 - [C#] 修復切片陣列的串聯 (#41245)
- GH-41190 - [C++] 支援單執行緒聯結 (#41125)
- GH-41192 - [C++] 修復 hashjoin 基準測試在建立 utf8 的隨機批次時失敗的問題 (#41195)
- GH-41198 - [C#] 修復 union 陣列的串聯 (#41226)
- GH-41199 - [C#] 修復存取切片十進位陣列的值 (#41200)
- GH-41258 - [C#][Integration] 修復具有非零偏移量的切片有效性緩衝區的比較 (#41259)
- GH-41263 - [C#][Integration] 確保在位元圖比較的每個分支中都考慮偏移量 (#41264)
- GH-41282 - [Dev] 如果合併腳本存在下一個主要版本,則始終提示 (#41305)
- GH-41306 - [C++] 當 NullBitmapBuffer 為 Null 時,檢查以避免複製 (#41452)
- GH-41317 - [C++] 修復無效 Parquet 檔案上的崩潰 (#41366)
- GH-41319 - [Python] `test_numpy_array_protocol` 測試在 numpy 2.0.0rc1 上失敗
- GH-41321 - [C++][Parquet] 更嚴格的 Parquet 層級檢查 (#41346)
- GH-41329 - [C++][Gandiva] 修復 gandiva 快取大小環境變數 (#41330)
- GH-41340 - [C++][CMake][Windows] 從連結庫中移除不必要的 .dll 後綴 (#41341)
- GH-41343 - [C++][CMake] 移除未使用的 ARROW_NO_DEPRECATED_API (#41345)
- GH-41356 - [Release][Docs] 更新發佈後文件任務,以移除穩定版本的警告橫幅 (#41377)
- GH-41367 - [C++][maybe_unused] 搭配 Arrow 巨集 (#41359)
- GH-41371 - [CI][Release] 在 macOS 上使用最新的 Ruby (#41379)
- GH-41390 - [CI] 在 csharp macOS 作業上使用 setup-python GitHub 動作 (#41392)
- GH-41397 - [C#] 降級 macOS 測試執行器以避免基礎架構錯誤 (#41934)
- GH-41418 - [C++][Large] scalar_if_else 核心函數的 ListView 和 Map 巢狀類型 (#41419)
- GH-41426 - [R][CI] 在 gh 執行器上安裝 CRAN 樣式的 openssl。 (#41629)
- GH-41433 - [C++][Gandiva] 修復 ascii_utf8 函數以在 x86 和 Arm 上傳回相同的結果 (#41434)
- GH-41464 - [Python] 修復 by=None 的 StructArray.sort() (#41495)
- GH-41467 - [CI][Release] 不要推送 conda-verify-rc 映像檔 (#41468)
- GH-41470 - [C++] 重複使用直接註冊的去重複邏輯 (#41466)
- GH-41471 - [Java] 修復效能 uber-jar (#41473)
- GH-41475 - [Python] 使用 Python 3.13 建置 (#42034)
- GH-41478 - [C++] 清理更多多餘的移動警告 (#41487)
- GH-41491 - [Python] 移除 Python <2.6 中與緩衝區相關的特殊方法 (#41492)
- GH-41502 - [Python] 修復讀取具有十進位值的欄索引 (#41503)
- GH-41529 - [C++][Compute] 移除 ExecScalarCaseWhen 中 ArrayData 作為 ExecResults 的多餘邏輯 (#41380)
- GH-41534 - [Go] 修復匯入長度為 0 的 C 陣列時的記憶體洩漏 (#41535)
- GH-41541 - [Go][Parquet] 更多針對寫入器效能衰退的修復 (#42003)
- GH-41541 - [Go][Parquet] 修復寫入器效能衰退的問題 (#41638)
- GH-41571 - [Java] 還原 GH-41307 (#41309) (#41628)
- GH-41573 - [Java] VectorSchemaRoot 使用效率低下的串流來複製 fieldVectors (#41574)
- GH-41581 - [C++][CMake] 正確使用 Protobuf_PROTOC_EXECUTABLE (#41582)
- GH-41587 - [Docs][Python] 移除重複內容 (#41588)
- GH-41602 - [C#] 解決建置警告 (#41645)
- GH-41617 - [C++][CMake] 修復 ARROW_USE_BOOST 偵測條件 (#41622)
- GH-41630 - [Benchmarking] 修復基準測試中的異地建置 (#41631)
- GH-41648 - [Java] 關於 splitAndTransfer 的記憶體洩漏 (#41898)
- GH-41660 - [CI][Java] 還原與 devtoolset 相關的 GANDIVA_CXX_FLAGS (#41661)
- GH-41679 - [Release][Packaging][deb] 也更新 01-preparesh 中的套件名稱 (#41859)
- GH-41684 - [C++][Python] 將可選的 null_bitmap 新增至 MapArray::FromArrays (#41757)
- GH-41686 - [Java] TransferPair 中未保留結構子向量的可空性 (#41785)
- GH-41688 - [Dev] 在 cmake-format precommit hook 中包含所有相關的 CMakeLists.txt 檔案 (#41689)
- GH-41697 - [Go][Parquet] 在 BufferedPageWriter 關閉時釋放 BufferWriter (#41698)
- GH-41699 - [Python][Parquet] 在 SortingColumn 上實作 to_dict 方法 (#41704)
- GH-41711 - [C++] macros.h:修復 MSVC 的 ARROW_FORCE_INLINE (#41712)
- GH-41717 - [Java][Vector] 修復 MessageSerializer 中 ByteBuffer 倒帶的問題 (#41718)
- GH-41720 - [C++][Acero] 移除在 hash_join_benchmark 中呼叫的 QueryContext::Init 的無用參數 (#41716)
- GH-41725 - [Python] CMake:如果未啟用 Parquet 本身,則忽略 Parquet 加密選項(修復 Java 整合建置)(#41776)
- GH-41735 - [CI][Archery] 更新 archery 以與 pygit2 1.15 API 變更相容 (#41739)
- GH-41738 - [C++] 修復臨時向量堆疊可能大小不足的問題 (#41746)
- GH-41741 - [C++] 在嘗試刪除擴展元數據鍵之前,檢查該鍵是否存在 (#41763)
- GH-41758 - [Python] 禁止直接 pa.RecordBatchReader() 建構以避免區段錯誤 (#41773)
- GH-41771 - [C++] Iterator 在讀取所有值時立即釋放其資源 (#41824)
- GH-41780 - [C++][Flight][Benchmark] 確保等待伺服器就緒 (#41793)
- GH-41784 - [Packaging][RPM] 為 -libs 套件名稱使用 SO 版本 (#41838)
- GH-41787 - 更新 fmpp-maven-plugin 輸出目錄 (#41788)
- GH-41791 - [CI][Conda] 更新 azure.linux.yml 任務,將 CondaEnvironment@1 替換為 Bash@3 (#41883)
- GH-41813 - [C++] 修復
CompareColumnsToRows
中大於 2GB 的 avx2 收集偏移量 (#42188) - GH-41829 - [R] 將 README 中的相對 URL 更新為絕對路徑,以防止 CRAN 檢查失敗 (#41830)
- GH-41836 - [Java] 修復 ARROW_S3=OFF 時的未定義符號錯誤 (#41837)
- GH-41862 - [C++][S3] 修復關閉輸出串流時的潛在死鎖 (#41876)
- GH-41884 - [Python] 修復 RecordBatchReader.cast 以支援轉換為所有類型的相等結構描述 (#42098)
- GH-41902 - [Java] Variadic Buffer Counts 不正確 (#41930)
- GH-41903 - [CI][GLib] 使用最新的 Ruby 以使用 OpenSSL 3 (#42001)
- GH-41920 - [CI][JS] 新增遺失的建置目錄引數 (#41921)
- GH-41924 - [Python] 修復在 Windows 上使用 NumPy 2.0 時的測試 (#42099)
- GH-41964 - [CI][C++] 清除 AppVeyor 上 mamba 的快取 (#41977)
- GH-42005 - [Java][Integration][CI] 修復 ARROW_BUILD_ROOT 路徑以尋找 pom.xml (#42008)
- GH-42006 - [CI][Python] 在驗證腳本上,使用 pip install -e 而不是 setup.py build_ext –inplace 安裝 pyarrow (#42007)
- GH-42015 - [MATLAB] 在從 14.39.33519 更新到 14.40.33807 的 MSVC 更新後,執行
tfeather.m
測試類別會導致 MATLAB 在windows-2022
上崩潰 (#42123) - GH-42017 - [CI][Python][C++] 修復 Windows 上 wheel 的 utf8proc 偵測 (#42022)
- GH-42039 - [Docs][Go] 修復損壞的連結 (#42040)
- GH-42041 - [Swift] 修復可為空類型解碼器問題 (#42043)
- GH-42065 - [C++] 支援 list_slice 上的 list-views (#42067)
- GH-42104 - [C++] 修復 OTel 測試失敗並移除不必要的日誌 (#42122)
- GH-42107 - [C++][FS][Azure] 確保設定 BlobSasBuilder::Protocol (#42108)
- GH-42116 - [C++] 在 array_take 和 array_filter 中支援 list-view 類型陣列 (#42117)
- GH-42130 - [GLib] 修復使用 MSVC 建置 gir 檔案 (#42131)
- GH-42136 - [CI][Go][Java][JS] 明確地使用基於 AMD64 的 macOS (#42175)
- GH-42139 - [C++] 修復一些潛在的未初始化變數警告 (#42207)
- GH-42140 - [C++] 避免 parquet-encoding-benchmark 中的無效存取 (#42141)
- GH-42149 - [C++] 使用 FetchContent 進行捆綁 ORC (#43011)
- GH-42170 - [Python][CI] 更新 numpy 2.0.0 的預期輸出 (#42172)
- GH-42197 - [CI][Packaging][Java] 確保在 macOS 上更新 “python@*” 公式 (#42202)
- GH-42198 - [C++] 修復 GetRecordBatchPayload 在裝置資料上崩潰的問題 (#42199)
- GH-42208 - [Java] 修復 flight-sql-jdbc-driver 模組中的測試 (#42217)
- GH-42213 - [Swift] 僅在 CI 上使用 “–warnings-as-errors” (#42214)
- GH-42220 - [R] 在元數據清理中處理 vctrs_rcrd 擴展類型 (#42226)
- GH-42224 - [Java] 修復 TestAceroSubstraitConsumer 測試方法中的錯字 (#42225)
- GH-42232 - [C++] 使用非過時的 c-ares 下載 URL (#42250)
- GH-42234 - [CI][R] 在 valgrind 測試中停用 libarrow 二進位檔使用 (#42249)
- GH-43048 - [JAVA] 通過正確報告索引來修復 IndexOutOfBoundsException 訊息 (#43049)
- GH-43058 - [C#] 還原將 Xunit 從 2.8.0 升級到 2.8.1 (#43074)
- GH-43059 - [CI][Gandiva] 在 AlmaLinux 8 上停用 Python Gandiva 測試 (#43093)
- GH-43062 - [Go] 使用 calloc 而不是 malloc (#43052)
- GH-43070 - [C++][Parquet] 檢查有效的密文長度以防止區段錯誤 (#43071)
- GH-43116 - [C++][Compute] 將 KeyCompare.CompareColumnsToRowsLarge 標記為大記憶體測試 (#43128)
- GH-43119 - [CI][Packaging] 更新已棄用的 manylinux 2014 CentOS 儲存庫 (#43121)
- GH-43122 - [CI][Packaging][RPM][CentOS] 為 SCL 使用 vault.centos.org (#43127)
- GH-43134 - [C++] 將捆綁的 google-cloud-cpp 升級到 2.22.0 (#43136)
- GH-43158 - [Packaging] 在 AlmaLinux 8/CentOS Stream 8 上使用捆綁的 nlohmann/json (#43159)
- GH-43199 - [CI][Packaging] dev/release/utils-create-release-tarball.sh 不應在 tarball 頂層目錄的名稱中包含發佈候選版本號碼。 (#43200)
- GH-43204 - [CI][Packaging] 應用 vcpkg 修補程式以修復 Thrift 版本 (#43208)
新功能與改進
- GH-29537 - [R] 支援使用隱含聯結進行 mutate/summarize (#41350)
- GH-33484 - [C++][Compute] 實作
Grouper::Reset
(#41352) - GH-35804 - [CI][Packaging][Conan] 同步上游 conan (#39729)
- GH-35888 - [Java] 新增 FlightStatusCode.RESOURCE_EXHAUSTED (#41508)
- GH-37333 - [Python] 將 pandas.util.testing.rands 替換為供應商版本 (#42089)
- GH-37720 - [Go][FlightSQL] 將預先處理的語句句柄新增至 DoPut 結果 (#40311)
- GH-37728 - [Java] 新增方法以取得 ValueVector 的 Iterable (#41895)
- GH-37929 - [Python] 開始將靜態設定移動到 pyproject.toml (#41041)
- GH-37938 - [Swift] 新增初始 C 資料介面實作 (#41342)
- GH-38255 - [Go][C++] 實作 Flight SQL 大量攝取 (#38385)
- GH-38325 - [Python] 實作 PyArrow 中裝置資料的 PyCapsule 介面 (#40717)
- GH-38325 - [Python] 使用 C 裝置資料支援擴展 Arrow PyCapsule 介面 (#40708)
- GH-38692 - [C#] 在純量陣列上實作 ICollection<T?> (#41539)
- GH-39204 - [Format][FlightRPC][Docs] 穩定 Flight SQL (#41657)
- GH-39220 - [Python] 讓 RecordBatch.filter 除了遮罩陣列外,還接受布林運算式 (#43043)
- GH-39301 - [Archery][CI][Integration] 將 nanoarrow 新增至 archery + 整合設定 (#39302)
- GH-39344 - [C++][FS][Azure] 支援 azure cli 驗證 (#41976)
- GH-39345 - [C++][FS][Azure] 新增環境憑證支援 (#41715)
- GH-39649 - [Java][CI] 修復或抑制 spurious errorprone warnings stage 2 (#39777)
- GH-39722 - [JS] 清理封裝 (#39723)
- GH-39798 - [C++] 針對固定大小類型(包括巢狀固定大小列表)最佳化 Take (#41297)
- GH-39858 - [C++][Device] 將 Copy/View 切片函數新增至 CPU 指標 (#41477)
- GH-39898 - [C++] 新增 OpenTelemetry 日誌記錄的支援 (#39905)
- GH-39990 - [Docs][CI] 新增 sphinx-lint 以進行文件 linting (#40022)
- GH-40078 - [C++] 匯入/匯出 ArrowDeviceArrayStream (#40807)
- GH-40339 - [Java] StringView 初始實作 (#40340)
- GH-40342 - [Python] 修復 cython 2 的 LocalFileSystem 的 pickle 問題 (#41459)
- GH-40342 - [C++] 將 LocalFileSystem 移動到登錄檔 (#40356)
- GH-40361 - [C++] 使 flatbuffers 序列化更具確定性 (#40392)
- GH-40384 - [Python] 擴展 C 裝置介面綁定以支援在 CUDA 裝置上匯入 (#40385)
- GH-40494 - [Go] 新增 protobuf 訊息的支援 (#40496)
- GH-40644 - [Python] 允許傳遞欄名稱的映射到
rename_columns
(#40645) - GH-40734 - [Packaging][Debian] 放棄對 Debian bullseye 的支援 (#41394)
- GH-40749 - [Python][Packaging] 在建置 wheel 時剝離不必要的符號 (#42028)
- GH-40819 - [Java] 將 Spotless 新增至 Algorithm 模組 (#41825)
- GH-40820 - [Java] 將 Spotless 新增至 Adapter 模組 (#42048)
- GH-40822 - [Java] 將 Spotless 新增至 C 模組 (#42059)
- GH-40823 - [Java] 將 Spotless 新增至 Compression 模組 (#42060)
- GH-40824 - [Java] 將 Spotless 新增至 Dataset 模組 (#42062)
- GH-40825 - [Java] 將 Spotless 新增至 Flight 模組 (#42063)
- GH-40826 - [Java] 將 Spotless 新增至 Format 模組
- GH-40827 - [Java] 將 Spotless 新增至 Gandiva 模組 (#42055)
- GH-40828 - [Java] 格式化 arrow-maven-plugins 模組 (#42054)
- GH-40829 - [Java] 將 Spotless 新增至 Memory 模組 (#42056)
- GH-40830 - [Java] 將 Spotless 新增至 Performance 模組 (#42057)
- GH-40831 - [Java] 將 Spotless 新增至 Tools 模組 (#42058)
- GH-40832 - [Java] 將 Spotless 新增至 Vector 模組 (#42061)
- GH-40930 - [Java] 實作在 StringView 中檢索參考緩衝區的函數 (#41796)
- GH-40932 - [Java] 實作 StringView 的 TransferPair 功能 (#41861)
- GH-40933 - [Java] 增強 StringView 中的 copyFrom* 功能 (#41752)
- GH-40942 - [Java] 實作 StringView 的 C 資料介面 (#41967)
- GH-40943 - [Java] 實作 StringView 的 RangeEqualsVisitor (#41636)
- GH-40944 - [Java] 實作 StringView 的 TypeEqualsVisitor (#41606)
- GH-40968 - [C++][Gandiva] 為 Like 函數新增 RE2::Options set_dot_nl(true) (#40970)
- GH-41020 - [C++] 引入可移植的編譯器假設 (#41021)
- GH-41035 - [C++] 新增 grouper 基準測試以防止效能衰退 (#41036)
- GH-41055 - [C++] 支援 flatten 以組合巢狀列表相關類型 (#41092)
- GH-41085 - [CI][Java] 將 Spark 整合測試新增至 Crossbow 任務中的 “java” 群組 (#41086)
- GH-41089 - [C++] 清理與半精度浮點數轉換相關的剩餘任務 (#41084)
- GH-41095 - [C++][FS][Azure] 新增對具有階層式命名空間支援的 CopyFile 的支援 (#41276)
- GH-41102 - [Packaging][Release] 為發佈候選版本建立唯一的 git 標籤(例如 apache-arrow-{MAJOR}.{MINOR}.{PATCH}-rc{RC_NUM}) (#41131)
- GH-41105 - [Python][Docs] 更新 PyArrow 安裝文件以說明 conda 套件拆分 (#41135)
- GH-41114 - [C++] 新增 is_validity_defined_by_bitmap() 述詞 (#41115)
- GH-41116 - [C++] IO:增強 CompressedInputStream 中的邊界檢查 (#41117)
- GH-41126 - [Python] 裝置和 MemoryManager 類別的基本綁定 (#41685)
- GH-41134 - [GLib] 支援使用 MSVC 建置 arrow-glib (#41599)
- GH-41159 - [Go][Parquet] 改善 Parquet BitWriter WriteVlqInt 效能 (#41160)
- GH-41173 - [Java] 為 Maven pom.xml 檔案新增 spotless 配置 (#41174)
- GH-41183 - [C++][Python] 在 list_flatten 核心函數和 pyarrow 綁定上公開列表的遞迴 flatten (#41295)
- GH-41186 - [C++][Parquet][Doc] 在 parquet.rst 中標註 PARQUET:field_id (#41187)
- GH-41203 - [Python][Packaging] 確保在 wheel 建置工作流程中使用已發佈的 numpy 2.0(而不是 RC)進行建置 (#42194)
- GH-41240 - [Release][Packaging] 使用 Debian bookworm 上傳二進位檔 (#41241)
- GH-41243 - [Release][Packaging] 避免 “archery crossbow download-artifacts” 造成不必要的下載 (#41244)
- GH-41256 - [Format][Docs] 為 JSON 新增標準擴展類型規範 (#41257)
- GH-41262 - [Java][FlightSQL] 實作無狀態預先處理的語句 (#41237)
- GH-41287 - [Java] ListViewVector 實作 (#41285)
- GH-41298 - [Format][Docs] 為 UUID 新增標準擴展類型規範 (#41299)
- GH-41301 - [C++] 提取用於 PrimitiveTakeExec 的核心迴圈,並將其推廣到任何固定寬度類型 (#41373)
- GH-41307 - [Java] 使用 org.apache:apache 父 pom 版本 31 (#41772)
- GH-41307 - [Java] 使用 org.apache:apache 父 pom 版本 31 (#41309)
- GH-41314 - [CI][Python] 在 ARM64 macOS 上新增一個作業 (#41313)
- GH-41316 - [CI][Python] 減少 macOS 上的 CI 時間 (#41378)
- GH-41323 - [R] 重新設計 summarize() 評估運算式的方式 (#41223)
- GH-41327 - [Ruby] 在 Arrow::Table#to_s 中顯示類型名稱 (#41328)
- GH-41334 - [C++][Acero] 使用每個節點的臨時向量堆疊來減輕溢位 (#41335)
- GH-41349 - [C#] 在 .NET 7+ 上最佳化 DecimalUtility.GetBytes(SqlDecimal) (#42150)
- GH-41358 - [R] 支援聯結 “na_matches” 引數 (#41372)
- GH-41361 - [C++][Parquet] 當 max_rep_level > 1 時,通過批次執行最佳化 DelimitRecords (#41362)
- GH-41375 - [C#] 移至 .NET 8.0 (#41376)
- GH-41385 - [CI][MATLAB][Packaging] 在 CI 和 crossbow 封裝工作流程中新增 MATLAB
R2024a
的支援 (#41504) - GH-41389 - [Python] 以儲存類型的形式公開 ExtensionType 的 byte_width 和 bit_width (#41413)
- GH-41400 - [MATLAB] 將
libmexclass
版本提升到提交ca3cea6
(#41436) - GH-41410 - [C++][FS][Azure][Docs] 將 AzureFileSystem 新增至 Filesystems API 參考 (#41411)
- GH-41420 - [R] 更新 16.1.0 的 NEWS.md (#41422)
- GH-41427 - [Go] 修復無狀態預先處理的語句 (#41428)
- GH-41430 - [Docs] 使用 sphinxcontrib-mermaid 而不是從 .mmd 產生映像檔 (#41455)
- GH-41435 - [CI][MATLAB] 新增作業以在
macos-14
上建置和測試 MATLAB 介面 (#41592) - GH-41450 - [R][CI] rhub/container 後續 (#41451)
- GH-41460 - [C++] 使用 ASAN 來毒害臨時向量堆疊記憶體 (#41695)
- GH-41480 - [Python] 更新 Python 開發指南,說明組件預設根據 Arrow C++ 啟用 (#41705)
- GH-41480 - [Python] 建置 PyArrow:預設根據 Arrow C++ 中的可用性啟用/停用 Python 組件 (#41494)
- GH-41493 - [C++][S3] 新增一個新選項以在 CreateDir 之前檢查是否存在 (#41822)
- GH-41507 - [MATLAB][CI] 將
strict: true
傳遞給matlab-actions/run-tests@v2
(#41530) - GH-41527 - [CI][Dev] 移除不必要的 six 要求 (#43087)
- GH-41531 - [MATLAB][Packaging] 將
matlab-actions/setup-matlab
和matlab-actions/run-command
從v1
提升到v2
在crossbow
作業中 (#41532) - GH-41540 - [R] 簡化 arrow_eval() 邏輯和綁定環境 (#41537)
- GH-41545 - [C++][Parquet] 修復 DeltaLengthByteArrayEncoder::EstimatedDataEncodedSize (#41546)
- GH-41547 - [C++] Thirdparty:將 xsimd 升級到 13.0.0 (#41548)
- GH-41558 - [C++] 改善 fixed_width_test_util.h (#41575)
- GH-41560 - [C++] ChunkResolver:實作 ResolveMany 並新增單元測試 (#41561)
- GH-41590 - [Java] 改善 BaseRepeatedValueVector 函數在 isEmpty 和 isNull 操作上的表現 (#41601)
- GH-41596 - [C++] fixed_width_internal.h:簡化文件字串並支援位元大小的類型 (BOOL) (#41597)
- GH-41608 - [C++][Python] 將 add_key_value 擴展到 parquet::arrow 和 PyArrow (#41633)
- GH-41611 - [Docs][CI] 為文件啟用大多數 sphinx-lint 規則 (#41612)
- GH-41620 - [Docs] 記錄 merge.conf 用法 (#41621)
- GH-41626 - [R][CI] 將 OpenSUSE 從 15.3 更新到 15.5 (#41627)
- GH-41652 - [C++][CMake][Windows] 不要建置不必要的物件庫 (#41658)
- GH-41653 - [MATLAB] 新增新的
arrow.c.Array
MATLAB 類別,該類別包裝 C 資料介面格式ArrowArray
C 結構 (#41655) - GH-41654 - [MATLAB] 新增新的
arrow.c.Schema
MATLAB 類別,該類別包裝 C 資料介面格式ArrowSchema
C 結構 (#41674) - GH-41656 - [MATLAB] 為
arrow.array.Array
新增 C 資料介面格式匯入/匯出功能 (#41737) - GH-41662 - [Python] 確保 Buffer 方法不會因非 CPU 資料而崩潰 (#41889)
- GH-41664 - [C++][Python] 通過複製到預設 CPU 裝置來 PrettyPrint 非 CPU 資料 (#42010)
- GH-41675 - [Packaging][MATLAB] 新增 crossbow 作業以在 macos-14 上封裝 MATLAB 介面 (#41677)
- GH-41681 - [GLib] 為每個 GLib 庫產生單獨的版本巨集 (#41721)
- GH-41691 - [Doc] 移除 “邏輯類型” 的概念 (#41958)
- GH-41702 - [C++][Parquet] Thrift:產生模板方法以加速讀取 thrift (#41703)
- GH-41726 - [C++][Parquet] 次要:預設移動 EncodedStats 而不是複製 (#41727)
- GH-41730 - [Java] 將 variadicBufferCounts 新增至 RecordBatch (#41732)
- GH-41748 - [Python][Parquet] 更新 write_table() 文件字串中的 BYTE_STREAM_SPLIT 描述 (#41759)
- GH-41749 - [GLib] 允許從 Dataset 或 Scanner 取得 RecordBatchReader (#41750)
- GH-41755 - [C++][ORC] 確保設定偵測到的 ORC 版本 (#41767)
- GH-41760 - [C++][Parquet] 新增檔案元數據讀取/寫入基準測試 (#41761)
- GH-41770 - [CI][GLib] 明確地移除臨時檔案 (#41807)
- GH-41783 - [C++] 使依賴 git 的定義成為內部定義 (#41781)
- GH-41789 - [Java] 清理 immutables 和 checkerframework 依賴項 (#41790)
- GH-41797 - [C++][S3] 移除較新 AWS SDK 版本的 GetBucketRegion hack (#41798)
- GH-41799 - [Java] 遷移到 com.gradle:develocity-maven-extension (#41800)
- GH-41803 - [MATLAB] 為
arrow.tabular.RecordBatch
新增 C Data Interface 格式匯入/匯出功能 (#41817) - GH-41804 - [Swift] 新增 Struct (巢狀) 類型 (#43082)
- GH-41806 - [GLib][CI] 使用 vcpkg 以處理在使用 MSVC 建置 GLib 函式庫時的 C++ 相依性 (#41839)
- GH-41818 - [C++][Parquet] 正規化字典編碼以使用 RLE_DICTIONARY (#41819)
- GH-41834 - [R] 改善 dplyr 程式碼中的錯誤處理 (#41576)
- GH-41841 - [R][CI] 移除更多失效的 rhub 容器 (#41828)
- GH-41887 - [Go] 透過 pre-commit 執行 linter (#41888)
- GH-41899 - [C++] IPC:稍微增強 writer 的程式碼 (#41900)
- GH-41905 - [JS] 更新相依性 (#41906)
- GH-41910 - [Python] 新增 Pyodide 支援 (#37822)
- GH-41923 - [C++] 修正 ExecuteScalar 推導 chunked_array 的 all_scalar (#41925)
- GH-41929 - [Java] pom.xml 授權格式化 (#42049)
- GH-41945 - [Swift] 新增介面 ArrowArrayHolderBuilder (#41946)
- GH-41947 - [Java] 在具有會期選項的 JDBC 驅動程式中支援 catalog (#42035)
- GH-41952 - [R] 預設為 macOS 開啟 S3 和 ZSTD (#42210)
- GH-41953 - [C++] 稍微增強 FixedShapeTensorType 的程式碼風格 (#41954)
- GH-41955 - [C++] 後續新增 null_bitmap 至 MapArray::FromArrays (#41956)
- GH-41960 - 公開新的 S3 選項 check_directory_existence_before_creation (#41972)
- GH-41968 - [Java] 為 BinaryView 實作 TransferPair 功能 (#41980)
- GH-41970 - [C++] 其他變更使 list-like 類型和 list-view 類型周圍的程式碼行為方式相同 (#41971)
- GH-41978 - [Python] 修正 pandas 測試以遵循下游 datetime64 單位變更 (#41979)
- GH-41983 - [Dev] 僅在開啟 issue 時(而非編輯時)執行 issue 標籤機器人 (#41986)
- GH-41994 - [C++] : kernel.cc:移除 switch 的預設值,以便編譯器可以檢查我們的完整 enum 涵蓋範圍 (#41995)
- GH-41999 - [Swift] 新增將陣列和 vargs 新增至 arrow 陣列的方法 (#42000)
- GH-42002 - [Java] 更新 Vector 模組的單元測試 (#42019)
- GH-42013 - [Python] 允許 Array.filter() 接受一般陣列輸入 (#42051)
- GH-42016 - [Python] 在 pyarrow.parquet 綁定中公開新的 FLOAT16 邏輯類型 (#42103)
- GH-42020 - [Swift] 為 Swift Codable 新增 Arrow 解碼實作 (#42023)
- GH-42021 - [Swift] 為 Swift Codable 新增 Arrow 編碼器實作 (#43063)
- GH-42025 - [Java] 更新 Algorithm 模組的單元測試 (#42029)
- GH-42030 - [Java] 更新 Adapter 模組的單元測試 (#42038)
- GH-42042 - [Java] 更新 Compressions 模組的單元測試 (#42044)
- GH-42045 - [Java] 更新 Flight 模組的單元測試 (#42158)
- GH-42087 - [Swift] 重構以移除建置警告 (#42088)
- GH-42092 - [Java] 更新 Tools 模組的單元測試 (#42093)
- GH-42100 - [C++][Parquet] ParquetFilePrinter::JSONPrint 印出 FLBA 的長度 (#41981)
- GH-42101 - [Java] 在 FileRoundtrip 中建立用於輸出驗證的檔案 (#42115)
- GH-42109 - [C++][CMake] 為 Valgrind 新增預設配置 (#42110)
- GH-42112 - [Python] Array 在非 CPU 裝置上優雅地失敗 (#42113)
- GH-42121 - [Java] 清理 spotless 外掛程式配置 (#43019)
- GH-42124 - [Swift] 新增依類型載入和驗證 builder 的方法 (#42195)
- GH-42126 - [C++] 將 TakeXXX 自由函式移至 TakeMetaFunction 並設為私有 (#42127)
- GH-42128 - [封裝][CentOS] 遷移 CentOS 7 和 CentOS Stream 8 封裝工作以使用 vault.centos.org (#42129)
- GH-42134 - [C++][FS][Azure] 驗證 AzureOptions::{blob,dfs}_storage_scheme (#42135)
- GH-42143 - [R] 清理 R metadata (#41969)
- GH-42146 - [MATLAB] 新增 IPC
RecordBatchFileReader
和RecordBatchFileWriter
MATLAB 類別 (#42201) - GH-42162 - [Java] 更新 Dataset 模組的單元測試 (#42163)
- GH-42164 - [Java] 更新 Gandiva 模組的單元測試 (#42166)
- GH-42165 - [Java] 更新 Memory 模組的單元測試 (#42161)
- GH-42167 - [CI] 升級 .env 中 vcpkg 的版本 (#42171)
- GH-42168 - [Python][Parquet] Pyarrow 將 decimal 儲存為 integer (#42169)
- GH-42190 - [Python] 為 Numpy 1.X 新增 CI 工作 (#42189)
- GH-42193 - [Java] 更新相依性以僅維護 JUnit 5 (#42206)
- GH-42228 - [CI][Java] 在 java-jars 中抑制傳輸進度記錄 (#42230)
- GH-42235 - [C++] list_parent_indices:新增 list-view 類型的支援 (#42236)
- GH-42243 - [Swift] 更新 isValidBuilderType 以不要求類型的實例 (#42244)
- GH-42245 - [Swift] 確保所有金鑰類型的 map 行為相同 (#42246)
- GH-43020 - [Java] 簡化 flight.properties 產生 (#43028)
- GH-43033 - [CI][Docker] 為 python-wheel-windows-test-vs2019 啟用 linter (#43034)
- GH-43040 - [C++] 減少 many-join 測試的遞迴 (#43042)
- GH-43045 - [CI][Python] 在 python substrait 整合中釘選 openjdk=17 (#43051)
- GH-43060 - [C++] 使用 raw_read_bound 限制 BufferedInputStream::SetBufferSize 中的緩衝區大小 (#43064)
- GH-43076 - [C#] 升級 Xunit 並變更 Python 整合測試的略過方式 (#43091)