Apache Arrow 10.0.0 (2022年10月26日)
這是一個主要版本發布,涵蓋了超過兩個月的開發。
下載
貢獻者
此版本包含來自 100 位不同貢獻者的 536 次提交。
$ git shortlog -sn apache-arrow-9.0.0..apache-arrow-10.0.0
68 Sutou Kouhei
52 Matt Topol
32 David Li
31 Antoine Pitrou
19 Alenka Frim
19 Jacob Wujciak-Jens
19 Weston Pace
18 Miles Granger
18 Nic Crane
17 Jin Shang
17 Raúl Cumplido
14 Neal Richardson
14 eitsupi
12 Will Jones
12 david dali susanibar arce
11 Dewey Dunnington
10 Vibhatha Lakmal Abeykoon
7 Igor Suhorukov
7 Larry White
7 Rok Mihevc
6 rtpsw
5 Kshiteej K
5 octalene
4 Krisztián Szűcs
4 Yibo Cai
3 Ben Harkins
3 Bryce Mecum
3 Dominik Moritz
3 George Godik
3 Joris Van den Bossche
3 LouisClt
3 Percy Camilo Triveño Aucahuasi
3 Philipp Moritz
3 Todd Farmer
3 Wes McKinney
2 0x26res
2 Anja Kefala
2 Dragoș Moldovan-Grünfeld
2 François Michonneau
2 Gang Wu
2 Hongze Zhang
2 Joost Hoozemans
2 Kae S
2 Nishanth Thimmegowda
2 Pavel Solodovnikov
2 SHIMA Tatsuya
2 Sam Albers
2 Ziheng Wang
1 Aleksei Smirnov
1 Andrea Giudiceandrea
1 Ankit Gehlot
1 Artavazd Balaian
1 Benson Muite
1 Christopher Dunderdale
1 Corey Kosak
1 Dhruv Vats
1 Duncan MacQuarrie
1 Egill Fridgeirsson
1 Eng Zer Jun
1 Felix Yan
1 Gajo Petrovic
1 Gil Forsyth
1 Ivan Chau
1 Jacky Lee
1 James Bourbeau
1 James Duong
1 Jayjeet Chakraborty
1 Jeroen van Straten
1 Jie Zhang
1 Jin Chengcheng
1 Kai Fricke
1 Kevin Gurney
1 Kun Liu
1 Leo Gertsenshteyn
1 Liang-Chi Hsieh
1 Michael Chirico
1 Michał Pogoda
1 Mitch
1 Muthunagappan Muthuraman
1 Otegami
1 Quang Hoang
1 Quanlong Huang
1 Raphael Taylor-Davies
1 Rasmus Johansen
1 Sanjiban Sengupta
1 Theodore Tsirpanis
1 Wilhelm Ågren
1 William Hyun
1 Xianyang Liu
1 ZMZ91
1 andreoss
1 dependabot[bot]
1 emkornfield
1 fatemehp
1 lafiona
1 mgiessing
1 michalursa
1 mopcup
1 patrick
1 serge-sans-paille
補丁提交者
以下 Apache 提交者將貢獻的補丁合併到儲存庫中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-9.0.0..apache-arrow-10.0.0
126 Sutou Kouhei
97 Antoine Pitrou
68 David Li
59 Matt Topol
41 Neal Richardson
26 Joris Van den Bossche
25 Weston Pace
21 Nic Crane
13 Dewey Dunnington
11 Yibo Cai
10 Alenka Frim
9 Krisztián Szűcs
4 Jonathan Keane
4 Rok
2 Eric Erhardt
2 Philipp Moritz
2 Wes McKinney
1 Alessandro Molina
1 Andrew Lamb
1 Benjamin Kietzman
1 Dominik Moritz
1 Ian Cook
1 Rok Mihevc
變更日誌
Apache Arrow 10.0.0 (2022-10-26)
新功能與改進
- ARROW-3678 - [Go] 實作 Union Arrays (#13768)
- ARROW-6772 - [C++] 為具有 Equals() 方法的介面新增 operator== (#14038)
- ARROW-6858 - [C++] 簡化可轉移建置選項依賴性 (#14224)
- ARROW-7744 - [Java][FlightRPC] Arrow Flight SQL 的 JDBC 驅動程式 (#13800)
- ARROW-8201 - [Python] 新增 FileFragment.open() 方法 (#14301)
- ARROW-8226 - [Go] 新增 64 位元偏移 Binary Builder 和 String Builder (#13719)
- ARROW-10600 - [Go] 實作 Decimal256 (#13792)
- ARROW-11699 - [R] 為 mutate() 實作 dplyr::across()
- ARROW-11841 - [R][C++] 允許取消長時間執行的命令 (#13635)
- ARROW-12105 - [R] 使用 eval_select, eval_rename 替換 vars_select, vars_rename (#14371)
- ARROW-12590 - [C++][R] 更新 Homebrew 檔案的副本以反映最近的更新 (#13769)
- ARROW-12693 - [R] 為 ArrowTabular, datasets 新增 unique() 方法 (#13641)
- ARROW-12778 - [R] 在 dplyr 動詞中支援 tidyselect where() 選擇輔助函數
- ARROW-12958 - [CI][Developer] 為 PR 分支建置 + 託管文件 (#13913)
- ARROW-13055 - [Doc] 建立正規擴充類型文件 (#14167)
- ARROW-13454 - [C++][Docs] 表格 vs Record Batches (#14008)
- ARROW-13766 - [R] 新增 slice_*() 方法 (#14361)
- ARROW-14280 - [Doc] R 套件架構概觀 (#14294)
- ARROW-14495 - [Python] 修復 DictionaryArray.from_buffers,不應崩潰 (#13989)
- ARROW-14500 - [C++] 支援從儲存類型轉換為擴充類型
- ARROW-14958 - [C++][Python][FlightRPC] 為 OpenTelemetry 傳播實作 Flight 中介軟體 (#11920)
- ARROW-15011 - [R] 為 dplyr 函數綁定產生文件 (#14014)
- ARROW-15260 - [R] open_dataset - 新增 file_name 作為欄位 (#12826)
- ARROW-15277 - [C++][Python] 為 chunked_array 使用 ChunkedArray::Make (#13950)
- ARROW-15479 - [C++] 將固定大小列表轉換為相容的固定大小列表類型(其他值類型,其他欄位名稱)(#14181)
- ARROW-15481 - [R][CI] 新增模擬 CRAN 舊版 macOS 的 crossbow 工作 (#13925)
- ARROW-15540 - [C++] 允許 Substrait 消費者接受帶有提示和可為空值文字的計畫 (#14402)
- ARROW-15545 - [Python][C++] 支援轉換為擴充類型 (#14106)
- ARROW-15582 - [C++] 新增註冊標準 Substrait 函數的支援 (#13613)
- ARROW-15584 - [C++] 新增對 Substrait 的 RelCommon::Emit 的支援 (#13914)
- ARROW-15678 - [C++] 新增對 -DCMAKE_BUILD_TYPE=MinSizeRel 的支援 (#14342)
- ARROW-15693 - [Dev] 更新 crossbow 範本以使用 master 或 main (#13975)
- ARROW-15745 - [Java] 棄用 ScanTask 的多餘 iterable (#14168)
- ARROW-15838 - [R] 在 full outer join 中合併 join keys (#14286)
- ARROW-15839 - [C++][Python] 在 ListArray.from_arrays 中接受有效性位元圖 (#13894)
- ARROW-15927 - [C++][Skyhook] 新增 skyhook 範例 (#12620)
- ARROW-16000 - [C++][Python] Dataset:將轉碼函數選項新增至 CSV 掃描器的替代實作 (#13820)
- ARROW-16190 - [CI][R] 在 Apple M1 上為 R 實作 CI (#14099)
- ARROW-16226 - [C++] 為檔案系統 tell 新增更好的覆蓋率。 (#14064)
- ARROW-16340 - [C++][Python] 將所有 Python 相關程式碼移至 PyArrow (#13311)
- ARROW-16356 - [Python] 公開 RandomAccessFile::GetStream (#13793)
- ARROW-16384 - [Docs] 將 Flight SQL 新增至狀態頁面 (#14053)
- ARROW-16424 - [C++] 使用 Uri 解析 substrait ReadRel 檔案路徑 (#14071)
- ARROW-16431 - [C++][Python] 當架構不同時,改進 AppendRowGroups 錯誤訊息 (#14029)
- ARROW-16584 - [Java] 具有 S3 支援的 Java JNI (#13157)
- ARROW-16605 - [CI][R] 修復 revdep docker 工作 (#13483)
- ARROW-16690 - [R][FlightRPC] do_put 方法中的額外 max_chunksize 參數 (#13267)
- ARROW-16695 - [R][Python][C++] joins 中不支援擴充類型 (#13501)
- ARROW-16719 - [Python] 將路徑/URI + 檔案系統處理新增至 parquet.read_metadata (#13629)
- ARROW-16740 - [C++] 移除 IR Consumer (#13301)
- ARROW-16855 - [C++] 新增 Read Relation ToProto (#13401)
- ARROW-16870 - [C++] 修復 flight 範例的 ldd 和 clang 的連結問題 (#14077)
- ARROW-16879 - [R][CI] 使用 testbench 測試 R GCS 綁定 (#13542)
- ARROW-16894 - [C++] 為 Asof Join Node 新增基準測試 (#13426)
- ARROW-16949 - [Doc] 將詞彙表新增至新貢獻者指南 (#13951)
- ARROW-16981 - [C++] 公開 jemalloc 統計資訊以進行日誌記錄 (#13516)
- ARROW-16988 - [C++] 引入 Substrait ToProto/FromProto 轉換選項 (#13537)
- ARROW-17004 - [Java] 新增實用工具,將 Arrow 資料繫結到 JDBC 參數 (#13589)
- ARROW-17016 - [C++][Python] 將 Arrow Python C++ 測試移至 Cython (#14117)
- ARROW-17017 - [C++][Python] 啟用 Arrow Python 的自動重建
- ARROW-17021 - [C++][R][CI] 在 crossbow 中啟用 sccache 的使用 (#13556)
- ARROW-17052 - [C++][Python][FlightRPC] 公開 flight 結構序列化 (#13986)
- ARROW-17079 - 顯示未知 S3 錯誤的 HTTP 狀態碼 (#14019)
- ARROW-17079 - [C++] 為 S3 錯誤引發適當的錯誤訊息,而不是錯誤碼 (#14001)
- ARROW-17079 - [C++] 改進 AWS S3 呼叫的錯誤訊息 (#13979)
- ARROW-17081 - [Java][Datasets] 將 JNI 建置設定從 cpp/ 移至 java/ (#13911)
- ARROW-17088 - [R] 使用
.arrow
作為 datasets 的 IPC 檔案的副檔名 (#13690) - ARROW-17089 - [Python] 使用
.arrow
作為 IPC 檔案 dataset 的副檔名 (#13677) - ARROW-17092 - [Docs] 在 IPC 檔案格式文件中新增關於 “Feather” 的註解 (#13693)
- ARROW-17106 - [Python] 將 init 程式碼移至 core 並僅公開 API (#13802)
- ARROW-17113 - [Java] 在靜態初始化程式碼區塊中明確失敗 (#13678)
- ARROW-17122 - [Python] 在將 Python 相關程式碼移至 pyarrow 後進行清理
- ARROW-17131 - [Python] 新增 StructType().field():依名稱或索引傳回欄位 (#13652)
- ARROW-17154 - [C++] 將 cmake 專案名稱從 arrow_python 變更為 pyarrow_cpp
- ARROW-17160 - [C++] 為 PyArrow CPP 標頭檔建立基礎目錄 (#14275)
- ARROW-17172 - [C++][Python] test_cython_api 在 windows 上失敗 (#14133)
- ARROW-17175 - [CI][macOS] macos-10.15 已棄用,而 macos-latest 是 macos-11 (#13684)
- ARROW-17178 - [R] 在具有使用者定義函數的 arrow_dplyr_query 中支援 head() (#13706)
- ARROW-17181 - [Docs][Python] 純量 UDF 實驗性文件 (#13687)
- ARROW-17205 - [Dev][Release] 當建立維護分支時,合併腳本應提示下一個版本 (#13708)
- ARROW-17214 - [C++] 為基於列表的類型新增純量轉換為字串類型 (#13737)
- ARROW-17219 - [Go][IPC] 非原生位元組序的位元組序轉換 (#13716)
- ARROW-17222 - [Docs][Archery][Integration] 記錄 archery 涵蓋的目前整合測試案例 (#13717)
- ARROW-17240 - [CI][Release] 在 nightly CI 中驗證 wheels (#14319)
- ARROW-17243 - [Website] 將 ClickHouse 新增至 “powered by”
- ARROW-17247 - [C++][Docs] 在 Acero Docs 中包含 ExecPlan API 的可見性 (#13741)
- ARROW-17252 - [R] 間歇性 valgrind 失敗 (#13773)
- ARROW-17266 - [Doc] Java nightlies 檔案字首已變更 (#13755)
- ARROW-17269 - [Java] 在 MapVector 中實作 TransferPair 方法,以取得正確的 valuevector 作為 mapvector 而不是 listvector (#13776)
- ARROW-17270 - [Docs] 將 nightly 套件說明移至 dev 文件 (#13766)
- ARROW-17273 - [Go][CSV] 為 csv.Writer 新增 Timestamp、Date32、Date64 格式支援 (#13772)
- ARROW-17274 - [GO] 從 parquet.file.RowGroupReader.Column(index int) 中移除 panic (#13767)
- ARROW-17275 - [Go][Integration] 處理 IPC 讀取/寫入中的 Large offset 類型 (#13770)
- ARROW-17276 - [Go][Integration] 為 union 類型實作 IPC 處理 (#13806)
- ARROW-17277 - [Go][CSV] 布林值的自訂 csv.Writer 格式器 (#13774)
- ARROW-17280 - [C++] 將 vendored flatbuffers 移至 private 命名空間 (#13775)
- ARROW-17282 - [Python] flake8 更新失敗 linter CI (#13778)
- ARROW-17287 - [C++] 建立不依賴合併產生器的掃描節點 (#13782)
- ARROW-17289 - [C++] 新增類型類別成員資格檢查 (#13783)
- ARROW-17293 - [Java][CI] 修剪 java nightly 建置 (#13839)
- ARROW-17297 - [Java][Doc] 新增透過 C Data Interface 在 C++ 和 Java 之間互動的文件 (#13788)
- ARROW-17299 - [C++][Python] 公開 Scanner kDefaultBatchReadahead 和 kDefaultFragmentReadahead 參數 (#13799)
- ARROW-17303 - [Java][Dataset] 透過 NativeDatasetFactory 讀取 Arrow IPC 檔案 (#13760) (#13811)
- ARROW-17304 - [C++][Compute] 在 aggregate 測試中,當比較失敗時列印實際值 (#13814)
- ARROW-17305 - [C++] 避免在 BitmapAnd 基準測試中花費時間在 popcount (#13794)
- ARROW-17306 - [C++] 為
LocalFileSystem
提供最佳化的GetFileInfoGenerator
特化 (#13796) - ARROW-17310 - [C++] 從 Iterator 公開 RBR:Make()
(#13798) - ARROW-17317 - [Release][Docs] 正規化先前的文件版本目錄 (#14457)
- ARROW-17318 - [C++][Dataset] 支援非同步串流介面,以取得 Dataset 中的片段 (#13804)
- ARROW-17320 - [Python] 完善 pyarrow.parquet API 公開 (#14096)
- ARROW-17321 - [JS] 更新依賴性 (#13758)
- ARROW-17322 - [Docs] 記錄錯誤和功能請求的問題生命週期 (#13781)
- ARROW-17323 - [Go] 清理和升級依賴性 (#13807)
- ARROW-17324 - [Go][CI] 新增 go1.18 工作和 -asan 旗標 (#13867)
- ARROW-17326 - [Go][FlightSQL] 為 Go 新增 FlightSQL 支援 (#13828)
- ARROW-17340 - [Go] 使用
T.TempDir
建立臨時測試目錄 (#13816) - ARROW-17348 - [C++] 新增使用 Visual C++ 2019 或更高版本建置 bundled LZ4 的支援 (#13817)
- ARROW-17349 - [C++] 允許轉換 map 類型 (#14198)
- ARROW-17355 - [R] 重構 handle_* 實用函數以獲得更好的開發體驗 (#14030)
- ARROW-17357 - [CI][Conan] 啟用 JSON (#13823)
- ARROW-17358 - [CI][C++] 為 Alpine Linux 新增工作 (#13825)
- ARROW-17359 - [Go][FlightSQL] 建立具有 SQLite in-mem 的範例,並使用它來測試 FlightSQL 伺服器 (#13868)
- ARROW-17362 - [R] 在 summarise() 內部實作 dplyr::across() (#14042)
- ARROW-17364 - [R] 在 across() 內部實作 .names 參數
- ARROW-17366 - [R] 在 .fns 參數中支援 purrr 樣式的 lambda 函數以用於 across() (#14327)
- ARROW-17367 - [C++] 修復 LZ4 的 CMake 目標名稱 (#13831)
- ARROW-17368 - [C++] 新增安裝實用工具的支援 (#13832)
- ARROW-17370 - [C++] 為 SplitString() 新增限制 (#13833)
- ARROW-17371 - [R] 移除 as.factor 到 dictionary_encode 的映射
- ARROW-17377 - [C++][Docs] 為基本 Arrow、檔案存取、compute 和 datasets 新增教學課程 (#13859)
- ARROW-17385 - [Integration] 重新啟用 Rust 整合案例 (#13852) (#13858)
- ARROW-17385 - [Integration] 還原 “重新啟用 Rust 整合案例” (#13856)
- ARROW-17387 - [R] 在 filter() 內部實作 dplyr::across() (#14281)
- ARROW-17390 - [Go] 新增 union 純量類型 (#13860)
- ARROW-17394 - [C++][Parquet] 修復 parquet_static 依賴性 (#13863)
- ARROW-17395 - [CI][Conan] 找不到 grpc-proto/cci.20220627 套件 (#13864)
- ARROW-17405 - [Doc][Java] C Data Interface 程式庫能夠使用 mvn 命令編譯 (#13881)
- ARROW-17407 - [Doc][FlightRPC] Flight/gRPC 最佳實務 (#13873)
- ARROW-17409 - [Packaging][RPM][GLib] *-glib-libs 應具有 .typelib,而 *-glib-devel 應具有 .gir (#13876)
- ARROW-17412 - [C++] AsofJoin 多個 keys 和類型 (#13880)
- ARROW-17418 - [Doc][Java] Dataset 程式庫能夠使用 mvn 命令編譯 (#13889)
- ARROW-17420 - [C++][FlightRPC] 修復 Flight SQL 整合測試中的架構驗證 (#13897)
- ARROW-17427 - [Java] 新增產生 DLL 的 Windows 建置腳本 (#14203)
- ARROW-17430 - [Java] ListBinder 將 Arrow List 類型繫結到 DB 欄位 (#13906)
- ARROW-17431 - [Java] MapBinder 將 Arrow Map 類型繫結到 DB 欄位 (#13941)
- ARROW-17434 - [Java][CI] 為 Java 新增建置 Windows 支援 (#13918)
- ARROW-17435 - [CI][Python][CUDA] 為 CUDA 互通性測試安裝 Numba (#13899)
- ARROW-17436 - [C++] 對於 RELEASE 建置使用 -O2 而不是 -O3 (#13661)
- ARROW-17439 - [R] 變更 pull 的行為以進行 compute 而不是 collect (#14330)
- ARROW-17449 - [Python] 更好的 Buffer、MemoryPool、NativeFile 和 Codec 的 repr (#13921)
- ARROW-17451 - [CI][Java] 為 JNI 使用 manylinux2014 映像檔 (#13920)
- ARROW-17455 - [Go] 函數和 Kernel 執行架構 (#13964)
- ARROW-17456 - [Go] 將 compute 模組標記為單獨的子模組 (#13910)
- ARROW-17460 - [R] 如果我註冊的新 UDF 與現有的 UDF 相同,則不要發出警告 (#14436)
- ARROW-17463 - [R] 避免不必要的投影 (#13954)
- ARROW-17470 - [CI][GLib] 新增更多系統套件以同步上游 PKGBUILD (#13917)
- ARROW-17475 - [Go] 函數介面和 Registry impl (#13924)
- ARROW-17476 - [Release][Packaging] 使二進位上傳器可從 datafusion-c 重複使用 (#13923)
- ARROW-17479 - [Go] 新增 ArraySpan 和實用工具 (#13929)
- ARROW-17480 - [Java] 將 setNull() 新增至 FieldVector 介面 (#14244)
- ARROW-17482 - [Go] 移除 ValueDescr 類型 (#13930)
- ARROW-17483 - [Python] 在非舊版 ParquetDataset/read_table 中支援 Expression 篩選器 (#14011)
- ARROW-17485 - [R] 允許 TRUE/FALSE 作為
write_feather
(write_ipc_file
) 的壓縮選項 (#13935) - ARROW-17488 - [Python] 新增對 RelWithDebInfo 的支援
- ARROW-17489 - [R] Nightly 建置由於測試引用未發布的 stringr 函數而失敗 (#13937)
- ARROW-17492 - [C++] 大型 var-binary 類型的 Hashing32/64 支援 (#13940)
- ARROW-17499 - [Go] 將 MakeArrayOfNull 移至 array 套件 (#13944)
- ARROW-17500 - [Go] Kernel 和 KernelContext 介面 (#13946)
- ARROW-17510 - [CI][C++][Windows][MSVC] 使用 ccache (#13957)
- ARROW-17511 - [C++] 新增對 xsimd 9.0.0 的支援 (#13958)
- ARROW-17512 - [Doc] 更新 crossbow 文件以提高清晰度 (#13993)
- ARROW-17519 - [R] RTools35 工作失敗 (#14035)
- ARROW-17521 - [Python] 為 Substrait 消費者新增 NamedTableProvider 的 python 綁定 (#14024)
- ARROW-17523 - [C++] 新增對 substrait 函數 is_null、is_not_null 和 count 的支援 (#13969)
- ARROW-17525 - [Java] 使用 NativeDatasetFactory 讀取 ORC 檔案 (#13973)
- ARROW-17527 - [Go] 實作轉換為布林值函數 (#13974)
- ARROW-17532 - [Go][Compute] 實作 Numeric Cast 函數 (#13992)
- ARROW-17536 - [Packaging][RPM][Gandiva] 修復 CentOS Stream 9 上的建置錯誤 (#13984)
- ARROW-17545 - [C++][CI] 強制使用 C++17 而不是 C++11 (#13991)
- ARROW-17546 - [C++] 移除 pre-C++17 相容性措施
- ARROW-17551 - [Go] 實作 Temporal Cast 函數 (#14006)
- ARROW-17553 - [Go] 啟用 flight.Server 以註冊額外的 grpc 服務 (#13995)
- ARROW-17554 - [Python][Packaging] 停止產生 macOS Mavericks wheels (#13996)
- ARROW-17555 - [Dev][CI] “ci/scripts/install_osx_sdk.sh” 未使用
- ARROW-17560 - [Java][Gandiva] 將 JNI 建置設定從 cpp/ 移至 java/ (#14159)
- ARROW-17561 - [Java][ORC] 將 JNI 建置設定從 cpp/ 移至 java/ (#14162)
- ARROW-17569 - [C++] 將 xsimd 版本升級到 9.0.1 (#14005)
- ARROW-17575 - [Docs][C++] 更新建置文件以遵循新的 CMake 套件 (#14097)
- ARROW-17585 - [Java] 更新 GenerateSampleData.java (#14289)
- ARROW-17586 - [Go] 字串到數值轉換函數 (#14015)
- ARROW-17587 - [Go] 從擴充類型轉換 (#14016)
- ARROW-17588 - [Go] 轉換為 binary-like 類型 (#14027)
- ARROW-17594 - [R][Packaging] 在 CentOS 7 上使用 devtoolset 8 建置二進位檔 (#14243)
- ARROW-17600 - [Go] 實作巢狀類型的轉換 (#14056)
- ARROW-17603 - [C++][FlightRPC] 當 REQUIRE_TLSCREDENTIALSOPTIONS 為 on 時,詳細說明失敗原因 (#14034)
- ARROW-17604 - [Docs][Java] 更明確地說明需要 –add-opens (#14066)
- ARROW-17617 - [Docs] 從 Flight 中移除實驗性限定詞 (#14055)
- ARROW-17621 - [CI] 稽核工作流程 (#14155)
- ARROW-17628 - [CI][Packaging][Java] 使用 SNAPSHOT 版本發布最新的 nightly 版本 (#14135)
- ARROW-17629 - [Java] 在 JdbcToArrowUtils 中將 DB 欄位繫結到 Arrow Map 類型 (#14134)
- ARROW-17630 - [Java] 在 JdbcToArrowTypeConverter 中引入欄位索引作為 JdbcFieldInfo.column
- ARROW-17631 - [Java] 將表格/欄位註解傳播到 Arrow Schema 中 (#14081)
- ARROW-17632 - [Python][C++] 新增關於建置期間 libarrow 在何處找到的詳細資訊 (#14059)
- ARROW-17638 - [Go] 擴充 C Data API 對 Union 陣列和 RecordReader 介面的支援 (#14057)
- ARROW-17646 - [Go][CI] 將 C Data 切換為使用 cgo.Handle(升級到 Go1.17)(#14067)
- ARROW-17647 - [C++] 將 protobuf 與 Substrait 一起使用時,使用更好的命名空間樣式 (#14121)
- ARROW-17649 - [Python] 從 <= 1.0.0 中移除剩餘的已棄用 API (#14401)
- ARROW-17659 - [Java] 當提供 config.shouldIncludeMetadata 時,填入 JDBC 架構名稱元數據 (#14196)
- ARROW-17665 - [R] 記錄 dplyr 和 compute 功能 (#14387)
- ARROW-17666 - [R] 記錄 dplyr 動詞支援的例外情況
- ARROW-17667 - [R] 記錄函數綁定支援的例外情況
- ARROW-17669 - [Go] 取得 Record batch、Tables 和 Chunked Arrays 的 Function kernels (#14214)
- ARROW-17670 - [Go] 為 Primitive 和 FixedSize 類型實作 Filter 函數 (#14088)
- ARROW-17671 - [Go] Binary/String 的過濾器核心 (#14098)
- ARROW-17673 - [R]
dplyr::arrange
中的desc
應允許dplyr::
前綴 (#14090) - ARROW-17674 - [R] 在 arrange() 內部實作 dplyr::across() (#14092)
- ARROW-17677 - [Go] 列表和擴展類型的過濾函數 (#14141)
- ARROW-17678 - [Go] Record Batches 和 Tables 的過濾器核心 (#14156)
- ARROW-17688 - [C++][Java][FlightRPC] Flight SQL 的 Substrait、交易、取消 (#13492)
- ARROW-17689 - [R] 在 group_by() 內部實作 dplyr::across() (#14122)
- ARROW-17690 - [R] 在 distinct() 內部實作 dplyr::across() (#14154)
- ARROW-17691 - [Go] 實作 Primitive Types 的 Take (#14101)
- ARROW-17693 - [C++] 移除 string_view backport (#14177)
- ARROW-17694 - [C++] 移除 std::optional backport (#14105)
- ARROW-17695 - [C++] 移除 Variant class (#14136)
- ARROW-17698 - [R] 實作在 `across()` 內部使用 `where()`
- ARROW-17701 - [C++][Gandiva] 新增對 untyped node 的支援 (#14110)
- ARROW-17704 - [Java][FlightRPC] 更新至 Junit 5 (#14103)
- ARROW-17716 - [Docs] 移除 IR 文件頁面 (#14112)
- ARROW-17724 - [R] 允許 dplyr::across 的 .fns 參數內使用套件名稱前綴 (#14279)
- ARROW-17730 - [Go] 實作 FSB 和 VarBinary 的 Take 核心 (#14127)
- ARROW-17734 - [Go] 實作 Lists 和 Dense Union 的 Take (#14130)
- ARROW-17736 - [C++] 為 Substrait producer 新增了 fallback 名稱解析機制。 (#14143)
- ARROW-17741 - [Packaging] 在 java-jars artifacts 中包含 JDBC driver (#14139)
- ARROW-17749 - [Go] 實作 Structs 的 Filter 和 Take (#14145)
- ARROW-17764 - [CI][C++] “#include
" 遺失 (#14161) - ARROW-17767 - [Java][ORC] 將 JNI 建置設定從 cpp/ 移動到 java/ (#14163)
- ARROW-17778 - [Go][CSV] 簡單 CSV Reader Schema 和類型推斷 (#14171)
- ARROW-17782 - [C++][R] R 套件在 macos 10.13 上使用 C++17 std lib 無法建置 (#14178)
- ARROW-17786 - [Java] 使用 org.apache.arrow.dataset.jni.NativeDatasetFactory 讀取 CSV 檔案 (#14182)
- ARROW-17788 - [R][Doc] 新增使用 Scanner 的範例 (#14184)
- ARROW-17789 - [Java][Docs] 使用最新變更更新 Java Dataset 文件 (#14382)
- ARROW-17792 - [C++] 使用 lambda capture move construction (#14188)
- ARROW-17794 - [Java] 強制在 JVM 退出時刪除 jni lib 檔案 (#14189)
- ARROW-17803 - [C++][nodiscard] (#14193)
- ARROW-17804 - [Go][CSV] 新增 Date32 和 Time32 parser (#14192)
- ARROW-17810 - [Java] 使用 jacoco-maven-plugin 0.8.8 支援 Java 18 (#14197)
- ARROW-17811 - [Java][Doc] 為 Java 中的字典編碼新增高階文件 (#14213)
- ARROW-17814 - [C++] 修復樣式 (#14218)
- ARROW-17814 - [C++] 移除 make_unique reimplementation (#14204)
- ARROW-17815 - [Python] 當 SetSignalStopSource 失敗時發出警告,而不是錯誤 (#14205)
- ARROW-17817 - [C++] 如果啟用了 ORC,則讓 ORC 在 MSVC 上編譯 (#14208)
- ARROW-17823 - [C++] 還原 CUDA 的 std::make_shared 變更 (#14233)
- ARROW-17823 - [C++] 偏好使用 std::make_shared/std::make_unique 而不是使用 new 的建構函式 (#14216)
- ARROW-17824 - [C++][Gandiva] 為可變長度輸出緩衝區實作預先分配 (#14230)
- ARROW-17826 - [Python] 允許在使用計算核心建立表達式時使用 scalars (#14360)
- ARROW-17834 - [Python] 允許透過 pa.array(..) 建構函式建立 ExtensionArray (#14253)
- ARROW-17840 - [Java] 停用不穩定的 JaCoCo 覆蓋率檢查 (#14231)
- ARROW-17844 - [C++] 移除 atomic shared_ptr 相容性函數 (#14239)
- ARROW-17845 - [CI][Conan] 在 Conan CI 檢查中重新啟用 Flight (#14240)
- ARROW-17846 - [C++] 在 CSV 子系統中使用
if constexpr
(#14241) - ARROW-17847 - [C++] 支援 JSON parser 中未加引號的 decimal (#14242)
- ARROW-17849 - [R][Docs] 記錄由於 C++17 對 centos-7 使用者的變更 (#14440)
- ARROW-17854 - [CI][Developer] 在 S3 上託管預覽文件 (#14247)
- ARROW-17856 - [CI][Archery] 新增 Archery 命令以刪除 crossbow repo 上的舊分支和標籤 (#14248)
- ARROW-17857 - [C++] 修復 Table::CombineChunksToBatch 中的 segmentation fault (#14249)
- ARROW-17860 - [Plasma] 棄用 Plasma
- ARROW-17861 - [C++] 棄用 Plasma (#14305)
- ARROW-17862 - [Plasma][GLib] 棄用 Plasma C GLib bindings (#14259)
- ARROW-17863 - [Python] 棄用 Plasma Python bindings (#14343)
- ARROW-17864 - [Plasma][Ruby] 棄用 Plasma Ruby bindings (#14258)
- ARROW-17865 - [Java] 棄用 Java Plasma JNI bindings (#14262)
- ARROW-17868 - [C++][Python] 還原 ARROW_PYTHON CMake 選項 (#14273)
- ARROW-17872 - [C++][CI] 減少 macOS CI 依賴性 (#14310)
- ARROW-17875 - [C++] 移除各種 pre-C++17 相容性措施 (#14263)
- ARROW-17878 - [Website] 從刪除中排除 Ballista 文件
- ARROW-17880 - [Go] 為 CSV writer 新增 Decimal128 和 Decimal256 的支援 (#14278)
- ARROW-17882 - [Java][Doc] 為 Windows 使用者新增建置步驟以產生 JNI DLL (#14379)
- ARROW-17883 - [Java] 實作 immutable table (#14316)
- ARROW-17888 - [Docs] 將 cookbook contrib 頁面的參考新增至 New Contributor’s Guide (#14283)
- ARROW-17889 - [CI] 移除 Kartothek 整合測試 (#14274)
- ARROW-17891 - [Docs][Python] 更新並同步 developers/python 頁面的 Win 區段 (#14350)
- ARROW-17903 - [JS] 更新依賴性 (#14285)
- ARROW-17911 - [R] 在
transmute()
內實作across()
(#14290) - ARROW-17924 - [Doc][Format] 釐清 C Data Interface 中的 immutability 假設 (#14304)
- ARROW-17929 - [C#] 改善 NuGet 套件。 (#14312)
- ARROW-17934 - [R] 對於 dataset 測試,使用 tempfile 而不是工作目錄 (#14315)
- ARROW-17936 - [R] ExecPlanReader 測試中止並崩潰
- ARROW-17939 - [Docs][Python] 在 PyArrow C++ 測試變更後更新 python dev 頁面 (#14322)
- ARROW-17940 - [Java][Gandiva] 為 JavaBuffer 實作 Reserve (#14323)
- ARROW-17942 - [Website] 某些連結可以從 http 變更為 https
- ARROW-17944 - [Python] substrait.run_query 接受 bytes/Buffer 而不會 segfault (#14331)
- ARROW-17945 - [Website][Release] 為 search.maven.org 使用 https:// (#14329)
- ARROW-17950 - [Docs][Python] 新增有關 PyArrow C++ API 變更的更多資訊 (#14333)
- ARROW-17952 - [Archery][CI] 修復執行 ubuntu-cuda-cpp 時的 archery 錯誤 (#14335)
- ARROW-17954 - [R] 更新 10.0 的新聞 (#14337)
- ARROW-17955 - [Docs][Java] Table 的教學文件 (#14344)
- ARROW-17962 - [Java] 從 try with resources 中移除未使用的 schema 建立 (#14346)
- ARROW-17965 - [C++] ChunkedArray 值的 ExecBatch 支援 (#14348)
- ARROW-17969 - [CI][C++] 請勿在 Ubuntu 18.04 上使用 LLVM 14 或更高版本 (#14356)
- ARROW-17971 - [Format][Docs] 新增 ADBC (#14079)
- ARROW-17972 - [CI] 更新 CUDA docker jobs
- ARROW-17976 - [C++] 在 arrow/compare.cc 中使用 generic lambdas (#14363)
- ARROW-17982 - [C++][Java] 將 ORC 更新至 1.8.0 (#14367)
- ARROW-17988 - [C++] 移除 index_sequence_for 和 aligned_union backports (#14372)
- ARROW-17992 - [CI][C++][Conda] 移除不必要的 clangdev/llvmdev pinnings (#14376)
- ARROW-17993 - [CI][Release] 為 verify-rc-source--conda- 使用 Node.js 16 LTS (#14377)
- ARROW-17997 - [Ruby] 新增從 raw nested Ruby array 建置 Arrow::Tensor 的支援 (#14381)
- ARROW-18010 - [Go] 為 Casting 新增 ARM64 Neon impl (#14388)
- ARROW-18017 - [Go] 簡化 Compute 模組依賴性和發布 (#14391)
- ARROW-18019 - [C++][Gandiva] 改善 Projector 評估效能 (#14394)
- ARROW-18026 - [C++][Gandiva] 為 unsigned ints 新增 div 和 mod 函數 (#14397)
- ARROW-18027 - [Dev][Archery][Crossbow] 重複使用 GitHub Token (#14398)
- ARROW-18028 - [Dev][Archery][Crossbow] 始終在 PR 註解中使用 GitHub Action 的 run page URL (#14399)
- ARROW-18030 - [C++] 升級 LZ4 版本 (#14405)
- ARROW-18044 - [Java] 將 error-prone library 版本升級到 2.16 (#14423)
- ARROW-18047 - [Dev][Archery][Crossbow] Queue.put() 應使用 Job.queue setter (#14410)
- ARROW-18048 - [Dev][Archery][Crossbow] 註解機器人在產生報告之前等待一段時間 (#14412)
- ARROW-18053 - [Dev] 修復 merge_arrow_pr.py 無法偵測 Co-authored-by: 的錯誤 (#14416)
- ARROW-18056 - [Ruby] 新增從 {name: Arrow::Tensor} 建置 Arrow::Table 的支援 (#14417)
- ARROW-18057 - [R] slice 函數的測試在沒有 Datasets 功能的建置上失敗 (#14418)
- ARROW-18058 - [Dev][Archery] 移除已移除的 ARROW_JNI 相關程式碼 (#14419)
- ARROW-18061 - [CI][R] 減少每次 commit 的 jobs 數量 (#14420)
- ARROW-18069 - [Docs] 建議最初使用 force 與 lease (#14430)
- ARROW-18072 - [C++] 無法將 bundled ORC 與 CMake 3.10 一起使用 (#14432)
- ARROW-17804 - [CI] PyArrow C++ 的 ctest 不再需要執行 (#14435)
- ARROW-18083 - [C++] 提升 vendored zlib 版本 (#14446)
- PARQUET-2172 - [C++] 將 field return type 變更為 const NodePtr& (#13865)
Bug Fixes
- ARROW-12175 - [C++] 修復 CMake packages (#13892)
- ARROW-13763 - [Python] 關閉 ParquetFile & ParquetDatasetPiece 中的檔案 (#13821)
- ARROW-14363 - [C++][Gandiva] LLVM 13 已棄用沒有明確元素類型的 CreateGEP 和 CreateLoad 方法
- ARROW-15602 - [R][Docs] 更新文件以說明如何讀取具有時區的 timestamp 欄位 (#13877)
- ARROW-15733 - array.String offsets int32 溢位
- ARROW-16141 - [R] 為上游變更更新 rhub/fedora-clang-devel (#12824)
- ARROW-16174 - [Python] 修復 sliced input 上的 FixedSizeListArray.flatten() (#14000)
- ARROW-16521 - [C++][Python] 為 S3 設定 curl timeout policy (#13385)
- ARROW-16651 - [Python] 將 Table 轉換為新 schema 時忽略欄位的 nullability (#14048)
- ARROW-16652 - [Python] 使用 Table 呼叫 Cast 計算核心時發生 segfault (#14044)
- ARROW-16674 - [Java] C data interface:從 imported buffer 讀取為 nioBuffer 時導致錯誤 (#13249)
- ARROW-16754 - [Java] StructVector 的子向量在新增重複欄位後意外重新排序 (#13321)
- ARROW-16838 - [Python] 改善具有 extension dtypes 的 pandas indexes 的 schema 推斷 (#14080)
- ARROW-16897 - [R][C++] Arrow 物件上的 Full join 不正確
- ARROW-16942 - 在 MacOS 上建置 JNI Libraries 時發生錯誤:找不到 “xsimd” 提供的套件設定檔
- ARROW-16993 - [C++] 如果不需要 Boost components,則不要尋找它們 (#13846)
- ARROW-17057 - [Python] S3FileSystem 沒有 retry strategy 的參數 (#13633)
- ARROW-17069 - [Docs][Python] 描述 GCS public 和 private 的身份驗證 (#14392)
- ARROW-17084 - [R] 在 linting 之前安裝套件 (#13620)
- ARROW-17099 - [Python] pyarrow 建置不支援 RELWITHDEBINFO 建置類型 (#14324)
- ARROW-17104 - [CI][Python] 在 CI job AMD64 MacOS 10.15 Python 3 上無法匯入 Pyarrow
- ARROW-17166 - [R][CI] force_tests() 無法傳回 TRUE (#13680)
- ARROW-17169 - [Go][Parquet] 具有 Nullable List of Struct 的 bitmap writer 中的 Panic (#14183)
- ARROW-17193 - [C++] 新增尋找系統 Abseil 的支援 (#13731)
- ARROW-17199 - [Java][FlightRPC] 清理 Flight SQL example server (#13710)
- ARROW-17217 - [Docs][Python] 新增 pandas 作為必要依賴項 (#13714)
- ARROW-17223 - [C#] DecimalArray 錯誤地附加大於 Decimal.MaxValue / 2 且小於 Decimal.MinValue / 2 的值 (#13732)
- ARROW-17228 - [Python] 當傳遞具有 projected columns 的 scanner 時,dataset.write_data 應使用 Scanner.projected_schema (#13756)
- ARROW-17230 - [C++] 修復 DeserializePlan,新增其他選項驗證 (#13728)
- ARROW-17233 - [Packaging][Linux] 更新 artifact patterns (#13740)
- ARROW-17248 - [CI][Conan] 啟用 Zstandard (#13742)
- ARROW-17249 - [CI][Conan] 啟用 bzip2 (#13743)
- ARROW-17250 - [CI][Conan] 自動啟用 utf8proc (#13744)
- ARROW-17251 - [CI][Conan] 啟用 Flight (#13761)
- ARROW-17253 - [Python] 偵測 iterator exception 而不是崩潰 (#13764)
- ARROW-17254 - [C++][Go][Java][FlightRPC] 實作並測試 Flight SQL GetSchema (#13898)
- ARROW-17256 - [Python] 無法對空的 ChunkedArray 呼叫 combine_chunks (#13757)
- ARROW-17272 - [Dev] 在 integration tests 中傳遞 –add-opens (#13765)
- ARROW-17281 - [C++] 修復 Windows 上的快取大小報告 (#13813)
- ARROW-17296 - [Python] 更新 pyarrow.parquet.read_metadata doctest 中的序列化 metadata 大小 (#13790)
- ARROW-17315 - [Release][Docs] 透過 post version bump 更新 versions.json (#13805)
- ARROW-17338 - [Java] BaseVariableWidthVector 的最大請求記憶體應限制為 Integer.MAX_VALUE (#13815)
- ARROW-17341 - [C++] 修復 musl libc 上的 cpu_info.cc 建置錯誤 (#13819)
- ARROW-17350 - [C++] 為異步工作建立 scheduler (#13912)
- ARROW-17353 - [Release][R] 驗證 binaries 版本 (#14396)
- ARROW-17372 - [Go][Parquet] 修復 ppc64le 的失敗 (#13840)
- ARROW-17382 - [C++] 當 header 帶有引號時,open_dataset 不會忽略 csv 檔案中的 BOM (#13838)
- ARROW-17386 - [R] strptime 測試在不同平台上不夠穩健 (#13854)
- ARROW-17389 - [Python] 當 PYARROW_INSTALL_TESTS=0 時正確排除測試 (#13904)
- ARROW-17410 - [JS][Integration] 降級 integration 的 zlib (#13885)
- ARROW-17421 - [C++] Windows 上的 CUDA 建置失敗 (#13883)
- ARROW-17422 - [C++][CI] Linux 建置缺少依賴項 (#13886)
- ARROW-17423 - [CI][C++] 修復建置 CUDA docker images (#13896)
- ARROW-17426 - [C++] Substrait consumer 無法在舊版 Ubuntu 上編譯 (#13888)
- ARROW-17433 - [CI][C++] 在 AppVeyor 上使用 Visual Studio 2019 (#13903)
- ARROW-17438 - [R] 如果存在 UDF,glimpse() 會發生錯誤
- ARROW-17440 - [C++] 支援 RISC-V 架構 (#13902)
- ARROW-17448 - [R] 修復某些文件中的雲端儲存路徑 (#14070)
- ARROW-17450 - [C++][Parquet] 除了 bool array 外,新增 uint8 boolean decode 的支援 (#14359)
- ARROW-17450 - [C++][Parquet] 支援 boolean datatype 的 RLE decode (#14147)
- ARROW-17453 - [Go][C++][Parquet] 具有 Repetition Levels 的不一致資料 (#13982)
- ARROW-17467 - [Go] 當沒有 t… 時,Aligned Bitmap Ops 會搞亂最後一個 byte (#13915)
- ARROW-17478 - [C++][Java] 將 ORC 更新至 1.7.6 (#13926)
- ARROW-17494 - [C++] 修復 static builds 上的 substrait 測試連結 (#13939)
- ARROW-17496 - [Go] 修復 Nightly Build (#13943)
- ARROW-17501 - [Python][wheel] 使用舊版 AWS SDK C++ (#14157)
- ARROW-17507 - [Dev][CI][R] GHA “autotune” 無法運作 (#14060)
- ARROW-17517 - [C++] 在 public API 測試中測試 engine API (#13965)
- ARROW-17517 - [C++] 從 substrait API 移除內部 headers (#14131)
- ARROW-17518 - [CI][Doc][Python] 更新 glob 以從 git 偵測 arrow 開發版本 (#13966)
- ARROW-17524 - [C++] 讀取 ORC table 時包含的欄位的修正 (#13962)
- ARROW-17543 - [R] 修復 array 建立中 NULL type 0 長度向量的錯誤
- ARROW-17550 - [C++][CI][MinGW] 使用系統 Python 進行 GCS testbench (#14272)
- ARROW-17556 - [C++] Unbound scan projection expression 導致載入所有欄位 (#14264)
- ARROW-17559 - [R][C++] Regression:移除 schema binding 後效能大幅下降
- ARROW-17565 - [C++] 未提供向後相容的 ${PACKAGE}_shared CMake target (#14003)
- ARROW-17567 - [C++] 避免 gcc 7 和 c++17 的內部編譯器錯誤 (#14004)
- ARROW-17571 - [Benchmarks] PyArrow 的預設建置似乎是 debug (#14010)
- ARROW-17573 - [Go][Parquet] ByteArray statistics 可能導致記憶體洩漏 (#14013)
- ARROW-17577 - [C++][Python] 建置 PyArrow 時 CMake 找不到 Arrow/Arrow Python
- ARROW-17578 - [CI][R] 修復 Ubuntu 22.04 和 R 上 GCC 12 的建置 (#14022)
- ARROW-17579 - [Python] PYARROW_CXXFLAGS 被忽略? (#14074)
- ARROW-17583 - [C++][Python] 將 WrittenFile.size 的 datawidth 變更為 int64 以符合 C++ 程式碼 (#14032)
- ARROW-17598 - [C++] 如果 SIMD level 為 NEON,則跳過 memory_benchmark (#14036)
- ARROW-17611 - [Rust] 從 arrow-rs 儲存的 Boolean 欄位資料使用 V2 無法被 pyarrow 讀取
- ARROW-17612 - [Benchmarks] macos-arm 上失敗的 benchmarks
- ARROW-17614 - [CI][Python] 測試 test_write_dataset_max_rows_per_file 產生多個 nightly build failures (#14199)
- ARROW-17616 - [CI][Java] 解決 regex 以支援最新的 Arrow Java 版本 >= 10.0.0 (#14076)
- ARROW-17620 - [R] as_arrow_array() 忽略 StructArrays 的類型 (#14047)
- ARROW-17627 - [Go][Parquet] 將 schema metadata 轉發到檔案,無需 StoreSchema (#14087)
- ARROW-17639 - [R] infer_type() 對於第一個元素為 NULL 的 lists 失敗 (#14062)
- ARROW-17641 - [python] 修復 invalid_row_handler 的 ParseOptions deserialization (#14061)
- ARROW-17643 - [R] 最新的 duckdb 發行版本導致測試失敗 (#14149)
- ARROW-17645 - [CI] 重新開始建置 conda-integration (#14069)
- ARROW-17675 - [C++] 修改 FileSource::Equals 方法以處理 buffer_ 為 null 的情況 (#14085)
- ARROW-17681 - [CI][Packaging] 使用 glib 更新 brew dependency glib-utils (#14095)
- ARROW-17682 - [CI][C++] Nightly test-ubuntu-20.04-cpp-thread-sanitizer 在 AsyncTaskScheduler 附近失敗 arrow-utility-test
- ARROW-17684 - [CI][deb] 停用 arm64 的 Flight (#14300)
- ARROW-17686 - [C++] 為 AsofJoinBasicTest 新增自訂 ToPrint (#14172)
- ARROW-17687 - ScanningStress 測試在 CI 中不穩定 (#14314)
- ARROW-17696 - [C++] arrow-compute-asof-join-node-test 異常緩慢 (#14190)
- ARROW-17697 - [Python] 修復 types.pxi 中的 Cython 警告 (#14280)
- ARROW-17699 - [R] 如果將非 schema 傳遞到 open_dataset(),則新增更好的錯誤訊息 (#14108)
- ARROW-17702 - [R][CI] CentOS 7 上的測試失敗
- ARROW-17703 - [C++][Gandiva] 修復 Gandiva OpenSSL 依賴性 (#14109)
- ARROW-17717 - [R] CI 上的 Lintr 錯誤 (#14113)
- ARROW-17725 - [CI][Python] 修復在沒有 parquet 的 Arrow 建置情況下的測試收集 (#14119)
- ARROW-17728 - [C++][Gandiva] 接受 LLVM 15.0 (#14125)
- ARROW-17733 - [C++] 在 index buffer 中填寫 nulls 時考慮 index_width (#14129)
- ARROW-17737 - [R] 在轉換為 Table 之前的 Groups 在
collect()
之後不得還原 (#14175) - ARROW-17738 - [R] dplyr::compute 應從 grouped arrow_dplyr_query 轉換為 arrow Table (#14160)
- ARROW-17742 - [C++][Gandiva] 修復 CMake presets 中的 Gandiva utf8proc 依賴性 (#14140)
- ARROW-17753 - [Python][Docs] 記錄用於修復建置環境問題的清理 (#14260)
- ARROW-17770 - [C++][Gandiva] 修復 Gandiva projector Evaluate 的 const 正確性 (#14165)
- ARROW-17771 - [Docs][Python] 將 CONDA_DLL_SEARCH_MODIFICATION_ENABLE 的使用新增至文件 (#14302)
- ARROW-17773 - [CI][C++] 修復 Travis-CI Arm64 建置上的 sccache 錯誤 (#14201)
- ARROW-17785 - [Java] 抑制 JDBC driver 測試中 gRPC 的不穩定性 (#14210)
- ARROW-17787 - [Java] 修復 Javadoc 建置 (#14212)
- ARROW-17790 - [C++][Gandiva] 適應 LLVM opaque pointer (#14187)
- ARROW-17791 - [Python][CI] 某些 nightly jobs 因為 ACCESS_DENIED 存取 S3 bucket 而失敗
- ARROW-17795 - [C++][R] 新增遺失的 PKG_CONFIG_PATH 以使用系統 zstd (#14202)
- ARROW-17800 - [C++] 修復 jemalloc stats 測試中的失敗 (#14194)
- ARROW-17805 - [C++][CI] 為 MacOS 使用 Brew 安裝的 clang
- ARROW-17813 - [Python] Nested ExtensionArray 與 pandas/numpy 之間的轉換 (#14238)
- ARROW-17818 - [R] 跳過 duckdb 測試,直到問題解決 (#14209)
- ARROW-17822 - [C++][FlightRPC] 修復無效傳輸方案上的崩潰 (#14267)
- ARROW-17829 - [Python] 避免 pandas groupby 棄用警告 write_to_dataset (#14306)
- ARROW-17830 - [C++][Gandiva] 暫時在 AppVeyor 上固定 LLVM 版本 (#14228)
- ARROW-17831 - [Python][Docs] 在移動 pyarrow C++ 程式碼後,PyArrow 架構頁面已過時 (#14311)
- ARROW-17842 - [C++][CI] 為 MacOS verify-rc 使用 Brew 安裝的 clang (#14236)
- ARROW-17848 - [R] 跳過 lubridate::format_ISO8601 測試,直到下一個發行版本 (#14282)
- ARROW-17850 - [Java] 升級 netty + grpc + protobuf + jackson BOM 版本 (#14265)
- ARROW-17853 - [Python][CI] test_dataset.py::test_write_dataset_s3_put_only 中的 Timeout (#14257)
- ARROW-17853 - temporary revert fix for test_write_dataset_max_rows_per_file (#14246)
- ARROW-17885 - [R] 將 BLOB 資料以 raw 列表而不是 integers 列表的形式傳回 (#14277)
- ARROW-17915 - [C++] 使用 Substrait ProjectRel 時發生錯誤 (#14295)
- ARROW-17927 - [C++] 變更 SleepABitAsync 以使用 thread pool 以減少執行緒數量 (#14339)
- ARROW-17930 - [CI][C++] PrintValue<arrow::dataset::ScannerTestParams> 中的 Valgrind 失敗 (#14317)
- ARROW-17931 - [C++][CI] 關於 CI 上 dataset “new scanner” 的 Thread Sanitizer 失敗
- ARROW-17938 - [Python] 修復 python_test.cc 上的編譯錯誤 (#14321)
- ARROW-17973 - [C++] nullary 函數呼叫的 Expression::ToString 錯誤 (#14370)
- ARROW-17977 - [CI][C++] 請勿在 Debian i386 上使用 LLVM 14 或更高版本 (#14368)
- ARROW-17990 - [C++] 還原 -mbmi2 flag (#14375)
- ARROW-17995 - [C++] 修復未根據 explicit schema 重新縮放的 json decimals (#14380)
- ARROW-17999 - [C++] 使 Minio server 啟動更穩健 (#14383)
- ARROW-18004 - [C++] ExecBatch 轉換為 RecordBatch 可能會超出範圍 (#14386)
- ARROW-18018 - [C++] 由於使用 AllComplete 而非 AllFinished,單元測試中可能發生 segmentation fault (#14393)
- ARROW-18031 - [C++][Parquet] bool RLE decoder 中的 Undefined behavior (#14407)
- ARROW-18041 - [Python] wheel 測試中 Sustrait 相關的測試失敗 (#14408)
- ARROW-18055 - [C++] arrow-dataset-dataset-writer-test 仍然偶爾 timeout (#14428)
- ARROW-18062 - [R] 當安裝 R 套件時,R 3.5 和 3.6 的 CI jobs 中發生錯誤 (#14424)
- ARROW-18079 - [R] 提高 schema 建立的效率以防止效能下降 (#14447)
- ARROW-18088 - [Python][CI] 使用 pandas master/nightly 建置失敗,與 timedelta64 resolution 相關
- ARROW-18103 - [Packaging][deb][RPM] 修復 upload artifacts patterns (#14462)