Apache Arrow 9.0.0 (2022 年 8 月 3 日)
這是一個主要版本,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 114 位不同貢獻者的 529 個提交。
$ git shortlog -sn apache-arrow-8.0.0..apache-arrow-9.0.0
65 Sutou Kouhei
56 Raúl Cumplido
26 David Li
25 Jacob Wujciak-Jens
25 Neal Richardson
23 Will Jones
17 Alenka Frim
16 Dragoș Moldovan-Grünfeld
15 Antoine Pitrou
14 Weston Pace
14 Vibhatha Lakmal Abeykoon
12 Krisztián Szűcs
10 Rok Mihevc
9 Wes McKinney
9 Yibo Cai
8 david dali susanibar arce
7 Matt Topol
6 Alessandro Molina
6 rtpsw
6 Todd Farmer
6 Matthew Topol
5 Matt DePero
5 Joris Van den Bossche
5 Sasha Krassovsky
4 Jeroen van Straten
4 Hongze Zhang
4 Mark Wolfe
4 Ivan Chau
4 Nic Crane
4 Larry White
3 Vibhatha Abeykoon
3 Sanjiban Sengupta
3 SHIMA Tatsuya
3 Vinícius Roque
3 michalursa
3 eitsupi
3 Johnnathan
3 palak-9202
2 SG011
2 AlvinJ15
2 Anthony Louis
2 Dewey Dunnington
2 Jabari Booker
2 Johnnathan Almeida
2 Kazuaki Ishizaki
2 Muthunagappan Muthuraman
2 Paul Taylor
2 Phillip Cloud
2 Sahaj Gupta
2 William Hyun
2 Yaron Gvili
2 octalene
2 okadakk
1 Mathias Michael
1 Jürgen Walter
1 Jin Chengcheng
1 Maya Anderson
1 Min-Young Wu
1 okadak
1 Jacky Lee
1 JabariBooker
1 Nicola Crane
1 zhang chaoming
1 Alexandre de Siqueira
1 Phillip LeBlanc
1 Przemysław Kowolik
1 Rafael Telles
1 Ian Cook
1 Rishabh Rana
1 Robert Purdom
1 Hideaki Hayashi
1 Hamish Nicholson
1 Even Rouault
1 pschou
1 Sam Albers
1 Eric Erhardt
1 ElenaHenderson
1 Saul Pwanson
1 Sten Larsson
1 Edward Visel
1 Thomas Powell
1 Tobias Zagorni
1 Dominik Moritz
1 Dominic Barnes
1 Danielle Navarro
1 Christopher D. Higgins
1 Chris Casola
1 Austin Dickey
1 Ariana Villegas
1 William Ayd
1 William Butler
1 Alexandre Crayssac
1 WilliamWhispell
1 stczwd
1 Anja Kefala
1 Yuqi Gu
1 alexandreyc
1 alexdesiqueira
1 Andy Teucher
1 Amir Khosroshahi
1 emkornfield
1 karldw
1 lfygh
1 Alvin Chunga
1 nullptr
1 zagto
1 Kshiteej K
1 Li Jin
1 Liang-Chi Hsieh
1 Ling Jin
1 Konstantin Ilchenko
1 Martin Liu
1 Masato Kato
1 KBambrick1
Patch 提交者
以下 Apache 提交者合併了貢獻的 patch 到儲存庫。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-8.0.0..apache-arrow-9.0.0
126 Sutou Kouhei
75 Antoine Pitrou
67 David Li
40 Neal Richardson
34 Weston Pace
25 Matthew Topol
24 Krisztián Szűcs
19 Joris Van den Bossche
17 Nic Crane
17 Alessandro Molina
16 Yibo Cai
15 Pindikura Ravindra
9 Wes McKinney
7 Jonathan Keane
6 Dewey Dunnington
5 Alenka Frim
4 Matt Topol
4 Dominik Moritz
3 Rok
3 Eric Erhardt
1 Benjamin Kietzman
1 Ian Cook
1 Andrew Lamb
1 Micah Kornfield
變更日誌
Apache Arrow 9.0.0 (2022-08-03)
錯誤修正
- ARROW-11341 - [Python][Gandiva] 為 Gandiva builder 函數新增 NULL/None 檢查 (#9289)
- ARROW-12626 - [C++] 支援工具鏈 xsimd,更新工具鏈版本至 8.1.0 版 (#13244)
- ARROW-13129 - [C#] 修正 TableFromRecordBatches (#10562)
- ARROW-13612 - [Python] 允許為轉換 ExtensionScalar 為 python 物件指定自訂類型 (#13454)
- ARROW-14114 - [C++][Parquet] 修正 PME 檔案的多執行緒讀取
- ARROW-14518 - [Ruby][BigDecimal] ) (#13377)
- ARROW-14575 - [R] 允許帶有
pkg::
前綴的函數 (#13160) - ARROW-14613 - [R] [Docs] 將 R 套件新增至 C Stream 介面?
- ARROW-14790 - [GLib] 修正建立 GArrowDatum 時的記憶體洩漏 (#13228)
- ARROW-14889 - [C++] 如果未安裝 testbench,GCS 測試會掛起 (#13520)
- ARROW-14989 - [R] 更新 num_rows 方法以輸出 doubles 而非 integers,以防止整數溢位
- ARROW-15415 - [C++] 修正 MSVC + vcpkg Debug 建置 (#13108)
- ARROW-15938 - [C++][Compute] 修正 build side 上零批次的情況下 HashJoinBasicImpl 的問題 (#13686)
- ARROW-16002 - [Go] fileBlock.NewMessage 應使用 memory.Allocator (#13554)
- ARROW-16005 - [Java] 修正使用 ArrowVectorIterator 時的 ArrayConsumer (#12692)
- ARROW-16035 - [Java] 處理空的 JDBC ResultSet
- ARROW-16116 - [C++] 讀取 Parquet 時處理不可為 null 的欄位
- ARROW-16142 - [C++] Temporal floor/ceil/round 對於 date32 和 time32 輸入傳回不正確的結果 (#13539)
- ARROW-16272 - [Python] 修正 NativeFile.read1()
- ARROW-16302 - [C++] FilenamePartitioning 的分割欄位中的 Null 值
- ARROW-16309 - [CI] [Go] [Flight] 驗證發布任務由於以下原因而失敗:panic: rpc error: code = NotFound desc = Unknown descriptor
- ARROW-16317 - [CI][Dev] 不要在 crossbow submit action 分支上使用遞增 ID
- ARROW-16341 - [Python] 研究 C++ 與 PyArrow 的 CMake
- ARROW-16342 - [Python] PyArrow 建置設定變更的初稿
- ARROW-16343 - [Python] 精煉 PyArrow 建置設定變更的初稿
- ARROW-16344 - [Python] 完成 Pyarrow 建置設定變更
- ARROW-16345 - [Python] 由於將 Python C++ API 移至 PyArrow,因此變更 C++ 建置設定
- ARROW-16346 - [Python] 由於 Python 程式碼已移至 PyArrow,因此為外部套件新增遷移路徑
- ARROW-16371 - [JS] 修正迭代沒有批次的表格時的錯誤 (#13287)
- ARROW-16372 - [Python] 對於 Parquet 不必要的測試,使用 IPC 而非 Parquet
- ARROW-16413 - [Python] 某些資料集 API 會在使用 python 檔案系統時掛起
- ARROW-16420 - [Python] pq.write_to_dataset 總是忽略分割
- ARROW-16425 - [C++] 為純量陣列時間戳記比較新增計算核心測試
- ARROW-16427 - [Java] 提供明確的欄位類型映射
- ARROW-16434 - [R][CI] 目前將 devdocs 還原為 setup-r@v1
- ARROW-16436 - [C++][Python] 資料集不應忽略 CSV autogenerate_column_names
- ARROW-16441 - [Go][Flight][Java] 更新 flight 整合測試以在 DoPut 之後等待 io.EOF
- ARROW-16442 - [Python][Dataset] 修正 ORC 資料集的片段以使用 FileFragment 類別
- ARROW-16456 - [Go] 修正 StructBuilder 在存在額外欄位時的 RecordBuilder UnmarshalJSON
- ARROW-16458 - [CI][Python] 在 nightly 整合上執行 dask S3 測試
- ARROW-16461 - [C++] 修正零星的 Thread Sanitizer 失敗
- ARROW-16473 - [Go] 修正 serializedPageReader 中的記憶體洩漏
- ARROW-16474 - [C++][Packaging] 要求 Python 3.7 或更高版本
- ARROW-16478 - [C++] 精煉 cpu info 偵測
- ARROW-16489 - [R] 錯誤的編碼導致剖析錯誤
- ARROW-16490 - [C++][Windows] 不要強制使用捆綁的 GoogleTest
- ARROW-16494 - [C++] 新增遺失的 include,導致某些封裝任務失敗
- ARROW-16498 - [C++] 修正 arrow::compute::TaskScheduler 中的潛在死鎖
- ARROW-16502 - [Go] 在 StructBuilder 中取消 marshaling JSON 時接受遺失的可選欄位
- ARROW-16507 - [CI][C++] 將系統 gtest 與 mamba/conda 搭配使用
- ARROW-16525 - [C++] Tee 節點未正確標記節點已完成
- ARROW-16526 - [Python] 使用 PARQUET 建置但沒有 DATASET 時,test_partitioned_dataset 失敗
- ARROW-16531 - [Dev] 更新 pre-commit 以使用最新的 flake8 並移除不受支援的 cython linting
- ARROW-16534 - [Java] 更新 Gandiva protobuf 程式庫以在 M1 上啟用建置
- ARROW-16546 - [Parquet][C++][Python] 使 Thrift 限制可配置 (#13275)
- ARROW-16548 - [Python] 將 pytest.mark.parquet 新增至 tests/parquet 套件下的所有測試
- ARROW-16560 - [Website][Release] 修正 versions.json 更新階段
- ARROW-16563 - [Go][Parquet] 修正損壞的 parquet plain boolean 解碼器
- ARROW-16566 - [Java] 在使用時而非靜態地初始化 JNI 組件 (#13146)
- ARROW-16572 - [C++] 修正外部專案的 LZ4 建置
- ARROW-16574 - [C++] arrow-ipc-read-write-test 中的 TSAN 失敗 (#13245)
- ARROW-16578 - [R] 在寫入和從 parquet 檔案讀取後,tibble 欄位上的 unique() 和 is.na() 速度慢很多 (#13415)
- ARROW-16579 - [Go][CI] 修正 Flakey Struct 測試
- ARROW-16585 - [C++] 新增對絕對 CMAKE_INSTALL_*DIR 的支援
- ARROW-16592 - [C++][Python][FlightRPC] 在寫入失敗後完成 (#13191)
- ARROW-16597 - [Python][FlightRPC] 強制伺服器在直譯器結束時關閉
- ARROW-16604 - [C++] 從基準測試中移除不必要的 Boost 相依性 (#13192)
- ARROW-16606 - [FlightRPC][Python] 處理非小寫標頭名稱 (#13274)
- ARROW-16612 - [R] 修正從檔名推斷壓縮 (#13625)
- ARROW-16617 - [C++] 在 Windows 上新增對多位元組系統錯誤訊息的支援
- ARROW-16638 - [Go][Parquet] 修正跳過布林欄位中大量列的問題
- ARROW-16638 - [Go][Parquet] 修正布林欄位跳過
- ARROW-16643 - [C++] 修正 clang-14 的警告
- ARROW-16646 - [C++] 允許 Bloom 篩選器中的索引欄位為純量
- ARROW-16659 - [C++] 移除 VectorKernel 的模糊建構子
- ARROW-16669 - [Go][CI] pqarrow 的 ARM 測試失敗 (#13628)
- ARROW-16675 - [C++] 邊緣情況下 BufferedOutputStream 的錯誤 Tell() 結果 (#13250)
- ARROW-16678 - [R] 無法在 Ubuntu 22.04 上使用 “NOT_CRAN” = TRUE 安裝新的 Arrow 8.0.0
- ARROW-16685 - [Python] 保留 join 中欄位的順序 (#13281)
- ARROW-16692 - [C++] 合併產生器中的 StackOverflow 導致掃描中的分段錯誤 (#13691)
- ARROW-16694 - [Packaging][Python] 使用 Mamba 而非 conda 來為 windows 封裝任務建置 conda 環境 (#13351)
- ARROW-16699 - [C++][GANDIVA] 修正 Concat_WS 分配錯誤 (#13276)
- ARROW-16700 - [C++][R][Datasets] 分割欄位上的聚合 (#13518)
- ARROW-16720 - [R] 無法讀取依點開頭的欄位分割的資料集
- ARROW-16722 - [CI][C++] 修正 Minio 失敗,指定要使用的 Minio 版本 (#13299)
- ARROW-16723 - [CI] Github Actions 設定失敗
- ARROW-16725 - [C++] 修正發布模式中的編譯警告 (#13293)
- ARROW-16726 - [Python] 修正 Setuptools 關於將套件安裝為資料的警告 (#13309)
- ARROW-16738 - [C++][Gandiva] 修正大整數值的 TO_TIMESTAMP(INTEGER) 函數 (#13298)
- ARROW-16744 - [JavaScript] 修正 yarn perf 失敗 (#13305)
- ARROW-16749 - [Go] 修正 null 陣列的 pqarrow writer
- ARROW-16788 - [C++] 移除 gRPC 不支援的強化標誌 (#13346)
- ARROW-16794 - [CI][C++][MinGW] 使 CI 任務更穩定 (#13359)
- ARROW-16796 - [C++] 修正 ExecContext 引數的錯誤預設值 (#13355)
- ARROW-16801 - [CI][C++] 使用指定的 MinIO 而非 Homewbrew 中的 MinIO (#13362)
- ARROW-16803 - [R][CI] 修正 R mingw 建置的快取 (#13379)
- ARROW-16806 - [CI][Python] 提高要求的 setuptools 版本 (#13361)
- ARROW-16807 - [C++][R] count distinct 錯誤地合併狀態 (#13583)
- ARROW-16808 - [C++] count_distinct 錯誤地跨 row groups 聚合
- ARROW-16813 - [Go][Parquet] 修正 go parquet 字典編碼 writer 屬性
- ARROW-16825 - [Java] 重新命名包含關於 commit metadata 的檔案 git.properties (#13578)
- ARROW-16831 - [Go] 當字串陣列偏移量無效時,ipc.Reader 中發生 panic
- ARROW-16848 - [C++][Java] 將 ORC 更新至 1.7.5 (#13392)
- ARROW-16864 - [Python] 允許在使用 role_arn 時省略 S3 external_id 和 session_name (#13455)
- ARROW-16869 - [CI][C++][Homebrew] 使用 C++17 建置 Apache Arrow (#13407)
- ARROW-16872 - [C++] 修正 CSV 剖析器邊緣情況 (#13437)
- ARROW-16877 - [C++] 為 Registry 測試定義自訂印表機以修正 valgrind (#13438)
- ARROW-16881 - [Gandiva][C++] 修正 castINTERVALYEAR 實作 (#13421)
- ARROW-16892 - [Dev][Release] 修正 merge_arrow 腳本上的版本排序 (#13427)
- ARROW-16895 - [R] 修正 cmake 版本偵測 (#13429)
- ARROW-16898 - [Python] 修正使用非 str 索引名稱時的 pandas 轉換失敗 (#13402)
- ARROW-16899 - [R][CI] R nightly 建置使用舊的 libarrow (#13411)
- ARROW-16902 - [C++][FlightRPC] 修正 Flight SQL 中的 DLL 連結 (#13434)
- ARROW-16904 - [C++] 如果 Parquet 檔案有多個 row group,則 min/max 不具決定性 (#13509)
- ARROW-16908 - [Python][CI] 避免安裝測試 wheels 所需的錯誤 numpy 版本 (#13449)
- ARROW-16919 - [C++] Flight 整合測試在 linux amd64 上的 verify rc nightly 中失敗
- ARROW-16926 - [Go] 修正後續讀取覆蓋的 csv reader 錯誤 (#13451)
- ARROW-16932 - [C++] Rounding RoundTemporalOptions.calendar_based_origin 未正確偏移非 UTC 結果 (#13462)
- ARROW-16933 - [C++] 修正使用捆綁 zlib 的 google-cloud-cpp 建置 (#13466)
- ARROW-16936 - [C++] 更新 gRPC absl 靜態相依性 (#13486)
- ARROW-16939 - [R] 修正合併 ARROW-16407 後的 nightly 建置 (#13479)
- ARROW-16943 - [Java][Packaging] 修正產生過多 jar 的 nigthly 建置問題 (#13485)
- ARROW-16948 - [C++] 基準測試聚合在聚合更新後編譯失敗 (#13489)
- ARROW-16978 - [C#] 間歇性的 Archery 失敗 (#13573)
- ARROW-16983 - [Go][Parquet] 修正 DeltaByteArrayEncoder 的 EstimatedDataEncodedSize (#13522)
- ARROW-16989 - [C++] Substrait ProjectRel 被錯誤地解譯 (#13528)
- ARROW-16994 - [Docs][CI] 清理 docs 警告 (#13533)
- ARROW-16996 - [Java] 基於 BOM 配置配置 Netty/GRPC/Protobuf + 依 CVE 升級相依性 (#13544)
- ARROW-16998 - [Java] 升級 commons-codec 相依性 (#13540)
- ARROW-17013 - [CI][C++] 修正 Ubuntu CPP 22.04 的 arrow 建置 (#13547)
- ARROW-17014 - [CI] 在 Windows 上的 cython 測試中新增 ENABLE_EXTENDED_ALIGNED_STORAGE (#13549)
- ARROW-17018 - [C++][Python] Timedelta dtype metadata base unit 被 Table.to_pandas() 方法全域變更 (#13553)
- ARROW-17030 - [Python] 確保 dtype 變更測試在 s390x 上運作 (#13560)
- ARROW-17041 - [C++] 修正未初始化的 FixedSizeBinaryScalar 緩衝區值 (#13597)
- ARROW-17045 - [C++] 拒絕檔案路徑上的尾部斜線 (#13577)
- ARROW-17051 - [C++] 一致地連結 Flight/gRPC/Protobuf (#13599)
- ARROW-17059 - [C++] 修正表達式基準測試 (#13584)
- ARROW-17066 - [C++][Python][Substrait] 將 JSON 轉換為二進位時,應指定 “ignore_unknown_fields” (#13605)
- ARROW-17071 - [C++][Compute] 修正 hash join 節點中的差一錯誤 (#13616)
- ARROW-17075 - [C++] 強制 HDFS 中檔名上沒有尾部斜線 (#13615)
- ARROW-17087 - [C++] 掃描器測試中的競爭條件 (#13651)
- ARROW-17100 - [C++][Parquet] 修正 3.0.0 之前寫入的 ParquetV2 資料頁面的向後相容性,根據 ARROW-10353 (#13665)
- ARROW-17107 - [Java] 修正整合 JSON writer 中的可變寬度向量 (#13676)
- ARROW-17111 - [CI][Packaging] 封裝 almalinux 9 和 centos 9 因缺少 libre2 而安裝失敗
- ARROW-17112 - [Java] 修正 s390x 上 TestArrowReaderWriter.testFileFooterSizeOverflow 的失敗 (#13638)
- ARROW-17115 - [C++] 如果 HashJoin 遇到超過 32Ki 列的批次,則會失敗 (#13679)
- ARROW-17142 - [Python] 當傳遞 None 時,Parquet FileMetadata.equals() 方法會發生分段錯誤 (#13658)
- ARROW-17174 - [C++] FileSystemDataset FilenamePartitioning 錯誤 - fsspec 檔案系統
- ARROW-17191 - [C++][FlightRPC] 處理串連後內聯的 slices (#13696)
- ARROW-17197 - [R] floor_date/ceiling_date lubridate 比較測試在 macOS 上失敗 (#13705)
- ARROW-17206 - [R] 跳過測試以修正 snappy sanitizer 問題 (#13704)
- ARROW-17211 - [Java] 修正 gh 和 self-hosted runners 上的 java-jar nightly (#13712)
- ARROW-17227 - [C++] 擴展 hash-join 單元測試以涵蓋空批次和 length=0 批次 (#13725)
- ARROW-17234 - [Release][R] 將 r-binary-packages 新增至封裝群組 (#13734)
- ARROW-17237 - [Release] 還原 python_wheel_unix_test.sh 腳本中 python 測試相依性的安裝 (#13735)
- ARROW-17238 - [Release] 在 wheel 驗證期間關閉 GCS 測試 (#13736)
- ARROW-17246 - [Packaging][deb][RPM] 不要使用系統 jemalloc (#13739)
- PARQUET-2163 - 處理具有大型 fixed_len_byte_arrays 的 decimal schemas
新功能與改進
- ARROW-602 - [C++] 提供 Array 內部原始元素的迭代器存取
- ARROW-7286 - [Go] 確保 go 實作實施澄清的字典規範
- ARROW-8324 - [R] 新增與 _feather 分開的 read/write_ipc_file (#13626)
- ARROW-10359 - [R] 如果不符合系統需求,則不要下載 linux 二進位檔
- ARROW-12203 - [C++][Python] 將預設 Parquet 版本切換為 2.4 (#13280)
- ARROW-13052 - [Gandiva][C++] 新增 regexp_extract 函數
- ARROW-13160 - [CI][C++] 對於 vcpkg 建置使用二進位快取 (#13507)
- ARROW-13388 - [C++][Parquet] 修正文件以反映 DELTA_LENGTH_BYTE_ARRAY 的讀取支援 (#13530)
- ARROW-13388 - [C++][Parquet] 啟用 DELTA_LENGTH_BYTE_ARRAY 解碼器 (#13386)
- ARROW-13530 - [C++] 實作累積總和計算函數
- ARROW-13844 - [Docs][Release] 將發布管理指南新增至 Dev 文件 (#13272)
- ARROW-14163 - [C++] Join 的初步溢出實作
- ARROW-14182 - [C++][Compute] Hash Join 效能改進 v2 (#13493)
- ARROW-14185 - [C++] HashJoinNode 應驗證 HashJoinNodeOptions (#13051)
- ARROW-14458 - [R] 使用 expect_snapshot() 來改進測試
- ARROW-14471 - [R] 實作 lubridate 的個別日期/時間剖析器
- ARROW-14512 - [Java][Doc] 建置文件時的 JavaDoc 錯誤
- ARROW-14632 - [Python] 使 write_dataset 引數僅限關鍵字
- ARROW-14771 - [C++] 匯出 Protobuf 符號表 (#13387)
- ARROW-14819 - [R] lubridate::qday 的綁定 (#13440)
- ARROW-14820 - [R] 實作 lubridate 計算函數的綁定
- ARROW-14821 - [R] 實作 lubridate 的 floor_date、ceiling_date 和 round_date 的綁定 (#12154)
- ARROW-14821 - [C++] 新增 ceil_is_strictly_greater 和 calendar_based_origin 時間 round 選項 (以模擬 lubridate 的日期 rounding) (#12657)
- ARROW-14845 - [R] 實作 lubridate formatter 函數的綁定
- ARROW-14848 - [R] 實作 lubridate 的 parse_date_time 的綁定
- ARROW-14892 - [Python][C++] GCS 綁定 (#12763)
- ARROW-14945 - [R] 實作 lubridate 函數以進行日期數學運算
- ARROW-15016 - [R]
show_exec_plan
用於arrow_dplyr_query
(#13541) - ARROW-15130 - [Docs] 新增詞彙表 (#12868)
- ARROW-15174 - [Java] 整合 JNI 編譯
- ARROW-15176 - [Java] 檢查 Java Arrow 目前支援哪些 Java 版本
- ARROW-15177 - [Java] 檢查我們正在封裝哪些 Java 版本
- ARROW-15179 - [Java] 確保支援現代 Java 版本
- ARROW-15222 - [Ruby] 使用 Compute 進行 Column 上的 Enum 運算 (#12053)
- ARROW-15224 - [R] 為 not_between() 三元核心新增綁定
- ARROW-15271 - [R] 重構 do_exec_plan 以傳回 RecordBatchReader
- ARROW-15280 - [R] 公開 FileSystemFactoryOptions
- ARROW-15292 - [R] 預設為 Ubuntu/Redhat 上的二進位 libarrow
- ARROW-15293 - [R] [CI] 將 arrow-r-nightly 移至 apache/arrow / crossbow
- ARROW-15301 - [R] 討論:將 testthat 測試 helpers 移至 R/test-helpers.R
- ARROW-15365 - [Python] 在 pyarrow.compute.cast 函數中公開完整的 cast 選項 (#13109)
- ARROW-15422 - [Packaging][RPM][deb] 新增 GDB 外掛程式的支援 (#13477)
- ARROW-15430 - [Python] 處理檔案系統 (介面) 中的文件字串 (#13564)
- ARROW-15498 - [C++][Compute] 實作 hash join 之間的 Bloom 篩選器下推
- ARROW-15534 - [C++] 為 substrait consumer 新增便利函數以建立 plan 而非 declaration
- ARROW-15568 - [C++][Gandiva] 實作 Translate 函數 (#12333)
- ARROW-15583 - [C++] 如果 producer 使用大型 anchors,Substrait consumer 可能會使用大量 RAM
- ARROW-15587 - [C++] 新增對 substrait::ReadRel::LocalFiles::FileOrFiles 指定的所有選項的支援
- ARROW-15590 - [C++] 為 Substrait consumer 新增 join 的支援 (#13078)
- ARROW-15591 - [C++] 為 Substrait consumer 新增 aggregation 的支援 (#13130)
- ARROW-15622 - [R] 為 arrow_dplyr_query 實作 union_all 和 union
- ARROW-15639 - [C++][Python] UDF 純量函數實作
- ARROW-15661 - [Gandiva][C++] 新增 SHA512 函數 (#12404)
- ARROW-15671 - [GLib] 新增 Vala 的支援
- ARROW-15779 - [Python] 為 Substrait consumer 建立 python 綁定
- ARROW-15804 - [R] 在提供多個 tryFormats 時改進 as.Date() 錯誤訊息
- ARROW-15893 - [CI][Python] 將 python minimal 建置新增至 nightly 建置 (#13113)
- ARROW-15901 - [C++] 支援 Substrait 中的平面自訂輸出欄位名稱 (#13069)
- ARROW-15906 - [C++][Python][R] 預設情況下,不要建立或刪除 S3 buckets (#13206)
- ARROW-15936 - [Ruby] 為 Arrow::DictionaryArray#raw_records 新增測試
- ARROW-15937 - [Website] 在 8.0.0 發布後將 Flight SQL 子專案頁面導向至主要文件
- ARROW-15958 - [Java][Docs] 改進並記錄 StackTrace (#12656)
- ARROW-15959 - [Java][Docs] 使用 IntelliJ 改進 Java 開發體驗
- ARROW-16006 - [C++][Docs] 為動態 schemas 提供列轉換範例 (#12775)
- ARROW-16018 - [Doc][Python] 在 Python 文件字串範例上執行 doctests (–doctest-cython)
- ARROW-16018 - [Doc][Python] 在 Python 文件字串範例上執行 doctests (CI 任務)
- ARROW-16018 - [Doc][Python] 在 Python 文件字串範例上執行 doctests (–doctest-modules)
- ARROW-16083 - [C++] 實作 AsofJoin 執行節點 (#13028)
- ARROW-16085 - [C++][R] InMemoryDataset::ReplaceSchema 不會變更掃描輸出
- ARROW-16091 - [Python] 繼續改進類別和方法文件字串
- ARROW-16092 - [Python] 處理檔案系統 (實作) 中的文件字串 (#13416)
- ARROW-16093 - [Python] 處理檔案系統 (Python 實作) 中的文件字串 (#13595)
- ARROW-16094 - [Python] 處理檔案系統 (Utilities) 中的文件字串 (#13582)
- ARROW-16144 - [R] 寫入壓縮資料流 (特別是透過 S3)
- ARROW-16168 - [C++][CMake] 使用 target 新增 include 路徑
- ARROW-16183 - [C++][FlightRPC] 支援捆綁的 UCX
- ARROW-16206 - [Ruby] 新增對 DictionaryArray#values、#raw_records 與 {Month,DayTime,MonthDayNano} Interval Type 的支援 (#13255)
- ARROW-16228 - [CI][Packaging][Conan] 新增任務以測試最小建置
- ARROW-16234 - [C++] Rank 的向量核心 (#12963)
- ARROW-16241 - [Python] 在使用 use_legacy_dataset=True 時,抑制測試中的警告
- ARROW-16243 - [C++][Python] 移除 Parquet ReadSchemaField 方法 (#13060)
- ARROW-16253 - [R] 用於從 float 轉換為 duration (透過 int64()) 的 Helper 函數
- ARROW-16255 - [R] 重新組織 datetime 綁定
- ARROW-16267 - [Java] 新增支援以使用 JDK 18 編譯 Java 程式碼
- ARROW-16268 - [R] 移除長期棄用的函數 (#13550)
- ARROW-16276 - [R] Arrow 8.0 新聞
- ARROW-16281 - [R][CI] 使用 4.2 版本發布來 Bump 版本
- ARROW-16297 - [R] 改進離線建置的 ARROW_*_URL 變數的偵測
- ARROW-16323 - [Go] 實作 Dictionary Scalars (#13575)
- ARROW-16324 - [Go] 實作 Dictionary Unification (#13529)
- ARROW-16327 - [Java][CI] 將 Java 17 新增至 java 工作流程的 CI 矩陣
- ARROW-16328 - [Java] POC Arrow Modular
- ARROW-16329 - [Java][C++] 在透過 JNI marshalling 錯誤時保留更多上下文 (#13246)
- ARROW-16333 - [Release] 改進 Nightly 報告
- ARROW-16335 - [Release][C++] Windows 原始碼驗證在單一執行緒上執行 C++ 測試
- ARROW-16357 - [Archery][Dev] 新增將 nightly 報告傳送至 Zulip/Slack 的可能性
- ARROW-16358 - [CI][Dev] 允許 archery crossbow 為 nightly 建置產生 CSV 報告
- ARROW-16359 - [Dev][CI] 建立簡單的靜態網站,其中包含 nightly 建置的目前狀態
- ARROW-16360 - [Dev][CI] 在 nightly 儀表板上新增失敗任務的最後成功 commit / 日期
- ARROW-16361 - [Dev][Archery] 為 nightly 建置報告通知新增靜態頁面的連結 (#13450)
- ARROW-16378 - [Archery][CI] 新增透過 webhook 將 Zulip 通知報告傳送至 archery crossbow 報告的可能性
- ARROW-16380 - [C++] 研究在 Arrow-C++ 中預設 Memory Mapping 為 ON 的位置
- ARROW-16382 - [Python] 預設在 pyarrow 中停用 memory mapping (#13342)
- ARROW-16383 - [C++] 預設在 Arrow-C++ 中停用 memory mapping (#13419)
- ARROW-16394 - [R] 實作 lubridate 的具有年、月和日期組件的剖析器
- ARROW-16395 - [R] 實作 lubridate 的具有年、月、日、時、分和秒組件的剖析器 (#13627)
- ARROW-16400 - [R][CI] 將 arrow-r nightly/release 建置整合到 Crossbow 中
- ARROW-16401 - [R][CI] 將 arrow-r-nightly 工作流程分解為 Crossbow 任務
- ARROW-16402 - [R][CI] 建立新的 Archery 任務
- ARROW-16403 - [R][CI] 為 R nightly 建置建立 Crossbow 任務
- ARROW-16404 - [R][CI] 研究替代的二進制檔案託管方案
- ARROW-16405 - [R][CI] 使用 nightlies.apache.org 作為開發儲存庫 (#13241)
- ARROW-16406 - [文件][R] 使用新的 nightly 位置更新文件
- ARROW-16407 - [R] 擴展
parse_date_time
以涵蓋小時、日期和分鐘組件 (#13196) - ARROW-16414 - [R] 移除 ARROW_R_WITH_ARROW 和 arrow_available()
- ARROW-16415 - [R] 使用
tz
參數更新strptime
綁定簽名 (#13190) - ARROW-16418 - [R] 重構 difftime() 和 as.diffime() 綁定
- ARROW-16426 - [C++] 將 TeeNode 新增至執行引擎
- ARROW-16439 - [R] 實作
lubridate::fast_strptime
的綁定 - ARROW-16444 - [R] 在 R 綁定中實作使用者定義的純量函數 (#13397)
- ARROW-16445 - [R][文件] 為在 Linux 文章上安裝 Arrow 套件新增簡短摘要
- ARROW-16446 - [R] 更新 parse_date_time 以接受不含分隔符號的字串
- ARROW-16448 - [CI][Archery] 將 EmailReport 重構為 JinjaReport
- ARROW-16450 - [Go][文件] 在 csv 範例中包含錯誤處理
- ARROW-16455 - [CI][封裝] 將 linux-ppc64le 新增至 conda 上要清除的平台清單
- ARROW-16467 - [Python] 新增輔助函數 _exec_plan._filter_table 以根據表達式篩選表格
- ARROW-16468 - [Python] 使用複雜表達式測試表格篩選功能並新增 Expression.apply 方法
- ARROW-16469 - [Python] Table.filter 除了布林陣列外,也接受布林表達式
- ARROW-16470 - [文件][Python] 記錄透過表達式篩選表格和資料集 (#13319)
- ARROW-16477 - [封裝][deb] 使用 -Dvapi 而非 -Dvala (#13499)
- ARROW-16477 - [封裝][RPM] 為 aarch64 上的 Amazon Linux 2 新增支援 (#13473)
- ARROW-16484 - [Go][Parquet] 更新 parquet writer 版本
- ARROW-16486 - [Go] 使用 Arm64 GoLang Assembly 實作 bit_packing 函數
- ARROW-16487 - [C++][Parquet] 修復具有 minmax 的 parquet::Statistics::Equals()
- ARROW-16488 - [Archery][開發] 允許在聊天報告上傳送額外訊息
- ARROW-16497 - [R] 更新 NEWS.md 中的版本
- ARROW-16499 - [發佈][Ruby] 新增遺失的匯出
- ARROW-16500 - [發佈][R] 請勿將 GNU sed 擴充功能用於 r/NEWS.md 更新
- ARROW-16501 - [文件][C++][R] 從 Google Analytics 遷移至 Matomo
- ARROW-16504 - [Go][CSV] 為讀取器新增 arrow.TimestampType 支援
- ARROW-16508 - [Archery][開發] 根據任務的成功或失敗,新增擴充聊天報告訊息的可能性
- ARROW-16509 - [R][文件] 更正資料集小品文
- ARROW-16510 - [R] 為 GCS 檔案系統新增綁定 (#13404)
- ARROW-16511 - [R] 在 write_dataset() 中保留綱要中繼資料
- ARROW-16514 - [網站] 更新 8.0.0 的安裝頁面
- ARROW-16515 - [C++] 為 RecordBatchReader 新增 Close 方法 (#13205)
- ARROW-16516 - [R] 實作 ym() my() 和 yq() 剖析器
- ARROW-16523 - [C++] ExecPlan 清理的第 1 部分:集中式任務群組 (#13143)
- ARROW-16527 - [Gandiva][C++] 新增二元函數
- ARROW-16529 - [Java] 修復 ArrowVectorIterator.hasNext()
- ARROW-16530 - [Go] 在始終為序列的關鍵位置新增並行性,無論 parallel=true 與否
- ARROW-16537 - [Java] 修補 JSE11+ 的資料集模組測試失敗
- ARROW-16538 - [Java] 為模擬 ResultSets 新增彈性
- ARROW-16539 - [C++] 將捆綁的 thrift 升級至 0.16.0
- ARROW-16541 - [R][CI] 減少 lintr 執行的次數
- ARROW-16549 - [C++] 簡化 AggregateNodeOptions aggregates/targets (#13150)
- ARROW-16551 - [Go] 改善時間類型
- ARROW-16552 - [Go] 改善 decimal128 公用程式
- ARROW-16553 - [CI][Java] 將 Java nightly 套件 (.pom/.jar) 新增至 nightlies.apache 儲存庫 (#13328)
- ARROW-16554 - [Java] 從 https://nightlies.apache.org/arrow/java/org/apache/arrow/ 下載 Java nightlies 成品 (#13352)
- ARROW-16555 - [Go][Parquet] 將 BitBlockCounter 和 VisitBitBlocks 提升至共用內部公用程式
- ARROW-16556 - [Go] 將 Layout 方法新增至 DataTypes (#13136)
- ARROW-16557 - [Go] 啟用 Slicing memory.Buffer 物件
- ARROW-16561 - [Go][Parquet] 測試 parquet 根節點組態
- ARROW-16561 - [Go][Parquet] 新增自訂 parquet 根節點的選項
- ARROW-16567 - [文件][Python] Sphinx Copybutton 應忽略 IPython 提示文字 (#13329)
- ARROW-16568 - [Java] 啟用使用 ArrowBuf 的 setBytes 和 getBytes 跳過 BOUNDS_CHECKING
- ARROW-16569 - [CI] 將 checkout 動作更新至較新版本
- ARROW-16570 - [R] 讓 pkg-config 命令找到所有程式庫
- ARROW-16571 - [Java] 更新 .gitignore 以排除 JNI 相關的二進制檔案
- ARROW-16573 - [C++][格式] 為 C 資料介面新增標準包含保護
- ARROW-16581 - [C++][Java] 將 ORC 升級至 1.7.4
- ARROW-16582 - [Python][文件] 更新 Python 建置文件以包含資料集
- ARROW-16588 - [C++][FlightRPC] 請勿在測試輔助程式中子類別化 GTest
- ARROW-16590 - [C++] 合併處理以列為主儲存的檔案 (#13218)
- ARROW-16594 - [R] 一致地使用 “getOption” 設定 nightly 儲存庫
- ARROW-16599 - [C++] 實作 ExecuteScalarExpressionOverhead 基準測試,不含 arrow 以進行比較 (#13179)
- ARROW-16600 - [Java] 可組態的 RoundingMode 以處理 BigDecimal 中不一致的比例 (#13433)
- ARROW-16601 - [C++][FlightRPC] 請勿對 arrow_flight_testing 強制執行與靜態 GoogleTest 的靜態連結 (#13180)
- ARROW-16602 - [開發] 使用 GitHub API 合併提取請求 (#13184)
- ARROW-16607 - [R] 改善 KeyValueMetadata 處理
- ARROW-16609 - [C++] 建置 C++ 時,xxhash 未安裝至 dist/lib/include 中 (#13282)
- ARROW-16610 - [Python] 針對 pq.write_to_dataset 中衝突的選項引發錯誤 (#13317)
- ARROW-16613 - [C++][Parquet] 修復重複呼叫 AppendRowGroups() 的效能
- ARROW-16614 - [C++] 將 lz4::lz4 用於 lz4 的 CMake 目標名稱 (#13193)
- ARROW-16623 - [GLib] 新增 GArrowQuantileOptions (#13374)
- ARROW-16626 - [C++] 命名 C++ 串流執行引擎
- ARROW-16634 - [Gandiva][C++] 新增 udfdegrees 別名
- ARROW-16636 - [Rust] 啟用 rust 的數個 IPC 整合測試 (#13219)
- ARROW-16647 - [C++] 為具有間隔類型的 unique()、value_counts()、dictionary_encode() 新增支援
- ARROW-16648 - [GLib] 新增 MemoryPool 包裝函式 (#13224)
- ARROW-16653 - [R] lubridate
parse_date_time
綁定支援所有格式 (#13506) - ARROW-16654 - [開發][Archery] 支援主要版本的 cherry-picking
- ARROW-16655 - [發佈] 發佈改善
- ARROW-16656 - [CI][發佈] 允許 archery 支援 MINOR 票證,並更新發佈註解以包含 MINOR
- ARROW-16657 - [C++] 支援擴充功能 ID 登錄檔的巢狀結構 (#13232)
- ARROW-16660 - [C#] 為 Time32Array 和 Time64Array 新增支援 (#13279)
- ARROW-16663 - [發佈][開發] 為 archery 發佈策展新增旗標,僅顯示最少資訊 (#13284)
- ARROW-16664 - [CI][發佈] 自動建立驗證發佈提取請求 (#13511)
- ARROW-16665 - [發佈] 更新二進制檔案提交以追蹤自動建立的 PR 上的二進制檔案提交任務 (#13612)
- ARROW-16666 - [文件][發佈] 更新發佈指南以指定新的工作流程和功能凍結 (#13308)
- ARROW-16667 - [CI][發佈] 合併後指令碼應為非必要 (#13593)
- ARROW-16668 - [CI] 為 python wheels 新增 Substrait 支援 (#13239)
- ARROW-16672 - [Java] 允許 Java C 資料介面中重複的欄位名稱 (#13247)
- ARROW-16676 - [C++] ReservationListenableMemoryPool::Impl::bytes_allocated() 應傳回其自己的位元組數,而不是基礎集區的位元組數
- ARROW-16677 - [C++] 支援函數登錄檔的巢狀結構 (#13252)
- ARROW-16679 - [R] 如果 CDPATH 不是 null,configure 會失敗 (#13313)
- ARROW-16681 - [Python] 修復 PyArrow 單元測試的 doc,其取決於模組路徑 (#13318)
- ARROW-16683 - [C++] 為捆綁的 gflags 目標新增遺失的相依性
- ARROW-16684 - [CI][Archery] 為 GitError 失敗新增重試機制至 git fetch
- ARROW-16686 - [C++] 將 shared_ptr 與 FunctionOptions 搭配使用 (#13344)
- ARROW-16689 - [CI] 改善 R Nightly 工作流程 (#13266)
- ARROW-16693 - [JS] 升級至 TS 4.7
- ARROW-16703 - [R] 重構 map_batches(),使其可以串流結果 (#13650)
- ARROW-16704 - [JS] 處理
tableFromIPC
輸入為非同步RecordBatchReader
的情況 (#13278) - ARROW-16706 - [Python] 公開 RankOptions (#13327)
- ARROW-17008 - [開發] 將基本驗證取代為 JIRA 的權杖驗證 (#13283)
- ARROW-16709 - [文件][Python] 將如何執行 doctest 新增至開發人員指南 (#13325)
- ARROW-16711 - [C++] 移除已棄用的 ORC API (#13286)
- ARROW-16713 - [C++] 將聯結累積提取至 HashJoinImpl 外部 (#13332)
- ARROW-16714 - [C++] 移除已棄用的 IPC API (#13288)
- ARROW-16715 - [R] 提高預設 parquet 版本 (#13555)
- ARROW-16716 - [C++] 為 ProjectNode 新增基準測試 (#13314)
- ARROW-16717 - [C++] 為系統 jemalloc 新增支援 (#13373)
- ARROW-16721 - [C++] 放棄對捆綁的 Thrift < 0.13 的支援 (#13292)
- ARROW-16729 - [C++] 提高 Abseil/gRPC 相依性版本 (#13315)
- ARROW-16730 - [C++] 提高供應商提供的 jemalloc 版本 (#13294)
- ARROW-16731 - [C++] 提高供應商提供的 mimalloc 版本 (#13295)
- ARROW-16732 - [C++] 提高供應商提供的 nlohmann_json 版本 (#13571)
- ARROW-16733 - [C++] 提高供應商提供的 opentelemetry-cpp 和 opentelemetry-proto 版本 (#13580)
- ARROW-16734 - [C++] 提高供應商提供的 protobuf 版本 (#13581)
- ARROW-16735 - [C++] 提高供應商提供的 rapidjson 版本 (#13608)
- ARROW-16736 - [C++] 提高供應商提供的 RE2 版本 (#13570)
- ARROW-16737 - [C++] 提高供應商提供的 zstd 版本 (#13611)
- ARROW-16741 - [C++] 為二元時間運算新增基準測試 (#13302)
- ARROW-16742 - [C++][文件] 修復文件中 hash_distinct 的輸出類型 (#13303)
- ARROW-16745 - [封裝][RPM] 為 AlmaLinux 9 新增支援 (#13307)
- ARROW-16747 - [CI][發佈][Python] 放棄對 manylinux 2010 的支援 (#13566)
- ARROW-16751 - [C++] 修復 cmake3.5 上的 ucx 目標錯誤 (#13389)
- ARROW-16752 - [R] 重新設計 Linux 二進制檔案安裝 (#13464)
- ARROW-16756 - [C++] 引入非擁有 ArraySpan、ExecSpan 資料結構,並重構 ScalarKernels 以使用它們 (#13364)
- ARROW-16757 - [C++][後續] 透過移除 alignas 的用法來修復 mingw32 RTools 4.0 建置 (#13557)
- ARROW-16757 - [C++] 移除 ScalarKernel 實作的 “scalar” 輸出模態,移除 ValueDescr 類別 (#13521)
- ARROW-16759 - [Go] 更新 testify 以取得 gopkg.in/yaml.v3 (v7) 的安全性修補程式
- ARROW-16760 - [文件] 在 Python 開發文件中提及 PYARROW_PARALLEL (#13324)
- ARROW-16761 - [C++][Python] 追蹤資料集中寫入的位元組 (#13338)
- ARROW-16763 - [封裝][RPM] 為 CentOS Stream 9 新增支援 (#13474)
- ARROW-16764 - [封裝][deb] 放棄對 Debian GNU/Linux buster 的支援 (#13470)
- ARROW-16765 - [封裝][RPM] 修復 arrow-libs 和 arrow8-libs 的衝突 (#13472)
- ARROW-16767 - [Archery] 將 archery.release 子模組重構為其自己的子套件 (#13326)
- ARROW-16769 - [C++] 將 Warn() 函數新增至 Status (#13383)
- ARROW-16776 - [R] arrow 表格和資料集的 dplyr::glimpse 方法 (#13563)
- ARROW-16779 - [CI][Python] 要求在 arm64 MacOS 版本的 wheel 中運送 Pyarrow Flight (#13460)
- ARROW-16780 - [CI] 為文件 PR 新增自動 PR 標籤 (#13340)
- ARROW-16783 - [R] 在 arrow_dplyr_query 中明確檢查支援的類別
- ARROW-16784 - [C++][Gandiva] 為 Upper 和 Lower 新增別名 (#13335)
- ARROW-16785 - [封裝][Linux] 新增 FindThrift.cmake (#13337)
- ARROW-16786 - [文件] 更新提取請求註記中的 “closed without merge” (#13341)
- ARROW-16789 - [格式] 從 C 串流介面移除實驗性標記 (#13345)
- ARROW-16792 - [C++][CMake] 在 Arrow 用作子專案時,新增對使用 Arrow 選項的支援 (#13348)
- ARROW-16793 - [CI] 更新 M1 自我託管執行器任務的標籤,使其更具體 (#13350)
- ARROW-16799 - [C++] 建立自我管道抽象化 (#13354)
- ARROW-16800 - [C++] RecordBatchBuilder 棄用 Status API,新增 Result API (#13356)
- ARROW-16804 - [CI][Conan] 合併上游變更 (#13360)
- ARROW-16809 - [C++] 為 FilterNode 新增基準測試 (#13366)
- ARROW-16815 - [封裝][RPM] 停用 aarch64 的 Apache Arrow Flight (#13371)
- ARROW-16816 - [C++] 將 Substrait 升級至 v0.6.0 (#13468)
- ARROW-16818 - [文件][Python] 記錄 PyArrow 的 GCS 檔案系統 (#13681)
- ARROW-16819 - [C++] arrow::compute::CallFunction 需要用於空函數的批次長度
- ARROW-16823 - [C++] 用於 UDF 的 Arrow Substrait 增強功能 (#13375)
- ARROW-16824 - [C++] 遷移 VectorKernels 以使用 ExecSpan,拆分 ChunkedArray 執行 (#13398)
- ARROW-16828 - [R][封裝] 在 MacOS 和 Windows 上啟用 Brotli 和 BZ2 (#13484)
- ARROW-16829 - [R] 將新貢獻者指南的連結新增至開發人員指南
- ARROW-16832 - [C++] 完全移除 hiveserver2 相關程式碼 (#13400)
- ARROW-16832 - [C++] 移除 cpp/src/arrow/dbi/hiveserver2 (#13382)
- ARROW-16839 - [CI][C++] 修復 xsimd 遺失相關的失敗 (#13388)
- ARROW-16840 - [CI] 將 actions/setup-ruby 取代為 ruby/setup-ruby
- ARROW-16850 - [C++] 分別複製 CSV 資料欄位和結束字元 (#13394)
- ARROW-16852 - [C++] 遷移剩餘的核心以使用 ExecSpan,移除 ExecBatchIterator (#13630)
- ARROW-16871 - [R] 在 Arrow dplyr 查詢中實作 exp() 和 sqrt() (#13517)
- ARROW-16873 - [Python] 在 run_debug_memory_pool 測試中,停用衍生子程序上的 faulthandler (#13461)
- ARROW-16874 - [Ruby] 針對自動資料類型轉換使用更多 .try_convert (#13417)
- ARROW-16875 - [Ruby] 新增 Column#cast 和 ChunkedArray#cast (#13418)
- ARROW-16886 - [C++] 新增選項以停用 PIC (#13475)
- ARROW-16887 - [R][文件] 更新 GCS 的檔案系統小品文 (#13601)
- ARROW-16900 - [R] 升級 lintr (#13432)
- ARROW-16901 - [R][CI] 修剪 R nightly 建置 (#13453)
- ARROW-16906 - [CI][C++] 在 MinGW 工作流程上啟用 ARROW_GCS (#13444)
- ARROW-16910 - [C++] 為 FileFragment 新增 Equals 方法 (#13490)
- ARROW-16911 - [C++] 為 Partitioning 新增 Equals 方法 (#13567)
- ARROW-16912 - [R][CI] 修復不含 GCS 的 nightly centos 套件 (#13441)
- ARROW-16913 - [Java] 實作 ArrowArrayStream (#13465)
- ARROW-16918 - [Gandiva][C++] 新增 UTC-本地時區轉換函數 (#13428)
- ARROW-16929 - [C++] 移除 ExecBatchIterator 及其用法
- ARROW-16930 - [Java] 將 CPP ORC JNI 程式碼移至 Java ORC 專案 (#13458)
- ARROW-16931 - [Ruby] 在 Arrow::Field 中新增對 nullable 的支援 (#13459)
- ARROW-16934 - [Go][Parquet] 修復 TODO。新增 json 和 csv,新增參數以設定輸出並關閉中繼資料 (#13463)
- ARROW-16935 - [封裝][RPM] 停用 Amazon Linux 2 的 GCS (#13469)
- ARROW-16937 - [封裝][deb] 放棄對 Ubuntu impish 的支援 (#13471)
- ARROW-16938 - [GLib] 將 girdir/vapidir 新增至 .pc (#13476)
- ARROW-16941 - [Java][Dataset] 更新更多 jni_util.h 路徑 (#13503)
- ARROW-16941 - [Java] 合併資料集 JNI 編譯 (#13481)
- ARROW-16955 - [CI] 將 setup-python github 動作升級至 v4 (#13491)
- ARROW-16964 - [C++] asof-join-node 測試中的 TSAN 錯誤 (#13639)
- ARROW-16966 - [文件] 記錄 Substrait 一致性 (#13494)
- ARROW-16971 - [GLib] 在呼叫 g_seekable_tell() 之前檢查 g_seekable_can_seek() (#13498)
- ARROW-16972 - [CI][封裝] 修復 homebrew 公式上的 -Dvapi 而非 -Dvala (#13504)
- ARROW-16974 - [GLib] 使 C99 相容 (#13512)
- ARROW-16977 - [R] 更新資料集列計數,以便在大型資料集上不會發生整數溢位 (#13514)
- ARROW-16984 - [Ruby] 新增在 Fedora 上自動安裝 Apache Arrow GLib 的支援 (#13524)
- ARROW-16995 - [CI][C++][MinGW] 請勿快取 site-packages (#13534)
- ARROW-16997 - [文件][開發] 更新 arrow/dev README (#13694)
- ARROW-16999 - [C++] 新增 SnappyConfig.cmake 的支援 (#13536)
- ARROW-17001 - [發佈][R] 使用 apache artifactory 取得 libarrow 二進制檔案。 (#13622)
- ARROW-17003 - [Java][文件] 記錄 arrow-jdbc 配接器 (#13543)
- ARROW-17005 - [Java] 允許覆寫 arrow-jdbc 中的欄位可空性 (#13558)
- ARROW-17010 - [Python] 從 <= 1.0.0 移除已棄用的 API (最上層 ipc、Value 純量類別、pyarrow.compat 模組) (#13545)
- ARROW-17011 - [C++][Flight] 移除 python/flight.cc 內部對 serialization_internal.h 的需求 (#13546)
- ARROW-17012 - [C++][Flight] 移除 python/flight.cc 內部對 serialization_internal.h 的需求
- ARROW-17019 - [Java][文件]:更新文件以與刪除 mac / linux netty-native 設定檔的任務對齊
- ARROW-17032 - [GLib][Ruby] 新增 Apache Arrow Flight SQL 的支援 (#13561)
- ARROW-17034 - [C++] 為 ThirdpartyToolchain.cmake 啟用編譯器快取 (#13562)
- ARROW-17035 - [C++][Gandiva] 新增 Ceil 函數 (#13565)
- ARROW-17036 - [C++][Gandiva] 新增 sign 函數 (#13568)
- ARROW-17037 - [C++] 拆分 utf8.h 以避免向第三方程式碼公開 xsimd 相依性 (#13569)
- ARROW-17039 - [C++] 分割區 schema() 方法不受 const 支援。 (#13572)
- ARROW-17046 - [Python] 改善 pyarrow.parquet.write_to_dataset 函數的文件 (#13591)
- ARROW-17047 - [Python][文件] 記錄如何從 StructType 取得欄位 (#13642)
- ARROW-17050 - [CI] 在 mamba install 上使用 -y 旗標以不要求確認 (#13579)
- ARROW-17055 - [Java][FlightRPC] 請勿在 flight-core 和 flight-sql 之間重複產生 Protobuf 類別 (#13596)
- ARROW-17060 - [C++] 變更 AsOfJoinNode 以使用 ExecContext 的記憶體集區 (#13585)
- ARROW-17063 - [GLib] 新增透過網路傳送/接收記錄批次的範例 (#13590)
- ARROW-17065 - [Python] 允許在 ExtensionType 中使用子類別化的 ExtensionScalar (#13594)
- ARROW-17070 - [Gandiva][C++] 新增 mask-show-first/last-n 函數 (#13609)
- ARROW-17078 - [C++] 清理 C++ 範例中的錯誤處理 (#13598)
- ARROW-17080 - [Java] 為 JNI 新增最上層 CMakeLists.txt (#13618)
- ARROW-17082 - [CI][Conan] 啟用 Brotli (#13617)
- ARROW-17083 - [Python] 刪除檔案系統 docstring 範例中建立的檔案和資料夾 (#13619)
- ARROW-17085 - [R] group_vars() 不應傳回 NULL (#13621)
- ARROW-17086 - [C++] 安裝 java/dataset 包含檔案並修復編譯器旗標導致的偵錯建置失敗 (#13614)
- ARROW-17095 - [Go] 允許串連字典陣列 (#13624)
- ARROW-17096 - [C++][Compute] 修復布林陣列上的模式核心錯誤 (#13646)
- ARROW-17101 - [Java] 更新 protoc 和 protoc-gen-grpc-java (#13632)
- ARROW-17102 - [R] 由於 Parquet 寫入,測試在 R minimal nightly 建置上失敗 (#13631)
- ARROW-17108 - [Python] 停止在整合任務上略過 dask 測試 (#13636)
- ARROW-17118 - [文件][發佈] 使用直接連結將新發佈新增至 Apache 報告資料庫 (#13645)
- ARROW-17121 - [Gandiva][C++] 將 mask 函數新增至 Gandiva (#13647)
- ARROW-17135 - [C++] 縮減 compute/kernels/scalar_compare.cc 中的程式碼大小 (#13654)
- ARROW-17140 - [C++][GANDIVA] 新增 Floor 函數 (#13655)
- ARROW-17151 - [文件] 固定文件主題以延遲深色模式更新 (#13663)
- ARROW-17153 - [GLib][Homebrew] glib-utils 僅適用於 GLib (#13683)
- ARROW-17153 - [CI][Homebrew] 需要 glib-utils (#13666)
- ARROW-17156 - [GLib][Flight] 新增 GAFlightClientOptions::disable-server-verification (#13670)
- ARROW-17157 - [GLib][Ruby][Flight] 為 GAFlightCallOptions 新增標頭支援 (#13671)
- ARROW-17158 - [GLib][Flight] 新增 GetFlightInfo 的支援 (#13672)
- ARROW-17161 - [C++][Java] 資料集:支援從 Parquet 格式檔案的固定偏移量讀取
- ARROW-17162 - [C++] 提高 protobuf 供應商版本以包含在 DEBUG 上編譯時的 ABI 不符修復 (#13674)
- ARROW-17163 - [C++] 還原 jni_util.h 的安裝 (#13675)
- ARROW-17188 - [R] 更新 9.0.0 的新聞 (#13726)
- ARROW-17194 - [CI][Conan] 啟用 glog (#13697)
- ARROW-17213 - [C++] 修復 test-r-linux-valgrind crossbow 建置中的 valgrind 問題 (#13715)
- ARROW-17242 - [C++][FlightRPC] 透過 Flight 傳播 RecordBatchReader::Close 錯誤 (#13738)