Apache Arrow 5.0.0 (2021 年 7 月 29 日)
這是涵蓋超過 3 個月開發的主要版本。
下載
貢獻者
此版本包含來自 2 個 Arrow 儲存庫中 99 位不同貢獻者的 684 次提交。
77 David Li
43 Krisztián Szűcs
42 Antoine Pitrou
35 Dominik Moritz
33 Nic Crane
27 Weston Pace
27 Sutou Kouhei
27 Andrew Lamb
23 Jonathan Keane
21 Joris Van den Bossche
17 Jorge C. Leitao
17 Ian Cook
16 João Pedro
15 Jiayu Liu
14 Yibo Cai
14 Alessandro Molina
13 Jorge Leitao
12 Ritchie Vink
12 Benjamin Kietzman
10 niranda perera
10 Wakahisa
10 Matthew Topol
9 Anthony Louis
8 Raphael Taylor-Davies
8 Nate Clark
7 Eduardo Ponce
6 Daniël Heres
5 Neal Richardson
5 Navin
5 Jörn Horstmann
5 Andy Grove
4 crystrix
4 Uwe L. Korn
4 Romain Francois
4 Rok
4 Marco Neumann
4 Ádám Lippai
3 liyafan82
3 frank400
3 Ying Zhou
3 Roee Shlomo
3 Michael Edwards
3 Matthijs Brobbel
3 Alenka Frim
2 Zachary Blackwood
2 Wes McKinney
2 Steven
2 P42
2 Michal Nowakiewicz
2 Kazuaki Ishizaki
2 Karik Isichei
2 Jeroen Ooms
2 Gary Pennington
2 Diana Clarke
2 Bryan Cutler
1 sjgupta2
1 sgilmore
1 ptaylor
1 nullptr
1 kazuhiko kikuchi
1 hulunbier
1 baishen
1 Zimo Zhang
1 Yordan Pavlov
1 Will Jones
1 Steven Burns
1 Stephen
1 Shuai Zhang
1 Ray Bell
1 Projjal Chanda
1 Pachamaltese
1 Nick Bruno
1 Micah Kornfield
1 Menno Siekerman
1 Max Meldrum
1 Mauricio Vargas
1 Marc van Heerden
1 Manish Gill
1 Maarten A. Breddels
1 Lorenz Walthert
1 Linan Qiu
1 Laurent Mazare
1 Kornelijus Survila
1 Kevin Gurney
1 Joris Peeters
1 Jinpeng Zhou
1 Jiangtao Peng
1 Hideaki Hayashi
1 Giordon Stark
1 Gang Liao
1 GALI PREM SAGAR
1 Edd Robinson
1 Dorian Kind
1 Dmitry Patsura
1 Chojan Shang
1 Boaz
1 Ben Chambers
1 Alex Baden
1 Adam Johnson
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到 Arrow 儲存庫。
96 Antoine Pitrou
69 Sutou Kouhei
63 David Li
59 Krisztián Szűcs
36 Jonathan Keane
33 Benjamin Kietzman
33 Neal Richardson
27 Andrew Lamb
22 Ian Cook
22 Praveen
21 Jorge C. Leitao
19 Yibo Cai
16 Dominik Moritz
16 Joris Van den Bossche
15 Jiayu Liu
12 GitHub
12 Ritchie Vink
11 Micah Kornfield
10 Wakahisa
8 Jorge Leitao
8 Raphael Taylor-Davies
6 Daniël Heres
5 Andy Grove
5 Jörn Horstmann
5 liyafan82
5 Navin
5 Weston Pace
4 Ádám Lippai
4 Marco Neumann
3 Brian Hulette
3 Michael Edwards
3 Roee Shlomo
2 Eric Erhardt
2 Gary Pennington
2 Steven
2 Uwe L. Korn
2 Wes McKinney
1 baishen
1 Ben Chambers
1 Boaz
1 Bryan Cutler
1 Chojan Shang
1 Dmitry Patsura
1 Edd Robinson
1 Gang Liao
1 hulunbier
1 ishizaki
1 Kazuaki Ishizaki
1 kazuhiko kikuchi
1 Kornelijus Survila
1 Laurent Mazare
1 Manish Gill
1 Marc van Heerden
1 Max Meldrum
1 Yordan Pavlov
變更日誌
以下變更日誌適用於 apache/arrow
儲存庫。關於 Apache Arrow 的 Rust 實作,請參閱 apache/arrow-rs
變更日誌。
Apache Arrow 5.0.0 (2021-07-28)
錯誤修正
- ARROW-6189 - [Rust] [Parquet] 純文字編碼的布林值資料行區塊限制為 2048 個值
- ARROW-6312 - [C++] 在 arrow.pc 套件配置中宣告必要的 Libs.private
- ARROW-7948 - [Go][整合] Decimal 整合失敗
- ARROW-9594 - [Python] DictionaryArray.to_numpy 未正確地將空索引轉換為空值
- ARROW-10910 - [Python] 使用舊版資料集將 None 給 read_table 時發生區段錯誤
- ARROW-10958 - [GLib] 通過 glib 發生「未實作巢狀資料轉換」,但 pyarrow 則否
- ARROW-11077 - [Rust] ParquetFileArrowReader 在嘗試讀取巢狀列表時發生 panic
- ARROW-11146 - [CI][Python] conda-python-3.8-jpype 每夜建置失敗
- ARROW-11161 - [Python][C++] S3Filesystem:檔案 Content-Type 未正確設定?
- ARROW-11633 - [CI] [文件] 找不到 Maven 預設外觀
- ARROW-11780 - [C++][Python] StructArray.from_arrays() 導致 Python 直譯器崩潰
- ARROW-11908 - [Rust] 間歇性 Flight 整合測試失敗
- ARROW-12007 - [C++] 載入 Parquet 檔案時傳回「Invalid UTF8 payload」錯誤
- ARROW-12055 - [R] is.na() 在 Arrow NaN 值上評估為 FALSE
- ARROW-12096 - [Python][C++] Pyarrow Parquet 讀取器在轉換為 Arrow Array (timestamp[ns]) 時溢位 INT96 時間戳記
- ARROW-12122 - [Python] 無法通過 pip 安裝 M1 mac
- ARROW-12142 - [Python] 未定義符號:_ZN5arrow6StatusC1ENS_10StatusCodeERKNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE
- ARROW-12150 - [Python] 混合精度 Decimal 的錯誤類型推斷
- ARROW-12232 - [Rust][Datafusion] CAST 錯誤:不支援 SQL 類型 Time
- ARROW-12240 - [Python] 來自 apple clang-12 的 invalid-offsetof 警告
- ARROW-12377 - [Doc][Java] Java 文件建置中斷
- ARROW-12407 - [Python] 建置 PyArrow 時的棄用警告
- ARROW-12431 - [Python] 當類型為二進位且要轉換的值為 numpy 陣列時,pa.array 遮罩反轉
- ARROW-12472 - [Python] 傳遞 PEP519 檔案系統物件時,read_table 失敗
- ARROW-12482 - [Doc][Python] 提及 CSVStreamingReader 與類型推斷的陷阱
- ARROW-12491 - [Packaging] CentOS RPM 套件中缺少 LZ4 >= 1.8 的必要依賴項
- ARROW-12503 - [C++] 確保針對 jemalloc 的函式庫目錄使用「lib/」
- ARROW-12508 - [R] expect_as_vector 實作導致 R <= 3.3 上的測試失敗,且在未安裝 arrow 時,於 test_that 之外定義的變數會中斷建置
- ARROW-12543 - [CI][Python] conda-python-3.9 每夜建置失敗
- ARROW-12568 - [Python][C++] 在 v4.0.0 中轉換 int64 的切片 ListArray 時發生 Segfault
- ARROW-12569 - [R] [CI] 在 CI 中執行 revdep
- ARROW-12570 - [JS] 修正阻礙 v4.0.0 版本發布的問題
- ARROW-12579 - [Python] Pyarrow 4.0.0 依賴項 numpy 1.19.4 在 Apple silicon/M1 編譯時拋出錯誤
- ARROW-12589 - [C++] 當 -DARROW_WITH_BACKTRACE=OFF 時,在 Windows 上編譯無法運作
- ARROW-12601 - [R][Packaging] 修正 r/configure 中的 pkg-config 檢查
- ARROW-12604 - [R][Packaging] Dataset、Parquet 在 autobrew 和 CRAN Mac 建置中關閉
- ARROW-12605 - [Documentation] 修復 dataset.rst 中的行號
- ARROW-12606 - [C++] Quantile 和 Mode 函數在具有偏移量的陣列上失敗
- ARROW-12610 - [C++] 在 Windows 上跳過 TestS3FSGeneric TestDeleteDir 和 TestDeleteDirContents,因為它們不穩定
- ARROW-12611 - [CI][Python] 每夜 test-conda-python-pandas-0.24 由於 numpy 相容性問題而失敗
- ARROW-12613 - [Python] 將 Scalar 與 None 進行比較時發生 AttributeError
- ARROW-12614 - [C++][Compute] 還原 ExecuteScalarExpression 中對 Table 的支援
- ARROW-12617 - [Python] pyarrow.orc.write_table 簽名與 pyarrow.parquet.write_table 相反
- ARROW-12620 - [C++] 資料集寫入只能包含投影資料行,如果輸入資料行也包含在內
- ARROW-12622 - [Python] 在 Flight 伺服器內部讀取 CSV 時發生 Segfault
- ARROW-12630 - [Dev][Integration] conda-integration docker 建置失敗
- ARROW-12639 - [CI][Archery] Archery 建置無法建立分支
- ARROW-12640 - [C++] 修復 cpp/src/parquet/types.h 中來自 VS 2019 的錯誤
- ARROW-12642 - [R] LIBARROW_MINIMAL、LIBARROW_DOWNLOAD、NOT_CRAN 環境變數不應區分大小寫
- ARROW-12644 - [C++][Dataset] 支援讀取日期/時間分割的資料集,並考量 URL 編碼 (Spark)
- ARROW-12646 - [C++][CI][Packaging][Python] 將 vcpkg 版本升級到最新版本
- ARROW-12663 - [C++] 使用 nvcc 11.2 編譯 arrow 標頭時發生 segfault
- ARROW-12668 - [C++][Dataset] CountRows 偶爾發生 segfault
- ARROW-12670 - [C++] extract_regex 在空值或不匹配項之後給出奇怪的行為
- ARROW-12672 - [C++] 轉換「fill_null()」的結果時發生 Segfault (非點陣圖但未知的 null_count)
- ARROW-12679 - [Java] JDBC 配接器未保留 SQL 空值性
- ARROW-12684 - [Go][Flight] 修復錯誤情況下的 nil 指標反參考
- ARROW-12708 - [C++] 呼叫 negate_checked 時發生 Valgrind 錯誤
- ARROW-12729 - [R] 修復 Table、RecordBatch 的 length 方法
- ARROW-12746 - [Go][Flight] 用戶端驗證處理常式覆寫傳出的中繼資料
- ARROW-12756 - [C++] MSVC 建置在最新的 gtest (來自 vcpkg) 上失敗
- ARROW-12757 - [Dev][Archery] 「archery docker run」中關於 RUST 變數的警告
- ARROW-12762 - [Python] ListType 在 pickle 和 unpickle 後未保留欄位名稱
- ARROW-12769 - [Python] 負超出範圍的切片產生無效的陣列
- ARROW-12771 - [C++] Arrow compute hash_count 在串流執行中跳過後續的 Chunked Array
- ARROW-12772 - [CI] 合併腳本測試由於缺少依賴項而失敗
- ARROW-12773 - [Docs] 釐清 Java 對於透過 JNI 綁定的 ORC 和 Parquet 的支援
- ARROW-12774 - [C++][Compute] replace_substring_regex() 建立無效的陣列 => 崩潰
- ARROW-12776 - [Archery][Integration] 修復 write_js_test_json 中的 decimal 案例產生
- ARROW-12779 - [Python][FlightRPC] Flight 伺服器在特定資料下發生 segfault
- ARROW-12780 - [CI][C++] MinGW 建置在嘗試建置 Gandiva 時失敗
- ARROW-12790 - [Python] 無法從路徑名稱中帶有空格的 HDFS 讀取
- ARROW-12793 - [Python] PYARROW_BUILD_TYPE=Debug 無法正確運作
- ARROW-12797 - [JS] 使用新連結更新 readme 並移除過時的範例
- ARROW-12798 - [JS] 使用 == null 比較
- ARROW-12799 - [JS] 針對預設值使用 Nullish Coalescing Operator (??)
- ARROW-12804 - [C++] 陣列方法 IsNull 和 IsValid 對於 NullType 感到困惑
- ARROW-12807 - [C++] 修復與 Future 重構/非同步 IPC 的合併衝突
- ARROW-12838 - [Java][Gandiva] 修復 Gandiva 的 JNI CI 測試
- ARROW-12842 - [Java][FlightRPC] 來自 FlightStatusException 的錯誤中繼資料未傳播到用戶端
- ARROW-12850 - [R] is.nan() 在 Arrow 空值上評估為 null
- ARROW-12854 - [Dev][Release] Windows wheel 驗證腳本無法下載產出物
- ARROW-12857 - [C++] hash_aggregate_test 未在 master 上建置
- ARROW-12864 - [C++] 從 arrow::internal::InvertBitmap 移除不必要的 out 引數
- ARROW-12865 - [C++][Python] Python FlightRPC 伺服器找不到 RE2 符號
- ARROW-12882 - [C++][Gandiva] 修復 convevrt_replace 函數對於空替換字元的行為
- ARROW-12887 - [CI] AppVeyor pip 安裝在設定期間失敗
- ARROW-12906 - [Python] 使用空值呼叫 `fill_null` 在非固定大小類型上發生 seg fault。
- ARROW-12907 - [Java] 當從通道讀取時發生例外狀況時,可能發生記憶體洩漏
- ARROW-12911 - [Python] 將純量聚合選項匯出到 pc.sum (零列的總和給出空值;應給出 0)
- ARROW-12917 - [C++][R][pyarrow] 使用 C 資料介面匯入某些 decimal 類型失敗
- ARROW-12918 - [C++] 使用 Visual Studio 16.10.31321.278 發生建置錯誤
- ARROW-12919 - [Developer Tools] Crossbow 評論機器人無法對評論做出反應
- ARROW-12935 - [C++][CI] 某些 clang 版本上的編譯器錯誤
- ARROW-12941 - [C++] csv 讀取器 skip_row 未正確更新 num_rows_seen
- ARROW-12942 - [C++][Compute] 如果後續區塊中有新群組,Arrow compute hash_min_max 的結果不正確
- ARROW-12956 - [C++] 修復 Parquet 檔案上的崩潰 (OSS-Fuzz)
- ARROW-12969 - [C++] match_substring 不會將空 needle 與空 haystack 匹配
- ARROW-12974 - [R] test-r-without-arrow 建置由於需要 Arrow 的範例而失敗
- ARROW-12983 - [C++][Python] 如果值不適合單個區塊,Converter::Extend 會卡在無限迴圈中,導致 OOM
- ARROW-12987 - [CI] test-ubuntu-18.04 每夜建置由於 Gandiva 「TestUpper」測試失敗而失敗
- ARROW-12988 - [CI] kartothek 每夜整合建置失敗 (test_update_dataset_from_ddf_empty)
- ARROW-12988 - [CI] kartothek 每夜整合建置失敗 (test_update_dataset_from_ddf_empty)
- ARROW-12989 - [CI] 「Dev PR」工作不當地取消
- ARROW-12991 - [CI] Travis ARM 建置經常崩潰
- ARROW-12993 - [Python] 使用無效 Feather 檔案和 stackprinter 解決邊界錯誤
- ARROW-12995 - [C++] CSV 讀取器應驗證選項
- ARROW-12998 - [C++] 資料集需要依賴 xsimd
- ARROW-13001 - [Go] s390x 上 parquet/internal/bmi 中的建置失敗
- ARROW-13003 - [C++] compute/exec/ cc 檔案中的未對齊存取
- ARROW-13008 - [C++] 編譯最小範例時的棄用警告
- ARROW-13010 - [C++][Compute] 支援從 kleene 核心輸出到切片
- ARROW-13018 - [C++][Docs] 在純量聚合核心中使用一致的術語表示空值 (min_count)
- ARROW-13026 - [C++][CI] s390x 工作設定失敗
- ARROW-13037 - [R] 建立 Expression 時的錯誤參數導致 R 崩潰
- ARROW-13039 - [R] 修復錯誤訊息處理
- ARROW-13041 - [C++] 一元核心可能會在空值條目下留下未初始化的資料
- ARROW-13046 - [Release] JS 套件在發布前測試失敗
- ARROW-13048 - [C++] S3FileSystem 無法移動包含 = 或 + 的檔案路徑
- ARROW-13053 - [Python] 在 MacOS Big Sur 上使用自製 Arrow 函式庫時建置失敗
- ARROW-13069 - [Website] 將 Daniël 新增至提交者列表
- ARROW-13073 - [Developer] archery benchmark list: 意外的關鍵字 ‘benchmark_filter’
- ARROW-13080 - [Release] 在 ubuntu 20.10 中產生 API 文件
- ARROW-13083 - [Python] setup.py 和 crossbow 中的錯誤 SCM 版本偵測
- ARROW-13085 - [Python] Apache Arrow 最小 cpp 建置在 pyarrow 函式庫中發生 segfault
- ARROW-13090 - [Python] ffspec 2021.6.0 的測試失敗
- ARROW-13104 - [C++] ByteStreamSplit 實作使用無效的指標轉換
- ARROW-13108 - [Python] Pyarrow 4.0.0 在 macOS 10.13.6 上匯入時崩潰
- ARROW-13116 - [R] RecordBatchReader 到 C 介面的測試由於缺少依賴項而在 arrow-r-minimal 上失敗
- ARROW-13125 - [R] 在 arrange() 中將 2 個以上的引數傳遞給 desc() 時拋出錯誤
- ARROW-13128 - [C#] TimestampArray 奈米和微秒的轉換邏輯錯誤
- ARROW-13135 - [C++] 修復 END_PARQUET_CATCH_EXCEPTIONS 中的 Status 傳播
- ARROW-13139 - [C++] ReadaheadGenerator 無法安全地複製/移動
- ARROW-13145 - [C++][CI] Flight 測試在 MinGW 上崩潰
- ARROW-13148 - [Dev][Archery] Crossbow 建置提交失敗
- ARROW-13153 - [C++] `parquet_dataset` 遺失 `_metadata` 中檔案的排序
- ARROW-13154 - [C++] Unions 無法將 126 和 127 作為 type_codes
- ARROW-13169 - [R] [C++] 排序的分割區鍵可能會導致問題
- ARROW-13173 - [C++] TestAsyncUtil.ReadaheadFailed 偶爾斷言
- ARROW-13187 - [c++][python] 在 CSV 中讀取時,可能未釋放記憶體
- ARROW-13189 - [R] 停用資料集上的列級中繼資料應用
- ARROW-13203 - [R] 修復導致失敗的可選組件檢查
- ARROW-13207 - [Python][Doc] 資料集文件仍然建議將棄用的 scan 方法作為首選的迭代方法
- ARROW-13216 - [R] 類型檢查測試在 rtools35 上失敗
- ARROW-13217 - [C++][Gandiva] 修正 convert_replace 函數對於字串開頭的無效字元的行為
- ARROW-13223 - [C++][CI] 修復執行緒安全漏洞偵測器失敗
- ARROW-13225 - [Go][Flight] 實作自訂中介軟體介面並啟用整合測試
- ARROW-13229 - [Python] ascii_trim、ascii_ltrim 和 ascii_rtrim 缺少選項
- ARROW-13239 - [Doc][Python] Dataset.head 函數未提及必要的引數
- ARROW-13243 - [R] R 3.5 中的 altrep 函數呼叫
- ARROW-13246 - [C++] CSV skip_rows_after_names 可能過早丟棄資料
- ARROW-13249 - [Java][CI] Java JNI 建置中的一致逾時
- ARROW-13253 - [C++][FlightRPC] 發送 record batch >2GB 時發生 Segfault
- ARROW-13254 - [Python] 讀取 pandas 資料時,進程被終止且 semaphore 物件洩漏
- ARROW-13265 - [R] nightlies 中的 cli valgrind 錯誤
- ARROW-13266 - [JS] 改善基準測試名稱並將套件名稱新增至 json
- ARROW-13281 - [C++][Gandiva] timestampDiffMonth 函數對於負 diff 值的行為錯誤
- ARROW-13284 - [C++] 錯誤的 pkg_check_modules() 選項名稱
- ARROW-13288 - [Python] PyArrow 中缺少核心選項的預設值
- ARROW-13290 - 由於缺少 include,clang-12 和 gcc-11 上的編譯失敗
- ARROW-13305 - [C++] 由於 CSV 選項,無法在 Ubuntu 21.04 上安裝 nightly
- ARROW-13315 - [R] 使用 ARROW_R_WITH_ARROW 檢查包裝 r_task_group includes
- ARROW-13321 - [C++][Python] MakeArrayFromScalar 不適用於 FixedSizeBinaryType
- ARROW-13324 - [R] utf8_reverse 和 ascii_reverse 的綁定中的錯字
- ARROW-13332 - [C++] TestAsyncUtil.ReadaheadFailed 中的 TSAN 失敗
- ARROW-13341 - [C++] arrow-compute-plan-test ExecPlanExecution.SourceScalarAggSink 中的 Segfault
- ARROW-13350 - [Python][CI] conda-python-3.7-pandas-0.24 每夜建置在 test_extract_datetime_components 中失敗
- ARROW-13352 - [C++] case_when 核心中的 Valgrind 失敗
- ARROW-13353 - [Documentation] 建置在 sphinx.util.cfamily.DefinitionError 中失敗
- ARROW-13360 - [C++] C++ thirdparty 離線依賴項 versions.txt 中缺少依賴項
- ARROW-13363 - [R] is.nan() 在非浮點資料上發生錯誤
- ARROW-13368 - [C++][Doc] 在文件中將專案重新命名為 make_struct
- ARROW-13381 - [C++] ArrayFromJSON 不適用於浮點值字典類型
- ARROW-13382 - [C++] 純量上的聚合導致 autobrew R 工作失敗
- ARROW-13384 - [C++] 在 cmake 中指定最低要求的 zstd 版本
- ARROW-13391 - [C++] CSV 串流讀取器不包含與表格讀取器相同的錯誤資訊
- ARROW-13417 - [C++] 合併的產生器有時可以從來源同步重入式提取
- ARROW-13419 - [JS] 修復效能測試
- ARROW-13428 - [C++][Flight] -lssl 在捆綁的 gRPC 和系統共用 OpenSSL 中遺失
- ARROW-13431 - [Release] 將 go 版本升級到 1.15;不再驗證 rust 原始碼
- ARROW-13432 - [Release] 修復與二進位上傳器容器的 ssh 連線
- ARROW-13450 - [Python][Packaging] 將通用二進位 wheel 的部署目標設定為 10.13
新功能與改進
- ARROW-2665 - [Python/C++] 新增 index() 方法以尋找 Python 純量的第一個出現位置
- ARROW-3014 - [C++] ORC 檔案格式的最小寫入器配接器
- ARROW-3316 - [R] 從 R data.frame 到 Arrow table / record batch 的多執行緒轉換
- ARROW-5385 - [Go] 實作 EXTENSION 資料類型
- ARROW-5640 - [Go] 實作 Map 陣列
- ARROW-6513 - [CI] conda 環境檔案 arrow/ci/conda_env_*.yml 應具有 .txt 副檔名
- ARROW-6513 - [CI] conda 環境檔案 arrow/ci/conda_env_*.yml 應具有 .txt 副檔名
- ARROW-7001 - [C++] 開發執行緒 API 以適應巢狀平行處理
- ARROW-7114 - [JS][CI] NodeJS 建置在 Github Actions Windows 節點上失敗
- ARROW-7252 - [Rust] [Parquet] 讀取 UTF-8/JSON/ENUM 欄位導致大量 vec 分配
- ARROW-7396 - [Format] 向 IANA 註冊 Apache Arrow 格式的媒體類型 (MIME 類型)
- ARROW-8421 - [Rust] [Parquet] 實作 Parquet 寫入器
- ARROW-8459 - [Dev][Archery] 使用更新版本的 cmake-format
- ARROW-8527 - [C++][CSV] 新增對 ReadOptions::skip_rows >= block_size 的支援
- ARROW-8655 - [C++][Dataset][Python][R] 保留已發現資料集的分割資訊
- ARROW-8676 - [Rust] 建立來自 ARROW-300 的 IPC RecordBatch body 緩衝區壓縮實作
- ARROW-9054 - [C++] 新增 ScalarAggregateOptions
- ARROW-9056 - [C++] 支援純量上的純量聚合
- ARROW-9140 - [R] 盡可能將 Arrow 零複製到 R
- ARROW-9295 - [Archery] 在 lint 命令中支援 rust clippy
- ARROW-9299 - [Python] 在 Python ORCFile 中公開 ORC metadata()
- ARROW-9313 - [Rust] 使用 feature enum
- ARROW-9421 - [C++][Parquet] 冗餘 SchemaManifest::GetFieldIndices
- ARROW-9430 - [C++/Python] 用於 SetItem(BooleanArray, values) 的核心
- ARROW-9697 - [C++][Dataset] Dataset/Scanner 的 num_rows 方法
- ARROW-10031 - [Java] 在 Archery 中支援 Java 基準測試
- ARROW-10115 - [C++] CSV 空的帶引號字串被視為 NULL
- ARROW-10316 - [Python] 考慮將 __wrapped__ 用於計算函數內省
- ARROW-10391 - [Rust] [Parquet] 巢狀 Arrow 讀取器
- ARROW-10440 - [C++][Dataset][Python] 新增回呼以在 Finish() 之前訪問檔案寫入器
- ARROW-10550 - [Rust] [Parquet] 寫入巢狀類型 (struct、list)
- ARROW-10557 - [C++] 新增純量字串切片/子字串提取核心
- ARROW-10640 - [C++] 一個「if_else」核心,用於根據遮罩合併兩個陣列
- ARROW-10658 - [Python][Packaging] Apple Silicon 的 Wheel 建置
- ARROW-10675 - [C++][Python] 支援 AWS S3 Web 身分驗證憑證
- ARROW-10797 - [C++] 研究用於測試和基準測試的更快隨機產生
- ARROW-10926 - [Rust] 為 decimal 類型新增 parquet 讀取器/寫入器
- ARROW-10959 - [C++] 新增純量字串聯接核心
- ARROW-11061 - [Rust] 根據 schema 驗證陣列屬性
- ARROW-11173 - 在 FieldReader / FieldWriter 中新增 Map 類型作為讀取器/寫入器
- ARROW-11199 - [C++][Python] 修正 ORC 讀取器的單元測試
- ARROW-11206 - [C++][Compute][Python] 將 “project” 核心 (kernel) 重新命名為 “make_struct”
- ARROW-11342 - [Python] [Gandiva] 公開 ToString 和結果類型資訊
- ARROW-11499 - [Packaging] 移除所有對 bintray 的使用
- ARROW-11514 - [R][C++] paste(), paste0(), str_c() 的綁定
- ARROW-11515 - [R] strsplit 的綁定
- ARROW-11565 - [C++][Gandiva] 修改 upper()/lower() 以支援 UTF8 並新增 INIT_CAP 函數
- ARROW-11608 - [CI] turbodbc 整合測試失敗 (建置問題)
- ARROW-11660 - [C++] 將 RecordBatch::SelectColumns 方法從 R 移至 C++ 程式庫
- ARROW-11673 - [C++] 鑄造字典類型以使用不同的索引類型
- ARROW-11675 - [CI][C++] 解決 VS 2019 建置上的 ctest 失敗問題
- ARROW-11705 - [R] 在 RecordBatch/Table$create() 中支援純量值回收
- ARROW-11748 - [C++] 確保 Decimal128 和 Decimal256 的欄位採用原生位元組序
- ARROW-11759 - [C++] 從時間戳記類型中提取日期時間組件 (年、月、日等) 的核心 (kernel)
- ARROW-11769 - [R] 從 grouped_df 將群組提取到 RecordBatch 或 Table
- ARROW-11772 - [C++] 為 ipc::RecordBatchFileReader 新增非同步讀取功能
- ARROW-11782 - [GLib][Ruby][Dataset] 移除內部類別的綁定
- ARROW-11787 - [R] 實作 CSV 寫入功能
- ARROW-11843 - [C++] 為 parquet::arrow::FileReader 新增非同步讀取功能
- ARROW-11849 - [R] 在 R 文件中使用 roxygen @examplesIf 標籤
- ARROW-11889 - [C++] 為串流 CSV 讀取器新增平行處理能力
- ARROW-11909 - [C++] 移除 MakeIteratorGenerator
- ARROW-11926 - [R] 通過新的 UCRT CRAN Windows 建置
- ARROW-11926 - [R] 通過新的 UCRT CRAN Windows 建置
- ARROW-11928 - [C++][Compute] 新增 ExecNode 層級結構
- ARROW-11929 - [C++][Compute] 將 Expression 提升至 compute 命名空間
- ARROW-11930 - [C++][Dataset][Compute] 重構 Dataset 掃描以使用 ExecNode 圖形
- ARROW-11932 - [C++] 提供 ArrayBuilder::AppendScalar
- ARROW-11950 - [C++][Compute] 新增一元負數核心 (kernel)
- ARROW-11960 - [C++][Gandiva] 支援 LIKE 中的逸出字元
- ARROW-11980 - [Python] 移除 Table.replace_schema_metadata 的 “experimental” 狀態
- ARROW-11986 - [C++][Gandiva] 為 doubles 和 floats 實作 IN 運算式
- ARROW-11990 - [C++][Compute] 一致地使用 Status/Result 回傳值來指示錯誤
- ARROW-12004 - [C++] Result<detail::Empty> 令人困擾
- ARROW-12010 - [C++][Compute] 提升 GroupIdentifier 中使用的雜湊表效能
- ARROW-12016 - [C++] 為 BOOL 類型實作 array_sort_indices 和 sort_indices
- ARROW-12050 - [C++][Python][FlightRPC] 使用 StopToken 來啟用中斷長時間 Flight 操作
- ARROW-12074 - [C++][Compute] 為十進位輸入新增純量算術核心 (kernel)
- ARROW-12083 - [R] open_dataset 中的 schema 使用
- ARROW-12166 - [C++][Gandiva] 實作 CONVERT_TO(value, type) 函數
- ARROW-12184 - [R] na.fail, na.omit, na.exclude, na.pass 的綁定
- ARROW-12185 - [R] any, all 的綁定
- ARROW-12198 - [R] strptime 的綁定
- ARROW-12199 - [R] stddev, variance 的綁定
- ARROW-12205 - [C++][Gandiva] 實作 TO_TIME([number] secs) 和 TO_TIMESTAMP([number] secs) 函數
- ARROW-12231 - [C++][Dataset] 將讀取器支援的資料集與 InMemoryDataset 分開
- ARROW-12253 - [Rust] [Ballista] 實作可擴展的 joins
- ARROW-12255 - [Rust] [Ballista] 將排程器與 DataFusion 整合
- ARROW-12256 - [Rust] [Ballista] 新增 DataFrame 支援
- ARROW-12257 - [Rust] [Ballista] 將使用者指南發佈到 Arrow 網站
- ARROW-12261 - [Rust] [Ballista] Ballista 不應有自己的 DataFrame API
- ARROW-12291 - [R] 判斷未評估運算式的類型
- ARROW-12310 - [Java] ValueVector#getObject 應支援複雜類型的共變性
- ARROW-12355 - [C++] 實作高效能的非同步 CSV 掃描
- ARROW-12362 - [Rust] [DataFusion] topk_query 測試失敗
- ARROW-12364 - [Python] [Dataset] 為 ds.write_dataset() 新增 metadata_collector 選項
- ARROW-12378 - [C++][Gandiva] 實作 castVARBINARY 函數
- ARROW-12386 - [C++] 在 AsyncScanner 中支援檔案平行處理
- ARROW-12391 - [Rust][DataFusion] 實作 date_trunc() 函數
- ARROW-12392 - [C++] 還原非同步串流 CSV 讀取器
- ARROW-12393 - [JS] 最佳化地使用 closure compiler
- ARROW-12403 - [Rust] [Ballista] 整合測試應檢查查詢結果是否正確
- ARROW-12415 - [CI] [Python] 錯誤:在 ARM64 上建置 pygit2 的 wheel 失敗
- ARROW-12424 - [Go][Parquet] 新增 Schema 套件
- ARROW-12428 - [Python] pyarrow.parquet.read_* 應使用 pre_buffer=True
- ARROW-12434 - [Rust] [Ballista] 顯示帶有指標的已執行計畫
- ARROW-12442 - [CI] 在 GitHub Actions 上設定工作逾時
- ARROW-12443 - [C++][Gandiva] 為二進位輸入實作 castVARCHAR 函數
- ARROW-12444 - [RUST] [CI] 移除 Rust 並將指標整合測試指向 arrow-rs 儲存庫
- ARROW-12445 - [Rust] 設計並實作封裝流程,以在簽署的 tar 檔案中捆綁 Rust
- ARROW-12468 - [Python][R] 將 UseAsync 公開給 python/R
- ARROW-12478 - [C++] 支援 LLVM 12
- ARROW-12484 - [CI] 更改 jinja 巨集,使其在 Github Actions 中上傳成品時不需要 CROSSBOW_TOKEN
- ARROW-12489 - [Developer] autotune 已損壞
- ARROW-12490 - [Dev] 為所有平台使用 miniforge
- ARROW-12492 - [Python] 新增輔助方法,將 DictionaryArray 解碼回純 Array
- ARROW-12496 - [C++][Dataset] 確保 Scanner 測試完全涵蓋非同步
- ARROW-12499 - [C++][Compute][R] 將 ScalarAggregateOptions 新增至 Any 和 All 核心 (kernel)
- ARROW-12500 - [C++][Dataset] 合併檔案格式的相似測試
- ARROW-12501 - [CI][Ruby] 移除 MinGW 建置的不必要變通方法
- ARROW-12507 - [CI] 移除重複的 cron/nightly 建置
- ARROW-12512 - [C++][Dataset] 實作 CSV 寫入支援
- ARROW-12514 - [Release] 在 ARROW_GANDIVA=OFF 的情況下,不要執行 Gandiva 相關的 Ruby 測試
- ARROW-12517 - [Go] 在 Flight client 中公開應用程式 Metadata
- ARROW-12518 - [Python] 公開 Parquet 統計資訊 has_null_count / has_distinct_count
- ARROW-12520 - [R] 少量文件更新
- ARROW-12522 - [C++] 實作 ReadRangeCache 的非同步/“lazy” 變體
- ARROW-12525 - [JS] Vector toJSON 回傳陣列
- ARROW-12527 - [Dev] 不要嘗試取得 MINOR PR 的 JIRA 資訊
- ARROW-12528 - [JS] 在 Table.new 中支援 typed arrays
- ARROW-12530 - [C++] 移除 Buffer::mutable_data_ 成員,並且僅在 is_mutable_ 為 true 時才在 data_ 上使用 const_cast
- ARROW-12533 - [C++] 在使用 clang 建置時,Arm64 Linux 上的隨機實數產生器速度緩慢
- ARROW-12534 - [C++][Gandiva] 在 Gandiva 上為字串輸入值實作 LEFT 和 RIGHT 函數
- ARROW-12537 - [JS] 文件建置不應包含測試來源
- ARROW-12541 - [Docs] 改善新文件主題中表格的樣式/可讀性
- ARROW-12551 - [Java][Release] Java 發佈後測試因缺少測試資料而失敗
- ARROW-12554 - 允許 compute::is_in 的 value_set 中出現重複項
- ARROW-12555 - [Java][Release] Java 發佈後腳本遺失 dataset JNI 綁定
- ARROW-12556 - [C++][Gandiva] 在 Gandiva 上實作 BYTESUBSTRING 函數
- ARROW-12560 - [C++] 調查在將回呼新增至已完成的 future 時,是否利用積極的執行緒任務建立
- ARROW-12567 - [C++][Gandiva] 為字串輸入值實作 LPAD 和 RPAD 函數
- ARROW-12567 - [C++][Gandiva] 為字串輸入值實作 LPAD 和 RPAD 函數
- ARROW-12571 - [R][CI] 使用 valgrind 執行 nightly R
- ARROW-12575 - [R] 使用一元負數核心 (kernel)
- ARROW-12577 - [Website] 在所有位置使用 Artifactory 而不是 Bintray
- ARROW-12578 - [JS] 簡化 NodeJS 中的 UTF8 處理
- ARROW-12581 - [C++][FlightRPC] 使用真實資料基準測試壓縮
- ARROW-12584 - [C++][Python] 公開基準測試工具的方法,以從記憶體配置器釋放未使用的記憶體
- ARROW-12591 - [Java][Gandiva] 為 MacOS 和 Linux 建立單一 Gandiva jar 檔案
- ARROW-12593 - [Packaging][Ubuntu] 新增對 Ubuntu 21.04 的支援
- ARROW-12597 - [C++] 實作 OptionalParallelForAsync
- ARROW-12598 - [C++][Dataset] 為 CSV 實作列計數或允許從 CSV 選取 0 個欄位
- ARROW-12599 - [Doc][Python] pyarrow.Table 的文件遺失
- ARROW-12600 - [CI] 從 crossbow 任務推送 docker 映像檔
- ARROW-12602 - [R] 將 C++ 的 BuildInfo 新增至 arrow_info
- ARROW-12608 - [C++] 新增 split_pattern_regex 函數
- ARROW-12612 - [C++][Compute] 將 Expression 新增至 type_fwd.h
- ARROW-12619 - [Python] pyarrow sdist 不應需要 git
- ARROW-12621 - [C++][Gandiva] 為 sha1 和 sha256 函數新增別名
- ARROW-12631 - [Python] pyarrow.dataset.write_table 應接受 Scanner 來寫入
- ARROW-12643 - 為實驗性儲存庫新增文件
- ARROW-12645 - [Python] 修正 numpydoc 驗證
- ARROW-12648 - [C++][FlightRPC] 允許在基準測試中使用 TLS
- ARROW-12649 - [Python/Packaging] 使用交叉編譯將 conda-aarch64 移至 Azure
- ARROW-12653 - [Archery] 允許我為 crossbow 請求新增註解
- ARROW-12658 - [C++] 將 aws-c-common 升級至 v0.5.10
- ARROW-12660 - [R] 針對 CRAN 的 4.0 後調整
- ARROW-12661 - [C++] CSV 新增跳過欄名後的列
- ARROW-12662 - [Website] 強制使用 squash merge
- ARROW-12667 - [Python] 確保對跨步 numpy 陣列轉換的測試覆蓋率
- ARROW-12675 - [C++] CSV 應在剖析錯誤訊息中包含行/列號碼
- ARROW-12677 - [Python] 為 pyarrow.StructArray.from_arrays 新增 mask 參數
- ARROW-12685 - [C++][Compute] 新增一元絕對值核心 (kernel)
- ARROW-12686 - [C++][Python][FlightRPC] 在 DoGet 中支援 export_to_c/繼承自 RecordBatchReader
- ARROW-12687 - [C++][Python][Dataset] 支援 Scanner 的 C 資料介面
- ARROW-12689 - [R] 實作 ArrowArrayStream C 介面
- ARROW-12692 - [R] 改善 strsplit() 綁定的測試和註解
- ARROW-12694 - [R][CI] rtools35 工作在 32 位元建置測試中失敗
- ARROW-12696 - [R] 改善轉換為警告的錯誤訊息測試
- ARROW-12699 - [CI][Packaging][Java] 為所有 Arrow 組件產生與 Linux 和 MacOS 相容的 jar 檔案
- ARROW-12701 - [Website][Release] 在發行說明中包含 Rust 貢獻者、提交者和提交
- ARROW-12702 - [JS] 升級 Webpack 和 terser
- ARROW-12703 - [JS] 將 Table 與 DataFrame 分開
- ARROW-12704 - [JS] 使用 optional chaining
- ARROW-12709 - [C++] 新增 variadic 字串 join 核心 (kernel)
- ARROW-12713 - [C++] 字串反轉核心 (kernel)
- ARROW-12715 - [C++] SQL 樣式的 glob 字串比對核心 (kernel)
- ARROW-12716 - [C++] 左/右/中 字串填充核心 (kernel)
- ARROW-12717 - [C++] 子字串尋找位置核心 (kernel)
- ARROW-12719 - [C++][Python] pyarrow.fs.S3FileSystem 傳遞額外的 kwargs,例如 ACL
- ARROW-12721 - [CI] 修正從 nightly 建置上傳 aarch64 conda 成品的路徑
- ARROW-12722 - [R] 嘗試列印具有重複命名的表格時引發錯誤
- ARROW-12730 - [MATLAB] 更新 featherreadmex 和 featherwritemex 以針對最新的 arrow c++ API 進行建置
- ARROW-12731 - [R] 在 dplyr 程式碼中使用 InMemoryDataset 作為 Table/RecordBatch
- ARROW-12736 - [C++] 消除 FieldPath::Get() 中不必要的複製
- ARROW-12738 - [CI] [Gandiva] azure-conda-osx-clang-py38 (和 py39, py*-r*) 中的 nightly 建置錯誤
- ARROW-12741 - [CI] 為 Nightly Builds 設定 GitHub Token
- ARROW-12745 - [C++][Compute] 新增 floor、ceiling 和 truncate 核心 (kernel)
- ARROW-12749 - [C++] 從左值建構 RecordBatch/Table/Schema 造成不必要的複製
- ARROW-12750 - [CI] [R] 實際將參數化的 docker 選項傳遞至範本
- ARROW-12751 - [C++] 新增 variadic 列式 min/max 核心 (kernel) (least/greatest)
- ARROW-12758 - [R] 為更多函數文件新增範例
- ARROW-12759 - [C++][Compute] 將分組聚合包裝在 ExecNode 中
- ARROW-12760 - [C++][Python][R] S3FileSystem: IO 執行緒平行處理限制為 8 個執行緒
- ARROW-12761 - [R] 改善 write_to_raw 的錯誤處理
- ARROW-12764 - [CI] 修正 Conda Windows 建置中的引數
- ARROW-12777 - [R] 在 match_arrow 和 is_in 中將所有輸入轉換為 Arrow 物件
- ARROW-12781 - [R] 為 dplyr 實作 is.type() 函數
- ARROW-12785 - [CI] r-devdocs 建置在 brew 安裝 gcc 時發生錯誤
- ARROW-12791 - [R] 改進未指定格式時 DatasetFactory$Finish() 的錯誤處理
- ARROW-12796 - [JS] 支援來自基準測試的 JSON 輸出
- ARROW-12800 - [JS] 捨棄 IE 支援並移除 text encoder 和 decoder polyfills
- ARROW-12801 - [CI][Packaging][Java] 在產生 Arrow jar 檔案的腳本中包含所有模組
- ARROW-12806 - [Python] test_write_to_dataset_filesystem 遺失 dataset 標記
- ARROW-12808 - [JS] 文件瀏覽器支援
- ARROW-12810 - [Python] 使用 AWS_EC2_METADATA_DISABLED=true 執行測試
- ARROW-12812 - [Packaging][Java] 改善 JNI jars 建置
- ARROW-12824 - [R][CI] 升級 R 4.1 發行版本的建置
- ARROW-12827 - [C++] [Dataset] 檢閱 datasets API 中的錯誤傳遞
- ARROW-12829 - [GLib][Ruby] 新增 Apache Arrow Flight 支援
- ARROW-12831 - [CI][macOS] 移除不必要的 Homebrew 變通方法
- ARROW-12832 - [JS] 以 TypeScript 撰寫基準測試
- ARROW-12833 - [JS] 在 JS 中建構 perf 資料
- ARROW-12835 - [C++] 在 match_substring(_regex) 和 match_like 中實作不區分大小寫的比對
- ARROW-12836 - [C++] 因為 CxxFlags 而導致 IBM i 上的安裝失敗
- ARROW-12841 - [R] 為更多函數文件新增範例 - 第 2 部分
- ARROW-12843 - [C++][Compute] 為浮點陣列新增 is_inf 核心 (kernel)
- ARROW-12848 - [Release] 郵件範本指向 404 錯誤頁面
- ARROW-12851 - [Go][Parquet] 新增 Encoding 套件第 1 部分
- ARROW-12856 - [C++][Gandiva] 在 Gandiva 上實作 castBIT 和 castBOOLEAN 函數
- ARROW-12859 - [C++] 新增 ScalarFromJSON 以簡化測試
- ARROW-12861 - [C++][Compute] 新增 sign 函數核心 (kernel)
- ARROW-12867 - [R] abs() 的綁定
- ARROW-12868 - [R] find_substring 和 find_substring_regex 的綁定
- ARROW-12869 - [R] utf8_reverse 和 ascii_reverse 的綁定
- ARROW-12870 - [R] stringr::str_like 的綁定
- ARROW-12875 - [JS] 升級 Jest 和其他小更新
- ARROW-12883 - [R] [CI] 版本相容性在 R 4.1 上失敗
- ARROW-12891 - [C++][Compute][Dataset] 將子樹修剪邏輯提取到 compute:
- ARROW-12894 - [R] 更新 R 版本
- ARROW-12895 - [CI] 在 Github Actions 上使用 “concurrency” 設定
- ARROW-12898 - [Release][C#] 套件上傳腳本已損壞
- ARROW-12900 - [Python][Documentation] 讀取資料集文件中的 np import
- ARROW-12901 - [R] 繼續新增更多範例
- ARROW-12909 - [R][Release] ubuntu-docs 的建置失敗
- ARROW-12912 - [Website] 使用 .asf.yaml 進行發佈
- ARROW-12915 - [Release] ubuntu-docs 的建置在 thrift 上失敗
- ARROW-12936 - [C++][Gandiva] 在 Gandiva 上實作 ASCII Hive 函數
- ARROW-12937 - [C++] 允許為新的 S3 檔案指定預設 metadata
- ARROW-12939 - [R] 簡化 RTask 停止處理
- ARROW-12940 - [R] 將 C 介面公開為 R6 方法
- ARROW-12948 - [C++] 新增字串切片取代核心 (kernel)
- ARROW-12949 - [C++] 新增字串 starts-with/ends-with 核心 (kernel)
- ARROW-12950 - [C++] 新增子字串計數核心 (kernel)
- ARROW-12951 - [C++] 重構 StringTransform
- ARROW-12952 - [C++] 新增 regex 計數核心 (kernel)
- ARROW-12955 - [C++] 為 if_else 核心 (kernel) 新增額外的類型支援
- ARROW-12957 - [R] cran 上的 rchk 問題
- ARROW-12961 - [C++] MSVC 在 Windows 上建置 PyArrow 時發出警告
- ARROW-12962 - [GLib][Ruby] 新增 Arrow::Scalar
- ARROW-12964 - [R] 為 ifelse() 和 if_else() 新增綁定
- ARROW-12966 - [Python] 公開 ElementWiseAggregateOptions 的 Python 綁定
- ARROW-12967 - [R] 為 pmin() 和 pmax() 新增綁定
- ARROW-12968 - [R] [CI] 為我們的 nightlies 新增 rchk 工作
- ARROW-12972 - [CI] ][C++] CentOS + ARM64 上的 archive_write_add_filter_zstd 錯誤
- ARROW-12975 - [C++][Python] if_else 核心 (kernel) 不支援向上轉型
- ARROW-12982 - [C++] 重新啟用 unused-variable 警告
- ARROW-12984 - [C++] 依參考傳遞 Count/Index 聚合的 options 參數
- ARROW-12985 - [Python][Packaging] 無法在 arm64 wheel 建置中安裝 pygit2
- ARROW-12986 - [C++][Gandiva] 在 Gandiva 中實作新的快取逐出策略
- ARROW-12992 - [R] substr(), substring(), str_sub() 的綁定
- ARROW-12994 - [R] 修正假設 UTC 本地時區的測試
- ARROW-12996 - [C++] CSV 串流讀取器沒有進度指示
- ARROW-13002 - [C++] 在 CMake 中新增 utf8proc 版本的檢查
- ARROW-13005 - [C++] 支援 union 資料類型的 filter/take。
- ARROW-13006 - [C++][Gandiva] 在 Gandiva 上實作 BASE64 和 UNBASE64 Hive 函數
- ARROW-13009 - [Doc][Dev] 文件建置郵件列表
- ARROW-13022 - [R] lubridate 的 year, isoyear, quarter, month, day, wday, yday, isoweek, hour, minute, 和 second 函數的綁定
- ARROW-13025 - [C++][Compute] 使用相等性、偵錯表示能力和可序列化性來增強 FunctionOptions
- ARROW-13027 - [C++] 修正 CI 中的 ASAN 堆疊追蹤
- ARROW-13030 - [CI][Go] 設定 Arm64 golang CI
- ARROW-13031 - [JS] 在 macOS 上的 closure compiler 中支援 arm
- ARROW-13032 - [Java] 更新 gauva 版本
- ARROW-13034 - [Python][Docs] 更新 Parquet 文件頁面上 hdfs/azure 的過時範例
- ARROW-13036 - [Doc] 提及 Arrow IPC 的建議檔案副檔名
- ARROW-13042 - [C++] 核心 (kernel) 不會在輸出中留下未初始化資料的自動檢查
- ARROW-13043 - [GLib][Ruby] 新增 GArrowEqualOptions
- ARROW-13044 - [Java] Union vectors 應擴展 ValueVector
- ARROW-13045 - [Packaging][RPM][deb] 如果系統 utf8proc 版本過舊,則不要安裝
- ARROW-13047 - [Website] 將 kiszk 新增至提交者列表
- ARROW-13049 - [C++][Gandiva] 在 Gandiva 上實作 BIN Hive 函數
- ARROW-13050 - [C++][Gandiva] 在 Gandiva 上實作 SPACE Hive 函數
- ARROW-13054 - [C++] 為 “day_of_week” 時間核心 (kernel) 新增選項以指定一週的第一天
- ARROW-13064 - [C++] 新增一般 “if, ifelse, …, else” 核心 (kernel) (“CASE WHEN”)
- ARROW-13065 - [Packaging][RPM] 新增遺失的必要 LZ4 版本資訊
- ARROW-13068 - [GLib][Dataset] 將前綴從 gad_ 變更為 gadataset_
- ARROW-13070 - [R] sd 和 var 的綁定
- ARROW-13072 - [C++] 新增位元運算算術 compute 函數
- ARROW-13074 - [Python] 開始棄用 ParquetDataset 自訂屬性
- ARROW-13075 - [Python] 公開 pyarrow.Field 的 C 資料介面 API
- ARROW-13076 - [Java] 啟用 ExtensionType 以使用 StructVector 和 UnionVector 作為底層儲存
- ARROW-13082 - [CI] 將 R 引數轉發到 ubuntu-docs 建置
- ARROW-13086 - [Python] 公開 Parquet ArrowReaderProperties::coerce_int96_timestamp_unit_
- ARROW-13086 - [Python] 公開 Parquet ArrowReaderProperties::coerce_int96_timestamp_unit_
- ARROW-13091 - [Python] 為 IpcWriteOptions 建構子新增 compression_level 引數
- ARROW-13092 - [C++] 如果目標存在且不是目錄,則 CreateDir 應失敗
- ARROW-13095 - [C++] 實作三角函數 compute 函數
- ARROW-13096 - [C++] 實作對數 compute 函數
- ARROW-13097 - [C++] 為 s 提供簡單的反思工具
- ARROW-13098 - [Dev][Archery] 將 docker 子模組重組為自己的子套件
- ARROW-13100 - [MATLAB] 將 GoogleTest 與 MATLAB 介面 C++ 程式碼整合
- ARROW-13101 - [Python][Doc] pyarrow.FixedSizeListArray 未出現在文件中
- ARROW-13110 - [C++] 在未使用傳輸回呼的情況下使用 BackgroundGenerator 時,可能會發生死鎖
- ARROW-13113 - [R] 使用 RTasks 管理將 arrow 轉換為 R 的平行處理
- ARROW-13117 - [R] 在新的 Expressions 中保留 schema
- ARROW-13119 - [R] 在純量 Expressions 中設定空的 schema
- ARROW-13124 - [Ruby] 新增記憶體視圖支援
- ARROW-13127 - [R] Valgrind nightly 錯誤
- ARROW-13136 - [C++] 新增 “coalesce” variadic 純量核心 (kernel)
- ARROW-13137 - [C++][Documentation] 使表格內參考保持一致
- ARROW-13140 - [C++/Python] 升級 nightlies 中的 libthrift pin
- ARROW-13142 - [Python] 從非跨步 numpy 陣列列表轉換時使用向量附加
- ARROW-13147 - [Java] 在配置向量緩衝區時,遵守捨入策略
- ARROW-13157 - [C++] 新增 find_substring_regex 核心 (kernel) 並為 find_substring 實作 ignore_case
- ARROW-13158 - [Python] 修正具有重複欄位名稱的 StructScalar 的 repr 和 contains
- ARROW-13162 - [C++][Gandiva] 為 Gandiva 登錄中的 extract date 函數新增新的別名
- ARROW-13171 - [R] 為 str_pad() 新增綁定
- ARROW-13190 - [C++] [Gandiva] 變更 INITCAP 函數的行為
- ARROW-13194 - [Java][Document] 建立關於 Java 演算法的散文文件
- ARROW-13195 - [R] rlang 反向相依性檢查問題
- ARROW-13199 - [R] 新增 ubuntu 21.04 至每日建置
- ARROW-13200 - [R] 為 case_when() 新增綁定
- ARROW-13201 - [R] 為 coalesce() 新增綁定
- ARROW-13210 - [Python][CI] 修復 macOS wheels 的 vcpkg 快取機制
- ARROW-13211 - [C++][CI] 移除過時的 Github Actions ARM 建置
- ARROW-13212 - [Release] 支援在 python 發布後腳本中部署到測試 PyPI
- ARROW-13215 - [R] [CI] 將 ENV TZ 新增至 docker 檔案
- ARROW-13218 - [Doc] 文件化/闡明時間戳記儲存的慣例
- ARROW-13219 - [C++][GLib] 降級/棄用 CompareOptions
- ARROW-13224 - [Python][Doc] 缺少 pyarrow.dataset.write_dataset 的文件
- ARROW-13226 - [Python] 新增通用 cython 跳板工具
- ARROW-13228 - [C++] S3 CreateBucket 失敗,因為 AWS 對待 us-east-1 的方式與其他區域不同
- ARROW-13230 - 新增 CSV Writer 文件
- ARROW-13234 - [C++] 新增字串填充選項以決定額外空間在哪一側
- ARROW-13235 - [C++] 使所有 FunctionOptionTypes 的 type_name 等於選項類別名稱
- ARROW-13236 - [Python] 改善 pyarrow.compute.FunctionOptions 的 repr
- ARROW-13238 - [C++][Dataset][Compute] 替換用於資料集掃描的 ExecPlan 實作
- ARROW-13242 - [C++] 改善十進制隨機生成
- ARROW-13244 - [C++] 新增取得當前執行緒 ID 的功能
- ARROW-13258 - [Python] 改善 ParquetFileFragment 的 repr
- ARROW-13262 - [R] 將資料拉入 R 後 transmute() 失敗
- ARROW-13273 - [C++] 請勿僅在 CMake 路徑中的 Requires.private 使用 .pc
- ARROW-13274 - [JS] 移除 Webpack
- ARROW-13275 - [JS] 修復效能測試
- ARROW-13276 - [GLib][Ruby][Flight] 新增 ListFlights 的支援
- ARROW-13277 - [JS] 新增宣告映射
- ARROW-13280 - [R] log 和 trig 函數的綁定
- ARROW-13282 - [C++] 移除過時的生成檔案
- ARROW-13283 - [開發者工具] 支援在 archery docker run 中傳遞記憶體限制
- ARROW-13286 - [CI] 要求 docker-compose 1.27.0 或更高版本
- ARROW-13289 - [C++] Log 函數沒有整數核心
- ARROW-13291 - [GLib][CI] 要求 gobject-introspection 3.4.5 或更高版本
- ARROW-13296 - [C++] 提供與反射相容的 enum 替換
- ARROW-13299 - [JS] 升級 ix 和 rxjs
- ARROW-13303 - [JS] 修訂 bundles
- ARROW-13306 - [Java][JDBC] 使用 ResultSetMetaData.getColumnLabel 而不是 ResultSetMetaData.getColumnName
- ARROW-13313 - [C++][Compute] 新增 ScalarAggregateNode
- ARROW-13320 - [網站] 將 MIME 類型新增至 FAQ
- ARROW-13323 - [Archery] 驗證 docker compose 配置
- ARROW-13343 - [R] 更新 5.0 版本的 NEWS.md
- ARROW-13346 - [C++] 從 EnumType 移除編譯時期解析
- ARROW-13355 - [R] 確保 sf 安裝在我們的 revdep 工作中
- ARROW-13357 - [R] sign() 的綁定
- ARROW-13365 - [R] floor/ceiling/truncate 的綁定
- ARROW-13385 - [C++][Compute] 文件化 FunctionRegistry 的外部來源新增
- ARROW-13386 - [R][C++] CSV 串流變更破壞 Rtools 35 32 位元建置
- ARROW-13418 - [R] python.r 中的錯字
- ARROW-13461 - [Python][Packaging] 為 python 3.8 建置 M1 wheels
- PARQUET-1798 - [C++] 檢閱 field_id 自動分配的邏輯
- PARQUET-1998 - [C++] 實作 LZ4_RAW 壓縮
- PARQUET-2056 - [C++] 為 ColumnReader 新增分別檢索字典和索引的能力