Apache Arrow 4.0.0 (2021年4月26日)
這是一個主要版本,涵蓋了超過 3 個月的開發。
下載
貢獻者
此版本包含來自 114 位不同貢獻者的 719 個提交。
$ git shortlog -sn apache-arrow-3.0.0..apache-arrow-4.0.0
65 Antoine Pitrou
47 Andrew Lamb
41 Heres, Daniel
40 David Li
37 Sutou Kouhei
33 Neal Richardson
30 Weston Pace
28 Jorge C. Leitao
26 Krisztián Szűcs
25 Ian Cook
21 Dominik Moritz
20 Andy Grove
19 Yibo Cai
18 Joris Van den Bossche
17 Neville Dipale
17 Jonathan Keane
17 Ritchie Vink
12 Mike Seddon
12 Benjamin Kietzman
11 Mauricio Vargas
10 Qingping Hou
10 Diana Clarke
8 Micah Kornfield
7 Matthew Topol
7 Dmitry Patsura
5 Projjal Chanda
5 Kenta Murata
4 Anthony Louis
4 Ximo Guanter
4 liyafan82
3 Andre Braga Reis
3 Kazuaki Ishizaki
3 Maarten A. Breddels
3 Uwe L. Korn
3 ptaylor
3 Steven Fackler
3 Sagnik Chakraborty
3 Nic Crane
2 Marc Prud'hommeaux
2 Raphael Taylor-Davies
2 João Pedro
2 Yordan Pavlov
2 emkornfield
2 Max Burke
2 Florian Müller
2 Ben Chambers
2 mqy
2 Christoph Schulze
2 Manoj Karthick
2 Sathis Kumar
2 Ryan Jennings
2 Ruan Pearce-Authers
2 Tao He
2 Eric Burden
2 Tyrel Rink
2 Romain Francois
2 Rok
1 witchard
1 Adam Lippai
1 Albert Villanova del Moral
1 Alessandro Molina
1 Ali
1 Andrew Wieteska
1 Bob Tinsman
1 Brian Hulette
1 Bryan Cutler
1 Clcanny
1 Daniel Russo
1 Daniël Heres
1 Eduardo Ponce
1 Evan Chan
1 FawnD2
1 Felix Zhu
1 Fernando Herrera
1 Fiona La
1 François Saint-Jacques
1 GALI PREM SAGAR
1 Gert Hulselmans
1 Ha Thi Tham
1 Hongze Zhang
1 Ilya Biryukov
1 Ivan Smirnov
1 James Winegar
1 Joe Roberts
1 Johannes Müller
1 Jörn Horstmann
1 Mahmut Bulut
1 Marco Gorelli
1 Marko Mikulicic
1 Markus Silberstein Hont
1 Martin Nowak
1 Matt Brubeck
1 Matt Summersgill
1 Max Meldrum
1 Nathaniel Bauernfeind
1 Nga Tran
1 Nick Bruno
1 Rok Mihevc
1 Roman Karlstetter
1 Sam Albers
1 Simon Bertron
1 Szangin
1 Truc Lam Nguyen
1 Weichen Xu
1 Ying Zhou
1 frank400
1 ivan
1 jpeeter
1 martinblostein
1 nmcdonnell-kx
1 pierwill
1 sjgupta2
1 sundy-li
1 ARF1
Patch 提交者
以下 Apache 提交者將貢獻的補丁合併到儲存庫。
$ git shortlog -csn apache-arrow-3.0.0..apache-arrow-4.0.0
157 Andrew Lamb
101 Antoine Pitrou
93 Neal Richardson
88 Krisztián Szűcs
72 Sutou Kouhei
41 David Li
30 Benjamin Kietzman
25 Neville Dipale
22 Micah Kornfield
19 Jorge C. Leitao
16 Andy Grove
14 Praveen
11 Joris Van den Bossche
9 GitHub
8 Yibo Cai
4 Uwe L. Korn
3 Sebastien Binet
2 liyafan82
1 Kenta Murata
1 Eric Erhardt
1 Chao Sun
1 Bryan Cutler
變更日誌
Apache Arrow 4.0.0 (2021-04-26)
新功能與改進
- ARROW-951 - [JS] 修復產生的 API 文件
- ARROW-2229 - [C++] 從 RecordBatch、Table 寫入 CSV 檔案
- ARROW-3690 - [Rust] 將 Rust 加入格式整合測試
- ARROW-6103 - [Java] 停止使用 Maven 發行外掛程式
- ARROW-6248 - [Python] 在 Python 3 的 HadoopFileSystem.open() 中使用 FileNotFoundError
- ARROW-6455 - [C++] 實作非 UTF-8 Unicode 資料的 ExtensionType
- ARROW-6604 - [C++] 新增對巢狀型別的 MakeArrayFromScalar 支援
- ARROW-7215 - [C++][Gandiva] 在 Gandiva 中實作 castVARCHAR(numeric_type) 函數
- ARROW-7364 - [Rust] 將 cast 選項新增至 cast kernel
- ARROW-7633 - [C++][CI] 為張量和稀疏張量建立模糊測試目標
- ARROW-7808 - [Java][Dataset] 實作 Datasets Java API
- ARROW-7906 - [C++][Python] ORC 格式的完整功能
- ARROW-8049 - [C++] 將捆綁的 Thrift 版本升級至 0.13.0
- ARROW-8282 - [C++/Python][Dataset] 支援整數欄位的 schema 演進
- ARROW-8284 - [C++][Dataset] 時間戳記欄位的 Schema 演進
- ARROW-8630 - [C++][Dataset] 傳遞包含所有實體化欄位的 schema 以捕捉 CSV 邊緣案例
- ARROW-8631 - [C++][Dataset] 將 ConvertOptions 和 ReadOptions 新增至 CsvFileFormat
- ARROW-8658 - [C++][Dataset] 為 FileSystemDataset::GetFragments 實作子樹修剪
- ARROW-8732 - [C++] 讓 Futures 支援取消
- ARROW-8771 - [C++] 新增 boost/process 函式庫以支援建置
- ARROW-8796 - [Rust] 允許 Parquet 直接寫入記憶體
- ARROW-8797 - [C++] 支援不同位元組序平台之間的 Flight RPC
- ARROW-8900 - [C++] 針對 S3 檔案系統尊重 HTTP(S)_PROXY 和/或將 Proxy 選項公開為參數
- ARROW-8919 - [C++] 將 “DispatchBest” API 新增至 compute::Function,以選擇可能需要隱式轉換才能調用的核心
- ARROW-9128 - [C++] 實作字串空格修剪核心:trim、ltrim 和 rtrim
- ARROW-9149 - [C++] 改善 RandomArrayGenerator::ArrayOf 的可配置性
- ARROW-9196 - [C++] 使時間轉換適用於純量輸入
- ARROW-9318 - [C++][Parquet] 加密金鑰管理工具
- ARROW-9731 - [C++][Dataset] 將 “head” 方法從 R 移植到 C++ Dataset Scanner
- ARROW-9749 - [C++][Dataset] 從 FileFormat 提取格式特定的掃描選項
- ARROW-9777 - [Rust] 實作 IPC 變更以趕上 1.0.0 格式
- ARROW-9856 - [R] 為字串計算函數新增綁定
- ARROW-10014 - [C++] TaskGroup::Finish 應執行任務
- ARROW-10089 - [R] 為 Array、ChunkedArray 和 Scalar 注入基底類別
- ARROW-10183 - [C++] 建立一個 ForEach 函式庫函數,該函數在 Futures 的迭代器上運行
- ARROW-10195 - [C++] 使用 re2 新增字串結構提取核心
- ARROW-10250 - [FlightRPC][C++] 移除 FlightClientOptions 的預設建構子
- ARROW-10255 - [JS] 重新組織匯入和匯出,以更友善地支援 ESM tree-shaking
- ARROW-10297 - [Rust] parquet-read 的參數,以 JSON 格式輸出資料
- ARROW-10299 - [Rust] 支援讀取和寫入 IPC 元資料的 V5 版本
- ARROW-10305 - [R] 使用正規表示式篩選
- ARROW-10306 - [C++] 新增字串替換核心
- ARROW-10349 - [Python] 建置和發布 aarch64 wheels
- ARROW-10354 - [Rust] [DataFusion] 新增對 regex 提取的支援
- ARROW-10360 - [CI] 提高 github actions 快取版本
- ARROW-10372 - [C++][Dataset] 讀取壓縮的 CSV 檔案
- ARROW-10406 - [C++] 在單次寫入 IPC 檔案時統一字典
- ARROW-10420 - [C++] FileSystem::OpenInput{File,Stream} 應接受 MemoryPool
- ARROW-10421 - [R] Feather 讀取器/寫入器應接受 MemoryPool
- ARROW-10438 - [C++][Dataset] Partitioning::Format 處理 Null 值
- ARROW-10520 - [C++][R] 為 RecordBatch 實作 add/remove/replace
- ARROW-10570 - [R] 使用 Converter API 將 SEXP 轉換為 Array/ChunkedArray
- ARROW-10580 - [C++] 驗證時,確保 DenseUnionArray 偏移量正在增加
- ARROW-10606 - [C++][Compute] 支援 Decimal256 型別的來回轉換。
- ARROW-10655 - [C++] 新增 LRU 快取機制
- ARROW-10734 - [R] 在 Solaris 上建置和測試
- ARROW-10735 - [R] 移除 arrow-without-arrow 包裝
- ARROW-10766 - [Rust] 計算列表陣列的巢狀定義和重複
- ARROW-10797 - [C++] 研究更快的隨機生成,用於測試和基準測試
- ARROW-10816 - [Rust] [DataFusion] 實作 INTERVAL
- ARROW-10831 - [C++][Compute] 實作 quantile kernel
- ARROW-10846 - [C++] 新增非同步檔案系統操作
- ARROW-10880 - [Java] 支援使用 LZ4 壓縮 RecordBatch IPC 緩衝區
- ARROW-10882 - [Python][Dataset] 從 record batches 的 Python 迭代器寫入 dataset
- ARROW-10895 - [C++][Gandiva] 在 Gandiva 中實作 bool 到 varchar 的轉換函數
- ARROW-10903 - [Rust] 為 FixedSizeBinaryArray 實作 FromIter<Option<Vec<u8>>> 建構子
- ARROW-11022 - [Rust] [DataFusion] 升級至 tokio 1.0
- ARROW-11070 - [C++] 實作 power / 指數計算核心
- ARROW-11074 - [Rust][DataFusion] 為 Parquet 表格實作述詞下推
- ARROW-11081 - [Java] 使 IPC 選項不可變
- ARROW-11108 - [Rust] 改善 MutableBuffer 的效能
- ARROW-11141 - [Rust]: Miri 檢查
- ARROW-11149 - [Rust] create_batch_empty - 支援 List、LargeList
- ARROW-11150 - [Rust] 設定雙週 Rust 同步電話會議並更新網站
- ARROW-11154 - [CI][C++] 將 homebrew crossbow 測試從 Travis-CI 移開
- ARROW-11156 - [Rust][DataFusion] 在雜湊聯結中建立向量化雜湊
- ARROW-11174 - [C++][Dataset] 使 Expressions 可用於投影
- ARROW-11179 - [Format] 使 fb 檔案中的註解對 Rust doc 友善
- ARROW-11183 - [Rust] [Parquet] 遺失 LogicalType::TIMESTAMP_NANOS
- ARROW-11191 - [C++] 為 TaskGroup 的任務使用 FnOnce 而不是 std::function
- ARROW-11216 - [Rust] 改善 StringDictionaryBuilder 的文件
- ARROW-11220 - [Rust] DF 實作 GROUP BY 支援 Boolean
- ARROW-11222 - [Rust] [Arrow] 趕上 flatbuffers 0.8.1
- ARROW-11246 - DF - 將型別新增至 Unexpected accumulator state 訊息
- ARROW-11254 - [Rust][DataFusion] 將 SIMD 和 snmalloc 標誌新增為基準測試的選項
- ARROW-11260 - [C++][Dataset] 使用基於 schema 的 Partitioning 讀取 dataset 時,不需要字典
- ARROW-11265 - [Rust] 使 bool 不可轉換為 bytes
- ARROW-11268 - [Rust][DataFusion] 支援在 MemTable 中指定重新分區
- ARROW-11270 - [Rust] 使用 slices 進行簡單的陣列資料緩衝區存取
- ARROW-11279 - [Rust][Parquet] ArrowWriter 定義層級記憶體使用量
- ARROW-11284 - [R] 支援 dplyr verb transmute()
- ARROW-11289 - [Rust] [DataFusion] 支援 Dictionary 欄位的 GROUP BY
- ARROW-11290 - [Rust][DataFusion] 解決大量群組的雜湊聚合效能問題
- ARROW-11291 - [Rust] 為 MutableBuffer 實作 extend (來自迭代器)
- ARROW-11300 - [Rust][DataFusion] 改善大量群組中雜湊聚合的效能
- ARROW-11308 - [Rust] [Parquet] 新增 Arrow decimal 陣列寫入器
- ARROW-11309 - [Release][C#] 使用 .NET 3.1 進行驗證
- ARROW-11310 - [Rust] 實作 arrow JSON 寫入器
- ARROW-11314 - [Release][APT][Yum] 新增對驗證 arm64 套件的支援
- ARROW-11317 - [Rust] 在 CI 中測試 prettyprint 功能
- ARROW-11318 - [Rust] 支援 pretty printing 時間戳記、日期和時間型別
- ARROW-11319 - [Rust] [DataFusion] 改善測試比較以記錄批次
- ARROW-11321 - [Rust][DataFusion] 修復 DataFusion 編譯錯誤
- ARROW-11325 - [Packaging][C#] 發布 Apache.Arrow.Flight 和 Apache.Arrow.Flight.AspNetCore
- ARROW-11329 - [Rust] 不要每次變更都重建函式庫
- ARROW-11330 - [Rust][DataFusion] 新增 ExpressionVisitor 模式
- ARROW-11332 - [Rust] 在 take_string 中使用 MutableBuffer 而不是 Vec
- ARROW-11333 - [Rust] 支援建立任意巢狀的空陣列
- ARROW-11336 - [C++][Doc] 改善在 Windows 上開發的文件
- ARROW-11338 - [R] quantile 和 median 的綁定
- ARROW-11340 - [C++] 將 vcpkg.json manifest 新增至 cpp 專案根目錄
- ARROW-11343 - [DataFusion] 簡化範例
- ARROW-11346 - [C++][Compute] 實作 quantile kernel 基準測試
- ARROW-11349 - [Rust] 新增 from_iter_values 以從 T 而不是 Option<T> 建立陣列
- ARROW-11350 - [C++] 提高依賴項版本
- ARROW-11354 - [Rust] 加速日期和時間的轉換
- ARROW-11355 - [Rust] 使 Date 型別與規範對齊
- ARROW-11358 - [Rust] 為串連小陣列新增基準測試
- ARROW-11360 - [Rust] [DataFusion] 改善 CSV “找不到檔案” 錯誤訊息
- ARROW-11361 - [Rust] 從布林值的迭代器建置緩衝區
- ARROW-11362 - [Rust][DataFusion] 在 to_array_of_size 中使用迭代器 API 以改善效能
- ARROW-11365 - [Rust] [Parquet] 為文字 schema 的 v2 版本實作剖析器
- ARROW-11366 - [Rust][DataFusion] 新增常數摺疊 / 支援等式運算式中的布林值字面量
- ARROW-11367 - [C++] 實作近似 quantile 工具
- ARROW-11369 - [DataFusion] 分割 expressions.rs
- ARROW-11372 - 支援在 macOS-ARM64 上進行 RC 驗證
- ARROW-11373 - [Python][Docs] 新增在讀取 CSV 檔案時指定欄位型別的範例
- ARROW-11374 - [Python] 使舊版 pyarrow.filesystem / pyarrow.serialize 警告更明顯
- ARROW-11375 - [Rust] CI 因 clippy 中的棄用警告而失敗
- ARROW-11377 - [C++][CI] 新增 ThreadSanitizer 每夜建置
- ARROW-11383 - [Rust] 在位元運算中使用 trusted len
- ARROW-11386 - [Release] 修復發布文件更新腳本
- ARROW-11389 - [Rust] 資料型別的註解不一致
- ARROW-11395 - [DataFusion] 支援自訂最佳化
- ARROW-11401 - [Rust][DataFusion] 在 DataFrame API 中傳遞 slices 而不是 Vec
- ARROW-11404 - [Rust][DataFusion] 升級至 aHash 0.7
- ARROW-11405 - [DataFusion] 支援多個自訂節點
- ARROW-11406 - [CI][C++] 修復 Travis-CI 建置上的快取
- ARROW-11408 - 在 datafusion readme 中新增 window 支援
- ARROW-11411 - [Packaging][Linux] 停用 arm64 每夜建置
- ARROW-11414 - [Rust] 減少 Schema::try_merge 中的複製
- ARROW-11417 - [Integration] 為緩衝區壓縮新增整合測試
- ARROW-11418 - [Doc] 新增 IPC 緩衝區壓縮以支援矩陣
- ARROW-11421 - [Rust][DataFusion] 支援依 Date32 分組
- ARROW-11422 - [C#] 新增對 decimals 的支援
- ARROW-11423 - [R] value_counts 和一些 StructArray 方法
- ARROW-11425 - [C++][Compute] 改善整數的 quantile kernel
- ARROW-11426 - [Rust][DataFusion] EXTRACT 支援
- ARROW-11428 - [Rust] 新增 power kernel
- ARROW-11429 - 使字串比較核心通用於 Utf8 和 LargeUtf8
- ARROW-11430 - [Rust] 基於布林遮罩合併兩個陣列的核心
- ARROW-11431 - [Rust] [DataFusion] 新增對 SQL HAVING 子句的支援
- ARROW-11435 - 允許從外部 crate 建立 ParquetPartition
- ARROW-11436 - [Rust] 允許 Primitive::from_iter 中使用非定大小的迭代器
- ARROW-11437 - [Rust] 簡化基準測試
- ARROW-11438 - sqltorel 中不支援的 ast 節點 Value(Boolean(true))
- ARROW-11439 - [Rust] 為時間核心新增年份支援
- ARROW-11440 - [Rust] [DataFusion] 將方法新增至 CsvExec 以取得 CSV schema
- ARROW-11442 - [Rust] 公開用於解釋日期/時間的邏輯
- ARROW-11443 - [Rust] 在 CSV 寫入器中寫入 Date64 型別的日期時間資訊
- ARROW-11444 - [Rust][DataFusion] 將 slices 而不是 &Vec 傳遞給函數
- ARROW-11446 - [DataFusion] 支援內建函數中的純量
- ARROW-11447 - [Rust] 新增 shift kernel
- ARROW-11449 - [CI][R][Windows] 使用 ccache
- ARROW-11457 - [Rust] 使字串比較核心通用於 Utf8 和 LargeUtf8
- ARROW-11459 - [Rust] 允許從迭代器建置原始型別的 ListArray
- ARROW-11462 - [Developer] 從預設 DOCKER_VOLUME_PREFIX 移除不必要的引號
- ARROW-11463 - [Python] 允許從 PyArrow 配置 IpcWriterOptions 64Bit
- ARROW-11466 - [Flight][Go] 為 Go 新增 BasicAuth 和 BearerToken 處理程式
- ARROW-11467 - [R] 修復 R 文件中對 json_table_reader() 的參考
- ARROW-11468 - [R] 允許使用者將 schema 傳遞給 read_json_arrow()
- ARROW-11474 - [C++] 更新捆綁的 re2 版本
- ARROW-11476 - [Rust][DataFusion] 在 CI 中測試 TPCH 基準測試的運行
- ARROW-11477 - [R][Doc] 重新組織並改善 README 和 vignette 內容
- ARROW-11478 - [R] 考慮使 arrow.skip_nul 選項更使用者友善的方式
- ARROW-11479 - [Rust][Parquet] 新增方法以傳回 row group 的壓縮大小
- ARROW-11481 - [Rust] 更多轉換實作
- ARROW-11484 - [Rust] 為 ExecutionContext 派生 Clone
- ARROW-11486 - [Website] 使用 Jekyll 4 和 webpack 以支援 Ruby 3.0 或更高版本
- ARROW-11489 - [Rust][DataFusion] 使 DataFrame Send+Sync
- ARROW-11491 - [Rust] 支援巢狀列表和結構的 JSON schema 推斷
- ARROW-11493 - [CI][Packaging][deb][RPM] 測試已建置的套件
- ARROW-11500 - [R] 允許捆綁的建置腳本在 Solaris 上運行
- ARROW-11501 - [C++] 位元組序檢查在 Solaris 上不起作用
- ARROW-11504 - [Rust] 在 ListArray::from(ArrayDataRef) 中驗證 Datatype
- ARROW-11505 - [Rust] 在 CSV 寫入器中新增對 LargeUtf8 的支援
- ARROW-11507 - [R] GetRuntimeInfo 的綁定
- ARROW-11510 - [Python] 新增註解,說明需要 pip >= 19.0 才能取得二進位套件
- ARROW-11511 - [Rust] 將 Arc<ArrayData> 替換為 ArrayData
- ARROW-11512 - [Packaging][deb] 為 Ubuntu 21.04 新增遺失的 gRPC 依賴項
- ARROW-11513 - [R] sub/gsub 的綁定
- ARROW-11516 - [R] 允許所有 C++ 計算函數在 dplyr 中按名稱呼叫
- ARROW-11539 - [Developer][Archery] 變更 items_per_seconds 單位
- ARROW-11541 - [C++][Compute] 實作近似 quantile kernel
- ARROW-11542 - [Rust] JSON 讀取器在讀取巢狀列表時不應崩潰
- ARROW-11544 - [Rust] [DataFusion] 為 AggregateExpr 實作 as_any
- ARROW-11545 - [Rust] [DataFusion] SendableRecordBatchStream 應實作 Sync
- ARROW-11556 - [C++] 輕微的基準測試改進
- ARROW-11557 - [Rust] 將表格取消註冊新增至 DataFusion ExecutionContext
- ARROW-11559 - [C++] 改善 flatbuffers 驗證限制
- ARROW-11559 - [C++] 改善 flatbuffers 驗證限制
- ARROW-11561 - [Rust][DataFusion] 將 Send + Sync 新增至 MemTable::load
- ARROW-11563 - [Rust] 支援 Cast(Utf8, TimeStamp(Nanoseconds, None))
- ARROW-11568 - [C++][Compute] Mode kernel 在某些條件下效能不佳
- ARROW-11570 - [Rust] ScalarValue - 支援 Date64
- ARROW-11571 - [CI] 取消過時的 Github Actions 工作流程執行
- ARROW-11572 - [Rust] 新增用於單一純量除法的核心
- ARROW-11573 - [Developer][Archery] Google benchmark 現在報告運行型別
- ARROW-11574 - [Rust][DataFusion] 升級 sqlparser 至 0.8 以支援剖析所有 TPC-H 查詢
- ARROW-11575 - [Developer][Archery] 在基準測試結果中公開執行時間
- ARROW-11576 - [Rust] 移除範例中未使用的變數
- ARROW-11580 - [C++] 新增 CMake 選項 ARROW_DEPENDENCY_SOURCE=VCPKG
- ARROW-11589 - [R] 新增用於修改 Schemas 的方法
- ARROW-11590 - [C++] 將 CSV 背景產生器移至 IO 線程池
- ARROW-11591 - [C++][Compute] 雜湊聚合的原型版本
- ARROW-11592 - [Rust] 註解中的錯字
- ARROW-11594 - [Rust] 支援使用 NullArrays 進行 pretty printing
- ARROW-11597 - [Rust] 在模組中分割資料型別
- ARROW-11598 - [Rust] 將 buffer.rs 分割成更小的檔案
- ARROW-11599 - [Rust] 新增函數以建立包含所有 Null 值的陣列
- ARROW-11601 - [C++][Dataset] 在 ParquetFileFormatReaderOptions 中公開預先緩衝
- ARROW-11606 - [Rust] [DataFusion] 需要 HashAggregateExec 重建方面的指導
- ARROW-11610 - [C++] 從 sourceforge 而不是 bintray 下載 boost
- ARROW-11612 - [C++] 為 1.75.0 重建修剪後的 boost 捆綁包
- ARROW-11613 - [R] 將每夜 C++ 建置從 bintray 移開
- ARROW-11616 - [Rust][DataFusion] 為 DataFrame 公開 collect_partitioned
- ARROW-11621 - [CI][Gandiva][Linux] 修復 Crossbow 設定失敗
- ARROW-11626 - [Rust][DataFusion] 將 DataFusion 範例移至自己的專案以減少依賴項數量
- ARROW-11627 - [Rust] 型別化分配器
- ARROW-11637 - [CI][Conda] 更新每夜清理目標平台和套件列表
- ARROW-11641 - [CI] 使用 docker buildkit 的內聯快取,以在不同主機之間重複使用建置快取
- ARROW-11649 - [R] 為 R 新增對 null_fallback 的支援
- ARROW-11651 - [Rust][DataFusion] 實作 Postgres Length 函數
- ARROW-11653 - Ascii/unicode 函數
- ARROW-11655 - Pad/trim 函數
- ARROW-11656 - 剩餘的函數/修復
- ARROW-11659 - [R] 保留 group_by .drop 參數
- ARROW-11662 - [C++] 支援 decimal 資料型別的排序。
- ARROW-11664 - [Rust] 轉換為 LargeUtf8
- ARROW-11665 - [Python] 文件化 decimal128() 的 precision 和 scale 參數
- ARROW-11666 - [Integration] 為 decimal256 新增位元組序 “gold” 整合檔案
- ARROW-11667 - [Rust] 為 utf8 比較函數新增文件
- ARROW-11669 - [Rust] [DataFusion] 從 GlobalLimitExec 移除 concurrency 欄位
- ARROW-11671 - [Rust][DataFusion] 清理 Expr 的文件
- ARROW-11677 - [C++][Dataset] 編寫文件
- ARROW-11680 - [C++] 新增 folly 的 spsc 佇列的供應商版本
- ARROW-11683 - [R] 支援 dplyr::mutate()
- ARROW-11685 - [C++] future_test.cc 中的錯字
- ARROW-11688 - [Rust] utf8 和 large-utf8 之間的轉換
- ARROW-11690 - [Rust][DataFusion] 在 Expr builder 方法中避免 Expr::clone
- ARROW-11692 - [Rust][DataFusion] 改善 Optimizer 的文件
- ARROW-11693 - [C++] 新增字串長度核心
- ARROW-11700 - [R] 在 tidy eval 中國際化錯誤處理
- ARROW-11701 - [R] 實作 dplyr::relocate()
- ARROW-11703 - [R] 實作 dplyr::arrange()
- ARROW-11704 - [R] 為 datasets 連接 dplyr::mutate()
- ARROW-11707 - 支援在沒有 IO 的情況下進行 CSV schema 推斷
- ARROW-11708 - 清理 Rust 2021 linting 警告
- ARROW-11709 - [Rust][DataFusion] 將 `expressions` 和 `inputs` 移至 LogicalPlan 而不是 util 中的 helpers
- ARROW-11710 - [Rust][DataFusion] 實作 ExprRewriter 以避免樹狀結構遍歷冗餘
- ARROW-11719 - 支援記憶體表格的合併 schema
- ARROW-11721 - JSON schema 推斷應傳回 Schema 型別而不是 SchemaRef
- ARROW-11722 - 改善 FFI 中的錯誤訊息
- ARROW-11724 - [C++] 與 protobuf 3.15 的命名空間衝突
- ARROW-11725 - [Rust][DataFusion] 利用 arrow 中的新 divide_scalar kernel
- ARROW-11727 - [C++][FlightRPC] 在基準測試中使用 TDigest 來估計延遲分位數
- ARROW-11730 - [C++] 新增隱式 Future(Status) 建構子以方便使用
- ARROW-11733 - [Rust][DataFusion] 支援雜湊重新分區
- ARROW-11734 - [C++] 供應商提供的 safe-math.h 無法在 Solaris 上編譯
- ARROW-11735 - [R] 允許 Parquet 和 Arrow Dataset 作為可選組件
- ARROW-11736 - [R] 允許字串計算函數為可選
- ARROW-11737 - [C++] 為 Solaris 修補供應商提供的 xxhash
- ARROW-11738 - [Rust][DataFusion] Concat 函數
- ARROW-11740 - [C++] posix_memalign 未在 Solaris 的範圍內宣告
- ARROW-11742 - [Rust] [DataFusion] 新增 Expr::is_null 和 Expr::is_not_null 函數
- ARROW-11744 - [C++] 新增 xsimd 依賴項
- ARROW-11745 - [C++] 改善隨機資料生成的可配置性
- ARROW-11750 - [Python][Dataset] 新增對 project expressions 的支援
- ARROW-11752 - [R] 替換 testthat::expect_is() 的用法
- ARROW-11753 - [Rust][DataFusion] 為 Join Statement 新增測試:Schema 包含重複的不合格欄位名稱
- ARROW-11754 - [R] 支援 dplyr::compute()
- ARROW-11761 - [C++] 增加公共 API 測試
- ARROW-11766 - [R] 更好地處理 Linux 上遺失的壓縮編解碼器
- ARROW-11768 - [C++][CI] 使 s390x 建置成為非可選
- ARROW-11773 - [Rust] 允許 JSON 寫入器寫出 JSON 陣列以及換行符號格式化的物件
- ARROW-11774 - [R] 在 macOS 上從原始碼單行安裝
- ARROW-11775 - [Rust][DataFusion] 依賴項的功能標誌
- ARROW-11777 - [Rust] 為 StringBuilder/BinaryBuilder 實作 AsRef
- ARROW-11778 - 從 large-utf8 轉換為數值陣列
- ARROW-11779 - [Rust] 使 alloc 模組公開
- ARROW-11790 - [Rust][DataFusion] 變更計畫建構子簽名以採用 Vec<Expr> 而不是 &[Expr]
- ARROW-11794 - [Go] 新增並行安全的 ipc.FileReader.RecordAt(i)
- ARROW-11795 - [MATLAB] 將 Apache Arrow 設計文件的 MATLAB 介面遷移至 Markdown
- ARROW-11797 - [C++][Dataset] 提供 Scanner 方法以產生/訪問掃描批次
- ARROW-11798 - [Integration] 更新測試子模組
- ARROW-11799 - [Rust] 使用來自 unbound iterator 的不正確長度建立字串和二進制陣列
- ARROW-11801 - [C++] 移除 filesystem/type_fwd.h 中錯誤的標頭保護
- ARROW-11803 - [Rust] [Parquet] 支援 v2 LogicalType
- ARROW-11806 - [Rust][DataFusion] 優化索引的內部聯結建立
- ARROW-11820 - 新增 macro create_native 以建構 impl
- ARROW-11822 - 支援函數的大小寫敏感
- ARROW-11824 - [Rust] [Parquet] 在 Arrow writer 中使用邏輯類型
- ARROW-11825 - [Rust][DataFusion] 將 mimalloc 作為基準測試的選項新增
- ARROW-11833 - [C++] 針對 emscripten 供應 fast_float 錯誤 (缺少架構標誌)
- ARROW-11837 - [C++][Dataset] 將原始片段公開為 ScanTask 的屬性
- ARROW-11838 - [C++] 支援讀取具有共享字典的 IPC 資料
- ARROW-11839 - [C++] 使用 xsimd 重寫位元解壓縮最佳化
- ARROW-11842 - [Rust][Parquet] 在 get_batch_with_dict 中使用更有效率的 clone_from
- ARROW-11852 - [Documentation] 更新 CONTRIBUTING 以說明貢獻者角色
- ARROW-11856 - [C++] 移除 RecordBatchStreamWriter 中未使用的參考
- ARROW-11858 - [GLib] GLib 中的 Gandiva Filter
- ARROW-11859 - [GLib] GArrowArray:缺少 concatenate
- ARROW-11864 - [R] 記錄 arrow.int64_downcast 選項
- ARROW-11870 - [Dev] 在 venv 中自動執行 merge script
- ARROW-11876 - [Website] 更新治理頁面
- ARROW-11877 - [C++] 為 Dataset 內部結構新增初始微基準測試
- ARROW-11879 - [Rust][DataFusion] ExecutionContext::sql 應最佳化查詢計畫
- ARROW-11883 - [C++] 新增 ConcatMap、MergeMap 和 Map 的非同步可重入版本
- ARROW-11887 - [C++] 將非同步讀取新增至串流 CSV 讀取器
- ARROW-11894 - [Rust][DataFusion] 變更 flight server 範例以使用 DataFrame API
- ARROW-11895 - [Rust][DataFusion] 新增對額外欄統計資訊的支援
- ARROW-11898 - [Rust] 美觀地列印欄
- ARROW-11899 - [Java] 將壓縮編解碼器實作重構為核心/Arrow 特定部分
- ARROW-11900 - [Website] 將 Yibo 新增至 committer 清單
- ARROW-11906 - [R] 使 FeatherReader print 方法更具資訊性
- ARROW-11907 - [C++] 在 S3FileSystem 中使用我們自己的 executor
- ARROW-11910 - [Packaging][Ubuntu] 停止支援 16.04
- ARROW-11911 - [Website] 將 protobuf vs arrow 新增至 FAQ
- ARROW-11912 - [R] 從 FeatherReader$create 移除 args
- ARROW-11913 - [Rust] 提升 StringBuilder 的效能
- ARROW-11920 - [R] 將 r/libarrow 新增至 make clean
- ARROW-11921 - [R] 在 r/data-raw/codegen.R 中設定 LC_COLLATE
- ARROW-11924 - [C++] 從 GetFileInfo 提供串流輸出
- ARROW-11925 - [R] 為 arrow_dplyr_query 新增 `between` 方法
- ARROW-11927 - [Rust][DataFusion] 支援 limit 下推
- ARROW-11931 - [Go][CI] 將 CI 版本提升為 Go 1.15
- ARROW-11935 - [C++] 新增 push generator
- ARROW-11944 - [Developer] Achery 基準測試差異回歸:無法比較 jsons
- ARROW-11949 - [Ruby] 接受原始 Ruby 物件作為排序鍵和選項
- ARROW-11951 - [Rust] 移除 OffsetSize::prefix
- ARROW-11952 - [Rust] 使 ArrayData –> GenericListArray 成為 fallable 而不是 `panic!`
- ARROW-11954 - [C++] arrow/util/io_util.cc 在 Solaris 上無法編譯
- ARROW-11955 - [Rust][DataFusion] 支援 Union
- ARROW-11958 - [GLib] GArrowChunkedArray:缺少 combine
- ARROW-11959 - [Rust][DataFusion] 修正最佳化計畫的記錄
- ARROW-11962 - [Rust][DataFusion] 更新 Datafusion 文件 / readme
- ARROW-11969 - [Rust][DataFusion] 改善文件中的範例
- ARROW-11972 - [C++][Dataset] 提取 IpcFragmentScanOptions、ParquetFragmentScanOptions
- ARROW-11973 - [Rust] 布林 AND/OR 核心應遵循關於 null 值的 sql 行為
- ARROW-11977 - [Rust] 為 sort 核心新增文件範例
- ARROW-11982 - [Rust] 捐贈 Ballista 分散式運算平台
- ARROW-11984 - [C++][Gandiva] 實作 SHA1 和 SHA256 函數
- ARROW-11987 - [C++][Gandiva] 在 Gandiva 上實作三角函數
- ARROW-11988 - [C++][Gandiva] 實作 last_day 函數
- ARROW-11992 - [Rust][Parquet] 新增關於 LogicalType #9731 的 4.0 版本重新命名的升級注意事項
- ARROW-11993 - [C++] 如果 ARROW_SIMD_LEVEL=NONE,則不下載 xsimd
- ARROW-11996 - [R] 使 r/configure 在 Solaris 上成功執行
- ARROW-11999 - [Java] 支援使用使用者指定的比較器進行平行向量元素搜尋
- ARROW-12000 - [Documentation] 新增關於 struct/classes 上偏離樣式指南的註解
- ARROW-12005 - [R] 修正 configure 中的 bash 拼字錯誤
- ARROW-12017 - [R] [Documentation] 製作適當的開發 arrow 文件
- ARROW-12019 - [Rust] [Parquet] 更新 README 以支援 2.6.0
- ARROW-12020 - [Rust][DataFusion] 將 SHOW TABLES 和 SHOW COLUMNS + 部分 information_schema 支援新增至 DataFusion
- ARROW-12031 - [C++][CSV] 推斷具有小數秒的 CSV 時間戳記欄
- ARROW-12032 - [Rust] 使用 trusted_len iterator 為布林值最佳化比較核心
- ARROW-12034 - [Docs] 將 Minor PRs 形式化
- ARROW-12037 - [Rust] [DataFusion] 支援表命名空間的 catalog 和 schema
- ARROW-12038 - [Rust][DataFusion] 將 hashbrown 升級至 0.11
- ARROW-12039 - [CI][C++][Gandiva] 修正 gandiva nightly linux 建置失敗
- ARROW-12040 - [R] [CI] [C++] test-r-rstudio-r-base-3.6-opensuse15 在測試期間逾時
- ARROW-12043 - [Rust] [Parquet] 寫入固定大小的二進制陣列
- ARROW-12045 - 已移植 Parquet 程式碼的第一個 Chunk
- ARROW-12047 - [Rust] Clippy parquet
- ARROW-12048 - [Rust][DataFusion] 支援 Common Table Expressions
- ARROW-12052 - [Rust] 在 C FFI 中實作子資料
- ARROW-12056 - [C++] 建立排序 AsyncGenerator
- ARROW-12058 - [Python] 在 Expressions 上啟用算術運算
- ARROW-12068 - [Python] 停止使用 distutils
- ARROW-12069 - [C++][Gandiva]為十進制類型實作 IN 運算式
- ARROW-12070 - [GLib] 停止支援 GNU Autotools
- ARROW-12071 - [GLib] 保留 GArrowJSONReader 的輸入串流參考
- ARROW-12075 - [Rust][DataFusion] 將 CTE 新增至支援功能清單
- ARROW-12081 - [R] utf8_length 的綁定
- ARROW-12082 - [R][Dataset] 允許從檔案路徑向量建立資料集
- ARROW-12094 - [C++][R] 修正/繞過在 clang/libc++ 上建置 re2 的問題
- ARROW-12097 - [C++] 修改 BackgroundGenerator 以使其建立較少的執行緒
- ARROW-12098 - [R] 捕捉 linux 上的 cpp 建置失敗
- ARROW-12104 - 已移植程式碼的下一個 Chunk
- ARROW-12106 - [Rust][DataFusion] 支援 `SELECT * from information_schema.tables`
- ARROW-12107 - [Rust][DataFusion] 支援 `SELECT * from information_schema.columns`
- ARROW-12108 - [Rust][DataFusion] 支援 `SHOW TABLES`
- ARROW-12109 - [Rust][DataFusion] 支援 `SHOW COLUMNS`
- ARROW-12110 - [Java] 為 java 實作 ZSTD 緩衝區壓縮
- ARROW-12111 - [Java] 將 flatc 產生的檔案置於原始碼控制之下
- ARROW-12116 - [Rust] 修正或忽略 1.51 clippy lints
- ARROW-12119 - [Rust][DataFusion] 提升 to_array_of_size 的效能
- ARROW-12120 - [Rust] 產生隨機陣列和批次
- ARROW-12121 - [Rust] [Parquet] Arrow writer 基準測試
- ARROW-12123 - [Rust][DataFusion] 使用 smallvec 作為索引以獲得更好的聯結效能
- ARROW-12128 - [CI][Crossbow] 移除 (或修正) test-ubuntu-16.04-cpp 工作
- ARROW-12131 - [CI][GLib] 確保升級 MSYS2
- ARROW-12133 - [C++][Gandiva] 新增選項以停用在 llvm ir 編譯期間將 mcpu 標誌設定為主機 cpu
- ARROW-12134 - [C++] 新增 regex 字串比對核心
- ARROW-12136 - [Rust][DataFusion] 將預設 batch_size 減少至 8192
- ARROW-12139 - [Python][Packaging] 使用 vcpkg 建置 macOS wheels
- ARROW-12141 - [R] grepl 的綁定
- ARROW-12143 - [CI] R 建置應在達到某個閾值後逾時並失敗,並傾印輸出。
- ARROW-12146 - [C++][Gandiva] 實作 CONVERT_FROM(expression, ‘UTF8’, replacement char) 函數
- ARROW-12151 - [Docs] 將 Jira 组件 + 摘要慣例新增至文件
- ARROW-12153 - [Rust] [Parquet] 在寫入 Parquet 檔案後傳回檔案元數據
- ARROW-12160 - [Rust] 為 ipc::writer::StreamWriter 新增 `into_inner()` 方法
- ARROW-12164 - [Java] 使 BaseAllocator.Config 公開
- ARROW-12165 - [Rust] 在 builders 中內聯 append 函數以提升效能
- ARROW-12168 - [Go][IPC] 為 IPC 實作壓縮處理
- ARROW-12170 - [Rust][DataFusion] 引入重新分區最佳化
- ARROW-12173 - [GLib] 移除 #include <config.h>
- ARROW-12176 - parquet/low-level-api/reader-writer.cc 中有一些錯字。
- ARROW-12187 - [C++][FlightRPC] 在 Flight 基準測試中啟用壓縮
- ARROW-12188 - [Docs] 為主要 sphinx 文件切換至 pydata-sphinx-theme
- ARROW-12190 - [Rust][DataFusion] 實作分區雜湊聯結
- ARROW-12192 - [Website] 使用可下載的 URL 作為歸檔下載
- ARROW-12193 - [Dev][Release] 使用可下載的 URL 作為歸檔下載
- ARROW-12194 - [Rust] [Parquet] 更新 zstd 版本
- ARROW-12197 - [R] cast、dictionary_encode 的 dplyr 綁定
- ARROW-12200 - [R] 匯出並記錄 list_compute_functions
- ARROW-12204 - [Rust][CI] 減少整合測試中 rust 建置產物的大小
- ARROW-12206 - [Python] 修正 Table 文件字串
- ARROW-12208 - [C++] 新增在不使用 CPU 執行緒池的情況下執行非同步任務的能力
- ARROW-12210 - [Rust][DataFusion] 記錄 SHOW TABLES / SHOW COLUMNS / InformationSchema
- ARROW-12214 - [Rust][DataFusion] 為 limit 新增一些測試
- ARROW-12215 - [C++] 固定大小的二進制欄在 CSV 讀取器中不能為 null
- ARROW-12217 - [C++] 清理 cpp 範例原始碼檔案名稱
- ARROW-12222 - [Dev][Packaging] 在 crossbow 主控台報告中包含建置 URL
- ARROW-12224 - [Rust] 為 no default test 使用 stable rust,清理 CI 測試
- ARROW-12228 - [CI] 為 conda 環境建立基礎映像檔
- ARROW-12236 - [R][CI] 新增檢查以確保所有文件頁面都列在 _pkgdown.yml 中
- ARROW-12237 - [Packaging][Debian] 新增對 bulleye 的支援
- ARROW-12238 - [JS] 移除尾隨空格
- ARROW-12239 - [JS] 切換至 yarn
- ARROW-12242 - [Python][Doc] 調整 nightly 建置指示
- ARROW-12246 - [CI] 將 conda recipes 與上游 feedstock 同步
- ARROW-12248 - [C++] 允許靜態建置變更記憶體分配器
- ARROW-12249 - [R] [CI] 修正 test-r-install-local nightlies
- ARROW-12251 - [Rust] [Ballista] 將 Ballista 測試新增至 CI
- ARROW-12263 - [Dev][Packaging] 將 Crossbow 移至 Archery
- ARROW-12269 - [JS] 移至 eslint
- ARROW-12274 - [JS] 記錄如何在不建置的情況下執行測試
- ARROW-12277 - [Rust][DataFusion] Min/Max 不支援時間戳記類型
- ARROW-12278 - [Rust][DataFusion]針對 SQL TIMESTAMP 類型使用 Timestamp(Nanosecond, None)
- ARROW-12280 - [Developer] 從 merge tool 的提交訊息中移除 @-mentions
- ARROW-12281 - [JS] 移除 shx、trash 和 rimraf
- ARROW-12283 - [R] dplyr verbs 中基本類型轉換函數的綁定
- ARROW-12286 - [C++] 從 Future<AsyncGenerator<T>> 建立 AsyncGenerator
- ARROW-12287 - [C++] 建立列舉產生器
- ARROW-12288 - [C++] 建立 Scanner 介面
- ARROW-12289 - [C++] 建立基本 AsyncScanner 實作
- ARROW-12303 - [JS] 在關鍵程式碼路徑中使用 iterators 而不是 generators
- ARROW-12304 - [R] 更新 4.0 的新聞並潤飾文件
- ARROW-12305 - [JS] 基準測試資料 generate.py 假設為 python 2
- ARROW-12309 - [JS] 使 es2015 bundles 成為預設值
- ARROW-12316 - [C++] 在 macOS 上將預設記憶體分配器從 jemalloc 切換為 mimalloc
- ARROW-12317 - [Rust] JSON writer 不支援時間、日期或間隔類型
- ARROW-12320 - [CI] REPO arg 從 conda-cpp-valgrind 中遺失
- ARROW-12323 - [C++][Gandiva] 實作 castTIME(timestamp) 函數
- ARROW-12325 - [C++] [CI] Nightly gandiva 建置因編譯器無法移動傳回值而失敗
- ARROW-12326 - [C++] 避免不必要的 c-ares 偵測
- ARROW-12328 - [Rust] [Ballista] 修正程式碼格式
- ARROW-12329 - [Rust] [Ballista] 新增 README
- ARROW-12332 - [Rust] [Ballista] Scheduler 的 Api server
- ARROW-12333 - [JS] 移除 jest-environment-node-debug,且預設不從 typescript 發出
- ARROW-12335 - [Rust] [Ballista] Bump DataFusion 版本
- ARROW-12337 - 新增 DoubleEndedIterator 和 ExactSizeIterator traits
- ARROW-12351 - [CI][Ruby] 使用 ruby/setup-ruby 而不是 actions/setup-ruby
- ARROW-12352 - [CI][R][Windows] 移除 MSYS2 不必要的變通方法
- ARROW-12353 - [Packaging][deb] 將 -archive-keyring 重新命名為 -apt-source
- ARROW-12354 - [Packaging][RPM] 使用 apache.jfrog.io/artifactory/ 而不是 apache.bintray.com/
- ARROW-12356 - [Website] 更新安裝頁面指示以指向 artifactory
- ARROW-12361 - [Rust] [DataFusion] 允許使用者覆寫物理最佳化規則
- ARROW-12367 - [C++] 當 PushGenerator 被銷毀時停止產生
- ARROW-12370 - [R] power 核心的綁定
- ARROW-12374 - [CI][C++][cron] 使用 Ubuntu 20.04 而不是 16.04
- ARROW-12375 - [Release] 移除 rebase 發佈後腳本
- ARROW-12376 - [Dev] archery trigger-bot 應使用 logger.exception
- ARROW-12380 - [Rust][Ballista] 新增 scheduler ui
- ARROW-12381 - [Packaging][Python] macOS wheels 使用錯誤的套件種類建置
- ARROW-12383 - [JS] 更新 direct deps
- ARROW-12384 - [JS] 改善程式碼風格
- ARROW-12389 - [R] [Docs] 新增關於自動轉換的註解
- ARROW-12395 - [C++]: 建立 RunInSerialExecutor 基準測試
- ARROW-12396 - [Python][Docs] 釐清關於已棄用狀態的序列化文件字串
- ARROW-12397 - [Rust] [DataFusion] 簡化 readme 範例 #10038
- ARROW-12398 - [Rust] 移除 iterators 中的雙重邊界檢查
- ARROW-12400 - [Rust] 重新啟用 transform 模組測試
- ARROW-12402 - [Rust] [DataFusion] 實作 SQL 指標框架
- ARROW-12406 - [R] 修正 configure 中的 checkbashims 違規
- ARROW-12409 - [R] 從 DESCRIPTION 移除 LazyData
- ARROW-12419 - [Java] flatc 未在 mvn 中使用
- ARROW-12420 - [C++/Dataset] 無法再將 null 欄讀取為字典
- ARROW-12423 - [Docs] 主要 Readme 中的 Codecov 徽章僅適用於 Rust
- ARROW-12425 - [Rust] new_null_array 未為字典陣列分配 keys 緩衝區
- ARROW-12432 - [Rust] [DataFusion] 為 SortExec 新增指標
- ARROW-12436 - [Rust][Ballista] 將 watch 功能新增至 config backend trait
- ARROW-12467 - [C++][Gandiva] 新增對 LLVM12 的支援
- ARROW-12477 - [Release] 在 verify-release-candidate.sh 中下載 linux aarch64 miniforge
- ARROW-12485 - [C++] 在 macOS 上使用 mimalloc 作為預設記憶體分配器
- ARROW-12488 - [GLib] 搭配 GLib 2.68 或更新版本使用 g_memdup2()
- ARROW-12494 - [C++] ORC adapter 在 GCC 4.8 上編譯失敗
- PARQUET-1846 - [C++] 移除已棄用的 IO 類別和相關函數
- PARQUET-1899 - [C++] 棄用 parquet/column_reader 中的 ReadBatchSpaced
- PARQUET-1990 - [C++] 在某些情況下寫出 ConvertedType::NA
- PARQUET-1993 - [C++] 公開預先提取何時完成
- PARQUET-1998 - [C++] 實作 LZ4_RAW 壓縮
錯誤修正
- ARROW-4784 - [C++][CI] 重新啟用不穩定的 mingw 測試。
- ARROW-6818 - [Doc] 文件格式令人困惑
- ARROW-7288 - [C++][R] read_parquet() 在 Windows 上使用日文地區設定時凍結
- ARROW-7830 - [C++] Parquet 程式庫版本不會隨版本發布而變更
- ARROW-9451 - [Python] 無號整數類型將接受 pyarrow.array 中的字串值
- ARROW-9634 - [C++][Python] 在讀取先前為 Arrow 的 Parquet 檔案時,還原非 UTC 時區
- ARROW-9878 - [Python] table to_pandas self_destruct=True + split_blocks=True 無法防止記憶體加倍
- ARROW-10038 - [C++] SetCpuThreadPoolCapacity(1) 啟動 nCPUs 執行緒
- ARROW-10056 - [C++] 增加 flatbuffers max_tables 參數,以便讀取寬表格
- ARROW-10364 - [Dev][Archery] 使用 semver 2.13.0 時測試失敗
- ARROW-10370 - [Python] 與 s3fs 相關的虛假測試失敗
- ARROW-10403 - [C++] 為字典類型實作 unique 核心
- ARROW-10405 - [C++] IsIn 核心應能夠在字串中查找字典
- ARROW-10457 - [CI] 修正 Spark branch-3.0 整合測試
- ARROW-10489 - [C++] 無法使用 intel 編譯器設定或 make
- ARROW-10514 - [C++][Parquet] parquet-reader 輸出模式中的資料不一致
- ARROW-10953 - [R] 建立具有 schema 的 Table 時進行驗證
- ARROW-11066 - [Java] flight AddWritableBuffer 中是否有錯誤
- ARROW-11066 - [Java] flight AddWritableBuffer 中是否有錯誤
- ARROW-11066 - [Java] flight AddWritableBuffer 中是否有錯誤
- ARROW-11066 - [Java] flight AddWritableBuffer 中是否有錯誤
- ARROW-11066 - [Java] flight AddWritableBuffer 中是否有錯誤
- ARROW-11134 - [C++][CI] Travis-CI 上的 ARM64 工作未執行測試
- ARROW-11147 - [Python][CI] Parquet 測試在 Dask master 的 nightly 建置中失敗
- ARROW-11180 - [Developer] cmake-format pre-commit hook 未執行
- ARROW-11192 - [Documentation] 描述開啟 Visual Studio 以使其繼承可運作的環境
- ARROW-11223 - [Java] BaseVariableWidthVector/BaseLargeVariableWidthVector setNull 和 getBufferSizeFor 有錯誤
- ARROW-11235 - [Python] 非預設區域內的 S3 測試失敗
- ARROW-11239 - [Rust] array::transform::tests::test_struct 失敗
- ARROW-11269 - [Rust] 無法讀取 Parquet 檔案,因為欄衍生和嵌入式 schema 不符
- ARROW-11277 - [C++] 修正 macOS 10.11 上資料集運算式中的編譯錯誤
- ARROW-11299 - [Python] python 中的建置警告
- ARROW-11303 - [Release][C++] 在 windows 驗證腳本中啟用 mimalloc
- ARROW-11305 - [Rust]: parquet-rowcount 二進制檔案嘗試將自身作為 parquet 檔案開啟
- ARROW-11311 - [Rust] unset_bit 正在切換位元,而不是取消設定它們
- ARROW-11313 - [Rust] iterators 的大小提示不正確
- ARROW-11315 - [Packaging][APT][arm64] 新增遺失的 gir1.2 檔案
- ARROW-11320 - [C++] 建立臨時目錄時發生虛假測試失敗
- ARROW-11322 - [Rust] Arrow `memory` 設定為私有是破壞性的 API 變更
- ARROW-11323 - [Rust][DataFusion] ComputeError(“concat requires input of at least one array”)) 與具有 ORDER BY 或 GROUP BY 的查詢,這些查詢未傳回任何結果
- ARROW-11328 - [R] 從資料集中收集零欄會傳回整個資料集
- ARROW-11334 - [Python][CI] Nightly pandas 建置因 pandas 內部變更而失敗
- ARROW-11337 - [C++] 使用 ThreadSanitizer 的編譯錯誤
- ARROW-11357 - [Rust] take primitive 實作不健全
- ARROW-11376 - [C++] 啟用 Thread Sanitizer 時 ThreadedTaskGroup 失敗
- ARROW-11379 - [C++][Dataset] 讀取在時間戳記分割區欄位上篩選的資料集時崩潰
- ARROW-11387 - [Rust] 具有 simd 功能的 Arrow 3.0.0 版本在沒有 feature=avx512 的情況下無法編譯。
- ARROW-11391 - [C++] HdfsOutputStream::Write 不安全地截斷超過 INT32_MAX 的整數
- ARROW-11394 - [Rust] Slice + Concat 對於 structs 不正確
- ARROW-11400 - [Python] Pickled ParquetFileFragment 在 pyarrow 2.0 中具有字典類型的無效 partition_expresion
- ARROW-11403 - [Developer] archery benchmark list:unexpected keyword ‘benchmark_filter’
- ARROW-11412 - [Python] 運算式無法與邏輯布林運算子 (and、or、not) 搭配運作
- ARROW-11412 - [Python] 運算式無法與邏輯布林運算子 (and、or、not) 搭配運作
- ARROW-11427 - [C++] 即使 OS 不支援,Arrow 仍使用 AVX512 指令
- ARROW-11448 - [C++] tdigest 在 Windows 上使用 Visual Studio 建置失敗
- ARROW-11451 - [C++] 修正 gcc-4.8 建置錯誤
- ARROW-11452 - [Rust] Parquet 讀取器無法讀取 struct 欄與 struct 成員欄具有相同名稱的檔案
- ARROW-11461 - [Flight][Go] GetSchema 無法與 Java Flight Server 搭配運作
- ARROW-11464 - [Python] pyarrow.parquet.read_pandas 不符合其文件
- ARROW-11470 - [C++] 在 ComputeRowMajorStrides、ComputeColumnMajorStrides 和 CheckTensorStridesValidity 中的整數乘法運算發生溢位
- ARROW-11472 - [Python][CI] Kartothek 整合建置因 numpy 1.20 而失敗
- ARROW-11472 - [Python][CI] Kartothek 整合建置因 numpy 1.20 而失敗
- ARROW-11480 - [Python] 使用 INT96 欄的日期篩選讀取 parquet 時發生區段錯誤
- ARROW-11483 - [Java][C++][Integration] C++ 整合測試建立與 Java 不相容的 JSON 檔案
- ARROW-11488 - [Rust]: StructBuilder 的 Drop impl 洩漏記憶體
- ARROW-11490 - [C++] BM_ArrowBinaryDict/EncodeLowLevel 不具決定性
- ARROW-11494 - [Rust] 修正 take bench
- ARROW-11497 - [Python] list 的 pyarrow parquet writer 不符合 Apache Parquet 規範
- ARROW-11538 - [Python] 使用 Timestamp 篩選讀取 Parquet 資料集時發生 Segfault
- ARROW-11547 - [Packaging][Conda][Drone] Nightly 建置因未定義變數錯誤而失敗
- ARROW-11548 - [C++] RandomArrayGenerator::List 大小不符
- ARROW-11551 - [C++][Gandiva] castTIMESTAMP(utf8) 函數對於無效輸入未顯示錯誤
- ARROW-11560 - [FlightRPC][C++][Python] 中斷 Flight server 會導致中止
- ARROW-11567 - [C++][Compute] Variance 核心有精確度問題
- ARROW-11577 - [Rust] Concat 核心在字串陣列切片上發生 panic
- ARROW-11582 - [R] write_dataset “format” 引數預設值和驗證可以更好
- ARROW-11586 - [Rust] [Datafusion] 無效的 SQL 語法有時會發生 panic
- ARROW-11595 - [C++][NIGHTLY:test-conda-cpp-valgrind] GenerateBitsUnrolled 在未初始化的輸入上觸發 valgrind
- ARROW-11596 - [Python][Dataset] 當使用 Python executor 執行掃描任務時發生 SIGSEGV
- ARROW-11603 - [Rust] 修復 clippy 錯誤
- ARROW-11607 - [Python] 從 parquet 讀取具有列表值的表格時發生錯誤
- ARROW-11614 - [C++][Gandiva] 修復 round() 邏輯以在參數為零時返回正零
- ARROW-11617 - [C++][Gandiva] 修復 gandiva 中巢狀 if-else 的最佳化
- ARROW-11620 - [Rust] [DataFusion] TableProvider 對 Box 和 Arc 的使用不一致
- ARROW-11630 - [Rust] 為排序核心引入 partial_sort 和 limit 選項
- ARROW-11632 - [Rust] csv::Reader 沒有將 schema metadata 傳播到 RecordBatches
- ARROW-11639 - [C++][Gandiva] 修復 Ubuntu nightly build 中的 signbit 編譯問題
- ARROW-11642 - [C++] 用於 Windows 中 JVM 偵測的不正確前處理器指令
- ARROW-11657 - [R] 使用指定的 .drop 進行 group_by 時發生錯誤
- ARROW-11658 - [R] 處理 group_by 內部的 mutate/rename
- ARROW-11663 - [DataFusion] Master 無法編譯
- ARROW-11668 - [C++] FutureStessTest.TryAddCallback 中偶發的 UBSAN 錯誤
- ARROW-11672 - [R] 修復 R 3.3 上的字串函數測試失敗
- ARROW-11681 - [Rust] IPC writers 不應在解構子中 unwrapping
- ARROW-11686 - [C++] flight-test-integration-client 有時會因 SIGABRT 而退出,但未印出堆疊追蹤
- ARROW-11687 - [Rust][DataFusion] RepartitionExec 掛起
- ARROW-11694 - [C++] Array Take 可能會對不存在的 null bitmap 進行解引用
- ARROW-11695 - [C++][FlightRPC][Packaging] 更新對近期 gRPC 版本禁用 TLS 伺服器驗證的支援
- ARROW-11717 - [Integration] 使用 auth:basic_proto 時,Flight integration 間歇性(但頻繁)失敗
- ARROW-11718 - [Rust] IPC writers 不應在 drop 時隱式完成
- ARROW-11741 - [C++] Decimal cast 在 big-endian 上失敗
- ARROW-11743 - [R] 使用 pkgdown 新發現的功能自動連結 Jira
- ARROW-11746 - [Developer][Archery] 修復 prefer real time check
- ARROW-11756 - [R] 將 partition 作為 schema 傳遞會導致 segfault
- ARROW-11758 - [C++][Compute] Summation kernel 捨入誤差
- ARROW-11767 - [C++] Scalar::hash 可能會因 null scalars 發生 segfault
- ARROW-11771 - [Developer][Archery] 移動 benchmark 測試(以便 CI 執行它們)
- ARROW-11784 - [Rust][DataFusion] CoalesceBatchesStream 不遵守 Stream 介面
- ARROW-11785 - [R] 當使用不支援的表達式過濾 Table 時,回退失敗
- ARROW-11786 - [C++] CMake 輸出過於冗雜
- ARROW-11788 - [Java] 附加空的 List Vector 會產生 NPE
- ARROW-11791 - [Rust][DataFusion] RepartitionExec 阻塞
- ARROW-11802 - [Rust][DataFusion] crossbeam channel 和 async tasks 的混合使用可能會導致死鎖
- ARROW-11819 - [Rust] 新增文件連結
- ARROW-11821 - [Rust] 編輯 Rust README
- ARROW-11830 - [C++] gRPC 編譯測試每次都會發生
- ARROW-11832 - [R] 處理額外巢狀 struct column 的轉換
- ARROW-11836 - Target libarrow_bundled_dependencies.a 尚未建立但已被要求。
- ARROW-11845 - [Rust] 如果陣列包含負值,Date32Array 的 Debug 實作會發生 panic
- ARROW-11850 - [GLib] 缺少 GARROW_VERSION_0_16 巨集
- ARROW-11855 - [C++] [Python] 將 chunked struct array 轉換為 to_pandas 時發生記憶體洩漏
- ARROW-11857 - [Python] 當將新的 Dataset API 與 Pandas 搭配使用時,資源暫時不可用
- ARROW-11860 - [Rust] [DataFusion] 新增 DataFusion 標誌
- ARROW-11866 - [C++] Arrow Flight SetShutdownOnSignals 導致 gRPC 中潛在的互斥鎖死鎖
- ARROW-11872 - [C++] GPU buffers 的陣列驗證因不正確的驗證檢查而失敗
- ARROW-11880 - [R] 正確處理空的或 NULL 的 transmute() 參數
- ARROW-11881 - [Rust][DataFusion] 修復 Clippy Lint
- ARROW-11896 - [Rust] 在 AMD64 Debian 10 Rust stable test workspace 中 CI 掛起/失敗
- ARROW-11904 - [C++] arrow-csv-test 結束時的 “pure virtual method called” 崩潰
- ARROW-11905 - [C++] SIMD info 在 MacOS 上始終返回 none
- ARROW-11914 - [R] [CI] r-sanitizer nightly 已損壞
- ARROW-11918 - [R] [Documentation] 文件清理
- ARROW-11923 - [CI] 更新 dask dev integration tests 的分支名稱
- ARROW-11937 - [C++] 如果 GZip codec 被刷新兩次,則會掛起
- ARROW-11941 - [Dev] “DEBUG=1 merge_arrow_pr.py” 更新 Jira issue
- ARROW-11942 - [C++] 如果任務提交速度過快,線程池可能無法啟動新線程
- ARROW-11945 - [R] filter 不接受負數作為有效值
- ARROW-11956 - [C++] 修復靜態函式庫的系統 re2 相依性偵測
- ARROW-11965 - [R][Docs] 修復 R dev 文件中的 install.packages 命令
- ARROW-11970 - [C++][CI] 修復 Valgrind 失敗
- ARROW-11971 - [Packaging] 由於行尾符號,Vcpkg patch 無法在 windows 上應用
- ARROW-11975 - [CI][GLib] 更新 gcc 失敗
- ARROW-11976 - [C++] TestThreadPool.SetCapacity 中偶發的 TSAN 錯誤
- ARROW-11983 - [Python] 從 ThreadPool 內呼叫 pyarrow from_pandas 時發生 ImportError
- ARROW-11997 - [Python] concat_tables 使 python 直譯器崩潰
- ARROW-12003 - [R] 修復關於未定義全域函數 group_by_drop_default 的 NOTE
- ARROW-12006 - [Java] 修復 checkstyle config 以在 Windows 上運作
- ARROW-12012 - [Java] [JDBC] BinaryConsumer 無法正確重新分配記憶體
- ARROW-12013 - [C++][FlightRPC] 無法偵測 gRPC 版本
- ARROW-12015 - [Rust] [DataFusion] 整合 doc-comment crate 以確保 readme 範例保持有效
- ARROW-12028 - [Rust][DataFusion] 不支援 Timestamp(Millisecond, None) 的 GROUP BY
- ARROW-12029 - 從 FeatherReader$create v2 移除 args
- ARROW-12033 - [Docs] 修復 developers/benchmarks.html 中的連結
- ARROW-12041 - [C++] 修復 tensor IPC messages 的字串描述
- ARROW-12051 - [GLib] test_add_column_type(TestCSVReader::#read::options) 中間歇性的 CI 失敗
- ARROW-12057 - [Python] 移除 pandas’ Block subclasses 的直接使用
- ARROW-12065 - [C++][Python] 讀取 JSON 檔案時發生 Segfault
- ARROW-12067 - [Python][Doc] 記錄 pyarrow_(un)wrap_scalar
- ARROW-12073 - [R] 修復關於 ‘X_____X’ 的 R CMD check NOTE
- ARROW-12076 - [Rust] 修復建置
- ARROW-12077 - [C++] ListArray::FromArrays 中的越界寫入
- ARROW-12086 - [C++] offline builds 沒有使用 ARROW_$LIBRARY_URL 搜尋套件
- ARROW-12088 - [Python][C++] 關於 pyarrow.dataset.RecordBatchIterator 中 offsetof 的警告
- ARROW-12089 - [Doc] 修復建置 Sphinx 文件時的警告
- ARROW-12100 - [C#] 無法使用 PyArrow 來回傳輸 record batch
- ARROW-12103 - [C++] Parquet reader 中的 “load of misaligned address”
- ARROW-12112 - [CI] 裝置上沒有剩餘空間 - AMD64 Conda Integration test
- ARROW-12112 - [CI] 裝置上沒有剩餘空間 - AMD64 Conda Integration test
- ARROW-12113 - [R] 修復來自 check_select_helpers() 的 rlang 棄用警告
- ARROW-12130 - [C++] 如果 -DARROW_SIMD_LEVEL=NONE,Arm64 建置失敗
- ARROW-12138 - [Go][IPC]
- ARROW-12140 - [C++][CI] Grouper 測試中的 Valgrind 失敗
- ARROW-12145 - [Developer][Archery] Flaky test: test_static_runner_from_json
- ARROW-12149 - [Dev] Archery benchmark 測試案例失敗
- ARROW-12154 - [C++][Gandiva] 修復某些 OS/CPU 組合中的 gandiva 崩潰
- ARROW-12155 - [R] 要求 Table columns 具有相同長度
- ARROW-12161 - [C++][R] 從 datasets 同步執行時,Async streaming CSV reader 死鎖
- ARROW-12161 - [C++][R] 從 datasets 同步執行時,Async streaming CSV reader 死鎖
- ARROW-12169 - [C++] 修復在檔案結尾使用空 stream 讀取壓縮檔案
- ARROW-12171 - [Rust] Clippy 錯誤
- ARROW-12172 - [Python][Packaging] 在 macOS wheel 建置中,將 python 版本作為 setuptools pretend version 傳遞
- ARROW-12178 - [CI] 更新 ubuntu images 中的 setuptools
- ARROW-12186 - [Rust][DataFusion] 修復 regexp_match 測試
- ARROW-12209 - [JS] @apache-arrow/ts 或 apache-arrow 無法編譯
- ARROW-12220 - [C++][CI] Thread sanitizer 失敗
- ARROW-12226 - [C++] s3fs_test.cc 中的 ASAN 錯誤
- ARROW-12227 - [R] 修復 RE2 和 median nightly build 失敗
- ARROW-12235 - [Rust][DataFusion] 當與多個小 partition 一起使用時,LIMIT 返回不正確的結果
- ARROW-12241 - [Python] 平行 csv reader 取消測試會終止 pytest
- ARROW-12250 - [Rust] 失敗的測試 arrow::arrow_writer::tests::fixed_size_binary_single_column
- ARROW-12254 - [Rust][DataFusion] Limit 在達到限制後仍持續輪詢輸入
- ARROW-12258 - [R] 永遠不要對 collect(as_data_frame = FALSE) 執行 as.data.frame()
- ARROW-12262 - [Doc][C++][Python] 文件在 S3 和 Flight 被禁用的情況下建置和推送
- ARROW-12267 - [Rust] JSON writer 不支援 timestamp 類型
- ARROW-12273 - [JS] Coveralls 不再運作
- ARROW-12279 - [Rust][DataFusion] 為 hash join 中的 null 處理新增測試 (ARROW-12266)
- ARROW-12294 - [Rust] 修復沒有餘數的 Boolean Kleene Kernels
- ARROW-12299 - [Python] pq.write_to_dataset 無法識別 S3FileSystem
- ARROW-12300 - [C++] ArrowCUDA 在僅使用 CUDA Driver API 時錯誤地連結到 CUDA Runtime
- ARROW-12313 - [Rust] [Ballista] Benchmark 文件已過時
- ARROW-12314 - [Python] use_legacy_dataset=False 的 pq.read_pandas 不接受 columns 作為 set (kartothek 整合失敗)
- ARROW-12327 - [Dev] 當透過 comment bot 提交 crossbow jobs 時,使用 pull request 的 head remote
- ARROW-12330 - [Developer] 還原 Archery benchmark 的 counters column 中的值
- ARROW-12334 - [Rust] [Ballista] Aggregate queries 產生不正確的結果
- ARROW-12342 - [Packaging] 修復 crossbow templates 中用於提交 nightly builds 的製表符
- ARROW-12357 - [Archery] 執行 “crossbow submit …” 時發生錯誤
- ARROW-12377 - [Doc][Java] Java doc 建置已損壞
- ARROW-12379 - [C++][CI] SerialExecutor 中的 Thread sanitizer 失敗
- ARROW-12382 - [C++][CI] Conda nightly jobs 由於未捆綁 xsimd 而失敗
- ARROW-12385 - [R] [CI] 修復 CI 中的 cran picking
- ARROW-12390 - [Rust] Inline Inline from_trusted_len_iter, try_from_trusted_len_iter, extend_from_slice
- ARROW-12401 - [R] 修復 dataset___Scanner__TakeRows 周圍的 guard
- ARROW-12405 - [Packaging] 修復 apt artifact patterns 以及從 travis 上傳 artifact
- ARROW-12408 - [R] 刪除 Scan() bindings
- ARROW-12421 - [Rust] [DataFusion] topk_query 測試在 master 中失敗
- ARROW-12421 - [Rust] [DataFusion] topk_query 測試在 master 中失敗
- ARROW-12429 - [C++] MergedGeneratorTestFixture 實例化不正確
- ARROW-12433 - [Rust] 由於新的 flatbuffer 版本引入 const generics,建置失敗
- ARROW-12437 - [Rust] [Ballista] Ballista plans 不得包含 RepartitionExec
- ARROW-12440 - [Release] 各種 packaging、release script 和 release verification script 的修復
- ARROW-12466 - [Python] 將陣列與 None 比較會引發錯誤
- ARROW-12475 - [C++] thread_pool_benchmark.cc 中的建置警告
- ARROW-12487 - [C++][Dataset] 如果掃描期間發生錯誤,ScanBatches() 會掛起
- ARROW-12495 - [C++][Python] 當 NumPy 陣列可寫入時,NumPy buffer 將 is_mutable_ 設定為 true,但未設定 mutable_data_
- PARQUET-1655 - [C++] 用於 min/max 統計資訊的 Decimal 比較不正確
- PARQUET-2008 - [C++] 寫入 RowGroup::total_byte_size 的資訊錯誤