Apache Arrow 2.0.0 (2020 年 10 月 19 日)
這是一個主要發佈版本,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 81 位不同貢獻者的 511 次提交。
$ git shortlog -sn apache-arrow-1.0.0..apache-arrow-2.0.0
68 Jorge C. Leitao
48 Antoine Pitrou
40 Krisztián Szűcs
34 alamb
33 Neal Richardson
30 Andy Grove
25 Benjamin Kietzman
25 Joris Van den Bossche
19 Sutou Kouhei
13 Uwe L. Korn
12 Micah Kornfield
10 Frank Du
10 Jörn Horstmann
9 Neville Dipale
9 Romain Francois
9 arw2019
8 Yibo Cai
8 liyafan82
7 Sagnik Chakraborty
6 David Li
5 Kazuaki Ishizaki
5 Mahmut Bulut
4 Mingyu Zhong
4 fredgan
3 Bryan Cutler
3 wqc200
2 Daniel Russo
2 Diana Clarke
2 James Duong
2 Kenta Murata
2 Patrick Woody
2 Projjal Chanda
2 naman1996
2 ptaylor
2 tianchen
1 Adam Szmigin
1 Ali McMaster
1 Andrew Stevenson
1 Ben Kimock
1 Brian Dunlay
1 Christoph Schulze
1 Derek Marsh
1 Dominik Moritz
1 Eric Erhardt
1 Ezra
1 Fernando José Herrera Elizalde
1 FredGan
1 Hongze Zhang
1 Jim Klucar
1 Josiah
1 Kyle Strand
1 Laurent Goujon
1 Lawrence Chan
1 Mark Rushakoff
1 Matt Corley
1 Matthew Topol
1 Matthias
1 Morgan Cassels
1 Ofek
1 Patrick Pai
1 Paul
1 PoojaChandak
1 Prashanth Govindarajan
1 Pratik raj
1 Revital Sur
1 Ruan Pearce-Authers
1 Ryan Murray
1 Simon Bertron
1 Steve Suh
1 Tanguy Fautre
1 Tobias Mayer
1 Troels Nielsen
1 Vivian Kong
1 Wes McKinney
1 Xavier Lange
1 Yordan Pavlov
1 kanga333
1 karldw
1 mubai
1 offthewall123
1 zanmato1984
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到儲存庫中。
$ git shortlog -csn apache-arrow-1.0.0..apache-arrow-2.0.0
127 Andy Grove
92 Antoine Pitrou
56 Krisztián Szűcs
51 Neal Richardson
44 Sutou Kouhei
18 Joris Van den Bossche
18 Micah Kornfield
17 Benjamin Kietzman
17 Wes McKinney
16 Neville Dipale
12 Jorge C. Leitao
10 Praveen
7 Paddy Horan
4 David Li
4 Eric Erhardt
4 Sebastien Binet
4 Uwe L. Korn
4 liyafan82
3 GitHub
1 Bryan Cutler
1 Chao Sun
1 tianchen
變更日誌
Apache Arrow 2.0.0 (2020-10-19)
錯誤修正
- ARROW-2367 - [Python] ListArray 在處理大於 kMaximumCapacity 的尺寸時發生問題
- ARROW-4189 - [CI] [Rust] 修正損壞的 cargo 覆蓋率
- ARROW-4917 - [C++] orc_ep 在 cpp-alpine docker 中失敗
- ARROW-5578 - [C++][Flight] Flight 無法在 Alpine Linux 上直接建置
- ARROW-7226 - [JSON][Python] Json 加載器在文件中的範例上失敗。
- ARROW-7384 - [網站] 修正 Google 回報的搜尋索引警告
- ARROW-7517 - [C++] Builder 不遵守初始化期間提供的字典類型
- ARROW-7663 - [Python] from_pandas 在某些情況下給出 TypeError 而不是 ArrowTypeError
- ARROW-7903 - [Rust] [DataFusion] 為 DataFusion 升級 SQLParser 依賴項
- ARROW-7957 - [Python] ParquetDataset 無法將 HadoopFileSystem 作為檔案系統
- ARROW-8265 - [Rust] [DataFusion] Table API collect() 不應要求 context
- ARROW-8394 - [JS] 使用 es2015-esm 套件時,arrow d.ts 檔案的 Typescript 編譯器錯誤
- ARROW-8735 - [Rust] [Parquet] Parquet crate 無法在 Arm 架構上編譯
- ARROW-8749 - [C++] IpcFormatWriter 寫入具有錯誤 ID 的字典批次
- ARROW-8773 - [Python] pyarrow schema.empty_table() 不保留欄位的可空性
- ARROW-9028 - [R] 應該能夠轉換空表格
- ARROW-9096 - [Python] 使用整數值的物件 dtype 欄標籤進行 Pandas 往返:無法理解資料類型“integer”
- ARROW-9177 - [C++][Parquet] 跨實作 LZ4 Parquet 壓縮相容性的追蹤問題
- ARROW-9414 - [C++] apt 套件包含 S3 介面的標頭,但沒有支援
- ARROW-9462 - [Go] 第一個 Record arrjson writer 之後的縮排遺失
- ARROW-9463 - [Go] writer 在 TestReadWrite 中被關閉兩次
- ARROW-9490 - [Python] 特定 numpy 純量集合的 pyarrow 陣列建立失敗
- ARROW-9495 - [C++] 相等性斷言無法正確處理 Inf / -Inf
- ARROW-9520 - [Rust] [DataFusion] 無法為聚合表達式建立別名
- ARROW-9528 - [Python] 從 datetime 轉換為 pyarrow 時,尊重 tzinfo 資訊
- ARROW-9532 - [Python] 在 macOS 上為 MacPorts 建置 pyarrow
- ARROW-9535 - [Python] 從 conda recipe 中移除符號連結修正
- ARROW-9536 - PlasmaOutOfMemoryException.java 中缺少參數
- ARROW-9541 - [C++] 建置靜態程式庫時,CMakeLists 要求 UTF8PROC_STATIC
- ARROW-9544 - [R] write_parquet 的 version 參數無法運作
- ARROW-9546 - [Python] 清理 Pandas Metadata Conversion 測試
- ARROW-9548 - [Go] tmp 目錄中的測試輸出檔案未正確移除
- ARROW-9549 - [Rust] Parquet 不再建置
- ARROW-9554 - [Java] FixedWidthInPlaceVectorSorter 有時產生錯誤結果
- ARROW-9556 - [Python][C++] UnionArray 與空值發生區段錯誤
- ARROW-9560 - [封裝] conda recipes 因為缺少 conda-forge.yml 而失敗
- ARROW-9569 - [CI][R] 修正 msys2 金鑰變更的 rtools35 建置
- ARROW-9570 - [Doc] 清理 sphinx 側邊欄
- ARROW-9573 - [Python] 分割欄位以 '_' 開頭時,Parquet 無法載入
- ARROW-9574 - [R] CRAN 1.0.0 發佈版本的清理
- ARROW-9575 - [R] CRAN 上的 gcc-UBSAN 失敗
- ARROW-9577 - [Python][C++] pyarrow 1.0.0 中 Debian 上的 posix_madvise 錯誤
- ARROW-9583 - [Rust] 偏移量在算術和布林運算核心中處理不當
- ARROW-9588 - [C++] clang/win: ParquetInvalidOrCorruptedFileException 的複製建構子未正確觸發
- ARROW-9589 - [C++/R] arrow_exports.h 包含宣告為 class 的結構
- ARROW-9592 - [CI] 在呼叫 brew bundle 之前更新 homebrew
- ARROW-9596 - [CI][Crossbow] 再次修正 homebrew-cpp,又一次
- ARROW-9597 - [C++] compute::FunctionRegistry 中的 AddAlias 應同步
- ARROW-9598 - [C++][Parquet] 間隔定義層級未正確指派。
- ARROW-9599 - [CI] Appveyor 工具鏈建置失敗,因為 CMake 偵測到不同的 C 和 C++ 編譯器
- ARROW-9600 - [Rust] 當用作 crate 依賴項時,arrow-flight 會在每次 cargo build 叫用時重建
- ARROW-9600 - [Rust] 當用作 crate 依賴項時,arrow-flight 會在每次 cargo build 叫用時重建
- ARROW-9602 - [R] 改善 Linux 建置中的 cmake 偵測
- ARROW-9603 - [C++][Parquet] Write Arrow 依賴於巢狀類型未指定的行為
- ARROW-9606 - [C++][Dataset] in 表達式無法與 >1 個分割層級一起運作
- ARROW-9609 - [C++] CSV 資料集不實例化虛擬欄位
- ARROW-9621 - [Python] test_move_file() 在 fsspec 0.8.0 中失敗
- ARROW-9622 - [Java] 如果 structvector 有一個帶有空值的子 UnionVector,則 ComplexCopier 失敗
- ARROW-9628 - [Rust] Clippy PR 測試在 Rust / AMD64 MacOS 上間歇性失敗
- ARROW-9629 - [Python] Kartothek 整合測試因缺少 freezegun 模組而失敗
- ARROW-9631 - [Rust] Arrow crate 不應依賴 flight
- ARROW-9631 - [Rust] Arrow crate 不應依賴 flight
- ARROW-9642 - [C++] 讓 MakeBuilder 參考 DictionaryType 的 index_type 以決定索引的起始位元寬度
- ARROW-9643 - [C++] 在 haswell cpu 上發生非法指令
- ARROW-9644 - [C++][Dataset] 不要在基本路徑中檢查 ignore_prefixes
- ARROW-9652 - [Rust][DataFusion] 嘗試從 CSV 中選取 * 時發生 Panic (在 '索引超出邊界:長度為 0 但索引為 0' 時 panic)
- ARROW-9653 - [Rust][DataFusion] 多欄位 Group by:無效的引數錯誤
- ARROW-9659 - [C++] RecordBatchStreamReader 在 CUDA 裝置緩衝區上拋出異常
- ARROW-9660 - [C++] IPC - 映射中的字典
- ARROW-9666 - [Python][wheel][Windows] ARROW-9412 造成的程式庫遺失失敗
- ARROW-9670 - [C++][FlightRPC] Close() 正在進行讀取的 DoPut 時鎖定用戶端
- ARROW-9684 - [C++] 修正無效 IPC / Parquet 輸入上的未定義行為 (OSS-Fuzz)
- ARROW-9692 - [Python] distutils 匯入警告
- ARROW-9693 - [CI][Docs] 夜間文件建置失敗
- ARROW-9696 - [Rust] [Datafusion] 巢狀二元表達式損壞
- ARROW-9698 - [C++] 還原 “將 -NDEBUG 旗標新增至 arrow.pc”
- ARROW-9700 - [Python] create_library_symlinks 在 macos 中無法運作
- ARROW-9712 - [Rust] [DataFusion] ParquetScanExec 在錯誤時 panic
- ARROW-9714 - [Rust] [DataFusion] TypeCoercionRule 未針對 Limit 或 Sort 實作
- ARROW-9716 - [Rust] [DataFusion] MergeExec 應具有並行限制
- ARROW-9726 - [Rust] [DataFusion] ParquetScanExec 過早啟動執行緒
- ARROW-9727 - [C++] 修正無效 IPC 輸入時的崩潰 (OSS-Fuzz)
- ARROW-9729 - [Java] Error Prone 導致其他註解處理器無法與 Eclipse 搭配使用
- ARROW-9733 - [Rust][DataFusion] 聚合 COUNT/MIN/MAX 無法在 VARCHAR 欄位上運作
- ARROW-9734 - [Rust] [DataFusion] TableProvider.scan 過早執行分割區
- ARROW-9741 - [Rust] [DataFusion] TPC-H 查詢 1 結果集中計數不正確
- ARROW-9743 - [R] 清理 open_dataset 中的路徑
- ARROW-9744 - [Python] 無法在 aarch64 上安裝
- ARROW-9764 - [CI][Java] 推送錯誤的 Docker 映像檔
- ARROW-9768 - [Python] Pyarrow 允許將 datetime 物件不安全地轉換為時間戳記奈秒
- ARROW-9768 - [Python] Pyarrow 允許將 datetime 物件不安全地轉換為時間戳記奈秒
- ARROW-9778 - [Rust] [DataFusion] 邏輯和物理綱要的可空性在 20 個端對端測試中的 8 個不符
- ARROW-9783 - [Rust] [DataFusion] 邏輯聚合表達式需要明確的資料類型
- ARROW-9785 - [Python] pyarrow/tests/test_fs.py::test_s3_options 太慢
- ARROW-9789 - [C++] 請勿平行安裝 jemalloc
- ARROW-9790 - [Rust] [Parquet] 如果批次正好落在列組邊界上,ParquetFileArrowReader 無法解碼所有頁面
- ARROW-9790 - [Rust] [Parquet] 如果批次正好落在列組邊界上,ParquetFileArrowReader 無法解碼所有頁面
- ARROW-9793 - [Rust] [DataFusion] 測試在 master 中失敗
- ARROW-9797 - [Rust] AMD64 Conda 整合測試對於 Master 分支失敗
- ARROW-9799 - [Rust] [DataFusion] 物理二元表達式 get_type 方法的實作不正確
- ARROW-9800 - [Rust] [Parquet] 在寫入欄位時,將 “min” 和 “max” 寫入標準輸出
- ARROW-9809 - [Rust] [DataFusion] 邏輯綱要 = 物理綱要不成立
- ARROW-9814 - [Python] test_parquet.py::test_read_partitioned_directory_s3fs 中的崩潰
- ARROW-9815 - [Rust] [DataFusion] 具有兩個 udfs 的物理計劃建立中的死鎖
- ARROW-9815 - [Rust] [DataFusion] 具有兩個 udfs 的物理計劃建立中的死鎖
- ARROW-9815 - [Rust] [DataFusion] 具有兩個 udfs 的物理計劃建立中的死鎖
- ARROW-9816 - [C++] 在 config.h 中逸出引號
- ARROW-9827 - [Python] pandas.read_parquet 對於寬 parquet 檔案和 pyarrow 1.0.X 失敗
- ARROW-9831 - [Rust] [DataFusion] 修正編譯錯誤
- ARROW-9840 - [Python] Python fs 文件與程式碼不同步
- ARROW-9846 - [Rust] Master 分支損壞的建置
- ARROW-9851 - [C++] 因無法辨識的指令而導致 Valgrind 錯誤
- ARROW-9852 - [C++] 修正無效 IPC 輸入時的崩潰 (OSS-Fuzz)
- ARROW-9852 - [C++] 修正無效 IPC 輸入時的崩潰 (OSS-Fuzz)
- ARROW-9855 - [R] 修正錯誤的合併/Rcpp 衝突
- ARROW-9859 - [C++] 具有特殊字元的 S3 FileSystemFromUri 秘密金鑰失敗
- ARROW-9864 - [Python] pathlib.Path 在具有分割欄位的 write_to_dataset 中不受支援
- ARROW-9874 - [C++] NewStreamWriter / NewFileWriter 不擁有輸出流
- ARROW-9876 - [CI][C++] Travis ARM 工作逾時
- ARROW-9877 - [C++][CI] homebrew-cpp 因 avx512 而失敗
- ARROW-9879 - [Python] ChunkedArray.__getitem__ 無法與 numpy 純量一起運作
- ARROW-9882 - [C++/Python] 更新 conda-forge-pinning 至 3 以用於 OSX conda 套件
- ARROW-9883 - [R] 修正 R < 3.6 的 linuxlibs.R 安裝腳本
- ARROW-9888 - [Rust] [DataFusion] ExecutionContext 無法在執行緒之間共用
- ARROW-9889 - [Rust][DataFusion] Datafusion CLI:CREATE EXTERNAL TABLE 錯誤,並顯示 “不支援的邏輯計劃變體”
- ARROW-9897 - [C++][Gandiva] 從模式新增 to_date() 函數
- ARROW-9898 - [C++][Gandiva] castINT 中的錯誤處理在某些環境中失敗
- ARROW-9906 - [Python] test_parquet.py::test_parquet_writer_filesystem_s3_uri 中的崩潰 (從 S3FileSystem 關閉 NativeFile)
- ARROW-9913 - [C++] Decimal128::FromString 的輸出取決於彼此的存在
- ARROW-9920 - [Python] pyarrow.concat_arrays 在傳遞區塊陣列時發生區段錯誤
- ARROW-9922 - [Rust] 將 `try_from(Vec<Option<(&str, ArrayRef)>>)` 新增至 StructArray
- ARROW-9924 - [Python] 使用 Dataset 介面讀取個別 Parquet 檔案的效能降低
- ARROW-9931 - [C++] 修正無效 IPC 上的未定義行為 (OSS-Fuzz)
- ARROW-9932 - [R] Arrow 1.0.1 R 套件無法在 linux 上的 R3.4 上安裝
- ARROW-9936 - [Python] 修正 / 測試 pyarrow.parquet 中的相對檔案路徑
- ARROW-9937 - [Rust] [DataFusion] 平均值不正確
- ARROW-9943 - [C++] 讀取 Parquet 檔案時,Arrow metadata 未遞迴套用
- ARROW-9946 - [R] 當 `sink` 是字串時,ParquetFileWriter 發生區段錯誤
- ARROW-9953 - [R] 宣告 bit64 的最低版本
- ARROW-9962 - [Python] 使用固定時區將索引欄位轉換為 pandas 失敗
- ARROW-9968 - [C++] UBSAN 與 __int8_t 的連結失敗
- ARROW-9969 - [C++] RecordBatchBuilder 使用字典欄位產生無效結果
- ARROW-9970 - [Go] sum 方法中的 checkptr 失敗
- ARROW-9972 - [CI] 解決 Homebrew 上 grpc-re2 衝突的問題
- ARROW-9973 - [Java] JDBC DateConsumer 不允許 epoch 之前的日期
- ARROW-9976 - [Python] 使用大型資料框架執行 Table.from_pandas 時發生 ArrowCapacityError
- ARROW-9990 - [Rust] [DataFusion] NOT 無法規劃
- ARROW-9993 - [Python] Tzinfo - 字串往返在 pytz.StaticTzInfo 物件上失敗
- ARROW-9994 - [C++][Python] 自動分塊包含類似二進位欄位的巢狀陣列導致格式錯誤的輸出
- ARROW-9996 - [C++] 當為空值呼叫 DictionaryArray.GetScalar 時,字典未設定
- ARROW-10003 - [C++] 在相同檔案系統內複製時,在 CopyFiles 中建立目錄
- ARROW-10008 - [Python] pyarrow.parquet.read_table 在使用 use_legacy_dataset=False 的類別資料上使用述詞下推失敗
- ARROW-10011 - [C++] 讓 FindRE2.cmake 可重入
- ARROW-10012 - [C++] CopyFiles 測試中的零星失敗
- ARROW-10013 - [C++][CI] TestFlightClient.GenericOptions 中的 Flight 測試失敗
- ARROW-10017 - [Java] LargeMemoryUtil.checkedCastToInt 具有錯誤邏輯
- ARROW-10022 - [C++] [Compute] 在某些 scalar-arithmetic-benchmark 上核心傾印
- ARROW-10027 - [Python] 使用資料集篩選表達式時傳回不正確的空值欄位。
- ARROW-10034 - [Rust] Master 建置損壞
- ARROW-10041 - [Rust] 可以使用 DataType::Utf8 建立 LargeStringArray
- ARROW-10047 - [CI] Conda 整合測試因 cmake 錯誤而失敗
- ARROW-10048 - [Rust] 字串的 min/max 聚合中的錯誤
- ARROW-10049 - [C++/Python] 將 conda recipe 與 conda-forge 同步
- ARROW-10060 - [Rust] [DataFusion] MergeExec 目前捨棄具有錯誤的分割區
- ARROW-10062 - [Rust]: 修正 DictArray 的 DoubleEndedIter 的空值元素
- ARROW-10073 - [Python] 測試 test_parquet_nested_storage 依賴於 dict 項目排序
- ARROW-10081 - [C++/Python] 修正 drone.io conda 建置中的 bash 語法
- ARROW-10085 - [C++] S3 測試在 AppVeyor 上失敗
- ARROW-10087 - [CI] 修正夜間文件工作
- ARROW-10098 - [R][Doc] 修正 copy_files 文件不符
- ARROW-10104 - [Python] 將測試分隔到自己的 conda 套件中
- ARROW-10114 - [R] 具有深度巢狀結構的 to_dataframe_parallel 中的區段錯誤
- ARROW-10116 - [Python][封裝] 修正 macOS wheel 建置中的 gRPC 連結錯誤
- ARROW-10119 - [C++] 修正無效輸入上的 Parquet 崩潰 (OSS-Fuzz)
- ARROW-10121 - [C++][Python] 可變字典無法在 IPC 流的往返中存活
- ARROW-10124 - [R] 寫入函數不遵循 umask 設定
- ARROW-10125 - [R] Int64 降轉檢查未考慮所有區塊
- ARROW-10130 - [C++][Dataset] ParquetFileFragment::SplitByRowGroup 不保留 “complete_metadata” 狀態
- ARROW-10136 - [Rust][Arrow] 在篩選 StringArray 後,Nulls 會轉換為 “”
- ARROW-10137 - [R] 修正如果 libarrow 不存在則會損壞的 cpp helper
- ARROW-10147 - [Python] 如果索引名稱預設不是 JSON 可序列化的,則建構 pandas metadata 會失敗
- ARROW-10150 - [C++] 修正無效 Parquet 檔案上的崩潰 (OSS-Fuzz)
- ARROW-10169 - [Rust] 在漂亮列印陣列時,Nulls 應呈現為 “” 而非預設值
- ARROW-10174 - [Java] 讀取字典編碼的 struct vector 失敗
- ARROW-10175 - [CI] 夜間 hdfs 整合測試工作失敗
- ARROW-10176 - [CI] 夜間 valgrind 工作失敗
- ARROW-10178 - [CI] 修正 spark master 整合測試建置設定
- ARROW-10179 - [Rust] Labeler 未標記
- ARROW-10181 - [Rust] Arrow 測試無法在 Raspberry Pi (32 位元) 上編譯
- ARROW-10188 - [Rust] [DataFusion] 某些範例已損壞
- ARROW-10189 - [Doc] 用於 i32 的 C 資料介面範例在格式中使用 `l` 而非 `i`
- ARROW-10192 - [C++][Python] 將具有字典欄位的巢狀 struct 陣列轉換為 pandas series 時發生區段錯誤
- ARROW-10193 - [Python] 轉換為固定大小二進位陣列時發生區段錯誤
- ARROW-10200 - [Java][CI] 修正 s390x 上 Java CI 的失敗
- ARROW-10204 - [RUST] [Datafusion] 在啟用 simd 功能的情況下,aggregate_grouped_empty 中的測試失敗
- ARROW-10214 - [Python] 列印具有二進位 metadata 的綱要時發生 UnicodeDecodeError
- ARROW-10226 - [Rust] [Parquet] Parquet 讀取器在 parquet 檔案中的某些批次中讀取錯誤的欄位
- ARROW-10230 - [JS][Doc] JavaScript 文件建置失敗
- ARROW-10232 - FixedSizeListArray 未正確寫入/從 parquet 讀取
- ARROW-10234 - [C++][Gandiva] 修正 Gandiva 中 float/decimal 的 round() 邏輯
- ARROW-10237 - [C++] 字典中的重複值導致損壞的 parquet
- ARROW-10238 - [C#] List<Struct> 已損壞
- ARROW-10239 - [C++] aws-sdk-cpp 顯然也需要 zlib
- ARROW-10244 - [Python][Docs] 新增關於使用 pyarrow.dataset.parquet_dataset 的文件
- ARROW-10248 - [C++][Dataset] 資料集寫入未寫入綱要 metadata
- ARROW-10262 - [C++] Scalar 類別中的某些 TypeClass 似乎不正確
- ARROW-10270 - [R] 修正 R-devel 上的 CSV timestamp_parsers 測試
- ARROW-10271 - [Rust] packed_simd 已損壞,並在新專案下繼續進行
- ARROW-10279 - [Release][Python] 修正驗證腳本以符合新的 macos wheel 平台標籤
- ARROW-10280 - [封裝][Python] 修正 macOS wheel 工件模式
- ARROW-10281 - [Python] 修正執行測試時的警告
- ARROW-10284 - [Python] Pyarrow 在匯入時引發關於檔案系統的棄用警告
- ARROW-10285 - [Python] pyarrow.orc 子模組正在使用已棄用的功能
- ARROW-10286 - [C++][Flight] 誤導性的 CMake 錯誤
- ARROW-10288 - [C++] 編譯在 i386 上失敗
- ARROW-10290 - [C++] 較舊的 CMake 版本中無法使用 List POP_BACK
- ARROW-10293 - [Rust] [DataFusion] 修正基準測試
- ARROW-10296 - [R] 儲存為 integer64 的資料載入為 integer
新功能和改進
- ARROW-983 - [C++] 實作 InputStream 和 OutputStream 類別,用於與 socket 連線互動
- ARROW-1105 - [C++] SQLite 記錄批次讀取器
- ARROW-1509 - [Python] 將序列化物件寫入為封裝 IPC 訊息流
- ARROW-1669 - [C++] 考慮將 Abseil (Google C++11 標準程式庫擴充功能) 新增至工具鏈
- ARROW-1797 - [C++] 為數值陣列實作二元算術核心
- ARROW-2164 - [C++] 清理不必要的十進位模組參考
- ARROW-3080 - [Python] 統一 Arrow 到 Python 物件轉換路徑
- ARROW-3757 - [R] Flight RPC 用戶端的 R 繫結
- ARROW-3872 - [R] 新增 Feather 相容性的特設測試
- ARROW-4046 - [Python/CI] 執行大量記憶體測試
- ARROW-4248 - [C++][Plasma] 在 Windows / Visual Studio 上建置
- ARROW-4685 - [C++] 在 manylinux1 docker 映像檔中更新 Boost 至 1.69
- ARROW-4927 - [Rust] 更新頂層 README 以描述目前功能
- ARROW-4957 - [Rust] [DataFusion] 正確實作 get_supertype
- ARROW-4965 - [Python] 時間戳記陣列類型偵測應使用 datetime.datetime 物件的 tzname
- ARROW-5034 - [C#] ArrowStreamWriter 應公開同步 Write 方法
- ARROW-5123 - [Rust] 從結構定義衍生 RecordWriter
- ARROW-6075 - [FlightRPC] 處理中介軟體中未捕獲的例外
- ARROW-6281 - [Python] 為 pyarrow.array 中巢狀類型產生分塊陣列
- ARROW-6282 - [Format] 支援有損壓縮
- ARROW-6437 - [R] 將 AWS SDK 新增至 macOS 和 Windows 的系統依賴項
- ARROW-6535 - [C++] Status::WithMessage 應接受可變參數
- ARROW-6537 - [R] 將 column_types 傳遞至 CSV 讀取器
- ARROW-6972 - [C#] 應支援 StructField 陣列
- ARROW-6982 - [R] 為 compare 和 boolean 核心新增綁定
- ARROW-7136 - [Rust][CI] 在 dockerfile 中預先安裝 rust 依賴項
- ARROW-7218 - [Python] 從布林 numpy 純量轉換無法運作
- ARROW-7302 - [C++] CSV:允許將欄位轉換為特定的字典類型
- ARROW-7372 - [C++] 允許從簡單 JSON 建立字典陣列
- ARROW-7871 - [Python] 公開更多計算核心
- ARROW-7960 - [C++][Parquet] 新增支援從 parquet 節點將 schema 轉換回 arrow 以處理遺失的類型
- ARROW-8001 - [R][Dataset] Dataset 寫入的綁定
- ARROW-8002 - [C++][Dataset] Dataset 寫入應允許您(重新)分割資料
- ARROW-8048 - [Python] 每晚執行記憶體洩漏測試,作為 ARROW-4120 的後續行動
- ARROW-8172 - [C++] 字典陣列的 ArrayFromJSON
- ARROW-8205 - [Rust] [DataFusion] DataFusion 應強制 schema 中欄位名稱的唯一性
- ARROW-8253 - [Rust] [DataFusion] 改善註冊 UDF 的人體工學設計
- ARROW-8262 - [Rust] [DataFusion] 新增使用 LogicalPlanBuilder 的範例
- ARROW-8289 - [Rust] [Parquet] 實作最小 Arrow Parquet 寫入器,作為完整寫入器的起點
- ARROW-8296 - [C++][Dataset] IpcFileFormat 應支援寫入具有壓縮緩衝區的檔案
- ARROW-8355 - [Python] 減少 test_feather 中 pandas 依賴測試案例的數量
- ARROW-8359 - [C++/Python] 在 conda recipes 中啟用 aarch64/ppc64le 建置
- ARROW-8383 - [Rust] 更容易隨機存取 DictionaryArray 的鍵和值
- ARROW-8402 - [Java] 在 Java 中支援 ValidateFull 方法
- ARROW-8423 - [Rust] [Parquet] 在寫入 parquet 時將 arrow schema 序列化到 metadata 中
- ARROW-8426 - [Rust] [Parquet] 新增支援寫入字典類型
- ARROW-8493 - [C++] 為陣列重建建立統一的 schema 解析程式碼。
- ARROW-8494 - [C++] 實作基本的逐陣列重新組裝邏輯
- ARROW-8581 - [C#] Date32/64Array.Builder 應接受 DateTime,而不是 DateTimeOffset
- ARROW-8601 - [Go][Flight] 實作 Flight Writer 介面
- ARROW-8601 - [Go][Flight] 實作 Flight Writer 介面
- ARROW-8618 - [C++] ASSIGN_OR_RAISE 應移動其引數
- ARROW-8678 - [C++][Parquet] 移除舊版 arrow 到 level 的轉換。
- ARROW-8712 - [R] 在 read_csv 轉換選項中公開 strptime 時間戳記解析
- ARROW-8774 - [Rust] [DataFusion] 改善執行緒模型
- ARROW-8810 - [R] 新增關於 Parquet 格式、附加到串流格式的文件
- ARROW-8824 - [Rust] [DataFusion] 實作新的 SQL 解析器
- ARROW-8828 - [Rust] 實作 SQL 符記器
- ARROW-8829 - [Rust] 實作 SQL 解析器
- ARROW-9010 - [Java] RecordBatch IPC 緩衝區壓縮的框架和介面變更
- ARROW-9065 - [C++] 支援解析 dataset 分割資料夾中的 date32
- ARROW-9068 - [C++][Dataset] 簡化 Partitioning 介面
- ARROW-9078 - [C++] 巢狀儲存類型的擴充類型 Parquet 寫入失敗
- ARROW-9104 - [C++] Parquet 加密測試應將檔案寫入臨時目錄,而不是測試子模組的目錄
- ARROW-9107 - [C++][Dataset] 基於時間的類型支援
- ARROW-9147 - [C++][Dataset] 在 Dataset 掃描中支援 null -> 其他類型提升
- ARROW-9205 - [Documentation] 修正 Columnar.rst 中的錯字
- ARROW-9266 - [Python][Packaging] 在 macOS wheels 中啟用 S3 支援
- ARROW-9271 - [R] 在往返行程中保留資料框 metadata
- ARROW-9286 - [C++] 將函數「別名」新增至 compute::FunctionRegistry
- ARROW-9328 - [C++][Gandiva] 為字串新增 LTRIM、RTRIM、BTRIM 函數
- ARROW-9338 - [Rust] 新增在本機執行 clippy 的說明
- ARROW-9344 - [C++][Flight] 在 flight 基準測試中測量延遲分位數
- ARROW-9358 - [Integration] 重新考慮 generated_large_batch.json
- ARROW-9371 - [Java] 為兩個分配器執行向量測試
- ARROW-9377 - [Java] 支援無符號字典索引
- ARROW-9387 - [R] 使用新的 C++ table select 方法
- ARROW-9388 - [C++] 除法核心
- ARROW-9394 - [Python] 支援 Scalars 的 pickle
- ARROW-9398 - [C++] 在函數執行個體而非 SIMD 函數下註冊 SIMD sum 變體
- ARROW-9402 - [C++] 為 __builtin_add_overflow 和相關函數新增可移植的包裝函式
- ARROW-9405 - [R] 切換至 cpp11
- ARROW-9412 - [C++] 將非 BUNDLED 依賴項新增至 arrow_static 的匯出 INSTALL_INTERFACE_LIBS,並測試其是否運作
- ARROW-9429 - [Python] ChunkedArray.to_numpy
- ARROW-9454 - [GLib] 新增一些字典建構器的綁定
- ARROW-9465 - [Python] 改善計算函數的人體工學設計
- ARROW-9469 - [Python] 使更多物件可弱參考
- ARROW-9487 - [Developer] 使用單元測試涵蓋 archery 發佈公用程式
- ARROW-9488 - [Release] 更新網站時使用新的變更日誌產生
- ARROW-9507 - [Rust] [DataFusion] PhysicalExpr 應實作 Display 特徵
- ARROW-9508 - [Release][APT][Yum] 為 arm64 二進位檔啟用驗證
- ARROW-9516 - [Rust][DataFusion] 重構物理表達式,使其不關心其名稱或索引
- ARROW-9517 - [C++][Python] 初始化 S3FileSystem 時允許 session_token 引數
- ARROW-9518 - [Python] 棄用 pyarrow 序列化
- ARROW-9521 - [Rust] CsvReadOptions 應允許指定副檔名
- ARROW-9523 - [Rust] 改善 filter 核心的效能
- ARROW-9534 - [Rust] [DataFusion] 實作函數以針對所有類型建立常值表達式
- ARROW-9550 - [Rust] [DataFusion] 從 hash aggregate 運算子中移除 Rc<RefCell<_>>
- ARROW-9553 - [Rust] 發佈腳本未提升 parquet crate 的 arrow 依賴版本
- ARROW-9557 - [R] 在 R 中迭代 parquet 欄位速度緩慢
- ARROW-9559 - [Rust] [DataFusion] 還原 exprlist_to_fields 的私有化
- ARROW-9563 - [Dev][Release] 在為網站建立發佈說明時使用 archery 的變更日誌產生器
- ARROW-9568 - [CI] 在 GHA 上使用官方 msys 動作
- ARROW-9576 - [Python][Doc] 修正擴充類型程式碼範例中的錯誤
- ARROW-9580 - [JS] 文件中有多餘的 ()
- ARROW-9581 - [Dev][Release] 將下一個快照版本提升至 2.0.0
- ARROW-9582 - [Rust] 實作 Array::memory_size()
- ARROW-9585 - [Rust] 移除 DataFusion readme 中重複的 to-do 行
- ARROW-9587 - [FlightRPC][Java] 清理 DoPut/FlightStream 記憶體處理
- ARROW-9593 - [Python] 為 DictionaryScalar 新增自訂 pickle reducer
- ARROW-9604 - [C++] 為 aggregate min/max 計算核心新增基準測試
- ARROW-9605 - [C++] 優化 aggregate min/max 計算核心的效能
- ARROW-9607 - [C++][Gandiva] 為整數新增 bitwise_and()、bitwise_or() 和 bitwise_not() 函數
- ARROW-9608 - [Rust] 從 parquet 的功能閘控中移除 arrow flight
- ARROW-9615 - [Rust] 新增計算字串陣列長度的核心
- ARROW-9617 - [Rust] [DataFusion] 新增字串陣列長度
- ARROW-9618 - [Rust] [DataFusion] 使撰寫優化器更容易
- ARROW-9619 - [Rust] [DataFusion] 新增述詞下推
- ARROW-9632 - [Rust] 為 ExecutionContextSchemaProvider 新增「new」方法
- ARROW-9638 - [C++][Compute] 實作 mode(最頻繁數字)核心
- ARROW-9639 - [Ruby] 新增依賴項版本檢查
- ARROW-9640 - [C++][Gandiva] 為整數和長整數實作 round()
- ARROW-9641 - [C++][Gandiva] 為浮點數和雙精度浮點數實作 round()
- ARROW-9645 - [Python] 棄用舊版 pyarrow.filesystem 介面
- ARROW-9646 - [C++][Dataset] 新增支援寫入 parquet datasets
- ARROW-9650 - [Packaging][APT] 放棄支援 Ubuntu 19.10
- ARROW-9654 - [Rust][DataFusion] 為 datafusion CLI 新增 EXPLAIN 命令
- ARROW-9656 - [Rust][DataFusion] 當為 CREATE EXTERNAL TABLE 提供不支援的類型時,訊息稍微令人困惑
- ARROW-9658 - [Python][Dataset] Dataset 寫入的綁定
- ARROW-9665 - [R] Datasets 的 head/tail/take
- ARROW-9667 - [CI][Crossbow] 2 個 nightly R 建置中的區段錯誤
- ARROW-9671 - [C++] BasicDecimal128 建構函式將最高位元設定為負數的 uint64_t 整數解譯為負數
- ARROW-9673 - [Rust] 為 DFParser::parse_sql 新增參數「dialect」
- ARROW-9678 - [Rust] [DataFusion] 改善投影下推以移除未使用的欄位
- ARROW-9679 - [Rust] [DataFusion] HashAggregate 多次走訪 map 以建置最終批次
- ARROW-9681 - [Java] 大端平台上的 Arrow Memory - Core 失敗
- ARROW-9683 - [Rust][DataFusion] 為 ExecutionPlan 特徵實作 Debug
- ARROW-9691 - [Rust] [DataFusion] 將 sql_statement_to_plan 公開
- ARROW-9695 - [Rust][DataFusion] 改善 LogicalPlan 變體的說明文件
- ARROW-9699 - [C++][Compute] 改善值範圍有限的整數類型之 mode 核心效能
- ARROW-9701 - [Java][CI] 在 s390x 上新增測試工作
- ARROW-9702 - [C++] 將 bpacking simd 移動到執行階段路徑
- ARROW-9703 - [Developer][Archery] 用於建立維護分支的可重新啟動 cherry-picking 流程
- ARROW-9706 - [Java] 大端平台上的 TestLargeListVector 測試失敗
- ARROW-9710 - [C++] 通用化 Decimal ToString,為 Decimal256 做準備
- ARROW-9711 - [Rust] 新增基於 TPC-H 的基準測試
- ARROW-9713 - [Rust][DataFusion] 移除明確的 panic
- ARROW-9715 - [R] 1.0.1 的變更日誌/文件更新
- ARROW-9718 - [Python] 使 pyarrow.parquet 可與新的 filesystem 介面搭配運作
- ARROW-9721 - [Packaging][Python] 更新 wheel 依賴項檔案
- ARROW-9722 - [Rust]:縮短字典陣列反向查找的鍵生命週期
- ARROW-9723 - [C++] 具有 NaN 的「mode」核心的預期行為?
- ARROW-9725 - [Rust] [DataFusion] LimitExec 和 SortExec 應使用 MergeExec
- ARROW-9737 - [C++][Gandiva] 為整數新增 bitwise_xor()
- ARROW-9739 - [CI][Ruby] 不要安裝 gem 文件
- ARROW-9742 - [Rust] 建立一個標準 DataFrame API
- ARROW-9751 - [Rust] [DataFusion] 擴充 UDF 以接受每個引數多個類型
- ARROW-9752 - [Rust] [DataFusion] 新增 Aggregate UDF 的支援
- ARROW-9753 - [Rust] [DataFusion] 移除 ExecutionPlan 特徵中 Mutex 的使用
- ARROW-9754 - [Rust] [DataFusion] 在 DataFusion 特徵中實作 async
- ARROW-9757 - [Rust] [DataFusion] 使用「pub use」公開清晰的公共 API
- ARROW-9758 - [Rust] [DataFusion] 為 DataFusion 實作擴充 API
- ARROW-9759 - [Rust] [DataFusion] 實作 DataFrame::sort
- ARROW-9760 - [Rust] [DataFusion] 實作 DataFrame::explain
- ARROW-9761 - [C++] 將實驗性基於 pull 的迭代器結構新增至 C 介面實作
- ARROW-9762 - [Rust] [DataFusion] ExecutionContext::sql 應傳回 DataFrame
- ARROW-9769 - [Python] 移除 test_move_file 中記憶體內 fsspec 的 skip
- ARROW-9775 - [C++] 自動 S3 區域選擇
- ARROW-9781 - [C++] 修正未初始化值警告
- ARROW-9782 - [C++][Dataset] 能夠使用 IpcFileFormat 寫入「.feather」檔案
- ARROW-9784 - [Rust] [DataFusion] 改善執行 tpch 基準測試的說明
- ARROW-9786 - [R] 在發佈前取消供應商 cpp11
- ARROW-9788 - 處理 SQL、DataFrame API 和結構名稱之間命名不一致的問題
- ARROW-9792 - [Rust] [DataFusion] 邏輯 aggregate 函數不應傳回 Result
- ARROW-9794 - [C++] 新增 cpu_info 的功能以區分 Intel 與 AMD x86
- ARROW-9795 - [C++][Gandiva] 在 Gandiva 中實作 castTIMESTAMP(int64)
- ARROW-9806 - [R] 更多計算核心綁定
- ARROW-9807 - [R] 1.0.1 後的新聞更新/版本提升
- ARROW-9808 - [Python] parquet.read_table 文件字串錯誤的 use_legacy_dataset 說明
- ARROW-9811 - [C++] 未檢查的浮點數除以 0 應成功
- ARROW-9813 - [C++] 停用語義中間插入
- ARROW-9819 - [C++] 將 mimalloc 升級至 1.6.4
- ARROW-9821 - [Rust][DataFusion] 使用者定義的 PlanNode / Operator API
- ARROW-9821 - [Rust][DataFusion] 使用者定義的 PlanNode / Operator API
- ARROW-9823 - [CI][C++][MinGW] 啟用 S3
- ARROW-9832 - [Rust] [DataFusion] 重構 PhysicalPlan 以移除 Partition
- ARROW-9833 - [Rust] [DataFusion] 重構 TableProvider.scan 以傳回 ExecutionPlan
- ARROW-9834 - [Rust] [DataFusion] 移除 Partition 特徵
- ARROW-9835 - [Rust] [DataFusion] 移除 FunctionMeta
- ARROW-9836 - [Rust] [DataFusion] 改善 UDF 使用的 API
- ARROW-9837 - [Rust] 為變數新增 provider
- ARROW-9838 - [Rust] [DataFusion] DefaultPhysicalPlanner 應插入明確的 MergeExec 節點
- ARROW-9839 - [Rust] [DataFusion] 新增將 ExecutionPlan 向下轉換為特定運算子的能力
- ARROW-9841 - [Rust] 更新已檢查的 flatbuffer 檔案
- ARROW-9844 - [Go][CI] 在 s390x 上為 Go 新增 Travis CI 工作
- ARROW-9845 - [Rust] [Parquet] serde_json 僅在測試中使用,但不在 dev-dependencies 中
- ARROW-9848 - [Rust] 實作變更以確保 flatbuffer 對齊
- ARROW-9849 - [Rust] [DataFusion] 使 UDF 不需要 Field
- ARROW-9850 - [Go] Defer 不應在迴圈中使用
- ARROW-9853 - [RUST] 為字典陣列實作「take」核心
- ARROW-9854 - [R] 支援從 S3 讀取/寫入資料
- ARROW-9858 - [C++][Python][Docs] 擴充 FileSystem 的使用者指南
- ARROW-9863 - [C++] [PARQUET] 優化 ApplicationVersion 的 metadata 恢復
- ARROW-9867 - [C++][Dataset] FileSystemDataset 應公開其 filesystem
- ARROW-9868 - [C++] 提供用於在檔案系統之間複製檔案的公用程式
- ARROW-9869 - [R] 實作完整的 S3FileSystem/S3Options 建構函式
- ARROW-9870 - [R] 適用於檔案系統 (S3) 的友善介面
- ARROW-9871 - [C++] 為 ARROW_USER_SIMD_LEVEL 新增大寫支援。
- ARROW-9873 - [C++][Compute] 改善有限值範圍內整數的 mode 核心
- ARROW-9875 - [Python] 讓 FileSystem.get_file_info 接受單一路徑
- ARROW-9884 - [R] 將 datasets 寫入 Parquet 的綁定
- ARROW-9885 - [Rust] [DataFusion] 簡化二進位類型的類型強制轉換程式碼
- ARROW-9886 - [Rust] [DataFusion] 簡化測試 cast 的程式碼
- ARROW-9887 - [Rust] [DataFusion] 新增對內建函數複雜傳回類型的支援
- ARROW-9890 - [R] 在 macOS 建置中新增 zstandard 壓縮編解碼器
- ARROW-9891 - [Rust] [DataFusion] 使數學函數支援 f32
- ARROW-9892 - [Rust] [DataFusion] 新增 concat 的支援
- ARROW-9893 - [Python] 將 datasets 寫入 Parquet 的綁定
- ARROW-9895 - [RUST] 改善 sort 核心
- ARROW-9899 - [Rust] [DataFusion] 從 Box<Schema> –> SchemaRef (Arc<Schema>) 切換,以與 Arrow 的其餘部分保持一致
- ARROW-9900 - [Rust][DataFusion] 在 LogicalPlan 中使用 Arc<> 而不是 Box<>
- ARROW-9901 - [C++] 為巢狀讀取新增手動製作的 Parquet 到 Arrow 重建測試
- ARROW-9902 - [Rust] [DataFusion] 新增 array() 的支援
- ARROW-9904 - [C++] 為 CountSetBits 手動展開迴圈
- ARROW-9908 - [Rust] 在 JSON 讀取器中支援時間資料類型
- ARROW-9910 - [Rust] [DataFusion] Variadic 的類型強制轉換錯誤
- ARROW-9914 - [Rust][DataFusion] 記錄 SQL -> Arrow 類型對應
- ARROW-9916 - [RUST] 避免在多個位置複製 ArrayData
- ARROW-9917 - [Python][Compute] 為 mode 核心新增綁定
- ARROW-9919 - [Rust] [DataFusion] 數學函數
- ARROW-9921 - [Rust] 為 [Large]StringArray 新增 `from(Vec<Option<&str>>)`
- ARROW-9925 - [GLib] 為 GArrowListArray 系列新增低階值讀取器
- ARROW-9926 - [GLib] 為 GArrowRecordBatchFileReader 使用 placement new
- ARROW-9928 - [C++] 稍微加速整數解析
- ARROW-9929 - [Developer] 自動調整 cmake-format
- ARROW-9933 - [Developer] 新增 drone 作為 crossbow 的 CI provider
- ARROW-9934 - [Rust] tensor 中的形狀和步幅檢查
- ARROW-9941 - [Python] 擴充類型的更佳字串表示法
- ARROW-9944 - [Rust] 實作 TO_TIMESTAMP 函數
- ARROW-9949 - [C++] 通用化 Decimal128::FromString 以在 Decimal256 中重複使用
- ARROW-9950 - [Rust] [DataFusion] 允許在沒有 registry 的情況下使用 UDF
- ARROW-9952 - [Python] 使用 pyarrow.dataset 寫入 pq.write_to_dataset
- ARROW-9954 - [Rust] [DataFusion] 簡化 aggregate planning 的程式碼
- ARROW-9956 - [C++][Gandiva] 在 Gandiva 中實作 Binary 字串函數
- ARROW-9957 - [Rust] 移除未維護的 tempdir 依賴項
- ARROW-9961 - [Rust][DataFusion] to_timestamp 函數將沒有時區偏移的時間戳記解析為 UTC 而非本機時間
- ARROW-9964 - [C++] CSV 日期支援
- ARROW-9965 - [Java] 固定寬度向量的緩衝區容量計算速度緩慢
- ARROW-9966 - [Rust] 加速 aggregate 核心
- ARROW-9967 - [Python] 新增 compute 模組文件
- ARROW-9971 - [Rust] 加速 take
- ARROW-9977 - [Rust] 為 [Large]String 新增 min/max
- ARROW-9979 - [Rust] 修正 arrow crate clippy lints
- ARROW-9980 - [Rust] 修正 parquet crate clippy lints
- ARROW-9981 - [Rust] 允許使用 IpcWriteOptions 配置 flight IPC
- ARROW-9983 - [C++][Dataset][Python] 為 Datasets API 使用比 32K 更大的預設批次大小
- ARROW-9984 - [Rust] [DataFusion] 函數到字串的 DRY
- ARROW-9986 - [Rust][DataFusion] TO_TIMESTAMP 函數在沒有時區的情況下錯誤地需要小數秒
- ARROW-9987 - [Rust] [DataFusion] 改善 `Expr` 的文件。
- ARROW-9988 - [Rust] [DataFusion] 將 std::ops 新增至邏輯表達式
- ARROW-9992 - [C++][Python] 基於可重複使用的轉換 API 重構 python 到 arrow 的轉換
- ARROW-9998 - [Python] 支援 pickle DictionaryScalar
- ARROW-9999 - [Python] 支援直接透過 pa.array() 建構字典陣列
- ARROW-10000 - [C++][Python] 支援從鍵值對清單建構 StructArray
- ARROW-10001 - [Rust] [DataFusion] 將開發人員指南新增至 README
- ARROW-10010 - [Rust] 加速算術
- ARROW-10015 - [Rust] 為 aggregate 核心 sum 實作 SIMD
- ARROW-10016 - [Rust] [DataFusion] 實作 IsNull 和 IsNotNull
- ARROW-10018 - [CI] 停用 Sphinx 和 API 文件建置,因為它在 master 上需要 6 小時
- ARROW-10019 - [Rust] 新增 substring 核心
- ARROW-10023 - [Gandiva][C++] 在 gandiva 中實作 Split part 函數
- ARROW-10024 - [C++][Parquet] 建立巢狀讀取基準測試
- ARROW-10028 - [Rust] 簡化 macro def_numeric_from_vec
- ARROW-10030 - [Rust] 支援 fromIter 和 toIter
- ARROW-10035 - [C++] 升級供應商程式碼的版本
- ARROW-10037 - [C++] 變更 AWS SDK 的尋找方式以強制尋找共享程式庫的解決方案
- ARROW-10040 - [Rust] 建立一種對齊非對齊偏移緩衝區進行切片的方法
- ARROW-10043 - [Rust] [DataFusion] 導入 DISTINCT 支援,部分實作 COUNT(DISTINCT)
- ARROW-10044 - [Rust] 改善 README
- ARROW-10046 - [Rust] [DataFusion] 使 `*Iterator` 實作 Iterator
- ARROW-10050 - [C++][Gandiva] 在 Gandiva 中實作 concat(),最多支援 10 個參數
- ARROW-10051 - [C++][Compute] 使聚合核心合併狀態可變
- ARROW-10054 - [Python] Slice 方法應返回空陣列而不是崩潰
- ARROW-10055 - [Rust] 為 NullableIter 實作 DoubleEndedIterator
- ARROW-10057 - [C++] 為巢狀資料新增 Parquet-Arrow 來回測試
- ARROW-10058 - [C++] 研究在沒有 BMI2 的情況下 LevelsToBitmap 的效能
- ARROW-10059 - [R][Doc] 提供更多關於如何設定 C++ 建置的建議
- ARROW-10063 - [Archery][CI] 僅在 archery 建置中,當它是 pull request 時才提取 main 分支
- ARROW-10064 - [C++] 解決 Apple Clang 12 上的編譯警告
- ARROW-10065 - [Rust] DRY downcasted Arrays
- ARROW-10066 - [C++] 確保預設 AWS 區域受到尊重
- ARROW-10068 - [C++] 為 aws-sdk-cpp 新增捆綁的外部專案
- ARROW-10069 - [Java] 支援從命令列執行 Java 基準測試
- ARROW-10070 - [C++][Compute] 實作 stdev 聚合核心
- ARROW-10071 - [R] 來自先前工作階段或已儲存的 ArrowObject 發生 segfault
- ARROW-10074 - [C++] 請勿使用 string_view.to_string()
- ARROW-10075 - [C++] 請勿使用 nonstd::nullopt,這會破壞 vendor abstraction。
- ARROW-10076 - [C++] 對於所有尚未使用 TemporaryDir 的測試,皆使用 TemporaryDir。
- ARROW-10077 - [C++] bit_stream_utils.h 乘法中可能發生溢位。
- ARROW-10083 - [C++] 改善 Parquet fuzz seed corpus
- ARROW-10084 - [Rust] [DataFusion] 新增大型字串陣列的長度
- ARROW-10086 - [Rust] 遷移 min_large_string -> min_string 核心
- ARROW-10090 - [C++][Compute] 改善 mode 核心
- ARROW-10092 - [Dev][Go] 將 grpc 產生的 go 檔案新增至 rat 排除清單
- ARROW-10093 - [R] 新增選擇退出 int64 -> int 降級的功能
- ARROW-10095 - [Rust] [Parquet] 更新以符合 IPC 變更
- ARROW-10096 - [Rust] [DataFusion] 移除未使用的程式碼
- ARROW-10099 - [C++][Dataset] 也允許將整數分割區欄位進行字典編碼
- ARROW-10100 - [C++][Dataset] 能夠使用給定的列組 ID 讀取/子集化 ParquetFileFragment
- ARROW-10102 - [C++] 通用化 BasicDecimal128::operator*= 以在 Decimal256 中重複使用
- ARROW-10103 - [Rust] 新增 Contains 核心
- ARROW-10105 - [FlightRPC] 新增用戶端選項以停用 TLS 的憑證驗證
- ARROW-10120 - [C++][Parquet] 為 2 層巢狀資料建立讀取基準測試
- ARROW-10127 - [Format] 更新規範以支援 256 位元 Decimal 類型
- ARROW-10129 - [Rust] Cargo 建置正在 arrow 變更時重建相依性
- ARROW-10134 - [C++][Dataset] 新增 ParquetFileFragment::num_row_groups 屬性
- ARROW-10139 - [C++] 新增在不建置測試的情況下建置 arrow_testing 的支援
- ARROW-10148 - [Rust] 為 lib.rs 新增文件
- ARROW-10151 - [Python] 為 MapArray 新增 to_pandas 轉換支援
- ARROW-10155 - [Rust] [DataFusion] 為 lib.rs 新增文件
- ARROW-10156 - [Rust] 自動標記 PR
- ARROW-10157 - [Rust] 新增更多關於 take 的文件
- ARROW-10160 - [Rust] 改善 DictionaryType 的文件
- ARROW-10161 - [Rust] [DataFusion] 簡化表達式測試
- ARROW-10162 - [Rust] 支援在美觀列印中顯示 DictionaryArrays
- ARROW-10164 - [Rust] 為 cast 核心新增 DictionaryArray 類型支援
- ARROW-10167 - [Rust] 支援在 sql.rs 中顯示 DictionaryArrays
- ARROW-10168 - [Rust] [Parquet] 擴展 arrow schema 轉換以支援 projected fields
- ARROW-10171 - [Rust] [DataFusion] 新增 `ExecutionContext::from
` - ARROW-10190 - [Website] 將 Jorge 新增至提交者清單
- ARROW-10191 - [Rust] [Parquet] 為單欄批次新增來回測試
- ARROW-10196 - [C++] 新增 Future::DeferNotOk()
- ARROW-10199 - [Rust][Parquet] 在 crates.io 發布 Parquet 以移除 debug prints
- ARROW-10201 - [C++][CI] 在 Travis CI 的 arm64 job 中停用 S3
- ARROW-10202 - [CI][Windows] 使用 sf.net mirror 作為 MSYS2
- ARROW-10205 - [Java][FlightRPC] 新增用戶端選項以停用伺服器驗證
- ARROW-10206 - [Python][C++][FlightRPC] 新增用戶端選項以停用伺服器驗證
- ARROW-10215 - [Rust] [DataFusion] 重新命名 “Source” typedef
- ARROW-10217 - [CI] 執行較少的 GitHub Actions jobs
- ARROW-10225 - [Rust] [Parquet] 修復來回測試中的 null bitmap 比較
- ARROW-10227 - [Ruby] 使用表格大小作為 parquet chunk_size 的預設值
- ARROW-10229 - [C++][Parquet] 移除遺留的 ARROW_LOG 語句。
- ARROW-10231 - [CI] 無法在 arm32v7 docker 映像檔中下載 minio
- ARROW-10233 - [Rust] 使 array_value_to_string 在所有 Arrow 建置中皆可使用
- ARROW-10235 - [Rust][DataFusion] 改善型別強制轉換的文件
- ARROW-10240 - [Rust] [Datafusion] 選擇性地在執行基準查詢之前將 tpch 資料載入記憶體
- ARROW-10251 - [Rust] [DataFusion] MemTable::load() 應平行載入分割區
- ARROW-10252 - [Python] 新增選項以跳過在 Python 安裝中包含 Arrow 標頭
- ARROW-10256 - [C++][Flight] 小心停用 -Werror
- ARROW-10257 - [R] 為 2.0 版本準備新聞/文件
- ARROW-10260 - [Python] 缺少 MapType 到 Pandas dtype 的轉換
- ARROW-10263 - [C++][Compute] 改善變異數合併的數值穩定性
- ARROW-10265 - [CI] 當 Travis CI 上快取不存在時,使用較小的建置
- ARROW-10266 - [CI][macOS] 確保搭配 Homebrew 使用 Python 3.8
- ARROW-10267 - [Python] 如果 disable_server_verification 功能不可用,則跳過 flight 測試
- ARROW-10272 - [Packaging][Python] 釘住較新的 multibuild 版本以避免更新 homebrew
- ARROW-10273 - [CI][Homebrew] 修復 “brew audit” 用法
- ARROW-10287 - [C++] 盡可能避免使用 std::random_device
- ARROW-10289 - [Rust] 支援讀取字典串流
- ARROW-10295 - [Rust] [DataFusion] 簡化累加器
- ARROW-10310 - [C++][Gandiva] 在 Gandiva 中新增單一參數 round()
- PARQUET-1845 - [C++] 測試案例中的 Int96 記憶體映像檔僅假設小端序
- PARQUET-1878 - [C++] lz4 編碼解碼器與 Hadoop Lz4Codec 不相容
- PARQUET-1904 - [C++] 在 RowGroupMetaData 中匯出 file_offset