Apache Arrow 7.0.0 (2022年2月3日)
這是一個主要版本,涵蓋了超過 3 個月的開發。
下載
貢獻者
此版本包含來自 105 位不同貢獻者的 650 次提交。
$ git shortlog -sn apache-arrow-6.0.0..apache-arrow-7.0.0
78 Antoine Pitrou
49 Sutou Kouhei
44 Krisztián Szűcs
39 David Li
35 Nic Crane
34 Alenka Frim
28 Carlos O'Ryan
27 Jonathan Keane
22 Weston Pace
21 Joris Van den Bossche
19 Dewey Dunnington
16 Matthew Topol
14 Dragos Moldovan-Grünfeld
14 Will Jones
12 Yibo Cai
12 Augusto Silva
12 Benson Muite
9 Alessandro Molina
7 Neal Richardson
6 Eduardo Ponce
5 Vibhatha Abeykoon
5 Dominik Moritz
5 Pradeep Garigipati
4 Johan Peltenburg
4 Ian Alexander Joiner
4 João Pedro
4 Matthijs Brobbel
4 Phillip Cloud
4 Sasha Krassovsky
4 liyafan82
3 Yuqi Gu
3 Sanjiban Sengupta
3 Kazuaki Ishizaki
3 Anthony Louis
3 jeszyb
3 Jedi18
3 Romain Francois
3 okadakk
2 Dhruv Vats
2 crystrix
2 Chenxi Li
2 Jayjeet Chakraborty
2 Danielle Navarro
2 Alex Şuhan
2 Projjal Chanda
2 Jeroen van Straten
2 Rok
2 Yue
2 Chris Casola
2 rodrigojdebem
2 Zixi
2 shanhuuang
2 Hongze Zhang
2 ArianaVillegas
2 Benjamin Kietzman
2 William Hyun
1 Vinicius Roque
1 Vitaly Buka
1 Andrew Lamb
1 Alvin Chunga
1 William Ayd
1 William Butler
1 ZMZ
1 [5~[5~David Li
1 [Paul Taylor
1 alvinj15
1 b41sh
1 bkmgit
1 c-jamie
1 daipom
1 frank400
1 liukun4515
1 Ákos Hadnagy
1 marlenezw
1 michalursa
1 notEvil
1 Diana Clarke
1 Dongjoon Hyun
1 Colin Sames
1 Dragoș Moldovan-Grünfeld
1 Eric Erhardt
1 James Duong
1 Jiayu Liu
1 Ahmet Uyar
1 Joost Hoozemans
1 Jorge C. Leitao
1 Jorge Leitao
1 Chathura Widanage
1 tomersolomon1
1 Konstantin Ilchenko
1 Chao Sun
1 Carl Boettiger
1 toppyy
1 Nate Clark
1 Nathaniel Bauernfeind
1 Benedikt Reinartz
1 Niyas Sait
1 wangzixuan.wzxuan
1 Attila Lendvai
1 Rafael Telles
1 zois
1 Stephanie Hazlitt
1 Terence Honles
1 Tim Paine
1 Vinicius Fraga
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到儲存庫。
$ git shortlog -csn apache-arrow-6.0.0..apache-arrow-7.0.0
149 Antoine Pitrou
85 Krisztián Szűcs
73 Sutou Kouhei
68 Jonathan Keane
64 David Li
52 Nic Crane
34 Joris Van den Bossche
24 Pindikura Ravindra
21 Weston Pace
14 GitHub
14 Matthew Topol
12 Neal Richardson
12 Yibo Cai
7 Benjamin Kietzman
5 Dominik Moritz
4 liyafan82
4 Eric Erhardt
3 Matt Topol
2 Ian Cook
1 Praveen
1 Micah Kornfield
1 Chao Sun
變更日誌
Apache Arrow 7.0.0 (2022-02-03)
錯誤修正
- ARROW-8340 - [文件] 移除舊的 Sphinx pin
- ARROW-9648 - [C++] 為 LZ4_FRAME 壓縮編解碼器新增壓縮等級參數
- ARROW-9688 - [C++][Python] 啟用為 win/arm64 建置 c++ 程式庫和 pyarrow 套件
- ARROW-10140 - [Python][C++] 為從 pyarrow 和 pandas 建立的 parquet 檔案的地圖欄位新增測試
- ARROW-10485 - [R] 當檔案路徑為 Hive 樣式時,在 open_dataset 中接受分割
- ARROW-10794 - [JS] Typescript Arrowjs 類別 ‘RecordBatch<T>’ 錯誤地繼承了基底類別 ‘StructVector<T>’
- ARROW-11549 - [C++][Gandiva] 修正因 ToString() 無法區分 null 和 ‘null’ 而導致的 FilterCacheKey 問題
- ARROW-12042 - [C++] 修正分塊陣列上的 array_sort_indices
- ARROW-12066 - [Python] 測試以確保使用等於 null 的篩選不會崩潰
- ARROW-12768 - [C++] 測試中更嚴格的帶符號零比較
- ARROW-13294 - [C#] 建立 Flight 範例伺服器和用戶端
- ARROW-13412 - [C++] 修正分塊陣列 + 純量輸入上的 Kleene 核心
- ARROW-13462 - [C++] 修正 Compute API 文件中的範例程式碼片段
- ARROW-13628 - [Rust] 為 rust 啟用 IPC month_day_nano_interval 整合測試
- ARROW-13735 - [C++][Python] 使用非預設欄位名稱建立 Map 陣列會導致區段錯誤
- ARROW-13756 - [Python] datetimetz 欄位索引的 pandas 轉換錯誤
- ARROW-13780 - [Gandiva][UDF] 修正 udf space/rpad/lpad 中的錯誤
- ARROW-13861 - [JS] 建立具有 List 類型的 Field 將會拋出錯誤
- ARROW-13879 - [C++] regex 函數中對二進位類型的混合支援
- ARROW-13896 - [Python] 印出帶時區時間戳記時出錯
- ARROW-13947 - [C++] 在索引核心中支援更多類型
- ARROW-13948 - [C++] 在 is_in/index_in 中支援帶時區時間戳記
- ARROW-13950 - [C++] min_element_wise/max_element_wise 缺少對某些類型的支援
- ARROW-13981 - [Java] VectorSchemaRootAppender 不適用於 BitVector
- ARROW-14029 - [R] 修復 map_batches()
- ARROW-14151 - [C++] ASCII 字串函數中對二進位類型的混合支援
- ARROW-14238 - [Python] test_fs.py 中出現 “could not run mc” 錯誤
- ARROW-14253 - [R] 更新 lz4 測試,因錯誤訊息不同而在本機端失敗
- ARROW-14318 - [文件] 修正多次建置資料集文件的文件建置問題
- ARROW-14374 - [Java] Java 的 C 資料介面實作的整合測試
- ARROW-14389 - [C++][Gandiva] 修正帶有保留字元的 LIKE 運算式的效能錯誤
- ARROW-14395 - [R] 重新啟用 duckdb 自動清理
- ARROW-14405 - [C++] 修正來自 windows clang 的建置錯誤
- ARROW-14419 - [R] 新增篩選器 + 連接測試
- ARROW-14426 - [C++] 為資料集寫入新增 minimum_row_group_size
- ARROW-14429 - [C++] RecordBatchFileReader 在 S3 中的效能非常差
- ARROW-14437 - [Python] 使 CSV 取消測試更穩健
- ARROW-14461 - [R] write_dataset() 允許使用者傳遞無效的額外引數
- ARROW-14469 - [R] lubridate::month() 的綁定未實作
label
引數 - ARROW-14475 - [C++] 不要遮蔽 enable_if 輔助函數
- ARROW-14492 - [JS] 修正瀏覽器套件的匯出
- ARROW-14493 - [發行][Go] 將主要版本的匯入路徑更新新增至腳本
- ARROW-14513 - [發行][Go] 使用 /v6 後綴更新 release-6.0.0
- ARROW-14516 - [CI] 停用 Docker 執行的特權模式
- ARROW-14517 - [Python] CFeatherReader 的 CIpcReadOptions 中缺少 and 符號
- ARROW-14519 - [C++] 若在不支援的類型上進行連接,正確地產生錯誤
- ARROW-14522 - [C++] 修正具有 null 儲存類型的 ExtensionType 的驗證
- ARROW-14523 - [C++] 修正 S3 多部分上傳中潛在的資料遺失
- ARROW-14529 - [GLib] 驗證 Decimal{128,256}DataType 精度
- ARROW-14530 - [GLib] 為無效的十進位字串傳回錯誤
- ARROW-14538 - [R] 迴避 Solaris 上空的 tr 呼叫
- ARROW-14539 - [C++] 資料集掃描器測試未能通過 DCHECK
- ARROW-14550 - [文件] 移除 JSON 許可證;非免費許可證。
- ARROW-14554 - [C++][CI] 修正 OSS-Fuzz 建置失敗
- ARROW-14578 - [格式][文件] 更新 union-of-structs 文件
- ARROW-14582 - [CI] 在 60 分鐘後逾時 asan ubsan 工作
- ARROW-14583 - [C++] 在 Take 中處理空的分塊陣列,在 GroupByNode 中處理空的資料集
- ARROW-14584 - [Python][CI] Python sdist 安裝在最新的 setuptools 58.5 版本中失敗
- ARROW-14586 - [R] 具有巢狀彙總運算式的 summarise() 有令人困惑的錯誤
- ARROW-14589 - [CI][Go] 修正 CGO Windows 測試
- ARROW-14592 - [C++] list_parent_indices 輸出類型不應依賴於輸入類型
- ARROW-14593 - [C++] 修正無效 IPC 檔案上的崩潰 (OSS-Fuzz)
- ARROW-14594 - [R] 預設啟用 snappy+lz4
- ARROW-14595 - [R] 清理將 deps_source 設定為 auto 後的殘留
- ARROW-14598 - [C++][Flight] 修正範例的 protoc 產生依賴項
- ARROW-14600 - [文件] 修正 Python 開發頁面中的損壞連結
- ARROW-14616 - [C++] 修正 master 上的建置錯誤
- ARROW-14620 - [Python] 缺少 existing_data_behavior 的綁定,使其無法維持舊行為
- ARROW-14622 - [C++] 修正初始化順序災難報告
- ARROW-14625 - [Python][CI] 在 s390x 上啟用 Python 測試
- ARROW-14627 - [C++] 修正使用 GCC 11.1 時的測試編譯錯誤
- ARROW-14629 - [Python] 為 test_permutation_of_column_order 新增 pytest 資料集標記
- ARROW-14630 - [C++] 修正純量鍵欄位上的彙總
- ARROW-14640 - [R] 從 S3 讀取資料
- ARROW-14642 - [C++] ScanNode 未使用篩選運算式
- ARROW-14644 - [C++][R] open_dataset 未忽略 csv 檔案中的 BOM
- ARROW-14659 - [R] 移除 if_else() 中關於因子轉換為字串的警告
- ARROW-14664 - [C++] 修正 Parquet 編碼 DELTA_BYTE_ARRAY 接受的類型
- ARROW-14667 - [C++] 新增 dcheck 以確保在使用 s3 選項之前初始化 aws
- ARROW-14667 - [C++] 呼叫 arrow::S3FileSystem$create 時發生區段錯誤
- ARROW-14682 - [開發] 在非 x86 架構上驗證 go
- ARROW-14685 - [Python] 測試案例自動偵測 numpy 物件的位元組順序
- ARROW-14693 - [R] 非整數被傳遞到 chunk_size
- ARROW-14696 - [Java] 在重複使用向量綱要根時,在填入 JDBC 資料之前重設向量
- ARROW-14699 - [C++] 修正 lz4 未定義行為問題
- ARROW-14700 - [C++] 僅在存在偏移量時檢查時區偏移量符號
- ARROW-14701 - [Python][次要] 文件化 parquet.write_table row_group_size
- ARROW-14704 - [C++] 修正 parquet-arrow-test 中的 Valgrind 失敗
- ARROW-14709 - [C++][Java] 將 ORC 升級到 1.7.1 並使用官方 Apache 發佈站點
- ARROW-14710 - [R] 在 Linux arm64 上使用 cmake-X.X.X-Linux-x86_64 時發生安裝錯誤
- ARROW-14717 - [Go] 在 messageReader 中使用 ipc.Reader 分配器
- ARROW-14721 - [C++] 加強 DELTA_BYTE_ARRAY 解碼器
- ARROW-14722 - [R] 修正 altrep 向量負運算修改原始向量的問題
- ARROW-14728 - [Go] 將 LICENSE.txt 拉到新的模組根目錄
- ARROW-14739 - [JS] 確保文件指向正確的來源
- ARROW-14744 - [R] 當提供
schema
引數,但未向CSVReadOptions
提供column_names
時,open_dataset() 發生錯誤 - ARROW-14749 - [Python][發行] 設定發行驗證腳本以使用目標來源,而不是目前的來源目錄
- ARROW-14765 - [Python] StructFieldOptions 未公開
- ARROW-14766 - [Python] 將計算函數引數標記為僅限位置
- ARROW-14769 - [Go] 確保 MessageReader 錯誤被回報
- ARROW-14773 - [JS] 修正來源地圖路徑
- ARROW-14774 - [JS] 更正套件匯出
- ARROW-14778 - [C++] 在除法後對十進位類型取平均值進行四捨五入
- ARROW-14783 - [C++][Python] 修正 BytesIO 中寫入 ORC 的問題
- ARROW-14786 - [R] 在 6.0.1 修補程式發行後提升開發版本
- ARROW-14788 - [C++] 修正 dataset/file_orc_test.cc 中的警告
- ARROW-14791 - [C++] 修正驗證損壞的列表陣列時的崩潰
- ARROW-14792 - [C++] 修正讀取 DELTA_BYTE_ARRAY Parquet 檔案時的崩潰
- ARROW-14795 - [C++] 修正使用遮罩替換 null 值時的問題
- ARROW-14796 - [Python] 文件:更正預設值
- ARROW-14800 - [C++] 在啟用 C++17 的 MSVC 上消除 std::launder 的歧義
- ARROW-14803 - [R] 函數未在範圍內宣告
- ARROW-14839 - [R] test-fedora-r-clang-sanitizer 工作因 snappy 導致 sanitizer 錯誤而失敗
- ARROW-14840 - [R][CI] test-ubuntu-20.10-docs 夜間建置因 R 安裝問題而失敗
- ARROW-14851 - [Archery] 不要將 JSON 基準測試輸出轉儲到 stdout
- ARROW-14853 - [C++][Python] 改善遺失函數選項的錯誤訊息
- ARROW-14854 - [C++] 修正無效索引上的 struct_field 崩潰
- ARROW-14894 - [R] write_parquet 分塊大小計算中的整數溢位
- ARROW-14898 - [C++][Compute] 修正當鍵小於 int64 時,key_hash 中超出範圍的記憶體存取崩潰
- ARROW-14919 - [R] write_parquet() 捨棄分組資料框的屬性
- ARROW-14922 - [C++][Parquet] 修正 column-io-benchmark 拋出異常
- ARROW-14930 - [C++] 使 S3 目錄偵測更穩健
- ARROW-14931 - [Python] 某些資料集文件中遺失 csv/orc 格式字串
- ARROW-14933 - [JS] 當檢查類型時,apache-arrow 無法使用 typescript 編譯
- ARROW-14936 - [C++][Gandiva] 修正 gandiva 中的 split_part 函數
- ARROW-14937 - [文件] 確保文件目錄已掛載為磁碟區
- ARROW-14962 - [CI] 修正 s390x 上的 minio 安裝
- ARROW-14966 - [R][CI] 為依賴項安裝新增 CRAN 鏡像的冗餘
- ARROW-14979 - [C++] 修正 GCS 整合測試中的程序洩漏
- ARROW-14980 - [C++] GCS 測試使用 PYTHON 環境變數
- ARROW-14991 - [封裝][Python] Windows wheel 建置因錯誤的 vcpkg triplet 名稱而失敗
- ARROW-15002 - [Python] 修正間隔類型的 hypothesis 策略
- ARROW-15004 - [開發][Archery] 使用預設 simd 等級
- ARROW-15009 - [C++] 使 hash join 測試在 TSan 下不那麼慢
- ARROW-15027 - [C++] 修正 OpenTelemetry CMake 定義
- ARROW-15028 - [C++] 修正 Unity 建置上的 Gandiva 編譯失敗
- ARROW-15030 - [C++] CSV 寫入器測試失敗
- ARROW-15031 - [C++] 修正無效 Parquet 檔案上的崩潰 (OSS-Fuzz)
- ARROW-15041 - [R] 不穩定的 BOM 移除測試
- ARROW-15047 - [R][次要] 建議用於設定建置環境變數的 R 命令
- ARROW-15071 - [C#] 修正 Column.cs ValidateArrayDataTypes 方法中的錯誤
- ARROW-15076 - [C++][Gandiva] 修正 AES {en,de}cryption 結果的分配
- ARROW-15078 - [C++] 使用捆綁的 OpenTelemetry 消除 CMake 錯誤 “includes non-existent path”
- ARROW-15090 - [C++] 如果在仍有任務要執行時發生錯誤,SerializedAsyncTaskGroup 不會完成
- ARROW-15101 - [Python] 修正 CSV 寫入器的建置失敗
- ARROW-15105 - [R] CSV 中帶有 tz 元素的不支援時間戳記轉換
- ARROW-15123 - [R] CSV 資料集檔案標頭讀取為資料
- ARROW-15143 - [C++] 移除 StringBinaryTransformExecBase 的 Transform API 上不正確的註解
- ARROW-15144 - [Java] 無法在 master 中讀取 IPC 檔案
- ARROW-15145 - [R][CI] test-r-minimal-build 因更新的錯誤訊息而失敗
- ARROW-15147 - [CI][C++][Gandiva] 修正與 boost 依賴項相關的損壞的夜間建置
- ARROW-15171 - [C++][Java] 將 ORC 更新到 1.7.2
- ARROW-15181 - [C++][FlightRPC] 修正訊號處理常式和關機之間的競爭
- ARROW-15184 - [C++] 讀取帶和不帶 null 值的 delta 編碼 Parquet 檔案的單元測試
- ARROW-15185 - [R] 使 arrow 建置選項檢查不區分大小寫
- ARROW-15194 - [C++] 合併 ChunkedArray 建構函式
- ARROW-15199 - [Java] 更新 protobuf-maven-plugin 以避免 ‘Text file busy’ 失敗
- ARROW-15200 - [C++][Gandiva] 在使用 vcpkg 建置 LLVM 依賴項時啟用 RTTI
- ARROW-15226 - [Python] 更新 ChunkedArray 建構函式的 Cython 綁定
- ARROW-15231 - [封裝][deb] 新增遺失的 ArrowFlight-1.0.typelib
- ARROW-15234 - [Python] 修正自訂 CSV 無效列處理常式的崩潰
- ARROW-15241 - [C++] MakeArrayOfNull 在具有巢狀儲存類型的擴充類型上失敗
- ARROW-15243 - [CI][Python] 使 PyArrow 安裝在 CI 中更穩健
- ARROW-15265 - [C++] 修正資料集寫入器在 kDeleteMatchingPartitions 和 #partitions >= 8 時的掛起
- ARROW-15266 - [R][CI] 測試重組觸發 valgrind 錯誤
- ARROW-15286 - [Python] 將傳遞給 FileSystemDataset.take 的索引轉換為陣列,以避免區段錯誤
- ARROW-15290 - [Python][文件] PyArrow 的文件頁面有不正確的超連結
- ARROW-15306 - [C++] 若未指定,S3FileSystem 應將 content-type 標頭設定為 application/octet-stream
- ARROW-15315 - [Java][FlightRPC] FlightSqlProducer#doAction 始終拋出 INVALID_ARGUMENT
- ARROW-15318 - [C++][Python] 迴歸讀取大型批次的分割鍵。
- ARROW-15323 - [CI] 夜間 spark 整合建置正在失敗
- ARROW-15324 - [C++] 避免在 HDFS 檔案關閉失敗時崩潰
- ARROW-15325 - [R] 修正關於 map_batches 收集的 CRAN 註解
- ARROW-15326 - [C++] 修正 Gandiva 崩潰
- ARROW-15335 - [Java] 修正 UnionListReader 中針對空 List 的 setPosition 呼叫
- ARROW-15358 - [C++] 修正自訂匹配器編譯
- ARROW-15360 - [Python] 檢查 Buffer.slice() 中的切片邊界
- ARROW-15362 - 將 OMP_NUM_THREADS 設定為 1 會導致資料集掛起
- ARROW-15370 - [Python] 修正空表格轉換為 pandas 的迴歸
- ARROW-15371 - [C++][發行] 驗證 docker 映像檔中缺少 libsqlite-dev
- ARROW-15372 - [C++][Gandiva] Gandiva 現在依賴於 boost/crc.hpp,該檔案在精簡的 boost 封存檔中遺失
- ARROW-15376 - [Go][發行] cpu_arm64 需要 +build 註解
- ARROW-15377 - [發行] 在 macOS 驗證建置中將 nodejs 版本提升到 16
- ARROW-15378 - [C++][發行] windows 驗證期間的 GTest 連結錯誤
- ARROW-15380 - [Python][發行] 驗證期間的 NumPy ABI 不相容性
- ARROW-15385 - [整合] 在整合測試中將持續時間從間隔中分離出來
- ARROW-15388 - [C++] 避免從 flatbuffers 包含 absl
- ARROW-15393 - [發行][Crossbow] 回退到
dev0 當產生的 scm 版本號碼沒有距離時 - ARROW-15394 - [CI][文件] 修正 env 變數,以確保在文件建置中使用 doxygen
- ARROW-15395 - [發行][Ruby] Ruby 驗證在 M1 上失敗
- ARROW-15403 - [Python][封裝] 使用捆綁的 ORC 來建置 python wheel
- ARROW-15404 - [Java][封裝] 使用捆綁的 ORC 來建置 java JNI jar
- ARROW-15414 - [java] RangeEqualsVisitor 不適用於 BitVector
- ARROW-15417 - [Python][封裝] 使用 vcpkg manifest 安裝 wheel 依賴項;透過建置捆綁版本來降級 AWS SDK
- ARROW-15420 - [Python] 若找不到 GDB 腳本則跳過
- ARROW-15424 - [C++][GLib] 修正 CUDA 綁定
- ARROW-15427 - [C++][Gandiva] 使用鎖定保護器來持有互斥鎖
- ARROW-15433 - [文件] 修正建置時的警告
- ARROW-15437 - [Python][FlightRPC] 修正不穩定的測試 test_interrupt
- ARROW-15438 - [Python] 不穩定的測試 test_write_dataset_max_open_files
- ARROW-15441 - [C++][Compute] 修正 null 類型欄位的 hash_count 的不正確結果
- ARROW-15442 - [C++][Python] 在非偵錯建置上跳過 GDB 測試
- ARROW-15447 - [C++] 避免 ORC 選項 API 和 glibc 定義的巨集之間的衝突
- ARROW-15451 - [C++] 修正使用 C++17 和 ARROW_GCS=ON 的建置
- ARROW-15454 - [Python] 嘗試使 CSV 取消測試更穩健
- ARROW-15461 - [C++] 避免 ReverseBitmap 中的 clang 錯誤
- ARROW-15467 - [Go][Parquet] 修正 s390x 上的 pqarrow 十進位測試
- ARROW-15485 - [發行][Java] 修正 java jars 上傳腳本
- ARROW-15488 - [Go] 修正 ipc.Writer 損壞 null 位元圖的問題
- ARROW-15493 - [C++][Gandiva] 初始化 ExpressionCacheKey.mode_
- ARROW-15499 - [Python] 修正 pyarrow._orc 中的匯入錯誤
- ARROW-15504 - [Python] 確保測試 ORC 綁定
- ARROW-15509 - [Go][Parquet] Parquet mainprogs 崩潰
- ARROW-15514 - [C++][Gandiva] 新增標誌以啟用 Gandiva 物件程式碼
- PARQUET-1856 - [C++] 避免在停用 Snappy 支援的情況下測試失敗
- PARQUET-2109 - [C++] 檢查 Parquet 頁面是否值太少
新功能與改進
- ARROW-1299 - [文件] 在某處發布針對 master 的夜間文件
- ARROW-1699 - [C++] 前向、後向填充核心函數
- ARROW-2366 - [Python][C++][Parquet] 新增測試以確保支援讀取具有欄位順序排列的 Parquet 檔案
- ARROW-3699 - [C++] 用於測試 32 位元 C++ 建置的 Dockerfile
- ARROW-4975 - [C++] 支援 UnionArrays 的串聯
- ARROW-5599 - [Go] 將 array.{Interface,Record,Column,Chunked,Table} 遷移到 arrow.{Array,Record,Column,Chunked,Table}
- ARROW-6001 - [Python] : 在 pyarrow.Table 中新增 from_pylist() 和 to_pylist() 以轉換記錄列表
- ARROW-6276 - [C++] 針對某些 arrow 類別的修改
- ARROW-8285 - [Python][Dataset] 測試 ScalarExpression 接受 numpy 純量
- ARROW-8605 - [R] 將 brotli 新增至 Windows R 建置
- ARROW-8823 - [C++] 將批次緩衝區總大小新增至 IPC 寫入統計資訊
- ARROW-9186 - [R] 允許指定 CSV 檔案編碼
- ARROW-9483 - [C++] 重新組織測試標頭檔
- ARROW-9630 - [Go] 實作公開的 JSON 讀取器/寫入器
- ARROW-10209 - [Python] 支援運算函數中的位置選項
- ARROW-10220 - [JS] 快取 javascript utf-8 字典索引鍵?
- ARROW-10317 - [Python] 文件化運算函數選項
- ARROW-10456 - [R] 實作 MapType 和 MapArray
- ARROW-10998 - [C++] 偵測預期檔案系統路徑的 URI
- ARROW-11297 - [C++][Python] 新增 ORC 寫入器選項
- ARROW-11347 - [JS] 考慮使用 Objects 而非 Maps
- ARROW-11424 - [C++] StructType::{AddField,RemoveField,SetField} 成員函數
- ARROW-11475 - [C++] 將 mimalloc 升級至 v1.7.3
- ARROW-11938 - [R] 讓 R 建置程序能在 Windows 上找到本地建置的 C++ 函式庫
- ARROW-12053 - [C++] 針對十進位資料類型實作彙總運算函數
- ARROW-12060 - [Python] 允許在 Expressions 上呼叫運算函數
- ARROW-12315 - [R] 在 write_dataset() 中新增 max_partitions 參數
- ARROW-12404 - [C++] 實作產生 0 到 1 之間均勻隨機數的 “random” 無引數函數
- ARROW-12422 - [C++][Gandiva] 從日期毫秒函數新增 castVARCHAR
- ARROW-12480 - [Java][Dataset] FileSystemDataset: 支援從目錄讀取
- ARROW-12516 - [C++][Gandiva] 實作 castINTERVALDAY(varchar) 和 castINTERVALYEAR(varchar) 函數
- ARROW-12536 - [JS] 從 JavaScript 類型建構表格
- ARROW-12538 - [JS] 在文件中顯示 Vectors
- ARROW-12545 - [Python][Docs] 填寫關於自訂 Schema 和 Field Metadata 的章節
- ARROW-12548 - [JS] 移除 columns
- ARROW-12549 - [JS] Table 和 RecordBatch 不應延伸 Vector,使 JS 函式庫更小
- ARROW-12595 - [C++][Gandiva][binary][string] 函數
- ARROW-12607 - [Website] Dataset Java 綁定的文件章節
- ARROW-12671 - [C++] 將 OpenTelemetry 新增至 ThirdpartyToolchain
- ARROW-12683 - [C++] 在 IPC 讀取器中啟用細粒度 I/O (合併)
- ARROW-12706 - [Python] 移除 Python 3.6 支援
- ARROW-12712 - [C++] 字串重複核心
- ARROW-12735 - [C++] 撰寫 GDB 外掛程式
- ARROW-12803 - [C++] [Dataset] 使用 scanner 寫入 dataset 不支援非同步掃描
- ARROW-12820 - [C++] 在 ISO8601、strptime 解析器中支援時區偏移
- ARROW-12858 - [C++][Gandiva] 在 Gandiva 上新增 isNull、isTrue、isFalse、isNotTrue、IsNotFalse 和 NVL 函數
- ARROW-12880 - [C++][Gandiva] 新增 castTIME(int32)、castTIMESTAMP(int64) 和 castTIME(utf8) 函數
- ARROW-12922 - [Java][FlightSQL] 為 Flight SQL 建立 Stubbed API
- ARROW-12943 - [Gandiva][C++] 實作 MD5 Hive 函數
- ARROW-13016 - [C++][Compute] 在 Sum/Mean 聚合中支援 Null 類型
- ARROW-13035 - [C++] indices_nonzero 運算函數
- ARROW-13051 - [Release][Java] 使用 Crossbow 建置的 Artifacts
- ARROW-13081 - [C++] 不允許比較時區感知和樸素時間戳記
- ARROW-13087 - [R] 公開 Parquet ArrowReaderProperties::coerce_int96_timestamp_unit
- ARROW-13111 - [R] ChunkedArray 的 altrep vectors
- ARROW-13130 - [C++] 在算術核心中新增十進位支援
- ARROW-13156 - [R] str_count 的綁定
- ARROW-13208 - [Python][CI] 建立用於驗證 python docstring 的建置
- ARROW-13328 - [C++][Dataset] 對於同步掃描使用 ExecPlan 或捨棄同步掃描
- ARROW-13338 - [C++][Dataset] 將非同步 Scanner 設定為預設值
- ARROW-13362 - [R] 清理 Arrow 訊息傳遞中的 in/by
- ARROW-13371 - [R] make_struct -> StructArray$create() 的綁定
- ARROW-13373 - [C++][Gandiva] 在 Gandiva 上實作 CRC32 Hive 函數
- ARROW-13376 - [C++][Gandiva] 在 Gandiva 上實作 FACTORIAL Hive 函數
- ARROW-13377 - [C++][Gandiva] 在 Gandiva 上實作 PMOD Hive 函數
- ARROW-13383 - [R] 為沒有範例的函數新增範例
- ARROW-13398 - [R] 更新 install.Rmd vignette
- ARROW-13400 - [R] 更新 fs.Rmd (使用 S3) vignette
- ARROW-13401 - [R] : 更新 python.Rmd vignette
- ARROW-13408 - [Packaging] 更新 crossbow 以檢出特定的 git hash
- ARROW-13449 - [Format] 更新與 schema 的 wire format 相關的文件
- ARROW-13467 - [C++] 在 IPC 檔案格式中支援 delta 字典
- ARROW-13494 - [C++] 重新命名 BitUtil 和 LittleEndianArray 命名空間
- ARROW-13514 - [JS] 更新 flatbuffers
- ARROW-13536 - [C++] 使用來自 fast-float 的小數點感知轉換
- ARROW-13553 - [Doc] 新增程式碼審查指南
- ARROW-13554 - [C++] 移除已棄用的 Scanner::Scan
- ARROW-13558 - [C++] 驗證十進位陣列/純量
- ARROW-13571 - [Python][ORC] 公開 stripe size ORCWriter API
- ARROW-13579 - 公開 Create EmptyArray、EmptyRecordBatch 和 EmptyTable 工具函數。
- ARROW-13589 - [C++] 協調 ValidateArray 和 ValidateArrayFull
- ARROW-13590 - [C++] 確保 dataset 寫入應用背壓
- ARROW-13598 - [C++] 移除 Datum::COLLECTION
- ARROW-13607 - [C++] 將 Skyhook 新增至 Arrow
- ARROW-13610 - [R] 取消 cpp11 的 vendor
- ARROW-13615 - [R] stringr::str_to_sentence 的綁定
- ARROW-13617 - [C++] 使 Decimal 表示法一致
- ARROW-13623 - [R] 更新 write_csv_arrow 以遵循 readr::write_csv 的簽名
- ARROW-13643 - [C++][Compute] 實作支援殘餘謂詞的外連接
- ARROW-13663 - [C++] RecordBatchReader 類似 STL 的迭代
- ARROW-13668 - [Python] 在
ParquetWriter
中新增write_batch
和write
方法 - ARROW-13707 - [Doc] Cookbook 版本 2
- ARROW-13711 - [Doc][Cookbook] 使用 Arrow Flight RPC 伺服器透過網路傳送和接收資料 - R
- ARROW-13781 - [Python] 允許 parquet 寫入器中每個資料行的編碼
- ARROW-13811 - [Java] 提供通用的異地排序器
- ARROW-13826 - [C++][Gandiva] 在 Gandiva 上實作 QUOTE Hive 函數
- ARROW-13828 - [C++][Gandiva] 在 Gandiva 上實作 SOUNDEX Hive 函數
- ARROW-13829 - [C++][Gandiva] 在 Gandiva 上實作 GREATEST 和 LEAST Hive 函數
- ARROW-13830 - [C++][Gandiva] 在 Gandiva 上實作 CHR Hive 函數
- ARROW-13832 - [Doc] 改善運算文件
- ARROW-13834 - [R][Documentation] 文件化建立運算核心的 R 綁定的過程以及慣例背後的理由
- ARROW-13841 - [Doc] 文件化組成 CI 的不同子元件以及它們如何組合在一起
- ARROW-13886 - [R] 擴展 decimal() 的文件
- ARROW-13887 - [R] 捕捉讀取帶有標頭且使用 schema 的 CSV 檔案時產生的錯誤,並新增建議
- ARROW-13888 - [R] 重新措辭 schema() 的 ellipses 參數的文件並重新措辭錯誤訊息
- ARROW-13923 - [C++] 更快的 CSV chunker,可處理長的 CSV cell
- ARROW-13943 - [Python] 從運算模組隱藏 hash_aggregate 函數
- ARROW-13984 - [Go][Parquet] 檔案讀取器
- ARROW-13984 - [Go][Parquet] go parquet 的檔案處理,僅限於讀取器
- ARROW-13986 - [Go][Parquet] 新增檔案寫入器和測試
- ARROW-13987 - [C++] 支援巢狀欄位參考
- ARROW-13988 - [C++] 在 hash_min_max 中支援基本二進制類型
- ARROW-13989 - [C++] 在運算函數中新增對 month-day-nano interval 的支援
- ARROW-14011 - [C++][Gandiva] 將 elt hive 函數新增至 gandiva
- ARROW-14022 - [Dev] 移除 arrow/dev/benchmarking
- ARROW-14032 - [C++][Gandiva] 將 concat_ws hive 函數新增至 gandiva
- ARROW-14039 - [C++][Docs] 指示建置的記憶體需求
- ARROW-14041 - [C++] 在 Parquet 解碼器中取代 BitmapReader 的使用
- ARROW-14048 - [C++][Gandiva] 在記憶體中僅快取物件程式碼,而非整個模組
- ARROW-14051 - [R] 處理封閉彙總表達式的條件式
- ARROW-14074 - [C++][Compute] 運算 IR 的 C++ 消費者
- ARROW-14092 - [C++] subtract(date, duration) -> timestamp 核心
- ARROW-14166 - [C++] 更新 vcpkg 內建基準
- ARROW-14167 - [C++][R] 在 coalesce 中直接支援字典
- ARROW-14171 - [C++][Python][Packaging] 升級 VCPKG 版本並新增 google-cloud-cpp 相依性
- ARROW-14174 - [C++] 重複資料刪除某些 Decimal/FixedSizeBinary 核心
- ARROW-14181 - [C++][Compute] 在 hash join 中支援字典
- ARROW-14189 - [Docs] 在 sphinx 文件中新增版本下拉選單
- ARROW-14193 - [C++][Gandiva] 實作 INSTR 函數
- ARROW-14205 - [C++] 新增 utf8_normalize 運算函數
- ARROW-14227 - [R] 實作 lubridate is.* 方法
- ARROW-14229 - [C++] 提升捆綁相依性的版本
- ARROW-14231 - [C++] 支援將帶有時區的時間戳記轉換為字串
- ARROW-14242 - 公開
to_string
中正確的indent
參數 - ARROW-14277 - [R] 2021 年第四季 R 教學課程倡議
- ARROW-14278 - [Doc] 新貢獻者指南
- ARROW-14294 - [Doc][Python] 在 pyarrow 文件中新增關於 Flight 的教學課程
- ARROW-14297 - [R] 平滑整數除法以更好地匹配 R
- ARROW-14306 - [C++][Compute] 新增二進制反向核心
- ARROW-14310 - [R] 使 expect_dplyr_equal() 更直觀
- ARROW-14311 - [C++] 加快 GCS FileSystem 測試速度
- ARROW-14315 - [C++][Gandiva] 實作 BROUND 函數
- ARROW-14336 - [C++] 在 Apache 管理的位置維護捆綁相依性 tarball
- ARROW-14338 - [Docs] 在 pkgdown (R) 文件中新增版本下拉選單
- ARROW-14346 - [C++] 實作 GcsFileSystem::OpenOutputStream
- ARROW-14347 - [C++] GcsFileSystem 的隨機存取檔案
- ARROW-14349 - [IR] 移除 RelBase
- ARROW-14350 - [IR] 將篩選表達式新增至 Source 節點
- ARROW-14351 - [IR] 將投影列表新增至 Source 節點
- ARROW-14352 - [IR] 從 Source 移除 schema 屬性
- ARROW-14355 - [C++] 建立演算法的簡單實作,以估計表格/批次緩衝區大小
- ARROW-14356 - [C++] 建立核心以確定陣列「參考」的緩衝區記憶體(即使有偏移量)
- ARROW-14365 - [R] 更新 README 範例以反映新功能
- ARROW-14384 - [Docs] 新增關於在不建置 pyarrow 的情況下建置 Sphinx 文件的文件
- ARROW-14385 - [C++] 更新 google-cloud-cpp
- ARROW-14388 - [Python] 為 pandas masks 新增單元測試
- ARROW-14390 - [Packaging][Ubuntu] 新增 Ubuntu 21.10 支援
- ARROW-14391 - [Docs] Archery 需要 docker
- ARROW-14398 - [CI] 請勿在所有 conda 建置中建置 doxygen 文件
- ARROW-1409 - [Packaging][Python] 更新 manylinux 平台標籤
- ARROW-14412 - [R] 當 data arg 物件類型錯誤時,為 flight_put() 提供更好的錯誤處理
- ARROW-14413 - [C++][Gandiva] 實作 levenshtein 函數
- ARROW-14416 - [R] 修正 Raspberry Pi 上的套件安裝
- ARROW-14421 - [C++] 實作 Flight SQL
- ARROW-14430 - [Go] 基本 Expression、欄位參考和 Datum 處理
- ARROW-14431 - [C++][Gandiva] 實作 AES ENCRYPT 和 AES DECRYPT 函數
- ARROW-14433 - [Release][APT] 跳過 arm64 Ubuntu 21.04 驗證
- ARROW-14435 - [Release] 更新驗證腳本以檢查 python 3.10 wheels
- ARROW-14436 - [C++] 在使用 ccache 編譯時停用顏色診斷
- ARROW-14438 - [CI] 請勿取消 main 分支上的建置
- ARROW-14440 - [C++][FlightRPC] 新增 gRPC + Flight 範例
- ARROW-14441 - [R] 將我們的哲學新增至 dev vignette
- ARROW-14446 - [Docs][Release] 更新關於驗證候選發布版本的說明文件
- ARROW-14448 - [Python] 更新 pyarrow.array() docstring 中關於時間戳記(時區)轉換的註解
- ARROW-14449 - [Python] Cython 中的 RecordBatch 缺少 column_data 方法
- ARROW-14450 - [R] 舊版 macos 建置錯誤
- ARROW-14451 - [Release][Ruby]
--path
旗標已棄用 - ARROW-14452 - [Release][JS] 更新 JavaScript 測試
- ARROW-14454 - [Release] shasum 在 CentOS 8 上不可用
- ARROW-14459 - [Doc] 將固定的 sphinx 版本更新至 4.2
- ARROW-14462 - [Go][Parquet] 更新相依性
- ARROW-14464 - [R] 將 write_parquet() 的預設 chunk_size 從所有列變更
- ARROW-14470 - [Python] 在 Feather 讀取函數中公開 use_threads 選項
- ARROW-14476 - [CI] Crossbow 應註解失敗原因
- ARROW-14479 - [C++] Hash Join 微基準測試
- ARROW-14480 - [R] 將 arrow::dataset::ExistingDataBehavior 公開給 R
- ARROW-14482 - [C++][Gandiva] 實作 MASK_FIRST_N 和 MASK_LAST_N 函數
- ARROW-14483 - [Release] 新增遺失的下載目標
- ARROW-14484 - [Crossbow] 新增透過環境變數指定佇列路徑的支援
- ARROW-14486 - [Packaging][deb] 新增遺失的 libthrift-dev 相依性
- ARROW-14489 - [Rust][CI] 在整合 docker 映像檔中安裝穩定的 rust 工具鏈
- ARROW-14490 - [Doc] 重新產生 CHANGELOG.md 以包含所有版本
- ARROW-14491 - [CI] 新增 Debian 10 C++ nightly 建置
- ARROW-14496 - [Docs] 在 sphinx toctree 中使用 stub 頁面為 R / JS / C/Glib 參考建立相對連結
- ARROW-14499 - [Docs] 版本下拉選單與搜尋框並排
- ARROW-14505 - [CI][Docs] 更頻繁地執行文件建置
- ARROW-14510 - [R][CI] 確保 docker 執行不會使用主機建置的 Artifacts
- ARROW-14514 - [C++][R] round 核心上的 UBSAN 錯誤
- ARROW-14515 - [R] 將 clang sanitizer 新增至 crossbow
- ARROW-14531 - [Ruby] 新增 Arrow::Table#join
- ARROW-14533 - [R] 在新行的大括號上關閉 linter
- ARROW-14551 - [Ruby] 接受 Arrow::Column 作為 Arrow::Datum 參數
- ARROW-14558 - [R] 釐清 Arrow vignette 中的 OOP 系統措辭
- ARROW-14559 - [C++] 減少 GcsFileSystem::OpenInputStream 中的記憶體使用量
- ARROW-14562 - [Ruby] 新增從 URI 載入 Arrow::Table 的支援
- ARROW-14577 - [C++] 為非同步 IPC 讀取器啟用細粒度 IO
- ARROW-14580 - [Python] 更新 trove classifiers 以包含 Python 3.10
- ARROW-14581 - [C++] 細粒度 IPC 讀取器測試不穩定
- ARROW-14585 - [C++] 透過 pkg-config 尋找 libgrpc++_reflection
- ARROW-14590 - [R] 實作 lubridate::week
- ARROW-14599 - [Release][Java] 將 .jar 上傳至 Artifacts
- ARROW-14601 - [JAVA] 修正時間戳記秒數的註解
- ARROW-14602 - [Doc] 教學課程 - Python 功能 PR
- ARROW-14603 - [Doc] 教學課程 - R 綁定
- ARROW-14605 - [Doc] 一般大綱
- ARROW-14608 - [Python] 透過 Table.group_by 方法提供對 hash_aggregate 函數的存取
- ARROW-14609 - [R] left_join by 參數錯誤訊息不符
- ARROW-14610 - [Doc] 新貢獻者指南:簡介 + 骨架
- ARROW-14615 - [C++] 重構巢狀欄位參考並新增 union 支援
- ARROW-14617 - [R][CI] 將 clang sanitizer 上游至 rhub
- ARROW-14618 - [Release] 將遺失的 AlmaLinux artifacts URL 新增至投票電子郵件範本
- ARROW-14619 - [Ruby] 使用 no @ openssl Homebrew 套件進行 pkg-config
- ARROW-14623 - [Packaging][Java] 不僅上傳 .jar,還上傳 .pom
- ARROW-14626 - [Website] 更新測試版本
- ARROW-14628 - [Release][Python] 使用 python -m pytest
- ARROW-14636 - [Ruby] 在文件中新增 Cookbook 章節
- ARROW-14637 - [GLib][Ruby] 新增明確初始化 S3 API 的支援
- ARROW-14641 - [C++][Compute] 減少單元測試中的 print 語句
- ARROW-14645 - [Go] 將 ValueOffsets 函數新增至 array.String
- ARROW-14650 - [JS] toArray 等同於 values/values64
- ARROW-14652 - [R] Dataset vignette 下載腳本可能因預設選項而失敗
- ARROW-14653 - [R] head() 在 CSV datasets > 600MB 時會 hang 住
- ARROW-14654 - [R][Docs] 在 dev 文件中新增關於如何使用 C++ 除錯器執行 R 的文章
- ARROW-14657 - [R][Docs] R 文件中的連結已損壞
- ARROW-14658 - [C++] 在掃描中新增對巢狀欄位參考的基本支援
- ARROW-14662 - [Docs] 新增關於連結 Flight/gRPC/Protobuf 的註解
- ARROW-14669 - [JS] 釐清 Perspective 對 apache arrow 的使用
- ARROW-14670 - [Release][Java] 建置遺失的 javadoc 和 source .jar
- ARROW-14671 - [Python][Doc] 關於如何整合 PyArrow 和 R 的文件
- ARROW-14675 - [R] 為 NEWS.md 啟用 union 合併
- ARROW-14676 - [R][Docs] 在 dev 文件中新增關於如何透過 docker 建置幾種不同設定的文章
- ARROW-14678 - [C++] 為快速開發設定新增合理的 CMake 預設值
- ARROW-14683 - [Release][Java] 建置遺失的 source-release.zip
- ARROW-14684 - [CI][C++] 在 macOS 上使用 aws-sdk-cpp 套件
- ARROW-14686 - [Python][C++] 使 numpy 內建類型的位元組順序偵測正確
- ARROW-14694 - [R] 讓我 dput 一個 schema
- ARROW-14712 - [R] 修正 dplyr 1.0.8 的 compare_dplyr_error()
- ARROW-14714 - [C++][Doc] 重新設計 CMake 預設值並新增文件
- ARROW-14715 - [Doc] 製作您的第一個 PR 的步驟 - 尋找 issue
- ARROW-14716 - [R][CI] 提升 docker 測試中使用的 R 版本
- ARROW-14718 - [Java] 當輸入不為 null 且只有 null 或非 null 值時,loadValidityBuffer 應避免分配記憶體
- ARROW-14732 - [Python] 當傳遞錯誤的位置引數數量時,改善運算函數中的錯誤訊息
- ARROW-14733 - [R] 在除錯器文件中新增關於當程式 hang 住時如何取得輸出的章節
- ARROW-14737 - [C++][Dataset] 支援 URI 解碼分割區索引鍵
- ARROW-14738 - [Python][Doc] 使回傳類型可點擊
- ARROW-14741 - [C++] 在 CSV 寫入器中新增對 RecordBatchReader 的支援
- ARROW-14743 - [C++] 當 schema 中有分割變數時,讀取 dataset 時發生錯誤
- ARROW-14746 - [CI] 允許(暫時)停用持續失敗的 nightly 建置
- ARROW-14747 - [Release] 新增一個腳本以合併發布分支中的變更
- ARROW-14748 - [C++][CI] 更新旗標以針對未使用的結果發出警告
- ARROW-14750 - [Release] 為 6.0.1 更新 post-03-website.sh
- ARROW-14751 - [C++] 為 set lookup “meta” 運算函數新增文件
- ARROW-14752 - [Doc] 製作您的第一個 PR 的步驟 - 設定
- ARROW-14753 - [Doc] 製作您的第一個 PR 的步驟 - 建置 C++
- ARROW-14754 - [Doc] 製作您的第一個 PR 的步驟 - 建置 R 套件
- ARROW-14755 - [Doc] 製作您的第一個 PR 的步驟 - 建置 PyArrow
- ARROW-14756 - [Doc] 製作您的第一個 PR 的步驟 - Python 綁定
- ARROW-14757 - [Doc] 製作您的第一個 PR 的步驟 - R 綁定
- ARROW-14758 - [文件] 首次提交 PR 的步驟 - 在 Python 中測試
- ARROW-14759 - [文件] 首次提交 PR 的步驟 - 在 R 中測試
- ARROW-14760 - [文件] 首次提交 PR 的步驟 - PR 生命周期
- ARROW-14761 - [文件] 協助文件編寫
- ARROW-14762 - [文件] 額外資訊與資源
- ARROW-14763 - [文件] Arrow 一般概述
- ARROW-14764 - [網站] 新增安裝 Go 套件的說明
- ARROW-14768 - [C++] 驗證計算函數 docstring 格式
- ARROW-14777 - [發佈] 啟用在 RHEL 衍生版本上運行
- ARROW-14779 - [C++] 在 RoundMode 文件中新增其他常見的捨入模式名稱
- ARROW-14784 - [GLib][Ruby] 將 GArrowSortKey::name 重新命名為 ::target
- ARROW-14804 - [R] import_from_c() / export_to_c() 方法應接受外部指標
- ARROW-14807 - [R] 實作 lubridate am 和 pm 的綁定
- ARROW-14816 - [R] 實作 lubridate::mday 的綁定
- ARROW-14822 - [C++] 實作 temporal 物件的 floor/ceil/round 函數
- ARROW-14823 - [R] 實作 lubridate::leap_year 的綁定
- ARROW-14842 - [C++] 改善 Decimal 的精度範圍錯誤訊息
- ARROW-14843 - [R] 實作
decimal128()
(取代decimal()
) - ARROW-14844 - [R] 實作 decimal256()
- ARROW-14849 - [R] 更新安裝腳本中的訊息
- ARROW-14850 - [R] 更新 ARROW_DEPENDENCY_SOURCE 預設為 AUTO
- ARROW-14857 - [持續整合][Homebrew] 新增 apache-arrow-glib 公式
- ARROW-14858 - [R][持續整合] 在 ubuntu 21.04 上不要建置額外的依賴項
- ARROW-14880 - [持續整合][C++] 在 MacOS 建置上啟用 ccache
- ARROW-14897 - [持續整合][C++] 將 Clang Tools 從 8 升級到 12
- ARROW-14899 - [C++] 實作 GcsInputStream::GetMetadata
- ARROW-14903 - [C++] 啟用 CSV Writer 控制用於遺失資料的字串
- ARROW-14905 - [C++] 啟用 CSV Writer 處理引用
- ARROW-14907 - [C++] 啟用 CSV Writer 控制行尾字元
- ARROW-14910 - [R][持續整合] 使用 dev duckdb 在少於 8GB 記憶體下建置
- ARROW-14912 - [C++] 實作 GcsFileSystem::CopyFile
- ARROW-14913 - [C++] 實作 GcsFileSystem::DeleteFile
- ARROW-14914 - [C++] gcsfs 將不實作 DeleteRootDirContents
- ARROW-14915 - [C++] 實作 GcsFileSystem::DeleteDirContents
- ARROW-14916 - [C++] GcsFileSystem 可以刪除目錄
- ARROW-14917 - [C++] 實作 GcsFileSystem::CreateDir
- ARROW-14918 - [C++] 實作 GcsFileSystem::GetFileInfo(FileSelector)
- ARROW-14920 - [C++] 使用字母順序排序
- ARROW-14924 - [C++] GcsFileSystem 的通用 fs 測試
- ARROW-14926 - [文件] 修正版本下拉選單可見性的 CSS
- ARROW-14929 - [持續整合] 修正 kartothek 整合建置 (安裝新的依賴項)
- ARROW-14932 - [持續整合] 偏好使用 mamba 而非 conda
- ARROW-14935 - [Ruby] 新增 GArrowTemporalDataType
- ARROW-14940 - [C++] 加速處理長 CSV 單元的 CSV 解析器
- ARROW-14941 - [R] 實作 Duration R6 類別以及 lubridate::duration() 的綁定
- ARROW-14957 - [C++] 更新 OpenTelemetry 至 v1.1.0
- ARROW-14961 - [C++] 提升 google benchmark 版本
- ARROW-14968 - [Python] 使用 oldest-supported-numpy 固定 numpy 建置依賴項
- ARROW-14969 - [C++][Python] 取消 FileSystem::OpenAppendStream 的棄用
- ARROW-14971 - [C++] 實作 GcsFileSystem::Move
- ARROW-14975 - [文件] 修正 emit_dictionary_deltas 文件中的錯字
- ARROW-14976 - [開發][Archery] 如果找不到基準測試則提早失敗
- ARROW-14977 - [Python] 為指南教學新增一個「虛構」功能
- ARROW-14981 - [持續整合][文件] 上傳已建置的文件
- ARROW-14984 - [持續整合][Debian] 缺少 rsync
- ARROW-14985 - [持續整合][Go] 使用 Go 1.16
- ARROW-14986 - [發佈][文件] 使用 Crossbow 建置的產出
- ARROW-14990 - [持續整合] 修正 nightly dask 整合建置 (確保已安裝 pandas)
- ARROW-14992 - [R] 安裝無法在 Pop! OS 上使用預先建置的 Arrow 二進制檔案
- ARROW-15005 - [C++] 使用 Neon 改善 csv 解析器
- ARROW-15010 - [R] 為我們的 NSE 函數建立函數註冊表
- ARROW-15019 - [Python] 為新的資料集寫入選項新增綁定
- ARROW-15022 - [R] 安裝 vignette 和安裝開發 vignette 需要為圖片加上 alt text
- ARROW-15029 - [C++] 分割 compute/kernels/scalar_string.cc
- ARROW-15032 - [C++] 新增 year_month_day 函數
- ARROW-15036 - [C++] 自動設定 S3 SDK 組態參數 “maxConnections”
- ARROW-15038 - [封裝][CentOS] 停止支援 CentOS 8
- ARROW-15043 - [Python][文件] 在 pandas <-> arrow 的型別轉換表中包含 time64
- ARROW-15044 - [C++] 新增 OpenTelemetry exporters 以供偵錯使用
- ARROW-15049 - [R] arrowExports.cpp 的生成隨著 glue 套件 1.5.1 而改變
- ARROW-15055 - [C++] 重構 GcsFileSystem 測試
- ARROW-15056 - [C++] 加速 GcsFileSystem 測試
- ARROW-15057 - [R][持續整合] 移動我們在 CI 中安裝 DuckDB 的位置
- ARROW-15058 - [Java] 移除效能模組中的 log4j2 依賴項
- ARROW-15070 - [Python][C++][R][文件] 在資料集文件中針對缺乏 ACID 保證新增一般聲明
- ARROW-15074 - [格式] 澄清 LZ4 包含單一 frame
- ARROW-15077 - [Python] 將 Expression 類別從 _dataset 移動到 _compute cython 模組
- ARROW-15082 - [R] 清理另一個 duration 映射條目
- ARROW-15084 - [C++] GcsFileSystem 的公開工廠函數
- ARROW-15085 - [C++] 在 GcsFileSystem 中支援憑證類型
- ARROW-15087 - [Python][文件] 文件化 MapArray 並將父類別更新為 ListArray
- ARROW-15091 - [C++][文件] 文件化 C++ streaming execution engine 中的節點
- ARROW-15095 - [開發][網站] Changelog 生成應使用 commit 訊息
- ARROW-15096 - [R] 使用 duration 型別時 Sanitizer 失敗
- ARROW-15099 - [C++] 改善 GcsFileSystem::GetFileInfo
- ARROW-15100 - [持續整合] 停止預設使用 Python 3.6
- ARROW-15103 - [文件][C++] 建置文件時發生錯誤:「arrow/cpp/src/arrow/csv/options.h:182: error: Found unknown command ‘\r’ “
- ARROW-15109 - [Python] 新增 show_info() 以印出建置、組件和系統資訊
- ARROW-15110 - [C++][Gandiva] 還原 Gandiva 快取策略的變更
- ARROW-15112 - [C++][FlightRPC][整合][Java] 實作 Flight RPC 整合測試
- ARROW-15113 - [C++] 讓 GcsFileSystem 測試稍微快一點
- ARROW-15114 - [C++] GcsFileSystem 使用 metadata 作為目錄標記
- ARROW-15115 - [C++] 如果使用已關閉的 stream,GcsFileSystem 會返回錯誤
- ARROW-15116 - [Python] 為 CSV reader 暴露 invalid_row_handler
- ARROW-15119 - [C++] 允許在通用測試中將目錄讀取為檔案
- ARROW-15121 - [C++] 在 GcsFileSystem 上實作最大遞迴深度
- ARROW-15122 - [R] 在 snappy 上閘控 parquet 測試
- ARROW-15126 - [C++] 支援 Null 型別作為群組鍵
- ARROW-15127 - [R] 更明顯的文件化 AWS_EC2_METADATA_DISABLED=TRUE
- ARROW-15133 - [持續整合] 移除 util_checkout.sh 和 util_cleanup.sh 腳本
- ARROW-15134 - [GLib] 新增 GArrow{Month,DayTime,MonthDayNano}IntervalDataType
- ARROW-15136 - [C++] 加速 S3FS 測試
- ARROW-15137 - [開發] 更新 archery crossbow latest-prefix 以適用於 nightly 日期
- ARROW-15138 - [C++] 讓 ExecPlan::ToString 提供一些額外資訊
- ARROW-15140 - [持續整合] 移動到 GHA checkouts 的 v2 版本
- ARROW-15150 - [文件] 新增關於資料集分區的指南
- ARROW-15153 - [Python] 將 ReferencedBufferSize 暴露給 python
- ARROW-15154 - [R] 將 ReferencedBufferSize 暴露給 R
- ARROW-15165 - [Python] 暴露函數以解析 S3 bucket 區域
- ARROW-15166 - [C++] 啟用 decimal256 的過濾器
- ARROW-15169 - [Python][R] 避免不安全的 Python-R 指標傳輸
- ARROW-15172 - [Go] 為 Arrow-math 新增 Arm64 Neon 實作
- ARROW-15173 - [R] 為橋接至舊版 pyarrow 提供向後相容性
- ARROW-15187 - [Java][FlightRPC] 修正新的 flight-sql 模組的 pom.xml
- ARROW-15188 - [C++] 升級捆綁的 re2 函式庫版本
- ARROW-15189 - [C++] 升級捆綁的 utf8proc 版本
- ARROW-15190 - [C++] 升級捆綁的 zstd 版本
- ARROW-15193 - [R][文件] 更新 R 綁定文件
- ARROW-15198 - [C++][FlightRPC] 修正 Flight SQL 中的 unity 建置錯誤
- ARROW-15203 - [GLib] 來自 C++ 的純量 garrow_struct_scalar_get_value() 返回值
- ARROW-15204 - [GLib] 新增 Arrow::RoundOptions
- ARROW-15205 - [GLib] 新增 garrow_function_all()
- ARROW-15207 - [GLib] 使用 Meson 的預設 -Dwerror=
- ARROW-15216 - [GLib] 新增 Arrow::RoundToMultipleOptions
- ARROW-15218 - [C++] 為 indices_nonzero 計算函數新增 decimal 支援
- ARROW-15219 - [Python] 導出 random 計算函數
- ARROW-15220 - [C++] 移除位元區塊計數器操作的 bool 特化
- ARROW-15232 - [封裝][deb] 停用 libarrow.so 的 DWARF 優化
- ARROW-15235 - [R] 停止支援 R 3.3
- ARROW-15244 - [格式] 澄清 binary 類陣列的 offsets 是單調遞增的
- ARROW-15245 - [Go] 解決大部分 staticcheck linting 問題。
- ARROW-15248 - [C++][文件] 改善關於 linting/formatting 的文件
- ARROW-15249 - [R] Autobrew + AWS sdk 依賴項
- ARROW-15267 - [GLib] 新增 garrow_function_get_default_options()
- ARROW-15268 - [封裝][deb] 不要使用 gi 捷徑
- ARROW-15269 - [C++][文件] 澄清並非所有計算函數都可以透過 CallFunction 調用
- ARROW-15273 - [GLib] 新增 garrow_function_get_options_type()
- ARROW-15274 - [Ruby] 改善 Arrow::Function#execute 的可用性
- ARROW-15279 - [R] 根據使用者回饋更新「writing bindings」開發文件
- ARROW-15288 - [GLib] 新增 garrow_execute_plan_build_hash_join_node()
- ARROW-15295 - [R] 將 6.0.0 新增到我們需要檢查的舊版本中
- ARROW-15300 - [C++] 為非同步資料集介面更新 Skyhook
- ARROW-15302 - [R] 停止支援 R 3.3 的後續
- ARROW-15303 - [R] linting 錯誤
- ARROW-15316 - [R] 建立一個單一函數指標的函數
- ARROW-15320 - [Go] 使用 Arm64 GoLang Assembly 實作 memset_neon
- ARROW-15322 - [文件][Go] 更新 Go 文件側邊欄連結。
- ARROW-15327 - [R] 更新 7.0.0 的新聞
- ARROW-15331 - [Go][Parquet] 新增 pqarrow 套件以進行 Parquet <-> Arrow 直接轉換
- ARROW-15332 - [C++] 在 IPC 讀/寫基準測試中新增案例並修正問題
- ARROW-15334 - [持續整合][GLib][Windows] 使用 Ruby 3.1
- ARROW-15336 - [Go] 使用 Arm64 GoLang Assembly 實作 ‘min_max_neon’
- ARROW-15337 - [文件] 新貢獻者指南更新
- ARROW-15338 - [Python] 新增
pyarrow.orc.read_table
API - ARROW-15339 - [網站] 新增 Skyhook 部落格文章
- ARROW-15343 - [文件][指南] 簡介與檢查清單 - 小幅修正
- ARROW-15344 - [文件][指南] 溝通 - 小幅修正
- ARROW-15345 - [文件][指南] 尋找 JIRA issue - 小幅修正
- ARROW-15355 - [文件] 在文件變更時觸發 sphinx 建置
- ARROW-15356 - [Ruby] 新增對 .arrows 擴展名的支援
- ARROW-15373 - [C++] 從 MemoryManager::AllocateBuffer 返回 unique_ptr
- ARROW-15374 - [C++][FlightRPC] 新增對替代 MemoryManager 的支援
- ARROW-15381 - [C#] 提升 C# Arrow.Flight 的依賴項版本並允許 netstandard2.0
- ARROW-15383 - [發佈] 新增用於更新 MSYS2 套件的腳本
- ARROW-15387 - [R] 取消跳過 decimal256() 的 chunked array 測試
- ARROW-15390 - [開發][C++][文件] 文件化 GDB 擴展
- ARROW-15399 - [發佈][JS] 將最低 NodeJS 版本提升至 16
- ARROW-15416 - [Python] 新增跳過 gdb 測試的選項
- ARROW-15423 - [C++][開發] 讓 GDB 外掛程式更易於自動載入
- ARROW-15435 - [C++][文件] 改善 API 文件覆蓋率
- ARROW-15436 - [發佈][Python] 在 apple M1 上停用不穩定的 csv::test_cancellation 測試
- ARROW-15439 - [發佈] 在發佈後更新 .deb/.rpm changelogs
- ARROW-15448 - [C++] 使用 apache mirror 系統下載 ORC 的原始碼
- ARROW-15457 - [封裝][deb] 明確指定 CUDAToolkit_ROOT
- ARROW-15463 - [GLib] 新增 arrow::compute::Utf8NormalizeOptions 綁定
- ARROW-15495 - [C++][FlightRPC] 要求 Protobuf/gRPC SOURCEs 必須匹配
- ARROW-15505 - [C++][Compute] 在 product aggregation 中支援 Null 型別
- PARQUET-492 - [C++][Parquet] 基礎支援讀取 DELTA_BYTE_ARRAY 資料。