Apache Arrow 6.0.0 (2021 年 10 月 26 日)
這是一個主要版本,涵蓋超過 3 個月的開發成果。
下載
貢獻者
此版本包含來自 88 位不同貢獻者的 592 個提交。
58 David Li
56 Antoine Pitrou
46 Neal Richardson
42 Sutou Kouhei
38 Jonathan Keane
34 Krisztián Szűcs
27 Matthew Topol
26 Nic Crane
23 Andrew Lamb
22 Joris Van den Bossche
21 Weston Pace
16 Alessandro Molina
15 Yibo Cai
10 Eduardo Ponce
9 Benson Muite
9 Rok
9 Micah Kornfield
8 liyafan82
8 michalursa
8 Benjamin Kietzman
8 Carlos O'Ryan
8 Ben Chambers
8 Navin
7 Alexander
7 Jiayu Liu
6 Phillip Cloud
5 Dominik Moritz
5 Percy Camilo Triveño Aucahuasi
5 Ian Cook
5 karldw
5 Wakahisa
4 Ruihang Xia
4 Nate Clark
4 Bryan Cutler
4 Dragos Moldovan-Grünfeld
4 Romain Francois
3 Daniël Heres
3 Matthew Turner
3 Sumit
3 Alenka Frim
3 okadakk
3 Laurent Goujon
3 Keith Kraus
3 Rommel Quintanilla
3 Roee Shlomo
2 Boaz
2 Chojan Shang
2 Ilya Biryukov
2 Markus Westerlind
2 Sergii Mikhtoniuk
2 Wang Fenjin
2 baishen
2 Fernando Rodriguez
2 João Pedro
2 Junwang Zhao
2 Takashi Hashida
2 William Butler
2 christian
2 darion.yaphet
2 frank400
2 jreid
2 rvernica
2 Jorge C. Leitao
1 Pachamaltese
1 Itamar Turner-Trauring
1 Projjal Chanda
1 Qingping Hou
1 Hongze Zhang
1 Eric Erhardt
1 ElenaHenderson
1 Sasha Krassovsky
1 Shoichi Kagawa
1 Eduard Tudenhoefner
1 Tahsin Hassan
1 niranda perera
1 Ted Dunning
1 Tim Swast
1 Wes McKinney
1 Dongjoon Hyun
1 Carol (Nichols || Goulding)
1 Christian Williams
1 Felix Yan
1 Andrey Klochkov
1 William Hyun
1 William Malpica
1 Dmitry Kalinkin
1 rodrigojdebem
1 czxrrr
1 wuzhuoming
1 seidl
1 jeremyd2019
1 shanhuuang
1 Dewey Dunnington
1 kharoc
1 lixiang.li
1 Daniel Rodriguez
1 Anthony Louis
1 neil
1 Matt Peterson
1 Kevin Gurney
1 Nathanaël Leaute
1 Kazuaki Ishizaki
1 Jiajun Yao
1 James Bourbeau
Patch 提交者
以下 Apache 提交者合併了貢獻的 patch 到 repository。
159 Antoine Pitrou
81 Neal Richardson
73 Sutou Kouhei
73 Andrew Lamb
49 Krisztián Szűcs
49 Jonathan Keane
43 David Li
24 Benjamin Kietzman
21 Matt Topol
18 Joris Van den Bossche
17 Micah Kornfield
16 Wakahisa
13 Weston Pace
13 Yibo Cai
7 Praveen
6 Nic Crane
6 Daniël Heres
4 Ian Cook
3 Phillip Cloud
3 Eric Erhardt
3 Bryan Cutler
3 Dominik Moritz
3 QP Hou
2 liyafan82
2 Chao Sun
更新日誌
Apache Arrow 6.0.0 (2021-10-26)
新功能與改進
- ARROW-1565 - [C++][Compute] 實作 TopK/BottomK
- ARROW-1568 - [C++] 實作「drop null」核心,傳回不含 null 值的陣列
- ARROW-4333 - [C++] 草擬在計算層中 kernels 和「query」執行的設計
- ARROW-4700 - [C++] 將 DecimalType 支援新增至 arrow::json::TableReader
- ARROW-5002 - [C++] 實作 Hash Aggregation query 執行節點
- ARROW-5244 - [C++] 檢閱實驗性 / 不穩定的 API
- ARROW-6072 - [C++] 實作 List <-> LargeList 的轉換
- ARROW-6607 - [Python] 從 Pandas 轉換時支援 set/list 欄位
- ARROW-6626 - [Python] 轉換為 Arrow 時,將巢狀「set」值處理為清單
- ARROW-6870 - [C#] 新增 Dictionary Arrays 和 Dictionary Encoding 的支援
- ARROW-7102 - [Python] 使檔案系統與 fsspec 相容
- ARROW-7179 - [C++][Compute] 合併 fill_null 和 coalesce
- ARROW-7901 - [Integration][Go] 新增 null 類型 (和整合測試)
- ARROW-8022 - [C++] 提供或 Vendor 一個 small_vector 實作
- ARROW-8147 - [C++] 將 google-cloud-cpp 新增至 ThirdpartyToolchain
- ARROW-8379 - [R] 調查/修正執行緒安全問題 (尤其是 Windows)
- ARROW-8621 - [Release][Go] 透過建立標籤新增模組支援
- ARROW-8780 - [Python] pyarrow.fs 檔案系統的 fsspec 相容包裝器
- ARROW-8928 - [C++] 測量與 ExecBatchIterator 相關聯的微效能
- ARROW-9226 - [Python] pyarrow.fs.HadoopFileSystem - 從 core-site.xml 或 hdfs-site.xml (如果可用) 檢索選項
- ARROW-9434 - [C++] 將 type_code 資訊儲存在 UnionScalar::value 中
- ARROW-9719 - [Doc][Python] 更好地記錄新的 pa.fs.HadoopFileSystem
- ARROW-10094 - [Python][Doc] 更新 pandas 文件
- ARROW-10415 - [R] 支援 dplyr::distinct()
- ARROW-10898 - [C++] 調查 Table 排序效能
- ARROW-11238 - [Python] 使 SubTreeFileSystem print 方法更具資訊性
- ARROW-11243 - [C++] 從字串剖析 time32 並在 CSV 讀取器中推斷
- ARROW-11460 - [R] 如果 Linux 上存在系統函式庫則使用它們
- ARROW-11691 - [Developer][CI] 為基準測試相關的環境變數提供合併的 .env 檔案
- ARROW-11748 - [C++] 確保 Decimal128 和 Decimal256 的欄位採用原生位元組順序
- ARROW-11828 - [C++] 在 api 中公開 CSVWriter 物件
- ARROW-11885 - [R] 當 LIBARROW_MINIMAL=true 時關閉某些功能
- ARROW-11981 - [C++][Dataset][Compute] 將 UnionDataset 替換為 Union ExecNode
- ARROW-12063 - [C++] 將 nulls 位置選項新增至排序函數
- ARROW-12181 - [C++][R] test-dataset.R 中的「CSV 資料集」在 RTools 3.5 上失敗
- ARROW-12216 - [R] 在 RTools3.5 (32 位元?) 上主動停用多執行緒
- ARROW-12359 - [C++] 棄用或移除 FileSystem::OpenAppendStream
- ARROW-12388 - [C++][Gandiva] 在 gandiva 中實作從 varbinary 函數轉換數字
- ARROW-12410 - [C++][Gandiva] 在 Gandiva 上實作 regexp_replace 函數
- ARROW-12479 - [C++][Gandiva] 實作 castBigInt、castInt、castIntervalDay 和 castIntervalYear 額外函數
- ARROW-12563 - 為字串新增 space、add_months 和 datediff 函數
- ARROW-12615 - [C++] 為 stddev 和 variance 新增處理 NA 的選項
- ARROW-12650 - [Doc][Python] 改善關於處理記憶體對應檔案的文件
- ARROW-12657 - [C++][Python][Compute] 字串十六進位到數值轉換和位元移位
- ARROW-12669 - [C++] Kernel 傳回 ListArray 中 list 索引處的元素陣列
- ARROW-12673 - [C++] 為具有不正確欄位計數的列配置自訂處理常式
- ARROW-12688 - [R] 使用 DuckDB 查詢 Arrow Dataset
- ARROW-12714 - [C++] 字串標題大小寫 kernel
- ARROW-12725 - [C++][Compute] GroupBy:僅當將索引鍵插入雜湊表時,才透過列格式編碼索引鍵來改善效能
- ARROW-12728 - [C++][Compute] 實作 count_distinct/distinct 雜湊聚合 kernel
- ARROW-12744 - [C++][Compute] 新增捨入 kernel
- ARROW-12759 - [C++][Compute] 將分組聚合包裝在 ExecNode 中
- ARROW-12763 - [R] 優化在使用 arrange 之後使用 head/tail 的 dplyr 查詢
- ARROW-12846 - [Release] 改善二進位檔案的上傳
- ARROW-12866 - [C++][Gandiva] 在 Gandiva 上實作 STRPOS 函數
- ARROW-12871 - [R] 升級到 testthat 3e
- ARROW-12876 - [R] 修正 Raspberry Pi 上的建置旗標
- ARROW-12944 - [C++] 字串首字大寫 kernel
- ARROW-12946 - [C++] 字串交換大小寫 kernel
- ARROW-12953 - [C++][Compute] 重構 CheckScalar* 以採用 Datum 引數
- ARROW-12959 - [C++][R] is_null(NaN) 的選項評估為 true
- ARROW-12965 - [Java] Arrow C 資料介面的 Java 實作
- ARROW-12980 - [C++] 提取日期時間元件的 Kernels 應具備時區意識
- ARROW-12981 - [R] 僅從 CRAN 安裝原始碼套件
- ARROW-13033 - [C++] 將 naive 時間戳記本地化為時區 (保留時鐘時間) 的 Kernel
- ARROW-13056 - [Dev][MATLAB] 擴展 PR 標籤器以支援語言
- ARROW-13067 - [C++][Compute] 實作整數到十進位轉換
- ARROW-13089 - [Python] 允許從 Python dict 建立 RecordBatch
- ARROW-13112 - [R] 字串和其他類型的 altrep 向量
- ARROW-13132 - [C++] 新增 Scalar 驗證
- ARROW-13138 - [C++] 實作從日期類型物件提取日期時間元件 (年、月、日等) 的 kernel
- ARROW-13141 - [C++][Python] HadoopFileSystem:根據 HADOOP_HOME 環境變數自動設定 CLASSPATH?
- ARROW-13163 - [C++][Gandiva] 在 Gandiva 上實作 REPEAT 函數
- ARROW-13164 - [R] 來自具有 null 值的陣列的 altrep 向量
- ARROW-13172 - [Java] 將 Vector 中的 TYPE_WIDTH 公開
- ARROW-13174 - [C++][Compute] 新增 strftime kernel
- ARROW-13202 - [MATLAB] 為 Linux 上 MATLAB 介面啟用 GitHub Actions CI
- ARROW-13218 - [Doc] 記錄/釐清時間戳記儲存的慣例
- ARROW-13220 - [C++] 新增 ‘choose’ kernel/純量計算函數
- ARROW-13222 - [C++] 在 case_when 函數中支援變寬類型
- ARROW-13227 - [C++][Compute] 記錄 ExecNode、ExecPlan
- ARROW-13257 - [Java][Dataset] 允許傳遞空欄位以進行投影
- ARROW-13260 - [Doc] 託管不同發佈版本的文件 + 版本切換器
- ARROW-13268 - [C++][Compute] 為 semi 和 anti-semi join 新增 ExecNode
- ARROW-13279 - [R] 在 wday 實作中使用 C++ DayOfWeekOptions,而不是手動透過 Expression 計算
- ARROW-13287 - [C++] [Dataset] FileSystemDataset::Write 應使用非同步掃描
- ARROW-13295 - [C++] 實作 hash_aggregate mean/stdev/variance kernels
- ARROW-13298 - [C++] 實作 hash_aggregate any/all Boolean kernels
- ARROW-13307 - [C++] 移除基於反射的列舉 (原為:為計算選項使用基於反射的列舉)
- ARROW-13311 - [C++][Documentation] 在某處列出雜湊聚合 kernels
- ARROW-13317 - [Python] 改善關於 ‘read_feather’ 中 ‘use_threads’ 功能的文件
- ARROW-13326 - [R] [Archery] 將 linting 新增至開發 CI
- ARROW-13327 - [Python] 改善 PyArrow 檔案中明確 C++ 類型的一致性
- ARROW-13330 - [Go][Parquet] 新增編碼套件第 2 部分
- ARROW-13344 - [R] ExecPlan/ExecNode 的初始綁定
- ARROW-13345 - [C++] 實作 logN 計算函數
- ARROW-13358 - [C++] 擴展 if_else kernel 的類型支援
- ARROW-13379 - [Dev][Docs] 改善 archery 文件
- ARROW-13390 - [C++] 改善 ‘coalesce’ kernel 的類型支援
- ARROW-13397 - [R] 更新 arrow.Rmd vignette
- ARROW-13399 - [R] 更新 dataset.Rmd vignette
- ARROW-13402 - [R] 更新 flight.Rmd vignette
- ARROW-13403 - [R] 更新 developing.Rmd vignette
- ARROW-13404 - [Python] [Doc] 使 Python landing page 與 arrow 文件的其他部分更少耦合
- ARROW-13405 - [Doc] 使 “Libraries” 作為文件的入口點
- ARROW-13416 - [C++] 實作 mod 計算函數
- ARROW-13420 - [JS] 更新相依性
- ARROW-13421 - [C++] 新增從分隔檔案讀取欄位作為浮點數的功能,其中逗號已用作小數分隔符
- ARROW-13433 - [R] 從 Valgrind 測試中移除 CLI hack
- ARROW-13434 - [R] group_by() 與未命名的表達式
- ARROW-13435 - [R] 新增函數 arrow_table() 作為 Table$create() 的別名
- ARROW-13444 - [C++] 透過將 std::result_of 更新為 std::invoke_result 來實現 C++20 相容性
- ARROW-13448 - [R] strftime 的綁定
- ARROW-13453 - [R] DuckDB 尚未發佈 0.2.8
- ARROW-13455 - [C++][Docs] RecordBatch::SetColumn 中的錯字
- ARROW-13458 - [C++][Docs] RecordBatch::schema 中的錯字
- ARROW-13459 - [C++][Docs] RecordBatch::SetColumn 的遺失參數文件
- ARROW-13461 - [Python][Packaging] 為 python 3.8 建置 M1 wheels
- ARROW-13463 - [Release][Python] 驗證 python 3.8 macOS arm64 wheel
- ARROW-13465 - [R] 來自 duckdb 的 to_arrow()
- ARROW-13466 - [R] 如果無法安裝 Arrow C++ 相依性,則使安裝失敗
- ARROW-13468 - [Release] 修正二進位檔案下載/上傳失敗
- ARROW-13472 - [R] 移除 .engine = “duckdb” 引數
- ARROW-13475 - [Release] 清理舊版本時,請勿考慮 rust tarball
- ARROW-13476 - [Doc][Python] 確保 ipc/io 文件使用上下文管理器而不是手動關閉串流
- ARROW-13478 - [Release] 版本遞增後發佈腳本的不必要 rc-number 引數
- ARROW-13480 - [C++] [R] [Python] Dataset SyncScanner 可能在錯誤時凍結
- ARROW-13482 - [C++][Compute] 為 ExecNode 實作提供登錄檔
- ARROW-13485 - [Release] 將 r/NEWS.md 中的 ${PREVIOUS_RELEASE}.9000 替換為 post-12-bump-versions.sh
- ARROW-13488 - [Website] 更新 5.0.0 的 Linux 套件安裝資訊
- ARROW-13489 - [R] 在 5.0.0 之後 Bump CI jobs
- ARROW-13501 - [R] count 聚合的綁定
- ARROW-13502 - [R] min/max 聚合的綁定
- ARROW-13503 - [GLib][Ruby][Flight] 新增 DoGet 的支援
- ARROW-13506 - 升級 ORC 至 1.6.9
- ARROW-13508 - [C++] 允許將自訂 RetryStrategy 物件傳遞至 S3FileSystem
- ARROW-13510 - [CI][R][C++] 將 -Wall 新增至 fedora-clang-devel as-cran 檢查
- ARROW-13511 - [CI][R] 如果 R 相依性未安裝,則在 docker 建置步驟中失敗
- ARROW-13516 - [C++] Mingw-w64 + Clang (lld) 不支援 –version-script
- ARROW-13519 - [R] 使文件範例更簡潔
- ARROW-13520 - [C++] 實作 hash_aggregate approximate quantile kernel
- ARROW-13521 - [C++][Docs] 在計算函數文件中新增關於 tdigest 的註解
- ARROW-13525 - [Python] 在 ParquetDataset 屬性的棄用訊息中提及替代方案
- ARROW-13528 - [R] mean、var、sd 聚合的綁定
- ARROW-13532 - [C++][Compute] Join:將設定成員資格測試方法新增至 grouper
- ARROW-13534 - [C++] 改善 csv chunker
- ARROW-13540 - [C++][Compute] 為 ExecPlan 中列的排序新增 OrderByNode
- ARROW-13541 - [C++][Python] 實作 ExtensionScalar
- ARROW-13542 - [C++][Compute][Dataset] 為將來自 ExecPlan 的列寫入磁碟新增 dataset::WriteNode
- ARROW-13544 - [Java] 移除已棄用很久的 API
- ARROW-13544 - [Java] 移除已棄用很久的 API
- ARROW-13544 - [Java] 移除已棄用很久的 API
- ARROW-13548 - [C++] 實作 datediff kernel
- ARROW-13549 - [C++] 實作時間戳記到日期/時間的轉換,以提取值
- ARROW-13550 - [R] 支援 dplyr::summarize() 的 .groups 引數
- ARROW-13552 - [C++] 移除已棄用的 API
- ARROW-13557 - [Packaging][Python] 跳過 M1 上的 test_cancellation 測試案例
- ARROW-13561 - [C++] 實作接受 WeekOptions 的 week kernel
- ARROW-13562 - [R] Styler 後續追蹤
- ARROW-13565 - [Packaging][Ubuntu] 停止支援 20.10
- ARROW-13572 - [C++][Python] 將基本 ORC 支援新增至 pyarrow.datasets API
- ARROW-13573 - [C++] 在 case_when kernel 中直接支援字典
- ARROW-13574 - [C++] 將 ‘count all’ 選項新增至 count (hash) 聚合 kernel
- ARROW-13575 - [C++] 實作 product 聚合 & hash 聚合 kernels
- ARROW-13576 - [C++][Compute] 將 ExecNode::InputReceived 替換為 ::MakeTask
- ARROW-13577 - [Python][FlightRPC] pyarrow client do_put 在 write_table 之後的 close 方法未擲回 flight 錯誤
- ARROW-13585 - [GLib] 新增 C ABI 介面的支援
- ARROW-13587 - [R] 處理 –use-LTO 覆寫
- ARROW-13595 - [C++] 為計算 kernel 輸出類型新增 debug 模式檢查
- ARROW-13604 - [Java] 移除代表不支援操作的 API 的棄用註釋
- ARROW-13606 - [R] 實際停用 LTO
- ARROW-13613 - [C++] 實作十進位的 sum/mean 聚合
- ARROW-13614 - [C++] 實作十進位的 min_max 聚合
- ARROW-13618 - [R] 預設為 summarize() 使用 Arrow 引擎
- ARROW-13620 - [R] n_distinct() 的綁定
- ARROW-13626 - [R] log base b 的綁定
- ARROW-13627 - [C++] ScalarAggregateOptions 沒有意義 (在雜湊聚合中)
- ARROW-13629 - [Ruby] 新增建置/轉換 map 的支援
- ARROW-13633 - [Packaging][Debian] 新增 bookworm 的支援
- ARROW-13634 - [R] 更新 nixlibs.R 中的 distro() 以從 “bookworm” 對應到 12
- ARROW-13635 - [Packaging][Python] 為 arm manylinux 建置中的 jemalloc 定義 –with-lg-page
- ARROW-13637 - [Python][Doc] 使 docstring 符合相同樣式
- ARROW-13642 - [C++][Compute] 實作多對多內部雜湊聯結
- ARROW-13645 - [Java] 允許 NullVectors 具有不同的欄位名稱
- ARROW-13646 - [Go][Parquet] 新增 Metadata 套件
- ARROW-13648 - [Dev] 盡可能使用 #!/usr/bin/env 而不是 #!/bin
- ARROW-13650 - [C++] 建立資料集寫入器以封裝資料集寫入器邏輯
- ARROW-13651 - [Ruby] 新增將 [Symbol] 轉換為 Arrow 陣列的支援
- ARROW-13652 - [Python] 在 Python 中公開 CopyFiles 公用程式
- ARROW-13660 - [C++][Compute] 移除 `seq` 作為 ExecNode::InputReceived 的參數
- ARROW-13670 - [C++] 進行一輪編譯器警告清理
- ARROW-13674 - [Dev][CI] PR 檢查工作流程應檢查 JIRA 組件
- ARROW-13675 - [Doc][Python] 在 Cookbook 中新增關於如何儲存分割資料集的食譜
- ARROW-13679 - [GLib][Ruby] 新增群組聚合的支援
- ARROW-13680 - [C++] 建立非同步 nursery 以簡化捕獲邏輯
- ARROW-13682 - [C++] 新增 TDigest::Merge(const TDigest&)
- ARROW-13684 - [C++][Compute] Strftime kernel 後續追蹤
- ARROW-13686 - [Python] 更新已棄用的 pytest yield_fixture 函數
- ARROW-13687 - [Ruby] 新增透過 Arrow Dataset 載入表格的支援
- ARROW-13691 - [C++] 將處理 NA 的選項新增至 VarianceOptions
- ARROW-13693 - [Website] arrow-site 應釘選特定的 Ruby 版本並利用 rbenv 等工具
- ARROW-13696 - [Python] 支援具有欄位的 MapType
- ARROW-13699 - [Python][Doc] 重構檔案系統介面文件
- ARROW-13700 - [Docs][C++] 釐清 DayOfWeekOptions 引數
- ARROW-13702 - [Python] test_parquet_dataset_deprecated_properties 缺少 dataset 標記
- ARROW-13704 - [C#] 新增讀取串流格式 delta 字典的支援
- ARROW-13705 - [Website] 釘選 node 版本
- ARROW-13721 - [Doc][Cookbook] 指定 Schema - Python
- ARROW-13733 - [Java] 允許 JDBC adapters 重複使用向量 schema root
- ARROW-13734 - [Format] 釐清時間類型允許的值
- ARROW-13736 - [C++] 協調 PrettyPrint 和 StringFormatter
- ARROW-13737 - [C++] 在雜湊聚合中支援純量欄位 (原為:純量欄位上的 hash_sum 導致 segfault)
- ARROW-13739 - [R] 支援 dplyr::count() 和 tally()
- ARROW-13740 - [R] summarize() 不應急切評估
- ARROW-13757 - [R] 修正 CRAN patch 版本 C++ 原始碼的下載
- ARROW-13759 - [C++] 更新 linting 和格式化腳本以在 shebang 行中指定 python3
- ARROW-13760 - [C++] 當啟用 Flight 時,將 Protobuf 版本 Bump 至 3.15
- ARROW-13764 - [C++] 實作 count_distinct (分組) 的 ScalarAggregateOptions
- ARROW-13768 - [R] 允許 JSON 作為可選組件
- ARROW-13772 - [R] median() 和 quantile() 聚合函數的綁定
- ARROW-13776 - [C++] 離線 thirdparty versions.txt 遺失某些檔案的擴展名
- ARROW-13777 - [R] group_by 之後的 mutate 應該可以,只要只有純量函數
- ARROW-13778 - [R] 處理複雜的 summarize 表達式
- ARROW-13782 - [C++] 將處理 NA 的選項新增至 TDigest、Index、Mode、Quantile 聚合
- ARROW-13783 - [Python] 改善 Table.to_string (以及可能 __repr__) 以也預覽表格的資料
- ARROW-13785 - [C++] ExecPlan 和 ExecNode 的 Print 方法
- ARROW-13787 - [C++] 驗證第三方下載
- ARROW-13789 - [Go] 為 Go 實作 Arrow 純量值
- ARROW-13793 - [C++] 將 ORCFileReader 遷移至 Result<T>
- ARROW-13794 - [C++] 棄用 Parquet 偽版本 “2.0”
- ARROW-13797 - [C++] 在 Datasets API 中實作欄位投影下推至 ORC 讀取器
- ARROW-13803 - [C++] 過濾 taxi 資料集時發生 Segfault
- ARROW-13804 - [Go] 新增間隔類型月份、日、奈秒的支援
- ARROW-13806 - [Python] 為 Month, Day Nano Interval Type 新增與 Pandas/Python 之間的轉換功能
- ARROW-13809 - [C ABI] 為 C-ABI 新增 Month, Day, Nanosecond interval type 的支援
- ARROW-13810 - [C++][Compute] Predicate IsAsciiCharacter 允許無效的類型和值
- ARROW-13815 - [R] 適應 rlang 中新的 callstack 變更
- ARROW-13816 - [Go] 為 C Data Interface 實作 Consumer API
- ARROW-13820 - [R] 將 na.min_count 重新命名為 min_count,na.rm 重新命名為 skip_nulls
- ARROW-13821 - [R] 處理 sd, var bindings 中的 na.rm
- ARROW-13823 - 從 git 和 RAT plugin 中排除 .factorypath
- ARROW-13824 - [C++][Compute] 使 BooleanToNumber kernel 成為 constexpr
- ARROW-13831 - [GLib][Ruby] 新增由 Arrow Dataset 寫入的支援
- ARROW-13835 - [Python] 文件化統一 schema 的工具
- ARROW-13842 - [C++] 升級 vendored date library 版本
- ARROW-13843 - [C++][CI] 在 fuzzing 設定中測試 ToString / PrettyPrint
- ARROW-13845 - [C++] 協調 RandomArrayGenerator::ArrayOf 變體
- ARROW-13847 - 避免不必要的 collection 複製
- ARROW-13849 - [C++] 新增 min 和 max 聚合函數
- ARROW-13852 - [R] 處理 ExecPlan 中的 Dataset schema metadata
- ARROW-13853 - [R] 字串 to_title, to_lower, to_upper kernels
- ARROW-13855 - [C++] [Python] 新增匯出 extension types 的支援
- ARROW-13857 - [R][CI] 移除 checkbashisms 下載
- ARROW-13859 - [Java] 新增程式碼覆蓋率支援
- ARROW-13866 - [R] 為所有可透過 list_compute_functions 取得的 compute kernels 實作 Options
- ARROW-13869 - [R] 為非綁定的 MatchSubstringOptions kernels 實作 options
- ARROW-13871 - [C++] 如果 list array 鍵存在於一個 chunk 中但不存在於後續的 chunk 中,JSON reader 可能會失敗
- ARROW-13874 - [R] 實作 TrimOptions
- ARROW-13883 - [Python] 允許使用 numpy.array 以外的類型作為建立 arrays 時的 masks
- ARROW-13890 - [R] 分割 test-dataset.R 和 test-dplyr.R
- ARROW-13893 - [R] 使 datasets 和 queries 的 head/tail 成為 lazy
- ARROW-13897 - [Python] TimestampScalar.as_py() 和 DurationScalar.as_py() 文件不準確地描述回傳類型
- ARROW-13898 - [C++][Compute] 新增字串二元轉換的支援
- ARROW-13899 - [Ruby] 由 compute kernels 實作 slicer
- ARROW-13901 - [R] 實作 IndexOptions
- ARROW-13904 - [R] 實作 ModeOptions
- ARROW-13905 - [R] 實作 ReplaceSliceOptions
- ARROW-13906 - [R] 實作 PartitionNthOptions
- ARROW-13908 - [R] 實作 ExtractRegexOptions
- ARROW-13909 - [GLib] 新增 GArrowVarianceOptions
- ARROW-13909 - [GLib] 新增 GArrowVarianceOptions
- ARROW-13910 - [Ruby] Arrow::Table#[]/Arrow::RecordBatch#[] 接受 Range 和 selectors
- ARROW-13919 - [GLib] 新增 GArrowFunctionDoc
- ARROW-13924 - [R] stringr::str_starts, stringr::str_ends, base::startsWith 和 base::endsWith 的綁定
- ARROW-13925 - [R] 移除系統安裝 devdocs 工作
- ARROW-13927 - [R] 將 Karl 加入 contributors 列表
- ARROW-13928 - [R] 重新命名 version(s) 任務,使其更清楚地表明哪個是哪個
- ARROW-13937 - [C++][Compute] 為 sign 函數新增明確的輸出值並修正 unary 類型檢查
- ARROW-13942 - [Dev] cmake_format autotune 無法運作
- ARROW-13944 - [C++] 將 xsimd 升級至最新版本
- ARROW-13958 - [Python] 遷移 Python ORC 綁定以使用新的 Result-based APIs
- ARROW-13959 - [R] 更新從 date32 物件中提取組件的測試
- ARROW-13962 - [R] 趕上 NEWS
- ARROW-13963 - [Go] 將 Bitmap Reader/Writer 實作從 Parquet 移動到 Arrow bituil 套件
- ARROW-13964 - [Go] 移除 Parquet bitmap reader/writer 實作並使用共用的 arrow bitutils 版本
- ARROW-13965 - [C++] parquet TypedColumnWriterImpl 中的 dynamic_casts 影響效能
- ARROW-13966 - [C++] decimals 的比較 kernel(s)
- ARROW-13967 - [Go] 為 Arrays 實作 Concatenate 函數
- ARROW-13973 - [C++] 新增 SelectKSinkNode
- ARROW-13974 - [C++] 解決 TopK/BottomK 的後續審查
- ARROW-13975 - [C++][Compute] 為 round 函數新增 decimal 支援
- ARROW-13977 - [Format] 澄清 interval type 的閏秒和閏日
- ARROW-13979 - [Go] 為 Go 測試啟用 -race 參數
- ARROW-13990 - [R] round kernels 的綁定
- ARROW-13994 - [Doc][C++] 建置文件遺漏 git submodule 更新
- ARROW-13995 - [R] join node 的綁定
- ARROW-13999 - [C++][CI] 必須安裝 Make 才能在 MinGW 上建置 LZ4
- ARROW-14002 - [Python] unify_schema 也應接受 tuples
- ARROW-14003 - [C++][Python] 在 “select_k_unstable” kernel 中未提供 sort_key 會導致崩潰
- ARROW-14005 - [R] 修正 PartitionNthOptions 的測試,使其可以在各種平台上執行
- ARROW-14006 - [C++][Python] 支援將 naive timestamps 轉換為字串
- ARROW-14007 - [C++] 修正 decimal promotion 機制中的編譯器警告
- ARROW-14008 - [R][Compute] ExecPlan_run 應回傳 RecordBatchReader 而非 Table
- ARROW-14009 - [C++] 確保 SourceNode 真正地並行地將 batches 饋送到 plan 中
- ARROW-14012 - [Python] 更新 compute 文件中的 kernel 類別以匹配 C++
- ARROW-14013 - [C++][Docs] 在 Fedora Linux 上安裝的說明
- ARROW-14016 - [C++] 目錄分割使用了錯誤的 type_name
- ARROW-14019 - [R] expect_dplyr_equal() 測試輔助函數忽略 grouping
- ARROW-14023 - [Ruby] Arrow::Table#slice 接受 Hash
- ARROW-14025 - [R][C++] 當通過 exec nodes 掃描 parquet 時,PreBuffer 未啟用
- ARROW-14030 - [GLib] 使用基於 arrow::Result 的 ORC API
- ARROW-14031 - [Ruby] 分別使用 min 和 max
- ARROW-14033 - [Ruby][Doc] 為 Red Arrow 新增 macOS 開發指南
- ARROW-14033 - [Ruby][Doc] 為 Red Arrow 新增 macOS 開發指南
- ARROW-14035 - [C++][Compute] 實作非 hash 的 count_distinct 聚合 kernel
- ARROW-14036 - [R] 無 grouping 的 n_distinct() 的綁定
- ARROW-14043 - [Python] 在 dictionary array 中新增對 unsigned indexes 的支援?
- ARROW-14044 - [R] 處理 summarize 中 group_by .drop 參數
- ARROW-14049 - [C++][Java] 將 ORC 升級至 1.7.0
- ARROW-14050 - [C++] 當未跳過 nulls 時,tdigest, quantile 回傳空陣列
- ARROW-14052 - [C++] 新增 appx_median, hash_appx_median 函數
- ARROW-14054 - [C++][Docs] 提高 row_conversion_example.cpp 的清晰度
- ARROW-14055 - [Docs] 為文件新增標準網址
- ARROW-14056 - [C++][Doc] 提及 ArrayData
- ARROW-14061 - [Go] 新增 Cgo Arrow Memory Pool Allocator
- ARROW-14062 - [Format] compute IR 的初始規範
- ARROW-14064 - [CI] 使用 Debian 11
- ARROW-14069 - [R] 預設情況下,過濾掉 list_compute_functions() 中的 hash 函數
- ARROW-14070 - [C++][CI] 移除對 VisualStudio 2015 的支援
- ARROW-14072 - [GLib][Parquet] 新增通過 metadata 獲取行數的支援
- ARROW-14073 - [C++] 去重複 sort keys
- ARROW-14084 - [GLib][Ruby][Dataset] 新增從目錄掃描的支援
- ARROW-14088 - [GLib][Ruby][Dataset] 新增對 filter 的支援
- ARROW-14106 - [Go][C] 實作匯出 C data interface
- ARROW-14107 - [R][CI] 並行化 Windows CI 工作
- ARROW-14111 - [C++] 為 time32/time64 新增提取函數支援
- ARROW-14116 - [C++][Docs] WriteCSV 範例中一致的變數名稱
- ARROW-14127 - [C++][Docs] 使用 compute 函數和輸出的範例
- ARROW-14128 - [Go] 為 nested types 實作 MakeArrayFromScalar
- ARROW-14132 - [C++] 在 CSV chunker 測試中測試混合引用和逸出
- ARROW-14135 - [Python] 缺少 compute kernels 的 Python 測試
- ARROW-14140 - [R] 從 R metadata 中跳過 arrow_binary/arrow_large_binary class
- ARROW-14143 - [IR] [C++] 為 IR 新增明確的 cast node
- ARROW-14146 - [Dev] 更新 merge 腳本以在 shebang 行中指定 python3
- ARROW-14150 - [C++] 如果 quoting 為 false,則在 CSV chunker 中跳過分隔符號檢查
- ARROW-14155 - [Go] 新增用於建立資料類型和 scalars 的 fingerprints/hashes 的函數
- ARROW-14157 - [C++] 在 ThirdpartyToolchain 中重構 Abseil 建置
- ARROW-14165 - [C++] 提高表格排序效能 #2
- ARROW-14178 - [C++] Boost 下載位置已移動
- ARROW-14180 - [Packaging] 新增對 AlmaLinux 8 的支援
- ARROW-14189 - [Docs] 為 sphinx 文件新增版本下拉選單
- ARROW-14191 - [C++][Dataset] Dataset 寫入應考慮 backpressure
- ARROW-14194 - [Docs] 改善 sphinx API 文件中的垂直間距
- ARROW-14198 - [Java] 升級 Netty 和 gRPC 依賴項
- ARROW-14207 - [C++] 為捆綁的 Boost targets 新增遺失的依賴項
- ARROW-14212 - [GLib][Ruby] 新增 GArrowTableConcatenateOptions
- ARROW-14217 - [Python][CI] 新增對 python 3.10 的支援
- ARROW-14222 - [C++] 建立 GcsFileSystem 骨架
- ARROW-14228 - [R] 允許建立可為 null 的欄位
- ARROW-14230 - [C++] 棄用 ArrayBuilder::Advance
- ARROW-14232 - [C++] 將 crc32c 依賴項更新至 1.1.2
- ARROW-14235 - [C++][Compute] 如果未提供 label,則使用節點計數器作為 label
- ARROW-14236 - [C++] 為 CI 建置安裝 GCS testbench
- ARROW-14239 - [R] 不要使用 rlang::as_label
- ARROW-14241 - [C++] Dataset ORC 建置在 java-jars nightly build 中失敗
- ARROW-14243 - [C++] 分割 vector_sort.cc
- ARROW-14244 - [C++] 調查 scalar_temporal.cc 編譯速度
- ARROW-14258 - [R] 如果 SF 欄位被轉換成表格,則發出警告
- ARROW-14259 - [R] 當 R vector 為 altrep 時,從 R vector 轉換為 Array
- ARROW-14261 - [C++] Includes 應按字母順序排列
- ARROW-14269 - [C++] 整合 utf8 基準測試
- ARROW-14274 - [C++] 升級 vendored base64 程式碼
- ARROW-14284 - [C++][Python] 當需要 async 時嘗試使用 SyncScanner 時,改善錯誤訊息
- ARROW-14291 - [CI][C++] 將 cpp/examples/ 檔案新增至 lint 目標
- ARROW-14295 - [Doc] 指示 archery 的位置
- ARROW-14296 - [Go] 更新 flatbuf 生成的程式碼
- ARROW-14304 - [R] 更新 6.0.0 的新聞
- ARROW-14309 - [Python] CompressedInputStream 不支援 str 或 file 物件
- ARROW-14317 - [Doc] 更新實作狀態
- ARROW-14326 - [Docs] 將 C/GLib 和 Ruby 新增至 C Data/Stream interface 支援的程式庫
- ARROW-14327 - [Release] 從 packaging group 中移除 conda-*
- ARROW-14335 - [GLib][Ruby] 新增對 expression 的支援
- ARROW-14337 - [C++] 當啟用 SIMD 加速時,Arrow 無法在 M1 上建置
- ARROW-14341 - [C++] 優化 decimal 基準測試
- ARROW-14343 - [Packaging][Python] 為 M1 wheels 啟用 NEON SIMD 優化
- ARROW-14345 - [C++] 為 GCS FileSystem 實作串流讀取
- ARROW-14348 - [R] 新增 group_vars.RecordBatchReader 方法
- ARROW-14349 - [IR] 移除 RelBase
- ARROW-14358 - 更新文件中的 CMake 選項
- ARROW-14361 - [C++] 為 ARROW_SIMD_LEVEL 定義一個 DEFAULT 值
- ARROW-14364 - [CI][C++] 支援 LLVM 13
- ARROW-14368 - [CI] ubuntu-16.04 在 Azure Pipelines 上不可用
- ARROW-14369 - [C++][Python] 使用 g++ 4.8.5 建置失敗
- ARROW-14386 - [Packaging][Java] devtoolset 在 manylinux2014 映像檔中升級至 10
- ARROW-14387 - [Release][Ruby] 在發布前檢查 Homebrew/MSYS2 套件版本
- ARROW-14396 - [R][Doc] 移除 write_dataset 中關於欄位無法重新命名的過時註釋
- ARROW-14400 - [Go] Tables 和 Chunked Arrays 的 Equals 和 ApproxEquals
- ARROW-14401 - [C++] 捆綁的 crc32c 的 include 路徑錯誤
- ARROW-14402 - [Release][Yum] RPM 簽署失敗
- ARROW-14404 - [Release][APT] 跳過 arm64 Debian GNU/Linux bookworm 驗證
- ARROW-14408 - [Packaging][Crossbow] 跳過 artifact 模式驗證的選項
- ARROW-14410 - [Python][Packaging] 使用 numpy 1.21.3 為 macOS 和 windows 建置 python 3.10 wheels
- ARROW-14452 - [Release][JS] 更新 Javascript 測試
- PARQUET-490 - [C++] 將 DELTA_BINARY_PACKED value encoder 併入程式庫並新增單元測試
錯誤修正
- ARROW-6946 - [Go] 執行測試時啟用 assert build tag
- ARROW-8452 - [Go][Integration] Go JSON producer 為 nested types 生成不正確的 nullable flag
- ARROW-8453 - [Integration][Go] 不支援遞迴 nested types
- ARROW-8999 - [Python][C++] 在 “AMD64 MacOS 10.15 Python 3.7” 建置中出現非決定性的 segfault
- ARROW-9948 - [C++] Decimal128 在重新調整比例時未檢查 scale range;可能導致緩衝區溢位
- ARROW-10213 - [C++] 從 timestamp 到 date 的時間轉換會四捨五入,而不是提取日期組件
- ARROW-10373 - [C++] ValidateFull() 未驗證 null_count
- ARROW-10773 - [R] 在 Windows 上,parallel as.data.frame.Table 無限期掛起
- ARROW-11518 - [C++] [Parquet] Parquet reader 在讀取 boolean 欄位時崩潰
- ARROW-11579 - [R] read_feather 在 Windows 上掛起
- ARROW-11634 - [C++][Parquet] dictionary 欄位的 Parquet 統計資訊 (min/max) 不正確
- ARROW-11729 - [R] 為 datasets 文件新增範例
- ARROW-12011 - [C++][Python] 將 large integers 轉換為 dates 時崩潰並產生不正確的結果
- ARROW-12072 - (ipc.Writer).Write 發生 panic,錯誤訊息為 `arrow/array: index out of range`
- ARROW-12087 - [C++] 修正 sort_indices, array_sort_indices timestamp 支援差異
- ARROW-12513 - [C++][Parquet] 對於具有 nulls 的 dictionary-encoded array,Parquet Writer 始終在 Parquet 統計資訊中將 null_count 設為 0
- ARROW-12540 - [C++] 實作從 date32[day] 到 utf8 的轉換
- ARROW-12636 - [JS] ESM Tree-Shaking 產生損壞的程式碼
- ARROW-12700 - [R] 在錯誤寫入後,Read/Write_feather 永遠卡住,R, Win32
- ARROW-12837 - [C++] Array::ToString() 在 null buffer 的情況下發生 segfault。
- ARROW-13134 - [C++] 與 SSL 相關的 arrow-s3fs-test 失敗,aws-sdk-cpp 版本為 1.9.51
- ARROW-13151 - [Python] 無法從 Parquet 讀取 struct 欄位的單個子欄位
- ARROW-13198 - [C++][Dataset] Async scanner 偶爾在 CI 中發生 segfault
- ARROW-13293 - [R] open_dataset 後接 collect 會掛起(而 compute 正常運作)
- ARROW-13304 - [C++] 由於 day of week 選項,無法在 Ubuntu 21.04 上安裝 nightly 版本
- ARROW-13336 - [Doc][Python] make clean 未清理 “generated” 文件
- ARROW-13422 - [R] 澄清關於 Windows 上 S3 支援的 README
- ARROW-13424 - [C++] conda-forge benchmark library 被拒絕
- ARROW-13425 - [Dev][Archery] Archery 導入 pandas,而 pandas 又導入 pyarrow
- ARROW-13429 - [C++][Gandiva] 在編譯具有 binary 類型的 If-else expression 時,Gandiva 崩潰
- ARROW-13430 - [Integration][Go] 整合測試中的各種錯誤
- ARROW-13436 - [Python][Doc] 澄清如果 read_table 被傳遞一個空的欄位列表,應該預期什麼
- ARROW-13437 - [C++] FixedSizeList 的 Slice 未通過 ValidateFull
- ARROW-13441 - [CSV] Streaming reader 轉換應跳過空區塊
- ARROW-13443 - [C++] 修正從 flatbuf::MetadataVersion 到 arrow::ipc::MetadataVersion 的不正確映射
- ARROW-13445 - [Java][Packaging] 修正 Java jars 的 artifact 模式
- ARROW-13446 - [Release] 修正 amazon linux 上的驗證
- ARROW-13447 - [Release] arm64 和 universal2 macOS wheels 的驗證腳本
- ARROW-13450 - [Python][Packaging] 為 universal2 wheels 設定部署目標為 10.13
- ARROW-13469 - [C++] 在 DayMilliseconds arrow/type.h 中抑制 -Wmissing-field-initializers
- ARROW-13474 - [C++][Python] 當 filter/take 空的 Extension array 時,PyArrow 崩潰
- ARROW-13477 - [Release] 將 ARTIFACTORY_API_KEY 傳遞給上傳腳本
- ARROW-13484 - [Release] Amazon Linux 2 無法使用套件
- ARROW-13490 - [R] [CI] 需要根據 duckdb 版本來限制 duckdb 範例
- ARROW-13492 - [R] [CI] 將 r tools 35 建置移回 per-commit/pre-PR
- ARROW-13493 - [C++] 在匿名 union 中的匿名 structs 是 GNU extension
- ARROW-13495 - [C++] 在寫入 dataset 時,BitUtil 中出現 UBSAN 錯誤
- ARROW-13496 - [CI][R] 修復 r-sanitizer 工作
- ARROW-13497 - [C++][R] aggregation nodes 未使用 FunctionOptions
- ARROW-13499 - [R] expression 上的 aggregation 未正確地執行 NSE
- ARROW-13500 - [C++] 警告:使用 gcc 9.3 建置時,無法識別的命令列選項 ‘-Wno-unknown-warning-option’
- ARROW-13504 - [Python] 使用 pytest markers 無法跳過 s3 或 hdfs 測試
- ARROW-13507 - [R] CRAN 上的 LTO 工作失敗
- ARROW-13509 - [C++] Take compute 函數應傳遞 ChunkedArray 類型以處理空的輸入陣列
- ARROW-13522 - [C++] macOS 上 compute `utf8_*trim` 函數的回歸問題。
- ARROW-13523 - 統一了測試案例名稱
- ARROW-13524 - [C++] 修正 ApplicationVersion::VersionEq 的描述
- ARROW-13529 - 在寫入 slices 時,IPC writer 中有過多的 releases
- ARROW-13538 - [R] [CI] 不要在 minimal build 中測試 DuckDB
- ARROW-13543 - [R] 處理 summarize() 帶有 0 個參數或沒有聚合函數的情況
- ARROW-13556 - [C++] 在 Ubuntu 21.04 上,使用 system libs 時,flight 未連結到 libprotobuf
- ARROW-13559 - [CI][C++] test-conda-cpp-valgrind nightly build 失敗
- ARROW-13560 - [R] 允許 Scanner$create() 接受 filter / project,即使使用 arrow_dplyr_querys
- ARROW-13580 - [C++] quoted_strings_can_be_null 僅適用於字串欄位
- ARROW-13597 - [C++] [R] 名為 source 的 ExecNode factory 不存在於 registry 中
- ARROW-13600 - [C++] 可能未初始化的警告
- ARROW-13602 - [C++] 測試解引用 type-punned pointer 編譯器警告
- ARROW-13603 - [GLib] GARROW_VERSION_CHECK() 始終回傳 false
- ARROW-13605 - [C++] ThreadSanitizer 在 GroupByNode 中發現資料競爭
- ARROW-13608 - [R] symbol 初始化似乎依賴於未定義的行為
- ARROW-13611 - [C++] 掃描 datasets 不強制執行 back pressure
- ARROW-13624 - [R] readr short 類型映射的 T 和 t 向後
- ARROW-13628 - [Format] 新增 MonthDayNano interval type。
- ARROW-13630 - [CI][C++] Travis s390x CI 工作失敗,並阻止了 endianness 相關程式碼的驗證
- ARROW-13632 - [Python] 在過濾 slice 時,Filter mask 始終應用於 FixedSizeListArray 開頭的元素
- ARROW-13638 - [C++][R] 在 Init/ExecNode_Aggregate keep_alives 未保持存活後,GroupByNode 訪問 FunctionOptions
- ARROW-13639 - [C++] 與空 dictionary 連接會發生 segfault (TestFilterKernelWithString/0.FilterDictionary 中的 ASan 失敗)
- ARROW-13654 - [C++][Parquet] 將 FileMetaData 物件附加到自身會導致記憶體爆炸
- ARROW-13655 - [C++][Parquet] 讀取大型 Parquet 檔案可能會因 Thrift 0.14 而產生 “MaxMessageSize reached” 錯誤
- ARROW-13662 - [CI] 使用 pandas 0.24 時,測試 test_extract_datetime_components 失敗
- ARROW-13662 - [CI] 使用 pandas 0.24 時,測試 test_extract_datetime_components 失敗
- ARROW-13669 - [C++] Variant emplace 方法似乎缺少大括號。
- ARROW-13671 - [Dev] 修正 Arm 64K page system 上的 conda recipe
- ARROW-13676 - [C++] Coredump 將 Arrow table 寫入 Parquet 檔案
- ARROW-13681 - [C++] list_parent_indices 僅針對第一個 chunk 計算
- ARROW-13685 - [C++] 如果 bucket 已存在,則無法將 dataset 寫入 S3FileSystem
- ARROW-13689 - [C#] 初始 C# 整合測試
- ARROW-13694 - [R] Arrow filter 崩潰 (R 終止會話)
- ARROW-13743 - [CI] OSX 工作因 git 和 libcurl 不相容而失敗
- ARROW-13744 - [CI] c++14 和 17 nightly 工作失敗
- ARROW-13747 - [CI][C++] s3fs 測試在 conda-python-pandas nightly 工作中失敗
- ARROW-13755 - [Python] 允許在儲存 datasets 時在 partitioning 中使用 field_names
- ARROW-13761 - [R] arrow::filter() 崩潰 (終止 R 會話)
- ARROW-13784 - [Python] 當 array 為空但 names 不為空時,Table.from_arrays 應引發錯誤
- ARROW-13786 - [R] [CI] 如果 arrow 未建置,則不要使 RCHK 建置失敗
- ARROW-13788 - [C++] 時間組件提取函數不支援 date32/64
- ARROW-13792 - [Java] unsigned integer vectors 的 toString 表示不正確
- ARROW-13799 - [R] case_when 錯誤處理正在捕獲字串
- ARROW-13800 - [R] 使用 divide 而不是 divide_checked
- ARROW-13812 - [C++] Grouper.BooleanKey 中的 Valgrind 失敗(未初始化的值)
- ARROW-13814 - [CI] 使用 spark master 的 nightly integration build 無法編譯 spark
- ARROW-13819 - [C++] 建置失敗,錯誤訊息為 “‘subseconds’ may be used uninitialized in this function”
- ARROW-13846 - [C++] 修復在無效 IPC 檔案上的崩潰問題 (OSS-Fuzz)
- ARROW-13850 - [C++] 修復在無效 Parquet 檔案上的崩潰問題 (OSS-Fuzz)
- ARROW-13860 - [R] arrow 5.0.0 write_parquet 寫入分組 data.frame 時拋出錯誤
- ARROW-13872 - [Java] ExtensionTypeVector 無法與 RangeEqualsVisitor 搭配運作
- ARROW-13876 - [C++] 計算函數中的一致性 null 處理
- ARROW-13877 - [C++] 為處理列表的計算函數新增對固定大小列表的支援
- ARROW-13878 - [C++] 為計算函數新增 fixed_size_binary 支援
- ARROW-13880 - [C++] 計算函數 sort_indices 不支援帶有時區的時間戳記
- ARROW-13881 - [Python] 錯誤訊息顯示「請使用以 gRPC 1.27 或更高版本建置的 Arrow Flight 版本。」,儘管我正在使用 gRPC 1.39
- ARROW-13882 - [C++] 為更多類型新增計算函數 min_max 支援
- ARROW-13884 - Arrow 5.0.0 無法使用 Typescript 4.2.2 編譯
- ARROW-13912 - [R] TrimOptions 實作因相依性而破壞 test-r-minimal-build
- ARROW-13913 - [C++] 如果在未提供選項的情況下呼叫計算函數 index,則會發生區段錯誤
- ARROW-13915 - [R][CI] R UCRT C++ 套件不完整
- ARROW-13916 - [C++] 在 date32/64 類型上實作 strftime
- ARROW-13921 - [Python][Packaging] 為 macos wheels 固定最小 setuptools 版本
- ARROW-13940 - [R] 使用 Arrow engine 查詢啟用多執行緒
- ARROW-13961 - [C++] iso_calendar 可能未初始化
- ARROW-13976 - 在 hdfs_internal.cc 中調整以適應 arm 架構 CPU
- ARROW-13978 - [C++] 將 gtest 升級至 1.11 以修復使用最新 clang 的建置問題
- ARROW-13981 - [Java] VectorSchemaRootAppender 不適用於 BitVector
- ARROW-13982 - [C++] 如果片段未產生批次,非同步掃描器會停滯
- ARROW-13983 - [C++] fcntl(…, F_RDADVISE, …) 在 macOS 上使用 NFS 掛載時可能會失敗
- ARROW-13996 - [Go][Parquet] 修復列組的檔案偏移量
- ARROW-13997 - [C++] 還原基於 exec 節點的查詢效能
- ARROW-14001 - [Go] BitmapWriter 中的 AppendBooleans 已損壞
- ARROW-14004 - [Python] to_pandas() 轉換為 float 而不是使用 pandas 可空類型
- ARROW-14014 - FlightClient.ClientStreamListener 在解析無效 trailers 時未收到錯誤通知
- ARROW-14017 - [C++] type_fwd.h 中未包含 NULLPTR
- ARROW-14020 - [R] 寫入具有列表欄位的 datafames 速度緩慢,並且隨著巢狀層級的增加而擴展性不佳
- ARROW-14024 - [C++] ScanOptions::batch_size 在 parquet/IPC 讀取器中未被遵循
- ARROW-14026 - [C++] 批次預讀在 Parquet 掃描器中無法正確運作
- ARROW-14027 - [C++][R] 確保群組器接受純量輸入 (原標題:允許我使用分割欄位進行 group_by + summarise())
- ARROW-14040 - [C++] ScanNode.MinimalGroupedAggEndToEnd 中出現虛假的測試失敗
- ARROW-14053 - [C++] AsyncReaderTests.InvalidRowsSkipped 不穩定
- ARROW-14057 - [C++] 升級 aws-c-common 版本
- ARROW-14063 - [R] open_dataset() 不適用於沒有標頭列的 CSV
- ARROW-14076 - 無法在 Heroku/Ubuntu 20.04 (focal) 上使用 `red-arrow` gem
- ARROW-14090 - [C++][Parquet] rows_written_ 應為 int64_t 而不是 int
- ARROW-14103 - [R] [C++] 允許在分組聚合中使用 min/max
- ARROW-14109 - 讀取具有重複鍵的 JSON 時發生區段錯誤
- ARROW-14124 - [R] R <= 3.4 中的時區支援
- ARROW-14129 - [C++] 空字典陣列在 `unique` 和 `value_counts` 上崩潰。
- ARROW-14139 - [IR] [C++] Table flatbuffer 物件在較舊的 GCC 上編譯失敗
- ARROW-14141 - [IR] [C++] RelationImpl 中缺少 Join
- ARROW-14156 - [C++] StructArray::Flatten 在某些情況下不正確
- ARROW-14162 - [R] 簡單的 arrange %>% head 不遵守排序
- ARROW-14173 - [IR] 允許表示類型化的 null 字面值
- ARROW-14179 - [C++] C 資料介面中 UnionArray 的匯入/匯出具有錯誤的緩衝區計數
- ARROW-14192 - [C++][Dataset] 有序掃描時,背壓已損壞
- ARROW-14195 - [R] 修復 ExecPlan 綁定註釋
- ARROW-14197 - [C++] Hashjoin + datasets 掛起
- ARROW-14200 - [R] 日期上的 strftime 不應使用或混淆時區
- ARROW-14203 - [C++] 修復聚合核心中 Scalars 的 ExecBatch.length 描述
- ARROW-14204 - [C++] 由於 MatchLike 中缺少 ifdef guard,因此在沒有 RE2 的情況下編譯 Arrow 失敗
- ARROW-14206 - [Go] 修復 ARM 和 s390x 的建置
- ARROW-14206 - [Go] 修復 ARM 和 s390x 的建置
- ARROW-14208 - [C++] 使用 Visual Studio 2019 時發生建置錯誤
- ARROW-14210 - [C++] CMAKE_AR 未傳遞至 bzip2 第三方相依性
- ARROW-14211 - [C++] arrow-compute-hash-join-node-test 中的 Valgrind 和 TSAN 錯誤
- ARROW-14214 - [Python][CI] wheel-windows-cp36-amd64 nightly build failure
- ARROW-14216 - [R] 停用 duckdb 表格的自動清理
- ARROW-14219 - [R] [CI] DuckDB valgrind 失敗
- ARROW-14220 - [C++] thirdpartyversions 中缺少結尾引號
- ARROW-14221 - [R] [CI] DuckDB 測試在 R < 4.0 上失敗
- ARROW-14223 - [C++] 將 google_cloud_cpp_storage 新增至 ARROW_THIRDPARTY_DEPENDENCIES
- ARROW-14224 - [R] [CI] R sanitizer 建置失敗
- ARROW-14226 - [R] 處理 args != 1 的 n_distinct()
- ARROW-14237 - [R] [CI] 在 R <= 3.5 中停用 altrep
- ARROW-14240 - [C++] nlohmann_json_ep 始終重新建置
- ARROW-14246 - [C++] build_google_cloud_cpp_storage 中的 find_package(CURL) 失敗
- ARROW-14247 - [C++] parquet-arrow-test 中的 Valgrind 錯誤
- ARROW-14249 - [R] dataframe-to-table 基準測試速度減慢
- ARROW-14252 - [R] 參數部分匹配警告
- ARROW-14255 - [Python] FlightClient.do_action 是一個產生器,而不是返回一個。
- ARROW-14257 - [Doc][Python] dataset 文件建置失敗
- ARROW-14260 - [C++] 使用 vcpkg 和 Visual Studio 2019 時發生 GTest 連結器錯誤
- ARROW-14283 - [C++][CI] LLVM 13 無法在 macOS GHA 建置上使用
- ARROW-14285 - [C++] 修復從有效 IPC 檔案漂亮列印資料時的崩潰問題 (OSS-Fuzz)
- ARROW-14299 - [Dev][CI] “linux-apt-r” dockerfile 重新安裝 Minio
- ARROW-14300 - [R][CI] “test-r-gcc-11” nightly build failure
- ARROW-14301 - [C++][CI] “test-ubuntu-20.04-cpp-17” nightly build crash in GCSFS test
- ARROW-14302 - [C++] Valgrind 錯誤
- ARROW-14305 - [C++] arrow-compute-hash-join-node-test 中的 Valgrind 錯誤
- ARROW-14307 - [R] 讀取具有 POSIXct 欄位的空 feather 時崩潰
- ARROW-14313 - [Doc][Dev] Archery 的安裝說明不完整
- ARROW-14321 - [R] 區段錯誤,轉換具有 0 個區塊的字典 ChunkedArray
- ARROW-14340 - [C++] 修復 apple m1 上的 xsimd 建置錯誤
- ARROW-14370 - [C++] ASAN CI job failed
- ARROW-14373 - [Packaging][Java] macOS java-jars 建置中缺少 LLVM 相依性
- ARROW-14377 - [Packaging][Python] Python 3.9 安裝在 macOS wheel 建置中失敗
- ARROW-14381 - [CI][Python] Spark 整合失敗
- ARROW-14382 - [C++][Compute] 移除重複的 ThreadIndexer 定義
- ARROW-14392 - [C++] 捆綁的 gRPC 遺漏捆綁的 Abseil 包含路徑
- ARROW-14393 - [C++] 來源發行驗證期間的 GTest 連結錯誤
- ARROW-14397 - [C++] 修復測試工具中的 valgrind 錯誤
- ARROW-14406 - [Python][CI] Nightly dask integration jobs fail
- ARROW-14411 - [Release][Integration] Go integration tests fail for 6.0.0-RC1
- ARROW-14417 - [R] Joins 忽略左側資料集的投影
- ARROW-14423 - [Python] 修復 pyproject.toml 中的版本約束
- ARROW-14424 - [Packaging][Python] 停用 python 3.6 的 windows wheel 測試
- ARROW-14434 - R 在為具有 DateTime 的 Datasets 進行空選擇時崩潰
- PARQUET-2067 - [C++] 重複欄位的 null_count 和 num_nulls 不正確
- PARQUET-2089 - [C++] RowGroupMetaData file_offset 設定不正確