Apache Arrow 8.0.0 (2022 年 5 月 6 日)
這是一個主要版本,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 127 位不同貢獻者的 636 個提交。
$ git shortlog -sn apache-arrow-7.0.0..apache-arrow-8.0.0
43 Antoine Pitrou
40 David Li
39 Sutou Kouhei
36 Alenka Frim
29 Weston Pace
25 Rok
22 Dragoș Moldovan-Grünfeld
22 Joris Van den Bossche
20 Jonathan Keane
20 Krisztián Szűcs
19 Raúl Cumplido
17 Will Jones
16 Dewey Dunnington
13 david dali susanibar arce
12 Matthew Topol
10 Nic Crane
10 Yibo Cai
10 Vibhatha Abeykoon
9 Dominik Moritz
9 SHIMA Tatsuya
8 Neal Richardson
8 Sanjiban Sengupta
8 okadakk
8 Jacob Wujciak-Jens
7 Tobias Zagorni
7 Alessandro Molina
7 William Butler
6 Dhruv Vats
5 Yuqi Gu
5 Johnnathan
4 Anthony Louis
4 Projjal Chanda
4 Fiona La
4 Micah Kornfield
4 Bryan Cutler
3 Yaron Gvili
3 Ian Alexander Joiner
3 Vinicius Roque
3 ViniciusSouzaRoque
3 emkornfield
3 Chenxi Li
2 Jorge C. Leitao
2 Jose Almeida
2 assignUser
2 Uwe L. Korn
2 Todd Farmer
2 Tim Van Wassenhove
2 Rob Saccoccio
2 Alvin Chunga
2 Stephanie Hazlitt
2 Jeroen van Straten
2 Kyle Barron
2 Sasha Krassovsky
2 Eduardo Ponce
2 Salonijain27
2 liyafan82
2 JabariBooker
2 michalursa
2 Matthijs Brobbel
2 Danielle Navarro
2 Maya Anderson
2 Even Rouault
2 Joost Hoozemans
1 zhixingheyi-tian
1 SAm Albers
1 Alex McRae
1 Alfred Mountfield
1 Ali Amiri
1 Andrew Higgins
1 Andrew Strelsky
1 Andrii Oriekhov
1 Andy Teucher
1 Benjamin Kietzman
1 Benson Muite
1 Bob Matcuk
1 Chris Casola
1 Colin Jermain
1 Corentin
1 Dongjoon Hyun
1 Dooyoung-Hwang
1 Edward Visel
1 Elena Henderson
1 Frederic Branczyk
1 Haowei Yu
1 Hongze Zhang
1 Isaac Brodsky
1 James Duong
1 Johan Mattsson
1 João Pedro
1 Kazuaki Ishizaki
1 Kevin Gurney
1 Kian-Meng Ang
1 Laurent Goujon
1 Leo Di Donato
1 Li Jin
1 Min-Young Wu
1 MrMallIronmaker
1 Nate Clark
1 Nicolas Moreau
1 Nivia
1 Pradeep Garigipati
1 Rafael Telles
1 Romain Francois
1 Ryan Blue
1 Aakash Kumar
1 Sam Albers
1 Siddhant Rao
1 Stephan T. Lavavej
1 Thomas J. Fan
1 Tom Drabas
1 William Ayd
1 Xinyu Zeng
1 Yue Ni
1 Zac Farrell
1 bkmgit
1 burntcustard
1 fabiencelier
1 hankvyang
1 hzuo
1 iurysalino
1 jvictorhuguenin
1 jwijffels
1 karldw
1 marcbernot
1 okadak
1 ptaylor
1 shegden
修補程式提交者
以下 Apache 提交者將貢獻的修補程式合併到儲存庫中。
$ git shortlog -csn apache-arrow-7.0.0..apache-arrow-8.0.0
105 David Li
102 Antoine Pitrou
84 Sutou Kouhei
72 Jonathan Keane
47 Krisztián Szűcs
46 Joris Van den Bossche
30 Weston Pace
25 Nic Crane
23 Pindikura Ravindra
22 Matthew Topol
16 Alessandro Molina
15 Yibo Cai
15 Neal Richardson
14 Dominik Moritz
5 Bryan Cutler
5 GitHub
3 Ian Cook
2 liyafan82
2 Micah Kornfield
1 Matt Topol
1 Li Jin
1 Chao Sun
變更日誌
Apache Arrow 8.0.0 (2022-05-06)
錯誤修正
- ARROW-5248 - [Python] 支援 zoneinfo / dateutil 時區
- ARROW-7350 - [Python] 將 Parquet 統計資訊解碼為純量
- ARROW-9664 - [Python] Array/ChunkedArray.to_pandas 不支援 types_mapper 關鍵字
- ARROW-11415 - [R] map_batches 不接受資料集作為引數
- ARROW-13168 - [C++][R] 為 Windows 啟用執行階段時區資料庫
- ARROW-13594 - [CI] 再次啟用 nightly turbodbc 建置
- ARROW-13922 - [Python] 修復 ParquetDataset 在 len(path_or_paths) == 1 時拋出錯誤
- ARROW-14047 - [C++] [Parquet] FileReader 在重複讀取時傳回不一致的結果
- ARROW-14215 - [R][CI] Conda Windows 建置因程式庫名稱中的空格而失敗
- ARROW-14256 - [CI][Package] 重新啟用已停用的 conda 套件建置
- ARROW-14389 - [C++][Gandiva] 修復 LIKE 運算式的效能錯誤
- ARROW-14638 - [C++][R] Arch Linux 上未知的 C 編譯器 / ccache
- ARROW-14647 - [JS] 修復負數的 bignumToNumber
- ARROW-14665 - [JAVA] 修復 JdbcToArrow ResultSet 迭代錯誤
- ARROW-14708 - [C++] 新增遺失的 abseil 相依性以啟用靜態 flight 建置
- ARROW-14908 - [C++][R] 資料集雜湊聯結在 Windows 上發生區段錯誤
- ARROW-14911 - [C++] arrow-compute-hash-join-node-test 失敗
- ARROW-14960 - [C++] 根據我們未採用的 Google 樣式指南中的變更,在 Arrow 樣式指南中新增例外
- ARROW-15018 - [Python] DataFrame Index 在 Feather 序列化往返期間被修改
- ARROW-15092 - [R] 在非 Linux 系統上支援 create_package_with_all_dependencies()
- ARROW-15253 - [Python] 具有擴充類型索引的空資料框的 to_pandas 中的錯誤
- ARROW-15272 - [Java] 在 ArrowVectorIterator#create 中將清除失敗新增為抑制
- ARROW-15291 - [C++][Python] 如果 StructArray 包含 ExtensionArray,則在 StructArray.to_numpy 和 to_pandas 中發生區段錯誤
- ARROW-15312 - [R][C++] 使用 is.na() 篩選 Parquet 資料集會遺漏某些列
- ARROW-15401 - [Python] Gdb 測試在 Windows 和 Apple M1 上失敗
- ARROW-15426 - [C++][Gandiva] 更新 InExpressionNode 驗證
- ARROW-15444 - [C++] 使用 GCC 7.5 編譯在 aggregate_basic.cc 中失敗
- ARROW-15465 - [Python] 在資料集測試中新增一些遺失的 parquet 標記
- ARROW-15502 - [Java] 偵測 Arrow 檔案讀取器中異常的頁尾大小
- ARROW-15504 - [Python][CI] 確保測試選用元件
- ARROW-15509 - [Go][Parquet] Parquet cmds 崩潰
- ARROW-15511 - [Python][C++] 移除 numpy 索引器中的參考管理
- ARROW-15514 - [C++][Gandiva] 新增標誌以啟用 Gandiva 物件程式碼
- ARROW-15520 - [C++] 限定
arrow_vendored::date::format()
以實現 C++20 相容性 - ARROW-15533 - [C++] 在 CI 中檢查 ARROW_WITH_OPENTELEMETRY
- ARROW-15539 - [Archery] 將 ARROW_JEMALLOC 新增至建置選項
- ARROW-15541 - [Python] 提高最低 Cython 版本
- ARROW-15544 - [Go][Parquet] 修復原始結構描述 base64 解碼
- ARROW-15546 - [FlightRPC][C++] 從 Cookie 標頭中移除引號
- ARROW-15555 - [Release] 請勿推送發行標籤,因為它已存在
- ARROW-15580 - [Python] 將 pytz 設為 PyArrow 的實際選用相依性
- ARROW-15593 - [C++] 使 fork 後 ThreadPool 重新初始化為執行緒安全
- ARROW-15598 - [C++][Gandiva] 避免在產生的程式碼中使用硬式編碼的原始指標位址
- ARROW-15599 - [R] 使用
T
col type 選項從 CSV 檔案轉換子秒時間戳記的欄位 - ARROW-15603 - [C++] 移除未使用的變數
- ARROW-15604 - [C++][CI] 使用 OpenTracing 的零星 ThreadSanitizer 失敗
- ARROW-15604 - [C++][CI] 使用 OpenTracing 的零星 ThreadSanitizer 失敗
- ARROW-15607 - [C++] 修復 AVX 偵測的不正確 CPUID 標誌
- ARROW-15626 - [GLib] 修復 GArrowGIOInputStream 可能無法讀取足夠資料的錯誤
- ARROW-15627 - [R] 修復 union 資料集統一結構描述
- ARROW-15648 - [C++][Gandiva] 修復 Gandiva 快取的大小
- ARROW-15651 - [JavaScript] Structs 不正確地初始化空值
- ARROW-15652 - [C++] 修復 parquet 命名空間內部的 GDB 美化列印
- ARROW-15659 - [R] strptime 應在格式不符時傳回 NA (而非錯誤)
- ARROW-15664 - [C++] parquet 讀取器因非法 SIMD 指令而區段錯誤
- ARROW-15667 - [R] 使用 ARROW_BUILD_STATIC=OFF 測試開發建置
- ARROW-15674 - [C++][Gandiva] Like 函數在某些情況下無法正確處理具有特殊字元的模式
- ARROW-15677 - [R] 在 ArrowObjects 上呼叫 invalidate() 方法會導致後續區段錯誤
- ARROW-15679 - [R] count 應傳回未分組的資料框
- ARROW-15688 - [C++] add_checked 在持續時間溢位時不會產生錯誤
- ARROW-15699 - [C++][Gandiva] 修復 left 和 right 函數的實作...
- ARROW-15700 - [C++] Ubuntu 18.04 上的編譯錯誤
- ARROW-15705 - [JavaScript] 允許在 StructBuilder 中的子項上附加空值
- ARROW-15710 - [C++] arrow-threading-utility-test 上的間歇性死鎖
- ARROW-15715 - [Go] ipc 修剪陣列上的值偏移量
- ARROW-15718 - [C++] 增加執行緒限制以解決執行緒問題
- ARROW-15720 - [CI] 修復 nightly dask 建置 (由於 Array.to_pandas 的錯誤使用而跳過失敗的測試)
- ARROW-15723 - [Python] 區段錯誤 orcWriter 寫入表格
- ARROW-15727 - [Python] 允許將 MonthDayNano 間隔清單轉換為 Pandas
- ARROW-15728 - [Python] 減少 zstd test_ipc 的熵
- ARROW-15743 - [R]
skip
未連接到 open_dataset 上的skip_rows
,儘管錯誤訊息另有指示 - ARROW-15746 - [Release][Java] 將遺失的構件新增至 tasks.yml
- ARROW-15748 - [Python] Round 時間選項預設單位為
day
,但文件記載為second
。後續行動 - ARROW-15748 - [Python] Round 時間選項預設單位為
day
,但文件記載為second
- ARROW-15757 - [Python] 遺失 existing_data_behavior 的繫結使其無法維持舊行為
- ARROW-15760 - [C++] 避免在 cmake 中硬性依賴 git (從 github 下載 tarball)
- ARROW-15770 - [CI] 並非所有 python 測試都在 CI 作業上執行
- ARROW-15772 - [Go][Flight] 伺服器基本驗證中介軟體/攔截器錯誤地進行 base64 解碼
- ARROW-15778 - [Java] 將原生位元組序設定為結構描述
- ARROW-15783 - [Python] 在寫入時初始化靜態 pandas 資料
- ARROW-15784 - [C++][Python] 移除不再使用的標誌 enable_parallel_column_conversion
- ARROW-15791 - [Go] ipc FileWriter 負 WaitGroup 計數器
- ARROW-15794 - [CI][Crossbow] Nightly 建置因 types_mapper 中的錯誤而失敗
- ARROW-15815 - [C++][Parquet] 修復無效輸入上的未定義行為
- ARROW-15819 - [R] R 文件版本切換器在 MacOS 上的 Safari 上無法運作
- ARROW-15830 - [C++] 確保在執行 Substrait 產生之前目標目錄存在
- ARROW-15837 - [C++][Python] 釐清 ListArray::offsets() 的文件
- ARROW-15845 - [Python][Packaging] 修復 macOS wheel 建置
- ARROW-15847 - [Python][CI] 確保我們有一個 nightly Python 建置,其中 parquet 加密已停用
- ARROW-15847 - [Python] 在建置 Parquet 但未建置 Parquet 加密的情況下失敗
- ARROW-15848 - [Gandiva][C++] 修復函數 istrue 和 is not true
- ARROW-15851 - [C++] 在使用 gRPC 建置時啟用 RE2
- ARROW-15852 - [JS] 修復
Table.getByteLength()
拋出的錯誤 - ARROW-15857 - [R] rhub/fedora-clang-devel 無法安裝 'sass' (rmarkdown 相依性)
- ARROW-15863 - [Packaging][C++][Python] 修復 conda 套件建置
- ARROW-15869 - [C++] 修復 Valgrind 失敗 (未初始化的值)
- ARROW-15888 - [Doc][Python] 將開發指示現代化
- ARROW-15892 - [C++] 資料集 API 需要 s3:ListBucket 權限
- ARROW-15895 - [R] R 文件版本切換器在 Chrome 上使用返回按鈕時消失又重新出現
- ARROW-15898 - [CI] 更徹底地清除舊的 conda nightly
- ARROW-15905 - [Python][C++] 修復建置 PyArrow 時的 CMake 警告
- ARROW-15928 - [C++] 修復當機並實作區塊陣列支援以用於 replace_with_mask 函數
- ARROW-15929 - [R] io_thread_count 實際上是 CPU 執行緒計數
- ARROW-15946 - [Go] 修復在寫入巢狀資料時 pqarrow.NewColumnWriter 中的記憶體洩漏
- ARROW-15949 - [Python] 在停用 Parquet 時,不需要 Parquet 加密
- ARROW-15951 - [CI][Python] “測試 wheel” 步驟成功,儘管測試錯誤
- ARROW-15954 - [Java] 在升級後移除 mac 原生 netty kqueue 相依性
- ARROW-15960 - [C++] 修復自適應整數建構器邊緣案例的當機
- ARROW-15962 - [C++][GANDIVA] 修復 unhex 錯誤傳回
- ARROW-15965 - [C++][Python] 將 RoundToMultipleOptions 的純量建構函式新增至 Python
- ARROW-15970 - [R][CI] 重新啟用 DuckDB 開發測試
- ARROW-15973 - [CI] 將 nightly 報告分成三個:測試、套件、發行
- ARROW-15982 - [Python] parquet.read_table 無法剖析主目錄路徑
- ARROW-15985 - [CI] 修復在沒有檔案要刪除時 conda-clean 失敗的問題
- ARROW-15987 - [C++][FlightRPC] 解決 AppVeyor 上 arrow-flight-test 當機的問題
- ARROW-15993 - [CI] 將 sphinx-tabs 新增至 ci/conda_env_sphinx.txt
- ARROW-16012 - [C++] 當 Minio 未完全初始化時,在測試中重試 S3 請求
- ARROW-16013 - [C++][Python] 在 NumPyStridedConverter 中使用負步幅時發生帶號溢位
- ARROW-16016 - [C++] 修復遞迴 ccache 叫用錯誤
- ARROW-16019 - [C++] 盡量減少 Minio 連線錯誤的機會
- ARROW-16021 - [C++] arrow-compute-hash-join-node-test 在 MinGW 上逾時
- ARROW-16025 - [Python][C++] 修復關閉 ORCFileWritter 時的區段錯誤
- ARROW-16031 - [C++][Gandiva] 修復 Soundex 錯誤產生
- ARROW-16035 - [Java] 處理空的 JDBC ResultSet
- ARROW-16043 - [C++][Filesystem][S3] 為建立目錄新增遺失的空內容
- ARROW-16048 - [Python] 避免將空緩衝區位址暴露給 Python 緩衝區協定
- ARROW-16051 - [Gandiva][C++] 修復 datediff 回歸建置
- ARROW-16052 - [R] 未定義的全域函數 %>%
- ARROW-16060 - [C++] subtract_checked 支援 timestamp(“s”) 和 date32
- ARROW-16071 - [R] 更多未定義的全域函數
- ARROW-16078 - 將捆綁的 zlib 升級到 1.2.12
- ARROW-16099 - [JS] 壓縮的 RecordBatches 應拋出錯誤
- ARROW-16107 - [Dev][Archery] 修復 archery crossbow latest-prefix 查詢
- ARROW-16110 - [C++] GcsFileSystem::Make 忽略 IOContext
- ARROW-16113 - [Python] 在欄位子集為字典編碼的情況下,Partitioning.dictionaries
- ARROW-16131 - [C++] 支援在 IPC 檔案的批次中儲存和擷取自訂中繼資料
- ARROW-16134 - [C++][GANDIVA] 修復 Concat_WS 錯誤傳回
- ARROW-16136 - [Gandiva][C++] 修復 AddMappings 函數大小過大的問題
- ARROW-16139 - [Python] tests/test_dataset.py::test_write_dataset_s3 中的當機
- ARROW-16143 - [Java] 升級 jackson 相依性 CVE-2020-36518
- ARROW-16143 - [Java] 升級 jackson 相依性 CVE-2020-36518
- ARROW-16146 - [C++] arrow-gcsfs-test 逾時
- ARROW-16148 - [C++] TPC-H 產生器清除
- ARROW-16152 - [C++] 修復 Substrait 中未知函數的區段錯誤
- ARROW-16159 - [C++][Python] 允許 FileSystem::DeleteDirContents 在目錄遺失時成功
- ARROW-16162 - [C++][FlightRPC] 修復 Ubuntu 18.04 上的 Flight 建置
- ARROW-16163 - [Go] IPC FileReader 在與 ZSTD 壓縮一起使用時洩漏記憶體
- ARROW-16165 - [CI][Archery] 修復 nightly 查詢到 crossbow 以傳送報告
- ARROW-16169 - [C++][Gandiva] 修復 convert_fromUTF8_binary() 中的空字串案例
- ARROW-16181 - [CI][C++] TPCH 節點測試中的 Valgrind 失敗
- ARROW-16182 - [C++][CI] TPCH 節點測試在 ThreadSanitizer 下逾時
- ARROW-16185 - [C++] 修復 strptime 核心中未初始化的輸出資料
- ARROW-16197 - [Docs] 修復損壞的連結
- ARROW-16205 - [C++][FlightRPC] 請勿使用 constexpr std::initializer_list
- ARROW-16209 - [JS] 支援在表格上設定任意符號
- ARROW-16215 - [C++][FlightRPC] 修復 Windows 上 Flight 測試中的區段錯誤
- ARROW-16216 - [Python][FlightRPC] 修復 test_flight.py (在 Flight 無法使用時)
- ARROW-16219 - [CI] 修復 git config 以防止 SCM 工具失敗
- ARROW-16223 - [C++] 修復十進位縮減比例捨入
- ARROW-16225 - [C++][Parquet] 修復加密 AAD 隨機位元組產生的長度
- ARROW-16233 - [Python][Packaging] test_zoneinfo_tzinfo_to_string 在 Windows 上的套件 wheel 上因 zoneinfo._common.ZoneInfoNotFoundError 而失敗
- ARROW-16235 - [C++] 修復 MinGW 的建置失敗、編譯器警告
- ARROW-16236 - [Python] [Packaging] test_s3fs_limited_permissions_create_bucket 在 MAC OS wheel 建置上因權限遭拒而失敗
- ARROW-16237 - [Docs] Apache Impala 不再處於孵化階段
- ARROW-16238 - [C++] 修復預先緩衝 IPC 讀取時的 nullptr 取消參考
- ARROW-16261 - [C++] 修復 HDFS 上 missing_dir_ok=True 的 DeleteDirContents
- ARROW-16262 - [CI][Integration] 跳過 kartothek 整合中失敗的測試
- ARROW-16278 - [CI] 修復 brew 上的 git 安裝失敗
- ARROW-16278 - [CI] 修復 brew 上的 git 安裝失敗
- ARROW-16278 - [CI] 修復 brew 上的 git 安裝失敗
- ARROW-16293 - [CI][GLib] 使測試穩定
- ARROW-16295 - [CI][Release] 使用 windows-2019 進行 verify-rc-source-windows
- ARROW-16300 - pc.sort_indices 與不存在的欄位一起使用時拋出 malloc 錯誤
- ARROW-16301 - [C#][CI] 修復 .NET 6 的 docker 設定
- ARROW-16305 - [C++] 在重新命名期間遺漏了對 ARROW_ENGINE 的參考
- ARROW-16306 - [CI] 修復 Ubuntu 上的 Nightly verify rc
- ARROW-16307 - [Java][FlightRPC] 跳過不穩定的測試 TestDoExchange.testClientCancel
- ARROW-16311 - [Java] 當未請求 table_schema 欄位時,請勿傳回該欄位
- ARROW-16312 - [C++][CI] 在 windows 驗證建置中安裝 tzdata
- ARROW-16313 - [R] 確保 assume_timezone 選項始終初始化
- ARROW-16332 - [Release][Java] 新增構件上傳驗證
- ARROW-16336 - [Python] ParquetDataset - 向使用者隱藏內部 (common_)metadata 相關警告
- ARROW-16374 - [R][C++] 在 sanitizer 執行期間跳過另一個 snappy 測試
- ARROW-16375 - [R][CI] 在 Windows 上將 test-r-devdocs 釘選到 R 4.1
- ARROW-16393 - [JAVA] 更新選項規格以接受 query、catalog、schema 和 table 的值
- ARROW-16413 - [Python] 某些資料集 API 會與 python 檔案系統一起掛起
- ARROW-16417 - [C++][Python] test_exec_plan.py / test_joins 中的區段錯誤
- ARROW-16419 - [Python] 正確等待 ExecPlan 完成
- ARROW-16442 - [Python][Dataset] 修復 ORC 資料集的片段以使用 FileFragment 類別
- PARQUET-2115 - [C++] Parquet 字典位元寬度限制為 32 位元
- PARQUET-2118 - [C++] 請勿假設標準指標
- PARQUET-2119 - [C++] 修復 DeltaBitPackDecoder fuzzer 發現的問題
- PARQUET-2123 - [C++] 修復 ScanFileContents 中的無效記憶體存取
- PARQUET-2124 - [C++] 移除 Parquet Dictionary DCHECK
- PARQUET-2130 - 修復使用非標準金鑰名稱進行偵錯時的當機。
- PARQUET-2131 - 解碼的數字值 DCHECK 應為例外
新功能與改進
- ARROW-1888 - [C++] 實作 Struct Casts
- ARROW-3016 - [Docs][C++] 使用 perf 進行記憶體分析
- ARROW-3039 - [Go] 新增 DictionaryArray 的支援
- ARROW-3998 - [C++] 新增 TPC-H 產生器
- ARROW-5107 - [Release] 驗證非 RC 原始碼和二進位構件
- ARROW-5598 - [Go] 將 array.Array{,Approx}Equal 重新命名為 array.{,Approx}Equal
- ARROW-6780 - [C++][Parquet] 支援在寫入/讀取 parquet 中的 DurationType (寫入為 int64)
- ARROW-7174 - [Python] 公開 parquet dictionary_pagesize_limit 寫入參數
- ARROW-7272 - [C++][Java][Dataset] RecordBatch 和 VectorSchemaRoot 之間的 JNI 橋接器
- ARROW-7914 - [Python] 允許 pandas datetime 作為 feather 的索引
- ARROW-9235 - [R] 讀取和寫入檔案時支援
connection
類別 - ARROW-9378 - [Go] 支援未帶號字典索引
- ARROW-9947 - [Python] Parquet 檔案加密的高階 Python API。
- ARROW-10643 - [Python] Pandas<->pyarrow 往返無法重新建立空資料框的索引
- ARROW-10924 - [C++] 驗證 ValidateArrayFull 中的時間資料
- ARROW-11071 - [R][CI] 在測試中使用 processx 設定 minio 和 flight 伺服器
- ARROW-11259 - [Python] 允許建立巢狀欄位的欄位參考
- ARROW-11989 - [C++][Python] 改善 ChunkedArray 存取元素的複雜性
- ARROW-12515 - [Dev][Wiki][Release] 修復和更新 Windows RC 驗證腳本
- ARROW-12516 - [C++][Gandiva] 實作 castINTERVALDAY(varchar) 和 castINTERVALYEAR(varchar) 函數
- ARROW-12659 - [C++] 支援 is_valid 作為保證
- ARROW-12743 - [R] 為開發相依性新增 DESCRIPTION 欄位
- ARROW-13185 - [MATLAB] 建立單一 MEX 閘道函數,將委派給特定的 C++ 函數
- ARROW-13204 - [MATLAB] 更新 MATLAB 介面的文件,以反映最新的 CMake 建置系統變更
- ARROW-13231 - [Doc] 新增 ORC 文件
- ARROW-13260 - [Doc] 託管不同發行版本的說明文件 + 版本切換器
- ARROW-13337 - [R] 定義 Math 群組泛型
- ARROW-13375 - [C++][Gandiva] 在 Gandiva 上實作 POSITIVE 和 NEGATIVE Hive 函數
- ARROW-13409 - [C++][FlightRPC] 公開具有截止時間的伺服器關閉
- ARROW-13564 - [Dev] 在整合提取請求時,檢查個別提交訊息中是否有 “Co-authored-by:” 標籤
- ARROW-13616 - [R] 速查表結構
- ARROW-13683 - [R] 測試 Windows UCRT R
- ARROW-13703 - [Python][R] 為新的資料集寫入選項新增繫結
- ARROW-13993 - [C++][Compute] 新增 hash_one 聚合函數
- ARROW-14075 - [C++][CI] 為 VisualStudio 2019、非 conda 新增 appveyor CI 作業
- ARROW-14091 - [C++] add(date, duration) -> timestamp 核心
- ARROW-14093 - [C++] subtract(date, date) -> duration 核心
- ARROW-14094 - [C++] add(timestamp, duration) -> timestamp 核心
- ARROW-14095 - [C++] subtract(timestamp, duration) -> timestamp 核心
- ARROW-14096 - [C++] add(time, duration) -> time 核心
- ARROW-14097 - [C++] subtract(time, duration) -> time 核心
- ARROW-14098 - [C++] subtract(time, time) -> duration 核心
- ARROW-14099 - [C++] add(duration, duration) -> duration 核心
- ARROW-14100 - [C++] subtract(duration, duration) -> duration 核心
- ARROW-14101 - [C++] multiply(duration, integer) -> duration 核心
- ARROW-14102 - [C++] divide(duration, integer) -> duration 核心
- ARROW-14153 - [C++][Dataset] 在 ORC 掃描器中新增對 batch_size 的支援
- ARROW-14168 - [R] 僅警告一次關於 arrow 函數差異
- ARROW-14169 - [R] factors 的 altrep
- ARROW-14199 - [R] format 的繫結 (在可能的情況下)
- ARROW-14266 - [R] 使用 WriteNode 寫入查詢
- ARROW-14279 - [Docs] 首次嘗試描述 PyArrow 程式庫的結構
- ARROW-14292 - [C++][Python] 表格的聯結基礎
- ARROW-14293 - [Python] PyArrow 中的基本聯結功能
- ARROW-14322 - [Doc] 新增關於如何將 Python 連接到其他語言的 Python 文件
- ARROW-14333 - [C++][Compute] 將二進位和 LargeStringType 測試新增至比較核心
- ARROW-14339 - [文件] 為 pkgdown (R) 文件新增標準網址
- ARROW-14442 - [R] 修正在將時區為 “” 的時間戳記轉換時的行為
- ARROW-14444 - [C++] 在 executable-pipelines 中實作基於任務的模型。
- ARROW-14498 - [文件] 使重新產生帶有額外修補程式的舊文件成為可能
- ARROW-14502 - [C++][Gandiva] 新增 DayOfMonth 測試
- ARROW-14506 - [C++] Conda 支援 google-cloud-cpp
- ARROW-14553 - [文件] Java Cookbook 發行版本 1
- ARROW-14579 - [文件] 記錄 CI
- ARROW-14591 - [R] 為 lubridate duration 類型實作綁定
- ARROW-14612 - [C++] 支援基於檔案名稱的分區
- ARROW-14631 - [C++][Gandiva] 實作 Nextday 函數
- ARROW-14651 - [發行][Archery] 新增重試下載的支援
- ARROW-14672 - [文件] 記錄如何在 Python 和 Java 之間交換資料
- ARROW-14679 - [R][C++] 在 joins 中處理 suffix 參數
- ARROW-14698 - [文件][FlightRPC] 為 Flight SQL 新增 API 文件
- ARROW-14702 - [文件][C++] 記錄執行緒模型
- ARROW-14745 - [R] 啟用真正的 duckdb 串流
- ARROW-14776 - [網站] 不要在合併提交訊息中包含壓縮的提交
- ARROW-14798 - [C++][Python][R] 為 PrettyPrintOptions 新增容器視窗
- ARROW-14808 - [R] 為
lubridate::date()
實作綁定 - ARROW-14810 - [R] 為 lubridate 的
date_decimal()
和decimal_date()
實作綁定 - ARROW-14815 - [R] 為
lubridate::semester()
綁定 - ARROW-14817 - [R] 為
lubridate::tz()
實作綁定 - ARROW-14823 - [R] 為 lubridate::leap_year 實作綁定
- ARROW-14824 - [R] 為 lubridate::epiyear() 實作綁定
- ARROW-14825 - [C++] 用於提取 epiyear 的時間組件提取函數
- ARROW-14826 - [R] 為
lubridate::dst()
實作綁定 - ARROW-14827 - [C++] 用於提取 dst 指示符的時間組件提取函數
- ARROW-14893 - [C++] 允許從 URI 建立 GCS 檔案系統
- ARROW-14927 - [CI] 將 Fedora 33 升級到 Fedora 35
- ARROW-14942 - [R] 為 lubridate 的 dpicoseconds, dnanoseconds, desconds, dmilliseconds, dmicroseconds 綁定
- ARROW-14943 - [R] 為 lubridate 的 ddays, dhours, dminutes, dmonths, dweeks, dyears 綁定
- ARROW-14944 - [R] 實作
lubridate::make_difftime()
- ARROW-14963 - [文件] 為程式碼區塊新增複製按鈕擴充功能
- ARROW-14993 - [C++] 基準測試 CSV 寫入器
- ARROW-14997 - [Python][文件] 為 API 文件新增 thread_count 函數
- ARROW-15013 - [R] 在 R 層級公開 concatenate
- ARROW-15015 - [R] 用於確保所有測試都執行的測試 / CI 標誌?
- ARROW-15020 - [R] 為新的資料集寫入選項新增綁定
- ARROW-15040 - [R] 啟用 write_csv_arrow 以 Dataset 或 arrow_dplyr_query 作為輸入
- ARROW-15061 - [C++] 為核心函數和執行計畫節點新增日誌記錄
- ARROW-15062 - [C++] 為當前 spans 新增記憶體資訊
- ARROW-15064 - [C++] 在 CSV 寫入器中向量化 CheckStringHasNoStructuralChars
- ARROW-15066 - [C++] 啟用使用非捆綁的 OpenTelemetry
- ARROW-15067 - [C++] 為掃描器新增追蹤 spans
- ARROW-15080 - [Python][C++] 啟用元組轉換為間隔
- ARROW-15089 - [C++][Compute] 實作核心以查找給定鍵的 MapArray 項目
- ARROW-15098 - [R] 為
lubridate::duration()
和/或as.difftime()
新增綁定 - ARROW-15118 - [C++] 如果所有 Scalar Kernels 的輸入皆有效,則避免使用點陣圖緩衝區
- ARROW-15152 - [C++][Compute] 實作 hash_list 聚合函數
- ARROW-15156 - [文件] 為 Java 文件實作教學課程
- ARROW-15157 - [文件] 新貢獻者指南 v2
- ARROW-15163 - [R] 8.0.0 版本的 lubridate 函數
- ARROW-15167 - [R] 提升 decimal 轉換的效率
- ARROW-15168 - [R] 新增 S3 泛型函數以建立主要的 Arrow 物件
- ARROW-15178 - [Java][文件] Java 教學:Java 開發人員文件
- ARROW-15180 - [文件] 記錄如何為 C++ 功能新增 JNI 綁定
- ARROW-15183 - [Python][文件] 新增遺失的資料集寫入選項
- ARROW-15192 - [Java] 允許使用 Jackson 2.12 及更高版本
- ARROW-15195 - [MATLAB] 在 macOS 上為 MATLAB 介面啟用 GitHub Actions CI
- ARROW-15197 - [C++] UTF-8 字串重複核心
- ARROW-15212 - [C++] 在 joins 中處理 suffix 參數
- ARROW-15215 - [C++] 在 replace_with_mask, case_when, coalesce, choose, fill_null_forward, fill_null_backward 之間整合核心資料複製工具
- ARROW-15223 - [C++] 實作 Not Between 三元核心
- ARROW-15238 - [C++] 帶有 substrait consumer 的 ARROW_ENGINE 模組
- ARROW-15239 - [C++][Compute] 新增 Bloom filter 實作
- ARROW-15258 - [C++] 從表格建立來源節點的簡易選項
- ARROW-15262 - [C++] 建立 ToTable sink 節點
- ARROW-15281 - [C++] 實作檢索片段檔案名稱的能力
- ARROW-15282 - [C++][FlightRPC] 從底層傳輸中分離資料方法
- ARROW-15294 - [R] 移除 arrow-without-arrow 和其他 Solaris hacks
- ARROW-15296 - [CI][GO] 為 CI lint 工作新增 Go staticcheck linting
- ARROW-15299 - [R] 調查 {remotes} 相依性 “soft” 與 TRUE
- ARROW-15313 - [C++][Java][FlightRPC] 為 flight-sql 實作 type info 方法
- ARROW-15314 - [C++][Java][FlightRPC] 在 Flight SQL 傳回的 Arrow schema 上新增遺失的 metadata
- ARROW-15321 - [開發][Python] 也對 Cython 產生方法進行 numpydoc 驗證
- ARROW-15346 - [文件][指南] Arrow codebase - 小錯誤修正
- ARROW-15347 - [文件][指南] 更新新貢獻者指南中的測試章節
- ARROW-15348 - [文件][指南] PR 的生命週期 - 小錯誤修正
- ARROW-15349 - [文件][指南] 現有貢獻者頁面 - 更新
- ARROW-15350 - [文件][指南] 新增樣式和 linters 資訊章節
- ARROW-15351 - [文件][指南] R 綁定的額外教學課程
- ARROW-15352 - [文件][指南] R 套件和 make clean
- ARROW-15353 - [文件][指南] CI 主題簡介和現有文件的連結
- ARROW-15364 - [Python] 更新讀取文件字串中的檔案系統條目以反映當前行為
- ARROW-15366 - [文件] 自動化 R 和非 R 版本切換器的套件版本遞增
- ARROW-15367 - [Python] 改善 8.0.0 版本的類別和方法文件字串
- ARROW-15369 - [文件] 調整範例以使用對 str 指標的新支援
- ARROW-15374 - [C++][FlightRPC] 在資料方法中新增 MemoryManager 的支援
- ARROW-15389 - [C++][開發] 改善 GDB 外掛程式中的 Array 預覽
- ARROW-15400 - [Go][CI] 在 arm 機器上執行建置
- ARROW-15410 - [C++][Datasets] 掃描 parquet 時,改善 datasets API 的記憶體使用量
- ARROW-15418 - [Go][Flight] 更新 gRPC 版本,隱藏實作細節
- ARROW-15425 - [C++] 在檔案格式中新增 delta 字典到整合測試
- ARROW-15428 - [Python] 解決 Parquet 類別和函數中的文件字串問題
- ARROW-15429 - [Python] 解決 ChunkedArray 類別、方法、屬性和建構子的文件字串問題
- ARROW-15431 - [Python] 解決 Schema 中的文件字串問題
- ARROW-15432 - [Python] 解決 CSV 文件字串問題
- ARROW-15440 - [Go] 使用 Arm64 GoLang Assembly 實作 ‘unpack_bool’
- ARROW-15450 - [Python][Wheel] Flight 測試在 macOS 測試期間收到 SIGKILL
- ARROW-15462 - [GLib] 新增 GArrow{Month,DayTime,MonthDayNano}Interval{Scalar,Array,ArrayBuilder}
- ARROW-15468 - [R][CI] 一個針對 DuckDB 開發分支進行測試的 crossbow 工作
- ARROW-15471 - [R] R 中的 ExtensionType 支援
- ARROW-15472 - [網站] 新增 Flight SQL 部落格文章
- ARROW-15477 - [C++][Python] 允許從陣列和類型建立 (FixedSize/Large)ListArray
- ARROW-15480 - [R] 擴展 schema/colnames 不符錯誤訊息
- ARROW-15483 - [發行] 改造驗證腳本
- ARROW-15487 - [FlightRPC][C++][GLib][Python][R] 實作 FlightClient::Close
- ARROW-15489 - [R] 擴展 RecordBatchReader 的可用性
- ARROW-15491 - [網站] 輪換 2022 年的 PMC 主席
- ARROW-15497 - [C++][Homebrew] 使用 Clang Tools 12
- ARROW-15501 - [Java] 支援驗證 decimal 向量
- ARROW-15503 - [GLib][發行] 避免棄用警告
- ARROW-15505 - [C++][Compute] 在 product 聚合中支援 null 類型
- ARROW-15506 - [C++][Compute] 在 hash_sum/hash_product/hash_mean 中支援 Null 類型
- ARROW-15510 - [C++][FlightRPC] 為基準測試新增 CUDA 記憶體管理器支援
- ARROW-15515 - [C++] 使用新選項更新 ExecPlan 範例程式碼和文件
- ARROW-15517 - [R] 在 write_dataset() 中使用 WriteNode
- ARROW-15523 - [Python] 支援將 Datasets 作為 Joins 的輸入
- ARROW-15524 - [Python] 使 joins 能夠接收 Tables 作為輸入
- ARROW-15525 - [Python] 使 joins 能夠輸出 Table 作為結果。
- ARROW-15526 - [Python] 支援 Dataset.join
- ARROW-15527 - [Python] 使 Joins 能夠執行 join 操作
- ARROW-15532 - [C++] 修正 StringClassifyDoc 的未使用警告
- ARROW-15542 - [GLib][Parquet] 新增 GParquet*Metadata
- ARROW-15550 - [C++] 新增可選的偵錯記憶體檢查
- ARROW-15551 - [C++][FlightRPC] 更新 gRPC TLS 選項偵測以支援 1.43
- ARROW-15552 - [文件][格式] 移除 base64 的錯誤提及
- ARROW-15556 - [發行] 新增一個用於更新 Homebrew 套件的腳本
- ARROW-15569 - [Packaging][deb] 使用 gem 而非 apt 安裝 gobject-introspection gem
- ARROW-15570 - [CI][Nightly] 移除 centos-8 R nightly 工作
- ARROW-15572 - [Java][文件] 為 Java 文件新增安裝章節
- ARROW-15573 - [Java][文件] 記錄 Apache Arrow 記憶體管理
- ARROW-15574 - [Java][文件] 審閱現有文件
- ARROW-15575 - [Java][文件] Datasets 教學課程
- ARROW-15576 - [Java][文件] 記錄 2D 資料的 VectorSchemaRoots
- ARROW-15577 - [Java][文件] 新增 Arrow Flight 文件
- ARROW-15578 - [Java][文件] 記錄 C Data Interface 以及如何與其他語言介接
- ARROW-15579 - [C++] 新增 MemoryManager::CopyBuffer(const Buffer&)
- ARROW-15594 - [C++][FlightRPC] 為各種 Flight 類型新增 Deserialize(const Buffer&)
- ARROW-15595 - [發行][Ruby] 新增 MFA 支援
- ARROW-15600 - [C++][FlightRPC] 新增最簡化的 Flight SQL 查詢範例
- ARROW-15601 - [文件][發行] 更新發行後腳本以移動穩定文件 + 保留開發文件
- ARROW-15605 - [CI][R] 在我們的 autobrew CI 工作中繼續使用舊的 macos runners
- ARROW-15606 - [CI][R] 新增一個用於測試 R 套件的 brew 建置
- ARROW-15609 - [C++][Compute] 支援僅帶有 keys 的 hash_aggregate
- ARROW-15611 - [C++] 將 arrow::ipc::internal::json::ArrayFromJSON 遷移至 Result<>
- ARROW-15614 - [C++] 新增 sqrt 二元純量核心
- ARROW-15617 - [文件][C++] 記錄環境變數
- ARROW-15619 - [C++] 用於提取 is_leap_year 指示符的時間組件提取函數
- ARROW-15623 - [C++][Python] 更新 developers/python.rst (console blocks + archery 安裝中的 “”)
- ARROW-15625 - [C++] 在範例可執行檔名稱中將底線轉換為連字符
- ARROW-15629 - [GLib] 新增 garrow_{,large_}string_array_builder_append_string_len()
- ARROW-15630 - [發行][MSYS2] 也更新反向相依性
- ARROW-15631 - [Packaging][RPM] 為 libs 套件新增主要版本
- ARROW-15632 - [R] 修剪捆綁的 libarrow 原始碼
- ARROW-15633 - [R] 跳過需要網路連線的 s3_bucket 範例
- ARROW-15634 - [C++][Packaging] 提升 MacOS 上 java-jars nightly 建置的編譯速度
- ARROW-15643 - [C++] 允許透過 cast 選取 StructArray 的欄位子集
- ARROW-15650 - [MATLAB] 重新命名 MEX gateway 函數
- ARROW-15653 - [R][CI] 修正捆綁 cpp 原始碼的測試
- ARROW-15656 - [C++][R] 使 valgrind 建置稍微快一點
- ARROW-15657 - [C++][Java] 將 Apache ORC 升級到 1.7.3
- ARROW-15665 - [C++] 修正帶有無效輸入的 strptime 中的 error_is_null
- ARROW-15665 - [C++] 為 StrptimeOptions 新增錯誤處理選項
- ARROW-15670 - [C++/Python/Packaging] 更新 conda pinnings 並在 Windows 上啟用 GCS
- ARROW-15672 - [C++] 啟用 CSV 寫入器以控制欄位分隔符
- ARROW-15673 - [R] 如果未安裝 DuckDB,則優雅地錯誤處理
- ARROW-15680 - [C++] 當捨入到週的倍數時,時間 floor/ceil/round 應接受 week_starts_monday
- ARROW-15682 - [CI] Github 開始將 “windows-latest” 標籤從 windows 2019 遷移到 windows 2022
- ARROW-15683 - [網站][Rust][DataFusion] 撰寫 7.0.0 發行公告部落格
- ARROW-15690 - [開發] 更新將 master 硬編碼為預設值的 GitHub Actions 工作流程
- ARROW-15692 - [開發] 更新發行腳本以使用預設分支
- ARROW-15694 - [開發] 更新 apache/arrow-site GitHub Actions deploy.yml 網站部署工作流程,以支援在推送到 main 時觸發
- ARROW-15697 - [R] 為 pkgdown 網站新增標誌和 meta 標籤
- ARROW-15698 - [整合] 在測試中私有化一些程式碼
- ARROW-15701 - [R] month() 應允許整數輸入
- ARROW-15706 - [C++][FlightRPC] 實作 UCX 傳輸
- ARROW-15707 - [C++][FlightRPC] 使 Flight 測試在不同傳輸之間更具可重複使用性
- ARROW-15708 - [R][CI] 在 clang sanitizer 上跳過 snappy 編碼的 parquets
- ARROW-15709 - [C++] 如果執行 “inline” 建置,則 ARROW_ENGINE 的編譯失敗
- ARROW-15709 - [C++] 還原變更
- ARROW-15709 - [C++] 如果執行 “inline” 建置,則 ARROW_ENGINE 的編譯失敗
- ARROW-15712 - [R] 為
Expression
物件新增type
方法 - ARROW-15714 - [C++][Gandiva] 增加 gandiva protobuf parser 中的 protobuf 遞迴限制
- ARROW-15717 - [文件] 將 hash_one 新增至文件
- ARROW-15721 - [文件][FlightRPC] 將 Flight/Flight SQL 新增至子專案
- ARROW-15722 - [Java] 改善具有不正確子系的巢狀類型的錯誤訊息
- ARROW-15726 - [C++] 如果未提供 projected_schema,但提供了綁定的投影表達式,則我們應使用它來推斷 projected_schema
- ARROW-15739 - [C++] 將 xsimd 升級到最新版本
- ARROW-15740 - [C++][Compute] 基準測試元素級別的 min/max
- ARROW-15741 - [文件][格式] 釐清 C 串流介面的執行緒安全性
- ARROW-15742 - [Go] 使用 Arm64 GoLang Assembly 實作 ‘bitmap_neon’
- ARROW-15744 - [C++][Gandiva] 為間隔類型新增 NEGATIVE 函數
- ARROW-15749 - [Ruby] 為 Month Interval Type 的 #values 新增支援
- ARROW-15750 - [Ruby] 為 Month Interval Type 的 #raw_records 新增支援
- ARROW-15755 - [Java] 支援 Java 17
- ARROW-15763 - [C++] 提升 CSV 寫入器效能
- ARROW-15766 - [R] 為 lubridate::duration() 實作綁定
- ARROW-15769 - [C++] 產生更少的算術核心
- ARROW-15775 - [R] 清理 as.* 方法以使用 build_expr()
- ARROW-15776 - [Python] 公開 IpcReadOptions
- ARROW-15777 - [Python][Flight] 允許將 IpcReadOptions 傳遞給 FlightCallOptions
- ARROW-15781 - [Python] 在 ensure_complete_metadata 中釋放 GIL
- ARROW-15782 - [C++] 修正 Findre2Alt.cmake 以先檢查 RE2_ROOT 變數
- ARROW-15788 - [C++][FlightRPC] 為替代傳輸準備基準測試
- ARROW-15789 - [C++] 將 OpenTelemetry 更新至 v1.2.0
- ARROW-15795 - [Java] 在帶有時區向量的時間戳記中為 timeZone 新增 getter
- ARROW-15796 - [Python] Pickling ParquetFileFragment 不應提取 metadata
- ARROW-15799 - [R] 更新 as.Date() 以支援與 epoch 不同的 origin
- ARROW-15800 - [R] 為
lubridate::as_date()
和lubridate::as_datetime()
實作綁定 - ARROW-15801 - [R] 為 lubridate 日期時間輔助函數實作綁定
- ARROW-15802 - [R] 為
lubridate::make_datetime()
和lubridate::make_date()
綁定 - ARROW-15810 - [CI][Nightly] 嚴格檢查 R 相關映像
- ARROW-15814 - [R][文件] 改善 cast() 的文件
- ARROW-15817 - [R] 使用 TableSourceNode 而非 InMemoryDataset
- ARROW-15818 - [R] 在 R 綁定中實作初始的 Substrait consumer
- ARROW-15820 - [C++][文件] 將 table_source 新增至 streaming_execution.rst 並釐清參數名稱
- ARROW-15821 - [JS] 修正目錄中 sourcemaps 的路徑
- ARROW-15823 - [C++][Python] 新增一個將 Table 轉換為 RecordBatchReader 的方法
- ARROW-15824 - [Python] 將 pyarrow.parquet 設為套件
- ARROW-15827 - [R] 改善 write_dataset(…, max_rows_per_group) 的 UX
- ARROW-15831 - [Java] 升級 Flight 相依性
- ARROW-15841 - [R] 實作 SafeCallIntoR 以從另一個執行緒安全地呼叫 R API
- ARROW-15844 - [發行][Packaging] 為 detached sign 使用 ASCII 格式
- ARROW-15846 - [格式] 釐清 struct validity bitmap 的存在
- ARROW-15850 - [C++] Engine substrait 標頭在安裝中遺失
- ARROW-15854 - [C++] 精簡 CSV 寫入器程式碼
- ARROW-15860 - [Python] 記錄 RecordBatchReader
- ARROW-15864 - [Java][文件] 更新 Arrow nightly Maven 發行版本文件
- ARROW-15866 - [Packaging][Ubuntu] 停止支援 Ubuntu 21.04
- ARROW-15870 - [Python] 開始為 parquet.read_table 中 use_legacy_dataset=True 引發棄用警告
- ARROW-15871 - [Python] 開始為新 API 將不支援的 ParquetDataset 關鍵字引發棄用警告
- ARROW-15873 - [CI] 從 Ubuntu 21.04 遷移到 22.04
- ARROW-15875 - [R] 為輸入串流公開 ReadMetadata
- ARROW-15882 - [Python][CI] 確保我們在 nightly hypothesis 建置中執行 hypothesis 測試
- ARROW-15885 - [Ruby] 為 DayTime Interval Type 的 #values 新增支援
- ARROW-15886 - [Ruby] 為 DayTimeInterval 類型的 #raw_records 新增支援
- ARROW-15890 - [CI][Python] 使用 venv 而非 virtualenv
- ARROW-15896 - [Python][C++] 為檔案系統 “file not found” 錯誤新增 errno 詳細資訊
- ARROW-15900 - [C++] 支援 Substrait 讀取 Feather 格式的本機檔案
- ARROW-15902 - [網站] 新增新的提交者:Raphael Taylor-Davies, Wang Xudong, Yijie Shen, Kun Liu
- ARROW-15916 - [Packaging][RPM] 新增 CentOS Stream 8 的支援
- ARROW-15917 - [Java][文件] 記錄如何使用 Flight artifacts
- ARROW-15918 - [Ruby][{day:, millisecond:}, …] )
- ARROW-15919 - [C++] 新增與時間戳記和持續時間數學運算不可交換的函數
- ARROW-15921 - [格式][FlightRPC][C++][Java] 釐清 FlightEndpoint.locations 的解釋
- ARROW-15923 - [Packaging][Linux] 啟用 GCS 支援
- ARROW-15924 - [Ruby] 為 MonthDayNanoInterval 類型的 #values 新增支援
- ARROW-15925 - [Ruby] 為 MonthDayNanoInterval 類型的 #raw_records 新增支援
- ARROW-15931 - [網站] 將明確的 Apache LICENSE.txt 和 NOTICE.txt 檔案新增至 apache/arrow-site 儲存庫
- ARROW-15932 - [C++][FlightRPC] 為常見的 Flight 套件新增更多測試
- ARROW-15934 - [Python] 在 python 中公開 write_batch_size
- ARROW-15935 - [Ruby] 為 Arrow::DictionaryArray#values 新增測試
- ARROW-15939 - [Python] 為 JSON options 類別新增 pickle 支援
- ARROW-15940 - [Gandiva][C++] 為 decimal 資料類型新增 NEGATIVE 函數
- ARROW-15941 - [C++] 允許使用環境變數覆寫 IO 執行緒的數量
- ARROW-15944 - [文件][C++] 記錄在 Arch Linux 上建置的相依性
- ARROW-15947 - [R] arrow_dplyr_query 的 rename_with s3 方法
- ARROW-15950 - [Go] 將 BitSetRunReader 提升到 internal/bitutils 套件
- ARROW-15952 - [C++] 記錄 Visitors 並完成 Scalar::Accept
- ARROW-15955 - [Packaging][RPM] 將遺失的 json-devel 新增至 CentOS Stream 8 建置映像
- ARROW-15956 - [Java] 整合 Flight 整合測試程式碼
- ARROW-15963 - [Go][Parquet] 簡化 ReaderAtSeeker 介面
- ARROW-15968 - [C++] 更新 AsyncGenerator 語意,僅在所有未完成的 futures 完成後才發出終端項目
- ARROW-15972 - [Java][文件] 新增入門章節
- ARROW-15974 - [C++] 將 flight/types.h 標頭定義遷移至使用 Result<>
- ARROW-15975 - [C++] 記錄類型特徵和 inline visitors
- ARROW-15976 - [C++] 清理執行計畫範例的註解
- ARROW-15979 - [C++][文件] 在文件中公開 parquet::WriterProperties 的更多函數
- ARROW-15984 - [C++] 變更 RecordBatchReader API 以使用 Result<>
- ARROW-15989 - [R] Table 和 RecordBatch 的 rbind & cbind
- ARROW-15994 - [C++] 撤銷 taskify 變更
- ARROW-15995 - [GO] 提升 ‘sum_float64_neon’ 效能
- ARROW-15998 - [文件][CI] 使用 sphinx-design tabs 而非 sphinx-tabs
- ARROW-15999 - [Python] 為使用 hypothesis 的測試關閉 deadlines
- ARROW-16007 - [R] grepl 綁定為 NA 輸入傳回 FALSE
- ARROW-16011 - [R] 如果 lintr 發現問題,CI 工作應失敗
- ARROW-16014 - [C++] 建立更多基準測試以測量表達式評估開銷
- ARROW-16026 - [C++] 新增對 serial executor 的支援,以將 async generator 公開為 iterable
- ARROW-16032 - [C++] 將 FlightClient API 遷移至 Result<>
- ARROW-16033 - [C++] 將 schema 傳遞給 consuming sink 節點
- ARROW-16038 - [R] 當 mutate 的
.keep
選項設定時,與 dplyr 的行為不同 - ARROW-16042 - [GO] 修正標頭檔預處理器問題
- ARROW-16044 - [Julia] 從 apache/arrow 移除
- ARROW-16046 - [文件][FlightRPC][Python] 確保 Flight Python API 已記錄
- ARROW-16049 - [C++][FlightRPC] 修正 Flight SQL 的 ColumnMetadata 建構子可見性
- ARROW-16053 - [C++][FlightRPC] 修正不穩定的測試 TestAuthHandler.FailUnauthenticatedCalls
- ARROW-16055 - [C++][Gandiva] 在使用物件程式碼快取時,快取命中期間跳過不必要的工作
- ARROW-16057 - [Python] 解決 RecordBatch 類別、方法、屬性和建構子的文件字串問題
- ARROW-16058 - [Python] 解決 Table 類別、方法、屬性和建構子的文件字串問題
- ARROW-16059 - [Python] 解決 Tensor 類別的文件字串問題
- ARROW-16061 - [R][CI] 加速 windows 3.6 建置
- ARROW-16062 - [Python] 將 libarrow_python include 定義移動到其自身檔案
- ARROW-16064 - [Java][C++][FlightRPC] 在 FlightSQL 上為類型名稱新增遺失的欄 metadata
- ARROW-16065 - [FlightRPC][文件] 改善 Flight 文件
- ARROW-16068 - [C++][FlightRPC] 將剩餘的 flight API 遷移至使用 Result<>
- ARROW-16069 - [C++][FlightRPC] 重構 gRPC 錯誤碼處理
- ARROW-16073 - [R] 一旦 tzdb 在 Windows 上可用,則清理日期時間單元測試
- ARROW-16074 - [文件] 記錄 joins
- ARROW-16079 - [Python] 處理 Parquet schema 和 metadata 中的 docstrings
- ARROW-16082 - [Flight][Go] 允許指定 net.Listener
- ARROW-16098 - [JS] 不要在 table 和 recordbatch 的迭代器中返回 null
- ARROW-16102 - [C++] 新增使用系統 gRPC 和捆綁 GCS 進行建置的支援
- ARROW-16104 - [封裝] 新增 Ubuntu 22.04 的支援
- ARROW-16105 - [C++][Gandiva] 新增 LLVM 14 的支援
- ARROW-16109 - [Python] 新增 dataset 標記以進行測試,避免失敗
- ARROW-16114 - [文件][Python] 記錄 Parquet FileMetaData
- ARROW-16117 - [JS] 提升 UTF8 解碼效能
- ARROW-16120 - [Python] ParquetDataset 棄用:將 Deprecation 變更為 FutureWarnings
- ARROW-16121 - [Python] 棄用 ParquetDataset 的 (common_)metadata(_path) 屬性
- ARROW-16122 - [Python] 變更 use_legacy_dataset 預設值,並棄用 parquet.write_to_dataset 中不再支援的關鍵字
- ARROW-16128 - [C++][FlightRPC] 修復 Windows 上 Flight SQL 靜態建置
- ARROW-16132 - [封裝][deb][CUDA] 放寬 libcuda1 相依性
- ARROW-16154 - [R] 經過
handle_csv_read_error()
和handle_parquet_io_error()
的錯誤需要更好的錯誤追蹤 - ARROW-16156 - [R] 釐清 .onAttach() 中未開啟功能的警告訊息
- ARROW-16158 - [C++][R] 將 ARROW_ENGINE 重新命名為 ARROW_SUBSTRAIT
- ARROW-16166 - [C++][Compute] 組裝 join 輸出的工具
- ARROW-16167 - [JS] 重構 get 和 set visitors
- ARROW-16173 - [C++] 為時間函數/核心 (kernels) 新增基準測試 (benchmarks)
- ARROW-16176 - [發布][C#] 在 Ubuntu 22.04 上使用 .NET 6.0
- ARROW-16186 - [C++][GANDIVA] 為 decimal、quarter、xor 等新增別名和測試…
- ARROW-16187 - [Go][Parquet] 在讀取時正確使用 BufferedStream 和緩衝區大小
- ARROW-16192 - [Go] 移除 v8 已棄用的別名
- ARROW-16193 - [Go] 將 CPU 探索套件替換為 golang.org/x/sys/cpu 模組
- ARROW-16198 - [CI][封裝][Python] 更新 VCPKG 版本
- ARROW-16201 - [R] 3.4 上的 SafeCallIntoR
- ARROW-16203 - [發布] 在發布時移除所有舊的 artifacts
- ARROW-16204 - [C++][Dataset] 寫入 dataset 時,預設錯誤 existing_data_behaviour 忽略單一檔案
- ARROW-16208 - [JS] 升級 dependencies (deps)
- ARROW-16210 - [JS] 實作 tableFromJSON 並支援 vectorFromArray 中的 struct vector
- ARROW-16214 - [GLib][Parquet] 新增 GParquetFileMetadata
- ARROW-16229 - [CI] 從 nightly tests 暫時移除 turbodbc 測試
- ARROW-16232 - [C++] 在 LICENSE.txt 中包含 OpenTelemetry
- ARROW-16240 - [Python] 在 use_legacy_dataset=False 的 pq.write_to_dataset 中支援 row_group_size/chunk_size 關鍵字
- ARROW-16242 - [Go] xerrors.Errorf 和 xerrors.Is 已棄用,修正 linting
- ARROW-16245 - [GLib][Parquet] 新增 GParquetRowGroupMetadata
- ARROW-16247 - [GLib] 新增 GArrowGCSFileSystem
- ARROW-16250 - [GLib][Parquet] 新增 GParquetColumnChunkMetadata
- ARROW-16251 - [GLib][Parquet] 新增 GParquetStatistics 及其系列
- ARROW-16252 - [CI][Archery] 在 nightly 報告中醒目提示失敗建置的數量
- ARROW-16256 - [文件] 記錄支援的格式版本
- ARROW-16257 - [R] 將 as_date 和 as_datetime 分解為個別函數
- ARROW-16264 - [C++][CI] arrow-compute-hash-join-node-test 中的 Valgrind 超時
- ARROW-16276 - [R] 發布新聞
- ARROW-16277 - [Python] 沒有 macOS arm64 的建置。
- ARROW-16280 - [C++] 避免在 Expression::type() 中複製 shared_ptr
- ARROW-16282 - [CI] [C#] 驗證自 ubuntu 升級到 22.04 以來,c-sharp 上的發布一直失敗
- ARROW-16283 - [Go] 清理新的 Buffered Reader 中的 panics
- ARROW-16284 - [Python][封裝] 使用 delocate-fuse 建立 universal2 wheels
- ARROW-16291 - [Java]: 支援 Java Cookbooks 的 JSE17
- ARROW-16292 - [Java][文件] 升級 JSE17/JSE18 的 Java 文件
- ARROW-16294 - [C++] 提升 parquet readahead 的效能
- ARROW-16296 - [GLib] 為 GArrowRoundMode 新增遺失的 casts
- ARROW-16303 - [C++] 在檔案 IO 中檢查 EINTR
- ARROW-16308 - [CI] 升級 windows runner 版本,因為 windows-2016 已棄用。
- ARROW-16314 - [Python][CI] 在 windows 驗證建置中跳過執行 cython 測試
- ARROW-16325 - [R] 為使用 gcc12 的 R 套件新增任務
- ARROW-16327 - [Java][CI]: 新增 Java 17 CI 流程的支援
- ARROW-16334 - [Archery][CI] 在 nightly 報告電子郵件中使用建置連結,而非分支連結
- ARROW-16338 - [CI] 更新 azure windows 映像,因為 vs2017-win2016 已停用
- ARROW-16347 - [發布] 在驗證腳本中 escape 反引號
- ARROW-16349 - [發布][封裝][RPM] 從 KEYS 移除 ed25519 金鑰
- ARROW-16350 - [開發][Archery] 在錯誤訊息註解中新增遺失的換行符號
- ARROW-16352 - [GLib] 修復 enums.h 安裝位置錯誤
- ARROW-16354 - [封裝][RPM] 更新 artifacts 模式清單
- ARROW-16355 - [開發] 更新 verify-release-candidate.sh 以平行編譯 cpp
- ARROW-16373 - [文件][CI] CI 文件的微小改進
- ARROW-16387 - [C++] 將 -Wshorten-64-to-32 新增至 clang 測試的 CHECKIN 警告清單
- ARROW-16390 - [C++] 如果同時呼叫 dataset 初始化可能會發生 segmentation fault
- ARROW-16408 - [C++] 在 SQLite FlightSQL 範例中新增 DATE 類型的支援
- ARROW-16411 - [網站] 從 Google Analytics 遷移到 Matomo
- ARROW-16412 - [Java] 更新 README 以參考編譯文件
- ARROW-16416 - [C++] 在 Substrait 中支援 cast 函數
- ARROW-16428 - [發布] 為 ENV 變數新增前綴
- ARROW-16445 - [R] [文件] 為「在 Linux 上安裝 Arrow 套件」文章新增簡短摘要
- ARROW-16455 - [CI] [封裝] linux-ppc64le 的 Anaconda 儲存空間超出限制