Apache Arrow 0.16.0 (2020 年 2 月 7 日)
這是一個主要版本,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 99 位不同貢獻者的 709 次提交。
$ git shortlog -sn apache-arrow-0.15.1..apache-arrow-0.16.0
84 Antoine Pitrou
80 Sutou Kouhei
50 Neal Richardson
47 Krisztián Szűcs
44 Joris Van den Bossche
41 Wes McKinney
32 François Saint-Jacques
30 liyafan82
27 tianchen
26 Benjamin Kietzman
19 Andy Grove
16 Kazuaki Ishizaki
14 Kenta Murata
13 Neville Dipale
12 Projjal Chanda
9 gawain.bolton
8 David Li
6 Prudhvi Porandla
6 Renjie Liu
6 Yibo Cai
6 Yosuke Shiro
5 Bryan Cutler
5 Fokko Driesprong
5 Or Ozeri
5 Sebastien Binet
5 Uwe L. Korn
5 Zhuo Peng
4 Gurwinder Singh
4 Kyle McCarthy
4 Micah Kornfield
3 Anthony Abate
3 Paddy Horan
3 Rok
3 macx
3 takashi hashida
2 Adam Lippai
2 Danyang Zhuo
2 Gal Lushi
2 Jonathan A. Sternberg
2 Martin Grund
2 Pindikura Ravindra
2 Rohit Gupta
2 Romain Francois
2 Stéphane Campinas
2 Yuqi Gu
2 czxrrr
2 tianchen92
1 Adam Krebs
1 Alexis Mignon
1 Artem
1 Artem Alekseev
1 Bob Skowron
1 Brian Gold
1 Brian Hulette
1 Brian Wignall
1 Bruce Mitchener
1 Christopher Hutchinson
1 Davis Silverman
1 Dmitry Kalinkin
1 Donatien Criaud
1 Eric Erhardt
1 Fabian Höring
1 François Garillot
1 Gawain Bolton
1 Ha Thi Tham
1 Hengruo Zhang
1 Hiroaki Yutani
1 Hongze Zhang
1 Jim Apple
1 John Muehlhausen
1 John Norris
1 Kazuma Furuhashi
1 Keith Hughitt
1 Kornelijus Survila
1 Li, Jiajia
1 Maarten Ballintijn
1 Maarten Breddels
1 Matteo Figus
1 Matthew Franglen
1 Nick Poorman
1 Noel Hustler
1 Onur Satici
1 Pasha Stetsenko
1 Peter Hoffmann
1 Philipp Moritz
1 Rick Cobb
1 Rong Rong
1 Takashi Hashida
1 Taylor Baldwin
1 Wakahisa
1 Xavier Lacroze
1 Zherui Cao
1 francois-blanchard
1 gnguy
1 karldw
1 lmeyerov
1 luozijun
1 ptaylor
1 root
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到儲存庫。
$ git shortlog -csn apache-arrow-0.15.1..apache-arrow-0.16.0
133 Krisztián Szűcs
100 Sutou Kouhei
91 Wes McKinney
85 Antoine Pitrou
70 Neal Richardson
60 Micah Kornfield
34 Benjamin Kietzman
32 François Saint-Jacques
23 Andy Grove
13 Neville Dipale
12 Praveen
8 David Li
6 Paddy Horan
6 Yosuke Shiro
5 Bryan Cutler
5 Eric Erhardt
4 Kenta Murata
4 Pindikura Ravindra
4 Sebastien Binet
4 Sidd
3 Philipp Moritz
2 Joris Van den Bossche
2 Uwe L. Korn
1 Brian Hulette
1 Chao Sun
1 GitHub
變更日誌
新功能與改進
- ARROW-1175 - [Java] 實作/測試字典編碼子欄位
- ARROW-1456 - [Python] 在 Travis CI 中執行 s3fs 單元測試
- ARROW-1562 - [C++] 數值核心實作,用於加法 (+)
- ARROW-1638 - [Java] 空值類型的 IPC 往返
- ARROW-1900 - [C++] 新增核心函數,用於確定整數陣列的值範圍 (最大值和最小值)
- ARROW-2428 - [Python] 新增 API,將 Arrow 類型 (包含擴充類型) 對應到 pandas ExtensionArray 實例,用於 to_pandas 轉換
- ARROW-2602 - [Packaging] 自動化建置開發 Docker 容器
- ARROW-2863 - [Python] 為 RecordBatch*Writer/Reader 類別新增上下文管理器 API
- ARROW-3408 - [C++] 新增選項到 CSV 讀取器,以字典編碼個別欄位或所有字串/二進位欄位
- ARROW-3444 - [Python] Table.nbytes 屬性
- ARROW-3789 - [Python] 啟用在 Table.to_pandas 中呼叫物件以「自我銷毀」,以改善記憶體使用
- ARROW-3808 - [R] 實作 [.arrow::Array
- ARROW-3813 - [R] 較低層級的字典陣列建構
- ARROW-412 - [Format] 在 IPC 元數據中處理緩衝區填充
- ARROW-4208 - [CI/Python] 具有 S3 自動化測試
- ARROW-4219 - [Rust] [Parquet] 實作 ArrowReader
- ARROW-4223 - [Python] 支援 scipy.sparse 整合
- ARROW-4224 - [Python] 支援與 pydata/sparse 函式庫整合
- ARROW-4225 - [Format][C++] 新增 CSC 稀疏矩陣支援
- ARROW-4722 - [C++] 實作 Bitmap 類別以模組化處理位圖
- ARROW-4748 - [Rust] [DataFusion] GROUP BY 效能可以最佳化
- ARROW-4930 - [Python] 移除 Python 建置中的 LIBDIR 假設
- ARROW-5181 - [Rust] 建立 Arrow 檔案讀取器
- ARROW-5182 - [Rust] 建立 Arrow 檔案寫入器
- ARROW-5277 - [C#] MemoryAllocator.Allocate(length: 0) 不應傳回 null
- ARROW-5333 - [C++] 將建置選項摘要放入較窄的控制台
- ARROW-5366 - [Rust] 實作 Duration 和 Interval 陣列
- ARROW-5454 - [C++] 為 DataFrame 使用實作 ChunkedArray 上的 Take
- ARROW-5508 - [C++] 建立可重複使用的 Iterator
介面 - ARROW-5523 - [Python] [Packaging] 針對下載依賴項一致地使用 HTTPS
- ARROW-5801 - [CI] Docker 化 (新增至 docker-compose) 所有 Travis CI Linux 任務
- ARROW-5802 - [CI] Docker 化 “lint” Travis CI 工作
- ARROW-5809 - [Rust] Docker 化 (新增至 docker-compose) Rust Travis CI 建置
- ARROW-5831 - [Release] 遷移並改進二進位發布驗證腳本
- ARROW-5855 - [Python] 新增 Duration 類型支援
- ARROW-5859 - [Python] 在轉換為 numpy/pandas 時支援 ExtentionType
- ARROW-5971 - [Website] 部落格文章介紹 Arrow Flight
- ARROW-6003 - [C++] CSV 讀取器中更好的輸入驗證和錯誤訊息
- ARROW-6074 - [FlightRPC] 實作中介軟體
- ARROW-6091 - [Rust] [DataFusion] 為 limit 實作平行執行
- ARROW-6112 - [Java] 更新 API 以支援 64 位元位址空間
- ARROW-6184 - [Java] 提供基於雜湊表的字典編碼器
- ARROW-6251 - [Developer] 新增 PR 合併工具到 apache/arrow-site
- ARROW-6274 - [Rust] [DataFusion] 新增支援將結果寫入 CSV
- ARROW-6277 - [C++][Parquet] 支援讀取/寫入其他 Parquet 原始類型到 DictionaryArray
- ARROW-6283 - [Rust] [DataFusion] 實作運算子以將查詢結果寫入分割的 CSV
- ARROW-6285 - [GLib] 新增對 LargeBinary 和 LargeString 類型的支援
- ARROW-6286 - [GLib] 新增對 LargeList 類型的支援
- ARROW-6321 - [Python] 能夠在轉換為 pandas 時建立 ExtensionBlock
- ARROW-6340 - [R] 實作 Dataset 類別的低階綁定
- ARROW-6341 - [Python] 實作 Dataset 的低階綁定
- ARROW-6352 - [Java] 新增 DenseUnionVector 的實作。
- ARROW-6367 - [C++][Gandiva] 實作字串反轉
- ARROW-6378 - [C++][Dataset] 實作 TreeDataSource
- ARROW-6394 - [Java] 支援 delta 向量和部分和向量之間的轉換
- ARROW-6396 - [C++] 新增 ResolveNullOptions 到 Logical 核心
- ARROW-6405 - [Python] 新增 std::move 包裝器以在 Cython 中使用
- ARROW-6452 - [Java] 覆寫 ValueVector toString() 方法
- ARROW-6463 - [C++][Python] 將 arrow::fs::Selector 重新命名為 FileSelector
- ARROW-6466 - [Developer] 將 integration/integration_test.py 重構為適當的 Python 套件
- ARROW-6468 - [C++] 移除未使用的雜湊常式
- ARROW-6473 - [Format] 釐清字典編碼邊緣案例
- ARROW-6503 - [C++] 新增記憶體池物件的引數到 SparseTensorConverter
- ARROW-6508 - [C++] 新增具有驗證的 Tensor 和 SparseTensor 工廠函數
- ARROW-6515 - [C++] 清理 type_traits.h 定義
- ARROW-6578 - [C++] 將 int64 轉換為字串欄位
- ARROW-6592 - [Java] 在 Avro 轉換器中新增支援跳過欄位/欄位的解碼
- ARROW-6594 - [Java] 支援來自 Avro 的邏輯類型編碼
- ARROW-6598 - [Java] 排序 ApproxEqualsVisitor 的程式碼
- ARROW-6608 - [C++] 將 ARROW_HDFS 的預設值設為 OFF
- ARROW-6610 - [C++] 新增 ARROW_FILESYSTEM=ON/OFF CMake 配置標誌
- ARROW-6619 - [Ruby] 新增支援透過 Arrow::Schema#build_expression 建置 Gandiva::Expression
- ARROW-6624 - [C++] 新增 SparseTensor.ToTensor() 方法
- ARROW-6625 - [Python] 允許 concat_tables 為遺失的欄位填入 null 或預設值
- ARROW-6631 - [C++] 預設情況下不使用任何壓縮函式庫依賴項進行建置
- ARROW-6633 - [C++] 預設建置不需要 double-conversion
- ARROW-6634 - [C++] 建置不需要 flatbuffers 或 flatbuffers_ep
- ARROW-6635 - [C++] 預設建置不需要 glog
- ARROW-6636 - [C++] 預設情況下不建置 C++ 命令列工具
- ARROW-6637 - [C++] 零依賴預設核心建置
- ARROW-6646 - [Go] 修改 NullType IPC 實作,以便在 RecordBatch 訊息中不附加緩衝區
- ARROW-6650 - [Rust] [Integration] 建立方法以針對 Integration JSON 測試 Arrow 檔案
- ARROW-6656 - [Rust] [DataFusion] 實作 MIN 和 MAX 聚合表達式
- ARROW-6657 - [Rust] [DataFusion] 實作 COUNT 聚合表達式
- ARROW-6658 - [Rust] [DataFusion] 實作 AVG 聚合表達式
- ARROW-6659 - [Rust] [DataFusion] 重構 HashAggregateExec 以支援自訂合併
- ARROW-6662 - [Java] 為 VectorSchemaRoot 實作 equals/approxEquals API
- ARROW-6671 - [C++] 稀疏張量命名
- ARROW-6672 - [Java] 為字典建置器提取通用介面
- ARROW-6685 - [C++/Python] S3 FileStat 物件的 base_path 和類型取決於尾部斜線
- ARROW-6686 - [CI] 拉取和推送 Docker 映像以加速夜間建置
- ARROW-6688 - [Packaging] 在 conda 套件中包含 s3 支援
- ARROW-6690 - [Rust] [DataFusion] 沒有 GROUP BY 的 HashAggregate 應使用 SIMD
- ARROW-6692 - [Rust] [DataFusion] 更新範例以使用物理查詢計畫
- ARROW-6694 - [Rust] [DataFusion] 更新整合測試以使用物理計畫
- ARROW-6695 - [Rust] [DataFusion] 移除邏輯計畫的執行
- ARROW-6696 - [Rust] [DataFusion] 在物理查詢計畫中實作簡單的數學運算
- ARROW-6700 - [Rust] [DataFusion] 使用新的 parquet arrow 讀取器
- ARROW-6707 - [Java] 透過使用可空資訊來改進 JDBC 配接器的效能
- ARROW-6710 - [Java] 新增 JDBC 配接器測試以涵蓋包含一些空值的情況
- ARROW-6711 - [C++] 合併 Filter 和 Expression 類別
- ARROW-6721 - [JAVA] Avro 配接器基準測試在 JMH 中僅執行一次
- ARROW-6722 - [Java] 提供統一的方式來取得向量名稱
- ARROW-6729 - [C++] StlStringBuffer 建構函式不是零複製
- ARROW-6730 - [CI] 使用 GitHub Actions 進行 “C++ with clang 7” Docker 映像
- ARROW-6732 - [Java] 以非遞迴方式實作快速排序,以避免堆疊溢位
- ARROW-6741 - [Release] 更新 changelog.py 以使用 APACHE_ 前綴的 JIRA_USERNAME 和 JIRA_PASSWORD 環境變數
- ARROW-6742 - [C++] 從 arrow/io/hdfs_internal.cc 移除 boost::filesystem::path 的使用
- ARROW-6743 - [C++] 完全移除 boost::filesystem 的使用 (hdfs_internal 除外)
- ARROW-6744 - [Rust] 在 array 模組中匯出 JsonEqual 特徵
- ARROW-6754 - [C++] 合併 arrow/allocator.h 和 arrow/stl.h,或重新命名 allocator.h
- ARROW-6758 - [Release] 在發布驗證腳本中安裝暫時性的 node/npm/npx
- ARROW-6764 - [C++] 新增預讀迭代器
- ARROW-6767 - [JS] 在 scan/scanReverse 中延遲綁定批次
- ARROW-6768 - [C++][Dataset] 實作 dataset::Scan 到 Table 輔助函數
- ARROW-6769 - [C++][Dataset] 端對端資料集整合測試案例
- ARROW-6770 - [CI][Travis] 安靜地下載 Minio
- ARROW-6777 - [GLib][CI] 取消釘選 gobject-introspection gem
- ARROW-6778 - [C++] 在 Cast 核心中支援 DurationType
- ARROW-6782 - [C++] 建置最小核心 Arrow 函式庫,不包含任何 Boost 標頭
- ARROW-6784 - [C++][R] 將 filter 和 take 程式碼從 Rcpp 移動到 C++ 函式庫
- ARROW-6787 - [CI] 停用 “C++ with clang 7 and system packages” Travis CI 工作
- ARROW-6788 - [CI] 將 Travis CI lint 工作遷移到 GitHub Actions
- ARROW-6789 - [Python] 自動裝箱從 `FlightServerBase.do_action` 產生的位元組/類緩衝區值到 Result 值中
- ARROW-6790 - [Release] 在發布驗證中自動停用整合測試案例
- ARROW-6793 - [R] Linux 的 Arrow C++ 二進位封裝
- ARROW-6797 - [Release] 在網站發布後腳本中使用單獨克隆的 arrow-site 儲存庫
- ARROW-6802 - [Packaging][deb][RPM] 更新 qemu-user-static 套件 URL
- ARROW-6803 - [Rust] [DataFusion] 使用新的物理查詢計畫時,聚合查詢速度較慢
- ARROW-6804 - [CI] [Rust] 將 Travis Rust 工作遷移到 Github Actions
- ARROW-6807 - [Java][FlightRPC] 公開 gRPC 服務
- ARROW-6810 - [Website] 新增 R 套件 0.15 發布的文件
- ARROW-6811 - [R] 各種 0.15 發布後清理
- ARROW-6814 - [C++] 解決發布建置時發生的編譯器警告
- ARROW-6822 - [Website] merge_pr.py 已發布
- ARROW-6824 - [Plasma] 支援小物件的批次建立和封裝請求
- ARROW-6825 - [C++] 圍繞預讀迭代器重新設計 CSV 讀取器 IO
- ARROW-6831 - [R] 更新 R macOS/Windows 建置以適應 cmake 壓縮預設值的變更
- ARROW-6832 - [R] 實作 Codec::IsAvailable
- ARROW-6833 - [R][CI] 為完整的 R autobrew macOS 建置新增 crossbow 工作
- ARROW-6836 - [Format] 在 File.fbs 的 Footer 表格中新增 custom_metadata:[KeyValue] 欄位
- ARROW-6843 - [Website] 停用在 pull request 上部署
- ARROW-6847 - [C++] 為 Iterator<> 新增 range_expression 介面
- ARROW-6850 - [Java] Jdbc 轉換器支援 Null 類型
- ARROW-6852 - [C++] memory-benchmark 建置在 Arm64 上失敗
- ARROW-6853 - [Java] 支援向量和字典編碼器使用不同的雜湊器來計算 hashCode
- ARROW-6855 - [C++][Python][Flight] 實作 Flight 中介軟體
- ARROW-6862 - [Developer] 檢查 pull request 標題
- ARROW-6863 - [Java] 提供平行搜尋器
- ARROW-6865 - [Java] 提升比較 ArrowBuf 與位元組陣列的效能
- ARROW-6866 - [Java] 提升計算結構向量雜湊碼的效能
- ARROW-6881 - [Rust] 移除 “array_ops”,改用 “compute” 子模組
- ARROW-6884 - [Python][Flight] 使伺服器端 RPC 例外更友善?
- ARROW-6887 - [Java] 建立使用 ValueVectors 的散文文件
- ARROW-6888 - [Java] 支援向量值比較器的複製操作
- ARROW-6889 - [Java] ComplexCopier 啟用 FixedSizeList 類型 & 修復 RangeEualsVisitor StackOverFlow
- ARROW-6891 - [Rust] [Parquet] 為 ArrowReader 新增 Utf8 支援
- ARROW-6902 - [C++] 為 Compare 核心新增 String*/Binary* 支援
- ARROW-6904 - [Python] 實作 MapArray 和 MapType
- ARROW-6907 - [C++][Plasma] 允許 Plasma 儲存批量通知用戶端
- ARROW-6911 - [Java] 提供複合比較器
- ARROW-6912 - [Java] 為 avro 轉換器消費者提取通用基底類別
- ARROW-6916 - [Developer] 在夜間 Crossbow 報告中按字母順序排列任務名稱
- ARROW-6918 - [R] 加快 docker-compose 設定速度
- ARROW-6919 - [Python] 在 Cython 中公開更多建置器
- ARROW-6920 - [Python] 為 python3.8 建立 manylinux wheels
- ARROW-6926 - [Python] 為 Python 物件支援 __sizeof__ 協定
- ARROW-6927 - [C++] 新增 gRPC 版本檢查
- ARROW-6928 - [Rust] 新增 FixedSizeList 類型
- ARROW-6930 - [Java] 建立用於填充向量值的公用程式類別,僅用於測試目的
- ARROW-6932 - [Java] 已知擴充類型上的不正確日誌
- ARROW-6933 - [Java] 支援線性字典編碼器
- ARROW-6936 - [Python] 當提供錯誤類型物件時,改進錯誤訊息
- ARROW-6942 - [Developer] 在 GitHub Actions 的 pull request 檢查中新增 Parquet 支援
- ARROW-6943 - [Website] 將 Apache Arrow Flight 介紹翻譯成日文
- ARROW-6944 - [Rust] 新增 StringType
- ARROW-6949 - [Java] 修復可升級寫入以處理 nullvectors
- ARROW-6951 - [C++][Dataset] 確保欄位投影傳遞到 ParquetDataFragment
- ARROW-6952 - [C++][Dataset] 確保表達式篩選器傳遞到 ParquetDataFragment
- ARROW-6954 - [Python] [CI] 將 Python 3.8 新增到 CI 矩陣
- ARROW-6960 - [R] 在 Windows 建置中新增對更多壓縮編解碼器的支援
- ARROW-6961 - [C++][Gandiva] 在 Gandiva 中新增 lower_utf8 函數
- ARROW-6963 - [Packaging][Wheel][OSX] 使用 crossbow 的命令從 travis 建置部署產物
- ARROW-6964 - [C++][Dataset] 公開 Scanner::ToTable 的巢狀平行選項
- ARROW-6965 - [C++][Dataset] 可選地公開分割區鍵作為具體化欄位
- ARROW-6967 - [C++] 為 IN、IS_VALID 新增篩選表達式
- ARROW-6969 - [C++][Dataset] ParquetScanTask 迫切載入檔案
- ARROW-6970 - [Packaging][RPM] 新增 CentOS 8 支援
- ARROW-6973 - [C++][ThreadPool] 在 Submit 中使用完美轉發
- ARROW-6975 - [C++] 將 make_unique 放在自己的標頭中
- ARROW-6980 - [R] RecordBatch/Table 的 dplyr 後端
- ARROW-6984 - [C++] 將 LZ4 更新到 1.9.2 以解決 CVE-2019-17543
- ARROW-6986 - [R] 新增基本 Expression 類別
- ARROW-6987 - [CI] Travis OSX 無法安裝 sdk 標頭
- ARROW-6991 - [Packaging][deb] 新增 Ubuntu 19.10 支援
- ARROW-6994 - [C++] 研究 macOS 上 jemalloc 記憶體頁面回收配置,當 background_thread 選項不可用時
- ARROW-6997 - [Packaging] 新增 RHEL 支援
- ARROW-7000 - [C++][Gandiva] 處理字串 lower、upper 函數中的空輸入
- ARROW-7003 - [Format] [Rust] 在建置腳本中產生 flatbuffers 檔案
- ARROW-7004 - [Plasma] 使其可以提升 LRU 快取中的物件
- ARROW-7006 - [Rust] 提升 flatbuffers 版本以避免漏洞
- ARROW-7007 - [C++] 為 LocalFs 啟用 mmap 選項
- ARROW-7014 - [Developer] 編寫腳本以驗證 Linux wheels,給定具有 conda 或 virtualenv 的本機環境
- ARROW-7015 - [Developer] 編寫腳本以驗證 macOS wheels,給定具有 conda 或 virtualenv 的本機環境
- ARROW-7016 - [Developer][Python] 編寫腳本以驗證 Windows wheels,給定具有 conda 的本機環境
- ARROW-7019 - [Java] 提升載入有效性緩衝區的效能
- ARROW-7026 - [Java] 移除 MessageSerializer/vector/writer/reader 中的斷言
- ARROW-7031 - [Python] 在 python 中公開 ListArray 的偏移量
- ARROW-7032 - [Release] 在發布驗證腳本中執行 python 單元測試
- ARROW-7034 - [CI][Crossbow] 跳過已知的夜間失敗
- ARROW-7035 - [R] write_parquet 文件中的預設引數不明確
- ARROW-7036 - [C++] 升級 ORC 版本以避免編譯錯誤
- ARROW-7037 - [C++] protobuf >= 3.9 和 clang 組合上的編譯錯誤
- ARROW-7039 - [Python] Typecheck 預期已安裝 pandas
- ARROW-7047 - [C++][Dataset] 篩選表達式不應要求完全類型匹配
- ARROW-7052 - [C++] Datasets 範例無法使用 ARROW_SHARED=OFF 建置
- ARROW-7054 - [Docs] 新增選項以使用環境變數覆寫顯示的文件版本
- ARROW-7057 - [C++] 新增 API 以剖析 URI 查詢字串
- ARROW-7058 - [C++] FileSystemDataSourceDiscovery 應將分割區方案應用於其選取器的 base_dir
- ARROW-7060 - [R] 0.15.1 版本後的清理
- ARROW-7061 - [C++][Dataset] 具有 ParquetFileFormat 的 FileSystemDiscovery 應忽略非 Parquet 檔案
- ARROW-7062 - [C++] Parquet 檔案剖析錯誤訊息應包含檔案名稱
- ARROW-7064 - [R] 實作 null 類型
- ARROW-7066 - [Python] 支援從 __arrow_array__ 傳回 ChunkedArray?
- ARROW-7067 - [CI] 在 Travis-CI 上停用程式碼覆蓋率
- ARROW-7069 - [C++][Dataset] 將 ConstantPartitionScheme 替換為 PrefixDictionaryPartitionScheme
- ARROW-7070 - [Packaging][deb] 更新 1.0.0 的套件名稱
- ARROW-7072 - [Java] 支援有效位元的高效串連
- ARROW-7082 - [Packaging][deb] 新增 apache-arrow-archive-keyring
- ARROW-7092 - [R] 為 dplyr 和 datasets 新增 vignette
- ARROW-7093 - [R] 支援為更多資料類型建立純量運算式
- ARROW-7094 - [C++] FileSystemDataSource 應為 fs::Filesystem 使用擁有指標
- ARROW-7095 - [R] 更好處理 dplyr 方法中不受支援的篩選和變異運算式
- ARROW-7096 - [C++] 為促銷式串連和結構描述統一新增選項結構
- ARROW-7098 - [Java] 提升比較兩個記憶體區塊的效能
- ARROW-7099 - [C++] 消歧 csv 解析器測試中的函式呼叫
- ARROW-7101 - [CI] 重構 docker-compose 設定並搭配 GitHub Actions 使用
- ARROW-7103 - [R] 各種小清理
- ARROW-7107 - [C++][MinGW] 在 AppVeyor 上啟用 Flight
- ARROW-7110 - [GLib] 為 GArrowTable、GArrowChunkedArray 和 GArrowRecordBatch 新增篩選器支援
- ARROW-7111 - [GLib] 為 GArrowTable、GArrowChunkedArray 和 GArrowRecordBatch 新增 take 支援
- ARROW-7113 - [Rust] Buffer 應接受他人擁有的記憶體
- ARROW-7116 - [CI] 使用 apache 組織提供的 docker 儲存庫
- ARROW-7146 - [R][CI] R docker-compose 設定的各種修復和加速
- ARROW-7147 - [C++][Dataset] 重構 dataset 的 API 以使用 Result
- ARROW-7148 - [C++][Dataset] API 清理
- ARROW-7149 - [C++] 移除檔案系統 API 的實驗性狀態
- ARROW-7159 - [CI] 以 cron 工作排程執行 HDFS 測試
- ARROW-7160 - [C++] 更新 string_view backport
- ARROW-7161 - [C++] 將檔案系統層從 Status 遷移至 Result
- ARROW-7162 - [C++] 清理 cmake_modules/SetupCxxFlags.cmake 中的警告
- ARROW-7166 - [Java] 移除 Jdbc 介面卡的冗餘程式碼
- ARROW-7169 - [C++] 供應 uriparser 程式庫
- ARROW-7171 - [Ruby] 傳遞陣列
為了 Arrow::Table#filter - ARROW-7172 - [C++][Dataset] 改善 Expression::ToString 的格式
- ARROW-7176 - [C++] 修復 arrow::ipc 編譯器警告
- ARROW-7178 - [C++] 供應向前相容的 std::optional
- ARROW-7185 - [R][Dataset] 為 IN、IS_VALID 運算式新增綁定
- ARROW-7186 - [R] 新增內嵌註解以記錄 dplyr 程式碼
- ARROW-7192 - [Rust] 實作 Flight crate
- ARROW-7193 - [Rust] 建立 Arrow stream reader
- ARROW-7195 - [Ruby] 改善 #filter、#take 和 #is_in
- ARROW-7196 - [Ruby] 移除不必要的 BinaryArrayBuilder#append_values
- ARROW-7197 - [Ruby] 使用 Ruby 2.7 抑制關鍵字引數相關警告
- ARROW-7204 - [C++][Dataset] In 運算式不應要求精確的類型比對
- ARROW-7206 - [Java] 呼叫 Preconditions#checkArgument 時避免字串串連
- ARROW-7207 - [Rust] 更新產生的 Flatbuffer 檔案
- ARROW-7210 - [C++] 純量轉換應支援時間型類型
- ARROW-7211 - [Rust] [Parquet] 支援寫入位元組緩衝區
- ARROW-7216 - [Java] 提升設定/清除個別位元的效能
- ARROW-7219 - [CI][Python] 在 python 3.6 版本的 conda-python docker 映像檔中安裝 pickle5
- ARROW-7227 - [Python] 為 ConcatenateWithPromotion() 提供包裝函式
- ARROW-7228 - [Python] 在 Python 中公開 RecordBatch.FromStructArray。
- ARROW-7235 - [C++] 新增 Result
至 arrow/io 的 API - ARROW-7236 - [C++] 新增 Result
至 arrow/csv 的 API - ARROW-7240 - [C++] 新增 Result
至 arrow/util 的 API - ARROW-7246 - [CI][Python] wheel 無法因 SSL_ST_INIT 錯誤而建置
- ARROW-7247 - [CI][Python] wheel 無法因 wget 和 OpenSSL 錯誤而建置
- ARROW-7248 - [Rust] 從 Flatbuffers 自動重新產生 IPC 訊息
- ARROW-7255 - [CI] 在 pull request 上執行原始碼發佈測試
- ARROW-7256 - [C++] 移除 ARROW_MEMORY_POOL_DEFAULT 選項
- ARROW-7257 - [CI] Homebrew 公式因 openssl 公式名稱更新而失敗
- ARROW-7258 - [CI] Fuzzit 工作因不存在的目錄而失敗
- ARROW-7259 - [Java] 支援子欄位編碼器使用不同的雜湊器
- ARROW-7260 - [CI] Ubuntu 14.04 測試因使用者定義的常值而失敗
- ARROW-7261 - [Python] Python 支援固定大小清單類型
- ARROW-7262 - [C++][Gandiva] 在 Gandiva 中實作 replace 函式
- ARROW-7263 - [C++][Gandiva] 實作 locate 和 position 函式
- ARROW-7268 - [Rust] 從 IPC 訊息傳播 `custom_metadata` 欄位
- ARROW-7269 - [C++] 修復 arrow::parquet 編譯器警告
- ARROW-7270 - [Go] 保留 CSV 讀取行為,改善記憶體用量
- ARROW-7274 - [C++] 新增 Result
至 Decimal 類別的 API - ARROW-7275 - [Ruby] 新增對 Arrow::ListDataType.new(data_type) 的支援
- ARROW-7276 - [Ruby] 新增從 [[…]] 建置 Arrow::ListArray 的支援
- ARROW-7277 - [Document] 新增關於向量生命週期的討論
- ARROW-7279 - [C++] 將 UnionArray::type_ids 重新命名為 UnionArray::type_codes
- ARROW-7284 - [Java] 確保 java 實作符合已澄清的字典規格
- ARROW-7289 - [C#] ListType 建構子引數是多餘的
- ARROW-7290 - [C#] 實作 ListArray Builder
- ARROW-7292 - [C++] [CI] [Dev] 新增 ASAN / UBSAN CI 執行
- ARROW-7293 - [Dev] [C++] 在 docker-compose 建置磁碟區中持久化 ccache
- ARROW-7296 - [Python] 新增 ORC api 文件
- ARROW-7299 - [GLib] 使用 Result 取代 Status
- ARROW-7303 - [C++] 重構基準測試以使用新的 Result API
- ARROW-7306 - [C++] 新增傳回 Result 版本的 FileSystemFromUri
- ARROW-7307 - [CI][GLib] 文件未產生
- ARROW-7309 - [Python] 支援 HDFS 聯邦 viewfs://
- ARROW-7310 - [Python] 為 pyarrow.fs 公開 HDFS 實作
- ARROW-7311 - [Python] 從 URI 傳回檔案系統和路徑
- ARROW-7312 - [Rust] ArrowError 應實作 std::error:Error
- ARROW-7317 - [C++] 將 Iterator API 遷移至 Result
- ARROW-7321 - [CI][GLib] 建置失敗並出現 GLib 警告
- ARROW-7322 - [CI][Python] 回退至 arrowdev dockerhub 組織以取得 manylinux 映像檔
- ARROW-7323 - [CI][Rust] 夜間 CI 因不同的工具鏈而失敗
- ARROW-7324 - [Rust] 為 Timestamp 新增時區
- ARROW-7325 - [Rust] [Parquet] 更新至 parquet-format 2.6 和 thrift 0.12
- ARROW-7329 - [Java] AllocationManager:允許管理不同類型的記憶體,而非使用 Netty 分配的記憶體
- ARROW-7333 - [CI][Rust] 移除重複的夜間工作
- ARROW-7334 - [CI][Python] macOS 使用 Python 2
- ARROW-7340 - [CI] 移除已廢棄的 appveyor 建置設定
- ARROW-7344 - [Packaging][Python] 建置 manylinux2014 wheels
- ARROW-7346 - [CI] 在所有建置中明確使用 ccache
- ARROW-7347 - [C++] 將捆綁的 Boost 更新至 1.71.0
- ARROW-7348 - [Rust] 新增 api 以傳回空值點陣圖緩衝區的參考。
- ARROW-7351 - [Developer] 合併 Parquet 修補程式時,僅建議 cpp-* 修復版本
- ARROW-7357 - [Go] 從 pkg/errors 遷移至 x/xerrors
- ARROW-7366 - [C++][Dataset] 在 DataSourceDiscovery 中使用 PartitionSchemeDiscovery
- ARROW-7367 - [Python] 在 ParquetDatasetPiece 中使用 np.full 而非 np.array.repeat
- ARROW-7368 - [Ruby] 使用 :arrow_file 和 :arrow_streaming 作為格式名稱
- ARROW-7369 - [GLib] 新增 garrow_table_combine_chunks
- ARROW-7370 - [C++] 具有 AUTO 偵測功能的舊版 Protobuf 失敗
- ARROW-7377 - [C++][Dataset] 簡化 parquet 欄位投影
- ARROW-7378 - [C++][Gandiva] 迴圈向量化在 IR 優化中損壞
- ARROW-7379 - [C++] 導入 SchemaBuilder 伴隨類別和 Field::IsCompatibleWith
- ARROW-7380 - [C++][Dataset] 實作 DatasetFactory
- ARROW-7382 - [C++][Dataset] 重構 FsDsDiscovery 建構子
- ARROW-7387 - [C#] 支援 ListType 序列化
- ARROW-7392 - [Packaging] 為 python 3.8 新增 conda 套件任務
- ARROW-7398 - [Packaging][Python] Conda 建置在 macOS 上失敗
- ARROW-7399 - [C++][Gandiva] Gandiva 未選取執行階段 CPU 功能
- ARROW-7402 - [C++] 新增更多關於 CUDA 錯誤的資訊
- ARROW-7403 - [C++][JSON] 在 Arm64 Neon 上啟用 Rapidjson
- ARROW-7410 - [Python] [Doc] 文件化檔案系統 API
- ARROW-7411 - [C++][Flight] 不正確的 Arrow Flight 基準測試輸出
- ARROW-7413 - [Python][Dataset] 為 PartitionSchemeDiscovery 新增測試
- ARROW-7414 - [R][Dataset] 實作 PartitionSchemeDiscovery
- ARROW-7415 - [C++][Dataset] 為由 ipc 檔案組成的來源實作 IpcFormat
- ARROW-7416 - [R][Nightly] 修復 R 3.6.2 上 macos-r-autobrew 建置
- ARROW-7417 - [C++] 為 CUDA 10.1 新增 docker-compose 項目
- ARROW-7418 - [C++] 無法在 Ubuntu 16.04 上使用 g++ 5.4.0 建置
- ARROW-7420 - [C++] 將張量相關 API 遷移至傳回 Result 的版本
- ARROW-7429 - [Java] 增強 Java 程式碼的程式碼樣式檢查 (移除連續空格)
- ARROW-7430 - [Python] 為 dataset 綁定新增更多 docstring
- ARROW-7431 - [Python] 將 dataset API 新增至參考文件
- ARROW-7432 - [Python] 新增更高等級的 datasets 函式
- ARROW-7439 - [C++][Dataset] 移除 dataset 指標別名
- ARROW-7449 - [GLib] 使 GObject Introspection 成為選用項目
- ARROW-7452 - [GLib] 使 GArrowTimeDataType 成為抽象類別
- ARROW-7453 - [Ruby] 新增對 Arrow::NullArray#[] 的支援
- ARROW-7454 - [Ruby] 新增對儲存/載入 TSV 的支援
- ARROW-7455 - [Ruby] 為所有 GArrowDataType 輸入使用 Arrow::DataType.resolve
- ARROW-7456 - [C++] 新增對 YYYY-MM-DDThh 和 YYYY-MM-DDThh:mm 時間戳記格式的支援
- ARROW-7457 - [Doc] 修復錯字
- ARROW-7459 - [Python] 文件 lint 失敗
- ARROW-7460 - [Rust] 使用自動向量化改善一些核心
- ARROW-7461 - [Java] 修復錯字和拼字
- ARROW-7463 - [Doc] 修復損壞的連結和錯字
- ARROW-7464 - [C++] 使用 std::call_once 精煉 CpuInfo singleton
- ARROW-7465 - [C++] 為 Arm64 新增 Arrow 記憶體基準測試
- ARROW-7468 - [Python] 修復錯字
- ARROW-7469 - [C++] 改善與除法相關的位元運算
- ARROW-7470 - [JS] 修復錯字
- ARROW-7474 - [Ruby] 更快儲存 CSV 檔案
- ARROW-7475 - [Rust] 建立 Arrow Stream writer
- ARROW-7477 - [FlightRPC][Java] Flight gRPC 服務缺少反射資訊
- ARROW-7479 - [Rust][Ruby][R] 修復錯字
- ARROW-7481 - [C#] 修復錯字
- ARROW-7482 - [C++] 修復錯字
- ARROW-7484 - [C++][Gandiva] 修復錯字
- ARROW-7485 - [C++][Plasma] 修復錯字
- ARROW-7487 - [Developer] 修復錯字
- ARROW-7488 - [GLib] 修復錯字和損壞的連結
- ARROW-7489 - [CI] 修復錯字
- ARROW-7490 - [Java] Avro 轉換器應將屬性和 props 轉換為 FieldType metadata
- ARROW-7493 - [Python] 在 pyarrow.compute 中公開 sum 核心並支援 ChunkedArray 輸入
- ARROW-7498 - [C++][Dataset] 重新命名 DataFragment/DataSource/PartitionScheme
- ARROW-7502 - [Integration] 移除不再需要的 Spark Integration 修補程式
- ARROW-7513 - [JS] Arrow 教學課程:常見資料類型
- ARROW-7514 - [C#] 使 GetValueOffset 過時
- ARROW-7519 - [Python] 建置 wheels、具有 dataset 支援的 conda 套件
- ARROW-7521 - [Rust] 移除 FixedSizeList 資料類型上的 tuple
- ARROW-7523 - [Developer] 放寬 clang-tidy 檢查
- ARROW-7526 - [C++][Compute]:最佳化小型整數排序
- ARROW-7532 - [CI] 在 Homebrew 在上游修復後取消跳過 brew 測試
- ARROW-7537 - [CI][R] 夜間 macOS autobrew 工作在失敗時應更詳細
- ARROW-7538 - 在 AllocationManager 中釐清實際和期望大小
- ARROW-7540 - [C++] 未安裝授權檔案
- ARROW-7541 - [GLib] 安裝授權檔案
- ARROW-7542 - [CI][C++] macOS 上沒有 nproc
- ARROW-7549 - [Java] 重新組織 Flight 模組以保持頂層乾淨/有條理
- ARROW-7550 - [R][CI] 在 CI 中執行 donttest 範例
- ARROW-7557 - [C++][Compute] 在隨機測試中驗證排序穩定性
- ARROW-7558 - [Packaging][deb][RPM] 為成品使用主機擁有者和群組
- ARROW-7560 - [Rust] 減少 Rc/Refcell 用量
- ARROW-7565 - [Website] 新增對下載網址重新導向的支援
- ARROW-7566 - [CI] 在 AppVeyor 上使用更新版本的 Miniconda
- ARROW-7567 - [Java] 將 Checkstyle 從 6.19 升級至 8.18
- ARROW-7568 - [Java] 將 Apache Avro 從 1.9.0 升級至 1.9.1
- ARROW-7569 - [Python] 新增 API 以將 Arrow 類型對應至 pandas ExtensionDtypes 以進行 to_pandas 轉換
- ARROW-7570 - [Java] 修復 LGTM 報告的高嚴重性問題
- ARROW-7571 - [Java] 更正 README 上的最低 java 版本
- ARROW-7572 - [Java] 強制執行 README 中提及的 Maven 3.3+
- ARROW-7573 - [Rust] 減少裝箱和清理
- ARROW-7575 - [R] Linux 二進位套件後續
- ARROW-7576 - [C++][Dev] 改善模糊測試設定
- ARROW-7577 - [C++][CI] 在 CI 中檢查模糊器設定
- ARROW-7578 - [R] 新增對具有 IPC 檔案和多個來源的 datasets 的支援
- ARROW-7581 - [R] 0.16 發佈的文件/潤飾
- ARROW-7590 - [C++] thirdparty/ 中的受管理檔案被忽略
- ARROW-7597 - [C++] 改善 CMake 組態主控台摘要
- ARROW-7600 - [C++][Parquet] 新增基本停用的單元測試以練習巢狀功能
- ARROW-7601 - [Doc] [C++] 更新模糊測試文件
- ARROW-7602 - [Archery] 新增更多建置選項
- ARROW-7613 - [Rust] 移除多餘的 `::` 字首
- ARROW-7622 - [Format] 將 Tensor 和 SparseTensor 欄位標記為必要
- ARROW-7623 - [C++] 更新產生的 flatbuffers 檔案
- ARROW-7626 - [Parquet][GLib] 新增對版本巨集的支援
- ARROW-7627 - [C++][Gandiva] 最佳化字串截斷函式
- ARROW-7629 - [C++][CI] 將模糊迴歸檔案新增至 arrow-testing
- ARROW-7630 - [C++][CI] 在 CI 中檢查模糊崩潰迴歸
- ARROW-7632 - [C++] [CI] 改善模糊測試種子語料庫
- ARROW-7635 - [C++] 為每個組件新增 pkg-config 支援
- ARROW-7636 - [Python] 清理 pyarrow.dataset.partitioning() API
- ARROW-7644 - 新增 vcpkg 安裝指示
- ARROW-7645 - [Packaging][deb][RPM] crossbow 的 arm64 建置已損壞
- ARROW-7648 - [C++] 清理 Windows 上的本機路徑
- ARROW-7658 - [R] 支援 dplyr 對日期/時間進行篩選
- ARROW-7659 - [Rust] 減少 Rc 用量
- ARROW-7660 - [C++][Gandiva] 最佳化用於單一位元組字元的 castVarchar(string, int) 函式
- ARROW-7665 - [R] linuxLibs.R 應平行建置
- ARROW-7666 - [Packaging][deb] 始終使用 Ninja 以減少建置時間
- ARROW-7667 - [Packaging][deb] ubuntu-eoan 在夜間工作中遺失
- ARROW-7668 - [Packaging][RPM] 盡可能使用 Ninja 以減少建置時間
- ARROW-7670 - [Python][Dataset] 針對篩選運算式提供更好的人體工學設計
- ARROW-7671 - [Python][Dataset] 為 DatasetFactory 新增綁定
- ARROW-7674 - [Developer] 在 merge_arrow_pr.py 中為驗證碼挑戰新增有用的訊息
- ARROW-7682 - [Packaging][APT][Yum] 新增對 arm64 APT/Yum 儲存庫的支援
- ARROW-7683 - [Packaging] 設定 0.16.0 為下一個版本
- ARROW-7686 - [Packaging][deb][RPM] 包含更多 arrow-*.pc
- ARROW-7687 - [C++] README 中的 C++ 開發人員文件連結已損壞
- ARROW-7692 - [Rust] 數個模式比對難以閱讀
- ARROW-7694 - [Packaging][deb][RPM] 無法為 RC 建置儲存庫套件
- ARROW-7695 - [Release] 將 java 版本更新至 0.16-SNAPSHOT
- ARROW-7696 - [Release] 發佈分支上的單元測試失敗
- ARROW-7697 - [Release] 新增透過 00-prepare.sh 更新 Linux 套件的測試
- ARROW-7710 - [Release][C#] .NET 下載網址已重新導向
- ARROW-7711 - [C#] Date32 測試取決於系統時區
- ARROW-7715 - [Release][APT] 忽略一些 arm64 驗證
- ARROW-7716 - [Packaging][APT] 為 Ubuntu 19.10 使用 “main” 組件
- ARROW-7719 - [Python][Dataset] 表格相等性檢查偶爾失敗
- ARROW-772 - [C++] 實作 take 核心函式
- ARROW-7724 - [Release][Yum] 忽略一些 arm64 驗證
- ARROW-7743 - [Rust] [Parquet] 支援讀取時間戳記微秒
- ARROW-7768 - [Rust] 為 reader.rs 中的 Cursor<Vec 實作 Length 和 TryClone 特徵
> 在 reader.rs 中 - ARROW-843 - [C++] 實作結構描述統一,合併不相等但等效的結構描述
- ARROW-976 - [C++][Python] 提供 API 以定義和讀取具有更多特設分割配置的 Parquet datasets
錯誤修正
- ARROW-3783 - [R] 錯誤的浮點類型集合
- ARROW-3962 - [Go] 在讀取 CSV 檔案時支援空值。
- ARROW-5575 - [C++] arrowConfig.cmake 包含未安裝的目標
- ARROW-5655 - [Python] Table.from_pydict/from_arrays 未正確使用指定結構描述中的類型
- ARROW-5680 - [Rust] datafusion group-by 測試取決於結果集順序
- ARROW-6157 - [Python][C++] 具有無效資料的 UnionArray 通過驗證 / 導致區段錯誤
- ARROW-6195 - [C++] 如果未安裝 python,CMake 在捆綁 thrift 時會因找不到檔案錯誤而失敗
- ARROW-6429 - [CI][Crossbow] 夜間 spark 整合工作失敗
- ARROW-6445 - [CI][Crossbow] 夜間 Gandiva jar trusty 工作失敗
- ARROW-6567 - [Rust] [DataFusion] SQL 彙總查詢執行假設分組運算式在彙總運算式之前
- ARROW-6581 - [C++] 修復 fuzzit 工作提交
- ARROW-6704 - [C++] 從時間戳記轉換為更高解析度不會檢查超出範圍的時間戳記
- ARROW-6708 - [C++] “找不到 -lboost_filesystem_static”
- ARROW-6728 - [C#] 支援讀取和寫入 Date32 和 Date64 陣列
- ARROW-6736 - [Rust] [DataFusion] 彙總運算式被重複評估
- ARROW-6740 - [Python] 無法在 Windows 上刪除已關閉的 MemoryMappedFile
- ARROW-6745 - [Rust] 修復各種錯字
- ARROW-6749 - [Python] 將非 ns 時間戳記陣列轉換為 numpy 會產生錯誤的值
- ARROW-6750 - [Python] 預設情況下靜音 S3 錯誤日誌
- ARROW-6761 - [Rust] Travis CI 建置未遵循 rust-toolchain
- ARROW-6762 - [C++] JSON 讀取器在換行符號上區段錯誤
- ARROW-6785 - [JS] 移除多餘的子項指派
- ARROW-6786 - [C++] arrow-dataset-file-parquet-test 速度緩慢
- ARROW-6795 - [C#] 在 C# 中讀取大型 Arrow 檔案會導致例外
- ARROW-6801 - [Rust] Arrow 原始碼發佈 tarball 缺少基準測試
- ARROW-6806 - [C++] 還原序列化包含空值/空清單的 ListArray 時區段錯誤
- ARROW-6808 - [Ruby] 確保需要合適的 MSYS2 套件
- ARROW-6809 - [RUBY] Gem 因 glib2 3.3.7 編譯失敗而未在 macOS 上安裝
- ARROW-6812 - [Java] 從授權標頭中移除 Dremio Corp.
- ARROW-6813 - [Ruby] 在 Arrow 0.15 中,使用 headers=true 的 Arrow::Table.load 會導致例外
- ARROW-6820 - [C++] [Doc] [Format] Map 規格和實作不一致
- ARROW-6834 - [C++] 將 gtest 固定為 1.8.1 以分類失敗的 Appveyor / MSVC 建置
- ARROW-6835 - [Archery][CMake] 還原 ARROW_LINT_ONLY
- ARROW-6842 - [Website] Jekyll 錯誤建置網站
- ARROW-6844 - [C++][Parquet][Python] 清單
欄位讀取在 0.15.0 版本中損壞 - ARROW-6857 - [Python][C++] 在空 chunked_array 上進行 dictionary_encode 時區段錯誤 (邊緣案例)
- ARROW-6859 - [CI][Nightly] 為 CircleCI 工作停用 docker 層快取
- ARROW-6860 - [Python] 僅將 libarrow_flight.so 連結至 pyarrow._flight
- ARROW-6861 - [Python] arrow-0.15.0 讀取 arrow-0.14.1 輸出 Parquet 字典欄位:讀取欄位失敗:IOError:Arrow 錯誤:無效:Resize 無法縮減大小
- ARROW-6864 - [C++] 未啟用 bz2 / zstd 測試
- ARROW-6867 - [FlightRPC][Java] Flight 伺服器可能會在關機時掛起 JVM
- ARROW-6868 - [Go] 切割 Struct 陣列不會切割子欄位
- ARROW-6869 - [C++] builder_dict.h 中的字典 “delta” 建置邏輯產生無效陣列
- ARROW-6873 - [Python] 過時的 CColumn 參考中斷 Cython cimport pyarrow
- ARROW-6874 - [Python] 轉換為物件 dtype 時,Table.to_pandas() 中存在記憶體洩漏
- ARROW-6876 - [Python] 對於 0.15.0 版本,讀取具有許多欄位的 parquet 檔案變得緩慢
- ARROW-6877 - [C++] 無法從正確的環境找到 Boost
- ARROW-6878 - [Python] 在 python3 下,pa.array() 無法正確處理具有位元組金鑰的字典清單
- ARROW-6882 - [Python] 無法從 dictionary_encoding 結果建立 chunked_array
- ARROW-6885 - [Python] 移除多餘的跳過 timedelta 測試
- ARROW-6886 - [C++] arrow::io 標頭 nvcc 編譯器警告
- ARROW-6895 - [C++][Parquet] parquet::arrow::ColumnReader:ByteArrayDictionaryRecordReader 在呼叫 `NextBatch()` 時重複傳回的值
- ARROW-6898 - [Java] 修復 ArrowWriter 和數個測試類別中潛在的記憶體洩漏
- ARROW-6899 - [Python] list<dictionary<values=string, indices=int32> 未實作 to_pandas()
- ARROW-6901 - [Rust][Parquet] SerializedFileWriter 將 total_num_rows 寫為零
- ARROW-6903 - [Python] Wheels 在 ARROW-6860 變更後損壞
- ARROW-6905 - [Packaging][OSX] MacOS 上的夜間建置因 brew 編譯逾時而失敗
- ARROW-6910 - [Python] pyarrow.parquet.read_table(…) 佔用大量記憶體,直到程式結束才會釋放
- ARROW-6913 - [R] compute.cc 中潛在的錯誤
- ARROW-6914 - [CI] docker-clang-format 夜間工作失敗
- ARROW-6922 - [Python] Pandas master 建置失敗 (MultiIndex.levels 變更)
- ARROW-6925 - [C++] 使用 brew gcc 7 和 8 時,Arrow 無法在 MacOS 10.13.6 上建置
- ARROW-6929 - [C++] ValidateArray 與 ListArray IPC 規格不同步
- ARROW-6937 - [Packaging][Python] 修復 conda linux 和 OSX wheel 夜間建置
- ARROW-6938 - [Python] Windows wheel 取決於 zstd.dll 和 libbz2.dll,但這些檔案未捆綁
- ARROW-6948 - [Rust] [Parquet] 修復 arrow 讀取器中的布林陣列支援。
- ARROW-6950 - [C++][Dataset] 新增範例/基準測試以使用 dataset 讀取 parquet 檔案
- ARROW-6957 - [CI][Crossbow] 使用 sanitizers 的夜間 R 建置在安裝相依性時失敗
- ARROW-6962 - [C++] [CI] 停止使用 -Weverything 編譯
- ARROW-6966 - [Go] 32 位元 memset 為空值
- ARROW-6977 - [C++] 僅在支援功能時啟用 jemalloc background_thread
- ARROW-6983 - [C++] 執行緒化工作群組有時會崩潰
- ARROW-6989 - [Python][C++] 當十進位類型推斷發生在超出範圍精度的值時,會觸發 Assert
- ARROW-6992 - [C++]:未定義行為 sanitizer 建置選項在 GCC 中失敗
- ARROW-6999 - [Python] KeyError:‘__index_level_0__’ 將 Table.from_pandas 傳遞給自己的結構描述
- ARROW-7013 - [C++] arrow-dataset pkgconfig 不完整
- ARROW-7020 - [Java] 修復計算向量雜湊碼時的錯誤
- ARROW-7021 - [Java] UnionFixedSizeListWriter 十進位類型應檢查 writer 索引
- ARROW-7022 - [Python] __arrow_array__ 在 Table.from_pandas 中不適用於 ExtensionTypes
- ARROW-7023 - [Python] pa.array 未將 “from_pandas” 語意用於 pd.Index
- ARROW-7024 - [CI][R] 更新 Conda 建置的 R 相依性
- ARROW-7027 - [Python] 若傳遞無效物件,pa.table(..) 應拋出錯誤而非返回
- ARROW-7033 - [C++] 在 OSX 10.14.6 上建置時,jemalloc 的 ./configure 步驟中發生錯誤
- ARROW-7045 - [R] Factor 類型在 Parquet 往返行程中未保留
- ARROW-7050 - [R] 修正 R 綁定中的編譯器警告
- ARROW-7056 - [Python] 在沒有 S3 的情況下測試錯誤
- ARROW-7059 - [Python] 相較於 0.14.x,在 0.15.x 中讀取具有多列的 parquet 檔案速度較慢
- ARROW-7074 - [C++] ASSERT_OK_AND_ASSIGN 在失敗時崩潰
- ARROW-7077 - [C++] 不支援的 Dict->T 轉換應返回錯誤而非崩潰
- ARROW-7087 - [Python] 當我們寫入分割資料集時,表格 Metadata 消失
- ARROW-7097 - [Rust][CI] 建置因 rust nightly formatting 失敗
- ARROW-7100 - [C++] 在 ubuntu 19.04 和 openjdk-11 上找不到 libjvm.so
- ARROW-7105 - [CI][Crossbow] Nightly homebrew-cpp 工作失敗
- ARROW-7106 - [Java] 修正 flight 效能測試無限期掛起的問題
- ARROW-7117 - [C++][CI] 修正 Windows 2019 中掛起的 C++ 測試
- ARROW-7128 - [CI] Fedora cron 工作因錯誤的 fedora 版本而失敗
- ARROW-7133 - [CI] 允許 GH Actions 在所有分支上執行
- ARROW-7142 - [C++] 使用 GCC 5.4.0 編譯時發生錯誤
- ARROW-7152 - [Java] 刪除無用的類別 DiffFunction
- ARROW-7157 - [R] 為 Object$new() 新增驗證和有用的錯誤訊息
- ARROW-7158 - [C++][Visual Studio] 在非英文版本的 Visual Studio 上建置組態錯誤。
- ARROW-7163 - [Doc] 修正 double-and 錯字
- ARROW-7164 - [CI] Dev cron github action 每 15 分鐘失敗一次
- ARROW-7167 - [CI][Python] 將舊版本 pandas 的 nightly 測試新增至 Github Actions
- ARROW-7168 - [Python] pa.array() 未遵循指定的 dictionary 類型
- ARROW-7170 - [C++] 捆綁的 ORC 連結失敗
- ARROW-7180 - [CI] Java 建置未在 master 分支上觸發
- ARROW-7181 - [Python][Nightly] Wheel 建置找不到 ArrowPython
- ARROW-7183 - [CI][Crossbow] 重新跳過 r-sanitizer nightly 測試
- ARROW-7187 - [C++][Doc] doxygen 在 master 分支上因 @ 符號而損壞
- ARROW-7188 - [C++][Doc] doxygen 在 master 分支上損壞:遺失參數 implicit_casts
- ARROW-7194 - [Rust] CSV Writer 導致遞迴錯誤
- ARROW-7199 - [Java] BaseAllocator::getChildAllocators 中的 ConcurrentModificationException
- ARROW-7200 - [C++][Flight] 在兩台主機上執行 Arrow Flight 基準測試無效
- ARROW-7209 - [Python] 由於 pandas master 現在支援 __from_arrow__,因此使用 pandas master 的測試失敗
- ARROW-7212 - “go test -bench=8192 -run=. ./math” 失敗
- ARROW-7214 - [Python] 還原序列化具有 dictionary 欄位的 pyarrow 表格時崩潰
- ARROW-7217 - ARROW-7217: [CI][Python] 在 Github Actions 中使用正確的 python 版本
- ARROW-7225 - [C++] `*std::move(Result
)\` 呼叫 T 複製建構函式 - ARROW-7249 - [CI] Release 測試在 master 分支中因新的 arrow-flight Rust crate 而失敗
- ARROW-7250 - [C++] 使用 clang 4.x 時,StringToFloatConverter::Impl 的未定義符號
- ARROW-7253 - [CI] 修正 release 測試的 master 分支失敗
- ARROW-7254 - BaseVariableWidthVector#setSafe 似乎會使值偏移不一致
- ARROW-7264 - [Java] RangeEqualsVisitor 類型檢查不正確
- ARROW-7266 - [Python] slice 的 dictionary_encode() 給出錯誤結果
- ARROW-7271 - [C++][Flight] 使用 SetTotalBytesLimit 的單參數版本
- ARROW-7281 - [C++] AdaptiveIntBuilder::length() 未考慮 pending_pos_。
- ARROW-7282 - [Python] IO 函數應在適當時拋出 FileNotFoundError
- ARROW-7291 - [Dev] 修正 update-flatbuffers.sh 中的 FORMAT_DIR
- ARROW-7294 - [Python] converted_type_name_from_enum(): INT_64 的名稱不正確
- ARROW-7295 - [R] 修正導致 R < 3.5 失敗的錯誤測試
- ARROW-7298 - [C++] cpp/thirdparty/download-dependencies.sh 已損壞
- ARROW-7314 - [Python] pyarrow 中的編譯器警告
- ARROW-7318 - [C#] TimestampArray 序列化失敗
- ARROW-7320 - [C++] Target arrow-type-benchmark 無法在 bullx Linux 上建置
- ARROW-7327 - [CI] 失敗的 C GLib 和 R buildbot 建置器
- ARROW-7328 - [CI] GitHub Actions 應在 GitHub Actions 組態變更時觸發
- ARROW-7341 - [CI] 取消 nightly Conda R 工作的損壞狀態
- ARROW-7343 - [Java] 當用戶端取消時,Flight DoGet 中的記憶體洩漏
- ARROW-7349 - [C++] 修正剖析字串十六進位值的錯誤
- ARROW-7353 - [C++] 使用 clang 建置時停用 -Wmissing-braces
- ARROW-7354 - [C++] TestHadoopFileSystem::ThreadSafety 因 sigabort 而失敗
- ARROW-7355 - [CI] 為 fuzzit 建置定義了兩次環境變數
- ARROW-7358 - [CI] [Dev] [C++] 在 conda-python-hdfs 上停用 ccache
- ARROW-7359 - [C++][Gandiva] 請勿針對起始位置超過字串長度的 locate 函數拋出錯誤,改為返回 0
- ARROW-7360 - [R] 無法將 dplyr filter() 與父範圍中定義的變數一起使用
- ARROW-7361 - [Rust] 建置目錄未傳遞至 ci/scripts/rust_test.sh
- ARROW-7362 - [Python] ListArray.flatten() 應處理 slice 偏移
- ARROW-7374 - [Dev] [C++] cuda-cpp docker 映像檔編譯 Arrow 失敗
- ARROW-7381 - [C++][Packaging] Iterator 變更破壞了 manylinux1 wheels
- ARROW-7386 - [C#] Array 偏移無法正常運作
- ARROW-7388 - [Python] 如果找不到 libhdfs,則跳過 HDFS 測試
- ARROW-7389 - [Python][Packaging] 從配方中移除 pyarrow.s3fs 匯入檢查
- ARROW-7393 - [Plasma] 修正 Java 建置中的 plasma 可執行檔名稱
- ARROW-7395 - [C++] 具有常數的邏輯 “or” 是 Clang 警告
- ARROW-7397 - [C++] Json 空白字元長度偵測錯誤
- ARROW-7404 - [C++][Gandiva] 修正 Arm64 上 utf8 字元長度錯誤
- ARROW-7406 - [Java] NonNullableStructVector#hashCode 應將 hasher 傳遞給子向量
- ARROW-7407 - [Python] 無法在 Python 3.8 上安裝 pyarrow 0.15.1
- ARROW-7408 - [C++] 參考基準測試編譯失敗
- ARROW-7435 - 安全性問題:ValidateOffsets() 無法防止緩衝區過度讀取
- ARROW-7436 - [Archery] 修正基準測試預設組態
- ARROW-7437 - [Java] ReadChannel#readFully 未正確設定 writer index
- ARROW-7442 - [Ruby] 將欄位類型指定為 time 會導致區段錯誤
- ARROW-7447 - [Java] ComplexCopier 在某些情況下複製不正確
- ARROW-7450 - [CI][C++] test-ubuntu-18.04-cpp-static 因 arrow-io-hdfs-test 中的連結錯誤而失敗
- ARROW-7458 - [GLib] Makefile 中的不正確建置相依性
- ARROW-7471 - [Python] Cython flake8 失敗
- ARROW-7472 - [Java] 修正 UnionListWriter 中的一些不正確行為
- ARROW-7478 - [Rust] [DataFusion] 群組依據運算式被忽略,除非與彙總運算式配對
- ARROW-7492 - [CI][Crossbow] Nightly homebrew-cpp 工作在 Python 安裝時失敗
- ARROW-7497 - [Python] 測試斷言:pandas.util.testing 已棄用,請改用 pandas.testing
- ARROW-7500 - [C++][Dataset] hive 分割在 centos7 和 opensuse42 上發生 regex_error
- ARROW-7503 - [Rust] Rust 建置在 master 分支上失敗
- ARROW-7506 - [Java] JMH 基準測試應從 main 方法呼叫
- ARROW-7508 - [C#] DateTime32 讀取已損壞
- ARROW-7510 - [C++] Array::null_count() 與執行緒不相容
- ARROW-7516 - [C#] .NET 基準測試已損壞
- ARROW-7518 - [Python] 建置 wheels、conda 套件時使用 PYARROW_WITH_HDFS
- ARROW-7527 - [Python] pandas/feather 測試在 pandas master 分支上失敗
- ARROW-7528 - [Python] pandas.datetime 類別(datetime.datetime 的匯入)和 pandas.np 已棄用
- ARROW-7535 - [C++] 驗證中的 ASAN 失敗
- ARROW-7543 - [R] arrow::write_parquet() 程式碼範例無法運作
- ARROW-7551 - [FlightRPC][C++] 由於 Homebrew gRPC,macOS 上的 Flight 測試失敗
- ARROW-7552 - [C++] TestSlowInputStream 不穩定
- ARROW-7554 - [C++] 未知的 CMake 命令 “externalproject_add”。
- ARROW-7559 - [Rust] StringArray 和 BinaryArray 中可能不正確的索引檢查斷言
- ARROW-7561 - [Doc][Python] 修正 conda 環境命令
- ARROW-7582 - [Rust][Flight] 無法編譯 arrow.flight.protocol.rs
- ARROW-7583 - [C++][Flight] Auth handler 測試在 Windows 上不穩定
- ARROW-7591 - [Python] DictionaryArray.to_numpy 返回零件字典而不是 numpy 陣列
- ARROW-7592 - [C++] 修正損壞的 IPC 輸入上的崩潰
- ARROW-7593 - [CI][Python] Python 資料集在 master 分支上失敗 / 未在 CI 上執行
- ARROW-7595 - [R][CI] R appveyor 工作因 pacman 壓縮變更而失敗
- ARROW-7596 - [Python] 僅當 split_blocks=True 時才套用零複製 DataFrame 區塊最佳化
- ARROW-7599 - [Java] 修正因 RangeEqualsVisitor 變更而導致的建置中斷
- ARROW-7603 - [CI][Crossbow] Nightly centos 8 工作失敗
- ARROW-7611 - [Packaging][Python] wheel 的成品模式不正確
- ARROW-7612 - [Packaging][Python] Windows 上 Conda 的成品路徑不正確
- ARROW-7614 - [Python] test_parquet.py::test_set_data_page_size 中的效能緩慢
- ARROW-7618 - [C++] 修正損壞的 IPC 輸入上的崩潰或未定義行為
- ARROW-7620 - [Rust] Windows 建置因 flatbuffer 編譯錯誤而失敗
- ARROW-7621 - [Doc] 文件建置失敗
- ARROW-7634 - [Python] Dataset 測試在 Windows 上解析檔案路徑時失敗
- ARROW-7638 - [Python] 檢查具有無效檔案/分割的 dataset.Source 時發生 Segfault
- ARROW-7639 - [R] 當值不是字串時,無法將 Dictionary Array 轉換為 R
- ARROW-7640 - [C++][Dataset] 如果建置未包含 codec 支援,則讀取壓縮的 Parquet 檔案時發生 segfault
- ARROW-7647 - [C++] JSON reader 無法讀取值很少的陣列
- ARROW-7650 - [C++] Dataset 測試未在 Windows 上建置
- ARROW-7651 - [CI][Crossbow] Nightly macOS wheel 建置失敗
- ARROW-7652 - [Python][Dataset] 在 ScannerBuilder.filter 中插入隱含轉換
- ARROW-7661 - [Python] 當結尾沒有換行符號時,CSV chunking 非最佳
- ARROW-7689 - [C++] macOS 上偶發的 Flight 測試崩潰
- ARROW-7690 - [R] 無法將 parquet 寫入 OutputStream
- ARROW-7693 - [CI] 修正 test-conda-python-3.7-spark-master nightly 錯誤
- ARROW-7709 - [Python] 從 Table Column 轉換為 Pandas 會遺失 Timestamps 的名稱
- ARROW-7714 - [Release] 變數擴充遺失
- ARROW-7718 - [Release] 修正二進位發布腳本中的自動重試
- ARROW-7723 - [Python] 具有時區的 StructArray timestamp 類型 to_pandas 轉換錯誤