Apache Arrow 0.15.0 (2019 年 10 月 5 日)
這是一個主要版本,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 80 位不同貢獻者的 672 次提交。
$ git shortlog -sn apache-arrow-0.14.0..apache-arrow-0.15.0
96 Wes McKinney
63 Antoine Pitrou
59 tianchen
55 Sutou Kouhei
46 liyafan82
38 Neal Richardson
34 Joris Van den Bossche
29 Krisztián Szűcs
24 Andy Grove
20 Benjamin Kietzman
18 Prudhvi Porandla
17 Micah Kornfield
15 François Saint-Jacques
13 David Li
12 Yosuke Shiro
9 Pindikura Ravindra
8 Romain Francois
7 Omer Ozarslan
7 Praveen
6 Renjie Liu
5 ptaylor
5 Kenta Murata
5 Hatem Helal
5 Bryan Cutler
4 Marco Neumann
4 Uwe L. Korn
4 Eric Erhardt
3 ARF1
3 Chao Sun
3 Paddy Horan
2 James Lamb
2 andyscho
2 Ryan Murray
2 Martin Radev
2 Sebastien Binet
1 Zhuo Peng
1 b-rms
1 czxrrr
1 emkornfield
1 lihalite
1 mmaclach
1 psuman
1 roshie548
1 shengjun.li
1 tianchen92
1 Ádám Lippai
1 Aaron Opfer
1 Adam Lippai
1 Artem Alekseev
1 Chen Li
1 Eric Liang
1 Galuh Sahid
1 Hengruo Zhang
1 Ingo Mueller
1 Ingvar-Y
1 Itamar Turner-Trauring
1 Jeka Pats
1 Johan Peltenburg
1 Kenneth Jung
1 Liya Fan
1 Marcin Juszkiewicz
1 Marius Seritan
1 Mark Harris
1 Mark Mikofski
1 Neville Dipale
1 Paul Taylor
1 Philipp Moritz
1 Richard Liaw
1 Rok
1 Ruslan Kuprieiev
1 TP Boudreau
1 Takuya Kato
1 Tao He
1 Thomas Elvey
1 Tobias Mayer
1 Ulzii Otgonbaatar
1 Yuan Zhou
1 Yuqi Gu
1 Zeyuan Shang
1 Zherui Cao
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到儲存庫。
$ git shortlog -csn apache-arrow-0.14.0..apache-arrow-0.15.0
214 Wes McKinney
85 Sutou Kouhei
82 Micah Kornfield
70 Antoine Pitrou
44 Pindikura Ravindra
32 Krisztián Szűcs
29 François Saint-Jacques
25 Neal Richardson
19 Andy Grove
12 Yosuke Shiro
10 Benjamin Kietzman
10 Bryan Cutler
10 Paddy Horan
9 Praveen
6 Neville Dipale
4 Uwe L. Korn
3 Philipp Moritz
3 GitHub
1 Romain Francois
1 ptaylor
1 Chao Sun
1 emkornfield
1 Kenta Murata
變更日誌
新功能與改進
- ARROW-1324 - [C++] 在 Windows / MSVC 上支援 ARROW_BOOST_VENDORED
- ARROW-1561 - [C++] “isin”(集合包含)的核心實作
- ARROW-1566 - [C++] 實作非實體化排序核心
- ARROW-1741 - [C++] DictionaryArray 的比較函數,以判斷索引是否“相容”
- ARROW-1789 - [Format] 整合規格文件並提高新實作作者的清晰度
- ARROW-1875 - [Java] 在整合測試 JSON 檔案中將 64 位元整數寫為字串
- ARROW-2769 - [C++][Python] 棄用和重新命名 add_metadata 方法
- ARROW-2931 - [Crossbow] Windows 建置嘗試執行 linux 和 osx 套件任務
- ARROW-3032 - [Python] 清理與 NumPy 相關的 C++ 標頭
- ARROW-3204 - [R] 啟用套件在 CRAN 上可用
- ARROW-3243 - [C++] 將 jemalloc 升級到版本 5
- ARROW-3246 - [Python][Parquet] 在 parquet 中直接讀取/寫入 pandas 分類資料
- ARROW-3325 - [Python] 支援直接將 Parquet 二進位/字串欄位讀取為 DictionaryArray
- ARROW-3531 - [Python] 棄用 Schema.field_by_name,改用 __getitem__
- ARROW-3538 - [Python] 在寫入資料集時,能夠覆寫檔案名稱 uuid 的自動分配
- ARROW-3579 - [Crossbow] 遠端分支尚未推送時,出現難以理解的錯誤訊息
- ARROW-3643 - [Rust] 優化 `BufferBuilder` 的 `push_slice`
\` - ARROW-3710 - [Crossbow][Python] 針對 pandas master 執行每晚測試
- ARROW-3772 - [C++] 直接將 Parquet 字典編碼的 ColumnChunks 讀取到 Arrow DictionaryArray 中
- ARROW-3777 - [C++] 實作模擬“高延遲”檔案系統
- ARROW-3817 - [R] RecordBatch 的 $ 方法
- ARROW-3829 - [Python] 支援從第三方類別提取 Arrow 物件的協定
- ARROW-3943 - [R] 為 R 套件撰寫小品文
- ARROW-4036 - [C++] 使狀態碼可插拔
- ARROW-4095 - [C++] 實作字典統一的優化,其中字典是統一字典的前綴
- ARROW-4111 - [Python] 從 Python 整數序列建立時間類型
- ARROW-4218 - [Rust] [Parquet] 實作 ColumnReader
- ARROW-4220 - [Python] 使用模擬高延遲 IO 添加緩衝輸入和輸出流 ASV 基準測試
- ARROW-4365 - [Rust] [Parquet] 實作 RecordReader
- ARROW-4398 - [Python] 為 Arrow<>Parquet BYTE_ARRAY 序列化(讀取和寫入)添加基準測試
- ARROW-4473 - [Website] 新增執行 Arrow 網站測試部署的說明並修正錯誤
- ARROW-4507 - [Format] 為新文件建立大綱和簡介。
- ARROW-4508 - [Format] 從 Layout.rst 複製內容到新文件。
- ARROW-4509 - [Format] 從 Metadata.rst 複製內容到新文件。
- ARROW-4510 - [Format] 從 IPC.rst 複製內容到新文件。
- ARROW-4511 - [Format] 一旦所有內容都移動後,移除個別文件,改用新文件
- ARROW-453 - [C++] 為 Amazon S3 新增檔案系統實作
- ARROW-4648 - [C++/Question] cpp codebase 中的命名/組織不一致
- ARROW-4649 - [C++/CI/R] 新增(每晚)建置 `brew install apache-arrow –HEAD` 的工作
- ARROW-4752 - [Rust] 為除法核心添加顯式 SIMD 向量化
- ARROW-4810 - [Format][C++] 新增具有 64 位元偏移量的 “LargeList” 類型
- ARROW-4841 - [C++] 在產生的 CMake 配置中持久化 CMake 選項
- ARROW-5134 - [R][CI] 針對多個 R 版本執行每晚測試
- ARROW-517 - [C++] 冗長的 Array::Equals
- ARROW-5211 - [Format] MetaData 頁面上的 “字典編碼” 區段下缺少文件
- ARROW-5216 - [CI] 將 Appveyor 徽章添加到 README
- ARROW-5307 - [CI][GLib] 啟用 GTK-Doc
- ARROW-5343 - [C++] 考慮在 DictionaryType::Unify 中使用 Buffer 而不是 std::vector 來進行轉置映射
- ARROW-5344 - [C++] 在 compute/kernels/cast.cc 中使用 ArrayDataVisitor 實作字典解壓縮
- ARROW-5351 - [Rust] 新增對 take 核心函數的支援
- ARROW-5358 - [Rust] 實作 ArrayData 和 Array 的相等性檢查
- ARROW-5380 - [C++] 修正並啟用 UBSan 以進行未對齊的存取。
- ARROW-5439 - [Java] 在檔案格式中利用串流 EOS
- ARROW-5444 - [Release][Website] 在 0.14 版本發布後,更新什麼是“官方”版本
- ARROW-5458 - [C++] ARMv8 並行 CRC32c 計算優化
- ARROW-5480 - [Python] Pandas 分類類型無法在 parquet 中往返
- ARROW-5483 - [Java] 新增採用 Field 物件的 ValueVector 建構子
- ARROW-5494 - [Python] 建立 FileSystem 綁定
- ARROW-5505 - [R] 停止遮罩基本 R 函數/重新思考命名空間
- ARROW-5527 - [C++] HashTable/MemoTable 應使用 Buffer(s)/Builder(s) 進行堆積資料
- ARROW-5558 - [C++] 支援在具有非零偏移量的陣列上執行 Array::View
- ARROW-5559 - [C++] 引入 IpcOptions struct 物件,以便在新增選項時獲得更好的 API 穩定性
- ARROW-5564 - [C++] 將 uriparser 新增至 conda-forge
- ARROW-5579 - [Java] shade flatbuffer 相依性
- ARROW-5580 - [C++][Gandiva] 修正 Gandiva 中時間戳記函數的定義
- ARROW-5588 - [C++] 更好地支援建置 UnionArrays
- ARROW-5594 - [C++] 為 Take 和 Filter 新增對 UnionArrays 的支援
- ARROW-5610 - [Python] 在 Python 中定義擴充類型 API,以“接收”或“發送”外部擴充類型
- ARROW-5646 - [Crossbow][Documentation] 將使用者指南移動到 Sphinx 文件
- ARROW-5681 - [FlightRPC] 包裝 gRPC 例外/狀態
- ARROW-5686 - [R] 審查 R Windows CI 建置
- ARROW-5716 - [Developer] 改進合併 PR 腳本以確認共同作者
- ARROW-5717 - [Python] 在將可變字典轉換為 pandas 時支援字典統一
- ARROW-5719 - [Java] 支援就地向量排序
- ARROW-5722 - [Rust] 為 ListArray、BinaryArray 和 StructArray 實作 std::fmt::Debug
- ARROW-5734 - [Python] 從 pyarrow.table 工廠函數分派到 Table.from_arrays
- ARROW-5736 - [Format][C++] 支援稀疏張量中的小位元寬度索引
- ARROW-5741 - [JS] 使來自函數的數值向量與 TypedArray.from 一致
- ARROW-5743 - [C++] 新增 CMake 選項以啟用“大記憶體”單元測試
- ARROW-5746 - [Website] 將網站來源移出 apache/arrow
- ARROW-5747 - [C++] CSV 讀取器中更好的欄位名稱和標頭支援
- ARROW-5758 - [C++][Gandiva] 支援將小數轉換為 varchar,反之亦然
- ARROW-5762 - [Integration][JS] Map 類型的整合測試
- ARROW-5777 - [C++] BasicDecimal128 是一個小物件,始終按 const ref 傳遞沒有意義
- ARROW-5778 - [Java] 將向量資料複製的邏輯提取到父類別
- ARROW-5784 - [Release][GLib] 在 dev/release/02-source.sh 中執行 c_glib/autogen.sh 後替換 c_glib/
- ARROW-5786 - [Release] 在 dev/release/01-prepare.sh 中使用 arrow-jni 設定檔
- ARROW-5788 - [Rust] 對於 arrow 和 parquet 相依性,使用 { version = “…”, path = “../…” }
- ARROW-5789 - [C++] 小型警告/連結清理
- ARROW-5792 - [Rust] [Parquet] 用於 parquet 類型的訪問者特徵。
- ARROW-5798 - [Packaging][deb] 更新文件架構
- ARROW-5800 - [R] Dockerize R Travis CI 測試,以便可以使用 docker-compose 在任何地方執行
- ARROW-5803 - [C++] 使用 clang 7 Travis CI 單元測試邏輯 Dockerize C++
- ARROW-5812 - [Java] 在 BaseIntVector 中重構方法名稱和參數類型
- ARROW-5813 - [C++] 支援檢查不同連續張量的相等性
- ARROW-5814 - [Java] 為 DictionaryEncoder 實作 <Object, int> HashMap
- ARROW-5827 - [C++] 需要 c-ares CMake 配置
- ARROW-5828 - [C++] 新增 Protocol Buffers 版本檢查
- ARROW-5830 - [C++] 停止在 TensorEquals 中使用 memcmp
- ARROW-5832 - [Java] 支援向量資料的搜尋操作
- ARROW-5833 - [C++] 從 cast.cc 中分解出狀態複製程式碼
- ARROW-5834 - [Java] 在 DictionaryEncoder 中應用新的雜湊表
- ARROW-5835 - [Java] 支援二進位類型的字典編碼
- ARROW-5841 - [Website] 新增 0.14.0 版本說明
- ARROW-5842 - [Java] 修訂 ListVector 中 lastSet 的語義
- ARROW-5843 - [Java] 提高 BitVectorHelper#getNullCount 的可讀性和效能
- ARROW-5844 - [Java] 支援更多數值類型的比較和排序
- ARROW-5846 - [Java] 建立 Avro 配接器模組並新增相依性
- ARROW-5853 - [Python] 在 Array 上公開布林篩選核心
- ARROW-5861 - [Java] 初始實作以轉換具有基本類型的 Avro 記錄
- ARROW-5862 - [Java] 提供字典建構器
- ARROW-5864 - [Python] 簡化 Result 的 cython 包裝
- ARROW-5865 - [Release] 用於在 master 上重新定基開放提取請求的輔助腳本
- ARROW-5866 - [C++] 移除 cpp/Brewfile 中的重複程式庫
- ARROW-5867 - [C++][Gandiva] 新增對將整數轉換為小數的支援
- ARROW-5872 - 支援 Gandiva 中的 mod(double, double) 方法
- ARROW-5876 - [FlightRPC] 在所有語言中實作基本身份驗證
- ARROW-5877 - [FlightRPC] 修正 Python/Java 之間的身份驗證不相容性
- ARROW-5880 - [C++] 更新 arrow parquet writer 以使用 TypedBufferBuilder
- ARROW-5881 - [Java] 提供有效判斷有效性緩衝區是否完全為 1 位元/0 位元的功能
- ARROW-5883 - [Java] 支援 List 和 Struct 類型的字典編碼
- ARROW-5888 - [Python][C++] 新增元數據以在 Parquet 檔案元數據中儲存 Arrow 時區
- ARROW-5891 - [C++][Gandiva] 移除函數註冊表中的重複項
- ARROW-5892 - [C++][Gandiva] 支援函數別名
- ARROW-5893 - [C++] 從 C++ 程式庫中移除 arrow::Column 類別
- ARROW-5897 - [Java] 移除 MapVector 中的重複邏輯
- ARROW-5898 - [Java] 提供有效計算任意記憶體區段雜湊碼的功能
- ARROW-5900 - [Gandiva] [Java] 小數精度、比例邊界檢查
- ARROW-5901 - [Rust] 實作 PartialEq 以比較陣列和 json 值
- ARROW-5902 - [Java] 為字典編碼實作雜湊表以及 equals 和 hashCode API
- ARROW-5903 - [Java] DecimalVector 中的 set 方法很慢
- ARROW-5904 - [Java] [Plasma] 修正 Plasma Java 用戶端的編譯
- ARROW-5906 - [CI] 在 Travis CI 中執行的建置中設定 -DARROW_VERBOSE_THIRDPARTY_BUILD=OFF,可能預設為所有 docker-compose 建置
- ARROW-5908 - [C#] ArrowStreamWriter 未將緩衝區對齊到 8 個位元組
- ARROW-5909 - [Java] 優化 ByteFunctionHelpers equals 和 compare 邏輯
- ARROW-5911 - [Java] 使 ListVector 和 MapVector 延遲建立讀取器
- ARROW-5917 - [Java] 重新設計字典編碼器
- ARROW-5918 - [Java] 在 BaseIntVector 介面中新增 get
- ARROW-5919 - [R] 為使用來自 conda-forge 的相依性建置 r-arrow 新增每晚測試
- ARROW-5920 - [Java] 支援所有可變寬度向量的排序和比較
- ARROW-5924 - [C++][Plasma] 釋放 GPU 物件不方便
- ARROW-5934 - [Python] 將 arrow 的 LICENSE 與 wheels 捆綁在一起
- ARROW-5937 - [Release] 停止並行二進位上傳
- ARROW-5938 - [Release] 建立分支以自動新增版本說明
- ARROW-5939 - [Release] 新增對單獨產生投票電子郵件範本的支援
- ARROW-5940 - [Release] 新增對重新上傳二進位產物的簽名/校驗和的支援
- ARROW-5941 - [Release] 避免重新上傳已上傳的二進位產物
- ARROW-5943 - [GLib][Gandiva] 新增對函數別名的支援
- ARROW-5944 - [C++][Gandiva] 移除 ‘div’ 作為 ‘divide’ 的別名
- ARROW-5945 - [Rust] [DataFusion] Table 特徵應支援建置完整的查詢
- ARROW-5947 - [Rust] [DataFusion] 移除 serde_json 相依性
- ARROW-5948 - [Rust] [DataFusion] create_logical_plan 不應呼叫最佳化器
- ARROW-5955 - [Plasma] 支援為每個 plasma 用戶端設定記憶體配額,以實現更好的隔離
- ARROW-5957 - [C++][Gandiva] 在 Gandiva 中實作 div 函數
- ARROW-5958 - [Python] 在 wheels 中靜態連結 zlib
- ARROW-5961 - [R] 即使沒有 C++ 程式庫,也能夠執行僅限 R 的測試
- ARROW-5962 - [CI][Python] 不要在 Travis CI 中測試 manylinux1 wheels
- ARROW-5967 - [Java] DateUtility#timeZoneList 不正確
- ARROW-5970 - [Java] 提供指向 Arrow 緩衝區的指標
- ARROW-5974 - [Python][C++] 啟用 CSV 讀取器從串聯的 gzip 串流讀取
- ARROW-5975 - [C++][Gandiva] 新增將 Date(以毫秒為單位)轉換為時間戳記的方法
- ARROW-5976 - [C++] RETURN_IF_ERROR(ctx) 應為命名空間
- ARROW-5977 - [C++] [Python] 用於 read_csv 的方法,以限制讀取的欄位?
- ARROW-5979 - [FlightRPC] 公開協定類型的(反)序列化
- ARROW-5985 - [Developer] 不要在 dev/merge_arrow_pr.py 中建議為點版本設定修正版本
- ARROW-5986 - [Java] 字典編碼的程式碼清理
- ARROW-5988 - [Java] Avro 配接器實作簡單的 Record 類型
- ARROW-5997 - [Java] 支援 Union 類型的字典編碼
- ARROW-5998 - [Java] 開啟文件以追蹤 API 變更
- ARROW-6000 - [Python] 公開 LargeBinaryType 和 LargeStringType
- ARROW-6008 - [Release] 不要平行化 bintray 上傳腳本
- ARROW-6009 - [Release][JS] 忽略 javascript 發布腳本中的 NPM 錯誤
- ARROW-6013 - [Java] 支援範圍搜尋器
- ARROW-6017 - [FlightRPC] 允許使用未知方案建立位置
- ARROW-6020 - [Java] 使用新新增的 ArrowBufHasher 重構 ByteFunctionHelper#hash
- ARROW-6021 - [Java] 將 copyFrom 和 copyFromSafe 方法提取到 ValueVector 介面
- ARROW-6022 - [Java] 在 ValueVector 中支援 equals API 以比較兩個向量是否相等
- ARROW-6023 - [C++][Gandiva] 在 Gandiva 中新增函數
- ARROW-6024 - [Java] 提供更多雜湊演算法
- ARROW-6026 - [Doc] 新增 CONTRIBUTING.md
- ARROW-6030 - [Java] 有效計算 ArrowBufPointer 的雜湊碼
- ARROW-6031 - [Java] 支援透過 ArrowBufPointer 迭代向量
- ARROW-6034 - [C++][Gandiva] 在 Gandiva 中新增字串函數
- ARROW-6035 - [Java] Avro 配接器支援轉換可為空的值
- ARROW-6036 - [GLib] 為 skip rows 和 column_names CSV 讀取選項新增支援
- ARROW-6037 - [GLib] 新增遺失的版本巨集
- ARROW-6039 - [GLib] 新增 garrow_array_filter()
- ARROW-6041 - [Website] 宣布 R 套件發布的部落格文章
- ARROW-6042 - [C++] 實作始終產生 int32 索引的替代 DictionaryBuilder
- ARROW-6045 - [C++] Parquet float 和 NaN 編碼/解碼的基準測試
- ARROW-6048 - [C++] 新增呼叫 Array::View 的 ChunkedArray::View
- ARROW-6049 - [C++] 支援從相容的字典類型到另一種類型使用 Array::View
- ARROW-6053 - [Python] RecordBatchStreamReader::Open2 cdef 類型簽名與 C++ 不符
- ARROW-6063 - [FlightRPC] 為 DoPut 實作“半關閉”語義
- ARROW-6065 - [C++] 重組 parquet/arrow/reader.cc,移除程式碼重複,提高可讀性
- ARROW-6069 - [Rust] [Parquet] 實作 Converter 以將記錄讀取器轉換為 arrow 基本陣列。
- ARROW-6070 - [Java] 避免在 IPC 發送之前建立新的 schema
- ARROW-6077 - [C++][Parquet] 建置邏輯 schema 樹狀結構,將 Arrow 欄位映射到 Parquet schema 層級
- ARROW-6078 - [Java] 為 List 類型實作字典編碼的子欄位
- ARROW-6079 - [Java] 為 FixedSizeListVector 實作/測試 UnionFixedSizeListWriter
- ARROW-6080 - [Java] 支援 BaseRepeatedValueVector 的比較和搜尋操作
- ARROW-6083 - [Java] 重構 Jdbc 配接器消耗邏輯
- ARROW-6084 - [Python] 支援 LargeList
- ARROW-6085 - [Rust] [DataFusion] 為物理查詢計畫建立特徵
- ARROW-6086 - [Rust] [DataFusion] 為 parquet 掃描實作並行執行
- ARROW-6087 - [Rust] [DataFusion] 為 CSV 掃描實作並行執行
- ARROW-6088 - [Rust] [DataFusion] 為投影實作並行執行
- ARROW-6089 - [Rust] [DataFusion] 為選取實作並行執行
- ARROW-6090 - [Rust] [DataFusion] 為雜湊聚合實作並行執行
- ARROW-6093 - [Java] 減少 VectorRangeSearcher 中第一個匹配演算法的分支
- ARROW-6094 - [Format][Flight] 將 GetFlightSchema 新增至 Flight RPC
- ARROW-6096 - [C++] 有條件地相依於 boost regex 程式庫
- ARROW-6097 - [Java] Avro 配接器實作 unions 類型
- ARROW-6100 - [Rust] 釘選到特定的 Rust 每晚發布版本
- ARROW-6101 - [Rust] [DataFusion] 從邏輯計畫建立物理計畫
- ARROW-6104 - [Rust] [DataFusion] 不允許 bare_trait_objects
- ARROW-6105 - [C++][Parquet][Python] 新增測試案例,顯示巢狀類型中字典編碼的子欄位
- ARROW-6113 - [Java] 支援向量去重複函數
- ARROW-6115 - [Python] 支援轉換為 pandas 中的 LargeList、LargeString、LargeBinary
- ARROW-6118 - [Java] 將 google Preconditions 替換為 Arrow Preconditions
- ARROW-6121 - [Tools] 改善合併工具 cli 人體工學
- ARROW-6125 - [Python] 移除 0.14.x 之前棄用的任何 API
- ARROW-6127 - [Website] 新增網站圖示和 meta 標籤
- ARROW-6128 - [C++] 無法使用 g++ 8.3.0 建置,因為 class-memaccess 警告
- ARROW-6130 - [Release] 使用 0.15.0 作為下一個版本
- ARROW-6134 - [C++][Gandiva] 在 Gandiva 中新增 concat 函數
- ARROW-6137 - [C++][Gandiva] 變更 Gandiva 中 castVARCHAR(timestamp) 的輸出格式
- ARROW-6138 - [C++] 新增 Dataset 的基本(單個 RecordBatch)實作
- ARROW-6139 - [Documentation][R] 建置 R 文件 (pkgdown) 網站並新增至 arrow-site
- ARROW-6141 - [C++] 啟用記憶體映射與檔案開頭偏移的檔案區域
- ARROW-6142 - [R] Linux 上的安裝說明可以更清楚
- ARROW-6143 - [Java] 統一所有向量的 copyFrom 和 copyFromSafe 方法
- ARROW-6144 - [C++][Gandiva] 在 Gandiva 中實作 random 函數
- ARROW-6155 - [Java] 為元素駐留在連續記憶體區段中的向量提取超介面
- ARROW-6156 - [Java] 支援 ArrowBufPointer 的比較語義
- ARROW-6161 - [C++] 實作 dataset::ParquetFile 和相關的 Scan 結構
- ARROW-6162 - [C++][Gandiva] 當 out_len 參數為零時,不要在 castVARCHAR_varchar 中截斷字串
- ARROW-6172 - [Java] 提供基準測試以使用不同方法設定 IntVector
- ARROW-6177 - [C++] 新增 Array::Validate()
- ARROW-6180 - [C++] 建立 InputStream,它是 RandomAccessFile 區段的隔離讀取器
- ARROW-6181 - [R] 僅允許 R 套件在 Linux 上安裝而無需 libarrow
- ARROW-6183 - [R] 文件說明如果您不想使用 tidyselect,則不必使用
- ARROW-6185 - [Java] 提供基於雜湊表的字典建構器
- ARROW-6187 - [C++] 將 ExtensionType 寫入 Parquet 時回退到儲存類型
- ARROW-6188 - [GLib] 新增 garrow_array_is_in()
- ARROW-6192 - [GLib] 使用與 C++ 相同的 SO 版本
- ARROW-6194 - [Java] 在 DictionaryEncoder 中新增非靜態方法,使其易於擴充和重複使用
- ARROW-6196 - [Ruby] 新增透過 .new 建置 Arrow::TimeNNArray 的支援
- ARROW-6197 - [GLib] 新增 garrow_decimal128_rescale()
- ARROW-6199 - [Java] Avro 配接器避免潛在的資源洩漏。
- ARROW-6203 - [GLib] 新增 garrow_array_sort_to_indices()
- ARROW-6204 - [GLib] 新增 garrow_array_is_in_chunked_array()
- ARROW-6206 - [Java][Docs] 文件說明環境變數/java 屬性
- ARROW-6209 - [Java] 將 set null 方法提取到固定寬度向量的基底類別
- ARROW-6212 - [Java] 支援向量排序操作
- ARROW-6216 - [C++] 允許使用者選擇壓縮等級
- ARROW-6217 - [Website] 移除不必要的 _site/ 目錄
- ARROW-6219 - [Java] 為 JDBC 配接器新增 API,該 API 可以一次轉換少於完整結果集的資料。
- ARROW-6220 - [Java] 為 avro 配接器新增 API,以限制一次傳回的列數。
- ARROW-6225 - [Website] 更新 arrow-site/README 和任何其他位置,以將網站貢獻者指向正確的方向
- ARROW-6229 - [C++] 新增掃描目錄的 DataSource 實作
- ARROW-6230 - [R] 在 R 中讀取 Parquet 檔案比讀取 fst 檔案慢 20 倍
- ARROW-6231 - [C++][Python] 考慮在讀取 CSV 檔案且 header_rows=0 時指派預設欄位名稱
- ARROW-6232 - [C++] 將 Argsort 核心重新命名為 SortToIndices
- ARROW-6237 - [R] 新增選項以在使用 $ARROW_R_CXXFLAGS 編譯 R 套件時設定 CXXFLAGS
- ARROW-6238 - [C++] 實作 SimpleDataSource/SimpleDataFragment
- ARROW-6240 - [Ruby] Arrow::Decimal128Array 傳回 BigDecimal
- ARROW-6242 - [C++] 實作基本 Dataset/Scanner/ScannerBuilder
- ARROW-6243 - [C++] 實作基本 Filter 運算式類別
- ARROW-6244 - [C++] 實作 Partition DataSource
- ARROW-6246 - [Website] 新增 R 文件網站的連結
- ARROW-6247 - [Java] 為 float4 和 float8 向量提供通用介面
- ARROW-6249 - [Java] 移除無用的類別 ByteArrayWrapper
- ARROW-6250 - [Java] 實作 ApproxEqualsVisitor,比較浮點數的近似值
- ARROW-6252 - [Python] 新增 pyarrow.Array.diff 方法以公開 arrow::Diff
- ARROW-6253 - [Python] 在 pyarrow.parquet.read_table 中公開來自 parquet::ReaderProperties 的 “enable_buffered_stream” 選項
- ARROW-6258 - [R] 新增 macOS 建置腳本
- ARROW-6260 - [網站] 在 Travis 上使用部署金鑰來建置並推送到 asf-site
- ARROW-6262 - [開發者] 在合併前顯示 JIRA 議題
- ARROW-6264 - [Java] 在 ArrowBufHasher 中不需要考慮位元組順序
- ARROW-6265 - [Java] Avro adapter 實作 Array/Map/Fixed type
- ARROW-6267 - [Ruby] 為 Arrow::Time{32,64}DataType 值新增 Arrow::Time
- ARROW-6271 - [Rust] [DataFusion] 新增針對 Parquet 執行 SQL 的範例
- ARROW-6272 - [Rust] [DataFusion] 將 register_parquet 便利方法新增至 ExecutionContext
- ARROW-6278 - [R] 從原始向量讀取 parquet 檔案
- ARROW-6279 - [Python] 新增 Table.slice 方法或允許在 __getitem__ 中使用切片
- ARROW-6284 - [C++] 將 tuple 轉換為 arrow array 時,允許 std::tuple 中的參考
- ARROW-6287 - [Rust] [DataFusion] 重構 TableProvider 以傳回執行緒安全的 BatchIterator
- ARROW-6288 - [Java] 實作 TypeEqualsVisitor,比較向量類型是否相等(考量名稱和元數據)
- ARROW-6289 - [Java] 在 UnionVector 中新增 empty() 以建立實例
- ARROW-6292 - [C++] 新增使用 mimalloc 建置的選項
- ARROW-6294 - [C++] 為 plasma-store-server 執行檔使用連字符號
- ARROW-6296 - [Java] 清理 JDBC 介面並消除 binary/varchar 欄位的一個記憶體複製
- ARROW-6297 - [Java] 使用無號整數比較 ArrowBufPointers
- ARROW-6300 - [C++] 新增 io::OutputStream::Abort()
- ARROW-6303 - [Rust] 新增停用 SIMD 的功能
- ARROW-6304 - [Java] 為每個 maven artifact 新增描述
- ARROW-6306 - [Java] 支援透過穩定比較器進行穩定排序
- ARROW-6310 - [C++] 在 JSON 整合測試檔案中將 64 位元整數寫為字串
- ARROW-6311 - [Java] 使 ApproxEqualsVisitor 接受 DiffFunction 以使其更具彈性
- ARROW-6313 - [Format] 追蹤以確保 flatbuffer 序列化值在 stream/files 中對齊。
- ARROW-6314 - [C++] 實作變更以確保 flatbuffer 對齊。
- ARROW-6315 - [Java] 進行變更以確保 flatbuffer 讀取已對齊
- ARROW-6316 - [Go] 進行變更以確保 flatbuffer 讀取已對齊
- ARROW-6317 - [JS] 實作變更以確保 flatbuffer 對齊
- ARROW-6318 - [Integration] 更新整合測試以使用產生的二進制檔案,以確保向後相容性
- ARROW-6319 - [C++] 提取 NumericTensor 的核心
::Value as Tensor::Value - ARROW-6326 - [C++] 將 std::tuple 轉換為 Table 時的可為 Null 欄位
- ARROW-6328 - Click.option-s 應該要有說明文字
- ARROW-6329 - [Format] 在 IPC 訊息格式中新增 4 位元組 “stream continuation” 以對齊 Flatbuffers
- ARROW-6331 - [Java] 將 ErrorProne 納入 java 建置中
- ARROW-6334 - [Java] 改善 dictionary builder API 以傳回字典中值的位置
- ARROW-6335 - [Java] 改善 DictionaryHashTable 的效能
- ARROW-6336 - [Python] 釐清 pyarrow.serialize/deserialize 說明文件中關於與 Arrow IPC 協定的關係
- ARROW-6337 - [R] R API 中的 as_tibble 名稱不當
- ARROW-6338 - [R] 類型函數名稱與類型名稱不符
- ARROW-6342 - [Python] 新增 pyarrow.record_batch 工廠函數,其基本 API/語義與 pyarrow.table 相同
- ARROW-6346 - [GLib] 新增 garrow_array_view()
- ARROW-6347 - [GLib] 新增 garrow_array_diff_unified()
- ARROW-6350 - [Ruby] 移除 Arrow::Struct 並改用 Hash
- ARROW-6351 - [Ruby] 改善 Arrow#values 效能
- ARROW-6353 - [Python] 允許使用者在 pyarrow.parquet.write_table 中選取壓縮等級
- ARROW-6355 - [Java] 使 range equal visitor 可重複使用
- ARROW-6356 - [Java] Avro adapter 實作 Enum type 和巢狀 Record type
- ARROW-6357 - [C++] S3:允許背景寫入
- ARROW-6358 - [C++] FileSystem::DeleteDir 應使其可選擇是否刪除目錄本身
- ARROW-6360 - [R] 更新壓縮支援
- ARROW-6362 - [C++] S3:更彈性的憑證選項
- ARROW-6365 - [R] 應該能夠使用 schema 將 numeric 強制轉型為 integer
- ARROW-6366 - [Java] 明確地將欄位向量設為 final
- ARROW-6368 - [C++] 新增 RecordBatch 投影功能
- ARROW-6373 - [C++] 使 FixedWidthBinaryBuilder 與其他基本固定寬度建構器一致
- ARROW-6375 - [C++] 擴充 ConversionTraits 以允許在 STL API 中有效率地附加 list 值
- ARROW-6379 - [C++] 為 IPC 序列化 NullType 時,不要附加任何緩衝區
- ARROW-6381 - [C++] 對於許多小型寫入,BufferOutputStream::Write 速度很慢
- ARROW-6383 - [Java] 在父分配器關閉時報告未完成的子分配器
- ARROW-6384 - [C++] 升級依賴項
- ARROW-6385 - [C++] 調查 xxh3
- ARROW-6391 - [Python][Flight] 在 FlightServerBase 上新增內建方法,以啟動伺服器並等待其可用
- ARROW-6397 - [C++][CI] 修正 S3 minio 失敗
- ARROW-6401 - [Java] 為 Struct type 實作字典編碼的子欄位
- ARROW-6402 - [C++] 使用 g++ 9.2.1 抑制 sign-compare 警告
- ARROW-6403 - [Python] 將 FileReader::ReadRowGroups() 公開給 Python
- ARROW-6408 - [Rust] 在 SIMD 核心實作中使用 “if cfg!” 模式
- ARROW-6413 - [R] 支援自動產生欄位名稱
- ARROW-6415 - [R] 移除 R CMD config CXXCPP 的用法
- ARROW-6416 - [Python] 關於 chunksizes 的 API 和文件令人困惑
- ARROW-6419 - [網站] 關於 0.15.x 版本中 Parquet 字典效能工作的部落格文章
- ARROW-6422 - [Gandiva] 修正 double-conversion 連結器問題
- ARROW-6426 - [FlightRPC] 在 Flight 中公開 gRPC 組態旋鈕
- ARROW-6427 - [GLib] 新增欄位名稱自動產生 CSV 讀取選項的支援
- ARROW-6438 - [R] 為檔案系統 API 新增綁定
- ARROW-6447 - [C++] ARROW_JEMALLOC=ON 的建置會等到 jemalloc_ep 完成後才建置任何 libarrow .cc 檔案
- ARROW-6450 - [C++] 在 arrow::BufferBuilder 中使用 2 倍重新分配策略,而不是 1.5 倍
- ARROW-6451 - [Format] 在 Columnar.rst 中新增關於 Varbinary 或 List 陣列中 “null” slot 內容的說明
- ARROW-6453 - [C++] 來自 S3 的更豐富資訊的錯誤訊息
- ARROW-6454 - [開發者] 由於套件中的二進制重新發佈,將 LLVM 授權新增至 LICENSE.txt
- ARROW-6458 - [Java] 移除 ApproxEqualsVisitor 的值裝箱/拆箱
- ARROW-6460 - [Java] 為 avro adapter 新增基準測試和大型假資料 UT
- ARROW-6462 - [C++] 無法在 CentOS 6 x86_64 上使用捆綁的 double-conversion 建置
- ARROW-6465 - [Python] 改善 Windows 建置指示
- ARROW-6474 - [Python] 為 python 提供寫出舊格式的機制
- ARROW-6475 - [C++] 不要嘗試對字典陣列進行字典編碼
- ARROW-6477 - [Packaging][Crossbow] 使用 Azure Pipelines 建置 linux 套件
- ARROW-6480 - [開發者] 新增命令以產生並傳送 Crossbow 執行的電子郵件報告
- ARROW-6484 - [Java] 根據字典值計數啟用 DictionaryEncoding 的 create indexType
- ARROW-6487 - [Rust] [DataFusion] 建立測試工具模組
- ARROW-6489 - [開發者][文件] 修正合併腳本和 readme
- ARROW-6490 - [Java] 記錄分配器關閉時的洩漏錯誤
- ARROW-6491 - [Java] 修正 ErrorProne 造成的 master 建置失敗
- ARROW-6494 - [C++][Dataset] 實作基本 PartitionScheme
- ARROW-6504 - [Python][Packaging] 將 mimalloc 新增至 conda 套件以獲得更好的效能
- ARROW-6505 - [網站] 新增新的提交者
- ARROW-6518 - [Packaging][Python] Flight 在 OSX Python wheel 建置中失敗
- ARROW-6519 - [Java] 使用 IPC continuation token 標記 EOS
- ARROW-6524 - [開發者][Packaging] 每晚建置報告的主旨應包含 Arrow
- ARROW-6525 - [C++] CloseFromDestructor() 或許不應該崩潰
- ARROW-6526 - [C++] 在 PoolBuffer 解構子中污染資料
- ARROW-6527 - [C++] 新增 OutputStream::Write() 變體,接受擁有的緩衝區
- ARROW-6531 - [Python] 將 detach() 方法新增至緩衝串流
- ARROW-6532 - [R] 使用壓縮寫入 parquet 檔案
- ARROW-6533 - [R] 壓縮編解碼器應採用 “level”
- ARROW-6534 - [Java] 修正錯字和拼寫錯誤
- ARROW-6539 - [R] 提供寫出舊格式的機制
- ARROW-6540 - [R] 新增 Validate() 方法
- ARROW-6541 - [Format][C++] 使用兩部分 EOS 並修改 Format 文件
- ARROW-6542 - [R] 將 View() 方法新增至陣列類型
- ARROW-6544 - [R] 0.15 版本的說明文件/潤飾
- ARROW-6545 - [Go] 更新 Go IPC writer 以根據郵件列表討論使用兩部分 EOS
- ARROW-6546 - [C++] 新增遺失的 FlatBuffers 來源依賴項
- ARROW-6549 - [C++] 切換回最新的 jemalloc 5.x
- ARROW-6556 - [Python] 為不含 SparseDataFrame 的 pandas 版本做準備
- ARROW-6557 - [Python] 始終從 Array/ChunkedArray.to_pandas 傳回 pandas.Series,將欄位名稱從 RecordBatch、Table 傳播到 Series
- ARROW-6558 - [C++] 將 Iterator 重構為類型抹除的句柄
- ARROW-6559 - [開發者][C++] 新增 “archery” 選項以指定 C++ 建置的系統工具鏈
- ARROW-6563 - [Rust] [DataFusion] 建立 “merge” 執行計畫
- ARROW-6569 - [網站] 新增 GitHub Actions 自動部署的支援
- ARROW-6570 - [Python] 在 to_pandas 呼叫中使用 MemoryPool 為 NumPy 陣列分配記憶體
- ARROW-6580 - [Java] 支援無號整數的比較
- ARROW-6584 - [Python][Wheel] 再次將 zlib 與 windows wheel 捆綁在一起
- ARROW-6588 - [C++] 使用 g++ 9.2.1 抑制 class-memaccess 警告
- ARROW-6589 - [C++] 在 MakeArrayOfNull 中支援 BinaryType
- ARROW-6590 - [C++] 當 ARROW_IPC=ON 時,不需要 ARROW_JSON=ON
- ARROW-6591 - [R] 在原始碼控制中忽略 .Rhistory 檔案
- ARROW-6599 - [Rust] [DataFusion] 實作 SUM 聚合表達式
- ARROW-6601 - [Java] 改善 JDBC adapter 效能並新增基準測試
- ARROW-6605 - [C++] 將遞迴深度控制新增至 fs::Selector
- ARROW-6606 - [C++] 從 std::vector<fs::FileStats> 建構樹狀結構
- ARROW-6609 - [C++] 新增最小建置 Dockerfile 範例
- ARROW-6610 - [C++] 新增 ARROW_FILESYSTEM=ON/OFF CMake 組態標誌
- ARROW-6613 - [C++] 移除對 boost::filesystem 的依賴
- ARROW-6614 - [C++][Dataset] 實作 FileSystemDataSourceDiscovery
- ARROW-6621 - [Rust][DataFusion] DataFusion 的範例未在 CI 中執行
- ARROW-6629 - [Doc][C++] 記錄 FileSystem API
- ARROW-6630 - [Doc][C++] 記錄檔案讀取器(CSV、JSON、Parquet 等)
- ARROW-6644 - [JS] 修改 NullType IPC 協定以不附加緩衝區
- ARROW-6647 - [C++] 無法在 CentOS 7 上使用 g++ 4.8.5 建置,因為 shared_ptr 的成員初始化器
- ARROW-6648 - [Go] 公開 bitutil 套件
- ARROW-6649 - [R] Table、RecordBatch 等的 print() 方法
- ARROW-6653 - [開發者] 新增對提取請求自動 JIRA 連結的支援
- ARROW-6655 - [Python] S3 的檔案系統綁定
- ARROW-6664 - [C++] 新增不使用 SSE4.2 建置的選項
- ARROW-6665 - [Rust] [DataFusion] 實作數字字面值表達式
- ARROW-6667 - [Python] 避免 pyarrow.parquet 中的參考循環
- ARROW-6668 - [Rust] [DataFusion] 實作 CAST 表達式
- ARROW-6669 - [Rust] [DataFusion] 為二元表達式實作物理表達式
- ARROW-6675 - [JS] 將 scanReverse 函數新增至 dataFrame 和 filteredDataframe
- ARROW-6683 - [Python] 新增單元測試,以驗證安裝 fastparquet 時與 pyarrow.parquet 的交叉相容性
- ARROW-6725 - [CI] 停用第三方 fuzzit 每晚建置
- ARROW-6735 - [C++] 使用 g++ 9.2.1 抑制 sign-compare 警告
- ARROW-6752 - [Go] 為 Null 陣列實作 Stringer
- ARROW-6755 - [Release] 改善 Windows 版本驗證腳本
- ARROW-6771 - [Packaging][Python] conda 和 wheel 建置中遺失 pytest 依賴項
- ARROW-750 - [Format] 新增 LargeBinary 和 LargeString 類型
錯誤修正
- ARROW-1184 - [Java] Dictionary.equals 無法正確運作
- ARROW-2317 - [Python] 修正 C 連結警告
- ARROW-2490 - [C++] 輸入串流鎖定不一致
- ARROW-3176 - [Python] Date32 欄位轉換為 pandas 時發生溢位
- ARROW-3203 - [C++] Debian Buster 上的建置錯誤
- ARROW-3651 - [Python] 無法反序列化來自非 DateTimeIndex 的 Datetime
- ARROW-3652 - [Python] 讀回後 CategoricalIndex 遺失
- ARROW-3762 - [C++] 當 BinaryArray 容量溢位時,Parquet arrow::Table 讀取發生錯誤
- ARROW-3933 - [Python] 從 GNOMAD 讀取 Parquet 檔案時發生區段錯誤
- ARROW-4187 - [C++] file-benchmark 使用
- ARROW-4746 - [C++/Python] PyDataTime_Date 錯誤地轉換為 PyDataTime_DateTime
- ARROW-4836 - [Python] 使用 RecordBatchStreamWriter 時出現 “Cannot tell() a compressed stream”
- ARROW-4848 - [C++] 在 Windows 上,靜態 libparquet 未使用 -DARROW_STATIC 編譯
- ARROW-4880 - [Python] CMake 重構後,python/asv-build.sh 可能已損壞
- ARROW-4883 - [Python] 如果以文字模式提供檔案物件,read_csv() 會傳回垃圾資料
- ARROW-5028 - [Python][C++] 建立 list
使用 pyarrow.array 可能會溢位子建構器 - ARROW-5085 - [Python/C++] 使用 RowGroups 時,在 parquet 寫入中,字典編碼的 null 欄位的轉換失敗
- ARROW-5086 - [Python] ParquetFile.read_row_group() 中的記憶體洩漏
- ARROW-5089 - [C++/Python] 使用區塊大小時,將字典編碼的欄位寫入 parquet 非常慢
- ARROW-5125 - [Python] 無法透過 pyarrow 往返極端日期
- ARROW-5220 - [Python] Table.from_pandas 中指定 schema 中的 index/未知欄位
- ARROW-5292 - [C++] 在 AppVeyor 上建置靜態程式庫
- ARROW-5300 - [C++] 使用選項 -DARROW_NO_DEFAULT_MEMORY_POOL 時,0.13 無法建置
- ARROW-5374 - [Python] 在完整的 IPC 串流上呼叫 pyarrow.read_record_batch 時,誤導性的錯誤訊息
- ARROW-5414 - [C++] 在 Windows 上,使用 “Ninja” 建置系統產生器會覆寫預設的 Release 建置類型
- ARROW-5450 - [Python] TimestampArray.to_pylist() 失敗,並顯示 OverflowError: Python int too large to convert to C long
- ARROW-5471 - [C++][Gandiva] 在 Gandiva projector 中忽略陣列偏移量
- ARROW-5522 - [Packaging][Documentation] python/manylinux1/build_arrow.sh 中的註解已過時
- ARROW-5525 - [C++][CI] 啟用持續模糊測試
- ARROW-5560 - [C++][Plasma] 在 OutOfMemory 錯誤後無法建立 Plasma 物件
- ARROW-5562 - [C++][Parquet] parquet writer 無法正確處理負零
- ARROW-5630 - [Python][Parquet] 巢狀陣列的 Table 無法往返
- ARROW-5638 - [C++] 當啟用 Gandiva JNI 綁定時,cmake 無法產生 Xcode 專案
- ARROW-5651 - [Python] 當指定其他類型時,從跨步 Numpy 陣列進行不正確的轉換
- ARROW-5682 - [Python] from_pandas 轉換將值不一致地轉換為字串
- ARROW-5731 - [CI] Turbodbc 整合測試失敗
- ARROW-5753 - [Rust] 修正 CI 程式碼涵蓋率中的測試失敗
- ARROW-5772 - [GLib][Plasma][CUDA] Plasma::Client#refer_object 測試失敗
- ARROW-5775 - [C++] StructArray:快取的 boxed 欄位不是執行緒安全的
- ARROW-5776 - [Gandiva][Crossbow] 還原範本以包含提交 ID。
- ARROW-5790 - [Python] 將零維 numpy 陣列傳遞至 pa.array 會導致區段錯誤
- ARROW-5817 - [Python] 為 Flight 測試使用 pytest 標記,以避免由於匯入失敗而靜默跳過單元測試
- ARROW-5823 - [Rust] CI 腳本遺失 –all-targets cargo 引數
- ARROW-5824 - [Gandiva] [C++] 修正 decimal null
- ARROW-5836 - [Java][OSX] Flight 測試失敗:位址已被使用
- ARROW-5838 - [C++][Flight][OSX] 建置第三方 grpc 無法找到 OpenSSL
- ARROW-5848 - [C++] 1.0.0 版本後的 SO 版本控制 schema
- ARROW-5849 - [C++] mingw-w64 上的編譯器警告
- ARROW-5851 - [C++] 參考基準測試的編譯失敗
- ARROW-5856 - [Python] 自 0.14.0 以來,將第三方 cython 模組連結到 pyarrow 失敗
- ARROW-5860 - [Java] [Vector] 修正 decimal byte setter
- ARROW-5863 - [Python] 透過 pytest-runner 發生區段錯誤
- ARROW-5868 - [Python] manylinux2010 wheel 具有 liblz4 的共享程式庫依賴項
- ARROW-5870 - [C++] 開發編譯指示需要包含 “make”
- ARROW-5873 - [Python] 將 schema 與 None 比較時發生區段錯誤
- ARROW-5874 - [Python] pyarrow 0.14.0 macOS wheel 依賴 /usr/local/opt 下的共享程式庫
- ARROW-5878 - [Python][C++] Parquet 讀取器對於沒有時區的時間戳記不向前相容
- ARROW-5884 - [Java] 修正 StructVector 的 get 方法
- ARROW-5886 - [Python][Packaging] Manylinux1/2010 與 libz 的相容性問題
- ARROW-5887 - [C#] ArrowStreamWriter 以錯誤的順序寫入 FieldNodes
- ARROW-5889 - [Python][C++] Parquet 向後相容性對於沒有時區的時間戳記已損壞
- ARROW-5894 - [C++] libgandiva.so.14 正在匯出 libstdc++ 符號
- ARROW-5899 - [Python][Packaging] 在 windows wheel 中捆綁 uriparser.dll
- ARROW-5910 - [Python] read_tensor() 在不可搜尋的串流上失敗
- ARROW-5921 - [C++][Fuzzing] IPC 中遺失 nullptr 檢查
- ARROW-5923 - [C++] 修正 int96 註解
- ARROW-5925 - [Gandiva][C++] 將 decimal 轉換為 int 應四捨五入
- ARROW-5930 - [FlightRPC] [Python] Flight CI 測試失敗
- ARROW-5935 - [C++] 不穩固地支援具有可變類型的 ArrayBuilders
- ARROW-5946 - [Rust] [DataFusion] 具有產生不正確結果的聚合的投影下推
- ARROW-5952 - [Python] 以 category 作為 pandas dataframe 讀取空表格時發生區段錯誤
- ARROW-5959 - [C++][CI] Fuzzit 不知道分支 + 提交雜湊
- ARROW-5960 - [C++] Boost 依賴項以錯誤的順序指定
- ARROW-5963 - [R] R Appveyor 工作未測試 C++ 程式庫中的變更
- ARROW-5964 - [C++][Gandiva] 將 double 轉換為 decimal 並進行四捨五入會傳回 0
- ARROW-5966 - [Python] 將大型 UTF32 numpy 陣列轉換為 arrow 陣列時發生容量錯誤
- ARROW-5968 - [Java] 移除 JDBC adapter 中重複的 Preconditions 檢查
- ARROW-5969 - [CI] [R] Lint 失敗
- ARROW-5973 - [Java] 當底層資料為 null 時,可變寬度向量的 get 方法應傳回 null
- ARROW-5978 - [FlightRPC] [Java] 整合測試用戶端未關閉緩衝區
- ARROW-5989 - [C++][Python] pyarrow.lib.ArrowIOError:使用 openjdk-8 時無法載入 libjvm
- ARROW-5990 - [Python] RowGroupMetaData.column 遺失邊界檢查
- ARROW-5992 - [C++] Array::View 對於 string/utf8 作為 binary 失敗
- ARROW-5996 - [Java] 避免 flight service 中的資源洩漏
- ARROW-5999 - [C++] 當使用 -DARROW_DATASET=OFF 建置時,遺失必要的標頭檔
- ARROW-6002 - [C++][Gandiva] TestCastFunctions 未測試 int64 轉換`
- ARROW-6004 - [C++] CSV 讀取器 ignore_empty_lines 選項不處理空行
- ARROW-6005 - [C++] parquet::arrow::FileReader::GetRecordBatchReader() 自 ARROW-1012 以來行為與文件描述不符
- ARROW-6006 - [C++] 包含字典的空 IPC 串流已損壞
- ARROW-6012 - [C++] 回退到已知的 Apache mirror 以進行 Thrift 下載
- ARROW-6016 - [Python] pyarrow get_library_dirs 斷言錯誤
- ARROW-6029 - [R] 改善 R 文件,說明如何修正程式庫版本不符的問題
- ARROW-6032 - [C++] CountSetBits 不確保 64 位元對齊的存取
- ARROW-6038 - [Python] 如果任何批次為空,pyarrow.Table.from_batches 會產生損壞的表格
- ARROW-6040 - [Java] 即使為空,IPC 串流中也需要字典條目
- ARROW-6046 - [C++] 使用偏移量 0 切割 String 陣列的 RecordBatch 會傳回整個批次
- ARROW-6047 - [Rust] Rust nightly 1.38.0 建置失敗
- ARROW-6050 - [Java] 更新過時的 java/flight/README.md
- ARROW-6054 - pyarrow.serialize 應尊重 numpy 結構化 dtype 的值
- ARROW-6058 - [Python][Parquet] 從 S3 使用 s3fs 讀取 Parquet 檔案時失敗
- ARROW-6060 - [Python] 使用 use_threads=True 的 pyarrow.parquet.read_table 記憶體成本過高
- ARROW-6061 - [C++] 無法在沒有 rapidjson 的情況下建置 libarrow
- ARROW-6066 - [網站] 修正部落格文章作者標頭
- ARROW-6067 - [Python] 大型記憶體測試失敗
- ARROW-6068 - [Python] Hypothesis 測試失敗,新增接受欄位向量的 StructType::Make
- ARROW-6073 - [C++] Decimal128Builder 未在 Finish() 中重設
- ARROW-6082 - [Python] 使用非整數索引類型建立 pa.dictionary() 類型會崩潰
- ARROW-6092 - [C++] Python 2.7:arrow_python_test 失敗
- ARROW-6095 - [C++] Python 子專案忽略 ARROW_TEST_LINKAGE
- ARROW-6108 - [C++] Appveyor Build_Debug 組態在 C++ 單元測試中掛起
- ARROW-6116 - [C++][Gandiva] 修正 TimedTestFilterAdd2 中的錯誤
- ARROW-6117 - [Java] 修正 FixedSizeBinaryVector 的 set 方法
- ARROW-6120 - [C++][Gandiva] 包含某些標頭會導致 decimal_test 失敗
- ARROW-6126 - [C++] IPC 串流讀取器對空串流的處理可能不穩固
- ARROW-6132 - [Python] ListArray.from_arrays 未檢查輸入陣列的有效性
- ARROW-6135 - [C++] KeyValueMetadata::Equals 不應區分順序
- ARROW-6136 - [FlightRPC][Java] 不要重複關閉回應串流
- ARROW-6145 - [Java] MinorType#getNewVector 建立的 UnionVector 無法正確保留欄位類型資訊
- ARROW-6148 - [C++][Packaging] 改善 aarch64 支援
- ARROW-6152 - [C++][Parquet] 將 arrow::Array 直接寫入 parquet::TypedColumnWriter
- ARROW-6153 - [R] 解決 parquet 棄用警告
- ARROW-6158 - [Python] 可能建立 StructArray,其類型與子陣列的類型衝突
- ARROW-6159 - [C++] arrow::Schema 的 PrettyPrint 遺失第一行的縮排
- ARROW-6160 - [Java] AbstractStructVector#getPrimitiveVectors 無法與複雜的子向量一起運作
- ARROW-6166 - [Go] slice 的 slice 導致索引超出範圍 panic
- ARROW-6167 - [R] CRAN 上的 macOS 二進制 R 套件沒有 arrow_available
- ARROW-6170 - [R] “docker-compose build r” 很慢
- ARROW-6171 - [R] “docker-compose run r” 失敗
- ARROW-6174 - [C++] 驗證 ChunkedArray::Validate 中的區塊
- ARROW-6175 - [Java] 修正 MapVector#getMinorType 並擴充 AbstractContainerVector addOrGet 複雜向量 API
- ARROW-6178 - [開發者] 在多作者 PR 中,不要因為錯誤的主要作者輸入而在合併腳本中失敗
- ARROW-6182 - [R] 在 README 中新增關於 r-arrow conda 安裝的注意事項
- ARROW-6186 - [Packaging][C++] ubuntu-xenial libplasma-dev debian 套件未包含 Plasma 標頭
- ARROW-6190 - [C++] 無論 NDEBUG 為何,定義並宣告函式
- ARROW-6193 - [GLib] 在測試中新增遺失的 require
- ARROW-6200 - [Java] BaseRepeatedValueVector/ListVector 中的 getBufferSizeFor 方法不正確
- ARROW-6202 - [Java] 執行緒 “main” 中發生 org.apache.arrow.memory.OutOfMemoryException: 因記憶體限制,無法配置大小為 4 的緩衝區。目前已配置:2147483646
- ARROW-6205 - [C++] 從 CUDA (.cu) 原始碼包含 io/interfaces.h 時,出現 ARROW_DEPRECATED 警告
- ARROW-6208 - [Java] 在 ByteFunctionHelpers 中比較前,修正位元組順序
- ARROW-6210 - [Java] 從 ValueVector 移除 equals API
- ARROW-6211 - [Java] 從 ValueVector 介面移除對 RangeEqualsVisitor 的依賴
- ARROW-6214 - [R] 透過 R 綁定觸發 Sanitizer 錯誤
- ARROW-6215 - [Java] RangeEqualVisitor 無法正確比較 ZeroVector
- ARROW-6218 - [Java] 在整合中新增 UINT 型別測試,以避免潛在的溢位
- ARROW-6223 - [C++] 使用 Anaconda Python 3.7.4 時發生配置錯誤
- ARROW-6224 - [Python] 剩餘使用 ‘data’ 屬性 (來自先前的 Column) 導致警告
- ARROW-6227 - [Python] pyarrow.array() 不應將 np.nan 強制轉換為字串
- ARROW-6234 - [Java] ListVector hashCode() 不正確
- ARROW-6241 - [Java] master 上發生失敗
- ARROW-6259 - [C++][CI] macOS 上 CI 中發生與 Flatbuffers 相關的失敗
- ARROW-6263 - [Python] RecordBatch.from_arrays 不會根據傳遞的 schema 檢查陣列型別
- ARROW-6266 - [Java] 解決 RangeEqualsVisitor 中不明確的方法重載
- ARROW-6268 - 空緩衝區應具有有效的位址
- ARROW-6269 - [C++][Fuzzing] IPC 讀取未檢查十進位精度
- ARROW-6270 - [C++][Fuzzing] IPC 讀取未檢查緩衝區索引
- ARROW-6290 - [Rust] [DataFusion] 執行 sql_csv 範例時發生錯誤
- ARROW-6291 - [C++] CMake 忽略 ARROW_PARQUET
- ARROW-6301 - [Python] atexit: pyarrow.lib.ArrowKeyError: ‘找不到名稱為 arrow.py_extension_type 的型別擴充功能’
- ARROW-6302 - [Python][Parquet] 讀取具有序列化 Arrow schema 的字典型別時,不會還原 “ordered” 型別屬性
- ARROW-6309 - [C++] Parquet 測試和可執行檔為靜態連結
- ARROW-6323 - [R] 傳遞給讀取器時,展開檔案路徑
- ARROW-6325 - [Python] 具有布林值的 DataFrame 轉換錯誤
- ARROW-6330 - [C++] 在 api.h 中包含遺失的標頭檔
- ARROW-6332 - [Java][C++][Gandiva] 正確處理 varchar 向量的大小
- ARROW-6339 - [Python][C++] pd.NaT 陣列的 Rowgroup 統計資訊定義不明確
- ARROW-6343 - [Java] [Vector] 修正配置 helper
- ARROW-6344 - [C++][Gandiva] substring 無法處理多位元組字元
- ARROW-6345 - [C++][Python] 比較 DictionaryType 值的相等性時,似乎未將 “ordered” 旗標納入考量
- ARROW-6348 - [R] 套件未載入時,arrow::read_csv_arrow 命名空間錯誤
- ARROW-6354 - [C++] 建置時未包含 Parquet 失敗
- ARROW-6363 - [R] 使用非預期的 schema 時,Table__from_dots 中發生區段錯誤
- ARROW-6364 - [R] 處理 time64() 等的非預期輸入
- ARROW-6369 - [Python] 在 Array.to_pandas 轉換中支援布林值列表
- ARROW-6371 - [Doc] 列到欄轉換範例在註解中提及 arrow::Column
- ARROW-6372 - [Rust][Datafusion] 不支援從 Un-signed 整數轉換為 Signed 整數
- ARROW-6376 - [Developer] PR 合併腳本具有硬編碼的 “master” 目標參考
- ARROW-6387 - [Archery] make 發生錯誤
- ARROW-6392 - [Python][Flight] list_actions Server RPC 未在 test_flight.py 中測試,也未驗證傳回值
- ARROW-6406 - [C++] jemalloc_ep 離線建置失敗
- ARROW-6411 - [C++][Parquet] DictEncoderImpl
::PutIndicesTyped 在某些系統上效能不佳 - ARROW-6412 - [C++] arrow-flight-test 可能因埠配置而崩潰
- ARROW-6418 - [C++] Plasma cmake 目標未匯出
- ARROW-6423 - [Python] pyarrow.CompressedOutputStream() 使用 compression=’snappy’ 時永遠不會完成
- ARROW-6424 - [C++][Fuzzing] Fuzzit nightly 已損壞
- ARROW-6428 - [CI][Crossbow] Nightly turbodbc 工作失敗
- ARROW-6431 - [Python] 未安裝 pandas 時,測試套件失敗
- ARROW-6432 - [CI][Crossbow] 移除 alpine crossbow 工作
- ARROW-6433 - [CI][Crossbow] Nightly java docker 工作失敗
- ARROW-6434 - [CI][Crossbow] Nightly HDFS 整合工作失敗
- ARROW-6435 - [CI][Crossbow] Nightly dask 整合工作失敗
- ARROW-6440 - [CI][Crossbow] Nightly ubuntu、debian 和 centos 套件建置失敗
- ARROW-6441 - [CI][Crossbow] Nightly Centos 6 工作失敗
- ARROW-6443 - [CI][Crossbow] Nightly conda osx 建置失敗
- ARROW-6445 - [CI][Crossbow] Nightly Gandiva jar trusty 工作失敗
- ARROW-6446 - [OSX][Python][Wheel] 在 wheel 建置腳本中關閉 ORC 功能
- ARROW-6449 - [R] io “tell()” 方法命名不一致且未經測試
- ARROW-6457 - [C++] 使用 MSVC 2015 建置產生器在本機進行 CMake 建置失敗
- ARROW-6461 - [Java] EchoServer 可能在用戶端完成讀取之前關閉 socket
- ARROW-6472 - [Java] ValueVector#accept 可能有潛在的型別轉換例外
- ARROW-6476 - [Java][CI] Travis java all-jdks 工作已損壞
- ARROW-6478 - [C++] 回退至 jemalloc stable-4 分支,直到解決 5.2.x 中的效能問題
- ARROW-6481 - [Python][C++] 使用 column_types 時,read_csv() 效能不佳
- ARROW-6488 - [Python] pyarrow.NULL 等於自身
- ARROW-6492 - [Python] 使用最新 fastparquet 寫入的檔案無法使用最新 pyarrow 讀取
- ARROW-6502 - [GLib][CI] CI 中發生 MinGW 失敗
- ARROW-6506 - [C++] 驗證具有巢狀型別的 ExtensionType 失敗
- ARROW-6509 - [C++][Gandiva] 重新啟用 Gandiva JNI 測試並修正 Travis CI 失敗
- ARROW-6520 - [Python] 寫入具有固定大小二進位欄位的表格時發生區段錯誤
- ARROW-6522 - [Python] 使用 pandas 0.23.4、pytest 3.8.1 時,測試套件失敗
- ARROW-6530 - [CI][Crossbow][R] Nightly R 工作未安裝所有依賴項
- ARROW-6550 - [C++] 篩選運算式 PR 導致 manylinux 套件建置失敗
- ARROW-6552 - [C++] STL 測試中的 boost::optional 在 gcc 4.8.2 中編譯失敗
- ARROW-6560 - [Python] *-nopandas 整合測試中發生失敗
- ARROW-6561 - [Python] pandas-master 整合測試失敗
- ARROW-6562 - [GLib] 修正 GArrowBuffer 錯誤的切片資料
- ARROW-6564 - [Python] 呼叫 Array.__array__ 時,不需要 pandas
- ARROW-6565 - [Rust] [DataFusion] 因暫存目錄已存在而發生的間歇性測試失敗
- ARROW-6568 - [C++][Python][Parquet] 寫入零區塊字典型別欄位時,pyarrow.parquet 崩潰
- ARROW-6572 - [C++] 讀取某些 Parquet 資料可能會傳回未初始化的記憶體
- ARROW-6573 - [Python] 寫入 parquet 時發生區段錯誤
- ARROW-6576 - [R] 修正 sparklyr 整合測試
- ARROW-6597 - [Python] 在 Python 2.7 中使用 test_pandas 時發生區段錯誤
- ARROW-6618 - [Python] 讀取零大小緩衝區時可能會發生區段錯誤
- ARROW-6622 - [C++][R] Windows 上 SubTreeFileSystem 路徑錯誤
- ARROW-6623 - [CI][Python] Dask docker 整合測試可能因與統計資訊相關的變更而損壞
- ARROW-6639 - [Packaging][RPM] 新增對 aarch64 上 CentOS 7 的支援
- ARROW-6640 - [C++] BufferedInputStream Peek 超過緩衝位元組時發生錯誤
- ARROW-6642 - [Python] 鏈式存取 ParquetDataset 的 metadata 會導致區段錯誤
- ARROW-6651 - [R] 修正 R conda 工作
- ARROW-6652 - [Python] to_pandas 轉換從型別中移除時區
- ARROW-6660 - [Rust] [DataFusion] 0.15.0 版本的小型文件更新
- ARROW-6670 - [CI][R] 修正 R nightly 工作的修正
- ARROW-6674 - [Python] 修正或忽略測試警告
- ARROW-6677 - [FlightRPC][C++] 記錄在 C++ 中使用 Flight
- ARROW-6678 - [C++] ARROW-3246 引入的 Parquet 檔案相容性回歸
- ARROW-6679 - [RELEASE] LICENSE.txt 中的 autobrew 授權不可接受
- ARROW-6682 - [C#] Arrow R/C++ 在讀取 C# 產生的二進位檔案時掛起
- ARROW-6687 - [Rust] [DataFusion] 查詢傳回不正確的列數
- ARROW-6701 - [C++][R] Lint 在 R cpp 程式碼上失敗
- ARROW-6703 - [Packaging][Linux] 還原 ARROW_VERSION 環境變數
- ARROW-6705 - [Rust] [DataFusion] README 具有無效的 github URL
- ARROW-6709 - [JAVA] 當值為 null 時,Jdbc adapter currentIndex 應遞增
- ARROW-6714 - [R] 修正未經測試的 RecordBatchWriter 案例
- ARROW-6716 - [CI] [Rust] 新的 1.40.0 nightly 導致建置失敗
- ARROW-6751 - [CI] ccache 無法在 Travis-CI 上快取
- ARROW-6760 - [C++] JSON: 當欄位變更型別時,改善錯誤訊息
- ARROW-6762 - [C++] JSON 讀取器在換行符號時發生區段錯誤
- ARROW-6773 - [C++] 使用 Array 切片進行篩選時,篩選核心傳回無效資料