Apache Arrow 0.15.1 (2019年11月1日)
這是一個主要版本發布,包含超過 1 個月的開發成果。
下載
貢獻者
此版本包含來自 13 位不同貢獻者的 41 次提交。
$ git shortlog -sn apache-arrow-0.15.0..apache-arrow-0.15.1
10 Wes McKinney
10 Antoine Pitrou
7 Krisztián Szűcs
2 tianchen92
2 Joris Van den Bossche
2 Sutou Kouhei
2 Anthony Abate
1 Uwe L. Korn
1 Prudhvi Porandla
1 Yuqi Gu
1 ptaylor
1 Rick Cobb
1 tianchen
修補程式提交者
以下 Apache 提交者合併了貢獻的修補程式到儲存庫。
$ git shortlog -csn apache-arrow-0.15.0..apache-arrow-0.15.1
41 Krisztián Szűcs
變更日誌
新功能與改進
- ARROW-6610 - [C++] 新增 ARROW_FILESYSTEM=ON/OFF CMake 配置標記
- ARROW-6661 - [Java] 實作類似 slice 的 API 以增強 VectorSchemaRoot
- ARROW-6777 - [GLib][CI] 取消釘選 gobject-introspection gem
- ARROW-6852 - [C++] memory-benchmark 建置在 Arm64 上失敗
- ARROW-6927 - [C++] 新增 gRPC 版本檢查
- ARROW-6963 - [封裝][Wheel][OSX] 使用 crossbow 的命令從 travis 建置部署產物
錯誤修正
- ARROW-6464 - [Java] 使用 slice API 重構 FixedSizeListVector#splitAndTransfer
- ARROW-6728 - [C#] 支援讀取和寫入 Date32 和 Date64 陣列
- ARROW-6740 - [Python] 無法在 Windows 上刪除已關閉的 MemoryMappedFile
- ARROW-6762 - [C++] JSON 讀取器在換行時發生區段錯誤
- ARROW-6795 - [C#] 在 C# 中讀取大型 Arrow 檔案導致例外
- ARROW-6806 - [C++] 還原序列化包含 null/空列表的 ListArray 時發生區段錯誤
- ARROW-6809 - [RUBY] 由於 glib2 3.3.7 編譯失敗,Gem 無法在 macOS 上安裝
- ARROW-6813 - [Ruby] 在 Arrow 0.15 中,使用 headers=true 的 Arrow::Table.load 導致例外
- ARROW-6834 - [C++] 將 gtest 釘選到 1.8.1 以分類失敗的 Appveyor / MSVC 建置
- ARROW-6844 - [C++][Parquet][Python] List 欄位在 0.15.0 版本中讀取損壞
columns read broken with 0.15.0 - ARROW-6857 - [Python][C++] 在空的 chunked_array 上進行 dictionary_encode 時發生區段錯誤 (邊緣案例)
- ARROW-6860 - [Python] 僅將 libarrow_flight.so 連結到 pyarrow._flight
- ARROW-6861 - [Python] arrow-0.15.0 讀取 arrow-0.14.1 輸出的 Parquet dictionary 欄位:讀取欄位失敗:IOError: Arrow error: Invalid: Resize cannot downsize
- ARROW-6869 - [C++] builder_dict.h 中的 Dictionary “delta” 建構邏輯產生無效的陣列
- ARROW-6873 - [Python] 過時的 CColumn 參考中斷 Cython cimport pyarrow
- ARROW-6874 - [Python] 當轉換為 object dtype 時,Table.to_pandas() 中存在記憶體洩漏
- ARROW-6876 - [Python] 對於 0.15.0 版本,讀取具有多個欄位的 parquet 檔案變得緩慢
- ARROW-6877 - [C++] 無法從正確的環境找到 Boost
- ARROW-6878 - [Python] 在 python3 下,pa.array() 無法正確處理具有 bytes 鍵的 dict 列表
- ARROW-6882 - [Python] 無法從 dictionary_encoding 結果建立 chunked_array
- ARROW-6886 - [C++] arrow::io header nvcc 編譯器警告
- ARROW-6898 - [Java] 修正 ArrowWriter 和幾個測試類別中潛在的記憶體洩漏
- ARROW-6903 - [Python] 在 ARROW-6860 變更後,Wheel 損壞
- ARROW-6905 - [封裝][OSX] MacOS 上的每晚建置因 brew 編譯超時而失敗
- ARROW-6910 - [Python] pyarrow.parquet.read_table(…) 佔用大量記憶體,直到程式結束才釋放
- ARROW-6922 - [Python] Pandas master 建置失敗 (MultiIndex.levels 變更)
- ARROW-6937 - [封裝][Python] 修正 conda linux 和 OSX wheel 每晚建置
- ARROW-6938 - [Python] Windows wheel 依賴未捆綁的 zstd.dll 和 libbz2.dll
- ARROW-6962 - [C++] [CI] 停止使用 -Weverything 編譯
- ARROW-6977 - [C++] 僅在支援該功能時啟用 jemalloc background_thread
- ARROW-6983 - [C++] 線程任務組有時崩潰