Apache Arrow 0.4.0 (2017年5月22日)
在發佈部落格文章中閱讀更多
下載
變更日誌
貢獻者
$ git shortlog -sn apache-arrow-0.3.0..apache-arrow-0.4.0
28 Wes McKinney
18 Kouhei Sutou
9 Uwe L. Korn
3 Brian Hulette
3 Emilio Lahr-Vivaz
3 Philipp Moritz
3 Phillip Cloud
2 Julien Le Dem
1 Bryan Cutler
1 Jeff Reback
1 Max Risuhin
1 Wenchen Fan
1 bgosztonyi
新功能與改進
- ARROW-1000 - [GLib] 將安裝文件移至網站
- ARROW-1001 - [GLib] 統一 writer 檔案
- ARROW-1002 - [C++] 在 FileWriter 實作中,魔法標頭後不需要添加填充
- ARROW-1008 - [C++] 定義串流迭代的抽象介面
- ARROW-1010 - [網站] 在 /blog/ 中僅顯示英文文章
- ARROW-1011 - [Format] 闡明 validity bitmaps 中 buffer 填充的要求
- ARROW-1015 - [Java] 實作 schema 層級的 metadata
- ARROW-1016 - Python: 在 wheels 中包含 C++ 標頭 (可選)
- ARROW-1022 - [Python] 在 Feather read 方法中新增 nthreads 選項
- ARROW-1024 - Python: 將建置時間 numpy 版本更新至 1.10.1
- ARROW-1025 - [網站] 改善網站上的變更日誌
- ARROW-1027 - [Python] 允許在 pyarrow Table 和 Schema 物件的 fields/columns 中使用負索引
- ARROW-1028 - [Python] ARROW-1008 之後的文件更新
- ARROW-1029 - [Python] 修復 Windows 上 –with-parquet 建置,將單元測試新增至 Appveyor
- ARROW-1030 - Python: 在 parquet-cpp 中考量程式庫版本控制
- ARROW-1031 - [GLib] 支援 pretty print
- ARROW-1037 - [GLib] 跟隨 reader 名稱變更
- ARROW-1038 - [GLib] 跟隨 writer 名稱變更
- ARROW-1040 - [GLib] 跟隨 tensor IO
- ARROW-1044 - [GLib] 支援 Feather
- ARROW-182 - [C++] 移除 Array::Validate 虛擬函式並建立獨立方法
- ARROW-29 - C++: 新增 re2 作為可選的第三方工具鏈依賴項
- ARROW-446 - [Python] 在 Sphinx 中記錄 NativeFile 介面、HDFS client
- ARROW-482 - [Java] 在 IPC 設定中提供對 “custom_metadata” Field 屬性的 API 存取
- ARROW-532 - [Python] 擴展 pyarrow.parquet 文件以用於 0.3 版本
- ARROW-629 - [JS] 新增單元測試套件
- ARROW-714 - [C++] 以 NumPy 風格為第三方 C++ 使用者新增 import_pyarrow C API
- ARROW-819 - [Python] 定義 public Cython API
- ARROW-872 - [JS] 讀取串流格式
- ARROW-873 - [JS] 實作固定寬度列表類型
- ARROW-874 - [JS] 讀取字典編碼向量
- ARROW-899 - [文件] 為 0.3.0 新增變更日誌
- ARROW-901 - [Python] 將 FixedSizeBinary 寫入 Parquet
- ARROW-923 - [文件] 使用 JIRA 連結為網站產生變更日誌
- ARROW-929 - 將 KEYS 檔案移至 SVN,從 git 移除
- ARROW-943 - [GLib] 支援使用原始碼封存執行單元測試
- ARROW-945 - [GLib] 新增 Lua 範例以展示 Torch 整合
- ARROW-946 - [GLib] 對於建構子名稱使用 “new” 而非 “open”
- ARROW-947 - [Python] 改善 manylinux1 建置的執行時間
- ARROW-953 - 在 CI 建置中使用來自 conda-forge 的 cmake / curl
- ARROW-954 - 使 Arrow 可以使用僅標頭 boost 編譯
- ARROW-956 - 移除 pandas pre-0.20.0 相容性
- ARROW-957 - [文件] 將 HDFS 和 Windows 文件新增至 doxygen 輸出
- ARROW-961 - [Python] 將 InMemoryOutputStream 重新命名為 BufferOutputStream
- ARROW-963 - [GLib] 新增 equal
- ARROW-967 - [GLib] 支援使用 buffer 初始化 array
- ARROW-970 - [Python] 意外呼叫 pyarrow.Table() 不應導致程序崩潰
- ARROW-977 - [java] 新增時區感知時間戳記向量
- ARROW-984 - [GLib] 新增 Go 範例
- ARROW-985 - [GLib] 更新套件資訊
- ARROW-988 - [JS] 將條目新增至 Travis CI 矩陣
- ARROW-993 - [GLib] 在 Go 範例中新增遺失的錯誤檢查
- ARROW-996 - [網站] 以日文新增 0.3 版本公告
- ARROW-997 - [Java] 在 FixedSizeListVector 中實作 transfer
錯誤修正
- ARROW-1003 - [C++] 為 Windows 使用 MSVC 建置時,Hdfs 和 java dlls 無法載入
- ARROW-1004 - ArrowInvalid: Invalid: float 類型的 Python 物件不是 None,也不是字串、布林值或日期物件
- ARROW-1017 - Python: Table.to_pandas 洩漏記憶體
- ARROW-1023 - Python: 修復 macOS 的 arrow-cpp 捆綁
- ARROW-1033 - [Python] pytest 發現 scripts/test_leak.py
- ARROW-1046 - [Python] 使 DataFrame metadata 符合 pandas 規範
- ARROW-1053 - [Python] RecordBatchFileReader 的記憶體洩漏
- ARROW-1054 - [Python] 測試套件在 pandas 0.19.2 上失敗
- ARROW-813 - [Python] setup.py sdist 也必須捆綁相依的 cmake 模組
- ARROW-824 - Date 和 Time Vectors 應反映無時區語意
- ARROW-856 - CmakeError by Unknown compiler.
- ARROW-881 - [Python] 使用 custom_metadata 重建 Pandas DataFrame 索引
- ARROW-909 - libjemalloc.so.2: 無法開啟共享物件檔案
- ARROW-939 - 修復零維 Tensor 的除以零錯誤
- ARROW-940 - [JS] 產生多組產出
- ARROW-944 - Python: Compat broken for pandas==0.18.1
- ARROW-948 - [GLib] 更新 C++ 標頭檔案列表
- ARROW-952 - macOS 上使用 clang-802.0.42 編譯錯誤
- ARROW-958 - [Python] Conda 建置指南仍然需要 ARROW_HOME, PARQUET_HOME
- ARROW-991 - [Python] PyArray_SimpleNew 不應與 NPY_DATETIME 一起使用
- ARROW-995 - [網站] 0.3 版本公告的參考中有錯字
- ARROW-998 - [文件] 檔案格式文件不正確的 schema 位置