Apache Arrow 0.4.1 (2017 年 6 月 9 日)
本次發佈主要為錯誤修正版本,但也包含一些封裝和文件方面的改進。
請在發佈版本部落格文章中閱讀更多資訊。
下載
變更日誌
新功能與改進
- ARROW-1020 - [格式] 在 Schema.fbs 中新增額外語言以釐清 naive 與 localized Timestamp 值
- ARROW-1034 - [Python] 在 Windows / MSVC 上啟用二進制 wheel 的建立
- ARROW-1049 - [java] vector 範本清理
- ARROW-1060 - [Python] 為 ARROW-1053 新增單元測試
- ARROW-1063 - [網站] 0.4.0 版本發佈的部落格文章和網站更新
- ARROW-1068 - [Python] 建立外部 repo 並配置 appveyor.yml 以建置 Python wheel 安裝程式
- ARROW-1069 - 新增發佈 maven artifacts 的說明
- ARROW-1078 - [Python] 考量 PARQUET-967
- ARROW-1080 - C++: 新增關於轉換為/自 row-wise 表示法的教學
- ARROW-1082 - [GLib] 在 macOS 上新增 CI
- ARROW-1084 - BufferAllocator 的實作應處理 Netty 的 OutOfDirectMemoryError
- ARROW-897 - [GLib] 在 Travis CI 建置矩陣中將 arrow-glib 作為獨立建置
- ARROW-986 - [格式] 更新 IPC.md 以考量 dictionary batches
- ARROW-990 - [JS] 新增 tslint 支援以進行 TypeScript 的 linting
錯誤修正
- ARROW-1039 - Python: pyarrow.Filesystem.read_parquet 在 nthreads>1 時導致錯誤
- ARROW-1050 - [C++] 導出 arrow::ValidateArray
- ARROW-1051 - [Python] 如果 pyarrow.parquet 因共享函式庫 ABI 衝突而導入失敗,test_parquet.py 測試會靜默地不執行
- ARROW-1056 - [Python] Parquet+HDFS 測試因寫入 pandas index 而失敗
- ARROW-1057 - 修復 cmake 警告和 msvc debug asserts
- ARROW-1062 - [GLib] 範例使用舊 API
- ARROW-1066 - 移除 pandas >= 0.20.1 的 feather 警告
- ARROW-1070 - [C++] date/time 類型的 Feather 檔案應使用 physical types 寫入
- ARROW-1075 - [GLib] 在 macOS 上建置錯誤
- ARROW-1085 - [java] 跟進範本清理。IntervalYear 缺少方法
- ARROW-1086 - [Python] pypi 上的 pyarrow 0.4.0 缺少 pxd 檔案
- ARROW-1088 - [Python] 當系統不支援 unicode 檔名時,test_unicode_filename 測試失敗
- ARROW-1090 - [Python] build_ext 可用性
- ARROW-1091 - Decimal scale 和 precision 被翻轉
- ARROW-1092 - 更多 Decimal 和 scale 翻轉的後續處理
- ARROW-1094 - [C++] arrow::io::ReadableFile 中不完整的 buffer reads 應精確地截斷返回的 buffer
- ARROW-424 - [C++] arrow/io/hdfs.h 中的執行緒安全性
貢獻者
$ git shortlog -sn apache-arrow-0.4.0..apache-arrow-0.4.1
16 Wes McKinney
5 Julien Le Dem
4 Kouhei Sutou
2 Jacob Scott
1 Brian Hulette
1 Jeff Knupp
1 Jeff Reback
1 Max Risuhin
1 Phillip Cloud
1 Tony Kelman
1 Uwe L. Korn
1 adeneche
1 kimanjun
1 rip.nsk