Apache Arrow 0.10.0 (2018 年 8 月 6 日)
這是一個主要發行版本。
下載
貢獻者
$ git shortlog -sn apache-arrow-0.9.0..apache-arrow-0.10.0
70 Antoine Pitrou
49 Kouhei Sutou
40 Korn, Uwe
37 Wes McKinney
32 Krisztián Szűcs
30 Andy Grove
20 Philipp Moritz
13 Phillip Cloud
11 Bryan Cutler
11 yosuke shiro
7 Dimitri Vorona
6 Zhijun Fu
5 Bruce Mitchener
5 Joshua Storck
5 Robert Nishihara
5 ptaylor
4 Maximilian Roos
4 Sebastien Binet
3 Alex
3 Brian Hulette
3 Chao Sun
3 Dominik Moritz
3 Kenji Okimoto
3 Marco Neumann
3 Yuhong Guo
2 Abhi
2 Dhruv Madeka
2 Dmitry Kalinkin
2 Donal Simmie
2 Frank Wessels
2 Julius Neuffer
2 Manabu Ejima
2 Omer Katz
2 Paddy
2 Paddy Horan
2 Robert Gruener
2 Teddy Choi
2 Vanco Buca
2 Venki Korukanti
2 bomeng
2 fjetter
2 liurenjie1024
2 songqing
1 284km
1 Adrian Dorr
1 Albert Shieh
1 Alessandro Andrioni
1 Alok Singh
1 Aneesh Karve
1 Atul Dambalkar
1 Ben Wolfson
1 Brent Kerby
1 Daniel Chalef
1 Daniel Compton
1 Florian Rathgeber
1 Gatis Seja
1 HE, Tao
1 James Lamb
1 Jeff Zhang
1 Juan Paulo Gutierrez
1 Kane
1 Kee Chong Tan
1 Kelsey Jordahl
1 Kendall Willets
1 Li Jin
1 Licht-T
1 Lizhou Gao
1 Louis Potok
1 Markus Klein
1 Matt Topol
1 Matthew Topol
1 Michael Sarahan
1 Paul Taylor
1 Peter Schafhalter
1 Philipp Hoch
1 Renato Marroquin
1 Richard Gowers
1 Robbie Gruener
Patch 提交者
以下 Apache 提交者貢獻了 patch 到此儲存庫。
$ git shortlog -csn apache-arrow-0.9.0..apache-arrow-0.10.0
120 Wes McKinney
119 Korn, Uwe
63 Antoine Pitrou
50 Uwe L. Korn
28 Kouhei Sutou
27 Philipp Moritz
15 Bryan Cutler
15 Phillip Cloud
8 Robert Nishihara
6 Sidd
4 Brian Hulette
2 GitHub
1 Your Name Here
1 ptaylor
更新日誌
新功能與改進
- ARROW-1018 - [C++] 新增從作業系統檔案描述符建立 FileOutputStream、ReadableFile 的選項
- ARROW-1163 - [Plasma][Java] Plasma 的 Java 用戶端
- ARROW-1388 - [Python] 為移除欄位新增 Table.drop 方法
- ARROW-1454 - [Python] 當嘗試將不支援的 Arrow 類型寫入 Parquet 格式時,提供更豐富的錯誤訊息
- ARROW-1715 - [Python] 實作 Column、ChunkedArray、RecordBatch、Table 的序列化 (pickling)
- ARROW-1722 - [C++] 新增 linting 腳本以尋找 C++/CLI 問題
- ARROW-1731 - [Python] 提供在 RecordBatch/Table.from_pandas 中選擇要轉換的欄位子集
- ARROW-1744 - [Plasma] 提供 TensorFlow 運算子以從 plasma 讀取 tensors
- ARROW-1780 - [Java] Apache Arrow 的 JDBC Adapter
- ARROW-1858 - [Python] 新增關於 parquet.write_to_dataset 和相關方法的說明文件
- ARROW-1868 - [Java] 變更 vector getMinorType 以使用 MinorType 而非 Types.MinorType
- ARROW-1886 - [Python] 新增將表格中的 structs "扁平化" 的函式
- ARROW-1913 - [Java] 修正 JDK8 的 Javadoc 產生錯誤
- ARROW-1928 - [C++] 新增基準測試,比較 internal::BitmapReader/Writer 與 naive 方法的效能
- ARROW-1954 - [Python] 為 pyarrow.Field 新增 metadata 存取器
- ARROW-1964 - [Python] 暴露 Builder 類別
- ARROW-2014 - [Python] 在 pyarrow.parquet 中記錄 read_pandas 方法
- ARROW-2055 - [Java] 升級至 Java 8
- ARROW-2060 - [Python] 關於使用 from_arrays 或 dict 序列建立 StructArray 的文件
- ARROW-2061 - [C++] 在 Travis CI 中執行 ASAN builds
- ARROW-2074 - [Python] 允許 struct arrays 的類型推斷
- ARROW-2097 - [Python] 當沒有錯誤時,在 Travis CI builds 中抑制 valgrind stdout/stderr
- ARROW-2100 - [Python] 移除 Python 3.4 支援
- ARROW-2140 - [Python] 從 Numpy float16 array 轉換未實作
- ARROW-2141 - [Python] 從 Numpy object array 轉換為 varsize binary 未實作
- ARROW-2147 - [Python] 類型推斷在 Numpy arrays 列表上無法運作
- ARROW-2207 - [GLib] 支援 decimal 類型
- ARROW-2222 - [C++] 新增驗證 Flatbuffers 訊息的選項
- ARROW-2224 - [C++] 移除 boost regex 的使用
- ARROW-2241 - [Python] 用於在 commit 或 tag 上執行所有當前 ASV 基準測試的簡單腳本
- ARROW-2264 - [Python] 有效率地序列化 dtype 為 unicode 固定長度字串的 numpy arrays
- ARROW-2267 - Rust bindings
- ARROW-2276 - [Python] Tensor 可以實作 buffer protocol
- ARROW-2281 - [Python] 暴露 MakeArray 以從 buffers 建構 arrays
- ARROW-2285 - [Python] 無法轉換 Numpy 字串 arrays
- ARROW-2286 - [Python] 允許 subscripting pyarrow.lib.StructValue
- ARROW-2287 - [Python] chunked array 不可迭代,不可索引
- ARROW-2299 - [Go] Go 語言實作
- ARROW-2301 - [Python] 將原始碼發佈指示新增至套件/發行管理文件
- ARROW-2302 - [GLib] 在相同的 Travis CI build entry 中執行 autotools 和 meson Linux builds
- ARROW-2308 - 序列化 tensor 資料應為 64 位元組對齊。
- ARROW-2315 - [C++/Python] 新增方法以扁平化 struct array
- ARROW-2319 - [C++] 新增實作 OutputStream 介面的 buffered output 類別
- ARROW-2322 - 記錄執行 dev/release/01-perform.sh 的需求
- ARROW-2325 - [Python] 更新 setup.py 以使用 Markdown 專案描述
- ARROW-2330 - [C++] 使用部分可完成的 array builders 優化 delta buffer 建立
- ARROW-2332 - [Python] 提供用於讀取多個 Feather 檔案的 API
- ARROW-2334 - [C++] 將 boost 更新至 1.66.0
- ARROW-2335 - [Go] 將 Go README 向上移動一個目錄
- ARROW-2340 - [網站] 新增關於 Go codebase 捐贈的部落格文章
- ARROW-2341 - [Python] pa.union() mode 參數不直觀
- ARROW-2343 - [Java/Packaging] 在 API 文件 builds 中執行 mvn clean
- ARROW-2344 - [Go] 在 Travis CI 中執行 Go 單元測試
- ARROW-2345 - [Documentation] 修正 bundle exec 並將 sphinx nosidebar 設為 True
- ARROW-2348 - [GLib] 移除 Go 範例
- ARROW-2350 - 縮減 spark_integration Docker 容器的大小
- ARROW-2353 - 測試在 AppVeyor 上建置的 wheel 的正確性
- ARROW-2361 - [Rust] 啟動原生 Rust 實作
- ARROW-2364 - [Plasma] PlasmaClient::Get() 可以接受 object ids 的 vector
- ARROW-2376 - [Rust] Travis 應為 Rust 函式庫執行測試
- ARROW-2378 - [Rust] 使用 rustfmt 格式化原始碼
- ARROW-2381 - [Rust] Buffer
應具有 Iterator - ARROW-2384 - Rust: 使用 Traits 而不是直接定義方法
- ARROW-2385 - [Rust] 為 Field 和 DataType 實作 to_json()
- ARROW-2388 - [C++] Arrow::StringBuilder::Append() 使用 null_bytes 而不是 valid_bytes
- ARROW-2389 - [C++] 新增 StatusCode::OverflowError
- ARROW-2390 - [C++/Python] CheckPyError() 可以檢查例外類型
- ARROW-2395 - [Python] 修正 pyarrow/ 目錄外的 flake8 錯誤
- ARROW-2396 - 統一 Rust Errors
- ARROW-2397 - 記錄 IPC.md 中 Tensor 編碼的變更。
- ARROW-2398 - [Rust] 為類型安全的 Buffer 提供零複製 builder
- ARROW-2400 - [C++] Status 解構子成本高昂
- ARROW-2401 - 支援 Hive 分區 Parquet 檔案上的篩選器
- ARROW-2402 - [C++] FixedSizeBinaryBuilder::Append 缺少 “const char*” 多載
- ARROW-2404 - 修正 ‘type_id’ 的宣告在 msvc build 中隱藏類別成員警告
- ARROW-2407 - [GLib] 新增 garrow_string_array_builder_append_values()
- ARROW-2408 - [Rust] 應該可以從 Builder 取得 &mut[T]
- ARROW-2411 - [C++] 新增方法以將成批的 null 終止字串附加到 StringBuilder
- ARROW-2413 - [Rust] 移除無用的 `format!` 用法
- ARROW-2414 - [Documentation] 修正其他文件排版錯誤
- ARROW-2415 - [Rust] 修正 pattern matching 中使用 references
- ARROW-2416 - [C++] 支援系統 libprotobuf
- ARROW-2417 - [Rust] 檢閱 APIs 的安全性
- ARROW-2422 - [Python] 支援 Hive 分區 Parquet 檔案上更多的篩選運算子
- ARROW-2427 - [C++] ReadAt 實作欠佳
- ARROW-2430 - 基於分支的套件自動化的 MVP
- ARROW-2433 - [Rust] 新增 Builder.push_slice(&[T])
- ARROW-2434 - [Rust] 新增 windows 支援
- ARROW-2435 - [Rust] 新增記憶體池抽象化。
- ARROW-2436 - [Rust] 新增 windows CI
- ARROW-2440 - [Rust] 實作 ListBuilder
- ARROW-2442 - [C++] 消除 Builder::Append 多載的歧義
- ARROW-2445 - [Rust] 新增文件並將某些欄位設為私有
- ARROW-2448 - 當 plasma 用戶端在 buffer 之前超出範圍時發生 Segfault。
- ARROW-2451 - 在自訂 numpy array serializer 中有效率地處理更多 dtypes。
- ARROW-2453 - [Python] 改善 Table 欄位存取
- ARROW-2458 - [Plasma] PlasmaClient 使用全域變數
- ARROW-2463 - [C++] 將 flatbuffers 更新至 1.9.0
- ARROW-2464 - [Python] 使用 python_version marker 而不是條件
- ARROW-2469 - 在 ReadMessage API 中將 out 參數放在最後。
- ARROW-2470 - [C++] FileGetSize() 不應 seek
- ARROW-2472 - [Rust] Schema 和 Fields 類型不應具有公開屬性
- ARROW-2477 - [Rust] 在 CI 中設定程式碼覆蓋率
- ARROW-2478 - [C++] 引入 checked_cast 函式,在 debug 模式中執行 dynamic_cast
- ARROW-2479 - [C++] 擁有全域執行緒池
- ARROW-2480 - [C++] 啟用將 decimal 的值轉換為 int32_t 或 int64_t
- ARROW-2481 - [Rust] 將對 free() 的呼叫移動到 memory.rs 中
- ARROW-2482 - [Rust] 支援巢狀類型
- ARROW-2484 - [C++] 記錄 ABI 相容性檢查
- ARROW-2485 - [C++] 當 run_clang_format.py 報告變更時,輸出 diff
- ARROW-2486 - [C++/Python] 提供包含所有開發相依性的 Docker 映像檔
- ARROW-2488 - [C++] 將 Boost 1.67 列為支援版本
- ARROW-2493 - [Python] 新增對 buffers 和 arrays 進行序列化 (pickling) 的支援
- ARROW-2494 - 從 PlasmaClient::Seal 傳回狀態碼
- ARROW-2498 - [Java] 升級至 JDK 1.8
- ARROW-2499 - [C++] 為 Python 序列新增 iterator facility
- ARROW-2505 - [C++] 停用 MSVC 警告 C4800
- ARROW-2506 - [Plasma] macOS 上的建置錯誤
- ARROW-2507 - [Rust] 在不需要時不要採用 reference
- ARROW-2508 - [Python] pytest API 變更導致測試失敗
- ARROW-2513 - [Python] DictionaryType 應提供對索引類型和 dictionary array 的存取
- ARROW-2516 - AppVeyor Build Matrix 應針對 PR 中所做的變更
- ARROW-2521 - [Rust] 重構 Rust API 以使用 traits 和 generics
- ARROW-2522 - [C++] 版本共享函式庫檔案
- ARROW-2525 - [GLib] 新增 garrow_struct_array_flatten()
- ARROW-2526 - [GLib] 更新 .gitignore
- ARROW-2527 - [GLib] 啟用 GPU 文件
- ARROW-2529 - [C++] 在文件中將 clang-format 的提及更新為 5.0
- ARROW-2531 - [C++] 將 clang bits 更新至 6.0
- ARROW-2533 - [CI] 快速完成失敗的 AppVeyor builds
- ARROW-2536 - [Rust] ListBuilder 為 offset builder 使用錯誤的初始大小
- ARROW-2537 - [Ruby] 導入
- ARROW-2539 - [Plasma] 使用 unique_ptr 而不是 raw pointer
- ARROW-2540 - [Plasma] 新增建構子/解構子以確保自動呼叫 dlfree
- ARROW-2541 - [Plasma] 清理 macro 用法
- ARROW-2543 - [Rust] CI 應快取相依性以加快 builds 速度
- ARROW-2544 - [CI] 在 Travis-CI 上使用兩個 jobs 執行 C++ 測試
- ARROW-2547 - [Format] 修正 List<List
> 範例中的 off-by-one 錯誤 - ARROW-2548 - [Format] 釐清 `List
\` Array 範例 - ARROW-2549 - [GLib] 將 arrow::StatusCodes 變更應用於 GArrowError
- ARROW-2550 - [C++] 將遺失的狀態碼新增至 arrow::StatusCode::CodeAsString()
- ARROW-2551 - [Plasma] 改善通知邏輯
- ARROW-2553 - [Python] 在 wheel build 中設定 MACOSX_DEPLOYMENT_TARGET
- ARROW-2558 - [Plasma] 避免在用戶端斷線時遍歷所有物件
- ARROW-2562 - [C++] 將覆蓋率資料上傳至 codecov.io
- ARROW-2563 - [Rust] Travis-CI 中快取效果不佳
- ARROW-2566 - [CI] 將 codecov.io 徽章新增至 README
- ARROW-2567 - [C++/Python] 在比較 TimestampArrays 時忽略 Unit
- ARROW-2568 - [Python] 將執行緒池大小設定暴露給 Python,並棄用 “nthreads”
- ARROW-2569 - [C++] 改善執行緒池大小啟發式演算法
- ARROW-2574 - [CI] 收集並發佈 Python 覆蓋率
- ARROW-2576 - [GLib] 為 Decimal128 新增 abs 函式。
- ARROW-2577 - [Plasma] 新增 ASV 基準測試
- ARROW-2580 - [GLib] 修正 Decimal128 的 abs 函式
- ARROW-2582 - [GLib] 為 Decimal128 新增 negate 函式
- ARROW-2585 - [C++] 新增 Decimal128::FromBigEndian
- ARROW-2586 - [C++] 使 ListBuilder 和 StructBuilder 的子 builders 為 shared_ptr
- ARROW-2595 - [Plasma] operator[] 在 map 中建立 entries
- ARROW-2596 - [GLib] 使用 GTK-Doc 的預設值
- ARROW-2597 - [Plasma] 移除 UniqueIDHasher
- ARROW-2604 - [Java] 為 VarCharVector.set(int,String) 新增方法多載
- ARROW-2608 - [Java/Python] 新增 pyarrow.{Array,Field}.from_jvm / jvm_buffer
- ARROW-2611 - [Python] Python 2 整數序列化
- ARROW-2612 - [Plasma] 修正已棄用的 PLASMA_DEFAULT_RELEASE_DELAY
- ARROW-2613 - [Docs] 更新 gen_apidocs docker 腳本
- ARROW-2614 - [CI] 移除 Travis 中的 ‘group: deprecated’
- ARROW-2626 - [Python] pandas ArrowInvalid 訊息應包含失敗的欄位名稱
- ARROW-2634 - [Go] 為 Go 子專案新增 LICENSE
- ARROW-2635 - [Ruby] LICENSE.txt 不適用
- ARROW-2636 - [Ruby] 遺失 “非官方” 套件註記
- ARROW-2638 - [Python] 阻止直接呼叫 extension 類別建構子
- ARROW-2639 - [Python] 移除不必要的 _check_nullptr 方法
- ARROW-2641 - [C++] 調查 spurious memset() 呼叫
- ARROW-2645 - [Java] ArrowStreamWriter 累積 DictionaryBatch ArrowBlocks
- ARROW-2649 - [C++] 為更快的 bitmap 寫入新增類似 std::generate() 的函式
- ARROW-2656 - [Python] 改善 ParquetManifest 建立時間
- ARROW-2660 - [Python] 實驗零複製序列化
- ARROW-2661 - [Python/C++] 允許透過 map/dict 傳遞 HDFS Config 值,而無需 hdfs-site.xml 檔案
- ARROW-2662 - [Python] 為 ChunkedArray 新增 to_pandas / to_numpy
- ARROW-2663 - [Python] 使 dictionary_encode 和 unique 可在 Column / ChunkedArray 上存取
- ARROW-2664 - [Python] 在 Buffer 上實作 __getitem__ / slicing
- ARROW-2666 - [Python] numpy.asarray 應在 Array/ChunkedArray 上觸發 to_pandas
- ARROW-2672 - [Python] 在 manylinux1 wheels 中建置 ORC extension
- ARROW-2674 - [Packaging] 開始建置 nightly builds
- ARROW-2676 - [Packaging] 將 build artifacts 部署到 github releases
- ARROW-2677 - [Python] 暴露 Parquet ZSTD 壓縮
- ARROW-2678 - [GLib] 為 macOS 上常見的建置問題新增額外資訊
- ARROW-2680 - [Python] 新增關於 Table.from_pandas 中類型推斷的文件
- ARROW-2682 - [CI] 在 Slack 中通知關於 broken builds
- ARROW-2689 - [Python] 從文件中移除對 timestamps_to_ms 參數的引用
- ARROW-2692 - [Python] 為將 dictionary 編碼欄位寫入 chunked Parquet 檔案新增測試
- ARROW-2695 - [Python] 阻止直接呼叫 scalar 建構子
- ARROW-2696 - [JAVA] 使用 onFailedAllocation() 呼叫增強 AllocationListener
- ARROW-2699 - [C++/Python] 新增 Table 方法,以使用新的提供的欄位取代欄位
- ARROW-2700 - [Python] 為 Array.cast 文件字串新增簡單範例
- ARROW-2701 - [C++] 使 MemoryMappedFile 可調整大小
- ARROW-2704 - [Java] IPC stream 處理應對低階處理更友善
- ARROW-2713 - [Packaging] 修正 linux 套件 builds
- ARROW-2717 - [Packaging] 為 conda artifacts 後綴目標架構
- ARROW-2718 - [Packaging] GPG 簽署下載的 artifacts
- ARROW-2724 - [Packaging] 判斷是否已上傳所有預期的 artifacts
- ARROW-2725 - [JAVA] 使 Accountant.AllocationOutcome 公開可見
- ARROW-2729 - [GLib] 新增 decimal128 array builder
- ARROW-2731 - 允許使用外部 ORC 函式庫
- ARROW-2732 - 更新 macOS 的 brew 套件
- ARROW-2733 - [GLib] 將 garrow_decimal128 轉換為 gint64
- ARROW-2738 - [GLib] 在安裝過程中使用 Brewfile
- ARROW-2739 - [GLib] 為 GArrowDecimalDataType 和 GArrowDecimal128ArrayBuilder 使用 G_DECLARE_DERIVABLE_TYPE
- ARROW-2740 - [Python] 為 Buffer 新增 address 屬性
- ARROW-2742 - [Python] 允許 Table.from_batches 使用 ArrowRecordBatches 的 Iterator
- ARROW-2748 - [GLib] 新增 garrow_decimal_data_type_get_scale() (和 _precision())
- ARROW-2749 - [GLib] 將 *garrow_decimal128_array_get_value 重新命名為 *garrow_decimal128_array_format_value
- ARROW-2751 - [GLib] 新增 garrow_table_replace_column()
- ARROW-2752 - [GLib] 記錄 garrow_decimal_data_type_new()
- ARROW-2753 - [GLib] 新增 garrow_schema_*_field()
- ARROW-2755 - [Python] 允許使用 Ninja 建置 extension
- ARROW-2756 - [Python] 移除 parquet 測試中多餘的 imports 和小修正
- ARROW-2758 - [Plasma] 在 Plasma 中使用 Scope enum
- ARROW-2760 - [Python] 從 parquet 模組中移除 legacy property definition syntax 並測試它們
- ARROW-2761 - 支援在 Hive 分區 Parquet 檔案上設定篩選運算子
- ARROW-2763 - [Python] 使 parquet _metadata 檔案可從 ParquetDataset 存取
- ARROW-2780 - [Go] 執行程式碼覆蓋率分析
- ARROW-2784 - [C++] MemoryMappedFile::WriteAt 允許寫入超過結尾的位置
- ARROW-2790 - [C++] Buffers 包含未初始化的記憶體
- ARROW-2791 - [Packaging] 建置 Ubuntu 18.04 套件
- ARROW-2792 - [Packaging] 考慮上傳 tarballs 以避免命名衝突
- ARROW-2794 - [Plasma] 為多個物件新增 Delete 方法
- ARROW-2798 - [Plasma] 使用將所有 UniqueID 位元組納入考量的 hashing 函式
- ARROW-2802 - [Docs] 將發行管理指南移動到專案 wiki
- ARROW-2804 - [網站] 從首頁連結到開發者 wiki (Confluence)
- ARROW-2805 - [Python] 如果未安裝 CUDA,TensorFlow import workaround 無法與 tensorflow-gpu 運作
- ARROW-2809 - [C++] 降低 Travis CI 中 lint 檢查的詳細程度
- ARROW-2811 - [Python] 測試序列化的確定性
- ARROW-2815 - [CI] 在 C++ CI entries 中建置 Java 函式庫時,抑制 DEBUG logging
- ARROW-2816 - [Python] 為 NativeFile 新增 __iter__ 方法
- ARROW-2821 - [C++] 僅在一個位置將 BooleanBuilder 中的記憶體歸零
- ARROW-2822 - [C++] PoolBuffer::Resize 中的零填充位元組
- ARROW-2824 - [GLib] 新增 garrow_decimal128_array_get_value()
- ARROW-2825 - [C++] 需要具有預設記憶體池的 AllocateBuffer / AllocateResizableBuffer 變體
- ARROW-2826 - [C++] 需要釐清 ArrayBuilder::Init()、Resize() 和 Reserve() 之間的差異
- ARROW-2827 - [C++] LZ4 和 Zstd 建置可能會在平行建置中失敗
- ARROW-2829 - [GLib] 新增 GArrowORCFileReader
- ARROW-2830 - [Packaging] 再次為 deb 套件建置啟用平行建置
- ARROW-2833 - [Python] Column.__repr__ 將會鎖定具有大型資料集的 Jupyter
- ARROW-2834 - [GLib] 從 Meson 選項中移除 “enable_” 前綴
- ARROW-2836 - [Packaging] 將建置矩陣擴展到多個 tasks
- ARROW-2837 - [C++] ArrayBuilder::null_bitmap 傳回 PoolBuffer
- ARROW-2838 - [Python] 使用 Pandas 語義加速 null 測試
- ARROW-2844 - [Packaging] 在建置後測試 OSX wheels
- ARROW-2845 - [Packaging] 上傳額外的 debian artifacts
- ARROW-2846 - [Packaging] 更新 crossbow 中的 nightly build 以及範例設定
- ARROW-2847 - [Packaging] 修正 conda forge 套件的 artifact 名稱比對
- ARROW-2848 - [Packaging] lib*.deb 套件名稱與版本不符
- ARROW-2849 - [Ruby] Arrow::Table#load 支援 ORC
- ARROW-2855 - [C++] 概述使用 jemalloc 優點的部落格文章
- ARROW-2859 - [Python] 在 open_stream、open_file 和 RecordBatch*Reader APIs 中處理匯出 buffer protocol 的物件
- ARROW-2861 - [Python] 新增關於使用 Parquet 儲存無索引 pandas 資料的額外提示
- ARROW-2864 - [Plasma] 新增刪除快取以稍後刪除物件
- ARROW-2868 - [Packaging] 修正 centos-7 build
- ARROW-2869 - [Python] 為 Array.to_numpy 新增文件
- ARROW-2875 - [Packaging] 不要嘗試在 linux builds 中下載 arrow archive
- ARROW-2881 - [網站] 為網站新增社群標籤
- ARROW-2884 - [Packaging] 從 apache source archive 建置套件的選項
- ARROW-2886 - [Release] 存在未使用的變數
- ARROW-2890 - [Plasma] 使 Python PlasmaClient.release 私有
- ARROW-2893 - [C++] 從公開 API 中移除 PoolBuffer 類別,並將實作細節隱藏在 factory 函式後方
- ARROW-2897 - 組織支援的 Ubuntu 版本
- ARROW-2898 - [Packaging] Setuptools_scm 剛發佈了新版本,該版本無法解析 `apache-arrow-
\` 標籤 - ARROW-2906 - [網站] 移除 slack channel 的連結
- ARROW-2907 - [GitHub] 改善 “如何貢獻 patches”
- ARROW-2908 - [Rust] 將版本更新至 0.10.0
- ARROW-2914 - [Integration] 將 WindowPandasUDFTests 新增至 Spark Integration
- ARROW-2915 - [Packaging] 從 ubuntu-trusty build 中移除 artifact form
- ARROW-2918 - [C++] 改善 Struct pretty prints 的格式
- ARROW-2921 - [Release] 更新 .deb/.rpm changelos 以進行準備
- ARROW-2922 - [Release] 使 python command name 可自訂
- ARROW-2923 - [Doc] 新增執行 Spark integration tests 的指示
- ARROW-2924 - [Java] 當安裝了較舊的 maven javadoc plugin 時,mvn release 失敗
- ARROW-2927 - [Packaging] AppVeyor wheel task 在初始 checkout 時失敗
- ARROW-2928 - [Packaging] AppVeyor crossbow conda builds 正在選取 boost 1.63.0 而不是已安裝的版本
- ARROW-2929 - [C++] ARROW-2826 破壞 parquet-cpp 1.4.0 builds
- ARROW-2934 - [Packaging] 將 checksums 建立新增至 sign 子命令
- ARROW-2935 - [Packaging] 將 verify_binary_artifacts 函式新增至 verify-release-candidate.sh
- ARROW-2937 - [Java] ARROW-2704 的後續變更
- ARROW-2943 - [C++] 實作 BufferedOutputStream::Flush
- ARROW-2944 - [Format] Arrow columnar format 文件提及已不存在的 VectorLayout
- ARROW-2946 - [Packaging] 停止在 debian/rules 中使用 PWD
- ARROW-2947 - [Packaging] 移除 Ubuntu Artful
- ARROW-2949 - [CI] repo.continuum.io 在 builds 中可能不穩定
- ARROW-2951 - [CI] format/ 中的變更應導致 Appveyor builds 執行
- ARROW-2953 - [Plasma] 儲存記憶體使用量
- ARROW-2954 - [Plasma] 在物件表格中僅儲存 object_id 一次
- ARROW-2962 - [Packaging] 不再需要 Bintray descriptor 檔案
- ARROW-2977 - [Packaging] 發行驗證腳本應同時檢查 rust
- ARROW-2985 - [Ruby] 在 verify-release-candidate.sh 中執行單元測試
- ARROW-2988 - [Release] 在 Windows 上進行更自動化的發行驗證
- ARROW-2990 - [GLib] 無法在 macOS 上使用 rpath-ed Arrow C++ 建置
- ARROW-530 - C++/Python: 提供子池以獲得更好的記憶體分配追蹤
- ARROW-564 - [Python] 新增方法以回傳原始 NumPy 陣列 (若有 Null 值則額外回傳布林遮罩陣列)
- ARROW-889 - [C++] 為 ChunkedArray 實作 arrow::PrettyPrint
- ARROW-902 - [C++] 從本機 tarball 建置包含第三方相依性的 C++ 專案
- ARROW-906 - [C++] 將 Field metadata 序列化至 IPC metadata
錯誤修正
- ARROW-2059 - [Python] Feather 讀取/寫入路徑中可能出現效能衰退
- ARROW-2101 - [Python] from_pandas 在 Python 2 中將 'str' 類型讀取為二進制 Arrow 資料
- ARROW-2122 - [Python] Pyarrow 無法序列化包含時間戳記的 dataframe。
- ARROW-2182 - [Python] ASV 基準測試設定未考量 C++ 函式庫的變更
- ARROW-2193 - [Plasma] 當 ARROW_BOOST_USE_SHARED=on 時,plasma_store 具有 Boost 共用函式庫的執行階段相依性
- ARROW-2195 - [Plasma] 從 plasma store 擷取 RecordBatch 時發生區段錯誤
- ARROW-2247 - [Python] 在 libarrow 和 libparquet 中靜態連結 boost_regex 會導致區段錯誤
- ARROW-2273 - 無法反序列化 pandas SparseDataFrame
- ARROW-2300 - [Python] python/testing/test_hdfs.sh 已無法運作
- ARROW-2305 - [Python] Cython 0.25.2 編譯失敗
- ARROW-2314 - [Python] Union 陣列切片有缺陷
- ARROW-2326 - [Python] 無法在 OS X (10.9) 上匯入 pip 安裝的 pyarrow
- ARROW-2328 - 使用 feather 寫入切片會忽略偏移量
- ARROW-2331 - [Python] 修正索引實作
- ARROW-2333 - [Python] setup.py 中的 boost bundling 失敗
- ARROW-2342 - [Python] Aware 時間戳記類型無法進行 pickling
- ARROW-2346 - [Python] PYARROW_CXXFLAGS 不接受多個選項
- ARROW-2349 - [Python] Boost 共用函式庫 bundling 在 MSVC 上損壞
- ARROW-2351 - [C++] StringBuilder::append(vector
...) 未實作 - ARROW-2354 - [C++] PyDecimal_Check() 速度太慢
- ARROW-2355 - [Python] 無法匯入 pyarrow [0.9.0] OSX
- ARROW-2357 - Benchmark PandasObjectIsNull
- ARROW-2368 - DecimalVector#setBigEndian 對於負值未正確填充
- ARROW-2369 - 透過 PyArrow 寫入 Parquet 的大型 (>∼20 GB) 檔案已損壞
- ARROW-2370 - [GLib] include 路徑在 Meson 建置上錯誤
- ARROW-2371 - [GLib] GNU Autotools 建置上不需要 gio-2.0
- ARROW-2372 - [Python] ArrowIOError:讀取 Parquet 檔案時引數無效
- ARROW-2375 - [Rust] Buffer 應在 dropped 時釋放記憶體
- ARROW-2377 - [GLib] Travis-CI 失敗
- ARROW-2380 - [Python] 修正 numpy_to_arrow 轉換常式中的問題
- ARROW-2382 - [Rust] List
未使用安全記憶體 - ARROW-2383 - [C++] Debian 套件需要相依於 libprotobuf
- ARROW-2387 - [Python] 負十進位值產生虛假的重新縮放錯誤
- ARROW-2391 - [Python] 將 Pandas datetime 欄位對應至 pyarrow.date64 時,PyArrow 發生區段錯誤
- ARROW-2393 - [C++] arrow/status.h 未定義 ARROW_CHECK,ARROW_CHECK_OK 需要它
- ARROW-2403 - [C++] arrow::CpuInfo::model_name_ 在結束時解構兩次
- ARROW-2405 - [C++]
在 plasma/client.h 中遺失 - ARROW-2418 - [Rust] List builder 因記憶體未正確保留而失敗
- ARROW-2419 - [Site] 網站產生相依於本機時區
- ARROW-2420 - [Rust] 記憶體從未釋放
- ARROW-2423 - [Python] PyArrow 資料類型在針對非 PyArrow 物件進行相等性檢查時引發 ValueError
- ARROW-2424 - [Rust] 缺少匯入導致建置中斷
- ARROW-2425 - [Rust] Array::from 缺少 u8 類型的對應
- ARROW-2426 - [CI] glib 建置失敗
- ARROW-2432 - [Python] 如果有 None 值,from_pandas 在轉換十進位數時失敗
- ARROW-2437 - [C++] arrow::ipc::ReadMessage 簽章的變更破壞 ABI 相容性
- ARROW-2441 - [Rust] Builder
::slice\_mut 斷言太嚴格 - ARROW-2443 - [Python] 從 pandas 轉換空的 categorical 失敗,並出現 ArrowInvalid
- ARROW-2450 - [Python] 儲存至 parquet 對於空列表失敗
- ARROW-2452 - [TEST] Spark 整合測試因權限錯誤而失敗
- ARROW-2454 - [Python] 空的 chunked array 切片崩潰
- ARROW-2455 - [C++] CudaContextImpl 中的 bytes_allocated_ 未初始化
- ARROW-2457 - garrow_array_builder_append_values() 無法用於大型陣列
- ARROW-2459 - pyarrow:pyarrow.deserialize_pandas 發生區段錯誤
- ARROW-2462 - [C++] 從 Record Batch Stream 寫入包含字典欄位的 parquet 表格時發生區段錯誤
- ARROW-2465 - [Plasma] plasma_store 無法找到 libarrow_gpu.so
- ARROW-2466 - [C++] FileOutputStream 的 "append" 旗標具誤導性
- ARROW-2468 - [Rust] Builder::slice_mut 應接受 mut self
- ARROW-2471 - [Rust] 將值推送至容量為零的 Builder/ListBuilder 時發生斷言
- ARROW-2473 - [Rust] 長度為零的列表發生 List 斷言錯誤
- ARROW-2474 - [Rust] 新增 Windows 對記憶體池抽象化的支援
- ARROW-2489 - [Plasma] test_plasma.py 崩潰
- ARROW-2491 - [Python] Array.from_buffers 不適用於 ListArray
- ARROW-2492 - [Python] 防止意外呼叫 pyarrow.Array 時發生區段錯誤
- ARROW-2500 - [Java] IPC Writers/readers 並非總是正確設定有效位元
- ARROW-2502 - [Rust] 還原 Windows 相容性
- ARROW-2503 - [Python] pyarrow.parquet.ParquetFile 的 RowGroup 統計資訊中出現尾隨空格字元
- ARROW-2509 - [CI] 間歇性 npm 失敗
- ARROW-2511 - BaseVariableWidthVector.allocateNew 在無法配置記憶體時未拋出 OOM
- ARROW-2514 - [Python] 推斷/轉換巢狀 Numpy 陣列非常慢
- ARROW-2515 - ListArray 或其他 DictionaryArray 內部的 DictionaryArray 發生錯誤
- ARROW-2518 - [Java] 將 Java 單元測試和 javadoc 測試還原至 CI 矩陣
- ARROW-2530 - [GLib] Out-of-source 建置失敗
- ARROW-2534 - [C++] libarrow.so 洩漏 zlib 符號
- ARROW-2545 - [Python] Arrow 無法連結靜態編譯的 Python
- ARROW-2554 - pa.array 在使用 NS-timestamp 時發生類型推斷錯誤
- ARROW-2557 - [Rust] 在 README 中新增程式碼涵蓋率的徽章
- ARROW-2561 - [C++] 啟用涵蓋率時,cuda-test 關閉時發生崩潰
- ARROW-2564 - [C++] Rowwise 教學已過時
- ARROW-2565 - [Plasma] 新訂閱者無法接收關於現有物件的通知
- ARROW-2570 - [Python] 新增支援以 LZ4 壓縮寫入 parquet 檔案
- ARROW-2571 - [C++] Lz4Codec 未正確處理空資料
- ARROW-2575 - [Python] 讀取 Parquet 資料集時排除隱藏檔案
- ARROW-2578 - [Plasma] 與 std::random_device 相關的 Valgrind 錯誤
- ARROW-2589 - [Python] test_parquet.py 因 Pandas 0.23.0 而發生迴歸
- ARROW-2593 - [Python] TypeError:不理解資料類型 “mixed-integer”
- ARROW-2594 - [Java] Vector 重新配置未正確清除重複使用的緩衝區
- ARROW-2601 - [Python] MemoryPool bytes_allocated 導致 seg
- ARROW-2603 - [Python] from pandas 對於 date(time) 子類別引發 ArrowInvalid
- ARROW-2615 - [Rust] 重構引入了關於字串陣列的錯誤
- ARROW-2629 - [Plasma] pending_notifications_ 的迭代器失效
- ARROW-2630 - [Java] 文件中的錯字
- ARROW-2632 - [Java] ArrowStreamWriter 累積 ArrowBlock 但未使用它們
- ARROW-2640 - JS Writer 應序列化 schema metadata
- ARROW-2643 - [C++] 啟用 cpp toolchain 時 Travis-CI 建置失敗
- ARROW-2644 - [Python] parquet binding 在 AppVeyor 上建置失敗
- ARROW-2655 - [C++] 在 gcc 7.3.0 上使用 -Werror=conversion 失敗
- ARROW-2657 - 在 Pyarrow 之後匯入 TensorFlow 時發生區段錯誤
- ARROW-2668 - [C++] 使用 clang 6.0、Ubuntu 14.04 上的 dlmalloc.c 發出 -Wnull-pointer-arithmetic 警告
- ARROW-2669 - [C++] 建置 gbenchmark 時未傳遞 EP_CXX_FLAGS
- ARROW-2675 - 使用 clang-10 (Apple Clang / LLVM) 時 Arrow 建置錯誤
- ARROW-2683 - [Python] 使用 pyarrow.parquet.read_table() 時出現資源警告 (未關閉的檔案)
- ARROW-2690 - [C++] Plasma 未遵循變數和函式名稱的樣式慣例
- ARROW-2691 - [Rust] Travis 因格式差異而失敗
- ARROW-2693 - [Python] pa.chunked_array 在空輸入時導致區段錯誤
- ARROW-2694 - [Python] ArrayValue 字串轉換回傳表示形式而非轉換後的 python 物件字串
- ARROW-2698 - [Python] 將字串傳遞至 Table.column 時發生例外
- ARROW-2711 - [Python/C++] 當列表欄位的第一個元素為空時,Pandas-Arrow 無法往返
- ARROW-2716 - [Python] 使 manylinux1 基礎映像檔獨立於 Python 修補程式版本
- ARROW-2721 - [C++] 在 CentOS 7 上使用 -DARROW_ORC=ON 建置 Arrow C++ 時發生連結錯誤
- ARROW-2722 - [Python] 從 pandas to_numeric 降轉後,ndarray 轉 arrow 失敗
- ARROW-2723 - [C++] arrow-orc.pc 遺失
- ARROW-2726 - [C++] 最新的 Boost 版本錯誤
- ARROW-2727 - [Java] 無法建置 java/adapters 模組
- ARROW-2741 - [Python] 從 np.datetime[D] 和 type=pa.date64 產生的 pa.array 產生無效結果
- ARROW-2744 - [Python] 寫入空列表的 ListArray 時,寫入 parquet 崩潰
- ARROW-2745 - [C++] ORC ExternalProject 需要宣告相依於 vendored protobuf
- ARROW-2747 - [CI] [Plasma] Travis 上的大型表格測試失敗
- ARROW-2754 - [Python] 透過 pip 安裝 pyarrow 時,會建立偵錯版本
- ARROW-2770 - [Packaging] 考量 conda recipes 中的 conda-forge 編譯器遷移
- ARROW-2773 - [Python] 已修正 parquet 文件 partition_cols 參數名稱
- ARROW-2781 - [Python] 在 manylinux1 映像檔中使用 curl 下載 boost
- ARROW-2787 - [Python] 透過 cython 將表格從 python 傳遞至 c++ 時發生記憶體問題
- ARROW-2795 - [Python] 僅在 Linux 上執行 TensorFlow 匯入的變通方法
- ARROW-2806 - [Python] np.nan 的處理方式不一致
- ARROW-2810 - [Plasma] Plasma 公開標頭洩漏 flatbuffers.h
- ARROW-2812 - [Ruby] StructArray#[] 引發 NoMethodError
- ARROW-2820 - [Python] RecordBatch.from_arrays 未驗證陣列長度是否全部相等
- ARROW-2823 - [C++] 在
/lib64 - ARROW-2841 - [Go] 修正 Travis CI 中最近的 Go 建置失敗
- ARROW-2850 - [C++/Python] manylinux1 建置中遺失 PARQUET_RPATH_ORIGIN=ON
- ARROW-2851 - [C++] 更新 RAT 排除項目以用於新的安裝檔案名稱
- ARROW-2852 - [Rust] 將 Array 標記為 Sync 和 Send
- ARROW-2862 - [C++] 確保已在 thirdparty/download_thirdparty.sh 中建立 thirdparty 下載目錄
- ARROW-2867 - [Python] Cython 用法的不正確範例
- ARROW-2871 - [Python] Array.to_numpy 對於布林陣列無效
- ARROW-2872 - [Python] 新增 pytest 標記以選擇加入與 TensorFlow 相關的單元測試
- ARROW-2876 - [Packaging] 如果您使用 SSH 克隆,Crossbow 建置可能會掛起
- ARROW-2877 - [Packaging] crossbow submit 導致重複的 Travis CI 建置
- ARROW-2878 - [Packaging] README.md 未提及在使用者的 crossbow 儲存庫設定中設定 GitHub API 權杖
- ARROW-2883 - [Plasma] 編譯警告
- ARROW-2891 - 在 write_to_dataset 中保留 schema
- ARROW-2894 - [Glib] 格式測試因最近的重構而中斷
- ARROW-2895 - [Ruby] 當 C++ 變更時,CI 未執行
- ARROW-2896 - [GLib] export 遺失
- ARROW-2901 - [Java] 建置在 Java9 上失敗
- ARROW-2902 - [Python] HDFS Docker 整合測試留下 root 建立的檔案
- ARROW-2911 - [Python] 以 '\0' 結尾的 Parquet 二進制統計資訊截斷最後一個位元組
- ARROW-2917 - [Python] 需要 gradiant 的 Tensor 無法使用 pyarrow.serialize 序列化
- ARROW-2920 - [Python] pytorch 0.4 發生區段錯誤
- ARROW-2926 - [Python] 在傳遞的 schema 和表格 schema 不符的範例中,ParquetWriter 發生區段錯誤
- ARROW-2930 - [C++] 嘗試在不存在的 CMake 目標上設定目標屬性
- ARROW-2940 - [Python] pytorch 0.3 發生匯入錯誤
- ARROW-2945 - [Packaging] 更新 02-source.sh 的引數檢查
- ARROW-2955 - [Python] pyarrow 的 HDFS API 結果中的錯字
- ARROW-2963 - [Python] fork-join 期間和 use_threads=True 時發生死鎖
- ARROW-2978 - [Rust] Travis CI 建置失敗
- ARROW-2982 - “--show-progress” 選項僅在 wget 1.16 及更高版本中受支援
- ARROW-640 - [Python] Arrow 純量值應具有合理的 __hash__ 和比較