Apache Arrow 0.12.0 (2019 年 1 月 20 日)
這是一個主要版本發佈,涵蓋超過 3 個月的開發。
下載
貢獻者
此版本包含來自 77 位不同貢獻者的 601 次提交。
$ git shortlog -sn apache-arrow-0.11.0..apache-arrow-0.12.0
94 Kouhei Sutou
76 Wes McKinney
61 Antoine Pitrou
60 Krisztián Szűcs
25 Pindikura Ravindra
25 Yosuke Shiro
21 Romain Francois
17 Chao Sun
16 Andy Grove
15 Korn, Uwe
15 Sebastien Binet
13 Paddy Horan
13 Philipp Moritz
10 François Saint-Jacques
9 Praveen
8 Robert Nishihara
7 Uwe L. Korn
6 Brian Hulette
6 Bryan Cutler
6 praveenbingo
6 suquark
5 Javier Luraschi
5 Kousuke Saruta
4 Tanya Schlusser
3 Benjamin Kietzman
3 Dimitri Vorona
3 James Lamb
3 Kenta Murata
3 Neville Dipale
3 Yuhong Guo
3 alexandreyc
2 Animesh Trivedi
2 Deepak Majeti
2 Dmitry Kalinkin
2 Hatem Helal
2 Kengo Seki
2 Micah Kornfield
2 Pearu Peterson
2 Yasuo Honda
2 jlapacik
2 ptaylor
2 shyam
1 Antonio Cavallo
1 Binyang2014
1 Bradley Skaggs
1 Brent Kerby
1 Bruno P. Kinoshita
1 Christopher Hutchinson
1 Dmitry Vukolov
1 Dominik Moritz
1 Dustin Long
1 Jacques Nadeau
1 Jeffrey Wong
1 Joris Van den Bossche
1 Justin Dunham
1 Li Jin
1 Renjie Liu
1 ShubhamChaurasia
1 Siddharth Dave
1 Suvayu Ali
1 Sweeney, Mack
1 Sylvain Joubert
1 Tim Paine
1 Todd Mostak
1 Vivekanand Vellanki
1 Yevgeni Litvin
1 Yuqi Gu
1 Zhenyuan Zhao
1 andrew
1 c-bata
1 cav71
1 kabukawa
1 m.wang
1 minmin.fmm
1 philjdf
1 sarutak
1 siddharth
1 zeroshade
Patch Committers
以下 Apache committers 合併了貢獻的 patches 到 repository。
$ git shortlog -csn apache-arrow-0.11.0..apache-arrow-0.12.0
297 Wes McKinney
79 Kouhei Sutou
76 Krisztián Szűcs
35 Antoine Pitrou
25 Korn, Uwe
25 Yosuke Shiro
16 Philipp Moritz
15 Andy Grove
14 Uwe L. Korn
6 Robert Nishihara
4 Brian Hulette
4 Sidd
3 Bryan Cutler
3 GitHub
變更日誌
新功能與改進
- ARROW-1019 - [C++] 實作帶有 Gzip 編碼器的輸入串流和輸出串流
- ARROW-1423 - [C++] 從第三方使用者提供的 context handle 建立非擁有的 CudaContext
- ARROW-1492 - [C++] 型別轉換函數核心套件
- ARROW-1688 - [Java] 在 checkstyle 警告時建置失敗
- ARROW-1696 - [C++] 新增編碼器效能基準測試
- ARROW-1993 - [Python] 新增從 pandas.DataFrame 判斷隱含 Arrow schema 的函數
- ARROW-2211 - [C++] 為整數使用更簡單的雜湊函數
- ARROW-2216 - [CI] CI 描述和環境變數具有誤導性
- ARROW-2337 - [Scripts] Windows 發佈驗證腳本應使用 boost DSO 而非靜態連結
- ARROW-2475 - [Format] 令人困惑的陣列長度描述
- ARROW-2483 - [Rust] 為布林向量使用位元組封裝
- ARROW-2504 - [Website] 新增 ApacheCon NA 連結
- ARROW-2535 - [Python] 提供檢查 flake8 的 pre-commit hooks
- ARROW-2560 - [Rust] Rust README 應包含關於貢獻的 Rust 特定資訊
- ARROW-2624 - [Python] 用於 Arrow 轉換和 Parquet 測試的隨機 schema 和資料產生器
- ARROW-2637 - [C++/Python] Alpine Linux 上開發的建置支援和說明
- ARROW-2653 - [C++] 重構雜湊表支援
- ARROW-2670 - [C++/Python] 新增 Ubuntu 18.04 / gcc7 作為 nightly build
- ARROW-2673 - [Python] 為 ARROW-2661 新增文件 + docstring
- ARROW-2684 - [Python] 各種文件改進
- ARROW-2712 - [C#] 初始 C# .NET 程式庫
- ARROW-2720 - [C++] 清理 cmake CXX_STANDARD 和 PIC flag 設定
- ARROW-2759 - 匯出 Plasma 的 notification socket
- ARROW-2803 - [C++] 將雜湊函數放入 src/arrow/util
- ARROW-2807 - [Python] 在讀取 Parquet 檔案時,讓 memory-mapping 可在 get_reader 中切換
- ARROW-2808 - [Python] 為 ProxyMemoryPool 新增單元測試,啟用建構新的預設 MemoryPool
- ARROW-2919 - [C++] 改進列出空的 HDFS 檔案時的錯誤訊息
- ARROW-2968 - [R] 從 Arrow table 到 R data.frame 的多執行緒轉換
- ARROW-3020 - [Python] 新增選項以允許空的 Parquet row groups
- ARROW-3038 - [Go] 新增 StringArray 的支援
- ARROW-3063 - [Go] 將支援/TODO 功能列表移至 confluence
- ARROW-3070 - [Release] 在 ASF Bintray 帳戶而非 dist/mirror 系統上託管 RC 和發佈版本的二進位產物
- ARROW-3108 - [C++] Table 實例的 arrow::PrettyPrint
- ARROW-3126 - [Python] 讓 Buffered* IO 類別可供 Python 使用,併入 input_stream、output_stream 工廠函數
- ARROW-3131 - [Go] 為 Go-1.11 新增測試
- ARROW-3161 - [Packaging] 確保在 conda 和 wheel 建置中執行 pyarrow 單元測試
- ARROW-3169 - [C++] 將 array-test.cc 和 array.cc 分割成多個編譯單元
- ARROW-3184 - [C++] 新增模組化建置目標、“all” 目標,並在調用 make 或 ninja 時要求明確的目標
- ARROW-3194 - [Java] 修正在 variable width vectors 的 spitAndTransfer 中的 setValueCount
- ARROW-3199 - [Plasma] 檢查 recvmsg 和 sendmsg 中的 EAGAIN
- ARROW-3209 - [C++] 將 libarrow_gpu 重新命名為 libarrow_cuda
- ARROW-3230 - [Python] ChunkedArray、Table 上缺少比較
- ARROW-3233 - [Python] pyarrow.cuda GPU 支援的 Sphinx 文件
- ARROW-3248 - [C++] Arrow 測試應具有標籤 “arrow”
- ARROW-3260 - [CI] 將 linting 作為一個獨立的 job
- ARROW-3272 - [Java] 記錄 checkstyle 與 Google style guide 的偏差
- ARROW-3273 - [Java] checkstyle - 修正 javadoc style
- ARROW-3278 - [Python] 依名稱檢索 StructType 和 StructArray 的 field
- ARROW-3291 - [C++] 從 std::string 建構 arrow::io::BufferReader 的便利 API
- ARROW-3303 - [C++] 啟用使用簡化的 JSON 表示法寫入範例陣列
- ARROW-3306 - [R] 不同種類 arrow::Buffer 的物件和支援函數
- ARROW-3307 - [R] 將 chunked arrow::Column 轉換為 R vector
- ARROW-3310 - [R] 為各種 Arrow IO 介面建立 wrapper 類別
- ARROW-3312 - [R] 為 R binding C++ 程式碼和主要 C++ 程式碼庫使用相同的 .clang-format 檔案
- ARROW-3318 - [C++] 從 IPC 串流或檔案讀取所有批次作為 arrow::Table 的便利方法
- ARROW-3323 - [Java] checkstyle - 修正命名
- ARROW-3331 - [C++] 將 re2 新增至 ThirdpartyToolchain
- ARROW-3340 - [R] 支援日期和時間類別
- ARROW-3347 - [Rust] 實作 PrimitiveArrayBuilder
- ARROW-3353 - [Packaging] 建置 python 3.7 wheels
- ARROW-3355 - [R] 支援 factors
- ARROW-3358 - [Gandiva][C++] 將 gandiva/status.h 的用法替換為 arrow/status.h
- ARROW-3362 - [R] 防止 null buffers
- ARROW-3366 - [R] 用於 docker-compose 設定的 Dockerfile
- ARROW-3368 - [Integration/CI/Python] 將 dask 整合測試新增至 docker-compose 設定
- ARROW-3380 - [Python] 支援從 gzipped 檔案讀取 CSV 檔案和更多內容
- ARROW-3381 - [C++] 實作 bz2 檔案的 InputStream
- ARROW-3383 - [Java] 在 Travis CI 中執行 Gandiva 測試
- ARROW-3384 - [Gandiva] 同步 gandiva repo 中的剩餘 commits
- ARROW-3385 - [Java] [Gandiva] 自動部署 gandiva snapshot jars
- ARROW-3387 - [C++] 使用 UTF8 驗證將 binary 轉換為 string/utf8 的函數
- ARROW-3398 - [Rust] 更新現有的 Builder 以在內部使用 MutableBuffer
- ARROW-3402 - [Gandiva][C++] 在預先編譯的 IR routines 中利用常見的 bitmap 運算實作
- ARROW-3407 - [C++] 在 CSV reader 轉換選項中新增 UTF8 轉換模式
- ARROW-3409 - [C++] 新增串流壓縮介面
- ARROW-3421 - [C++] 將 include-what-you-use 設定新增至主要的 docker-compose.yml
- ARROW-3427 - [C++] 在 conda-forge 中為 double-conversion 套件新增 Windows 支援、Unix 靜態函式庫
- ARROW-3429 - [Packaging] 新增一個腳本以發佈使用 dist.apache.orgtable bit 上的原始碼封存檔的二進位檔案
- ARROW-3430 - [Packaging] 新增驗證 0.11.0 的 workaround
- ARROW-3431 - [GLib] 將 Gemfile 包含在封存檔中
- ARROW-3432 - [Packaging] 變數未在 Subversion commit 訊息中展開
- ARROW-3439 - [R] Feather 格式的 R 語言 bindings
- ARROW-3440 - [Gandiva][C++] 移除過時的 cpp/src/gandiva/README.md,將建置文件新增至 cpp/README.md
- ARROW-3441 - [Gandiva][C++] 產生較少的測試執行檔
- ARROW-3442 - [C++] 為單元測試使用動態連結,確保 coverage 在 clang 下正常運作
- ARROW-3450 - [R] 包裝 MemoryMappedFile 類別
- ARROW-3451 - [Python] 從 numba.cuda 建立的 CUcontext 分配 CUDA 記憶體
- ARROW-3455 - [Gandiva][C++] 支援 Gandiva 的 pkg-config
- ARROW-3456 - [CI] 重複使用 docker images 並最佳化 docker-compose containers
- ARROW-3460 - [Packaging] 新增一個腳本以將 master rebase 到本地發佈分支
- ARROW-3461 - [Packaging] 新增一個腳本以將 RC 產物上傳為官方發佈版本
- ARROW-3462 - [Packaging] 更新 0.11.0 的 CHANGELOG
- ARROW-3463 - [Website] 更新至 0.11.0
- ARROW-3465 - [Documentation] 修正 gen_apidocs 的 docker image
- ARROW-3469 - [Gandiva] 為 OSX 上的 gandiva 新增 travis entry
- ARROW-3472 - [Gandiva] 移除 gandiva helpers 程式庫
- ARROW-3473 - [Format] 更新 Layout.md 文件以闡明 64 位元陣列長度的使用
- ARROW-3474 - [GLib] 使用 get_schema 和 read_column 擴展 gparquet API
- ARROW-3479 - [R] 支援將 record_batch 作為串流寫入
- ARROW-3482 - [C++] 預設使用 JEMALLOC 建置
- ARROW-3487 - [Gandiva] 簡化可能傳回錯誤的 NULL_IF_NULL 函數
- ARROW-3488 - [Packaging] 為 packaging 和 tests 分隔 crossbow task definition files
- ARROW-3489 - [Gandiva] 支援 in expressions
- ARROW-3490 - [R] 將串流 arrow 物件傳輸到輸出串流
- ARROW-3492 - [C++] 平行建置 jemalloc
- ARROW-3493 - [Java] 記錄 BOUNDS_CHECKING_ENABLED
- ARROW-3499 - [R] 公開 arrow::ipc::Message 型別
- ARROW-3501 - [Gandiva] 啟用在 Ubuntu Trusty、類似發行版上使用 gcc 4.8.x 建置
- ARROW-3504 - [Plasma] 新增 Plasma Client 支援,以 put/get 原始位元組,無需 pyarrow 序列化。
- ARROW-3505 - [R] 讀取 record batch 和 table
- ARROW-3506 - [Packaging] docker-compose images 的 Nightly tests
- ARROW-3515 - 引入 NumericTensor 類別
- ARROW-3518 - [C++] 自動偵測 HOMEBREW_PREFIX
- ARROW-3519 - [Gandiva] 新增支援可以傳回 variable len output 的函數
- ARROW-3521 - [GLib] 在 meson.build 中使用 find_program 執行 Python
- ARROW-3529 - [Ruby] 匯入 Red Parquet
- ARROW-3530 - [Java/Python] 新增從 org.apache…pojo.Schema 轉換 pyarrow.Schema
- ARROW-3533 - [Python/Documentation] 使用 sphinx_rtd_theme 而非 Bootstrap
- ARROW-3536 - [C++] 快速 UTF8 驗證函數
- ARROW-3537 - [Rust] 實作 Tensor Type
- ARROW-3539 - [CI/Packaging] 更新腳本以針對 vendored jemalloc 建置
- ARROW-3540 - [Rust] 將 BooleanArray 併入 PrimitiveArray
- ARROW-3542 - [C++] 從 CSV 建置陣列時使用 unsafe appends
- ARROW-3545 - [C++/Python] 使用 StructType 正規化 child/field 術語
- ARROW-3547 - [R] 從 RecordBatch 讀取時防止 Null crash
- ARROW-3548 - 加速在物件儲存區中儲存小型物件。
- ARROW-3551 - 將 Powered By 頁面上的 MapD 變更為 OmniSci
- ARROW-3555 - [Plasma] 使用 metadata 統一 plasma client get 函數。
- ARROW-3556 - [CI] 在 Windows 上停用最佳化
- ARROW-3557 - [Python] 在 Cython 原始碼中設定 language_level
- ARROW-3558 - [Plasma] 移除 plasma client 在呼叫 get 在其建立的未封裝物件時的 fatal error。
- ARROW-3559 - 靜態連結 plasma_store_server 執行檔的程式庫。
- ARROW-3562 - [R] 不允許使用 null shared_ptr 建立物件
- ARROW-3563 - [C++] 宣告 public link dependencies,以便 arrow_static, plasma_static 自動拉入 transitive dependencies
- ARROW-3566 - 闡明 dictionary 編碼欄位的型別應為 encoded(index) 型別
- ARROW-3567 - [Gandiva] [GLib] 新增 Gandiva 的 GLib bindings
- ARROW-3568 - [Packaging] 為 windows wheels 執行 pyarrow unittests
- ARROW-3569 - [Packaging] 在建置 conda package 時執行 pyarrow unittests
- ARROW-3574 - 修正 plasma static 與 shared libraries 的剩餘 bug。
- ARROW-3576 - [Python] 將壓縮檔案讀取器公開為 NativeFile
- ARROW-3577 - [Go] 新增 ChunkedArray 的支援
- ARROW-3581 - [Gandiva][C++] 未使用 ARROW_PROTOBUF_USE_SHARED
- ARROW-3582 - [CI] Gandiva C++ 建置始終被觸發
- ARROW-3583 - [Python/Java] 從 VectorSchemaRoot 建立 RecordBatch
- ARROW-3584 - [Go] 新增 Table 的支援
- ARROW-3587 - [Python] Arrow 物件 (array, table, tensor 等) 的高效序列化
- ARROW-3588 - [Java] checkstyle - 修正 license
- ARROW-3589 - [Gandiva] 使在沒有 JNI 的情況下編譯 gandiva 成為可能
- ARROW-3591 - [R] 支援收集 decimal 型別
- ARROW-3592 - [Python] 將 BinaryArray 值作為零複製記憶體視圖取得
- ARROW-3597 - [Gandiva] gandiva 應與 ADD_ARROW_TEST 整合以進行測試
- ARROW-3600 - [Packaging] 支援 Ubuntu 18.10
- ARROW-3601 - [Rust] 發佈 0.11.0
- ARROW-3602 - [Gandiva] [Python] 為 Gandiva 新增初步的 Cython bindings
- ARROW-3603 - [Gandiva][C++] 無法使用 vendored Boost 建置
- ARROW-3605 - 從 plasma header 檔案中移除 AE 程式庫。
- ARROW-3607 - [Java] plasma 的 delete() 方法透過 JNI
- ARROW-3608 - [R] 支援 time32 和 time64 陣列型別
- ARROW-3609 - [Gandiva] 將效能基準測試移出單元測試
- ARROW-3610 - [C++] 新增介面以將 stl_allocator 轉換為 arrow::MemoryPool
- ARROW-3611 - 當 pyarrow 序列化 context 使用不正確時,更快地給出錯誤。
- ARROW-3612 - [Go] 實作 RecordBatch 和 RecordBatchReader
- ARROW-3615 - [R] 支援 NaN
- ARROW-3616 - [Java] checkstyle - 修正剩餘的 coding checks
- ARROW-3618 - [Packaging/Documentation] 新增 `-c conda-forge` 選項以避免 PackagesNotFoundError
- ARROW-3620 - [Python] 在 Sphinx 中記錄多執行緒選項並新增至 api.rst
- ARROW-3621 - [Go] 實作 TableBatchReader
- ARROW-3622 - [Go] 實作 Schema.Equal
- ARROW-3623 - [Go] 實作 Field.Equal
- ARROW-3624 - [Python/C++] 支援零大小的裝置 buffers
- ARROW-3626 - [Go] 新增 CSV TableReader
- ARROW-3629 - [Python] 將 write_to_dataset 新增至 Python Sphinx API listing
- ARROW-3630 - [Plasma] [GLib] 新增 Plasma 的 GLib bindings
- ARROW-3632 - [Packaging] 更新 dev/tasks/tasks.yml 中 dev/release/00-prepare.sh 的 deb 名稱
- ARROW-3633 - [Packaging] 更新 0.12.0 的 dev/tasks/tasks.yml 中的 deb 名稱
- ARROW-3636 - [C++/Python] 更新 arrow/python/pyarrow_api.h
- ARROW-3638 - [C++][Python] 將從 Feather 讀取為 Table 功能從 Python 移至 C++
- ARROW-3639 - [Packaging] 執行 gandiva nightly packaging tasks
- ARROW-3640 - [Go] 新增 Tensors 的支援
- ARROW-3641 - [C++/Python] 從 Cython api 函數中移除 public 關鍵字
- ARROW-3642 - [C++] 新增 arrowConfig.cmake 產生
- ARROW-3645 - [Python] 在 Sphinx 中記錄壓縮支援
- ARROW-3646 - [Python] 新增便利的 factories 以建立 IO streams
- ARROW-3647 - [R] 卸載 bit64 套件後發生 Crash
- ARROW-3648 - [Plasma] 新增 API 以同時取得 metadata 和 data
- ARROW-3649 - [Rust] 重構 MutableBuffer 的 resize
- ARROW-3656 - [C++] 允許在數字 CSV 欄位中使用空格
- ARROW-3657 - [R] 需要 bit64 套件
- ARROW-3659 - [C++] Clang Travis 建置 (matrix entry 2) 可能實際上未使用 clang
- ARROW-3660 - [C++] 對於唯讀檔案,不要不必要地鎖定 MemoryMappedFile 以進行調整大小
- ARROW-3661 - [Gandiva][GLib] 改進常數名稱
- ARROW-3662 - [C++] 為 MemoryMappedFile::GetSize 新增 const overload
- ARROW-3664 - [Rust] 為 PrimitiveArrayBuilder 新增效能基準測試
- ARROW-3665 - [Rust] 實作 StructArrayBuilder
- ARROW-3666 - [C++] 改進 CSV parser 效能
- ARROW-3672 - [Go] 實作 Time32 array
- ARROW-3673 - [Go] 實作 Time64 array
- ARROW-3674 - [Go] 實作 Date32 array
- ARROW-3675 - [Go] 實作 Date64 array
- ARROW-3677 - [Go] 實作 FixedSizedBinary array
- ARROW-3681 - [Go] 為 CSV reader 新增效能基準測試
- ARROW-3682 - [Go] 從 CSV reader 取消匯出 encoding/csv.Reader
- ARROW-3683 - [Go] 將 functional-option style 新增至 CSV reader
- ARROW-3684 - [Go] 將 chunk size 選項新增至 CSV reader
- ARROW-3692 - [Gandiva] [Ruby] 新增 Gandiva 的 Ruby bindings
- ARROW-3693 - [R] 具有 null data 的空字元的無效 buffer
- ARROW-3694 - [Java] 當記錄層級停用時,避免多餘的字串建立
- ARROW-3695 - [Gandiva] 使用 add_arrow_lib()
- ARROW-3696 - [C++] 新增 feather::TableWriter::Write(table)
- ARROW-3697 - [Ruby] 新增 schema#[]
- ARROW-3701 - [Gandiva] 新增 decimal 運算的支援
- ARROW-3708 - [Packaging] Nightly CentOS 建置失敗
- ARROW-3713 - [Rust] 實作 BinaryArrayBuilder
- ARROW-3718 - [Gandiva] 移除 spurious gtest include
- ARROW-3719 - [GLib] 支援讀取/寫入 tabl to/from Feather
- ARROW-3720 - [GLib] 使用 “indices” 而非 “indexes”
- ARROW-3721 - [Gandiva] [Python] 支援所有 Gandiva literals
- ARROW-3722 - [C++] 允許為 CSV reader 指定 column types
- ARROW-3723 - [Plasma] [Ruby] 新增 Plasma 的 Ruby bindings
- ARROW-3724 - [GLib] 更新 gitignore
- ARROW-3725 - [GLib] 將 field readers 新增至 GArrowStructDataType
- ARROW-3726 - [Rust] CSV Reader & Writer
- ARROW-3727 - [Python] 在 Sphinx 中記錄 pyarrow.foreign_buffer, cuda.foreign_buffer 的使用
- ARROW-3731 - [R] 用於讀取和寫入 Parquet 檔案的 R API
- ARROW-3733 - [GLib] 將 to_string() 新增至 GArrowTable 和 GArrowColumn
- ARROW-3736 - [CI/Docker] docker-compose run cpp 中的 Ninja 測試掛起
- ARROW-3738 - [C++] 新增 CSV 轉換選項以解析類似 ISO8601 的時間戳記字串
- ARROW-3741 - [R] 新增 arrow::compute::Cast 的支援,以將 Arrow 陣列從一種型別轉換為另一種型別
- ARROW-3743 - [Ruby] 新增儲存/載入 Feather 的支援
- ARROW-3744 - [Ruby] 在 Arrow::Table#to_s 中使用 garrow_table_to_string()
- ARROW-3746 - [Gandiva] [Python] 使列出所有在 Gandiva 中註冊的函數成為可能
- ARROW-3747 - [C++] 反轉 arrow::Decimal128 中資料成員的順序
- ARROW-3748 - [GLib] 新增 GArrowCSVReader
- ARROW-3749 - [GLib] 文件和測試案例名稱中的錯字
- ARROW-3751 - [Python] 為 gandiva 新增更多 cython bindings
- ARROW-3752 - [C++] 移除未使用的 status::ArrowError
- ARROW-3753 - [Gandiva] 移除 debug print
- ARROW-3755 - [GLib] 支援 CompressedInputStream, CompressedOutputStream
- ARROW-3760 - [R] 支援 Arrow CSV reader
- ARROW-3773 - [C++] 移除 parquet/arrow/arrow-reader-writer-test.cc 中重複的 AssertArraysEqual 程式碼
- ARROW-3778 - [C++] 不要將實作放入 test-util.h
- ARROW-3781 - [C++] 在 arrow::io::BufferedOutputStream 中配置 buffer size
- ARROW-3782 - [C++] 實作 C++ 的 BufferedReader
- ARROW-3784 - [R] 具有型別的陣列在 x is not a vector 時失敗
- ARROW-3785 - [C++] 在 CI toolchain 中使用 double-conversion conda package
- ARROW-3787 - 實作 From
for BinaryArray - ARROW-3788 - [Ruby] 新增支援以 C++ 撰寫的 CSV parser
- ARROW-3795 - [R] 支援從 INT64 陣列檢索 NA
- ARROW-3796 - [Rust] 為 PrimitiveArrayBuilder 新增範例
- ARROW-3798 - [GLib] 新增支援 column type CSV read options
- ARROW-3800 - [C++] Vendor a string_view backport
- ARROW-3803 - [C++/Python] 分割 C++ 和 Python 單元測試 Travis CI jobs,一起執行所有 C++ 測試 (包含 Gandiva)
- ARROW-3807 - [R] 缺少 Field API
- ARROW-3819 - [Packaging] 更新 conda variant files 以在編譯器遷移後符合 feedstock
- ARROW-3821 - [Format/Documentation]: 修正 Flight.proto comments 中的錯字和文法問題
- ARROW-3823 - [R] + buffer.complex
- ARROW-3825 - [Python] Python README.md 未顯示如何執行單元測試套件
- ARROW-3830 - [GLib] 新增 GArrowCodec
- ARROW-3834 - [Doc] 合併 Python & C++ 並移至頂層
- ARROW-3836 - [C++] 為 ADD_ARROW_BENCHMARK 新增 PREFIX 選項
- ARROW-3839 - [Rust] 在 CSV reader 中新增推斷 schema 的能力
- ARROW-3841 - [C++] warning: catching polymorphic type by value
- ARROW-3842 - [R] RecordBatchStreamWriter api
- ARROW-3844 - [C++] 移除 ARROW_USE_SSE 和 ARROW_SSE3
- ARROW-3845 - [Gandiva] [GLib] 新增 GGandivaNode
- ARROW-3847 - [GLib] 移除不必要的 “\”。
- ARROW-3849 - 利用 Armv8 crc32 extension instructions 加速 Arm64 的雜湊運算。
- ARROW-3851 - [C++] “make check-format” 很慢
- ARROW-3852 - [C++] used uninitialized warning
- ARROW-3853 - [C++] 實作字串到時間戳記轉換
- ARROW-3854 - [GLib] 棄用 garrow_gio_{input,output}_stream_get_raw()
- ARROW-3855 - [Rust] Schema/Field/Datatype 應實作 serde traits
- ARROW-3856 - [Ruby] 支援壓縮 CSV 儲存/載入
- ARROW-3858 - [GLib] 使用 {class_name}_get_instance_private
- ARROW-3859 - [Java] 修正 ComplexWriter 向後不相容的變更
- ARROW-3860 - [Gandiva] [C++] 新增選項以在建置 libgandiva_jni.so 時使用 -static-libstdc++
- ARROW-3862 - [C++] 改進 dependencies download script
- ARROW-3863 - [GLib] 將 travis_retry 與 brew bundle 命令一起使用
- ARROW-3864 - [GLib] 新增支援 allow-float-truncate cast option
- ARROW-3865 - [Packaging] 將 double-conversion dependency 新增至 conda forge recipes 和 windows wheel 建置
- ARROW-3867 - [Documentation] 將二進位 realase artifacts 上傳到 Bintray
- ARROW-3868 - [Rust] 在 CI 中針對 nightly Rust 建置
- ARROW-3870 - [C++] 將 Peek 新增至 InputStream API
- ARROW-3871 - [R] 將 C++ GetValuesSafely 的用法替換為 ArrayData 上的新方法
- ARROW-3878 - [Rust] 改進 primitive types
- ARROW-3880 - [Rust] PrimitiveArray
應支援簡單的數學運算 - ARROW-3883 - [Rust] 更新 Rust README 以反映新功能
- ARROW-3884 - [Python] 將 LLVM6 新增至 manylinux1 base image
- ARROW-3885 - [Rust] 將版本更新為 0.12.0 並更新 wiki 上的發佈說明
- ARROW-3886 - [C++] ARROW-3831 的其他測試案例
- ARROW-3891 - [Java] 移除使用簡單位元地圖操作的 Long.bitCount
- ARROW-3893 - [C++] 提升自適應整數建構器效能
- ARROW-3895 - [Rust] CSV 讀取器應回傳 Result<Option<» 而非 Option<Result<»
- ARROW-3900 - [GLib] 新增 garrow_mutable_buffer_set_data()
- ARROW-3905 - [Ruby] 新增 StructDataType#[]
- ARROW-3906 - [C++] 將 builder.cc 分割成多個編譯單元
- ARROW-3908 - [Rust] 更新 rust dockerfile 以使用 nightly toolchain
- ARROW-3910 - [Python] 在實作重複資料刪除邏輯後,預設在 *.to_pandas 中將 date_as_object 設定為 True
- ARROW-3911 - [Python] 在 Table.to_pandas 內部刪除 datetime.date 物件的重複資料
- ARROW-3912 - [Plasma][GLib] 新增建立和引用物件的支援
- ARROW-3913 - [Gandiva] [GLib] 新增 GGandivaLiteralNode
- ARROW-3914 - [C++/Python/Packaging] Alpine linux 的 Docker-compose 設定
- ARROW-3916 - [Python] 在 `ParquetWriter` 建構子中支援呼叫者提供的檔案系統
- ARROW-3922 - [C++] 提升位元地圖操作的效能
- ARROW-3924 - [Packaging][Plasma] 新增 Plasma deb/rpm 套件的支援
- ARROW-3925 - [Python] 在 conda 環境中,將 autoconf 包含在 Linux/macOS 依賴項中
- ARROW-3928 - [Python] 新增選項以在 Table.to_pandas 轉換路徑中刪除 PyBytes / PyString / PyUnicode 物件的重複資料
- ARROW-3929 - [Go] 改善 CSV 讀取器的記憶體使用量以提升執行效能
- ARROW-3930 - [C++] 隨機測試資料產生速度緩慢
- ARROW-3932 - [Python/Documentation] 在 Sphinx 文件中包含 Benchmarks.md
- ARROW-3934 - [Gandiva] 若 ARROW_GANDIVA_BUILD_TESTS=off,則不要編譯預編譯的測試
- ARROW-3938 - [Packaging] 停止參考 java/pom.xml 以取得版本資訊
- ARROW-3939 - [Rust] 移除 ListArrayBuilder 的巨集定義
- ARROW-3945 - [Website] 關於 Gandiva 程式碼捐贈的部落格文章
- ARROW-3946 - [GLib] 新增 union 的支援
- ARROW-3948 - [CI][GLib] 設定 Homebrew 的逾時時間
- ARROW-3950 - [Plasma] 不要強制在匯入時載入 TensorFlow op
- ARROW-3952 - [Rust] 在 Cargo.toml 中指定 edition=”2018”
- ARROW-3958 - [Plasma] 減少 IPC 的數量
- ARROW-3959 - [Rust] 時間和時間戳記支援
- ARROW-3960 - [Rust] 移除 Rust 2018 的 extern crate
- ARROW-3963 - [Packaging/Docker] 建立 sphinx 文件的 Nightly 測試
- ARROW-3964 - [Go] 更易讀的 csv.Reader 範例
- ARROW-3967 - [Gandiva] [C++] 使 gandiva/node.h 公開
- ARROW-3970 - [Gandiva][C++] 移除不必要的 boost 依賴項
- ARROW-3971 - [Python] 移除在 0.11 及更早版本中已棄用的 API
- ARROW-3974 - [C++] 在 array/builder.h 中合併 field_builders_ 和 children_ 成員
- ARROW-3982 - [C++] 允許簡單 JSON 格式中的 “binary” 輸入
- ARROW-3983 - [Gandiva][Crossbow] 在封裝時使用靜態 boost
- ARROW-3984 - [C++] 若使用者遇到 zstd ExternalProject 路徑,則以錯誤結束
- ARROW-3986 - [C++] 撰寫散文式文件
- ARROW-3988 - [C++] 在建置系統中預設不建置單元測試
- ARROW-3993 - [JS] CI 工作失敗
- ARROW-3994 - [C++] 移除 ARROW_GANDIVA_BUILD_TESTS 選項
- ARROW-3995 - [CI] 在 Travis Matrix 中使用可理解的名稱
- ARROW-3997 - [C++] [Doc] 釐清字典編碼整數的符號 (和寬度?)
- ARROW-4002 - [C++][Gandiva] 移除 CMake 版本檢查
- ARROW-4004 - [GLib] 將 GPU 取代為 CUDA
- ARROW-4005 - [Plasma] [GLib] 新增 gplasma_client_disconnect()
- ARROW-4006 - 新增 CODE_OF_CONDUCT.md
- ARROW-4009 - [CI] 在不同的建置中執行 Valgrind 和 C++ 程式碼覆蓋率
- ARROW-4015 - [Plasma] 移除 plasma manager 的舊版介面
- ARROW-4017 - [C++] 檢查和更新供應商提供的程式庫
- ARROW-4026 - [C++] 為單元測試使用個別的模組化 $COMPONENT-test 目標
- ARROW-4028 - [Rust] 合併 parquet-rs 程式碼庫
- ARROW-4029 - [C++] 定義和記錄不安裝的內部/私有標頭檔的命名慣例
- ARROW-4030 - [CI] 在步驟失敗時使用 travis_terminate 停止建置
- ARROW-4035 - [Ruby] 支援 msys2 mingw 依賴項
- ARROW-4037 - [Packaging] 移除驗證 0.11.0 的變通方法
- ARROW-4038 - [Rust] 為布林 AND、OR、NOT 新增 array_ops 方法
- ARROW-4039 - 更新 Python README.md 中 ‘development.rst’ 頁面的連結
- ARROW-4042 - [Rust] BinaryArray 和 PrimitiveArray 之間的方法命名不一致
- ARROW-4043 - [Packaging/Docker] Alpine 上的 Python 測試缺少 pytest 依賴項
- ARROW-4044 - [Packaging/Python] 將 hypothesis 測試依賴項新增至 pyarrow conda recipe
- ARROW-4045 - [Packaging/Python] 將 hypothesis 測試依賴項新增至 wheel crossbow 測試
- ARROW-4048 - [GLib] 在 gparquet_arrow_file_reader_read_column 中回傳 ChunkedArray 而非 Array
- ARROW-4051 - [Gandiva] [GLib] 新增 null literal 的支援
- ARROW-4054 - [Python] 更新 manylinux1 base image 中的 gtest、flatbuffers 和 OpenSSL
- ARROW-4060 - [Rust] 新增 Parquet/Arrow schema 轉換器
- ARROW-4069 - [Python] 為從 binary 轉換為 utf8 新增測試
- ARROW-4075 - [Rust] 在呼叫 finish() 後重複使用 array builder
- ARROW-4079 - [C++] 新增機器基準測試
- ARROW-4080 - [Rust] 改善 Appveyor 中冗長的建置時間
- ARROW-4082 - [C++] CMake 調整:允許 RelWithDebInfo,改善 FindClangTools
- ARROW-4084 - [C++] 簡化 Status 和 stringstream 樣板程式碼
- ARROW-4085 - [GLib] 為 struct 資料類型使用 “field”
- ARROW-4087 - [C++] 使 CSV null 值可設定
- ARROW-4093 - [C++] 棄用的方法建議錯誤的方法
- ARROW-4098 - [Python] 棄用 pyarrow.open_stream,open_file,改用 pa.ipc.open_stream/open_file
- ARROW-4100 - [Gandiva][C++] 修復 regex 以忽略 “.” 字元
- ARROW-4102 - [C++] FixedSizeBinary 恆等轉換未實作
- ARROW-4103 - [Documentation] 在 docs/ 根目錄新增 README
- ARROW-4105 - 新增 rust-toolchain 以強制使用者使用 nightly toolchain 進行建置
- ARROW-4107 - [Python] 在 pyarrow manylinux1 建置中使用 ninja
- ARROW-4112 - [Packaging][Gandiva] 新增 deb 套件的支援
- ARROW-4116 - [Python] 在 development.rst 中釐清 virtualenv 無法與 miniconda/Anaconda 搭配使用
- ARROW-4122 - [C++] 初始化一些未初始化的類別成員
- ARROW-4127 - [Documentation] 新增 Docker 建置指示
- ARROW-4129 - [Python] 修復基準測試文件中的語法問題
- ARROW-4132 - [GLib] 新增更多 GArrowTable 建構子
- ARROW-4141 - [Ruby] 新增從原始 Ruby 物件建立 schema 的支援
- ARROW-4148 - [CI/Python] 在 nightly Alpine 建置中停用 ORC
- ARROW-4150 - [C++] 不要從內部配置回傳包含 nullptr 的緩衝區
- ARROW-4151 - [Rust] 重新組織專案目錄
- ARROW-4152 - [GLib] 移除顯示 Torch 整合的範例
- ARROW-4153 - [GLib] 為了一致性新增 builder_append_value()
- ARROW-4154 - [GLib] 新增 GArrowDecimal128DataType
- ARROW-4155 - [Rust] 為 PrimitiveArray 實作 array_ops::sum()
- ARROW-4156 - [C++] cmake 產生的專案的 xcodebuild 失敗
- ARROW-4158 - [Dev] 允許維護者在合併 pull request 時使用 GitHub API token
- ARROW-4160 - [Rust] 將 README 和可執行檔新增至 parquet
- ARROW-4161 - [GLib] 新增 GPlasmaClientOptions
- ARROW-4162 - [Ruby] 新增從描述建立資料類型的支援
- ARROW-4166 - [Ruby] 新增儲存至和從緩衝區載入的支援
- ARROW-4167 - [Gandiva] 切換至 arrow/util/variant
- ARROW-4168 - [GLib] 使用屬性來保留在 garrow_field_new() 中傳遞的 GArrowDataType
- ARROW-4172 - [Rust] array builder 中更一致的命名
- ARROW-4174 - [Ruby] 新增從原始 Ruby 物件建置複合陣列的支援
- ARROW-4175 - [GLib] 新增 decimal 比較運算子的支援
- ARROW-4177 - [C++] 新增 ThreadPool 和 TaskGroup 微基準測試
- ARROW-4183 - [Ruby] 將 Arrow::Struct 新增為 Arrow::StructArray 的元素
- ARROW-4184 - [Ruby] 新增 Arrow::RecordBatch#to_table
- ARROW-4191 - [C++] 為 jemalloc 使用與主要來源相同的 CC 和 AR
- ARROW-4199 - [GLib] 新增 garrow_seekable_input_stream_peek()
- ARROW-4207 - [Gandiva] [GLib] 新增 IfNode 的支援
- ARROW-4210 - [Python] 在 pyarrow 的 conda meta.yaml 中直接提及 boost-cpp
- ARROW-4211 - [GLib] 新增 GArrowFixedSizeBinaryDataType
- ARROW-4214 - [Ruby] 新增從原始 Ruby 物件建置 RecordBatch 的支援
- ARROW-4216 - [Python] 新增 CUDA API 文件
- ARROW-4228 - [GLib] 新增 garrow_list_data_type_get_field()
- ARROW-4229 - [Packaging] 明確設定 crossbow 目標以啟用建置任意 arrow repo
- ARROW-4233 - [Packaging] 建立 Dockerfile 以建置原始碼封存檔
- ARROW-4239 - [Release] 更新 prepare script 中的 .deb 套件名稱在 OSX 上執行失敗
- ARROW-4240 - [Packaging] Plasma GLib 和 Gandiva GLib 的文件在原始碼封存檔中遺失
- ARROW-4241 - [Packaging] 停用 crossbow conda OSX clang 建置
- ARROW-4243 - [Python] 使用 pandas 0.24.0rc1 的測試失敗
- ARROW-4249 - [Plasma] 從 plasma/common.h 中移除對 logging.h 的參考
- ARROW-4257 - [Release] 更新發行驗證腳本以檢查 Bintray 上的二進位檔
- ARROW-4266 - [Python][CI] 在 dask 整合測試中停用 ORC 測試
- ARROW-4269 - [Python] AttributeError: module ‘pandas.core’ 沒有屬性 ‘arrays’
- ARROW-4270 - [Packaging][Conda] 更新 xcode 版本並移除 toolchain 建置
- ARROW-4276 - [Release] 從二進位檔驗證腳本中移除不必要的 Bintray 驗證
- ARROW-45 - [Python] 為 List 類型新增 unnest/flatten 函數
- ARROW-554 - [C++] 實作函數以使多個 Arrow 陣列之間不相等的字典一致
- ARROW-854 - [Format] 支援 sparse tensor
- ARROW-912 - [Python] 在 development.rst 中考量多架構系統
錯誤修正
- ARROW-1847 - [Doc] 以 FAQ 方式記錄 RecordBatch 和 Table 之間的差異
- ARROW-1994 - [Python] 針對 Pandas master 進行測試
- ARROW-2026 - [Python] 將所有時間戳記解析度轉換為 INT96 use_deprecated_int96_timestamps=True
- ARROW-2038 - [Python] s3fs Parquet 支援的後續錯誤修正
- ARROW-2113 - [Python] CLASSPATH 中包含 “hadoop” 的不完整 CLASSPATH 可能會誤導 classpath 設定 HDFS 邏輯
- ARROW-2591 - [Python] 將空的 ListType 欄位寫入 Parquet 時發生區段錯誤
- ARROW-2592 - [Python] 由於中繼資料向後相容性問題,讀取舊的 Parquet 檔案時發生錯誤
- ARROW-2708 - [C++] arrow::compute 中的內部 GetValues 函數應檢查 nullptr
- ARROW-2970 - [Python] Binary/String/FixedSizeBinary 的 NumPyConverter::Visit 可能會溢位
- ARROW-3058 - [Python] 當從 pandas 轉換產生 ChunkedArray 時,Feather 讀取失敗並出現難以理解的錯誤
- ARROW-3186 - [GLib] Travis CI 中的 mesonbuild 失敗
- ARROW-3202 - [C++] 建置在 Alpine Linux 上未成功
- ARROW-3225 - [C++/Python] ListType 的 Pandas 物件轉換
和 ListType - ARROW-3324 - [Parquet] 在寫入多個 row group 時釋放更多內部資源
- ARROW-3343 - [Java] Java 測試在 Flight 測試中以記憶體洩漏非確定性地失敗
- ARROW-3405 - [Python] 文件化 CSV 讀取器
- ARROW-3428 - [Python] 當將浮點數轉換為布林值時,from_pandas 給出不正確的結果
- ARROW-3436 - [C++] Gandiva 要求的 Boost 版本對於 Ubuntu 14.04 來說太新
- ARROW-3437 - [Gandiva][C++] 使用 LDFLAGS 設定 libgcc、libstdc++ 的靜態連結
- ARROW-3438 - [Packaging] 變更記錄中的逸出項目符號
- ARROW-3445 - [GLib] Parquet GLib 未連結 Arrow GLib
- ARROW-3449 - [C++] 支援 CMake 3.2 以進行 “out of the box” 建置
- ARROW-3466 - [Python] 匯入 tensorflow 和 pyarrow 時當機
- ARROW-3467 - 針對外部雙精度轉換進行建置已損壞
- ARROW-3470 - [C++] Row-wise 轉換教學已過時
- ARROW-3477 - [C++] Testsuite 在 32 位元架構上失敗
- ARROW-3480 - [Website] Ubuntu 的安裝文件已損壞
- ARROW-3485 - [C++] 範例因 Protobuf 錯誤而失敗
- ARROW-3494 - [C++] re2 conda-forge 套件在 toolchain 中無法運作
- ARROW-3516 - [C++] 在 parallel_memcpy 中使用 unsigned 類型表示指標的差異
- ARROW-3517 - [C++] MinGW 32 位元建置導致 g++ segv
- ARROW-3524 - [C++] 修復 clang-6 上 ARROW-3409 的編譯器警告
- ARROW-3527 - [R] R 套件 C++ 程式碼中未使用的變數
- ARROW-3528 - [R] R 文件中的錯字
- ARROW-3535 - [Python] pip install tensorflow 在 manylinux1 建置中安裝太新的 numpy
- ARROW-3541 - [Rust] 更新 BufferBuilder 以允許新的位元封裝 BooleanArray
- ARROW-3544 - [Gandiva] 在多個編譯單元中填入函數登錄檔,以減輕發行模式中冗長的編譯時間
- ARROW-3549 - [Rust] 將 i64 取代為 usize 以用於某些位元公用程式函數
- ARROW-3573 - [Rust] with_bitset 未正確設定有效位元
- ARROW-3580 - [Gandiva][C++] 使用 g++ 8.2.0 建置錯誤
- ARROW-3586 - [Python] 將空表格轉換為具有 categoricals 的 pandas 時發生區段錯誤
- ARROW-3598 - [Plasma] plasma_store_server 無法與啟用 GPU 的情況連結
- ARROW-3613 - [Go] Resize 未正確更新長度
- ARROW-3614 - [R] 處理從 Arrow 到 R 的 Type::TIMESTAMP
- ARROW-3634 - [GLib] cuda.cpp 編譯錯誤
- ARROW-3658 - [Rust] `List 的偏移緩衝區驗證不正確
\` - ARROW-3670 - [C++] 使用 FindBacktrace 尋找 execinfo.h 支援
- ARROW-3687 - [Rust] 任何測量陣列槽位都應為 `usize`
- ARROW-3698 - [C++] 在 Gandiva 中使用大型表格時發生區段錯誤
- ARROW-3700 - [C++] CSV 剖析器應允許忽略空行
- ARROW-3703 - [Python] 若 datetime 欄位具有時區,DataFrame.to_parquet 會當機
- ARROW-3704 - [Gandiva] 無法使用 g++ 8.2.0 建置
- ARROW-3707 - [C++] 使用 zstd 1.3.7 的測試失敗
- ARROW-3711 - [C++] 不要將 CXX_FLAGS 傳遞至 C_FLAGS
- ARROW-3712 - [CI] 授權檢查迴歸 (RAT 失敗)
- ARROW-3715 - [C++] gflags_ep 無法使用 CMake 3.13 建置
- ARROW-3716 - [R] ChunkedArray 轉換的遺失案例
- ARROW-3728 - [Python] 合併 Parquet 檔案 - Schema Mismatch 中的 Pandas Meta
- ARROW-3734 - [C++] 在 Arch x86-64 上連結靜態 zstd 程式庫失敗
- ARROW-3740 - [C++] 以小於目前附加長度的長度呼叫 ArrayBuilder::Resize 會導致無效狀態
- ARROW-3742 - 修復 pyarrow.types & gandiva cython 繫結
- ARROW-3745 - [C++] CMake 多次將靜態程式庫傳遞至連結器
- ARROW-3754 - [Packaging] linux 套件建置上的 Zstd 設定錯誤
- ARROW-3756 - [CI/Docker/Java] Java 測試在 docker-compose 設定中失敗
- ARROW-3762 - [C++] 當 Parquet arrow::Table 讀取超過 BinaryArray 容量時發生錯誤
- ARROW-3765 - [Gandiva] 當未配置有效性位元地圖時發生 Segfault
- ARROW-3766 - [Python] pa.Table.from_pandas 未使用 schema 排序
- ARROW-3768 - [Python] 將 classpath 設定為 hdfs 而非 hadoop 可執行檔
- ARROW-3790 - [C++] 當類型大小相同時,有號到無號整數轉換產生不正確的結果
- ARROW-3792 - [Python] 將空的 RecordBatches 寫入 Parquet 時發生區段錯誤
- ARROW-3793 - [C++] TestScalarAppendUnsafe 未測試不安全的附加
- ARROW-3797 - [Rust] BinaryArray::value_offset 在偏移案例中不正確
- ARROW-3805 - [Gandiva] 在 if-else 運算式中處理 null 有效性位元地圖
- ARROW-3831 - [C++] arrow::util::Codec::Decompress() 未回傳解壓縮的資料大小
- ARROW-3835 - [C++] arrow::io::CompressedOutputStream::raw() 實作遺失
- ARROW-3837 - [C++] Windows 上的 gflags 連結錯誤
- ARROW-3866 - [Python] 欄位中繼資料未傳輸至 pyarrow 中的表格
- ARROW-3874 - [Gandiva] 無法建置:未正確偵測到 LLVM
- ARROW-3879 - [C++] cuda-test 失敗
- ARROW-3888 - [C++] 使用 gcc 7.3.0 的編譯警告
- ARROW-3889 - [Python] 使用無效參數建立 schema 會導致 segmanetation fault
- ARROW-3890 - [Python] 使用明確字串類型建立 Array 在 Python 2.7 上失敗
- ARROW-3894 - [Python] 讀取沒有 record batch 的 IPC 檔案時發生錯誤
- ARROW-3898 - parquet-arrow 範例有編譯錯誤
- ARROW-3920 - Plasma 參考計數在 TensorFlow 自訂運算子中未正確完成。
- ARROW-3931 - 使建置可以不考慮 LANG
- ARROW-3936 - 將 _O_NOINHERIT 新增至 Windows 上的檔案開啟旗標
- ARROW-3937 - [Rust] Rust nightly 建置失敗
- ARROW-3940 - [Python/Documentation] 將必要的套件新增至開發指示
- ARROW-3941 - [R] RecordBatchStreamReader$schema
- ARROW-3942 - [R] Feather api 修正
- ARROW-3953 - 與 pandas 0.24 將 MultiIndex labels 重新命名為 codes 相容
- ARROW-3955 - [GLib] 新增 (transfer full) 以在不再需要時釋放
- ARROW-3957 - [Python] 當使用者使用錯誤的埠連線至 HDFS 叢集時,提供更好的錯誤訊息
- ARROW-3961 - [Python/Documentation] 修復 pyarrow README 中錯誤的路徑
- ARROW-3969 - [Rust] CI 建置中斷,因為 nightly toolchain 上沒有 rustfmt
- ARROW-3976 - [Ruby] CLI 上的 Homebrew 捐款請求中斷 CI 建置
- ARROW-3977 - [Gandiva] gandiva cpp 測試未在 CI 中執行
- ARROW-3979 - [Gandiva] 修復所有 valgrind 報告的錯誤
- ARROW-3980 - [C++] 修復 json-simple.cc 中的 CRTP 用法
- ARROW-3989 - [Rust] CSV 讀取器應處理布林值的案例靈敏度
- ARROW-3996 - [C++] 建置的描述不足
- ARROW-4008 - [C++] 整合測試可執行檔失敗
- ARROW-4011 - [Gandiva] 在建置目錄中參考 irhelpers.bc
- ARROW-4019 - [C++] 修復 coverity 問題
- ARROW-4033 - [C++] thirdparty/download_dependencies.sh 使用舊版 Linux 中不可用的工具或選項
- ARROW-4034 - [Ruby] FileOutputStream 的介面未遵循 append=True
- ARROW-4041 - [CI] Python 2.7 執行使用 Python 3.6
- ARROW-4049 - [C++] Arrow 從未使用 glog,即使 glog 已連結。
- ARROW-4052 - [C++] glog 和 gflags 的連結器錯誤
- ARROW-4053 - [Python/Integration] HDFS 測試因對已關閉檔案的 I/O 操作而失敗
- ARROW-4055 - [Python] 無法使用 2018.3 及更早版本轉換 pytz.utc
- ARROW-4058 - [C++] arrow-io-hdfs-test 在針對 docker-compose 中的 HDFS 叢集執行時失敗
- ARROW-4065 - [C++] arrowTargets.cmake 已損壞
- ARROW-4066 - 建立 Sphinx 文件的指示
- ARROW-4070 - [C++] ARROW_BOOST_VENDORED 無法與 ninja 建置正常運作
- ARROW-4073 - [Python] AppVeyor 上的 Parquet 測試失敗
- ARROW-4074 - [Python] 若程式庫安裝在與 conda 或 wheel 套件不同的位置,test_get_library_dirs_win32 會失敗
- ARROW-4078 - [CI] 當 docs/ 變更時,執行建置文件的 Travis 工作
- ARROW-4088 - [Python] 當傳遞具有中繼資料的 schema 時,Table.from_batches() 失敗
- ARROW-4089 - [Plasma] 關於 PlasmaClient.Create 的參數類型,教學課程是錯誤的
- ARROW-4101 - [C++] Binary 恆等轉換未實作
- ARROW-4106 - [Python] 由於 hypothesis 更新中斷其 API,測試無法執行
- ARROW-4109 - [Packaging] arrow-cpp conda recipe 中遺失 glog 依賴項
- ARROW-4113 - [R] 版本號碼修補程式中斷建置
- ARROW-4114 - [C++][DOCUMENTATION]
- ARROW-4115 - [Gandiva] valgrind 抱怨布林輸出資料緩衝區具有未初始化的資料
- ARROW-4118 - [Python] “asv run” 發生錯誤
- ARROW-4125 - [Python] 若未建置 Plasma 擴充功能 (例如在 Windows 上),ASV 基準測試無法執行
- ARROW-4126 - [Go] 存取布林陣列時未使用偏移
- ARROW-4128 - [C++][DOCUMENTATION] 更新樣式指南以反映更多例外
- ARROW-4130 - [Go] 存取二進位陣列時未使用偏移
- ARROW-4134 - [Packaging] 在 docker 測試中正確設定時區以防止 ORC 介面卡中止
- ARROW-4135 - [Python] 無法重新載入包含 datetime.time 清單的 pandas dataframe
- ARROW-4137 - [Rust] 將 parquet 程式碼移至個別的 crate
- ARROW-4138 - [Python] setuptools_scm 自訂在 Windows 上不適用於 0.9.0 以上版本
- ARROW-4147 - [JAVA] 減少可變寬度向量的堆積使用量
- ARROW-4149 - [CI/C++] Parquet 測試在 CMake 3.2 nightly 建置中遺失 ZSTD 壓縮編解碼器
- ARROW-4157 - [C++] Ubuntu 18.04 上 clang 6.0 的 -Wdocumentation 編譯失敗問題
- ARROW-4171 - [Rust] 修復 parquet crate 發行版本
- ARROW-4173 - dev/merge_arrow_pr.py 的錯誤訊息中 JIRA 函式庫名稱錯誤
- ARROW-4178 - [C++] 修復 TSan 和 UBSan 錯誤
- ARROW-4179 - [Python] 測試在 CI 中於所有平台崩潰
- ARROW-4185 - [Rust] Appveyor 建置已損壞
- ARROW-4186 - [C++] 當 length=0 時 BitmapWriters 覆寫第一個位元組
- ARROW-4188 - [Rust] 頂層 rust 目錄中應有一個 README 檔案
- ARROW-4197 - [C++] Emscripten 編譯器編譯 Arrow 失敗
- ARROW-4200 - [C++] conda_env_* 檔案無法在 Windows 上用於建立全新的 conda 環境
- ARROW-4209 - [Gandiva] 返回 IR 結構體導致 Windows 出現問題
- ARROW-4215 - [GLib] 修復文件中的錯字
- ARROW-4227 - [GLib] 複合資料類型中的欄位返回錯誤的資料類型
- ARROW-4237 - [Packaging] 修復發行驗證腳本中的 CMAKE_INSTALL_LIBDIR
- ARROW-4238 - [Packaging] 修復 crossbow 和 rake 之間的 RC 版本衝突
- ARROW-4246 - [Plasma][Python] PlasmaClient.list 無法與啟用 CUDA 的 Plasma 運作
- ARROW-4256 - [Release] 更新 0.12 發行版本的 Windows 驗證腳本
- ARROW-4258 - [Python] 從帶有 NaN 的 numpy float64 陣列安全轉換為整數失敗
- ARROW-4260 - [Python] test_serialize_deserialize_pandas 在多個建置項目中失敗