Apache Arrow 0.17.0 (2020 年 4 月 20 日)
這是一個主要版本,涵蓋超過 2 個月的開發。
下載
- 原始碼 Artifacts
- 二進位 Artifacts
- Git 標籤
貢獻者
此版本包含來自 79 位不同貢獻者的 569 個提交。
$ git shortlog -sn apache-arrow-0.16.0..apache-arrow-0.17.0
80 Antoine Pitrou
78 Krisztián Szűcs
58 Wes McKinney
55 Neal Richardson
39 Sutou Kouhei
30 Benjamin Kietzman
26 Joris Van den Bossche
20 Andy Grove
13 liyafan82
11 David Li
11 François Saint-Jacques
8 Micah Kornfield
8 Projjal Chanda
7 Max Burke
7 Prudhvi Porandla
6 Kenta Murata
6 Uwe L. Korn
6 Yibo Cai
6 tianchen
5 Frank Du
5 Martin Radev
4 Rok
3 Paddy Horan
3 Takashi Hashida
3 Yosuke Shiro
3 Zhuo Peng
2 Bryan Cutler
2 David Kegley
2 Jacek Pliszka
2 Ji Kunshang
2 Jorge C. Leitao
2 Jörn Horstmann
2 Kazuaki Ishizaki
2 Markus Westerlind
2 Morgan Cassels
2 Ryan Murray
2 Sam Albers
2 Siyuan
2 Stephanie Wang
2 Yuqi Gu
2 gawain.bolton
1 Adam Hooper
1 Andreas Zimmerer
1 Bryant Biggs
1 Chao Sun
1 Dan Nugent
1 Dominik Durner
1 Eyal Farago-Hagag
1 Grant Monroe
1 Hatem Helal
1 Ismaël Mejía
1 John Muehlhausen
1 Ken Suenobu
1 Kevin Conaway
1 Li, Jiajia
1 Mahmut Bulut
1 Marius van Niekerk
1 Michael Chirico
1 NAITOH Jun
1 Neville Dipale
1 Omega Gamage
1 Onur Satici
1 Palmer Lao
1 Paul Balanca
1 Prudhvi
1 Ravindra Wagh
1 Richard Artoul
1 Sebastien Binet
1 TP Boudreau
1 Tarek Allam
1 Tobias Mayer
1 Yuan Zhou
1 Zherui Cao
1 andy-thomason
1 caleboverman
1 mubai
1 psuman
1 ravindra-wagh
1 wenjun.swj
Patch Committers
以下 Apache committers 合併了貢獻的 patches 到 repository。
$ git shortlog -csn apache-arrow-0.16.0..apache-arrow-0.17.0
128 Wes McKinney
109 Krisztián Szűcs
86 Antoine Pitrou
61 Neal Richardson
60 Sutou Kouhei
33 Benjamin Kietzman
23 Andy Grove
14 François Saint-Jacques
10 Micah Kornfield
7 Paddy Horan
7 Praveen
5 David Li
5 Sebastien Binet
3 GitHub
3 Joris Van den Bossche
3 Neville Dipale
3 Pindikura Ravindra
3 Yosuke Shiro
2 Bryan Cutler
2 Philipp Moritz
1 Brian Hulette
1 Chao Sun
變更日誌
新功能與改進
- ARROW-1560 - [C++] “match” 函數的 Kernel 實作
- ARROW-1571 - [C++] 使用 O(n) 計數排序實作整數的 argsort kernels (排序索引)
- ARROW-1581 - [Packaging] 使 nightly wheels 可用於安裝的工具
- ARROW-1582 - [Python] 設定 + 文件化 macOS 的 nightly conda builds
- ARROW-1636 - [Format] Null type 的整合測試
- ARROW-2447 - [C++] 建立裝置抽象化
- ARROW-3054 - [Packaging] 使 nightly conda packages 可以更新到 anaconda.org channel 的工具
- ARROW-3410 - [C++][Dataset] 記憶體受限環境的 Streaming CSV reader 介面
- ARROW-3750 - [R] 通過 reticulate 以零複製方式將 Python 中建立的各種 wrapped Arrow 物件傳遞到 R 中
- ARROW-4120 - [Python] 定義測試程序的流程,以檢查是否沒有巨觀層級的記憶體洩漏
- ARROW-4226 - [Format][C++] 新增 CSF sparse tensor 支援
- ARROW-4304 - [Rust] 增強 arrow 的文件
- ARROW-4428 - [R] R build 的功能標誌
- ARROW-4482 - [Website] 新增部落格存檔頁面
- ARROW-4815 - [Rust] [DataFusion] 新增 SQL projection 中 * 的支援
- ARROW-5357 - [Rust] 在 Buffer 中新增 capacity 欄位
- ARROW-5405 - [Documentation] 將整合測試文件移至 Sphinx 文件,新增 JavaScript 的說明
- ARROW-5497 - [Release] 建置和發布 R/Java/JS 文件
- ARROW-5501 - [R] 重新組織 read/write file/stream 函數
- ARROW-5510 - [Format] 基於 Arrow IPC 檔案格式的 Feather V2,具有壓縮支援
- ARROW-5563 - [Format] 更新整合測試 JSON 格式文件
- ARROW-5585 - [Go] 將 arrow.TypeEquals 重新命名為 arrow.TypeEqual
- ARROW-5742 - [CI] 新增每日/每週 Valgrind build
- ARROW-5757 - [Python] 停止支援 Python 2.7
- ARROW-590 - [Integration] 新增 Union types 的整合測試
- ARROW-5949 - [Rust] 實作 DictionaryArray
- ARROW-6165 - [Integration] 使用 multiprocessing 在多個 CPU 核心上執行整合測試
- ARROW-6176 - [Python] 允許 subclass ExtensionArray 以附加到自訂 extension type
- ARROW-6393 - [C++] 在 SparseTensor::Equals 中新增 EqualOptions 支援
- ARROW-6479 - [C++] 內嵌來自外部專案 build logs 的 errors
- ARROW-6510 - [Python][Filesystem] 公開奈秒解析度 mtime
- ARROW-6666 - [Rust] [DataFusion] 實作字串字面值表達式
- ARROW-6724 - [C++] 為 BufferOutputStream 新增比目前 Create 函數更簡單的靜態 ctor
- ARROW-6821 - [C++][Parquet] 建置時不需 Thrift 編譯器 (但仍需 library)
- ARROW-6823 - [C++][Python][R] 支援 feather 格式的 metadata?
- ARROW-6837 - [C++/Python] 訪問 File Footer custom_metadata
- ARROW-6841 - [C++] 升級到 LLVM 8
- ARROW-6875 - [FlightRPC] 為 ListFlights RPC / list_flights 方法實作 Criteria
- ARROW-6915 - [Developer] 不要用 merge script 覆寫 minor release 版本,即使 committer 沒有指定
- ARROW-6947 - [Rust] [DataFusion] 新增 scalar UDFs 的支援
- ARROW-6996 - [Python] 在 Table 上公開 boolean filter kernel
- ARROW-7044 - [Release] 為 home-brew formulas 建立發布後腳本
- ARROW-7048 - [Java] 支援在 VectorSchemaRoot 下組合多個 vectors
- ARROW-7063 - [C++] Schema print 方法印出過多的 metadata
- ARROW-7073 - [Java] 支援在 batch 中串連 vectors 值
- ARROW-7080 - [Python][Parquet][C++] 在 Schema 物件中公開 parquet field_id
- ARROW-7091 - [C++] 將所有 factories 移動到 type_fwd.h
- ARROW-7119 - [C++][CI] 使用 scripts/util_coredump.sh 顯示自動 backtraces
- ARROW-7201 - [GLib][Gandiva] 新增 BooleanNode 支援
- ARROW-7202 - [R][CI] 改善 CI 上的 rwinlib 建置,以停止重新下載 dependencies
- ARROW-7222 - [Python][Release] 更新網站時清除任何現有的 generated Python API 文件
- ARROW-7233 - [C++] 新增 Result
APIs to IPC module - ARROW-7256 - [C++] 移除 ARROW_MEMORY_POOL_DEFAULT macro
- ARROW-7330 - [C++] 新增 Result
to APIs to arrow/gpu - ARROW-7332 - [C++][Parquet] 在 PARQUET_CATCH_NOT_OK 中明確捕捉 status exceptions
- ARROW-7336 - [C++] 實作 MinMax options 以不跳過 nulls
- ARROW-7338 - [C++] 改善 InMemoryDataSource 以支援 generator 而不是 static list
- ARROW-7365 - [Python] 支援轉換為 numpy/pandas 中的 FixedSizeList type
- ARROW-7400 - [Java] 避免 quick sort 的最壞情況
- ARROW-7412 - [C++][Dataset] 確保 dataset code 對於具有重複 field names 的 schemas 具有 robust
- ARROW-7419 - [Python] 支援 SparseCSCMatrix
- ARROW-7427 - [Python] 支援 SparseCSFTensor
- ARROW-7428 - [Format][C++] 為 CSF sparse tensors 新增序列化
- ARROW-7444 - [GLib] 新增 LocalFileSystem 支援
- ARROW-7462 - [C++] 為 Arm64 Architecture 新增 CpuInfo 偵測
- ARROW-7491 - [Java] 提升 aligning 的效能
- ARROW-7515 - [C++] 將 nonexistent 和 non_existent 重新命名為 not_found
- ARROW-7524 - [C++][CI] 在 VS2019 GitHub Actions job 中建置 parquet 支援
- ARROW-7530 - [Developer] 不要在 squashed summary message 中包含來自 PR 的 commits 列表
- ARROW-7534 - [Java] 建立新的 java/contrib module
- ARROW-7547 - [C++] [Python] [Dataset] ParquetFileFormat 中的額外 reader options
- ARROW-7587 - [C++][Compute] 新增 Top-k kernel
- ARROW-7608 - [C++][Dataset] 公開更多資訊屬性
- ARROW-7615 - [CI][Gandiva] 確保 gandiva_jni library 只有白名單中的一組 shared dependencies 作為 Travis CI job 的一部分
- ARROW-7616 - [Java] 支援比較 dense union vector 的 value ranges
- ARROW-7625 - [GLib] Parquet GLib 和 Red Parquet (Ruby) 不允許指定 compression type
- ARROW-7641 - [R] 使 dataset vignette 具有 executable code
- ARROW-7662 - [R] 支援從 R list 建立 ListArray
- ARROW-7664 - [C++] 從 FileSystemFromUri 提取 localfs default
- ARROW-7675 - [R][CI] 將 Windows CI 從 Appveyor 移至 GHA
- ARROW-7679 - [R] 更乾淨的介面用於建立 UnionDataset
- ARROW-7684 - [Rust] 為 DataFusion 提供 Flight server 的範例
- ARROW-7685 - [Developer] 為 Crossbow 新增 GitHub Actions 支援
- ARROW-7691 - [C++] 在 walking Flatbuffers data 時驗證 missing fields
- ARROW-7708 - [Release] 在 release changelogs 中包含來自 git changelog 的 PARQUET commits
- ARROW-7712 - [CI][Crossbow] 修復或刪除 fuzzit jobs
- ARROW-7720 - [C++][Python] 為 Table.equals 新增 check_metadata 參數
- ARROW-7725 - [C++] 為 unity builds 和 precompiled headers 新增基礎架構
- ARROW-7726 - [CI] [C++] 在 Windows GHA build 上使用 boost binaries
- ARROW-7729 - [Python][CI] 在 dask integration test 中將 pandas 版本釘選為 0.25
- ARROW-7733 - [Developer] 在本地安裝足夠新版本的 Go 以用於 release verification script
- ARROW-7735 - [Release] conda-forge channel 遺失,用於驗證 wheels
- ARROW-7736 - [Release] 二進位驗證有時會因暫時性錯誤而失敗
- ARROW-7739 - [GLib] 使用 placement new 初始化 private structs 中的 shared_ptr 物件
- ARROW-7741 - [C++][Parquet] 在 parquet write path 中加入新的 level generation logic,並帶有一個 flag 以還原回舊邏輯
- ARROW-7742 - [GLib] 新增 MapArray 支援
- ARROW-7745 - [Doc] [C++] 更新 Parquet 文件
- ARROW-7749 - [C++] 將更多 tests 連結在一起
- ARROW-7750 - [Release] 使 source release verification script 可重新啟動
- ARROW-7751 - [Release] macOS wheel verification 也需要 arrow-testing
- ARROW-7752 - [Release] 在 verification script 中啟用和測試 dataset
- ARROW-7754 - [C++] Result
is slow - ARROW-7761 - [C++] 為 fs::FileSystemFromUri 新增 S3 支援
- ARROW-7764 - [C++] Builders 分配一個 null bitmap buffer,即使沒有 nulls
- ARROW-7771 - [Developer] 在 verification scripts 中使用 ARROW_TMPDIR 環境變數而不是 TMPDIR
- ARROW-7774 - [Packaging][Python] 更新 macos 和 windows wheel 檔案名稱
- ARROW-7787 - [Rust] 為 Table API 新增 collect
- ARROW-7788 - [C++] 為 map type 新增 schema conversion 支援
- ARROW-7790 - [Website] 更新如何安裝 Linux packages
- ARROW-7795 - [Rust - DataFusion] 支援 boolean negation (NOT)
- ARROW-7796 - [R] write_* 函數應不可見地返回其 inputs
- ARROW-7799 - [R][CI] 從 homebrew formulae 中移除 flatbuffers
- ARROW-7804 - [C++][R] macOS 10.11 上的編譯錯誤
- ARROW-7812 - [Packaging][Python] 升級 manylinux1 docker image 中的 LLVM
- ARROW-7817 - [CI] macOS R autobrew nightly 在從 source 安裝 dependency 時失敗
- ARROW-7819 - [C++][Gandiva] 為 Filter/Projector classes 新增 DumpIR
- ARROW-7824 - [C++][Dataset] 提供 Dataset writing to IPC format
- ARROW-7828 - [Release] 移除內部使用的 SSH keys
- ARROW-7829 - [R] 在 clang 上測試 R bindings
- ARROW-7833 - [R] 使 install_arrow() 實際安裝 arrow
- ARROW-7834 - [Release] 更新文件發布後任務
- ARROW-7839 - [Python][Dataset] 為 python bindings 新增 IPC format
- ARROW-7846 - [Python][Dev] 移除對 six 的最後依賴
- ARROW-7849 - [Packaging][Python] 從 nightlies 中移除剩餘的 py27 crossbow wheel tasks
- ARROW-7858 - [C++][Python] 支援將 Extension type 轉換為其 storage type
- ARROW-7859 - [R] 用於 CRAN submission 0.16.0.2 的 Minor patches
- ARROW-7862 - [R] 預設情況下,Linux 安裝應更安靜
- ARROW-7863 - [C++][Python][CI] 確保執行 HDFS 相關測試
- ARROW-7864 - [R] 確保 bundled installation 即使存在 system packages 也能正常運作
- ARROW-7865 - [R] 在最新的 Linux 版本上測試 builds
- ARROW-7868 - [Crossbow] 減少 GitHub API query parallelism
- ARROW-7869 - [Python] Python wheels 中不再需要 Boost::system 和 boost::filesystem
- ARROW-7872 - [Python] 支援在 Array/Table.to_pandas 中轉換 list-of-struct
- ARROW-7874 - [Python][Archery] 使用 numpydoc 驗證 docstrings
- ARROW-7876 - [R] 安裝在文件產生 image 中失敗
- ARROW-7877 - [Packaging] 修復 crossbow deployment 到 github artifacts
- ARROW-7879 - [C++][Doc] 為 Device API 新增文件
- ARROW-7880 - [CI][R] R sanitizer job 沒有真正運作
- ARROW-7881 - [C++] 修復 pedantic warnings
- ARROW-7882 - [C++][Gandiva] 優化 substring pattern 的 like 函數
- ARROW-7886 - [C++][Dataset] 合併 Source 和 Dataset
- ARROW-7888 - [Python] 允許在 pyarrow.jvm 中使用更現代版本的 jpype
- ARROW-7890 - [C++] 新增 Promise / Future 實作
- ARROW-7891 - [C++] RecordBatch->Equals 也應具有 check_metadata 參數
- ARROW-7892 - [Python] 公開 FilesystemSource.format 屬性
- ARROW-7895 - [Python] 移除更多 python 2.7 cruft
- ARROW-7896 - [C++] 將從 #include guards 重構為 #pragma once
- ARROW-7897 - [Packaging] 暫時停用 artifact 上傳,直到我們修復 deployment issues
- ARROW-7898 - [Python] 使用 numpydoc 減少 docstring violations 的數量
- ARROW-7904 - [C++] 決定 Field/Schema metadata 列印參數以及預設顯示多少
- ARROW-7907 - [Python] 轉換為具有 timestamp type 的 empty table 的 pandas 會中止
- ARROW-7912 - [Format] C data interface
- ARROW-7913 - [C++][Python][R] C data interface 的 C++ 實作
- ARROW-7915 - [CI] [Python] 在啟用 Python development mode 的情況下執行 tests
- ARROW-7916 - [C++][Dataset] 將 IPC record batches 投射到 materialized fields
- ARROW-7917 - [CMake] FindPythonInterp 應檢查 python3
- ARROW-7919 - [R] 如果適當,install_arrow() 應 conda install
- ARROW-7920 - [R] 填寫一些遺失的 input validation
- ARROW-7921 - [Go] 為各種 components 新增 Reset 方法並清理 comments
- ARROW-7927 - [C++] 修復 ‘cpu_info.cc’ 編譯 warning
- ARROW-7929 - [C++] CMake target names 與 upstream 提供的 names 不同
- ARROW-7930 - [Python][CI] 在 CI 中測試 jpype integration
- ARROW-7932 - [Rust] [Parquet] 為 temporal types 實作 array reader
- ARROW-7934 - [C++] 修復空字串的 UriEscape
- ARROW-7935 - [Java] 移除 BufferAllocator 和 ReferenceManager 的 Netty dependency
- ARROW-7937 - [Python][Packaging] 從 macos wheels 中移除 boost
- ARROW-7941 - [Rust] [DataFusion] Logical plan 應支援 unresolved column references
- ARROW-7943 - [C++][Parquet] 新增一個能夠處理 nested data 的新 level builder
- ARROW-7947 - [Rust] [Flight] [DataFusion] 為 get_schema 實作範例
- ARROW-7949 - [Developer] 更新 ‘.gitignore’ 以不追蹤 user specific ‘cpp/Brewfile.lock.json’ 檔案
- ARROW-7951 - [Python][Parquet] 將 BYTE_STREAM_SPLIT 公開到 pyarrow
- ARROW-7959 - [Ruby] 再次新增 Ruby 2.3 的支援
- ARROW-7963 - [C++][Python][Dataset] 公開 listing fragments
- ARROW-7965 - [Python] 優化更高等級的 dataset API
- ARROW-7966 - [Integration][Flight][C++] Client 應獨立驗證每個 batch
- ARROW-7969 - [Packaging] 使用 cURL 上傳 artifacts
- ARROW-7970 - [Packaging][Python] 使用 system boost 建置 macos wheels
- ARROW-7971 - [Rust] 建立 rowcount utility
- ARROW-7977 - [C++] 將 fs::FileStats 重新命名為 fs::FileInfo
- ARROW-7979 - [C++] 在 IPC messages 中實作 experimental buffer compression
- ARROW-7982 - [C++] 讓 ArrayDataVisitor 接受 void-returning functions
- ARROW-7983 - [CI][R] Nightly builds 在失敗時應更 verbose
- ARROW-7984 - [R] 在更多地方檢查 valid inputs
- ARROW-7986 - [Python] pa.Array.from_pandas 無法轉換包含 pyspark.ml.linalg.SparseVector 的 pandas.Series
- ARROW-7987 - [CI][R] 修復 verbose nightly builds
- ARROW-7988 - [R] 修復 reticulate bindings 中的 on.exit calls
- ARROW-7991 - [C++][Plasma] 允許在建立物件時,如果已滿則 evicting 的選項
- ARROW-7993 - [Java] 支援 ComplexCopier 中的 decimal type
- ARROW-7994 - [CI][C++] 將 AppVeyor MinGW builds 移至 GitHub Actions
- ARROW-7995 - [C++] IO: coalescing 和 caching read ranges
- ARROW-7998 - [C++][Plasma] 使 Seal requests 同步
- ARROW-8005 - [Website] 檢閱和調整網站/工具中 Apache dist system 的任何用法
- ARROW-8014 - [C++] 提供 CMake targets 以僅在給定 label 內測試
- ARROW-8016 - [Developer] 修復 PR merge tool 中的 deprecation warning
- ARROW-8018 - [C++][Parquet]Parquet Modular Encryption
- ARROW-8024 - [R] BinaryType 和 FixedBinaryType 的 Bindings
- ARROW-8026 - [Python] 除了用於建構字串和二進位 type arrays 的字串 value types 外,還支援 memoryview
- ARROW-8027 - [Developer][Integration] 為重複 field names 新增整合測試
- ARROW-8028 - [Go] 允許 schemas 和 nested types 中重複的 field names
- ARROW-8030 - [C++][Plasma] 修復 inconsistent comment style
- ARROW-8039 - [Python][Dataset] 支援在 pyarrow.parquet 中使用 dataset API,並使用 minimal ParquetDataset shim
- ARROW-8044 - [CI][NIGHTLY:gandiva-jar-osx] pygit2 需要 libgit2 v1.0.x
- ARROW-8055 - [GLib][Ruby] 為 GArrowSchema 新增一些 metadata bindings
- ARROW-8058 - [C++][Python][Dataset] 在 FileSystemDatasetFactoryOptions 中提供一個選項來切換 validation 和 schema inference
- ARROW-8059 - [Python] 使 FileSystem 物件可序列化
- ARROW-8060 - [Python] 使 dataset Expression 物件可序列化
- ARROW-8061 - [C++][Dataset] 指定 ParquetFileFragment 粒度的能力 (支援 row groups)
- ARROW-8063 - [Python] 為 Datasets API 新增 user guide 文件
- ARROW-8064 - [Dev] 通過 Github actions 實作 Comment bot
- ARROW-8072 - [C++][Plasma] 在 parsing data 時新增 const constraint
- ARROW-8077 - [Python] 為 Windows on Python 3.5 新增 wheel build script 和 Crossbow configuration
- ARROW-8079 - [Python] 為 KeyValueMetadata 實作 wrapper,在相關情況下 duck-typing dict
- ARROW-8080 - [C++] 新增 AVX512 build 選項
- ARROW-8082 - [Java][Plasma] 新增 JNI list() 介面
- ARROW-8083 - [GLib] 為 GIOInputStream 新增 Peek() 支援
- ARROW-8086 - [Java] 支援在 UnionListWriter 中從 big endian byte array 寫入 decimal
- ARROW-8087 - [C++][Dataset] HivePartitioning 的 keys 順序在 resulting schema 中遺失
- ARROW-8096 - [C++][Gandiva] 建立 Interval type 的 null node
- ARROW-8097 - [Dev] Comment bot 的 crossbow command 在 master branch 上執行
- ARROW-8103 - [R] 使預設 Linux build 更 minimal
- ARROW-8104 - [C++] 不要安裝 bundled Thrift
- ARROW-8107 - [Packaging][APT] 為 Debian GNU/Linux stretch 的 LLVM APT repository 使用 HTTPS
- ARROW-8109 - [Packaging][APT] 停止支援 Ubuntu Disco
- ARROW-8117 - [Rust] [Datafusion] 允許從 number CAST 到 timestamp
- ARROW-8118 - [R] FileSystemDataset 的 dim 方法
- ARROW-8120 - [Packaging][APT] 新增 Ubuntu Focal 的支援
- ARROW-8123 - [Rust] [DataFusion] 建立 LogicalPlanBuilder
- ARROW-8124 - [Rust] 更新 library dependencies
- ARROW-8126 - [C++][Compute] 新增 Top-K kernel benchmark
- ARROW-8129 - [C++][Compute] 優化 compare sorting kernel
- ARROW-8130 - [C++][Gandiva] 修復 llvm_generator 中的 Dex visitor 以處理 interval type
- ARROW-8140 - [Developer] Follow NullType -> NullField change
- ARROW-8141 - [C++] 使用 AVX512 Intrinsics API 優化 BM_PlainDecodingBoolean 效能
- ARROW-8145 - [C++] 重新命名 GetTargetInfos
- ARROW-8146 - [C++] 新增 per-filesystem facility 以 sanitize a path
- ARROW-8150 - [Rust] 允許寫入自訂 FileMetaData k/v pairs
- ARROW-8151 - [Benchmarking][Dataset] 使用 S3File 基準測試 Parquet read 效能
- ARROW-8153 - [Packaging] 更新 conda feedstock 檔案並將 artifacts 上傳到 Anaconda
- ARROW-8158 - [Java] 取得 data buffer 和 base variable width vector 的長度
- ARROW-8164 - [C++][Dataset] 讓 datasets 可以使用 non-identical schema 查看
- ARROW-8165 - [Packaging] 使 nightly wheels 在 PyPI server 上可用
- ARROW-8167 - [CI] 新增在 pull request 標題中使用跳過模式略過建置的支援
- ARROW-8168 - [Java][Plasma] 改善 Java Plasma 用戶端堆外記憶體使用量
- ARROW-8177 - [Rust] 將 schema_to_fb_offset 設為 public
- ARROW-8178 - [C++] 升級至 Flatbuffers 1.12
- ARROW-8179 - [R] 調整 Windows 建置腳本,以便在 GHA 上進行 nightly 套件發布
- ARROW-8181 - [Java][FlightRPC] 公開傳輸錯誤元數據
- ARROW-8182 - [Packaging] 遞增從最新的 git 標籤偵測到的版本號
- ARROW-8183 - [c++][FlightRPC] 公開傳輸錯誤元數據
- ARROW-8184 - [Packaging] 在 Anaconda 和 Gemfury 上使用 arrow-nightlies 組織名稱來託管 nightly 版本
- ARROW-8185 - [Packaging] 文件化可用的 nightly wheel 和 conda 套件
- ARROW-8187 - [R] 使測試斷言對 i18n 具有穩健性
- ARROW-8191 - [Packaging][APT] 修復 Debian GNU/Linux Stretch 中的 cmake 移除問題
- ARROW-8192 - [C++] 用於解壓縮 avx512 intrinsics 程式碼的腳本
- ARROW-8194 - [CI] Github Actions Windows 工作應並行執行測試
- ARROW-8195 - [CI] 移除 Github Actions 中的 Boost 下載步驟
- ARROW-8198 - [C++] Diffing 應處理 null 陣列
- ARROW-8200 - [GLib] 將 garrow_file_system_target_info{,s}() 重新命名為 …_file_info{,s}()
- ARROW-8203 - [C#] “dotnet pack” 失敗
- ARROW-8204 - [Rust] [DataFusion] 在 SQL 中新增對別名表達式的支援
- ARROW-8207 - [Packaging][wheel] 在 manylinux2010 和 manylinux2014 中使用 LLVM 8
- ARROW-8215 - [CI][GLib] Meson 安裝在 macOS 建置中失敗
- ARROW-8218 - [C++] 在實驗性 IPC 壓縮程式碼中,在欄位層級並行化解壓縮
- ARROW-8220 - [Python] 使 dataset FileFormat 物件可序列化
- ARROW-8222 - [C++] 使用 bcp 為捆綁建置建立精簡的 boost
- ARROW-8224 - [C++] 移除 0.16.0 之前已棄用的 API
- ARROW-8225 - [Rust] IPC reader 必須遵守 continuation markers
- ARROW-8227 - [C++] 精煉 SIMD 功能定義
- ARROW-8231 - [Rust] 從 parquet FileMetaData 將 key_value_metadata 解析為 arrow schema metadata
- ARROW-8232 - [Python] 棄用 pa.open_file 和 pa.open_stream,改用 pa.ipc.open_file/open_stream
- ARROW-8241 - [Rust] 為 Schema 新增便利方法
- ARROW-8242 - [C++] Flight 在 GCC 4.8 上編譯失敗
- ARROW-8243 - [Rust] [DataFusion] 修復 LogicalPlanBuilder 中不一致的 API
- ARROW-8244 - [Python][Parquet] 新增 `write_to_dataset` 選項以填充 “file_path” 元數據欄位
- ARROW-8246 - [C++] 使用 MinGW 編譯時新增 -Wa,-mbig-obj 以避免連結錯誤
- ARROW-8247 - [Python] 在 pyarrow.parquet.write_table 中公開 Parquet 寫入 “engine” 設定
- ARROW-8249 - [Rust] [DataFusion] 使 Table 和 LogicalPlanBuilder API 更一致
- ARROW-8252 - [CI][Ruby] 新增 Ubuntu 20.04
- ARROW-8256 - [Rust] [DataFusion] 更新 0.17.0 版本的 CLI 文件
- ARROW-8264 - [Rust] [DataFusion] 建立用於列印 record batch 的工具
- ARROW-8266 - [C++] 為外部專案來源下載新增備份鏡像
- ARROW-8267 - [CI][GLib] 在 Ubuntu 16.04 上建置失敗
- ARROW-8271 - [Packaging] 允許 wheel 上傳到 gemfury 失敗
- ARROW-8275 - [Python][Docs] 根據 “Feather V2” 變更審查 Feather + IPC 檔案文件
- ARROW-8277 - [Python] RecordBatch 介面改進
- ARROW-8279 - [C++] 不要從 Codec 實作匯出符號,移除對 PIMPL 模式的需求
- ARROW-8288 - [Python] 在 DataType 上公開 with_ 修飾符
- ARROW-8290 - [Python][Dataset] 改善 FileSystemDataset 建構子的符合人體工學設計
- ARROW-8291 - [Packaging] Conda nightly 建置找不到 Numpy
- ARROW-8292 - [Python][Dataset] 將 schema 傳遞到 dataset() 函數中的 Factory.finish()
- ARROW-8294 - [Format][Flight] 在 Flight 協議中新增 DoExchange RPC
- ARROW-8295 - [C++][Dataset] IpcFileFormat 應明確向下推送欄位投影
- ARROW-8299 - [C++] 可重複使用的 “optional ParallelFor” 函數,用於多執行緒的可選使用
- ARROW-8300 - [R] 0.17 的文件和變更日誌更新
- ARROW-8307 - [Python] 在 pyarrow.feather API 中公開 use_memory_map 選項
- ARROW-8308 - [Rust] [Flight] 在範例中實作 DoExchange
- ARROW-8309 - [CI] C++/Java/Rust 工作流程應在 Flight.proto 變更時觸發
- ARROW-8311 - [C++] 新增 push style stream format reader
- ARROW-8316 - [CI] 設定 docker-compose 使用 docker-cli 而非 docker-py 來建置映像檔
- ARROW-8319 - [CI] 在 debian 建置中安裝 thrift 編譯器
- ARROW-8320 - [Documentation][Format] 釐清 C 資料介面中(缺乏)對齊要求
- ARROW-8321 - [CI] 在 Fedora 30 建置中使用捆綁的 thrift
- ARROW-8322 - [CI] 修復 C# 工作流程檔案語法
- ARROW-8325 - [R][CI] 停止在 R windows bundle 中包含 boost
- ARROW-8329 - [Documentation][C++] Filter 核心中未文件化的 FilterOptions 參數
- ARROW-8330 - [Documentation] post release 腳本使用開發版本產生文件
- ARROW-8332 - [C++] 要求 Thrift 編譯器為 Parquet 建置使用系統 libthrift
- ARROW-8335 - [Release] 新增 crossbow jobs 以執行發布驗證
- ARROW-8336 - [Packaging][deb] 在 Debian 10 和 Ubuntu 19.10 或更高版本上使用 libthrift-dev
- ARROW-8341 - [Packaging][deb] 因磁碟空間不足而建置失敗
- ARROW-8343 - [GLib] 新增 GArrowRecordBatchIterator
- ARROW-8347 - [C++] 新增 Result
API 到 Array 方法 - ARROW-8351 - [R][CI] 將 Rtools 建置的 Arrow C++ 程式庫儲存為建置成品
- ARROW-8352 - [R] 新增 install_pyarrow()
- ARROW-8356 - [Developer] 透過 GitHub actions 支援使用 “crossbow submit” 的 * 萬用字元
- ARROW-8361 - [C++] 新增 Result
API 到 Buffer 方法和函數 - ARROW-8362 - [Crossbow] 確保在 docker 任務中使用本地產生的版本
- ARROW-8367 - [C++] 棄用 Buffer::FromString(…, pool)
- ARROW-8368 - [Format] 在 C 介面中,釐清對於只需要 ArrowArray 中子欄位子集的消費者,資源管理方式
- ARROW-8370 - [C++] 新增 Result
到 type / schema API - ARROW-8371 - [Crossbow] 實作並執行 tasks.yml 的健全性檢查
- ARROW-8372 - [C++] 新增 Result
到 table / record batch API - ARROW-8375 - [CI][R] 使 Windows 測試在發生 segfault 時更詳細
- ARROW-8376 - [R] 為 ScanTask/RecordBatch 迭代器新增實驗性介面
- ARROW-8387 - [Rust] 將 schema_to_fb 設為 public
- ARROW-8389 - [Integration] 並行執行測試
- ARROW-8390 - [R] 公開 schema unification 功能
- ARROW-8393 - [C++][Gandiva] 使 gandiva 函數註冊表不區分大小寫
- ARROW-8396 - [Rust] 從依賴項中移除 libc
- ARROW-8398 - [Python] 移除源自 python 測試的棄用警告
- ARROW-8401 - [C++] 新增 ByteStreamSplitDecode/ByteStreamSplitEncode 的 AVX2/AVX512 版本
- ARROW-8403 - [C++] 為 ChunkedArray、Table 和 RecordBatch 新增 ToString()
- ARROW-8407 - [Rust] 為 Dictionary type 新增 rustdoc
- ARROW-8408 - [Python] 為 pyarrow.feather.read_feather 新增 memory_map= 切換
- ARROW-8409 - [R] 新增 arrow::cpu_count、arrow::set_cpu_count 包裝函式,類似 Python
- ARROW-8412 - [C++][Gandiva] 修復 gandiva date_diff 函數定義
- ARROW-8433 - [R] 在 dataset API 中為 ipc 格式新增 feather 別名
- ARROW-8443 - [Gandiva][C++] 修復 round/truncate 對於特殊情況的無操作
- ARROW-8444 - [Documentation] 修復整個程式碼庫中的拼寫錯誤
- ARROW-8449 - [R] 到處使用 CMAKE_UNITY_BUILD
- ARROW-8450 - [Integration][C++] 實作 large list/binary/utf8 整合
- ARROW-8457 - [C++] bridge 測試未考慮位元組序
- ARROW-8458 - [C++] 對於捆綁的第三方依賴項,優先使用原始鏡像
- ARROW-8461 - [Packaging][deb] 為 Ubuntu Xenial 使用 zstd 套件
- ARROW-8463 - [CI] 平衡 CircleCI、Azure 和 Github 之間的 nightly 測試建置
- ARROW-8467 - [C++] 使用 ArrayFromJSON 的測試案例假設僅為小端平台
- ARROW-8477 - [C++] 啟用 Windows 長檔名的讀取和寫入
- ARROW-8496 - [C++] 精煉 ByteStreamSplitDecodeScalar
- ARROW-8499 - [C++][Dataset] 在 ScannerBuilder 中,如果 projecter 不為空,batch_size 將無法運作
- ARROW-8506 - [c++] 缺少測試來驗證 RLE 中 bit_width > 8 的 expected_buffer
- ARROW-8515 - [C++] Bitmap ToString 應具有按位元組分組的選項
- ARROW-8517 - [Developer][Release] 更新 Crossbow RC 驗證設定,以適應 0.16.0 以來的變更
- ARROW-8523 - [C++] 優化 BitmapReader
- PARQUET-1663 - [C++] 提供 API 以檢查複雜資料類型的存在
- PARQUET-1716 - [C++] 新增 BYTE_STREAM_SPLIT 編碼的支援
- PARQUET-1770 - [C++][CI] 為讀取 Parquet 檔案新增 fuzz target
- PARQUET-1785 - [C++] 改善 encoding-test.cc 中的程式碼可重用性
- PARQUET-1786 - [C++] 使用 simd 來改善 BYTE_STREAM_SPLIT 解碼效能
- PARQUET-1806 - [C++] [CI] 改善 fuzzing seed corpus
- PARQUET-1825 - [C++] 修復 column_io_benchmark.cc 中的編譯錯誤
- PARQUET-1828 - [C++] 為 ByteStreamSplit 編碼器實作新增 SSE2 路徑
- PARQUET-1840 - [C++] DecodeSpaced 複製的值多於必要的數量
- PARQUET-458 - [C++] 實作 DataPageV2 的支援
錯誤修復
- ARROW-1907 - [C++/Python] Feather 格式無法容納總資料量超過 2GB 的字串欄位
- ARROW-2255 - [Developer][Integration] 在整合測試 JSON 格式中序列化 schema 和欄位層級的自訂元數據
- ARROW-2587 - [Python] 無法將具有多個子項的 StructArrays 寫入 parquet
- ARROW-3004 - [Documentation] 為 master 而非釘選的 commit 建置文件
- ARROW-3543 - [R] 更好地支援 R 中的時間戳記格式和時區
- ARROW-5265 - [Python/CI] 新增與 kartothek 的整合測試
- ARROW-5473 - [C++] 使用 Ninja 時,googletest_ep 上的建置失敗
- ARROW-5981 - [C++] DictionaryBuilder
使用 Array 初始化可能會靜默失敗 - ARROW-6528 - [C++] Spurious Flight 測試失敗(port 分配失敗)
- ARROW-6738 - [Java] 修復當前 union 比較邏輯的問題
- ARROW-6757 - [Python] 建立 csv.ParseOptions() 會導致 Visual Studio 2017 出現 “Windows fatal exception: access violation”
- ARROW-6871 - [Java] 增強 TransferPair 相關參數檢查和測試
- ARROW-6872 - [C++][Python] 具有 dictionary 欄位的空表格會引發 ArrowNotImplementedError
- ARROW-6895 - [C++][Parquet] parquet::arrow::ColumnReader: ByteArrayDictionaryRecordReader 在呼叫 `NextBatch()` 時重複傳回值
- ARROW-7008 - [Python] pyarrow.chunked_array([array]) 在具有全 None buffer 的陣列上失敗
- ARROW-7049 - [C++] 在 mingw-w64 上建置時的警告
- ARROW-7301 - [Java] Sql type DATE 應對應於 DateDayVector
- ARROW-7335 - [C++][Gandiva] 在 Gandiva 中新增 castBIGINT、extractDay interval_day 函數
- ARROW-7390 - [C++][Dataset] Projector::Project 中的並發競爭
- ARROW-7405 - [Java] ListVector isEmpty API 不正確
- ARROW-7466 - [CI][Java] 修復 gandiva-jar-osx nightly 建置失敗
- ARROW-7467 - [Java] ComplexCopier 對於 Map nullable info 執行不正確的複製
- ARROW-7520 - [R] 寫入許多 batch 會導致崩潰
- ARROW-7546 - [Java] 使用新的實作在 batch 中串連向量值
- ARROW-7624 - [Rust] 透過 `Buffer` 方法的健全性問題
- ARROW-7628 - [Python] 更好地文件化一些 read_csv 邊緣案例
- ARROW-7631 - [C++][Gandiva] 如果在將十進位數轉換為較低精度/scale 時發生溢位,則傳回零
- ARROW-7680 - [C++][Dataset] 分割區探索在 windows 路徑下無法運作
- ARROW-7701 - [C++] [CI] macOS 上的 Flight 測試錯誤
- ARROW-7713 - [Java] TastLeak 的位置錯誤
- ARROW-7722 - [Java][FlightRPC] 記憶體洩漏
- ARROW-7734 - [C++] 在比較具有和不具有 detail 的 status 時發生 Segfault
- ARROW-7740 - [C++] StructArray::Flatten 中的陣列內部損壞
- ARROW-7755 - [Python] Windows wheel 無法在 Python 3.8 上安裝
- ARROW-7758 - [Python] 錯誤轉換超出 pandas 範圍的時間戳記(例如 0000-01-01)
- ARROW-7760 - [Release] 修復 verify-release-candidate.sh,因為 pip3 似乎不再位於 miniconda 中
- ARROW-7762 - [Python] ParquetWriter 中的例外狀況被忽略
- ARROW-7766 - [Python][Packaging] Windows py38 wheel 使用錯誤的 ABI 標籤建置
- ARROW-7772 - [R][C++][Dataset] 無法使用 date64 純量篩選 date32 物件
- ARROW-7775 - [Rust] 不要讓安全程式碼任意轉換 readers 和 writers
- ARROW-7777 - [Go] StructBuilder/ListBuilder 索引超出範圍 panic
- ARROW-7780 - [Release] 修正 Windows wheel RC 驗證腳本,因為 Python 3.8 中缺少 “m” ABI 標籤
- ARROW-7781 - [C++][Dataset] 篩選不存在的欄位會產生 segfault
- ARROW-7783 - [C++] ARROW_DATASET 應啟用 ARROW_COMPUTE
- ARROW-7785 - [C++] sparse_tensor.cc 編譯速度極慢
- ARROW-7786 - [R] 在 Table.Equals 方法中連接 check_metadata
- ARROW-7789 - [R] 當 R.oo 套件載入時,無法初始化 arrow 物件
- ARROW-7791 - [C++][Parquet] 修復建置錯誤 “cannot bind lvalue”
- ARROW-7792 - [R] read_* 函數應關閉與檔案的連線
- ARROW-7793 - [Java] 如果發生洩漏,base allocator 應在擲出例外狀況之前將多餘的記憶體釋放給父級
- ARROW-7794 - [Rust] cargo publish 因 Flight.proto 的相對路徑而失敗
- ARROW-7797 - [Release][Rust] 修復 datafusion crate 中 arrow-flight 的版本
- ARROW-7802 - [C++] 在 hash 核心中支援 LargeBinary 和 LargeString
- ARROW-7806 - [Python] 為 LargeBinary/String 清單實作 to_pandas
- ARROW-7807 - [R] 在 RHEL 7 上安裝 無法呼叫 io___MemoryMappedFile__Open()
- ARROW-7809 - [R] vignette 無法在 Win 10 或 ubuntu 上執行
- ARROW-7813 - [Rust] 修復未定義行為並移除 unsafe
- ARROW-7815 - [C++] 修復 corrupt IPC 輸入時的崩潰(OSS-Fuzz)
- ARROW-7827 - [Python] conda-forge pyarrow 套件未啟用 s3
- ARROW-7832 - [R] 0.16.0 版本的修補程式
- ARROW-7836 - [Rust] “allocate_aligned”/“reallocate” 需要初始化記憶體以避免 UB
- ARROW-7837 - [Java] BaseVariableWidthVector.copyFromSafe 中的錯誤導致索引超出範圍例外狀況
- ARROW-7838 - [C++] 安裝的 plasma-store-server 找不到 Boost
- ARROW-7841 - [C++] HADOOP_HOME 無法找到 libhdfs.so
- ARROW-7844 - [R] array_to_vector 不是執行緒安全的
- ARROW-7848 - 新增 MapType 的文件
- ARROW-7852 - [Python] 0.16.0 wheel 與舊版 numpy 不相容
- ARROW-7857 - [Python] 使用 pandas master 進行擴充類型轉換時測試失敗
- ARROW-7861 - [C++][Parquet] 為 parquet reader 新增 fuzz regression corpus
- ARROW-7884 - [C++][Python] pq.read_table() 中的崩潰
- ARROW-7887 - [Rust] Filter 核心不支援時間類型
- ARROW-7889 - [Rust] Datafusion CLI 不支援註冊 Parquet 檔案
- ARROW-7899 - [Integration][Java] null type 整合測試
- ARROW-7908 - [R] 無法在不設定 LIBARROW_DOWNLOAD=true 的情況下安裝套件
- ARROW-7922 - [CI][Crossbow] Nightly macOS wheel 建置失敗 (brew bundle edition)
- ARROW-7923 - [CI][Crossbow] macOS autobrew 在 homebrew-versions 上失敗
- ARROW-7926 - [Developer] “archery lint” 目標對於執行單一檢查(如 IWYU)來說不符合人體工學
- ARROW-7928 - [Python] Flight server 和 client 的範例無法運作
- ARROW-7931 - [C++] 修復 corrupt Map 陣列輸入時的崩潰(OSS-Fuzz)
- ARROW-7936 - [Python] FileSystem.from_uri 測試在 python 3.5 上失敗
- ARROW-7940 - [C++] 無法使用預設值以外的設定產生 cmake 建置
- ARROW-7958 - [Java] 將 Avro 更新至 1.9.2 版本
- ARROW-7962 - [R][Dataset] “Consolidate Source and Dataset classes” 的後續行動
- ARROW-7968 - [C++] orc_ep 建置在 64 位元 Raspbian 上失敗
- ARROW-7973 - [Developer][C++] run_cpplint.py 中的 ResourceWarnings
- ARROW-7974 - [Developer][C++] “make check-format” 中的 ResourceWarning
- ARROW-7975 - [C++] 不要在 “Buffer” IPC 元數據會計中包含 padding 位元組
- ARROW-7978 - [Developer] GitHub Actions “lint” 任務正在執行 include-what-you-use 並失敗
- ARROW-7980 - [Python] 對於某些基於 Timestamp 的資料框架,使用 pyarrow 還原序列化失敗
- ARROW-7981 - [C++][Dataset] 在 gcc 5.4 上編譯失敗
- ARROW-7985 - [C++] 如果底層 value builder 為空且已 .Reserve’d,ListBuilder.Finish 會失敗
- ARROW-7990 - [C++][Developer] 為執行 “iwyu.sh all” 新增 “archery lint” 選項
- ARROW-7992 - [C++] MSVC 警告導致 sort_to_indices.cc 中的 Appveyor 失敗
- ARROW-7996 - [Python] 使用 pyarrow 序列化空的 pandas DataFrame 時發生錯誤
- ARROW-7997 - [Python] pyarrow 中 Schema equals 方法的文件不一致
- ARROW-7999 - [C++] 修復 corrupt Map 陣列輸入時的崩潰(OSS-Fuzz)
- ARROW-8000 - [C++] gcc 4.8 建置失敗
- ARROW-8003 - [C++] 使用 clang 建置時,-DBZip2_SOURCE=BUNDLED 失敗
- ARROW-8006 - [C++] 從 parquet 還原的不安全 arrow dictionary
- ARROW-8007 - [Python] 移除 plasma 測試中未使用且已停用的 assert_get_object_equal
- ARROW-8008 - [C++/Python] 即使 Framework Python 不是已啟用的 Python,也優先選用 Framework Python
- ARROW-8009 - [Java] 修復 BitVector 的 hash code 方法
- ARROW-8011 - [C++] 從 Parquet 讀取時,某些 buffer 未調整大小
- ARROW-8013 - [Python][Packaging] 修復 manylinux wheel
- ARROW-8021 - [Python] Appveyor 似乎未在測試執行中包含 pandas
- ARROW-8036 - [C++] 使用 gtest 1.10.0 編譯失敗
- ARROW-8042 - [Python] pyarrow.ChunkedArray 文件字串對於零長度 ChunkedArray 沒有 chunk 的描述不正確
- ARROW-8057 - [Python] 不要在 __eq__ 和 __ne__ 中檢查 Schema 元數據
- ARROW-8070 - [C++] 從 list 轉換為 utf8 的不支援轉換時發生 segfault
到 utf8 - ARROW-8071 - [GLib] 使用 configure 建置錯誤
- ARROW-8088 - [C++][Dataset] 具有指定 dictionary 類型的分割區欄位導致全部為 null
- ARROW-8091 - [CI][Crossbow] 修復 nightly homebrew 和 R 失敗
- ARROW-8092 - [CI][Crossbow] OSX wheel 在捆綁的 bzip2 上失敗
- ARROW-8094 - [CI][Crossbow] Nightly valgrind 測試失敗
- ARROW-8095 - [CI][Crossbow] Nightly turbodbc 工作失敗
- ARROW-8098 - [go] Go 1.14 上的 Checkptr 失敗
- ARROW-8101 - [FlightRPC][Java] 無法僅讀取/寫入空的 null 陣列
- ARROW-8102 - [Dev] Crossbow 的版本偵測在 comment bot 的情境中無法運作
- ARROW-8105 - [Python] pyarrow.array 在傳遞具有縮小 mask 的 masked array 時發生 segfault
- ARROW-8106 - [Python] master 上的建置因 pandas 1.0.2 版本而中斷
- ARROW-8110 - [C#] 如果包含 NestedType,BuildArrays 會失敗
- ARROW-8112 - [FlightRPC][C++] 某些 status code 無法透過 gRPC 往返
- ARROW-8119 - [Dev] 使 Yaml 成為 archery 的可選依賴項
- ARROW-8122 - [Python] 無法還原序列化具有 shape 的空 numpy 陣列
- ARROW-8125 - [C++] 使用 ninja 建置時,"arrow-tests" 目標中斷
- ARROW-8127 - [C++] [Parquet] 多頁 batch 寫入的欄位 chunk 元數據不正確
- ARROW-8128 - [C#] NestedType 子項序列化長度錯誤
- ARROW-8132 - [C++] arrow-s3fs-test 在 master 上失敗
- ARROW-8133 - [CI] Github Actions 有時無法 checkout Arrow
- ARROW-8136 - [C++][Python] 從相對路徑建立 dataset 不再運作
- ARROW-8139 - [C++] FileSystem enum 導致屬性警告
- ARROW-8142 - [C++] 轉換具有 0 個 chunk 的 chunked array 時發生嚴重錯誤
- ARROW-8144 - [CI] Cmake 3.2 nightly 建置失敗
- ARROW-8159 - [Python] pyarrow.Schema.from_pandas 不支援 ExtensionDtype
- ARROW-8166 - [C++] AVX512 intrinsics 在 Ubuntu 18.04 上使用 clang-8 編譯失敗
- ARROW-8176 - [FlightRPC][Integration] 讓 Flight 服務在整合中綁定到 port 0
- ARROW-8186 - [Python] Dataset 表達式 != 對於無效值傳回 bool 而非表達式
- ARROW-8188 - [R] 適應 R-devel 中的最新檢查
- ARROW-8193 - [C++] arrow-future-test 在 gcc 4.8 上編譯失敗
- ARROW-8197 - [Rust] DataFusion “create_physical_plan” 傳回不正確的 schema?
- ARROW-8206 - [R] Linux 安裝上向後相容性的小修復
- ARROW-8209 - [Python] 按名稱存取 Table 的重複欄位時給出錯誤的錯誤訊息
- ARROW-8213 - [Python][Dataset] 使用本地錯誤路徑開啟 dataset 會給出令人困惑的錯誤訊息
- ARROW-8216 - [R][C++][Dataset] 篩選在篩選欄位遺失的情況下傳回全遺失列
- ARROW-8217 - [R][C++] 修復 ARROW-7979 在 32 位元 Windows 上 test-dataset.R 中的崩潰測試
- ARROW-8219 - [Rust] sqlparser crate 需要升級到 0.2.5 版本
- ARROW-8233 - [CI] “AMD64 Windows MinGW 64 GLib & Ruby “ 上的建置超時
- ARROW-8237 - [Python] 審查 conda 和非 conda 使用者的開發人員建置指示
- ARROW-8238 - [C++][Compute] 無法在 windows 上使用 msvc2015 建置 compute 測試
- ARROW-8239 - [Java] 修復 splitAndTransfer 方法中的參數檢查
- ARROW-8245 - [Python][Parquet] 讀取分割的 parquet 檔案時略過隱藏目錄
- ARROW-8255 - [Rust] [DataFusion] COUNT(*) 導致令人困惑的錯誤
- ARROW-8259 - [Rust] [DataFusion] ProjectionPushDownRule 不會重寫 LIMIT
- ARROW-8268 - [Ruby] 由於缺少已建置的 ZSTD 支援而導致測試失敗
- ARROW-8269 - [Python] “nopandas” 建置中 test_parquet_row_group_fragments 失敗
- ARROW-8270 - [Python][Flight] 具有 TLS 憑證和金鑰的範例 Flight server 無法運作
- ARROW-8272 - [CI][Python] Ubuntu 16.04 上的測試失敗
- ARROW-8274 - [C++] 在 IPC 寫入中使用 LZ4 frame 格式進行 “LZ4” 壓縮
- ARROW-8276 - [C++][Dataset] 掃描 Fragment 不會將分割區欄位納入考量
- ARROW-8280 - [C++] MinGW 建置由於 CARES 相關的工具鏈問題而失敗
- ARROW-8286 - [Python] 從 pathlib 建立 dataset 會導致 UnionDataset 而非 FileSystemDataset
- ARROW-8298 - [C++][CI] MinGW 建置在建置 grpc 時失敗
- ARROW-8303 - [Python] 修復由 Python 3.5 上不確定的 dict 金鑰排序引起的測試失敗
- ARROW-8304 - [Flight][Python] 具有 TLS root certificate 的 Flight client 在 do_get() 上報告錯誤
- ARROW-8305 - [Java] ExtensionTypeVector 應確保 underlyingVector 不為 null
- ARROW-8310 - [C++] Minio 的例外狀況無法被 IsConnectError() 辨識
- ARROW-8315 - [Python][Dataset] 在 test_dataset.py 中不要依賴有序字典的鍵
- ARROW-8323 - [C++] 將 gRPC 固定在 v1.27 版本以避免其標頭檔中的編譯錯誤
- ARROW-8326 - [C++] 不要使用已棄用的 TYPED_TEST_CASE
- ARROW-8327 - [FlightRPC][Java] gRPC trailers 可能為 null
- ARROW-8331 - [C++] arrow-compute-filter-benchmark 編譯失敗
- ARROW-8333 - [C++][CI] 始終在某些 C++ CI 條目中編譯基準測試
- ARROW-8334 - [C++] [Gandiva] LLVM Types / Simple D32 Compute Functions 中缺少 DATE32
- ARROW-8342 - [Python] dask 和 kartothek 整合測試失敗
- ARROW-8345 - [Python] feather.read_table 不應要求 pandas
- ARROW-8346 - [CI][Ruby] GLib/Ruby macOS 建置在 zlib 上失敗
- ARROW-8349 - [CI][NIGHTLY:gandiva-jar-osx] 使用最新的 pygit2
- ARROW-8353 - [C++] parquet writer 中的 is_nullable 可能未初始化
- ARROW-8354 - [R] 修復 Table 轉換為 Array 時的區段錯誤
- ARROW-8357 - [Rust] [DataFusion] CLI 的 Dockerfile 缺少 format 目錄
- ARROW-8358 - [C++] 修復 clang-11 中的 -Wrange-loop-construct 警告
- ARROW-8360 - [C++][Gandiva] 修復 date/time 函數的 date32 支援
- ARROW-8365 - [C++] 寫入大於 5 GB 的檔案到 S3 時發生錯誤
- ARROW-8366 - [Rust] 需要還原最近的 arrow-flight 建置變更
- ARROW-8369 - [CI] 修復 crossbow 萬用字元群組
- ARROW-8373 - [GLib] 在 Meson 建置中解析 gobject-introspection, arrow 時發生問題
- ARROW-8380 - [RUST] StringDictionaryBuilder 未從 arrow::array 公開匯出
- ARROW-8384 - [C++][Python] arrow/filesystem/hdfs.h 和 Python wrapper 沒有設定 Kerberos 票證路徑的選項
- ARROW-8386 - [Python] pyarrow.jvm 對於空的 Arrays 引發錯誤
- ARROW-8388 - [C++] GCC 4.8 無法移動回傳值
- ARROW-8397 - [C++] 在 Ubuntu 16.04 上編譯 aggregate_test.cc 失敗
- ARROW-8406 - [Python] 從 Windows 上不同的磁碟機執行 test_fs 時失敗
- ARROW-8410 - [C++] CMake 在不支援 -march=armv8-a+crc+crypto 的 aarch64 系統上失敗
- ARROW-8414 - [Python] test_parquet.py 中非決定性的列順序失敗
- ARROW-8415 - [C++][Packaging] 修復 gandiva linux job
- ARROW-8416 - [Python] 在 dataset API 中提供 "feather" 別名
- ARROW-8420 - [C++] CMake 無法在 armv7l 平台 (例如 Raspberry Pi 3) 上配置
- ARROW-8427 - [C++][Dataset] 當指定完整路徑時,不要忽略帶有底線/點的文件路徑
- ARROW-8428 - [C++][NIGHTLY:gandiva-jar-trusty] GCC 4.8 在 C++ 單元測試中失敗
- ARROW-8429 - [C++] 修復 0 大小緩衝區上的 Buffer::CopySlice
- ARROW-8432 - [Python][CI] 下載 Hadoop 失敗
- ARROW-8437 - [C++] 從 MakeRandomNullBitmap 測試工具中移除 std::move 回傳值
- ARROW-8438 - [C++] arrow-io-memory-benchmark 崩潰
- ARROW-8439 - [Python] Filesystem 文件已過時
- ARROW-8441 - [C++] 修復無效輸入時的崩潰 (OSS-Fuzz)
- ARROW-8442 - [Python] NullType.to_pandas_dtype 與 to_pandas/to_numpy 中傳回的 dtype 不一致
- ARROW-8460 - [Packaging][deb] Ubuntu Focal 建置失敗
- ARROW-8465 - [Packaging][Python] Windows py35 wheel 建置因 boost 而失敗
- ARROW-8466 - [Packaging] python 單元測試未在 windows wheel 建置中執行
- ARROW-8468 - [Document] 修復不正確的 null bits 描述
- ARROW-8469 - [Dev] 修復 azure 上的 nightly docker 測試
- ARROW-8478 - [Java] 回滾 contrib package 變更。
- ARROW-8498 - [Python] Schema.from_pandas 在 extension type 上失敗,而 Table.from_pandas 則可以運作
- ARROW-8511 - [Developer][Release] 如果 C++ 編譯失敗,Windows 發布驗證腳本不會停止
- PARQUET-1780 - [C++] 設定 ColumnMetadata.encoding_stats 欄位
- PARQUET-1788 - [C++] ColumnWriter 在寫入 arrow chunks 時具有未定義的行為
- PARQUET-1797 - [C++] 修復模糊測試錯誤
- PARQUET-1799 - [C++] Stream API: 放寬讀取時的 schema 檢查
- PARQUET-1810 - [C++] 修復無效 enum 值時的未定義行為 (OSS-Fuzz)
- PARQUET-1813 - [C++] 移除單元測試中的記錄語句
- PARQUET-1819 - [C++] 修復損壞 IPC 輸入時的崩潰 (OSS-Fuzz)
- PARQUET-1823 - [C++] 使用 parquet::arrow::FileReader->RowGroup(i)->Column(j) 讀取時,傳回無效的 RowGroup
- PARQUET-1829 - [C++] 修復無效輸入時的崩潰 (OSS-Fuzz)
- PARQUET-1831 - [C++] 修復無效輸入時的崩潰 (OSS-Fuzz)
- PARQUET-1835 - [C++] 修復無效輸入時的崩潰 (OSS-Fuzz)