Apache Arrow 0.8.0 (2017年12月18日)
這是一個主要版本發佈。
下載
貢獻者
$ git shortlog -sn apache-arrow-0.7.1..apache-arrow-0.8.0
90 Wes McKinney
23 Phillip Cloud
21 Kouhei Sutou
13 Licht-T
12 Korn, Uwe
12 Philipp Moritz
12 Uwe L. Korn
10 Bryan Cutler
5 Li Jin
5 Robert Nishihara
4 Paul Taylor
4 siddharth
3 Max Risuhin
3 Stephanie
2 Rene Sugar
2 Heimir Sverrisson
2 Brian Hulette
2 Yuliya Feldman
2 dhirschf
2 Matthias Vallentin
1 vkorukanti
1 Andrew Andrade
1 Benjamin Goldberg
1 Ivan Sadikov
1 John Jenkins
1 Joris Van den Bossche
1 Lewis John McGibbney
1 Lu Qi
1 Manuel
1 Nick White
1 Ofek Lev
1 Shixiong Zhu
1 Siddharth Teotia
1 Stephen G
1 Victor Uriarte
1 Wataru Shimizu
1 ksdevlife
1 lmeyerov
1 rvernica
1 Amir Malekpour
程式碼修補提交者
下列 Apache 提交者提交了程式碼修補至儲存庫。
$ git shortlog -csn apache-arrow-0.7.0..apache-arrow-0.8.0
236 Wes McKinney
35 Uwe L. Korn
10 Philipp Moritz
5 Kouhei Sutou
1 Steven Phillips
變更日誌
新功能與改進
- ARROW-1032 - [JS] 支援 custom_metadata
- ARROW-1047 - [Java] 新增與 IO / 訊息框架分離的通用串流寫入器和讀取器介面
- ARROW-1087 - [Python] 新增 get_include 以公開包含標頭檔的目錄
- ARROW-1114 - [C++] 建立 Record Batch Builder 類別,作為將逐列資料轉置為欄的可重複使用且有效率的方式
- ARROW-1134 - [C++] 允許 C++/CLI 專案使用 Arrow 建置
- ARROW-1178 - [Python] 建立 Table.from_pandas 的替代方案,以產生具有給定區塊大小的 RecordBatch 物件列表
- ARROW-1226 - [C++] 改善 / 更正 arrow::ipc 中的 doxygen 函式文件
- ARROW-1250 - [Python] 定義使用者類型檢查陣列類型的 API
- ARROW-1369 - 在 javascript arrow reader 函式庫中支援布林類型
- ARROW-1371 - [網站] 在網站上新增「技術支援」頁面
- ARROW-1455 - [Python] 新增 Dockerfile 以在一般 CI 之外驗證 Dask 整合
- ARROW-1471 - [JAVA] 文件化 ValueVector 更新的需求和非需求
- ARROW-1472 - [JAVA] 設計更新的 ValueVector 物件階層
- ARROW-1473 - [JAVA] 建立原型程式碼階層 (實作階段 1)
- ARROW-1474 - [JAVA] ValueVector 階層 (實作階段 2)
- ARROW-1476 - [JAVA] 實作最終 ValueVector 更新
- ARROW-1482 - [C++] 實作 date32 和 date64 之間的轉換
- ARROW-1483 - [C++] 實作 time32 和 time64 之間的轉換
- ARROW-1484 - [C++] 實作 (安全和不安全) 時間戳記和不同單位時間之間的轉換
- ARROW-1486 - [C++] 決定 arrow::RecordBatch 是否需要可複製
- ARROW-1487 - [C++] 實作從 List 到 List 的轉換,其中從任何 A 到 B 都定義了轉換函式
- ARROW-1488 - [C++] 以 internal::ArrayData 的形式實作 ArrayBuilder::Finish
- ARROW-1498 - [GitHub] 新增 CONTRIBUTING.md 和 ISSUE_TEMPLATE.md
- ARROW-1503 - [Python] 在 pyarrow.serialize 中為 pandas 物件新增序列化回呼
- ARROW-1522 - [C++] 支援 pyarrow.Buffer 作為 pyarrow.serialize 中的內建類型
- ARROW-1523 - [C++] 新增輔助資料結構,其中包含用於讀取可能具有非零偏移量的有效性點陣圖的方法
- ARROW-1524 - [C++] 更優雅的解決方案,用於處理計算函式庫中輸入和輸出上的非零偏移量
- ARROW-1525 - [C++] 變更 arrow/compare.h 中的函式,使其不傳回 Status
- ARROW-1526 - [Python] 單元測試以執行 PARQUET-1100 中的程式碼路徑
- ARROW-1535 - [Python] 啟用 sdist 原始碼 tarball 以建置,假設主機系統上提供 Arrow C++ 函式庫
- ARROW-1538 - [C++] 在 .deb 封裝自動化中支援 Ubuntu 14.04
- ARROW-1539 - [C++] 移除自 0.7.0 和先前版本起已棄用的函式
- ARROW-1556 - [C++] 納入 PARQUET-1100 patch 中的 AssertArraysEqual 函式
- ARROW-1559 - [C++] “unique” 的核心實作 (計算陣列的不同元素)
- ARROW-1573 - [C++] 實作狀態核心函式,該函式使用 DictionaryBuilder 計算字典索引
- ARROW-1575 - [Python] 新增 pyarrow.column 工廠函式
- ARROW-1577 - [JS] NPM 模組的套件發佈腳本
- ARROW-1588 - [C++/格式] 強化 Decimal 格式
- ARROW-1593 - [PYTHON] serialize_pandas 應傳遞 preserve_index 關鍵字
- ARROW-1594 - [Python] 在 Table.from_pandas 中啟用多執行緒轉換
- ARROW-1600 - [C++] 從 std::string 進行零複製 Buffer 建構
- ARROW-1602 - [C++] 在 arrow::Array 中新增 IsValid/IsNotNull 方法
- ARROW-1603 - [C++] 新增 BinaryArray 方法以取得 std::string 的值
- ARROW-1604 - [Python] 在 cast(…) 和各種 type= 引數中支援常見的類型別名
- ARROW-1605 - [Python] pyarrow.array 應能夠產生更小的整數類型,而無需明確轉換
- ARROW-1607 - [C++] 為 Decimals 實作 DictionaryBuilder
- ARROW-1613 - [Java] ArrowReader 不應關閉輸入 ReadChannel
- ARROW-1616 - [Python] 在 RecordBatchStreamWriter 中新增 “write” 方法,該方法會適當地分派到 write_table/write_back
- ARROW-1626 - 新增 make targets 以執行名為 “infer” 的跨程序靜態分析工具。
- ARROW-1627 - [JAVA] 減少堆積使用量 (階段 2) - AllocationManager.BufferLedger 中的記憶體佔用量
- ARROW-1630 - [序列化] 支援 Python datetime 物件
- ARROW-1631 - [C++] 將 GRPC 新增至 ThirdpartyToolchain.cmake
- ARROW-1635 - 為 PMC 新增發佈管理指南
- ARROW-1637 - [C++] null 類型的 IPC 往返
- ARROW-1641 - [C++] 不要包含
在公開標頭中 - ARROW-1648 - [C++] 新增從 Dictionary[NullType] 到 NullType 的轉換
- ARROW-1649 - [C++] 在 NullArray 的 PrettyPrint 中印出 null 數量
- ARROW-1651 - [JS] Table 中的延遲列存取器
- ARROW-1652 - [JS] 將 Vector 分隔為 BatchVector 和 CompositeVector
- ARROW-1654 - [Python] pa.DataType 無法被 pickled
- ARROW-1662 - 將 OSX 相依性管理移至 brew bundle Brewfiles 中
- ARROW-1665 - [序列化] 在預設序列化上下文中支援更多自訂資料類型
- ARROW-1666 - [GLib] 在 Travis CI Mac 環境中啟用 gtk-doc
- ARROW-1667 - [GLib] 支援 Meson
- ARROW-1671 - [C++] 變更 arrow::MakeArray 使其不傳回 Status
- ARROW-1675 - [Python] 在 FeatherWriter.write 中使用 RecordBatch.from_pandas
- ARROW-1677 - [部落格] 新增關於 Ray 和 Arrow Python 序列化的部落格文章
- ARROW-1679 - [GLib] 新增 garrow_record_batch_reader_read_next()
- ARROW-1683 - [Python] 將 “TimestampType” 還原至 pyarrow 命名空間
- ARROW-1684 - [Python] 簡化用於讀取巢狀 Parquet 欄的使用者 API
- ARROW-1685 - [GLib] 新增 GArrowTableReader
- ARROW-1689 - [Python] 類別索引應為零複製
- ARROW-1690 - [GLib] 新增 garrow_array_is_valid()
- ARROW-1691 - [Java] 使 Java Decimal 類型實作符合 ARROW-1588 中的格式決策
- ARROW-1697 - [GitHub] 新增 ISSUE_TEMPLATE.md
- ARROW-1701 - [序列化] 支援零複製 PyTorch Tensor 序列化
- ARROW-1702 - 在 manylinux1 建置中更新 jemalloc
- ARROW-1703 - [C++] 供應我們依賴的精確 jemalloc 版本
- ARROW-1707 - 在移至 GitBox 後更新開發 README
- ARROW-1710 - [Java] 在新的向量類別階層中移除不可為 null 的向量
- ARROW-1716 - [格式/JSON] 在 JSON 中對 Decimals 使用字串整數值
- ARROW-1717 - [Java] 在向量類別中移除 JSONReader/Writer 的公開靜態輔助方法
- ARROW-1718 - [Python] 實作從時間戳記到 date32/date64 的轉換,並在 Array.from_pandas 中支援
- ARROW-1719 - [Java] 移除存取器/變更器
- ARROW-1721 - [Python] 在 numpy_to_arrow.cc 中不支援 null mask 的地方支援 null mask
- ARROW-1724 - [封裝] 支援 Ubuntu 17.10
- ARROW-1725 - [封裝] 上傳 Ubuntu 17.10 的 .deb
- ARROW-1726 - [GLib] 新增設定描述以驗證 C GLib 建置
- ARROW-1727 - [格式] 擴展 Arrow 串流格式以允許新字典和 delta / 新增至現有字典
- ARROW-1728 - [C++] 在 Travis CI 中執行 clang-format 檢查
- ARROW-1734 - [C++/Python] 在 Column 層級新增轉換函式
- ARROW-1736 - [GLib] 新增 GArrowCastOptions:allow-time-truncate
- ARROW-1737 - [GLib] 使用 G_DECLARE_DERIVABLE_TYPE
- ARROW-1746 - [Python] 為 Arch Linux 新增建置相依性
- ARROW-1747 - [C++] 不要匯出靜態連結函式庫的符號
- ARROW-1748 - [GLib] 新增 GArrowRecordBatchBuilder
- ARROW-1750 - [C++] 移除對 arrow/util/random.h 的需求
- ARROW-1752 - [封裝] 為 Debian 和 Ubuntu 新增 GPU 套件
- ARROW-1753 - [Python] 提供在序列化上下文中使用 register_type 比對子類別
- ARROW-1755 - [C++] 為 MSVC 新增建置選項以使用靜態執行階段函式庫
- ARROW-1758 - [Python] 移除物件序列化的 pickle=True 選項
- ARROW-1763 - [Python] DataType 應為可雜湊
- ARROW-1765 - [文件] 在 C++ docker 建置中使用 conda 的相依性
- ARROW-1767 - [C++] 支援在 Windows 上讀取和寫入超過 2GB 的檔案
- ARROW-1772 - [C++] 以 parquet-cpp 的風格新增 public-api-test 模組
- ARROW-1773 - [C++] 新增從日期/時間類型到相容有號整數的轉換
- ARROW-1775 - 能夠中止已建立但未封鎖的 Plasma 物件
- ARROW-1777 - [C++] 新增靜態 ctor ArrayData::Make 以在某些地方提供更簡潔的語法
- ARROW-1779 - [Java] 如果不將有效性向量歸零,整合測試會中斷
- ARROW-1782 - [Python] 將壓縮器公開為 pyarrow.compress、pyarrow.decompress
- ARROW-1783 - [Python] 使用最少的記憶體配置 / 複製,將 SerializedPyObject 轉換為/從元件緩衝區序列
- ARROW-1784 - [Python] 透過分解 BlockManager 而非強制轉換為 Arrow 格式,在 pyarrow.serialize 中讀取和寫入 pandas.DataFrame
- ARROW-1785 - [格式/C++/Java] 從 Flatbuffers metadata 中移除 VectorLayout metadata
- ARROW-1787 - [Python] 以向後相容的方式支援將 parquet 檔案讀取到 DataFrames 中
- ARROW-1794 - [C++/Python] 將 DecimalArray 重新命名為 Decimal128Array
- ARROW-1801 - [文件] 更新安裝指示以使用 red-data-tools repos
- ARROW-1802 - [GLib] 新增 Arrow GPU 支援
- ARROW-1806 - [GLib] 新增 garrow_record_batch_writer_write_table()
- ARROW-1808 - [C++] 將 RecordBatch 介面設為虛擬,以允許延遲具體化欄的 record batch
- ARROW-1809 - [GLib] 對於 GTK-Doc 主要檔案,使用 .xml 而非 .sgml
- ARROW-1810 - [Plasma] 移除測試 shell 腳本
- ARROW-1817 - 設定 JsonFileReader 以讀取浮點數的 NaN
- ARROW-1818 - 檢查 Java 相依性
- ARROW-1819 - [Java] 移除舊版向量類別
- ARROW-1826 - [JAVA] 避免在儲存格層級進行分支 (copyFrom)
- ARROW-1827 - [Java] 新增 checkstyle 設定檔和標頭檔
- ARROW-1828 - [C++] 為 BooleanType 實作雜湊核心特化
- ARROW-1834 - [文件] 在個別建置資料夾中建置文件
- ARROW-1838 - [C++] 統一使用 compute::Datum 作為核心的輸入引數
- ARROW-1841 - [JS] 更新 text-encoding-utf-8 和 tslib 以支援 node ESModules
- ARROW-1844 - [C++] 雜湊核心的基本基準測試套件
- ARROW-1849 - [GLib] 將輸入檢查新增至 GArrowRecordBatch
- ARROW-1850 - [C++] 在 Writable::Write 中使用 const void* 而非 const uint8_t*
- ARROW-1854 - [Python] 改善序列化物件 dtype ndarray 的效能
- ARROW-1855 - [GLib] 為 macOS 上的建置失敗新增解決方案
- ARROW-1857 - [Python] 為 wheels 中與靜態 parquet 的 boost 連結新增切換
- ARROW-1859 - [GLib] 新增 GArrowDictionaryDataType
- ARROW-1862 - [GLib] 新增 GArrowDictionaryArray
- ARROW-1864 - [Java] 將 Netty 升級至 4.1.x
- ARROW-1867 - [Java] 從舊版向量類別新增 BitVector API
- ARROW-1874 - [GLib] 新增 garrow_array_unique()
- ARROW-1878 - [GLib] 新增 garrow_array_dictionary_encode()
- ARROW-1884 - [C++] 將 JsonReader/JsonWriter 類別設為內部 API
- ARROW-1885 - [Java] 還原先前的 MapVector 類別名稱
- ARROW-1901 - [Python] 為 DaskFilesystem 支援遞迴 mkdir
- ARROW-1902 - [Python] 從 write_to_dataset 移除 mkdir 競爭條件
- ARROW-1905 - [Python] 在 pyarrow.types 中新增更多用於檢查精確類型的方法
- ARROW-1911 - 將 Graphistry 新增至 Arrow JS 驗證點
- ARROW-480 - [Python] 為 Parquet 欄統計資訊新增存取器
- ARROW-504 - [Python] 新增轉接器以將使用者選取區塊大小的 pandas.DataFrame 寫入串流格式
- ARROW-507 - [C++/Python] 從偏移量和值子陣列建構 List 容器
- ARROW-541 - [JS] 實作與 JavaScript 相容的實作
- ARROW-571 - [Python] 新增 API 以從 Arrow 表格增量建置 Parquet 檔案
- ARROW-587 - 將 JIRA 修正版本新增至合併工具
- ARROW-609 - [C++] 用於從 UNIX epoch 以來的日期天數轉換為 int64 日期的函式
- ARROW-838 - [Python] 從非 pandas 1D NumPy 陣列有效率地建構陣列
- ARROW-905 - [文件] 新增 Dockerfile 以進行可重現的文件產生
- ARROW-942 - 在 Python 2.7 上支援整合測試
- ARROW-950 - [網站] 新增 Google Analytics 標籤
- ARROW-972 - [Python] 為 UnionArray 新增測試案例和基本 API
錯誤修正
- ARROW-1282 - Arrow 的大型記憶體重新配置導致 jemalloc 中斷
- ARROW-1341 - [C++] 棄用 arrow::MakeTable,改用 ARROW-1334 的新建構子
- ARROW-1347 - [JAVA] List null 類型應對內部欄位使用一致的名稱
- ARROW-1398 - [Python] 不支援讀取 decimal(19,4) 類型的欄
- ARROW-1409 - [格式] 在 metadata 中為 Buffer 中的 “page” 屬性使用
- ARROW-1540 - [C++] 盡可能修正 cuda-test 中的 valgrind 警告
- ARROW-1541 - [C++] arrow_gpu 的競爭條件
- ARROW-1543 - [C++] row_wise_conversion 範例與 ListBuilder 建構子引數不符
- ARROW-1549 - [JS] 整合自動產生的 Arrow 測試檔案
- ARROW-1555 - [Python] s3 上的 write_to_dataset
- ARROW-1584 - [PYTHON] 空 dataframe 上的 serialize_pandas
- ARROW-1585 - 整數欄上的 serialize_pandas 往返失敗
- ARROW-1586 - [PYTHON] serialize_pandas 往返遺失欄名稱
- ARROW-1609 - Plasma: 使用 Xcode 9.0 建置失敗
- ARROW-1615 - 開發的 CXX 旗標比 Travis CI 建置更寬鬆
- ARROW-1617 - [Python] 不要在 python/cmake_modules 中使用符號連結
- ARROW-1620 - Python: 從 bintray 在 manylinux1 建置中下載 Boost
- ARROW-1624 - [C++] 後續修正 / 微調 Plasma / LLVM 4.0 的編譯器警告,新增至 readme
- ARROW-1625 - [序列化] 正確支援 OrderedDict
- ARROW-1629 - [C++] 修正 infer 工具識別的問題程式碼路徑
- ARROW-1633 - [Python] numpy “unicode” 陣列無法理解
- ARROW-1640 - 解決 Travis CI 中的 OpenSSL 問題
- ARROW-1647 - [Plasma] 讀取/寫入訊息時的潛在錯誤。
- ARROW-1653 - [Plasma] 使用靜態轉換以避免編譯器警告。
- ARROW-1656 - [C++] Endianness Macro 在 Windows 和 Mac 上不正確
- ARROW-1657 - [C++] 多執行緒讀取測試在 Arch Linux 上失敗
- ARROW-1658 - [Python] 超出範圍的字典索引在轉換為 pandas 後導致區段錯誤
- ARROW-1663 - [Java] 後續處理 ARROW-1347 並使 schema 向後相容
- ARROW-1670 - [Python] 加速反序列化程式碼路徑
- ARROW-1672 - [Python] 無法寫入 Feather 位元組欄
- ARROW-1673 - [Python] NumPy 布林陣列在 NdarrayToTensor 往返中被轉換為 uint8 陣列
- ARROW-1676 - [C++] 在寫入 Feather 格式時正確截斷超大的有效性點陣圖
- ARROW-1678 - [Python] numpy.float16 的不正確序列化
- ARROW-1680 - [Python] 時間戳記單位變更未在 from_pandas() 轉換中完成
- ARROW-1686 - 文件產生腳本在 site/java 下建立 “apidocs” 目錄
- ARROW-1693 - [JS] 讀取字典編碼的整合測試檔案時發生錯誤
- ARROW-1695 - [序列化] 修正自訂序列化器中建立的 numpy 陣列的參考計數
- ARROW-1698 - [JS] 檔案讀取器嘗試多次載入相同的字典批次
- ARROW-1704 - [GLib] 測試套件中的 Go 範例已損壞
- ARROW-1708 - [JS] Linter 問題中斷 master 建置
- ARROW-1709 - [C++] Decimal.ToString 對於負刻度不正確
- ARROW-1711 - [Python] flake8 檢查仍然無法使建置失敗
- ARROW-1714 - [Python] 沒有命名的 pd.Series 名稱序列化為 u’None’
- ARROW-1720 - [Python] 嘗試存取超出範圍的區塊時發生區段錯誤
- ARROW-1723 - Windows: 建置 arrow 靜態函式庫時指定了 __declspec(dllexport)
- ARROW-1730 - [Python] 傳遞時間戳記類型時,pyarrow.array 的結果不正確
- ARROW-1732 - [Python] 當 preserve_index=False 時,RecordBatch.from_pandas 在沒有欄的 DataFrame 上失敗
- ARROW-1735 - [C++] Cast 核心無法寫入切片的輸出陣列
- ARROW-1738 - [Python] 當 pa.array 具有單位時,日期時間轉換錯誤
- ARROW-1739 - [Python] 修正導致建置中斷的 assertRaises 用法
- ARROW-1742 - [C++] clang-format 在 OSX 上不再正確偵測到
- ARROW-1743 - [Python] 當索引包含類別欄時,Table to_pandas 失敗
- ARROW-1745 - Mac OS 上 plasma 測試中的編譯失敗
- ARROW-1749 - [C++] 處理需要顯示 39 位數的 Decimal128 值範圍
- ARROW-1751 - [Python] Pandas 0.21.0 為 MultiIndex 建構引入了破壞性的 API 變更
- ARROW-1754 - [Python] 當索引名稱與欄名稱相同時,修正有錯誤的 Parquet 往返
- ARROW-1756 - [Python] 在 Feather 寫入/讀取路徑中觀察到 int32 溢位
- ARROW-1762 - [C++] 語言環境的單元測試失敗
- ARROW-1764 - [Python] 為 Windows 開發安裝指示新增 -c conda-forge
- ARROW-1766 - [GLib] 修正 OSX 上失敗的建置
- ARROW-1768 - [Python] 修正 ParquetWriter.__del__ 中被抑制的例外狀況
- ARROW-1770 - [GLib] 修正 GLib 編譯器警告
- ARROW-1771 - [C++] ARROW-1749 中斷 parquet-cpp 中的 Public API 測試
- ARROW-1776 - [C++[ 未定義 arrow::gpu::CudaContext::bytes_allocated()
- ARROW-1778 - [Python] 在 manylinux1 wheels 中靜態、私有地連結 parquet-cpp
- ARROW-1781 - [CI] Travis-CI 上的 OSX 建置經常逾時
- ARROW-1788 - Plasma 儲存區在嘗試中止已斷線用戶端的物件時崩潰
- ARROW-1791 - 整合測試產生超出合理範圍的 date[DAY] 值
- ARROW-1793 - [整合] 修正 README.md 的錯字
- ARROW-1800 - [C++] 修正並簡化 random_decimals
- ARROW-1805 - [Python] 在探索資料集時忽略非 parquet 檔案
- ARROW-1811 - [C++/Python] 將所有 Decimal 基礎的 API 重新命名為 Decimal128
- ARROW-1812 - Plasma 儲存區在用戶端斷線期間迭代時修改雜湊表
- ARROW-1821 - [ARROW-1821] 新增整合測試案例以明確檢查選用的有效性緩衝區
- ARROW-1829 - [Plasma] 清理逐出策略簿記
- ARROW-1830 - [Python] 在字典中載入所有檔案時發生錯誤
- ARROW-1836 - [C++] 修正在 MSVC 建置中 arrow/util/variant.h 產生的 C4996 警告
- ARROW-1839 - [C++/Python] 新增 Decimal Parquet 讀取/寫入測試
- ARROW-1840 - [網站] 安裝命令在 Windows 10 Anaconda 環境中失敗。
- ARROW-1845 - [Python] 公開 Decimal128Type
- ARROW-1852 - [Plasma] 將檢索管理員檔案描述符設為 const
- ARROW-1853 - [Plasma] 修正重試處理中的差一錯誤
- ARROW-1863 - [Python] PyObjectStringify 可以為更多類型的物件呈現類似位元組的輸出
- ARROW-1865 - [C++] 將欄位新增至空表格失敗
- ARROW-1869 - 修正 LowCostIdentityHashMap 中的錯字
- ARROW-1871 - [Python/C++] 附加不同小數位數的 Python Decimal 需要重新調整比例
- ARROW-1873 - [Python] 載入總共 2GB 的 Parquet 檔案時發生區段錯誤
- ARROW-1877 - JsonStringArrayList.equals 中的不正確比較
- ARROW-1879 - [Python] 如果未安裝 Dask,則不會跳過 Dask 整合測試
- ARROW-1881 - [Python] setuptools_scm 擷取 JS 版本標籤
- ARROW-1882 - [C++] 重新引入 DictionaryBuilder
- ARROW-1883 - [Python] BUG:如果欄位不存在,Table.to_pandas 元數據檢查失敗
- ARROW-1889 - [Python] 在較舊的 git 版本中,「–exclude」不可用
- ARROW-1890 - [Python] date32 陣列的遮罩處理無法運作
- ARROW-1891 - [Python] 只有在使用 from_pandas 時,NaT date32 值才會轉換為 null
- ARROW-1892 - [Python] 未知的列表項目類型:binary
- ARROW-1893 - [Python] test_primitive_serialization 在 Python 2.7.3 上失敗
- ARROW-1895 - [Python] 將 field_name 新增至 pandas 索引元數據
- ARROW-1897 - [Python] Categoricals 的 pandas 元數據的 numpy_type 不正確
- ARROW-1904 - [C++] 棄用 PrimitiveArray::raw_values
- ARROW-1906 - [Python] 建立具有不同單位時間戳記的 pyarrow.Array 時不會轉換類型
- ARROW-1908 - [Python] 從具有重複欄位名稱的 pandas DataFrame 建構 arrow table 時崩潰
- ARROW-1910 - CPP README Brewfile 連結不正確
- ARROW-1914 - [C++] 使用 -DARROW_GPU=on 時,make -j 可能建置失敗
- ARROW-1915 - [Python] Parquet 測試應該是可選的
- ARROW-1916 - [Java] 請勿從原始碼發行版本中排除 java/dev/checkstyle
- ARROW-1917 - [GLib] 必須在 verify-release-candidate.sh 中設定 GI_TYPELIB_PATH
- ARROW-226 - [C++] libhdfs:提供回饋以協助判斷開啟檔案路徑失敗的原因
- ARROW-641 - [C++] 如果 ARROW_HDFS=off,則不要建置/執行 io-hdfs-test