Apache Arrow 14.0.0 (1 November 2023)
這是一個主要版本發布,涵蓋了超過兩個月的開發時程。
下載
貢獻者
此版本包含來自 116 位不同貢獻者的 612 次提交。
$ git shortlog -sn apache-arrow-13.0.0..apache-arrow-14.0.0
69 Sutou Kouhei
59 dependabot[bot]
52 sgilmore10
34 Nic Crane
28 mwish
27 Raúl Cumplido
25 Kevin Gurney
19 Antoine Pitrou
19 Dewey Dunnington
17 Alenka Frim
16 Dane Pitkin
16 Matt Topol
13 Joris Van den Bossche
12 Jin Shang
11 David Li
11 Felipe Oliveira Carvalho
10 James Duong
8 Curt Hagenlocher
7 Jacob Wujciak-Jens
6 Benjamin Kietzman
6 Weston Pace
5 Frederic Branczyk
5 david dali susanibar arce
4 Ben Harkins
4 Thor
3 Bryce Mecum
3 Chris Jordan-Squire
3 Diego Fernández Giraldo
3 Francis
3 Ian Cook
3 Jonathan Keane
3 Junming Chen
3 Tim Schaub
3 h-vetinari
3 takuya kodama
2 Abe Tomoaki
2 Adam Reeve
2 Dominik Moritz
2 Elliott Brossard
2 Fokko Driesprong
2 Gang Wu
2 Mark Wolfe
2 Matthias Loibl
2 Rok Mihevc
2 Thomas Newton
2 Timothy Meehan
2 Vibhatha Lakmal Abeykoon
2 Will Jones
2 abandy
2 davidhcoe
2 jeremyosterhoudt
2 lambda
2 谢天
1 0x26res
1 Alex Shcherbakov
1 Alexander Grueneberg
1 Angela Li
1 Anja Kefala
1 Arkadiusz Rudny
1 Ashish Bailkeri
1 Austin Dickey
1 Bruno Tremblay
1 Chelsea Jones
1 Christian Lorentzen
1 Danyaal Khan
1 David Greiss
1 DenisTarasyuk
1 Donald Tolley
1 Ed Seidl
1 Edward Visel
1 Eero Lihavainen
1 Erik McKelvey
1 Fernando Mayer
1 František Nečas
1 George Godik
1 Hirokazu SUZUKI
1 Hyunseok Seo
1 Ikko Eltociear Ashimine
1 Ivan Chesnov
1 Jacek Stania
1 James Henderson
1 Jinpeng
1 Joe Marshall
1 Jonathan Swenson
1 Judah Rand
1 Justin Heesemann
1 KarateSnowMachine
1 Kevin Liu
1 Kuba Martin
1 Kyle Barron
1 Laurent Goujon
1 Li Jin
1 Michael Lui
1 Miguel Pragier
1 Paul Taylor
1 Rajat Subhra Mukherjee
1 Ray Zhang
1 SGZW
1 Sam Albers
1 Slobodan Ilic
1 Spencer Nelson
1 Srinivas Lade
1 Tero Vuotila
1 Thomas Grainger
1 Tommy Setiawan
1 Val Gridnev
1 Vitalii Tverdokhlib
1 Yue
1 andrewchambers
1 hrishisd
1 ismail simsek
1 panbingkun
1 patrick
1 pegasas
1 rtpsw
1 yyang52
補丁提交者
下列 Apache 提交者將貢獻的補丁合併到儲存庫中。
$ git shortlog -sn --group=trailer:signed-off-by apache-arrow-13.0.0..apache-arrow-14.0.0
190 Sutou Kouhei
81 Antoine Pitrou
70 Kevin Gurney
46 Matt Topol
40 David Li
35 Nic Crane
31 Raúl Cumplido
28 Joris Van den Bossche
19 Jacob Wujciak-Jens
14 Dewey Dunnington
12 AlenkaF
12 Weston Pace
11 Benjamin Kietzman
4 Gang Wu
3 Dominik Moritz
2 Eric Erhardt
2 Jonathan Keane
1 Li Jin
1 Will Jones
變更日誌
Apache Arrow 14.0.0 (2023-10-31 07:00:00)
錯誤修正
- GH-15017 - [Python] 加強 test_memory.py 以便與 ARROW_USE_GLOG=ON 一起使用 (#36901)
- GH-15281 - [C++] 以 span 取代 bytes_view 別名 (#36334)
- GH-31621 - [JS] 修正 Union null bitmaps (#37122)
- GH-32439 - [Python] 修正 chunking nested structs 時的 off by one bug (#37376)
- GH-32483 - [文件][Python] 澄清需要使用 conda-forge 安裝 nightly conda 套件 (#37948)
- GH-33807 - [R] 如果偵測到在模擬環境下執行,則新增訊息 (#37777)
- GH-34567 - [JS] 改善建置並避免產生
bin/bin
目錄 (#36607) - GH-34640 - [R] 當同時提供 (非 Hive) 分割區和結構描述時,無法讀取 CSV 資料集中的分割欄 (#37658)
- GH-34909 - [C++] 避免大型整數輸入時的 mean 溢位 (#37243)
- GH-35095 - [C++] 防止在 arrow::ipc::IpcFormatWriter 中關閉後寫入 (#37783)
- GH-35167 - [文件][C++] 對於 arrow::json::TableReader 使用新的 API (#37301)
- GH-35292 - [Release] 重試 “apt install” (#36836)
- GH-35328 - [Go][FlightSQL] 修正 FlightSql 驅動程式的不穩定測試 (#38044)
- GH-35450 - [C++] 當使用不符的欄長度呼叫
RecordBatch::ToStructArray
時,傳回錯誤 (#36654) - GH-35581 - [C++] 在 scalars 中儲存 offsets (#36018)
- GH-35641 - [CI][C++] 停用 precompiled headers (#37502)
- GH-35658 - [Packaging] 將 conda recipes 與 feedstocks 同步 (#35637)
- GH-35770 - [Go][Documentation] 更新 TimestampType 零值作為註解中的秒數 (#37905)
- GH-35942 - [C++] 改善 Decimal ToReal 準確度 (#36667)
- GH-36069 - [Java] 確保 S3 在關閉時已完成 (#36934)
- GH-36154 - [JS][CI] 在 CI 中使用
jest
快取 (#36373) - GH-36189 - [C++][Parquet] StreamReader::SkipRows() 在多個 row-group 檔案中跳到不正確的位置 (#36191)
- GH-36318 - [Go] 僅解碼現有值的長度,而非所有 nvalues 的長度。 (#36322)
- GH-36323 - [Python] 修正 datetime 範圍外值的 Timestamp scalar repr 錯誤 (#36942)
- GH-36332 - [CI][Java] 與 Spark 的整合工作失敗,出現 NoSuchMethodError:io.netty.buffer.PooledByteBufAllocator
- GH-36371 - [Java] CycloneDX 無法載入 mojo ‘makeBom’
- GH-36379 - [C++] 捆綁的相依性 include 路徑應覆寫系統 include 目錄 (#37612)
- GH-36502 - [C++] 新增 run-end 編碼陣列支援至 ReferencedByteRanges (#36521)
- GH-36610 - [CI][C++] 預設不啟用 ARROW_ACERO (#36611)
- GH-36619 - [Python] Parquet 統計資訊字串表示方式具有誤導性 (#36626)
- GH-36634 - [Dev] 確保 merge 指令碼在從 GitHub 請求資訊時遍歷所有頁面 (#36637)
- GH-36638 - [R] 在 Windows 上使用 create_package_with_all_dependencies() 時發生錯誤 (#37226)
- GH-36645 - [Go] 在寫入 parquet 時將 writer.Close 錯誤傳回呼叫者 (#36646)
- GH-36655 - [Dev] 修正 fury 指令以上傳 nightly wheels (#36657)
- GH-36663 - [C++] 修正 enum 選項的預設值資訊 (#36684)
- GH-36680 - [Python] 新增遺失的 pytest.mark.acero (#36683)
- GH-36685 - [R][C++] 修正 Homebrew 的非法運算碼失敗 (#36705)
- GH-36688 - [C#] 修正 dereference 錯誤 (#36691)
- GH-36692 - [CI][Packaging] 由於 faraday 相依性的問題,將 gemfury 固定為 0.12.0 (#36693)
- GH-36708 - [C++] 完全計算 null-counts,以便 REE 配置有意義 (#36740)
- GH-36712 - [CI] 當 issue 元件更新時也進行更新 (#36723)
- GH-36720 - [R] 無法使用命名空間前綴呼叫 stringr modifier 函數 (#36758)
- GH-36726 - [R] 在 S3 連線上呼叫 read_parquet 會導致錯誤訊息被忽略 (#37024)
- GH-36730 - [Python] 新增對 Cython 3.0.0 的支援 (#37097)
- GH-37771 - [R] stringr helper 函數在評估時會捨棄呼叫環境 (#36784)
- GH-36776 - [C++] 使 ListArray::FromArrays() 處理包含 null 的 sliced offsets Arrays (#36780)
- GH-36787 - [R] lintr 更新導致 main 上的測試失敗 (#36788)
- GH-36809 - [Python] 具有自訂欄位名稱的 MapScalar.as_py (#36830)
- GH-36819 - [R] 使用 RunWithCapturedR 讀取 Parquet 檔案 (#37274)
- GH-36828 - [C++][Parquet] 使用 BufferedPageWriter 製作 buffered RowGroupSerializer (#36829)
- GH-36850 - [Go] Arrow Concatenate 修正,確保 allocations 已 Free’d (#36854)
- GH-36856 - [C++] 從 BasicDecimal256FromLE() 引數中移除不必要的括號 (#36987)
- GH-36858 - [Go] 修正 dictionary builder 洩漏 (#36859)
- GH-36860 - [C++] 當系統 Protobuf 存在但系統 gRPC 不存在時,報告 CMake 錯誤 (#36904)
- GH-36863 - [C#] 如果 .NET > 5.0,則移除不必要的已應用修正,以避免關閉 CDataInterfacePythonTests 上的 PythonEngine (#36872)
- GH-36863 - [C#][Packaging] 如果 .NET > 5.0,則不要關閉 CDataInterfacePythonTests 上的 PythonEngine (#36868)
- GH-36883 - [R] 移除觸發 CRAN 警告的版本號碼 (#36884)
- GH-36920 - [Java][Docs] 新增 ARROW_JSON var 至 maven 建置設定檔 (#36921)
- GH-36922 - [CI][C++][Windows] 從 PATH 搜尋 OpenSSL (#36923)
- GH-36935 - [Go] 修正 Timestamp 到 Time 的日期 (#36964)
- GH-36939 - [C++][Parquet] 當多次呼叫時,BooleanArray 的直接 put 不正確 (#36972)
- GH-36941 - [CI][Docs] 使用系統 Protobuf (#36943)
- GH-36949 - [C++] 修正 KeyColumnArray 的 buffers 陣列邊界斷言。 (#36966)
- GH-36973 - [CI][Python] Archery linter 與 flake8==6.1.0 整合 (#36976)
- GH-36975 - [C++][FlightRPC] 跳過未知欄位,不要崩潰 (#36979)
- GH-36981 - [Go] 修正 ipc reader 洩漏 (#36982)
- GH-36983 - [Python] pyarrow.fs.S3FileSystem 和 s3fs 之間不同的 get_file_info 行為 (#37768)
- GH-36991 - [Python][Packaging] 跳過 Win 上需要 tz 資料庫的測試 (#36996)
- GH-37017 - [C++] 保護 BMI2 指令的意外使用 (#37610)
- GH-37022 - [CI][Java] 使用官方 Maven 下載 URL (#37119)
- GH-37050 - [Python][Interchange protocol] 為空的 dataframes 新增 workaround (#38037)
- GH-37056 - [Java] 修正從 c-data 匯入空資料陣列的問題 (#37531)
- GH-37067 - [C++] 安裝捆綁的 GoogleTest (#37483)
- GH-37099 - [C++] 修正 Flight-UCX 的建置 (#37105)
- GH-37102 - [Go][Parquet] 編碼:當 ReserveBytes 時,使 BitWriter Reserve (#37112)
- GH-37106 - [C++] 移除溢位整數四捨五入基準測試 (#37109)
- GH-37107 - [C++] 使用 GCC 7 抑制未使用的變數警告 (#37240)
- GH-37110 - [C++] Expression: SmallestTypeFor 遺失 Scalar 的時區資訊 (#37135)
- GH-37111 - [C++][Parquet] Dataset: 修正結構描述轉換 (#37793)
- GH-37116 - [C++][ORC] 連結至 absl::log_internal_check_op 以用於 ABSL_DCHECK*() (#37117)
- GH-37120 - [CI][Docs] 確保移除現有的 Node.js (#37121)
- GH-37129 - [CI][Docs] 使用 Ubuntu 22.04 (#37132)
- GH-37129 - [CI][Docs] 釋放磁碟空間 (#37131)
- GH-37148 - [C++] 明確列出 Type::type enum 的整數值 (#37149)
- GH-37173 - [C++][Go][Format] C-export/import Run-End Encoded Arrays (#37174)
- GH-37208 - [R] 使用目前執行的 R 二進位檔編譯測試程式 (nix 安裝) (#37225)
- GH-37213 - [C#] 更新因 rebase/merge 衝突而遺漏的 FlatBuffers 參考 (#37214)
- GH-37217 - [Python] 新增遺失的 docstrings 至 Cython (#37218)
- GH-37239 - [Ruby] 更新 ArrowTable#initialize 的文件以釐清引數詳細資訊 (#37261)
- GH-37245 - [MATLAB] 當製作訊息以顯示擲回
arrow:proxy:ProxyNameMismatch
錯誤時,arrow.internal.proxy.validate
擲回MATLAB:UndefinedFunction
(#37248) - GH-37266 - [CI][C++] 使用 ARROW_CMAKE_ARGS 而非 CMAKE_ARGS (#37272)
- GH-37276 - [C++] 在單執行緒環境中跳過多執行緒測試 (#37327)
- GH-37294 - [C++] 對於 HasSubstr matcher 使用 std::string (#37314)
- GH-37299 - [C++] 修正 clang-format 版本不符錯誤與 Homebrew 的 clang-format (#37300)
- GH-37303 - [Python] 由於 CumulativeSumOptions 重構,更新 test_option_class_equality (#37305)
- GH-37308 - [C++][Docs] 變更 CPP 教學課程的名稱並對工作進行小修正 (#37311)
- GH-37325 - [R] 使用遺失的 13.0.0 變更更新 NEWS.md (#37326)
- GH-37329 - [Release][Homebrew] 遵循目錄結構變更 (#37349)
- GH-37340 - [MATLAB] 如果
index
參照arrow.array.Time32Array
欄,則arrow.tabular.RecordBatch
的column(index)
方法會發生錯誤 (#37347) - GH-37352 - [C++] 不要將所有相依性放入 ArrowConfig.cmake/arrow.pc (#37399)
- GH-37373 - [CI] 使整合建置更精簡 (#37366)
- GH-37373 - [CI][Integration] 釋放磁碟空間 (#37374)
- GH-37377 - [C#] 在 TimestampArray.ConvertTo() 中的溢位時擲回 OverflowException (#37388)
- GH-37386 - [R] 由於「無效的非字元版本規格」,CRAN 失敗 (#37387)
- GH-37406 - [C++][FlightSQL] 新增遺失的 ArrowFlight::arrow_flight_{shared,static} 相依性 (#37407)
- GH-37408 - [C++] 僅當 ARROW_COMPUTE=ON 時才安裝 arrow-compute.pc (#37409)
- GH-37410 - [C++][Gandiva] 新增支援使用 LLVM 共用程式庫 (#37412)
- GH-37411 - [C++][Python] 新增字串 -> 日期轉換核心 (修正 python scalar 轉換) (#38038)
- GH-37414 - [Release][CI] 更新錯誤的 apache-arrow Homebrew 公式路徑的參考 (#37415)
- GH-37419 - [Go][Parquet] pqarrow 的 Decimal256 支援 (#37503)
-
GH-37431 - [R] 由於在測試中使用 base pipe (>),R 版本 < 4.0 的測試失敗 >) in tests (#37432) - GH-37433 - [CI][Release] 增加 macOS 的逾時時間 (#37530)
- GH-37437 - [C++] 修正大型字串值類型列表陣列的 MakeArrayOfNull (#37467)
- GH-37453 - [C++][Parquet] WriteBatch 的效能修正 (#37454)
- GH-37456 - [R] CRAN incoming checks 顯示 NOTE,因為內部函數未記錄在文件中 (#37457)
- GH-37463 - [R] 由於測試執行時間過長,CRAN incoming checks 失敗 (#37464)
- GH-37466 - [C++][Parquet] 修正 DELTA_BYTE_ARRAY 解碼器中的 Valgrind 失敗 (#37471)
- GH-37470 - [Python][Parquet] 新增遺失的引數至
ParquetFileWriteOptions
(#37469) - GH-37480 - [Python] 提高 pandas 版本,其中包含 pandas issue 50127 的迴歸 (#37481)
- GH-37485 - [C++][Skyhook] 不要使用已棄用的 BufferReader API (#37486)
- GH-37487 - [C++][Parquet] Dataset: 實作同步
ParquetFileFormat::GetReader
(#37514) - GH-37488 - [C++] 停用 Azure SDK for C++ 的 unity 建置 (#37489)
- GH-37500 - [CI][C++] 預設停用 Dataset 和 Substrait (#37501)
- GH-37507 - [GLib] 不要使用隱含的 include 目錄 (#37508)
- GH-37515 - [C++] 如果
ChunkedArray
可能有NaN
值,則從ChunkedArray::Equals(const std::shared_ptr<arrow::ChunkedArray>& other)
移除記憶體位址最佳化 (#37579) - GH-37523 - [C++][CI][CUDA] 不要使用較新的 API 並新增遺失的 CUDA 相依性 (#37497)
- GH-37535 - [C++][Parquet] 在 parquet.pc 中新增遺失的 “thrift” 相依性 (#37603)
- GH-37539 - [C++][FlightRPC] 修正繫結至 IPv6 位址 (#37552)
- GH-37555 - [Python] 更新 get_file_info_selector 以忽略 base directory (#37558)
- GH-37560 - [Python][Documentation] 將混淆的批次大小從 128Ki 替換為 128_000 (#37605)
- GH-37574 - [Python] 與 numpy 2.0 相容 (#38040)
- GH-37576 - [R] 使用
SafeCallIntoR()
在配置失敗後呼叫垃圾回收 (#37565) - GH-37601 - [C++][Parquet] 新增遺失的 GoogleMock 相依性 (#37602)
- GH-37608 - [C++][Gandiva] TO_DATE 函數支援 YYYY-MM 和 YYYY (#37609)
- GH-37614 - [R][CI] 由於 duckdb repo 移動,更新 CI 工作 (#37615)
- GH-37621 - [Packaging][Conda] 將 conda recipes 與 feedstocks 同步 (#37624)
- GH-37639 - [CI] 修正舊版 OS 上的 checkout (#37640)
- GH-37648 - [Packaging][Linux] 修正 libarrow-glib-dev/arrow-glib-devel 相依性 (#37714)
- GH-37650 - [Python] 檢查 FilterMetaFunction 中的篩選器輸入 (#38075)
- GH-37671 - [R] legacy 時區符號連結導致 CRAN 失敗 (#37672)
- GH-37712 - [Go][Parquet] 修正 ARM64 組件以用於 bitmap extract bits (#37785)
- GH-37715 - [Packaging][CentOS] 在 CentOS 9 Stream 上使用預設 g++ (#37718)
- GH-37730 - [C#] 如果 fractionalPart 太大,則在 DecimalUtility 中擲回 OverflowException (#37731)
- GH-37735 - [C++][FreeBSD] 抑制 shorten-64-to-32 警告 (#38004)
- GH-37738 - [Go][CI] 更新驗證的 Go 版本 (#37745)
- GH-37750 - [R][C++] 新增與 IntelLLVM 的相容性 (#37781)
- GH-37767 - [C++][CMake] 不要觸碰 .git/index (#38003)
- GH-37771 - [Go][Benchmarking] 更新 Conbench git 資訊 (#37772)
- GH-37803 - [Python][CI] 固定 setuptools_scm 以修正版本發布驗證指令碼 (#37930)
- GH-37803 - [CI][Dev][Python] 版本發布和合併指令碼錯誤 (#37819)
- GH-37805 - [CI][MATLAB] 在 MATLAB CI 工作流程中,將
matlab-actions/setup-matlab
動作的release
硬式編碼為R2023a
(#37808) - GH-37813 - [R] 新增 quoted_na 引數至 open_delim_dataset() (#37828)
- GH-37829 - [Java] 避免在附加可變長度向量時兩次調整資料緩衝區大小 (#37844)
- GH-37834 - [Gandiva] 移轉至新的 LLVM PassManager API (#37867)
- GH-37845 - [Go][Parquet] 檢查邏輯欄位數而非實體欄數 (#37846)
- GH-37858 - [Docs][JS] 修正遠端 URL 的檢查以產生 JS 文件 (#37870)
- GH-37893 - [Java] 將 Types.proto 移至子資料夾 (#37894)
- GH-37907 - [R] 遺失設定 rosetta 變數 (#37961)
- GH-37927 - [CI][Dev][Archery] crossbow 工作的徽章始終顯示「沒有狀態」,即使它們已失敗或成功
- GH-37936 - [CI] 修正 rc-verify nightly builds 中的整合測試 (#37933)
- GH-37950 - [R] 由於測試呼叫 data.frame() 時未指定 stringsAsFactors=FALSE,R < 4.0 的測試失敗 (#37951)
- GH-37952 - [C++] 使 unique->shared 明確以修正至少在一個編譯器上的建置失敗 (#38136)
- GH-37993 - [CI] 修正 conda-integration 建置 (#37990)
- GH-37999 - [CI][Archery] 在 ARM 工作上安裝 python3-dev 以存取 Python.h (#38009)
- GH-38011 - [C++][Dataset] 變更 force close 以傾向於在寫入時關閉 (#38030)
- GH-38014 - [Python] pyarrow extension type 在 13.0.0 中未正確轉換為 pandas
- GH-38034 - [Python] DataFrame Interchange Protocol - 類別欄的正確 dtype 資訊 (#38065)
- GH-38039 - [C++][Parquet] 修正取得 Parquet 欄壓縮層級時的 segfault (#38025)
- GH-38049 - [R] 防止
on_rosetta()
發出警告 (#38052) - GH-38057 - [Python][CI] 修正不穩定的 hypothesis 測試 (#38058)
- GH-38059 - [Python][CI] 將 CUDA 升級至 11.2.2 (#38081)
- GH-38060 - [Python][CI] 升級 Spark 版本 (#38082)
- GH-38068 - [C++][CI] 修正 Parquet 單元測試
arrow_reader_writer_test.cc
編譯 (#38069) - GH-38074 - [C++] 修正 Hash Join 中 slicing Large String 和 Binary 類型的 Offset Size 計算 (#38147)
- GH-38076 - [Java][CI][Java-Jars][MacOS] MacOS AARCH 64 的 C++ 程式庫
- GH-38077 - [C++] 將捆綁的 GoogleTest 輸出至 ${BUILD_DIR}/${CONFIG} (#38132)
- GH-38084 - [R] 當明確檢查檔案移除時,不要記憶體對應 (#38085)
- GH-38193 - [CI][Java] 釋放 “AMD64 manylinux2014 Java JNI” 的磁碟空間 (#38194)
- GH-38197 - [R] 更新使用 setup-r@v1 的動作以使用 setup-r@v2 (#38218)
- GH-38200 - [CI][Release][Go] 確保移除所有模組快取 (#38222)
- GH-38201 - [CI][Packaging] 在 conan 上使用 thrift 時,固定 zlib 1.2.13 (#38202)
- GH-38206 - [CI] 移除更多預先安裝的檔案 (#38233)
- GH-38226 - [R] 從 test-r-versions 移除 R 3.5 (#38230)
- GH-38227 - [R] 修正 nightly builds 中的非 unicode 字元錯誤 (#38232)
- GH-38228 - [R] Fence 範例需要具有
examplesIf
的資料集 (#38229) - GH-38239 - [CI][Python] 暫時停用 Python CI 工作上的 -W 錯誤 (#38238)
- GH-38263 - [C++]:在預期 char 指標的地方,偏好呼叫 string_view::data() 而非 begin() (#38265)
- GH-38282 - [C++]:使用正確的類型簽章實作 ReplaceString (#38283)
- GH-38286 - [CI][R] 清理 ubuntu-r-only-r 映像檔的 GitHub runner 磁碟 (#38287)
- GH-38293 - [R] 修正非決定性 duckdb 測試 (#38294)
- GH-38295 - [CI][R] 釋放 Azure Pipelines 工作的磁碟空間 (#38302)
- GH-38332 - [CI][Release] 解決 RAT lint 中的符號連結 (#38337)
新功能與改進
- GH-20086 - [C++] 在固定大小和可變大小列表之間轉換 (#37292)
- GH-21815 - [JS] 新增 Duration 類型的支援 (#37341)
- GH-24868 - [C++] 新增具有不同維度的 Tensor 邏輯值類型,使用 ExtensionType 實作 (#37166)
- GH-25659 - [Java] 為 Large 類型新增 DefaultVectorComparators (#37887)
- GH-29184 - [R] 讀取以逗號作為小數點分隔符號的 CSV (#38002)
- GH-29238 - [C++][Dataset][Parquet] 在新的 Dataset API 中支援 parquet modular encryption (#34616)
- GH-29847 - [C++] 使用 Azure SDK for C++ 建置 (#36835)
- GH-32863 - [C++][Parquet] 新增 DELTA_BYTE_ARRAY 編碼器至 Parquet writer (#14341)
- GH-33032 - [C#] 支援固定大小列表 (#35716)
- GH-33749 - [Ruby] 新增 Arrow::RecordBatch#each_raw_record (#37137)
- GH-33985 - [C++] 為表達式新增 substrait 序列化/反序列化 (#34834)
- GH-34031 - [Python] 使用 PyCapsule 在 Python 層級傳達 C Data Interface 指標
- GH-34105 - [R] 為失敗的建置提供額外輸出 (#37727)
- GH-34213 - [C++] 如果使用者正在執行遞迴 GetFileInfo,則使用不含分隔符號的遞迴呼叫 (#35440)
- GH-34252 - [Java] 支援 ScannerBuilder::Project 或 ScannerBuilder::Filter 作為 Substrait proto 擴展表達式 (#35570)
- GH-34588 - [C++][Python] 為 “dictionary_decode” 新增 MetaFunction (#35356)
- GH-34620 - [C#] 在 .NET 6.0+ 上支援 DateOnly 和 TimeOnly (#36125)
- GH-34950 - [C++][Parquet] 支援頁面索引的加密 (#36574)
- GH-35116 - [CI][C++] 在某些 CI 平台上啟用編譯時期 AVX2 (#36662)
- GH-35176 - [C++] 新增停用 emscripten threading 的支援 (#35672)
- GH-35243 - [C#] 實作 MapType (#37885)
- GH-35273 - [C++] 新增整數 round kernels (#36289)
- GH-35287 - [C++][Parquet] 新增 CodecOptions 以自訂壓縮參數 (#35886)
- GH-35296 - [Go] 新增 arrow.Table.String() (#35580)
- GH-35409 - [Python][Docs] 釐清 EC2 的 S3FileSystem 認證鏈 (#35312)
- GH-35531 - [Python] C Data Interface PyCapsule 協議 (#37797)
- GH-35600 - [Python] 允許透過 python API 設定時區資料庫的路徑 (#37436)
- GH-35623 - [C++][Python] FixedShapeTensorType.ToString() 應列印類型的參數 (#36496)
- GH-35627 - [Format][Integration] 新增 string-view 至 arrow format (#37526)
- GH-35698 - [C#] 更新 FlatBuffers (#35699)
- GH-35740 - 為列表陣列的 values 屬性新增文件 (#35865)
- GH-35775 - [Go][Parquet] 允許在寫入 row groups 後寫入 key value 檔案中繼資料 (#37786)
- GH-35903 - [C++] Azure Blob Storage 檔案系統實作的骨架 (#35701)
- GH-35916 - [Java][arrow-jdbc] 新增額外欄位至 JdbcFieldInfo (#37123)
- GH-35934 - [C++][Parquet] PageIndex 讀取基準測試 (#36702)
- GH-36078 - [C#] C# 的 Flight SQL 實作 (#36079)
- GH-36103 - [C++] 初始裝置同步 API (#37040)
- GH-36111 - [C++] 重構 dict_internal.h 以使用 Result (#37754)
- GH-36124 - [C++] 預設匯出 compile_commands.json (#37426)
- GH-36155 - [C++][Go][Java][FlightRPC] 新增對長時間執行查詢的支援 (#36946)
- GH-36187 - [C++] 當針對 HashJoin 傳回狀態「資料類型 … 在 join non-key 欄位中不受支援」時,顯示有問題的欄位名稱 (#36539)
- GH-36199 - [Python][CI][Spark] 更新我們 nightly 測試中使用的 spark 版本 (#36347)
- GH-36240 - [Python] 將 CumulativeSumOptions 重構為獨立類別以進行獨立棄用 (#36977)
- GH-36247 - [R] 新增 write_csv_dataset (#36436)
- GH-36326 - [C++] 移除 v9.0 或更早版本中已棄用的 API (#36675)
- GH-36363 - [MATLAB] 為 DataType 類別階層建立 proxy 類別 (#36419)
- GH-36417 - [C++] 新增 Buffer::data_as, Buffer::mutable_data_as (#36418)
- GH-36420 - [C++] 為 SetLookup 選項新增 Enum 選項 (#36739)
- GH-36433 - [C++] 更新 fast_float 版本至 3.10.1 (#36434)
- GH-36469 - [Java][Packaging] 使用 mavencentral jars 發佈 linux aarch64 libs (#36487)
- GH-36488 - [C++] 匯入/匯出 ArrowDeviceArray (#36489)
- GH-36511 - [C++][FlightRPC] 擺脫 GRPCPP_PP_INCLUDE (#36679)
- GH-36512 - [C++][FlightRPC] 新增非同步 GetFlightInfo client call (#36517)
- GH-36546 - [Swift] swift arrow flight 的初始實作 (#36547)
- GH-36570 - [Dev] 為 PR 新增 “Component: Swift” 標籤 (#36571)
- GH-36573 - [CI] 移除 Travis CI 相關檔案和提及 (#36741)
- GH-36590 - [Docs] 支援 Pydata Sphinx Theme 0.14.0 (#36591)
- GH-36601 - [MATLAB] 新增 MATLAB “type traits” 類別階層 (#36653)
- GH-36614 - [MATLAB] 子類別 arrow::Buffer 以保持 MATLAB 資料支援 arrow::Arrays 存活 (#36615)
- GH-36618 - [C++] 為 ARROW_CHECK payload 的評估新增測試 (#36617)
- GH-36621 - [C++] 為 ACERO_ALIGNMENT_HANDLING 新增文件 (#36622)
- GH-36623 - [Go] NullType 支援 csv (#36624)
- GH-36642 - [Python][CI] 將警告設定為 pytest 期間的錯誤 (#37018)
- GH-36643 - [C++][Parquet] 在 parquet 中使用巢狀命名空間 (#36647)
- GH-36652 - [MATLAB] 從現有的 proxy ids 初始化
arrow.array.Array
子類別的Type
屬性 (#36731) - GH-36666 - [Python][CI] 重新啟用跳過的 dask test_pandas_timestamp_overflow_pyarrow 測試 (#38066)
- GH-36671 - [Go] BinaryMemoTable 優化 GetOrInsert 的記憶體配置 (#36811)
- GH-36672 - [Python][C++] 新增向量函數 UDF 的支援 (#36673)
- GH-36674 - [C++] 在 arrow/ipc/reader.cc 中使用匿名命名空間 (#36937)
- GH-36696 - [Go] 改善 MapOf 和 ListOf 輔助函數 (#36697)
- GH-36698 - [Go][Parquet] 新增 TimestampLogicalType 建立函數 … (#36699)
- GH-36709 - [Python] 允許在 Table.group_by 中指定 use_threads=False 以獲得穩定的排序 (#36768)
- GH-36734 - [MATLAB] 在 ArrowType 而非 CType 上範本化 arrow::matlab::proxy::NumericArray (#36738)
- GH-36735 - 將
TimeUnit
和TimeZone
新增至arrow.type.TimestampType
顯示 (#36871) - GH-36750 - [R] 修正 MacOS 上的 test-r-devdocs (#36751)
- GH-36752 - [Python] 在建置 wheels 時移除 AWS SDK 捆綁 (#36925)
- GH-36762 - [Dev] 當 issue 更新時僅移除 component labels (#36763)
- GH-36765 - [Python][Dataset] 變更讀取 Parquet 檔案時 pre_buffer 的預設值為 True (#37854)
- GH-36767 - [C++][CI] 修正 i386 上的測試失敗 (#36769)
- GH-36770 - [C++] 使用環境變數 AWS_ENDPOINT_URL 為 s3 使用自訂端點 (#36791)
- GH-36773 - [C++][Parquet] 避免多次計算 prebuffer column bitmap (#36774)
- GH-36789 - [C++] 支援 divide(duration, duration) (#36800)
- GH-36793 - [Go] 允許 NewSchemaFromStruct 在標記為 parquet:"-" 時跳過欄位 (#36794)
- GH-36795 - [C#] 實作 dense 和 sparse unions 的支援 (#36797)
- GH-36816 - [C#] 減少記憶體配置 (#36817)
- GH-36824 - [C++] 改善 if-else kernel 測試中 CheckWithDifferentShapes 的測試追蹤 (#36825)
- GH-36837 - [CI][RPM] 使用多核心安裝 gems (#36838)
- GH-36843 - [Python][Docs] 將 dict 新增至 docstring (#36842)
- GH-36845 - [C++][Python] 允許在
pa.concat_tables
上進行型別提升 (#36846) - GH-36852 - [MATLAB] 新增
arrow.type.Field
類別 (#36855) - GH-36853 - [MATLAB] 新增從現有
arrow::DataType
物件建立 proxies 的工具 (#36873) - GH-36867 - [C++] 新增 struct_ 和 schema 多載,接受 (name, type) pairs 的 vector (#36915)
- GH-36874 - [MATLAB] 將型別建構子函數從
arrow.type
套件移動到arrow
套件 (#36875) - GH-36882 - [C++][Parquet] 當 data page 和 version 均為 V2 時,BOOLEAN 預設編碼使用 RLE (#38163)
- GH-36882 - [C++][Parquet] parquet version 2.x 中布林值的預設 RLE (#36955)
- GH-36885 - [Java][Docs] 將 substrait dependency 新增至 maven build profiles (#36899)
- GH-36886 - [C++] 配置
azurite
以準備測試 Azure C++ filesystem (#36988) - GH-36893 - [Go][Flight] 公開底層的 protobuf 定義 (#36895)
- GH-36905 - [C++] 新增 SparseUnion 對 selection functions 的支援 (#36906)
- GH-36927 - [Java][Docs] 在 Java maven 命令中啟用 Gandiva 建置 (#36929)
- GH-36931 - [C++] 新增 cumulative_mean 函數 (#36932)
- GH-36933 - [Python] array repr 中無意義的省略符號 (#37168)
- GH-36936 - [Go] 使註冊自訂函數成為可能。 (#36959)
- GH-36944 - [C++] 統一 OpenSSL 偵測以建置 GCS (#36945)
- GH-36950 - [C++] 將 std::vector<std::shared_ptr
> 變更為使用其別名:FieldVector (#37101) - GH-36952 - [C++][FlightRPC][Python] 新增方法以傳送 headers (#36956)
- GH-36953 - [MATLAB] 新增 gateway
arrow.array
函數以從 MATLAB 資料建立 Arrow Arrays (#36978) - GH-36961 - [MATLAB] 新增
arrow.tabular.Schema
類別和相關聯的arrow.schema
建構函數 (#37013) - GH-36970 - [C++][Parquet] Parquet metadata 的小風格修正 (#36971)
- GH-36984 - [MATLAB] 建立
arrow.recordbatch
便利建構子函數 (#37025) - GH-36990 - [R] 公開 Parquet ReaderProperties (#36992)
- GH-36994 - [Java] 在 CI 中使用 JDK 21 (#38219)
- GH-37012 - [MATLAB] 從
arrow.tabular.RecordBatch
移除私有屬性ArrowArrays
(#37015) - GH-37014 - [C++][Parquet] 在合併統計資訊時保留一些 Parquet distinct counts (#37016)
- GH-37021 - [Java][arrow-jdbc] 可插拔的 getConsumer (#37085)
- GH-37028 - [C++] 新增 duration types 對 if_else functions 的支援 (#37064)
- GH-37041 - [MATLAB] 使用新的 MATLAB Interface APIs 實作 Feather V1 Reader (#37044)
- GH-37042 - [MATLAB] 使用新的 MATLAB Interface APIs 實作 Feather V1 Writer (#37043)
- GH-37045 - [MATLAB] 根據 arrow.internal.io.feather.Writer 實作 featherwrite (#37047)
- GH-37046 - [MATLAB] 根據
arrow.internal.io.feather.Reader
實作featherread
(#37163) - GH-37049 - [MATLAB] 更新 feather
Reader
和Writer
物件以直接與arrow.tabular.RecordBatch
s 而非 MATLABtable
s 搭配使用 (#37052) - GH-37051 - [Dev][JS] 為 npm 新增 Dependabot 配置 (#37053)
- GH-37073 - [Java] JDBC:僅在未提供 token 時使用 username/pass auth (#37083)
- GH-37093 - [Python] 新增具有 GetFlightInfo 的 async Flight client (#36986)
- GH-37096 - [MATLAB] 新增工具,可從任意字串清單建立有效的 MATLAB table variable names (#37098)
- GH-37124 - [MATLAB] 新增工具函數以驗證 numeric 和 string index values (#37150)
- GH-37128 - [Java] 將 CI job 從 JDK 18 升級至 JDK 20 (#37125)
- GH-37141 - [GLib][FlightRPC] 新增更多 ArrowFlight::ClientOptions 屬性 (#37142)
- GH-37143 - [GLib][FlightSQL] 新增 prepared INSERT 的支援 (#37196)
- GH-37144 - [C++] 新增 RecordBatchFileReader::To{RecordBatches,Table} (#37167)
- GH-37145 - [Python] 在 from_dataframe 中支援 bitsize 為 1 的布林 columns (#37975)
- GH-37151 - [MATLAB] 在
RecordBatch
的table
方法實作中使用makeValidVariableNames
和makeValidDimensionNames
(#37152) - GH-37155 - [MATLAB] 在
arrow.tabular.RecordBatch
的column()
方法中使用arrow.internal.validate.index.numeric()
(#37156) - GH-37157 - [MATLAB] 在
arrow.tabular.Schema
的field()
方法中使用arrow.internal.validate.index.numericOrString()
(#37162) - GH-37160 - [MATLAB]
arrow.internal.validate.index.string()
在給定零字元字串時不應出錯 (#37161) - GH-37170 - [C++] 支援 RecordBatch 的 schema rewriting。 (#37171)
- GH-37175 - [MATLAB] 支援從
arrow.array.Array
值的清單建立arrow.tabular.RecordBatch
instances (#37176) - GH-37179 - [MATLAB] 新增測試工具,建立包含所有支援類型的 MATLAB
table
(#37191) - GH-37181 - [MATLAB] 移除過時的測試類別
tArrowCppCall.m
(#37185) - GH-37182 - [MATLAB] 將 public
Schema
屬性新增至 MATLABarrow.tabular.RecordBatch
類別 (#37184) - GH-37187 - [MATLAB] 根據新的內部 Feather Reader 和 Writer 物件重新實作
tfeathermex.m
測試 (#37189) - GH-37188 - [MATLAB] 將
test/util/featherRoundTrip.m
移動到 packaged test utility function 中 (#37190) - GH-37203 - [MATLAB] 移除未使用的 feather V1 MEX infrastructure 和程式碼 (#37204)
- GH-37209 - [CI][Docs][MATLAB] 從 CMake build system 移除
MATLAB_ARROW_INTERFACE
flag 的支援,並預設建置新的 MATLAB Interface 程式碼 (#37211) - GH-37210 - [Docs][MATLAB] 更新 MATLAB
README.md
以提及對新 MATLAB APIs 的支援 (例如RecordBatch
,Field
,Schema
等) (#37215) - GH-37212 - [C++] IO: 將 FromString 新增至 ::arrow::io::BufferReader (#37360)
- GH-37216 - [Docs] 新增文件以處理未發布的 allocators (#37498)
- GH-37222 - [Docs][MATLAB] 將
arrow.recordbatch
(全部小寫) 重新命名為arrow.recordBatch
(camelCase) (#37223) - GH-37228 - [MATLAB] 新增 C++
ARROW_MATLAB_EXPORT
symbol export macro (#37233) - GH-37229 - [MATLAB] 新增
arrow.type.Date32Type
類別和arrow.date32
建構函數 (#37348) - GH-37230 - [MATLAB] 新增
arrow.type.Date64Type
類別和arrow.date64
建構函數 (#37578) - GH-37231 - [MATLAB] 新增
arrow.type.Time32Type
類別和arrow.time32
建構函數 (#37250) - GH-37232 - [MATLAB] 新增
arrow.type.Time64Type
類別和arrow.time64
建構函數 (#37287) - GH-37234 - [MATLAB] 建立抽象
arrow.type.TemporalType
類別 (#37236) - GH-37237 - [C++] 將 extraction time 設定為所有已下載內容的時間戳記 (#37238)
- GH-37244 - [Python] 移除 pickle5 的支援 (#37644)
- GH-37246 - [Java] 公開 VectorAppender 類別以提供附加 vector values 的支援 (#37247)
- GH-37251 - [MATLAB] 將
arrow.type.TemporalType
作為 “tag” 類別 (#37256) - GH-37252 - [MATLAB] 新增
arrow.type.DateUnit
enumeration 類別 (#37280) - GH-37253 - [MATLAB] 新增測試案例,驗證
NumFields
,BitWidth
, 和ID
屬性無法修改為hFixedWidth
測試類別 (#37316) - GH-37254 - [Python] 參數化所有 pickling 測試,以同時使用 pickle 和 cloudpickle modules (#37255)
- GH-37257 - [Ruby][FlightSQL] 為 auto prepared statement close request 使用相同的選項 (#37258)
- GH-37259 - [Ruby] 新增明確的 csv gem dependency (#37506)
- GH-37262 - [MATLAB] 新增名為
arrow.type.TimeType
的抽象類別 (#37279) - GH-37268 - [C++] 在 fs 和 dataset 的某些 ctor 中新增 move (#37264)
- GH-37273 - [C++] 升級 vendored xxhash 版本 (#37275)
- GH-37290 - [MATLAB] 新增
arrow.array.Time32Array
類別 (#37315) - GH-37293 - [C++][Parquet] Encoding: 為 DELTA_BYTE_ARRAY 新增 Benchmark (#37641)
- GH-37306 - [Go] 新增 binary dictionary unifier (#37309)
- GH-37307 - [Python][CI] 手動跳過具有 skip_with_pyarrow_strings marker 的測試以進行 nightly dask integration tests (#37324)
- GH-37330 - [Docs][CI] 增加 Sphinx build 的 Timeout (#37331)
- GH-37334 - [Packaging][Release][RPM] 請勿移除舊的 repodata/* (#37351)
- GH-37337 - [MATLAB] 新增
arrow.array.Time64Array
類別 (#37368) - GH-37345 - [MATLAB] 將 function handle 新增至
TypeTraits
類別的fromMATLAB
static construction methods (#37370) - GH-37364 - [C++][GPU] 新增 Device Event/Stream 的 CUDA impl (#37365)
- GH-37367 - [MATLAB] 新增
arrow.array.Date32Array
類別 (#37445) - GH-37379 - [C++][Parquet] Thrift: 產生 movable types (#37461)
- GH-37384 - [R] 在 CI 上設定 R_CHECK_STOP_ON_INVALID_NUMERIC_VERSION_INPUTS = TRUE (#37385)
- GH-37391 - [MATLAB] 在
arrow.array.Array
上實作isequal()
方法 (#37446) - GH-37392 - [JS] 移除 lerna (#37393)
- GH-37394 - [C++][S3] 使用 AWS_SDK_VERSION_* 而非 try_compile() (#37395)
- GH-37416 - [Go] 允許訪問 dictionary builders 的底層 index builder (#37417)
- GH-37434 - [C++] IO: 重構 BufferedInputStream::Read 以處理 small input (#37460)
- GH-37440 - [C#][Docs] 將 Flight SQL 支援的函數新增至 status.rst (#37441)
- GH-37447 - [C++][Docs] 文件化
ARROW_SUBSTRAIT
CMake flag (#37451) - GH-37448 - [MATLAB] 新增
arrow.array.ChunkedArray
類別 (#37525) - GH-37465 - [Go] 將 Value 方法新增至 BooleanBuilder (#37459)
- GH-37472 - [MATLAB] 在
arrow.type.Type
上實作isequal()
方法 (#37474) - GH-37473 - [MATLAB] 新增依
Field
name 索引RecordBatch
columns 的支援 (#37475) - GH-37477 - [MATLAB] 將
AllowNonScalar
name-value pair 新增至 arrow.internal.validate.index.* validation functions (#37482) - GH-37510 - [C++] 請勿為 C++ 安裝 bundled Azure SDK (#38176)
- GH-37532 - [CI][Docs][MATLAB] 從 MATLAB interface 的 CMake build system 移除
GoogleTest
支援 (#37784) - GH-37537 - [Integration][C++] 新增 C Data Interface integration testing (#37769)
- GH-37553 - [Java] 允許 FlightInfo#Schema 對於 long-running queries 為 nullable (#37528)
- GH-37562 - [Ruby] 新增 table.each_raw_record.to_a 的支援 (#37600)
- GH-37567 - [C++] 將 JSON Integration 程式碼遷移至 Result<> (#37573)
- GH-37568 - [MATLAB] 為
arrow.tabular.Schema
MATLAB 類別實作isequal
(#37619) - GH-37569 - [MATLAB] 為
arrow.type.Field
MATLAB 類別實作isequal
(#37617) - GH-37570 - [MATLAB] 為
arrow.tabular.RecordBatch
MATLAB 類別實作isequal
(#37627) - GH-37571 - [MATLAB] 新增
arrow.tabular.Table
MATLAB 類別 (#37620) - GH-37572 - [MATLAB] 新增
arrow.array.Date64Array
類別 (#37581) - GH-37584 - [Go] 將 value len 函數新增至 string array (#37586)
- GH-37587 - [C++] 將 integration machinery 移動到其自己的目錄和命名空間中 (#37588)
- GH-37591 - [MATLAB] 使
arrow.type.Type
繼承自matlab.mixin.Heterogeneous
(#37593) - GH-37597 - [MATLAB] 將
toMATLAB
方法新增至arrow.array.ChunkedArray
類別 (#37613) - GH-37628 - [MATLAB] 為
arrow.tabular.Table
MATLAB 類別實作isequal
(#37629) - GH-37635 - [Format][C++][Go] 將 app_metadata 新增至 FlightInfo 和 FlightEndpoint (#37679)
- GH-37636 - [Go] 升級最低 go 版本 (#37637)
- GH-37643 - [C++] 增強 arrow::Datum::ToString (#37646)
- GH-37651 - [C#] 公開 ArrowArrayConcatenator.Concatenate (#37652)
- GH-37653 - [MATLAB] 新增
arrow.array.StructArray
MATLAB 類別 (#37806) - GH-37654 - [MATLAB] 將
Fields
屬性新增至arrow.type.Type
MATLAB 類別 (#37725) - GH-37670 - [C++] IO FileInterface 從 enable_shared_from_this 延伸 (#37713)
- GH-37681 - [R] 為 13.0.0.1 更新 NEWS.md (#37682)
- GH-37687 - [Go] 當容量足夠時,請勿在 realloc 中複製。 (#37688)
- GH-37694 - [Go] 將 SetNull 新增至 array builders (#37695)
- GH-37701 - [Java] 為更多 types 新增預設 comparators (#37748)
- GH-37702 - [Java] 新增與 C++ 一致的 vector validation (#37942)
- GH-37703 - [Java] 在 ListVector 中設定確切記錄數目的方法 (#37838)
- GH-37704 - [Java] 新增 schema IPC serialization methods (#37778)
- GH-37705 - [Java] VarChar writers 的額外輸入方法 (#37883)
- GH-37705 - [Java] binary writers 的額外輸入方法 (#37791)
- GH-37706 - [Java] VarCharWriter 應支援從 `Text` 和 `String` 寫入
- GH-37722 - [Java][FlightRPC] 棄用 stateful login methods (#37833)
- GH-37724 - [MATLAB] 新增
arrow.type.StructType
MATLAB 類別 (#37749) - GH-37742 - [Python] 啟用 Cython 3 (#37743)
- GH-37744 - [Swift] 為 arrow flight doGet FlightData 新增測試 (#37746)
- GH-37770 - [MATLAB] 新增 CSV
TableReader
和TableWriter
MATLAB 類別 (#37773) - GH-37779 - [Go] 連結至 pkg.go.dev 網站以取得 Go reference docs (#37780)
- GH-37782 - [C++] 將
CanReferenceFieldsByNames
方法新增至arrow::StructArray
(#37823) - GH-37789 - [Integration][Go] Go C Data Interface integration testing (#37788)
- GH-37795 - [Java][FlightSQL] 新增 mock FlightSqlProducer 和 tests (#37837)
- GH-37799 - [C++] Compute: CommonTemporal 支援 time32 和 time64 casting (#37949)
- GH-37825 - [MATLAB] 改善
arrow.type.Field
顯示 (#37826) - GH-37835 - [MATLAB] 改善
arrow.tabular.Schema
顯示 (#37836) - GH-37842 - [R] 實作 infer_schema.data.frame() (#37843)
- GH-37849 - [C++] 將 cpp/src/*/.cmake 新增至 cmake-format targets (#37850)
- GH-37851 - [C++] IPC: ArrayLoader 風格增強 (#37872)
- GH-37863 - [Java] 為 StructVector 新增 typed getters (#37916)
- GH-37864 - [Java] 從 OrcReader 移除不必要的 throws (#37913)
- GH-37873 - [C++][Parquet] DELTA_BYTE_ARRAY: 盡可能避免複製資料 (#37874)
- GH-37876 - [Format] 將 list-view specification 新增至 arrow format (#37877)
- GH-37880 - [CI][Python][Packaging] 新增 Python 3.12 的支援 (#37901)
- GH-37906 - [Integration][C#] 為 C# 實作 C Data Interface integration testing (#37904)
- GH-37917 - [Parquet] 為 FileSource 新增 OpenAsync (#37918)
- GH-37923 - [R] 將 macOS build system 移動至 nixlibs.R (#37684)
- GH-37934 - [Doc][Integration] 文件化 C Data Interface testing (#37935)
- GH-37939 - [C++] 在編碼 DELTA_BINARY_PACKED 時,為 frame of reference 使用 signed arithmetic (#37940)
- GH-37941 - [R][CI][Release] 為 pre-compiled binaries 新增 checksum verification (#38115)
- GH-37945 - [R] 更新 developer documentation (#38220)
- GH-37971 - [CI][Java] 請勿為 nightly upload 使用 cache (#37980)
- GH-37978 - [C++] 新增支援,可為
arrow::PrettyPrintOptions
指定自訂 Array element delimiter (#37981) - GH-37984 - [Release] 為 YAML date value 使用 ISO 8601 格式 (#37985)
- GH-37994 - [R] 為 CSV*Options 類別建立 wrapper functions (#37995)
- GH-37996 - [MATLAB] 將名為
fromMATLAB
的 static constructor method 新增至arrow.array.StructArray
(#37998) - GH-38005 - [Java] 在執行 Java tests 時停用 debug log (#38006)
- GH-38015 - [MATLAB] 將
arrow.buffer.Buffer
類別新增至 MATLAB Interface (#38020) - GH-38017 - [Go][FlightSQL] 增加 internal converter 處理的 types 數量 (#38028)
- GH-38043 - [R] 在 macOS 上預設啟用所有功能 (#38195)
- GH-38053 - [C++][Go] 從 Schema.fbs 重新產生 sources (#38054)
- GH-38055 - [C++] 請勿在 ARROW_ENABLE_THREADING=OFF 的情況下尋找/使用 Threads::Threads (#38056)
- GH-38063 - [C++] 為外部專案的 ar/ranlib 使用絕對路徑 (#38064)
- GH-38071 - [C++][CI] 修正 pre-buffer 的 Overlap column chunk ranges (#38073)
- GH-38088 - [R] 移除過時的 brew 和 autobrew 參考 (#38089)
- GH-38138 - [R] 將 curl 新增至 suggests 以使用
skip_if_offline()
(#38140) - GH-38142 - [R] 為 14.0.0 新增 NEWS (#38143)
- GH-38145 - [Docs][Python] 在 Python install docs 中新增 Windows 上 tzdata 的子章節 (#38146)
- GH-38159 - [CI][Release] 僅在 integration test mode 上執行 integration tests (#38177)
- GH-38172 - [CI][C++] 在 Ubuntu 22.04 上使用 system GoogleTest (#38173)
- GH-38174 - [C++] 將 bundled Azure SDK for C++ 更新至 1.10.3 (#38175)
- GH-38209 - [Docs] 在較小的螢幕上縮減 header items 的寬度並保持 header height 預設值 (small) (#38148)
- GH-38240 - [Docs] version_match 應與 versions.json 中的 version 相符 (#38241)
- GH-38243 - [CI][Python] 為 dataset encryption tests 新增遺失的 dataset marker (#38244)
- GH-38285 - [Go] Slight deps 和 docs update (#38284)
- GH-38312 - [Docs] 將 Arrow C Device data interface page 新增至 sidebar TOC (#38313)
- PARQUET-2323 - [C++] 使用 bitmap 儲存 pre-buffered column chunks (#36649)