跳至內容

從/向序列化的 Arrow 資料讀取/寫入連線、檔案路徑、URL 或原始向量。Arrow 文件通常將此格式稱為「Arrow IPC」,因為其起源是作為在程序之間傳輸表格(例如,多個 R 會議)的一種方式。此格式也可以寫入和讀取檔案或 URL,並且本質上是 CSV 檔案的高效能等效物,能更好地維護類型。

用法

read_nanoarrow(x, ..., lazy = FALSE)

write_nanoarrow(data, x, ...)

example_ipc_stream()

引數

x

一個 raw() 向量、連線或檔案路徑,用於從中讀取二進位資料。指示壓縮的常見副檔名(.gz、.bz2、.zip)會自動解壓縮。

...

目前未使用。

lazy

預設情況下,read_nanoarrow() 將讀取並丟棄讀取器結構描述的副本,以確保盡快發現無效的串流。使用 lazy = TRUE 將此檢查延遲到實際使用讀取器時。

data

一個要寫入為 Arrow IPC 串流的物件,使用 as_nanoarrow_array_stream() 轉換。值得注意的是,這包括 data.frame()

詳細資訊

nanoarrow 套件實作了一個 IPC 寫入器;但是,您也可以使用 arrow::write_ipc_stream() 從 R 寫入資料,或使用來自 Python、C++、Rust、JavaScript、Julia、C# 和其他語言的另一個 Arrow 實作的等效寫入器。

Arrow 串流的媒體類型是 application/vnd.apache.arrow.stream,建議的檔案副檔名是 .arrows

範例

as.data.frame(read_nanoarrow(example_ipc_stream()))
#>   some_col
#> 1        1
#> 2        2
#> 3        3