從/向序列化的 Arrow 資料讀取/寫入連線、檔案路徑、URL 或原始向量。Arrow 文件通常將此格式稱為「Arrow IPC」,因為其起源是作為在程序之間傳輸表格(例如,多個 R 會議)的一種方式。此格式也可以寫入和讀取檔案或 URL,並且本質上是 CSV 檔案的高效能等效物,能更好地維護類型。
引數
- x
一個
raw()
向量、連線或檔案路徑,用於從中讀取二進位資料。指示壓縮的常見副檔名(.gz、.bz2、.zip)會自動解壓縮。- ...
目前未使用。
- lazy
預設情況下,
read_nanoarrow()
將讀取並丟棄讀取器結構描述的副本,以確保盡快發現無效的串流。使用lazy = TRUE
將此檢查延遲到實際使用讀取器時。- data
一個要寫入為 Arrow IPC 串流的物件,使用
as_nanoarrow_array_stream()
轉換。值得注意的是,這包括data.frame()
。
詳細資訊
nanoarrow 套件實作了一個 IPC 寫入器;但是,您也可以使用 arrow::write_ipc_stream()
從 R 寫入資料,或使用來自 Python、C++、Rust、JavaScript、Julia、C# 和其他語言的另一個 Arrow 實作的等效寫入器。
Arrow 串流的媒體類型是 application/vnd.apache.arrow.stream
,建議的檔案副檔名是 .arrows
。
範例
as.data.frame(read_nanoarrow(example_ipc_stream()))
#> some_col
#> 1 1
#> 2 2
#> 3 3