建立 RecordBatch
參數
- ...
一個
data.frame
或一組具名的陣列 (Arrays) 或向量 (vectors)。如果給定 data.frame 和向量的混合,輸入將會自動拼接在一起 (請參閱範例)。或者,您可以提供單個 Arrow IPCInputStream
、Message
、Buffer
或包含Buffer
的 Rraw
物件。- schema
一個 Schema,或
NULL
(預設值) 以從...
中的資料推斷 schema。當提供 Arrow IPC buffer 時,schema
是必要的。
範例
batch <- record_batch(name = rownames(mtcars), mtcars)
dim(batch)
#> [1] 32 12
dim(head(batch))
#> [1] 6 12
names(batch)
#> [1] "name" "mpg" "cyl" "disp" "hp" "drat" "wt" "qsec" "vs" "am"
#> [11] "gear" "carb"
batch$mpg
#> Array
#> <double>
#> [
#> 21,
#> 21,
#> 22.8,
#> 21.4,
#> 18.7,
#> 18.1,
#> 14.3,
#> 24.4,
#> 22.8,
#> 19.2,
#> ...
#> 15.2,
#> 13.3,
#> 19.2,
#> 27.3,
#> 26,
#> 30.4,
#> 15.8,
#> 19.7,
#> 15,
#> 21.4
#> ]
batch[["cyl"]]
#> Array
#> <double>
#> [
#> 6,
#> 6,
#> 4,
#> 6,
#> 8,
#> 6,
#> 8,
#> 4,
#> 4,
#> 6,
#> ...
#> 8,
#> 8,
#> 8,
#> 4,
#> 4,
#> 4,
#> 8,
#> 6,
#> 8,
#> 4
#> ]
as.data.frame(batch[4:8, c("gear", "hp", "wt")])
#> gear hp wt
#> 1 3 110 3.215
#> 2 3 175 3.440
#> 3 3 105 3.460
#> 4 3 245 3.570
#> 5 4 62 3.190