'Parquet' 是一種柱狀儲存檔案格式。此函數讓您能夠將 Parquet 檔案讀取到 R 中。
用法
read_parquet(
file,
col_select = NULL,
as_data_frame = TRUE,
props = ParquetArrowReaderProperties$create(),
mmap = TRUE,
...
)
參數
- file
字元檔案名稱或 URI、連線、
raw
向量、Arrow 輸入串流,或具有路徑的FileSystem
(SubTreeFileSystem
)。如果是檔案名稱或 URI,Arrow InputStream 將會在完成時開啟和關閉。如果提供輸入串流,它將保持開啟狀態。- col_select
要保留的欄位名稱的字元向量,如同
data.table::fread()
中的 "select" 參數,或是欄位的 tidy selection specification,如同dplyr::select()
中所使用。- as_data_frame
函數應該傳回
tibble
(預設值) 還是 Arrow Table?- props
- mmap
使用 TRUE 以在可能的情況下使用記憶體映射
- ...
傳遞給
ParquetFileReader$create()
的額外參數
值
如果 as_data_frame
為 TRUE
(預設值),則為 tibble
,否則為 Arrow Table。
範例
tf <- tempfile()
on.exit(unlink(tf))
write_parquet(mtcars, tf)
df <- read_parquet(tf, col_select = starts_with("d"))
head(df)
#> # A tibble: 6 x 2
#> disp drat
#> <dbl> <dbl>
#> 1 160 3.9
#> 2 160 3.9
#> 3 108 3.85
#> 4 258 3.08
#> 5 360 3.15
#> 6 225 2.76