跳到內容

'Parquet' 是一種柱狀儲存檔案格式。此函數讓您能夠將 Parquet 檔案讀取到 R 中。

用法

read_parquet(
  file,
  col_select = NULL,
  as_data_frame = TRUE,
  props = ParquetArrowReaderProperties$create(),
  mmap = TRUE,
  ...
)

參數

file

字元檔案名稱或 URI、連線、raw 向量、Arrow 輸入串流,或具有路徑的 FileSystem (SubTreeFileSystem)。如果是檔案名稱或 URI,Arrow InputStream 將會在完成時開啟和關閉。如果提供輸入串流,它將保持開啟狀態。

col_select

要保留的欄位名稱的字元向量,如同 data.table::fread() 中的 "select" 參數,或是欄位的 tidy selection specification,如同 dplyr::select() 中所使用。

as_data_frame

函數應該傳回 tibble (預設值) 還是 Arrow Table

props

ParquetArrowReaderProperties

mmap

使用 TRUE 以在可能的情況下使用記憶體映射

...

傳遞給 ParquetFileReader$create() 的額外參數

如果 as_data_frameTRUE (預設值),則為 tibble,否則為 Arrow Table

範例

tf <- tempfile()
on.exit(unlink(tf))
write_parquet(mtcars, tf)
df <- read_parquet(tf, col_select = starts_with("d"))
head(df)
#> # A tibble: 6 x 2
#>    disp  drat
#>   <dbl> <dbl>
#> 1   160  3.9 
#> 2   160  3.9 
#> 3   108  3.85
#> 4   258  3.08
#> 5   360  3.15
#> 6   225  2.76