跳到內容

Hive 分割將欄位名稱和值嵌入路徑片段中,例如 "/year=2019/month=2/data.parquet"。

用法

hive_partition(..., null_fallback = NULL, segment_encoding = "uri")

參數

...

具名的資料類型列表,傳遞給 schema()

null_fallback

字元,用於替換分割區欄位中遺失的值 (NANULL)。預設值為 "__HIVE_DEFAULT_PARTITION__",這也是 Hive 使用的值。

segment_encoding

在分割路徑後解碼分割區片段。預設值為 "uri" (URI 解碼片段)。也可以是 "none" (保持原樣)。

一個 HivePartitioning,或者如果呼叫不帶參數的 hive_partition(),則為 HivePartitioningFactory

詳細資訊

因為欄位在路徑片段中被命名,所以傳遞給 hive_partition() 的欄位順序並不重要。

範例

hive_partition(year = int16(), month = int8())
#> HivePartitioning