跳到內容

使用套件

讀取和寫入資料檔案

了解如何使用 arrow 讀取和寫入 CSV、Parquet 和 Feather 檔案

使用 dplyr 語法進行資料分析

了解如何使用 arrow 提供的 dplyr 後端

處理多檔案資料集

了解如何使用 Datasets 讀取、寫入和分析大於記憶體的多檔案資料

整合 Arrow、Python 和 R

了解如何使用 arrow 和 reticulate 有效率地在 R 和 Python 之間傳輸資料,而無需進行不必要的複製

使用雲端儲存空間 (S3, GCS)

了解如何使用儲存在 Amazon S3 儲存桶或 Google Cloud Storage 上的資料集

連線到 Flight 伺服器

了解如何使用 Arrow Flight 在網路上有效率地串流 Apache Arrow 資料物件

Arrow 概念

資料物件

了解 arrow 中的純量、陣列、表格和資料集物件(以及其他物件),它們彼此之間的關係,以及它們與熟悉的 R 物件(如資料框和向量)的關係

資料類型

了解 Apache Arrow 中的基本資料類型,以及這些類型如何對應到 R 中對應的資料類型

Metadata

了解 Arrow 如何使用 Schemas 來記錄資料物件的結構,以及 Arrow 如何支援 R metadata

安裝

在 Linux 上安裝

在 Linux 上安裝 arrow 通常都能順利進行,但偶爾會出現問題。了解如何在發生安裝問題時處理這些問題

安裝開發版本

了解如何安裝 arrow 的每夜建置版本

開發者指南

開發者簡介

了解如何貢獻 arrow 套件

設定開發環境

了解如何設定您的環境,以便您可以貢獻 arrow 套件

開發者工作流程

了解 arrow 開發者遵循的工作流程和慣例

除錯策略

協助 arrow 開發者進行除錯的工具和策略

使用 docker 容器

想要使用 docker 的 arrow 開發者指南

安裝詳細資訊

針對開發者的 arrow 安裝低階描述

Arrow 物件的內部結構

了解 Arrow 資料物件的內部結構。