Apache Arrow#

Apache Arrow 是一個通用的欄狀格式和多語言工具箱,用於快速資料交換和記憶體內分析。

該專案定義了一個與語言無關的欄導向記憶體格式,用於平面和階層式資料,並針對現代硬體上的高效分析操作進行了組織。該專案包含一個活躍開發的多語言程式庫集合,用於解決與資料傳輸和記憶體內分析處理相關的問題。這包括以下主題:

  • 零複製共享記憶體和基於 RPC 的資料移動

  • 讀取和寫入檔案格式(如 CSV、Apache ORC 和 Apache Parquet)

  • 記憶體內分析和查詢處理

要學習如何使用 Arrow,請參閱針對您目標環境的文件。

規格

閱讀關於 Apache Arrow 格式及其相關規格和協定的資訊。

開發

尋找關於從原始碼建置程式庫、建置文件、貢獻和程式碼審查、持續整合、基準測試和發布流程的文件。

實作#

範例#