Apache Arrow#
Apache Arrow 是一個通用的欄狀格式和多語言工具箱,用於快速資料交換和記憶體內分析。
該專案定義了一個與語言無關的欄導向記憶體格式,用於平面和階層式資料,並針對現代硬體上的高效分析操作進行了組織。該專案包含一個活躍開發的多語言程式庫集合,用於解決與資料傳輸和記憶體內分析處理相關的問題。這包括以下主題:
零複製共享記憶體和基於 RPC 的資料移動
讀取和寫入檔案格式(如 CSV、Apache ORC 和 Apache Parquet)
記憶體內分析和查詢處理
要學習如何使用 Arrow,請參閱針對您目標環境的文件。
規格
閱讀關於 Apache Arrow 格式及其相關規格和協定的資訊。
開發
尋找關於從原始碼建置程式庫、建置文件、貢獻和程式碼審查、持續整合、基準測試和發布流程的文件。