宣布 Apache Arrow DataFusion 現在更名為 Apache DataFusion
已發布 2024年5月7日
作者 Apache Arrow PMC (pmc)
簡介
簡而言之;Apache Arrow DataFusion –> Apache DataFusion
Arrow PMC 和新成立的 DataFusion PMC 很高興宣布,自 2024 年 4 月 16 日起,Apache Arrow DataFusion 子專案現在已成為頂級的 Apache 軟體基金會專案。
背景
Apache DataFusion 是一個快速、可擴展的查詢引擎,用於在 Rust 中建構高品質的以資料為中心的系統,並使用 Apache Arrow 記憶體內格式。
當 DataFusion 在 2019 年捐贈給 Apache 軟體基金會時,DataFusion 社群的規模還不足以獨立運作,Arrow 專案同意協助支援它。自 2019 年以來,社群顯著成長,從成為 Arrow 的一部分並遵循「Apache 之道」中獲益良多。
為什麼是現在?
社群公開討論升級為頂級專案已近一年,因為該專案似乎已準備好獨立運作,並將受益於更集中的治理。 例如,在 DataFusion 的早期,許多人同時為 arrow-rs 和 DataFusion 做出貢獻,但隨著 DataFusion 的成熟,許多貢獻者、提交者和 PMC 成員越來越專注於 DataFusion。
展望未來
未來一片光明。 現在已有數十個已知專案是使用 DataFusion 建構的,而且這個數字持續成長。 我們最近舉辦了第一次線下聚會,在 GitHub 上超過 5000 個星標,撰寫了一篇論文並被 SIGMOD 2024 接受,並開始開發 Comet,這是一個最初由 Apple 捐贈的 Apache Spark 加速器。
感謝 Arrow 社群中多年來協助 DataFusion 成長和成熟的每個人,我們期待作為專案繼續合作。 未來的部落格和公告都將發布在 Apache DataFusion 網站上。
參與其中
如果您有興趣加入社群,我們非常歡迎您的加入。 請使用「交流文件」與我們聯繫,並瞭解如何透過「貢獻者指南」參與其中。 我們歡迎所有人嘗試在自己的資料和專案上使用 DataFusion,並讓我們知道情況如何,貢獻建議、文件、錯誤報告,或包含文件、測試或程式碼的 PR。