
ETL大數據培訓機構有哪些內容
ETL,英文Extract-Transform-Load的縮寫,用于描述從源端抽取數據(extract)、轉換(transform)、裝載(load)到目的地的過程。ETL一詞通常用于數據倉庫,但是它的對象不僅限于數據倉庫。
ETL是將業務系統的數據抽取、清洗轉換后,裝入數據倉庫的過程,旨在把部門內零散、零散、標準不統一的數據整合起來,以供辦案決策時參考。ETL是BI項目中的關鍵環節。一般來說,在BI項目中ETL花費了整個項目至少1/3的時間,ETL設計的優劣直接關系到與BI項目的成敗。
ETL系統設計分為三個部分:數據提取、數據清理轉換、數據裝載。我們設計ETL時也是從這三個方面開始的。提取數據是從各種不同的數據源提取到ODS(OperationalDataStore,運作型數據存儲),這一過程還可以進行一些數據的清理和轉換),在提取過程中需要選擇不同的提取方法,盡可能地提高ETL的運行效率。在ETL三個部分中,花費時間最長的部分是"T"(Transform,清洗,轉換),這個部分通常只占整個ETL的2/3。通常,在完成數據清理后,數據的裝載直接寫入DW(DataWarehousing,數據倉庫)。
以上是關于小編的一些分析,希望對大家有所幫助,詳細了解可詢問線上客服,或者客服處留言哦,我們會盡快回復您,詳細為您解答……