![]() |
新聞中心
當前位置:網(wǎng)站首頁 > 新聞中心
如何為大數(shù)據(jù)項目做好準備:成功制定戰(zhàn)略的6個關(guān)鍵要素
如果沒有做好準備,那么項目失敗的可能性就更大。人們在準備大數(shù)據(jù)項目時需要要考慮一樣事項。
如果企業(yè)沒有為獲得最佳性能而預先準備數(shù)據(jù),那將不會更好地為那些消耗數(shù)據(jù)的用戶提供服務。實際上,不良的數(shù)據(jù)準備是導致大數(shù)據(jù)項目失敗的主要原因,而管理此類項目的人負擔不起,只是出于這個原因,對于企業(yè)來說,擁有大數(shù)據(jù)準備策略和方法并如實執(zhí)行是至關(guān)重要的。數(shù)據(jù)準備策略應包含以下元素:
1.對當前和將來的業(yè)務問題有透徹的了解,期望數(shù)據(jù)能為企業(yè)帶來答案。了解要應用大數(shù)據(jù)分析的業(yè)務領(lǐng)域可以為數(shù)據(jù)建立業(yè)務環(huán)境,并有助于制定數(shù)據(jù)收集和執(zhí)行策略。此階段的目標是確定企業(yè)中哪些數(shù)據(jù)與關(guān)鍵業(yè)務問題相關(guān),哪些無關(guān)。企業(yè)還可以隨著業(yè)務需求的變化擴展業(yè)務問題和要查找的數(shù)據(jù),但是一開始最好還是密切關(guān)注數(shù)據(jù)。
2.數(shù)據(jù)集中化。數(shù)據(jù)必須規(guī)范化以便一致,并且企業(yè)中的每個人都使用相同的數(shù)據(jù)。因此,即使可以選擇針對特定業(yè)務領(lǐng)域填充此主數(shù)據(jù)的不同子集,也必須將所有分析數(shù)據(jù)存儲在IT維護的集中式存儲庫中。
3.標識必須饋入中央分析信息存儲庫的數(shù)據(jù)源。一旦確定了業(yè)務案例和問題,就應確定可用于匯總回答業(yè)務中緊迫問題的數(shù)據(jù)集和源。這些數(shù)據(jù)源可以來自企業(yè)內(nèi)部或外部。
4.識別可能相關(guān)的未來數(shù)據(jù)源。同時,現(xiàn)在開始識別將來業(yè)務可能需要的其他數(shù)據(jù)集或源還為時過早。這些數(shù)據(jù)源最初不會準備數(shù)據(jù),但是它們的標識將為將來的數(shù)據(jù)準備提供一個路線圖。
5.定義的數(shù)據(jù)準備方法。有三個基本步驟可將干凈數(shù)據(jù)移入中央數(shù)據(jù)存儲庫。首先,從數(shù)據(jù)源中提取數(shù)據(jù)。然后,將其轉(zhuǎn)換為與其要到達的數(shù)據(jù)目標兼容的格式。最后,將其加載到目標存儲庫中。重要的部分是轉(zhuǎn)型。如果相同的數(shù)據(jù)字段將流入新的目的地,但該目的地的格式不同于原始目的地,則必須將數(shù)據(jù)轉(zhuǎn)換為新格式,以便數(shù)據(jù)正常工作并在目的地中保持一致。如果人工完成,這是一個繁瑣的步驟,因此需要自動化工具。
6.選擇有效的數(shù)據(jù)準備工具。市場上有許多數(shù)據(jù)準備工具,因此建議企業(yè)嘗試使用它們,并與提供強大支持和培訓的供應商合作。目標應該是準備數(shù)據(jù)以使其具有最高質(zhì)量,并選擇易于使用的工具,并提供自動執(zhí)行數(shù)據(jù)準備步驟的工具。
上一篇 什么云服務器掛千牛好? 下一篇 關(guān)于云遷移,企業(yè)需要了解的事
|