雖然云計算使用起來非常方便,對于用戶來說也具有較好的成本效益,但它在整合和處理數據方面也可能帶來新的挑戰和要求。
云計算的出現,讓企業在投資IT和商業應用時,多了一種部署選擇,不再僅限于本地部署。但云環境也經常會增加企業使用的系統的數量,此外,企業還需要具備跨平臺的集成和數據數據準備的能力,只有這樣他們才能整合不同來源的數據。
從本質上說,使用云計算讓企業的成本由硬件和軟件支出轉變持續的運營支出。云計算還可以簡化現金流和并降低成本,讓企業能夠將成本主要投入在其真正需要的技術上,并有足夠的成本來擴大其IT系統,此外,該企業不必擔心它的硬件會過時,因為云平臺提供商可以負責對云環境中進行不斷的系統升級。
云環境的好處吸引了一系列的企業,這些企業正在以一些不同的方式使用云計算技術,主要集中在以下三個用例。
使用云服務直接替換本地系統。在這種情況下,IT團隊依舊負責云端應用程序端到端設計、開發、測試、實現和管理工作。這降低了企業在新技術上的支出,并允許它保持對應用平臺的完全控制。
使用軟件即服務(SaaS)應用程序,如使用Salesforce提供的應用程序。除了降低設備成本,使用SaaS的方式還簡化了應用軟件的實現和管理,這些軟件通常是負責處理企業重點功能,如銷售、營銷、客戶服務,財務和人力資源等。
使用完全管理的平臺即服務(PaaS)環境。在PaaS設置中,云服務提供商負責設計、部署、后端處理和數據資源管理。
云中數據無處不在
盡管云提供很多好處,但它還是有一個顯著的缺點:平臺,應用程序,工具和數據的位置相對分散。雖然云系統對用戶來說更加便捷,成本較低且速度更快,他們仍需要建立一個新的模式,數據分布跨越了不同的系統,也跨越企業和行政邊界。大數據平臺越來越多地部署在云中,考慮到它們包含的數據量,這可能會帶來一些管理上的挑戰。
這種數據的分散也導致了一些問題,例如在管理和使用云端數據方面。對于初學者來說,在云中如何妥善管理各種數據集的數據模型和元數據?進一步來說,如何訪問所有的數據?如何保證不同數據集的同步,協調使用這些數據?
這樣的問題在商業智能,報告和分析應用上更為明顯。使用者必須采取一定的方法,以便在不同的云平臺,應用程序和數據存儲間完成數據集成和數據準備過程,如同在本地部署系統中完成數據集成和數據準備過程一樣。同時,你還必須提供一個可操作的用戶界面,以供業務分析師,數據科學家和其他智能分析用戶查找,準備和分析相關的信息集。
架起數據間的橋梁
事實上,這些問題目前存在一個解決方案,那就是使用那些支持跨平臺的數據集成和數據準備軟件。這些工具,也包括自助數據準備軟件,它提供了主流關系數據庫管理系統和新的NoSQL數據庫之間的連接器。該工具還可以鏈接到Hadoop集群和數據湖泊,獲取存儲在Hadoop分布式文件系統和相關的數據存儲庫中的數據。
此外,這些跨平臺工具還可以攝取非結構化的文本文件和結構化的XML以及JSON文件,此外它們還可以攝取社交網絡的數據流,網站點擊流日志和股票市場數據。而且,他們還可以連接到SaaS應用程序和云服務,將產生的數據與其他所需信息數據整合,完成數據準備過程的自動化。
跨平臺工具擁有其他三個關鍵屬性。首先,它們能夠直接將數據引入到任何選定的平臺,這與傳統的數據集成工具相比是一個很大的區別,傳統數據集成工具是將數據從源系統抽取到一個單一的區域。第二,無論所需的數據存儲在哪里,它們都能讓終端用戶非常容易的訪問到數據,在數據展示層面,它們還支持數據可視化工具。第三、跨平臺工具提供對數據集語義類別劃分;其所存儲的業務元數據能夠提供有關數據元素的細節,定義和結構;它們還提供了數據集成過程所需相關的業務規則。
所有這一切都表明,跨平臺的數據集成和數據準備工具不僅僅是改進了在混合數據源上(本地部署或云端)的數據提取、轉換和加載過程。新興的技術還融合了各種功能,提供了一個統一的方式來訪問,準備,查詢不同的數據以及實現數據的可視化。云環境中分散數據集也有了其對應的數據管理方式。
來源:中國IDC圈
石家莊服務器托管 石家莊服務器租用 石家莊機柜租用 石家莊機房