企業(yè)應(yīng)用歷程回顧及未來展望(三): 云時代的BI
一家云計算公司為什么要投入如此多的資金去收購數(shù)據(jù)可視化公司,僅僅是為了提升數(shù)據(jù)分析和展示的能力,從而為企業(yè)提供更多的服務(wù)么?另外,傳統(tǒng)的BI廠商和云計算廠商結(jié)合后,是否會加速數(shù)據(jù)上云的過程,提升PAAS平臺的服務(wù)能力呢 ?未來,商業(yè)智能最核心的價值和競爭力是什么
商業(yè)智能又被稱為BI,主要指商業(yè)領(lǐng)域的數(shù)據(jù)分析和可視化展示。提到BI,最近的一則新聞似乎在行業(yè)里引起轟動,那就是領(lǐng)先SAAS公司Salesforce花了150億美金收購了知名BI公司Tableau。
一家云計算公司為什么要投入如此多的資金去收購數(shù)據(jù)可視化公司,僅僅是為了提升數(shù)據(jù)分析和展示的能力,從而為企業(yè)提供更多的服務(wù)么?另外,傳統(tǒng)的BI廠商和云計算廠商結(jié)合后,是否會加速數(shù)據(jù)上云的過程,提升PAAS平臺的服務(wù)能力呢 ?未來,商業(yè)智能最核心的價值和競爭力是什么 ?
帶著以上這些問題,首先還是來看下傳統(tǒng)BI的價值,傳統(tǒng)的商業(yè)智能主要是為更好地制訂戰(zhàn)略和決策提供良好的環(huán)境,為特定的應(yīng)用系統(tǒng)(如客戶關(guān)系管理CRM、供應(yīng)鏈管理SCM、企業(yè)資源計劃ERP)提供數(shù)據(jù)環(huán)境和決策分析支持。
當(dāng)面向特定應(yīng)用的特定戰(zhàn)略和決策問題,商業(yè)智能從數(shù)據(jù)準(zhǔn)備做起,建立或虛擬一個集成的數(shù)據(jù)環(huán)境。在集成的數(shù)據(jù)環(huán)境之上,利用科學(xué)的決策分析工具,通過數(shù)據(jù)分析、知識發(fā)現(xiàn)等過程,為戰(zhàn)略制訂和決策提供支持。整個過程中,集成的數(shù)據(jù)環(huán)境和決策分析工具是十分重要和不要缺少的。
那么,云計算時代的商業(yè)智能和傳統(tǒng)的BI相比有哪些不同或者說結(jié)合的方式呢?
一、基于云計算模式的BI
1.1 云計算與商業(yè)智能結(jié)合
BI其實就是一種可視化應(yīng)用和數(shù)據(jù)處理的能力。BI上云其實也就是利用云計算提供的海量平臺。BI與云計算結(jié)合,或者說把BI轉(zhuǎn)移到云計算平臺上,將很大程度提高BI的運行速度、數(shù)據(jù)存儲能力、數(shù)據(jù)分析能力、決策判斷能力等?;A(chǔ)架構(gòu)對應(yīng)的IaaS平臺可以提供基礎(chǔ)設(shè)施,如虛擬化服務(wù)器,而PaaS云能夠提供海量的數(shù)據(jù)存儲空間,有助于企業(yè)存儲越來越多的信息和數(shù)據(jù)。
最上層的SaaS層面向終端提供服務(wù),按照不同的部署方式,企業(yè)的商業(yè)智能可選擇公有云、私有云和混合云幾種。
1.2 IaaS與虛擬服務(wù)器、虛擬存儲、數(shù)據(jù)倉庫
IaaS是指將IT基礎(chǔ)設(shè)施能力(如服務(wù)器、存儲、計算能力等)通過互聯(lián)網(wǎng)提供給用戶使用,并根據(jù)用戶對資源的實際使用量或占用量進行計費的一種服務(wù)。IaaS所提供的資源是富有彈性的,也就是說,當(dāng)用戶需要的時候能夠立即提供,而當(dāng)用戶不需要時候能自動回收。
虛擬服務(wù)器能夠再一臺物理服務(wù)器上運行多種虛擬服務(wù)器。而BI的最核心能力其實是位于PaaS層的數(shù)據(jù)倉庫。當(dāng)然,創(chuàng)建data warehouse直接在IaaS的虛擬服務(wù)器上就能完成。
BI最后給管理者提供的決策建議,其準(zhǔn)確度與數(shù)據(jù)倉庫的數(shù)據(jù)有很大的關(guān)系。高質(zhì)量的數(shù)據(jù)越多,推薦的結(jié)果也更加精準(zhǔn)。目前的線下服務(wù)器存儲能力難以負荷巨大的數(shù)據(jù)信息量。將DW遷移到云上,有助于更大信息量的存儲和分析。
1.3 SaaS與BI應(yīng)用
SaaS是一種局域互聯(lián)網(wǎng)提供軟件服務(wù)的應(yīng)用模式,它能夠以較低的成本為用戶提供軟件服務(wù),無需軟件的安裝、管理和支持等復(fù)雜的流程,使用戶能夠獲得比本地更好的體驗。
從架構(gòu)成熟度上,BI在SaaS的實現(xiàn)以SaaS服務(wù)架構(gòu)的4級成熟度為前提。4級成熟度包括表現(xiàn)層、調(diào)度層、業(yè)務(wù)層與數(shù)據(jù)層。BI實質(zhì)上就是應(yīng)用而已,構(gòu)建在云上,顯示出極佳的效果。
表現(xiàn)層提供SaaS的展示方式,決定應(yīng)用能夠?qū)崿F(xiàn)的用戶體驗水平。BI的服務(wù)對象主要是信息技術(shù)人員,而不是管理者,BI的可視化效果將影響管理者對決策信息的接受程度。
所謂的可視化技術(shù)就是通過計算機圖形學(xué)和圖像處理技術(shù),將數(shù)據(jù)轉(zhuǎn)換為圖形或圖像顯示等。展示層將BI分析得出的信息與結(jié)果用可視化形式表示出來,信息表達、解釋和評估的可視化有助于理解所獲得的信息并檢驗信息的實用性。
調(diào)度層將客戶端發(fā)出的請求調(diào)度到何時的業(yè)務(wù)處理服務(wù)器上,提高SaaS的交付性能與資源利用率。業(yè)務(wù)層和數(shù)據(jù)層為BI應(yīng)用提供支持。
與云計算技術(shù)結(jié)合的BI自下而上可劃分為三個部分:最底層為基礎(chǔ)層,負責(zé)BI的數(shù)據(jù)倉庫、存儲處理計算等;中間層為平臺等,提供編程接口、邏輯實現(xiàn)等功能;最表層為實現(xiàn)層,根據(jù)用戶的個性化定制,把數(shù)據(jù)分析的結(jié)果呈現(xiàn)給用戶。
1.4 私有云、混合云和BI的結(jié)合
所謂的私有云,有點像云計算的基礎(chǔ)設(shè)施,使用虛擬化技術(shù),位于私有數(shù)據(jù)中心。私有云之所以更受企業(yè)認(rèn)可,是因為私有云比公有云更有私密的保護性。雖然因此其共享性受到影響,但是由于BI里面分析的數(shù)據(jù)都是企業(yè)內(nèi)部數(shù)據(jù),采用私有云可以對數(shù)據(jù)進行較好的保護。因此BI上到私有云上,不僅可以使數(shù)據(jù)得到一定的保護,還可以享受云計算帶來的便利。
所謂的混合云,就是公有云和私有云的結(jié)合,是在云中存在兩種或者兩種以上云的類型。混合云涵蓋了公有云和私有云的屬性,使得用戶的數(shù)據(jù)和應(yīng)用能夠根據(jù)不同需要在不同的云中遷移。它使企業(yè)既有自己的云計算環(huán)境,同時也能夠使用外部公共云計算的服務(wù)。兼顧了公有云的成本優(yōu)勢和私有云的安全性,受到企業(yè)的歡迎。
1.5 基于云計算的BI的優(yōu)點
BI上云主要有以下幾個優(yōu)點:
- 提供更強大的數(shù)據(jù)存儲和管理能力:面對海量的數(shù)據(jù),傳統(tǒng)的數(shù)據(jù)倉庫模式已經(jīng)難以滿足當(dāng)今的需求?;谠朴嬎隳J降纳虡I(yè)智能可以通過虛擬服務(wù)器、虛擬存儲等服務(wù),提供給企業(yè)更強大的數(shù)據(jù)存儲和管理能力。
- 提供BI的實時性:企業(yè)的現(xiàn)狀,包括業(yè)務(wù)信息、客戶信息等不斷變化,要做出更為準(zhǔn)確有效的決策,這就對BI的實時性提出了更高的要求?;谠朴嬎隳J降腂I具有更快速、高效、穩(wěn)健的運行性能,同時擴展性極強。
- 硬件冗余自動故障切換:云計算將BI所需的數(shù)據(jù)、應(yīng)用進行分塊,建立在副本,保存在不同的服務(wù)器中,避免了物理硬件的損壞。
- 負載均衡:云計算BI能夠?qū)⒐ぷ骶鶆蚍峙涞讲煌?wù)器上,避免個別服務(wù)器工作負荷過大,讓BI性能發(fā)揮到極致。
- 個性化定制:將BI構(gòu)建在云上, SaaS將從展現(xiàn)層、業(yè)務(wù)層、數(shù)據(jù)層等方面,提供更人性化、更符合企業(yè)自身的可定制化配置和用戶可自定義功能。
- 成本低:基于云計算模式的BI更符合企業(yè)追求低成本的理念,有助于擴大BI在中小企業(yè)中的發(fā)展力度,吸引更多的企業(yè)商家選擇BI。
1.6 應(yīng)用前景
云計算模式下的BI,企業(yè)可將大量數(shù)據(jù)存儲到云中,減少企業(yè)硬件成本,獲得彈性的存儲量大小。
在SaaS上,BI可提供不同的擴展包,分為基礎(chǔ)包、專業(yè)包、企業(yè)包。企業(yè)可根據(jù)自身需要購買不同層次的擴展包,這三個包給企業(yè)提供了更多的選擇。
BI所依賴的云,在現(xiàn)階段主要是以私有云為主。雖然公有云的成本更低,但是安全性還有待時間的考證。然而,隨著云安全性的不斷提升,可以預(yù)見,BI將逐步有私有云遷移到公有云,畢竟公有云成本更低。
隨著云計算技術(shù)的不斷完善,BI必將逐步遷移到該平臺上,不同類型的企業(yè)都會逐步嘗試采用這種低成本、高效率、可擴展的模式,具有廣大的市場機會。
二、基于云端的數(shù)據(jù)處理能力
相比于傳統(tǒng)的OLTP和OLAP,云端的數(shù)據(jù)處理目前最核心的技術(shù)在于機器學(xué)習(xí),這也是為什么最近Apache Spark變得越來越流行,大有取代hadoop之勢。因為Apache Spark除了性能更好以外,更重要的是融入了先進的機器學(xué)習(xí)庫,可以建立聚類和預(yù)測模型,高效實現(xiàn)業(yè)務(wù)場景。
從業(yè)務(wù)層面,傳統(tǒng)的BI分析僅僅能夠展示現(xiàn)有的數(shù)據(jù)統(tǒng)計信息,沒有任何趨勢分析和決策建議,對管理層無法帶來實質(zhì)性的價值。而借助人工智能技術(shù),建立的數(shù)據(jù)模型具有前瞻性和參考價值,幫助管理者洞察業(yè)務(wù)關(guān)鍵信息。
標(biāo)準(zhǔn)BI和機器學(xué)習(xí)的結(jié)合模式如下圖所示:
從運營成本層面,本地建立機器學(xué)習(xí)模型成本非常的高,不僅需要昂貴的硬件設(shè)施,而且必須雇傭?qū)I(yè)的數(shù)據(jù)科學(xué)家。而數(shù)據(jù)上云以后,可以直接建設(shè)在第三方的IaaS和PaaS平臺上,調(diào)用第三方供應(yīng)商開發(fā)的機器學(xué)習(xí)模型也相對簡單高效。當(dāng)然這個也帶來了接下來我們要討論的一個企業(yè)擔(dān)憂的問題 – 云端安全。
三、云端安全性探究
3.1 安全性隱患
云計算的安全性一直是備受關(guān)注的問題。云安全主要包括系統(tǒng)安全和數(shù)據(jù)安全。在云計算環(huán)境下,用戶對云計算數(shù)據(jù)中心的強依賴性,以及云計算服務(wù)對網(wǎng)絡(luò)條件的高要求,系統(tǒng)安全目前非常受重視。
虛擬存儲等服務(wù),實際上是將企業(yè)的內(nèi)部數(shù)據(jù)外包給服務(wù)商,使得數(shù)據(jù)的私密性成為了云計算服務(wù)的一個困擾。但是建立正確的安全模型、選擇正確的安全方法,那么在云計算平臺上可以實現(xiàn)對數(shù)據(jù)、系統(tǒng)安全性的保證。
3.2 安全解決方案
在基于云計算的BI中,針對安全問題,可以封裝一個安全層。云模式BI的安全模型構(gòu)建主要包括三個層面的安全性保障措施:基礎(chǔ)設(shè)施層、底部架構(gòu)層、數(shù)據(jù)信息層。
在基礎(chǔ)設(shè)施層上,根據(jù)安全防護需求,將云計算劃分成幾個安全域。各安全域之間通過防火墻進行隔離。虛擬機接收到的包必須經(jīng)過虛擬網(wǎng)卡。這個虛擬網(wǎng)卡是通過 Host OS創(chuàng)建的,可對經(jīng)過它的包進行過濾選擇。倘若某個包是發(fā)往不允許接收的端口,則虛擬網(wǎng)卡會丟棄這個包,以免端口收到攻擊。通過防火墻的隔離,確保安全域之間的數(shù)據(jù)傳輸?shù)陌踩院头€(wěn)定性。
由于云計算需要建立在互聯(lián)網(wǎng)上,因而對基礎(chǔ)網(wǎng)絡(luò)的安全性也有要求。云計算BI的平臺應(yīng)進行統(tǒng)一IP地址規(guī)劃,對各部分再進行IP地址和數(shù)據(jù)鏈路地址綁定。此外還應(yīng)建立異常流程監(jiān)控體系,以防網(wǎng)絡(luò)收到攻擊。
在底層架構(gòu)層上,主要針對的是IaaS服務(wù)。解決方法之一,就是將一系列虛擬機進行劃分,在同一區(qū)域內(nèi)的虛擬機擁有一致的安全水平,相互之間可以安全交換信息,并與非該區(qū)域的虛擬機隔離,通過特定的安全策略與可信虛擬域外的虛擬機進行通信。所有加入可信虛擬域內(nèi)的虛擬機都需要事先通過安全認(rèn)證。
在數(shù)據(jù)信息層里,可采取數(shù)據(jù)備份、身份認(rèn)證、權(quán)限管理、加密傳輸?shù)燃夹g(shù),實現(xiàn)對數(shù)據(jù)信息安全性和安全性的保護。為防止數(shù)據(jù)不慎損壞,需要對數(shù)據(jù)信息進行備份與恢復(fù)。通過對用戶身份認(rèn)證,確保以身份進行操作的操作者就是這個數(shù)字身份的合法擁有者,也就是保證操作者的物理身份與數(shù)字身份相對應(yīng)。
結(jié)語
回到我們開始談到的那則新聞,不難理解Salesfroce為什么要花大代價采購Tableau。主要還是因為Salesforce擁有大量的用戶數(shù)據(jù)和云計算能力,而tableau擁有從數(shù)據(jù)倉庫到數(shù)據(jù)分析和報表完整的BI產(chǎn)品體系,兩者的結(jié)合可以增強彼此的產(chǎn)品和服務(wù),將BI部署到云上,產(chǎn)生更強的競爭壁壘。
BI與云計算的集合是當(dāng)下熱門的問題?;谠朴嬎隳J降腂I,其本質(zhì)還是BI,云計算只是一個平臺,它結(jié)合了兩者的優(yōu)勢。云計算的海量存儲、數(shù)據(jù)挖掘能力,為BI提供了良好的基礎(chǔ),同時其擁有的相比傳統(tǒng)模式更為低廉的收費,使企業(yè)減少成本,有助于吸引中小企業(yè)的加入。
BI的核心競爭力在于機器學(xué)習(xí)等AI技術(shù)的植入。將BI與云計算結(jié)合,其強大的功能將為企業(yè)管理帶來前所未有的助力。
本文由@靜空一葉 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來自Unsplash,基于CC0協(xié)議
- 目前還沒評論,等你發(fā)揮!