2023年底,云計算“水逆”
云計算,是這些年來互聯(lián)網(wǎng)大廠選擇投入熱門領(lǐng)域之一,那么,云計算的技術(shù)基石是否會受到威脅?大模型的出現(xiàn),又會給云計算的游戲規(guī)則帶來什么改變?這篇文章里,作者結(jié)合近期事件做了解讀,一起來看。
云計算,曾被無數(shù)科技大廠視為“市值壓艙石”,如今似乎遭遇了“滑鐵盧”。
老生常談的市場增速是最直觀的體現(xiàn)。IDC近期發(fā)布的《中國公有云服務(wù)市場(2023上半年)跟蹤報告》顯示,中國公有云市場的IaaS和PaaS增長僅為15.9%,是近三年的最低水平。
原因可以歸結(jié)于兩點。一是企業(yè)IT預算的增長未達預期。后疫情時代下的企業(yè),在預算制定和支出上變得更加謹慎,他們開始尋求更高效、成本更低的方案。這在很大程度上抑制了公有云市場的增長。
其次,互聯(lián)網(wǎng)云服務(wù)商為了保持利潤,做出了戰(zhàn)略上的調(diào)整。競爭加劇的市場環(huán)境中,這些廠商從追求收入轉(zhuǎn)變?yōu)樽非笥艞壛瞬糠址怯椖?。這也導致了市場整體收入增長的放緩。
還有更為嚴重的挑戰(zhàn),可能正直接威脅到云計算技術(shù)基石的地位。
就在近段時間,海外,馬斯克的X平臺選擇離開云端以節(jié)約成本;國內(nèi),多家互聯(lián)網(wǎng)平臺因云產(chǎn)品引發(fā)了網(wǎng)站宕機。偶發(fā)的幾起事件,匯聚在一起,對云計算的效率和可靠性提出質(zhì)疑。
在成為科技大廠多年追求的熱門領(lǐng)域之后,云計算如今面臨著其發(fā)展歷程中最艱難的時刻。
一、X“下云”開先河
2023年10月27日,X的工程團隊發(fā)布了一篇詳盡的長帖,對過去一年中平臺架構(gòu)所做的調(diào)整進行了總結(jié)。
最引人矚目的是X平臺嘗試“下云”所帶來的顯著成本變化。通過優(yōu)化對云服務(wù)提供商的使用,X平臺實現(xiàn)了月度云成本的60%降低。
具體來說,團隊將所有媒體/數(shù)據(jù)塊工件從云中遷移出來,降低了60%的云數(shù)據(jù)存儲大小,并將云數(shù)據(jù)處理成本降低了75%。
這一策略的調(diào)整明顯事出有因。據(jù)外媒報道,X平臺之前每年在AWS上的開銷高達1億美元。馬斯克收購后指示平臺削減云服務(wù)和額外的服務(wù)器空間,以期望每年節(jié)約高達10億美元的基礎(chǔ)設(shè)施成本。
盡管實際成效尚未完全明朗,但根據(jù)最新公布的數(shù)據(jù),“節(jié)約60%的月度云成本”意味著X平臺每年可能節(jié)省高達6000萬美元。
這一成績引起了“下云”倡導者的極大關(guān)注,其中包括Ruby on Rails框架創(chuàng)始人David Heinemeier Hansson(簡稱DHH)。今年6月,DHH 宣布其創(chuàng)始公司 37Signals 時隔6個月完成“下云”,將所有應(yīng)用遷移至本地硬件。即使預留50萬美元用于意外開支,5年內(nèi)也可節(jié)約700萬美元的云成本。
他在《X celebrates 60% savings from cloud exit》一文中指出,對于首席財務(wù)官和投資者而言,這種成本節(jié)約是無法忽視的。如果像X平臺這樣的大型企業(yè)能夠在員工數(shù)量大幅減少的同時,通過“下云”措施獲得巨額利潤,那么對于其他大型企業(yè)而言,“下云”無疑是一個值得探索的領(lǐng)域。
不過,該觀點也有一些質(zhì)疑的聲音。例如,盡管X平臺在云計算上的支出減少了60%,但他們在本地化操作后的具體成本并未公開,這讓人們對整體成本效益產(chǎn)生了疑問。
業(yè)內(nèi)專家也指出,每年都有新聞報道客戶因為彈性伸縮云產(chǎn)品價格昂貴而選擇“下云”,節(jié)省了大量預算。但這并不意味著彈性伸縮云產(chǎn)品不適合所有客戶。這些新聞背后的真正問題,可能是產(chǎn)品經(jīng)理和銷售團隊的失職,他們未能合理設(shè)置價格策略,導致客戶流失。
傳統(tǒng)意義上,企業(yè)上云被認為是一種節(jié)省成本的策略。云計算的銷售人員經(jīng)常向企業(yè)領(lǐng)導強調(diào),通過遷移到云端的數(shù)字化管理轉(zhuǎn)型,可以在多個方面實現(xiàn)成本節(jié)約。其中包括數(shù)據(jù)管理、機房建設(shè)、專業(yè)運維人員的費用,以及其他與系統(tǒng)維護相關(guān)的綜合成本。
而云服務(wù)的立錐之地,一個關(guān)鍵優(yōu)勢在于靈活性和可擴展性。這意味著企業(yè)可以實時調(diào)整資源,而不需要承擔傳統(tǒng)IT基礎(chǔ)設(shè)施所帶來的高額成本和時間投入。
因此很長一段時間內(nèi),上云被視為企業(yè)降低運營成本、提高效率的理想選擇。
然而,隨著X平臺開了“下云”先河,人們開始重新審視云計算的成本效益,考慮云計算與本地化運營之間的平衡。
二、大廠宕機扯下遮羞布
近期,國內(nèi)大型互聯(lián)網(wǎng)平臺的網(wǎng)站服務(wù)紛紛遭遇崩潰,演繹了一出黑色幽默戲碼。
紅星資本局的報告顯示,近幾年每當應(yīng)用程序崩潰,用戶便會迅速匯聚至各大社交平臺展開討論。當這些討論達到一定程度時,媒體便會關(guān)注這些事件,并可能使其登上各大平臺的熱搜榜。以此為依據(jù),2022年發(fā)生的崩潰事故大約有9起,而今年已有14起。
這一增長趨勢反映出技術(shù)問題的普遍性。
一位資深技術(shù)專家在分析宕機現(xiàn)象時,提出了IT系統(tǒng)的三層結(jié)構(gòu)模型:最頂層為應(yīng)用軟件,中間層是云平臺,最底層則是IT硬件。
他指出,當?shù)讓拥腎T硬件出現(xiàn)問題時,通??梢酝ㄟ^增加冗余系統(tǒng)或快速更換硬件來解決。但問題若發(fā)生在云平臺層面,其影響會顯著擴散,不僅影響單個應(yīng)用,而且可能涉及多個應(yīng)用。另一方面,如果應(yīng)用可以打開但無法正常使用,則通常指向應(yīng)用軟件層面的問題。
據(jù)此可以判斷,近期的App宕機潮與云平臺和應(yīng)用軟件層面的問題密切相關(guān)。這一系列事件再次挑戰(zhàn)了云服務(wù)長期以來的可靠性口碑。
阿里系產(chǎn)品近期的集體故障顯然與其云服務(wù)的使用密切相關(guān)。其影響之廣,不僅是技術(shù)層面的問題,也與阿里采用的云服務(wù)特性有很大關(guān)系。
Flexera的《2022年云狀態(tài)報告》指出,89%的受訪企業(yè)在IT架構(gòu)上采用了多云戰(zhàn)略。多云策略的優(yōu)勢在于它可以幫助企業(yè)保持議價能力,不受單一資源的限制,并避免技術(shù)架構(gòu)與單一云服務(wù)商深度綁定。
這就對國內(nèi)的阿里系產(chǎn)品提出了挑戰(zhàn)。因為其大多使用的云服務(wù)實際上是自家業(yè)務(wù)的一部分。未來他們需要考慮是否將一部分業(yè)務(wù)轉(zhuǎn)移至其他云服務(wù)提供商,或是創(chuàng)建一個獨立的私有云,以此來分散和降低風險。
滴滴App的事故也源自云計算,外界普遍認為是與滴滴彈性云基于K8S的升級有關(guān)。
官方的內(nèi)部調(diào)查初步確定,事故起因是底層系統(tǒng)軟件發(fā)生故障,而非遭受攻擊;并承諾將深入進行技術(shù)風險隱患排查和升級工作,確保服務(wù)穩(wěn)定,努力避免類似事故再次發(fā)生。
另外,密集的突發(fā)事件還被解讀為是各大互聯(lián)網(wǎng)公司“降本增效”的裁員行為,影響到了技術(shù)、運維團隊的正常運作,導致技術(shù)服務(wù)和系統(tǒng)穩(wěn)定性受損。
盡管只是毫無根據(jù)地猜想,卻也映射出公眾對云服務(wù)故障的深切關(guān)注。未來用戶對于云服務(wù)故障事件的容忍度,可能會逐漸降低。
總之,云服務(wù)的一個關(guān)鍵風險——可靠性問題,正在暴露出來,尤其是在缺乏充分備份和故障轉(zhuǎn)移計劃的情況下。
三、誰來拯救云計算?
飛速發(fā)展的大趨勢下,問題往往被暫時隱藏在繁榮的表象之下?,F(xiàn)在,探索云計算如何能夠重拾增長的腳步,并進一步優(yōu)化客戶體驗?這一切的關(guān)鍵,恰恰在于生成式人工智能的廣泛應(yīng)用。
目前,大模型正在改變云計算的游戲規(guī)則,并逐漸成為行業(yè)共識。
一方面,龐大的語言模型在訓練和推理階段需要巨大的計算力。這一需求促使云服務(wù)商提供更加強大且高效的計算資源以支持模型訓練。
另一方面,大模型的流行也帶動了對云計算資源的額外需求,推動云計算的技術(shù)架構(gòu)和產(chǎn)品布局發(fā)生變化。
IDC的研究主任Ewa Zborowska對此進行了深入闡述。具體來說,在生成式AI的快速發(fā)展和可擴展性方面,云計算扮演了催化劑的角色。
當下,即便沒有巨額的前期投資,高性能的計算資源如GPU和TPU也變得觸手可及。這讓組織可以集中精力在最重要的事情上:開發(fā)創(chuàng)新的生成式AI解決方案,而不必擔心任何基礎(chǔ)設(shè)施問題。
此外,云平臺為生成式AI提供的一個主要優(yōu)勢是管理對預訓練模型和API的訪問。預訓練模型集成了生成式AI專家的知識和技能,節(jié)約了大量的時間和計算資源。通過利用這些模型,開發(fā)者可以推進他們的項目,專注于微調(diào)和定制,而不是花費無數(shù)小時在模型訓練上。
企業(yè)當然也可以選擇自己構(gòu)建和托管基礎(chǔ)模型,但這是一個非常昂貴、復雜且耗時的過程。而云服務(wù)商提供的API簡化了模型架構(gòu)的復雜性,使得將生成式AI能力整合到現(xiàn)有和新建應(yīng)用程序中變得更加簡單。
可以說,生成式AI的興起,加固了云計算不可或缺的基石地位。根據(jù)Gartner的預測,到2024年,主要需求將來自部署生成式AI能力的組織,他們的云基礎(chǔ)設(shè)施消耗預計將比2023年增長近27%。
盡管形勢一片大好,云服務(wù)商們也不能沉浸于現(xiàn)狀的自滿之中。在這條充滿不確定性的商業(yè)征途上,真正的驅(qū)動力是實際的經(jīng)濟效益。供應(yīng)商們必須認識到,唯有持續(xù)創(chuàng)新和適應(yīng)市場的不斷變化,才能保持領(lǐng)先。
比如,云服務(wù)商需要投資于硬件和芯片的研發(fā),增強針對生成式AI任務(wù)的硬件和芯片能力,甚至開發(fā)新型芯片來加速生成式AI的計算。只有不斷站穩(wěn)硬件層面的前沿,才可以提供更高的性能和成本效益。
另外,云服務(wù)商還需要開發(fā)行業(yè)特定或用例特定的AI框架,通過針對不同領(lǐng)域的獨特需求,實現(xiàn)差異化。只有通過這些專門的AI框架,才能使企業(yè)有效利用生成式AI,并推動特定行業(yè)的創(chuàng)新。
以上早已是今年上半年北美和中國云計算巨頭正在積極推進的策略。而眼下,云計算行業(yè)才正式邁入了決定其命運的下半場征程。
參考資料:
北京商報-今年App崩潰至少已有14起
IDC-Why Generative AI and Cloud Platforms Are a PerfectMatch
作者:樟稻;編輯:伊頁
來源公眾號:科技新知(ID:kejixinzhi),洞察技術(shù)變化背后的產(chǎn)業(yè)變遷。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @科技新知 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于 CC0 協(xié)議
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!