猛攻AI,字節(jié)還有幾張牌?
本文介紹了字節(jié)跳動在大模型行業(yè)的新動作,包括發(fā)布全模態(tài)AI模型和探索AI硬件,以及其在視頻生成賽道和AI生態(tài)構建中的策略和挑戰(zhàn)。
近日,大模型行業(yè)再掀“價格戰(zhàn)”,阿里云宣布旗下通義千,問的多款商業(yè)化再次大幅降價,早在今年5月,大模型行業(yè)已經(jīng)進行了一輪降幅接近90%的價格戰(zhàn)?!鞍倌4髴?zhàn)”行至此處,大家都清楚最終能夠留下來的通用大模型或不超過5個。
對于字節(jié)跳動(以下簡稱“字節(jié)”)這一“新晉”互聯(lián)網(wǎng)大廠而言,其在大模型領域的布局并不算早,其他大廠的大模型紛紛面世,字節(jié)的AI智能助手“豆包”才姍姍來遲,但憑著“大力出奇跡”的拼勁,“豆包”已經(jīng)成為了國內用戶最多的原生 AI 應用。
近日,字節(jié)再帶來了兩大新動作,一則,其在近日的AI創(chuàng)新巡展中一口氣發(fā)布了視頻生成模型、音樂模型和同聲傳譯模型,全面覆蓋語言、語音、圖像、視頻等全模態(tài);另外,字節(jié)正在探索自己開發(fā) AI 硬件,首款產品或是智能耳機。
從大模型B端的價格戰(zhàn),到大模型C端的應用創(chuàng)新,再到大模型生態(tài)的流量戰(zhàn),字節(jié)在大模型行業(yè)不曾錯過任何一個“可能”,在大模型卷向下半場之際,字節(jié)手里還有哪些“好牌”?
01 視頻生成賽道,字節(jié)后發(fā)而至
今年6月,快手自研的視頻生成大模型“可靈”正式上線;8月,字節(jié)旗下文生視頻應用“即夢”也后發(fā)而至。
9 月,字節(jié)旗下火山引擎更一舉發(fā)布了豆包視頻生成-PixelDance、豆包視頻生成-Seaweed 兩款大模型,這兩款模型目前已在即夢 AI 內測版小范圍測試。
不過,從目前的輿論偏向來看,“即夢”生成的內容在某些特定的底圖和描述詞之下表現(xiàn)更佳,但更多時候,“可靈”視頻中的物體動態(tài)和光影會更自然。另外,二者生成的AI視頻風格顯然有著差別, “即夢”更擅長動畫風,而“可靈”則更影像風。
兩種風格孰優(yōu)孰劣目前還不好說,但造成這種差異背后,并不只是大模型的技術原因,還跟字節(jié)與快手平臺的布局有關。
一方面,快手在視頻生成模型有先發(fā)優(yōu)勢。雖然“可靈”、“即夢”都是受到了SORA的啟發(fā)而“匆忙”面世,推出時間也相差不遠,但兩者在集團中的地位卻并不相同。
“可靈”源于快手于2023年10月就籌備的靜態(tài)圖片生成Gif表情包的工具,而快手董事長程一笑也將其上升為集團戰(zhàn)略項目,并給予了最大支持。相較之下,在快手推出“可靈”時,字節(jié)還在忙著進行大模型價格戰(zhàn),彼時其最重要的對手是阿里、騰訊、百度。
今年5月,字節(jié)率先宣布旗下豆包通用模型的輸入價格降至最低為0.0008元/千tokens,并聲稱已經(jīng)擊穿了大模型行業(yè)的最低價,隨后,阿里、百度、騰訊紛紛跟隨,帶動大模型行業(yè)卷向“價格戰(zhàn)”。
幾家大廠官宣“降價”幾乎沒有太多時間差,《市界》曾透露,率先降價后火山引擎的銷售人員便開始積極接觸客戶、推介產品,由此可以推測,爭奪B端市場才是字節(jié)彼時的最高級別戰(zhàn)略。
而且,彼時豆包的勢頭也很好。根據(jù)QuestMobile數(shù)據(jù),2024年6月在中國大語言模型應用中,豆包APP月活用戶達到2,750萬,排名第一,相較之下,字節(jié)應用層的其他AI應用如貓箱、星繪等均存在感不高,誰是戰(zhàn)略重點也一目了然。
另一方面,兩者對視頻生成模型的布局有所不同。字節(jié)將“即夢”作為一個單獨的移動應用,獨立于視頻編輯工具剪影之外;而快手則選擇直接將“可靈”搭載于其視頻剪輯平臺快影上,兩者使用的便捷程度有所不同,在用戶積累、生成視頻數(shù)量上自然也有差異。
據(jù)快手高級副總裁蓋坤披露,目前已有超過 260 萬人使用過快手的視頻生成大模型可靈 AI,并累計生成超 2700 萬個視頻。
而字節(jié)“即夢”目前尚未公布相關的用戶數(shù)據(jù),不過在蘋果App Store的“攝影與錄像”下載量排行榜中,“即夢”排在第33,“快影”則排在第11。從生成視頻質量來看,根據(jù)博主闌夕的分享,在Meta的AI視頻論文里,快手的可靈在主流競品的雙盲測試對比中基本是表現(xiàn)最好的那個,甚至好過了還沒公開的Sora。
但字節(jié)看起來似乎不算太著急,“可靈”在3個月內已經(jīng)進行了9次迭代,而字節(jié)旗下火山引擎現(xiàn)在才帶來了兩款全新的視頻生產模型。
字節(jié)的“淡定”,或是因為按目前科技公司本身的算力儲備與資金實力來看,發(fā)布一個大模型的難度并沒有想象中那么高,關鍵是能否擁有高質量數(shù)據(jù)場景,以及能否擁有足夠的差異化。
從這點來看,快手與字節(jié)同為短視頻平臺,兩者在文生視頻賽道都有著相同的視頻數(shù)據(jù)優(yōu)勢。此外,字節(jié)還具有更龐大的短視頻用戶規(guī)模以及更多待挖掘的應用場景,因此,推動AI生態(tài)構建與擴容才是字節(jié)的當務之急。
02 AI+硬件,字節(jié)布局流量通道
近日,字節(jié)的另一新動作便是探索AI硬件。據(jù)《晚點LatePost》報道,字節(jié)正在探索將大模型與硬件結合,第一款產品或為智能耳機。
早在今年5月,《36氪》曾報道稱字節(jié)正在加速AI硬件方向的探索,其中一條產品線為智能耳機,在此之前,字節(jié)已經(jīng)收購了耳機品牌Oladance。
字節(jié)在硬件方面的探索已是駕輕就熟。早在2018年,字節(jié)便收購了錘子科技堅果手機團隊和部分專利使用權,并發(fā)布了堅果手機、TNT顯示器以及音箱等周邊產品。
不過,辦公硬件市場強敵環(huán)伺,于是字節(jié)從2020年開始聚焦教育硬件賽道,啟動了動“大力教育”品牌,并發(fā)布了智能學習燈、教育平板、詞典筆等多款產品。
只是,即便字節(jié)曾計劃以每年百億元的規(guī)模投資教育行業(yè),但盲目跟風再加上“雙減”政策的影響,這次字節(jié)依然沒能“大力出奇跡”,目前大力教育官網(wǎng)也僅剩智能學習燈一款產品的身影。
2021年,字節(jié)斥資90億元收購國內VR出貨量第一的廠商PICO,并在研發(fā)、營銷、運營等方面投入數(shù)百億元,但字節(jié)的“硬件野望”再一次破滅,去年PICO多次裁員,目前僅保留少部分硬件團隊。
但即便如此,字節(jié)還是“屢敗屢戰(zhàn)”,旗下豆包大模型目前已經(jīng)與眾多硬件廠商展開合作,在5月的2024春季火山引擎 FORCE 原動力大會上,其展示了機器狗、學習機、學習機器人三款與 AI 硬件合作的產品。
在智能終端方面,榮耀、OPPO等均宣布與豆包大模型達成合作;在智能汽車聯(lián)盟方面,豆包大模型也先后與吉利、長城、蔚來、廣汽等多家車企達成深度合作。
事實上,“軟硬件協(xié)同”已在互聯(lián)網(wǎng)行業(yè)發(fā)展中經(jīng)歷過數(shù)次輪回,比如PC電腦、智能手機、智能穿戴、智能家居等。在萬物互聯(lián)的趨勢下,硬件是軟件落地的載體,也是用戶流量通向生態(tài)的通道,而AI硬件的發(fā)展路徑,也不過是軟件側的平移。
因此,相中AI硬件的大廠也并不只有字節(jié)。據(jù)悉,美團正在研發(fā)一款名為“俏魚”的AI業(yè)務,并和兒童穿戴設備廠商“小天才”達成合作;科大訊飛發(fā)布了三款AI耳機,加碼AI辦公;百度、華為等在智能終端早有布局的大廠,也在積極構建自己的AI硬件生態(tài)。
目前來看,各大模型廠商在AI硬件的布局還是略有雷同,教育、辦公、生活依然是AI硬件落地的主要場景。但對于大廠們來說,有了連接物理世界的入口,才能形成從內容到流量,到應用和硬件的閉環(huán),這也是AI生態(tài)發(fā)展的基礎。
只不過,這一發(fā)展路徑也并非“萬試萬靈”,字節(jié)此前多次在硬件層面折戟,意味著硬件雖然是個“筐”,但不能什么都往里裝。
一方面,硬件的發(fā)展往往有自己的節(jié)奏,更容易受到市場成熟度的挑戰(zhàn),單純通過軟件業(yè)務恐怕難以在短期內催熟硬件產品。以PICO為例,AR頭顯固然有足夠噱頭,但在穿戴不便、不適的問題難以解決之前,還是很難做到大量普及。
另一方面,硬件是服務于功能的,但在當前大模型應用拉不開差距的前提下,即便大量補貼硬件,用戶也不見得愿意只為“某個軟件”付費,這也意味著大模型企業(yè)必須要把應用打磨得足夠差異化,才能跑通AI+硬件的模式。
所以,硬件雖然是流量的載體,但也不僅只是“載體”,硬件要能夠為大模型提供更便捷的調用觸點,給用戶帶來更便捷的調用形式,這才是“軟硬融合”的契合點。
03 虎口奪食,字節(jié)也在整合生態(tài)
當然,字節(jié)能否在AI硬件領域上再進一步,目前仍有待市場測試,但可以肯定的是,字節(jié)的野心并不只在此處,目前,其也試圖與阿里、百度等大廠短兵相接,搶奪AI生態(tài)話語權。
除了進一步提升大模型能力、打磨AI應用,以及推出AI硬件之外,字節(jié)還推出了智能體開發(fā)平臺“扣子”以及 AI 編程助手“豆包MarsCode”。
在B端市場,火山引擎總裁譚待表示,豆包大模型已經(jīng)在其內部的50多個業(yè)務中進行了真實的實踐驗證,同時還在30多個行業(yè)外部企業(yè)實現(xiàn)深度共創(chuàng),自今年7月發(fā)布以來,平均每家企業(yè)客戶日均Tokens使用量呈22倍的速度增長
雖然,字節(jié)并非傳統(tǒng)的“BAT”巨頭,甚至旗下豆包大模型還比其他大廠的模型晚到了幾個月,但如今字節(jié)也在按照自己的節(jié)奏布局AI生態(tài),其也有自己的牌面。
首先,得益于字節(jié)豐富的業(yè)務場景積累,其能夠更好打磨大模型應用。目前,字節(jié)的業(yè)務場景涵蓋了短視頻、社交媒體、在線教育、電商等眾多領域,這些多元化的業(yè)務場景為豆包大模型的研發(fā)和訓練提供了海量的數(shù)據(jù)和豐富的應用場景。
事實上,字節(jié)在大模型領域的打法策略也與其他大廠略有不同,其更看重C端的體驗,更傾向先打磨C端產品,等到模型能力具備競爭優(yōu)勢后再拓展B端市場。
這或許也跟字節(jié)在C端場景的布局有關,畢竟旗下的大模型乃至AI產品,終究要優(yōu)先服務于旗下的抖音、今日頭條等流量型APP,但這也讓字節(jié)在多模態(tài)大模型領域走得更快。
其次,流量也是字節(jié)的優(yōu)勢。如果說AI生態(tài)的構建需要創(chuàng)作者和使用者雙方流量的共同注入,那么字節(jié)的AI生態(tài)在使用場景和流量引入方面顯然也更具優(yōu)勢。
據(jù)Unique Capital報告顯示,今年7月,字節(jié)旗下CapCut和Doubao在全球人工智能應用下載超越了OpenAI的ChatGPT,斬獲全球第一。
字節(jié)旗下抖音、今日頭條等明星產品已經(jīng)成為流量的重要入口,通過龐大的用戶規(guī)模和精準的數(shù)據(jù)分析能力,字節(jié)也能進一步提升大模型的使用體驗,并進一步發(fā)展多模態(tài)大模型。
近日,字節(jié)旗下火山引擎除了發(fā)布了視頻生成模型、音樂模型、同聲傳譯模型三款新模型外,還對通用語言模型、文生圖模型、語音模型進行了全面升級。
不過,字節(jié)充沛流量支持背后,其也要付出不少代價。有業(yè)內人士透露,豆包大模型僅在6月上旬,就投放了超過一億元的廣告,而且在大模型的廣告戰(zhàn)中,抖音完全傾向了自家大模型,這意味著字節(jié)也在用抖音的廣告收入來換取豆包的用戶增長。
“流量”固然是字節(jié)獨有的“好牌”,但“燒錢換增長”這樣的套路卻難以持續(xù),字節(jié)在跑馬圈地后如何快速轉化并找到能落地的商業(yè)模式,將會成為字節(jié)AI生態(tài)發(fā)展的關鍵。因此,火山引起發(fā)布兩款豆包視頻生成模型時,譚待才會表示“從一落地就開始考慮商業(yè)化”。
最后,則是在“云服務”市場的加速發(fā)力。對于深入B端服務市場的企業(yè)而言,云服務無疑是互聯(lián)網(wǎng)行業(yè)最為重要的賽道之一。據(jù)Canalys預計,2026年中國的云基礎設施市場規(guī)模將達到850億美元,五年復合年增長率為25%。
但在B端市場,字節(jié)要面對的則是阿里云、騰訊云、華為云等主流云廠商,僅這三大云服務商所占的市場份額就已經(jīng)過半。
而且,阿里、騰訊、華為等早已經(jīng)找到各自擅長的細分市場,比如阿里的零售行業(yè);騰訊的文娛、金融行業(yè),字節(jié)想在其中占據(jù)一席之地并不容易。
所以,字節(jié)當前“C端強,B端弱”的現(xiàn)狀,也會成為其在AI生態(tài)中快速落子的障礙,相較于阿里、騰訊等大廠,字節(jié)很難依托現(xiàn)有業(yè)務領域在商用領域形成大模型應用的規(guī)模效應。
或是因為如此,字節(jié)才會在近年通過硬件拓展教育、辦公的不同垂直賽道,希望能夠找到新的突破點。
但如果字節(jié)想要繼續(xù)“大力出奇跡”,打破業(yè)界及客戶對于大廠生態(tài)的固有認知,光成為“實用主義者”還不夠,字節(jié)還需要找到屬于自己的應用賽道,拿出具有競爭力的優(yōu)勢,成為更專業(yè)的大模型方案解決者,方能實現(xiàn)彎道超車。
在當下的大模型市場,無論是B端還是C端,每一條賽道都擠滿了競爭對手,“流量”這一招雖然厲害,但也不是無所不能,回歸到產品應用和生態(tài)建設之上,能否讓垂直行業(yè)開發(fā)者和應用者以更低成本、更低門檻獲得更接地氣的產品和服務,才是關鍵。
作者:楷楷
本文由人人都是產品經(jīng)理作者【伯虎財經(jīng)】,微信公眾號:【伯虎財經(jīng)】,原創(chuàng)/授權 發(fā)布于人人都是產品經(jīng)理,未經(jīng)許可,禁止轉載。
題圖來自 Pixabay,基于 CC0 協(xié)議。
AI 快速的發(fā)展,解決了我們生活中的許多問題,字節(jié)布局流量通道必須開通