蘋(píng)果卷入大模型,手機(jī)行業(yè)借AGI「吃掉」軟件層?
本文主要探討了蘋(píng)果公司在WWDC大會(huì)上展示的新一代AI技術(shù)和其對(duì)未來(lái)AI產(chǎn)業(yè)發(fā)展的影響,特別是AI能否像預(yù)測(cè)的那樣“吃掉”軟件層,成為主導(dǎo)力量。同時(shí)也提及了AI在各行各業(yè)的實(shí)際運(yùn)用及存在的問(wèn)題。
蘋(píng)果重新定義了AI(Apple Intelligence)。
6月11日凌晨1點(diǎn),蘋(píng)果公司召開(kāi)了今年的開(kāi)發(fā)者大會(huì)WWDC,用了首場(chǎng)發(fā)布會(huì)將近一半的篇幅來(lái)講AI如何整合到蘋(píng)果系統(tǒng)中,將人工智能化于無(wú)形,融進(jìn)Apple Intelligence。
媒體和資本評(píng)價(jià)兩極化,一部分認(rèn)為蘋(píng)果這次出手,軟硬件結(jié)合,在系統(tǒng)層面提供了AI能力,一夜之間滅了許多AI創(chuàng)業(yè)者的生路——畢竟在當(dāng)下的節(jié)點(diǎn),利用OpenAI 接口包裝一個(gè)翻譯插件或者腦圖都算是創(chuàng)業(yè),這可叫AI公司怎么活。
反方則認(rèn)為蘋(píng)果此次更新了無(wú)新意,原地雕花,不夠炸裂,新功能還是基本集中在「文生圖」、「文本總結(jié)」、「跨應(yīng)用聯(lián)動(dòng)」這些老生常談的功能上。從發(fā)布會(huì)后的股價(jià)上漲近7.26% 的表現(xiàn)來(lái)看,資本市場(chǎng)倒是對(duì)「蘋(píng)果AI」基本滿意。
無(wú)論Apple Intelligence有多么誘人 華麗,也只是蘋(píng)果提前畫(huà)的大餅,英文版今年秋天上線,其他語(yǔ)言要到明年才會(huì)有后續(xù)。半年時(shí)間,對(duì)AI公司來(lái)說(shuō)可以做很多事。會(huì)有其他競(jìng)爭(zhēng)者對(duì)蘋(píng)果的藍(lán)圖提出挑戰(zhàn)嗎?
一、科技公司全面卷入AI
AI浪潮以來(lái),美股七雄(Magnificent 7,即美國(guó)市場(chǎng)上市值最大的七家科技公司,包括Alphabet、亞馬遜、蘋(píng)果、Meta、微軟、英偉達(dá)和特斯拉)分化明顯,市值排序跌宕起伏。
在6月5日大漲后,「賣(mài)鏟子」的NVIDIA市值超3萬(wàn)億美元,超越蘋(píng)果,距離3.15萬(wàn)億的微軟只需再漲不到5%;微軟借AI登上第一,乘了OpenAI的東風(fēng),并乘勢(shì)建立了更好的工具和商用系統(tǒng),推出了AI-PC,23年?duì)I收達(dá)到驚人的2210億美元;Meta用開(kāi)源大模型造福了一票國(guó)內(nèi)公司,用AI改進(jìn)廣告,內(nèi)容審核和個(gè)性化推薦,利潤(rùn)翻了兩番;亞馬遜將AI整合到AWS框架中,意在企業(yè)級(jí)AI,它還投資了Anthropic,與NVIDIA合作Blackwell Gpu;Alphabet對(duì)標(biāo)OpenAI節(jié)奏,但總感覺(jué)失之毫厘,略有漲幅;特斯拉掉隊(duì),蘋(píng)果踟躕不前,還在畫(huà)餅。
大模型方面,科技公司都有fomo(fear of missing out)效應(yīng),人無(wú)我有,就很尷尬;產(chǎn)品和生態(tài)上,后發(fā)制人有優(yōu)勢(shì)。非盈利機(jī)構(gòu)OpenaAI是最大造浪機(jī),蘋(píng)果與其合作,水到渠成。
蘋(píng)果放棄造車(chē)后,一門(mén)心思鉆研AI更廣泛的應(yīng)用,思路與其他 6 家不同,提出個(gè)人化AI(Personal),區(qū)別于微軟的工具性AI(Azure/Microsoft365/Copilot),用盡生態(tài)優(yōu)勢(shì),更重視操作的「非AI感」,理解用戶身處的情境,和用戶的生活交融,強(qiáng)調(diào)隱私保護(hù)。
蘋(píng)果發(fā)布會(huì)上演示的例子是去機(jī)場(chǎng)接?jì)寢專(zhuān)珹pple Intelligence可直接讀取媽媽發(fā)來(lái)的航班信息,查詢航班延誤情況和機(jī)場(chǎng)交通,直接生成行動(dòng)時(shí)間表并更新在日程中,本身要花好幾分鐘安排的事現(xiàn)在可以自動(dòng)完成了。與siri類(lèi)似,是生活工作小助手的定位,但更強(qiáng)大。
語(yǔ)言界面替代了操作界面,Apple版AI更理解人的需求和語(yǔ)言意味,而非僅僅在數(shù)值上更聰明,跑分更高。這是在讓AI對(duì)齊人類(lèi)生活方式,取巧,但又十分合理。
據(jù)「新皮層」報(bào)道,Apple Intelligence的模型架構(gòu)主要由3部分組成,按調(diào)用的優(yōu)先級(jí),分別是自研的端側(cè)模型、云端模型和GPT-4o等第三方模型。其中自研模型是蘋(píng)果發(fā)布的一系列小型模型,包括可以讀懂iPhone屏幕的多模態(tài)理解模型ReALM(Reference Resolution As Language Modeling),OpenELM(開(kāi)源高效語(yǔ)言模型)等。蘋(píng)果的模型能力不及OpenAI,是蘋(píng)果選擇接入第三方模型的原因。第三方模型可能不止GPT-4o?!度A爾街日?qǐng)?bào)》也曾于3月報(bào)道稱(chēng),蘋(píng)果還曾與百度初步談判,以在其中國(guó)版設(shè)備(比如 iPhone)中使用后者的AI技術(shù)。蘋(píng)果從未證實(shí)這一傳聞。
這么看來(lái),Apple Intelligence更像是多種模型組裝的工具包,各司其職,各盡其用。AI在蘋(píng)果生態(tài)里,與其說(shuō)是對(duì)話唱歌畫(huà)圖的小軟件,不如說(shuō)是幫人完成一系列復(fù)雜操作的AI-Agent,它聯(lián)通各平臺(tái)設(shè)備,粘合使用體驗(yàn)——肯定有一部分是以智能家居的那種方式,另一部分就可以展開(kāi)想象。
當(dāng)然,AI的聚合、融合,還是依靠AI公司、資本、政府的高期望。對(duì)很多人來(lái)說(shuō),這個(gè)期望的化身,就是AGI。
如果把實(shí)現(xiàn)AGI當(dāng)作最終目標(biāo),當(dāng)下AI處在大投入大基建的狀態(tài):投算力、投新型的數(shù)據(jù)中心、投模型,三類(lèi)投資分別對(duì)應(yīng)的是生產(chǎn)GPU+ 賣(mài)GPU的云 + 用GPU訓(xùn)練模型的公司,也就是英偉達(dá)、AWS+Azure和OpenAI等大模型公司。蘋(píng)果算是其中的異類(lèi),既不開(kāi)發(fā)新模型,甚至也沒(méi)有推出新應(yīng)用,只是整合。
但AGI的實(shí)現(xiàn)還很遙遠(yuǎn)。造富路上,AI公司開(kāi)始破產(chǎn)、倒閉、求收購(gòu)。
2024年第二季度還沒(méi)有結(jié)束,曾經(jīng)有10億美元估值、180名員工、創(chuàng)造出Stable Diffusion系列模型的明星獨(dú)角獸 Stability AI,就出現(xiàn)資金鏈斷裂,尋求合并。前OpenAI和谷歌AI開(kāi)發(fā)人員創(chuàng)立的AI公司Adept,也在談判售價(jià)。在「洗牌期」,就算有足夠資金支撐下去的AI公司,都開(kāi)始了裁員和降本增效。
這些現(xiàn)象暴露出殘酷的行業(yè)現(xiàn)狀:包括巨頭在內(nèi),所有AI公司/項(xiàng)目都盈利困難。連OpenAI也只能靠不斷融資來(lái)支撐ChatGPT高昂的運(yùn)行成本?!该?OpenAI過(guò)河」,將訂閱模式和企業(yè)版模式作為行業(yè)統(tǒng)一標(biāo)準(zhǔn)的其他玩家,只會(huì)更艱難。Meta為AI建設(shè)增加了約100億美元預(yù)算,但未來(lái)幾年內(nèi)依然不指望盈利。
據(jù)行研機(jī)構(gòu)PitchBook 數(shù)據(jù),AI創(chuàng)企在2021-2023年獲得了約3300億美元投資,同比增長(zhǎng)2/3,但很多AI創(chuàng)企的錢(qián)仍不夠花,高昂的AI建設(shè)成本、人工成本已經(jīng)拖垮不少AI公司。
國(guó)內(nèi)風(fēng)景獨(dú)好,煉制大模型的巨頭無(wú)憂生存,卻因競(jìng)爭(zhēng)激烈,打起了價(jià)格戰(zhàn)。5月6日深度求索(DeepSeek)發(fā)布的DeepSeek v2,提供的API定價(jià)僅為GPT-4-Turbo的近百分之一,之后智譜、字節(jié)、阿里、百度、科大訊飛和騰訊都紛紛下調(diào)了部分大模型的API價(jià)格。
考慮到國(guó)內(nèi)大模型,大部分是針對(duì)企業(yè)用戶和特定行業(yè),也許是性能評(píng)測(cè)標(biāo)準(zhǔn)不夠刺激,也可能是大模型落地難,性能遇到了瓶頸,只能同質(zhì)化競(jìng)爭(zhēng),價(jià)格戰(zhàn)成了國(guó)內(nèi)大模型行業(yè)問(wèn)題的縮影和最終解決方式。
國(guó)內(nèi)的AI公司和產(chǎn)品,長(zhǎng)時(shí)間對(duì)標(biāo)OpenAI,希望自家養(yǎng)的AI在跑分、推理、表現(xiàn)都超過(guò)GPT系列,是否做到暫且不談,但其中有一些誤區(qū)。AI不同于搜索引擎、平臺(tái)入口、內(nèi)容站,它的技術(shù)性遠(yuǎn)高于后者,在實(shí)際進(jìn)入應(yīng)用領(lǐng)域前,是純粹科學(xué)和技術(shù)的事,也是純投入的事業(yè)。
國(guó)內(nèi)環(huán)境,人們對(duì)于AI的實(shí)質(zhì)和AI的真正用途之間,有一道「理解鴻溝」,這首先是大模型的黑箱性質(zhì)所造成的,但同時(shí),國(guó)內(nèi)的AI產(chǎn)品,無(wú)論是豆包、元寶、Kimi,還是激進(jìn)地投入整條賽道的阿里做出來(lái)的東西,目前所呈現(xiàn)出來(lái)的能力,很難讓用戶持續(xù)買(mǎi)單,更別說(shuō)讓企業(yè)級(jí)用戶認(rèn)同。畢竟GPT-4o和Midjourney早已設(shè)立了標(biāo)準(zhǔn)。
蘋(píng)果AI的確為國(guó)內(nèi)市場(chǎng)打開(kāi)了一條思路:跑分再高也只是抽象能力,自研模型夠用就好,多模型融合,多層級(jí)協(xié)同,讓AI上手做事,融入整體應(yīng)用環(huán)境才是正經(jīng)事。
從理論上來(lái)說(shuō),AI可以與迄今為止人類(lèi)制造的所有軟件、系統(tǒng)、數(shù)據(jù)庫(kù)、云、電子設(shè)備結(jié)合,并產(chǎn)生新的交互模式。AI掌握了搜索引擎的使用方法和用戶需求,就誕生了新的流量和內(nèi)容入口,搜索就變成了AI的子功能,以前的計(jì)算廣告投放模式會(huì)受影響。
AI吞噬一切,重新安排其重要性。
是時(shí)候擁抱新世界,做些新東西。總比蘋(píng)果做好一切,國(guó)內(nèi)再模仿來(lái)得強(qiáng)。AI 時(shí)代與流量時(shí)代完全不同,起碼「模仿式創(chuàng)新」一定會(huì)變難。
二、AI改變個(gè)人工作流,但尚未改變行業(yè)
生成式AI的沖擊改變了科技行業(yè)的軌跡,但普通人視角下,沖擊在ChatGPT發(fā)布之后就逐漸放緩。
文字工作者(比如我)和廣義的內(nèi)容創(chuàng)作者們,早已全面擁抱AI。盡管AI很難寫(xiě)出80分的作品,但它可以高效滿足創(chuàng)作者工作流中的離散需求:快速生產(chǎn)大綱、和用戶一起頭腦風(fēng)暴、模仿文風(fēng)、文本修改、長(zhǎng)文本翻譯、文字 – 語(yǔ)音互轉(zhuǎn)、信息獲取、數(shù)據(jù)整理、梳理財(cái)報(bào)等等,這些方面AI又快又好。
在藝術(shù)、影視、教育、人文學(xué)術(shù)圈,AI頗受歡迎,它提供了快速試錯(cuò)過(guò)篩的工具,加上自身也是賣(mài)點(diǎn)和噱頭,AI成了一種隱喻修辭,代表著機(jī)遇,以及危機(jī)感。
任何研討會(huì)加個(gè)「AI時(shí)代」的名頭都能多吸引點(diǎn)注意力和流量。
這一波生成式AI的發(fā)展可能會(huì)經(jīng)歷四個(gè)階段:驚艷的玩具,(多樣化且具備替代效應(yīng)的)生產(chǎn)力工具,個(gè)人化系統(tǒng),(具有網(wǎng)絡(luò)效應(yīng))的生態(tài)系統(tǒng)。
目前的產(chǎn)品大多在從第一階段到第二階段過(guò)渡。
大部分AI產(chǎn)品,包括國(guó)外的,長(zhǎng)期用下來(lái),除了內(nèi)嵌在應(yīng)用和網(wǎng)頁(yè)中的AI和特定用途AI以外(比如wiki AI,notion AI,memo AI,Perplexity),大多還是花里胡哨,重復(fù)造輪子居多。
AI在當(dāng)下,嘗鮮多于工作,助力于個(gè)人多于組織,它只改變了游戲的樂(lè)趣,并未改變游戲規(guī)則,猶如個(gè)人寫(xiě)東西用Word 還是Ulysses,只有體驗(yàn)的細(xì)微區(qū)別,無(wú)關(guān)乎生產(chǎn)力。工具需的組織化、社會(huì)化、網(wǎng)絡(luò)化,才能最大化效能(比如微信和github)。
回到產(chǎn)業(yè),AI尚未顛覆任何領(lǐng)域,干掉任何公司——除了做二次開(kāi)發(fā)(套殼)的公司,在每次OpenAI發(fā)布新產(chǎn)品時(shí)都哀嘆不已。行業(yè)替代性在客服、審核等崗位的確存在,只是尚未爆發(fā),因?yàn)锳I還未先進(jìn)到重塑流程。
與互聯(lián)網(wǎng)浪潮不同,大模型時(shí)代也許不需要Killerapp,無(wú)論AI多么強(qiáng)大,整體提升Workflow,提供端到端的輸出,都比較難。這些流程依賴(lài)于長(zhǎng)程推理、常識(shí)和行業(yè)Know-how,光靠語(yǔ)義鏈接的橋梁還遠(yuǎn)遠(yuǎn)不夠。
大模型作為一個(gè)概率模型,在低容錯(cuò)率場(chǎng)景時(shí)仍然面臨很多問(wèn)題,遠(yuǎn)沒(méi)有我們想的那么神奇:我在寫(xiě)這篇文章時(shí),讓GPT-4o查詢NVIDIA近年股票和市值變化,一個(gè)看似簡(jiǎn)單的問(wèn)題,它需要現(xiàn)將問(wèn)題拆分成步驟,然后分別去搜相應(yīng)的信息,再做一個(gè)總結(jié),最后居然還是錯(cuò)的,還不如直接用搜索引擎快。
此外,很多定制化的工作,可能90%的文檔都不能滿足大模型Embedding時(shí)的質(zhì)量要求,還要做大量的數(shù)據(jù)清洗才能用。大模型的注意力也不夠穩(wěn)定,經(jīng)常被不相關(guān)的問(wèn)題干擾,出現(xiàn)幻覺(jué)。
大模型的產(chǎn)品發(fā)展與互聯(lián)網(wǎng)的產(chǎn)品發(fā)展還有一個(gè)截然不同的地方:邊際成本非常高,模型成本要遠(yuǎn)遠(yuǎn)高于人力成本和買(mǎi)量成本。移動(dòng)互聯(lián)網(wǎng)時(shí)代的App可以在小步快跑式迭代,但基于底層大模型+開(kāi)源小模型的雞尾酒分層打法的App尚未找到類(lèi)似路徑。也因此,還未出現(xiàn)大公司被小公司彎道超車(chē)的可能性。
當(dāng)然,假以時(shí)日,AI也許能在軟件編寫(xiě)上有所建樹(shù)。紐約市的風(fēng)險(xiǎn)投資基金Pace Capital的創(chuàng)始合伙人Chris Paik在「軟件的終結(jié)」(The End of Software)一文里提出,大模型不一定會(huì)顛覆toC產(chǎn)品,但有可能顛覆軟件生產(chǎn),因?yàn)檐浖某杀驹谟陂_(kāi)發(fā)人員,他們將人類(lèi)語(yǔ)言翻譯成計(jì)算機(jī)語(yǔ)言,大模型也許比人更擅長(zhǎng)做這事,形成液態(tài)系統(tǒng),建立中間層,鏈接一切。
「代碼將變得靈活可塑,傳統(tǒng)的技術(shù)棧概念將逐漸消失,取而代之的是由 AI 生成的微服務(wù)的流動(dòng)海洋,這些微服務(wù)可以根據(jù)需要進(jìn)行重新組合和再構(gòu)」。
蘋(píng)果說(shuō):我也是這樣想的。
三、如果沒(méi)有AGI,你還會(huì)期待AI嗎?
不要太期待AGI。
在業(yè)界狂熱討論AGI何年達(dá)成之時(shí),學(xué)界潑了三盆冷水。圖靈獎(jiǎng)得主、Meta首席AI科學(xué)家楊立昆(Yann Lecun)就并不認(rèn)可AGI,他認(rèn)為根本不存在通用智能,且大模型也不可能通向AGI。他還在X上說(shuō),「如果你是一名對(duì)構(gòu)建下一代人工智能系統(tǒng)感興趣的學(xué)生,不要研究大型語(yǔ)言模型(LLMs)」。
楊立昆并非唯一反對(duì)AGI的人。李飛飛從另一個(gè)角度論證了類(lèi)似觀點(diǎn),她認(rèn)為無(wú)論大模型有多少參數(shù),AI都無(wú)法擁有「知覺(jué)」,即所有的感覺(jué)——饑餓、疼痛、墜入愛(ài)河,因此AI不可能擁有主觀體驗(yàn)的能力,甚至不可能接近人類(lèi)智能。
李飛飛曾經(jīng)的老師,香港大學(xué)馬毅認(rèn)為,當(dāng)前的生成AI其能力依靠規(guī)模定律(Scaling Laws)涌現(xiàn)其能力,但規(guī)模定律并非物理定律,而是一種偶然,早晚會(huì)失效,AI又不是只有喂數(shù)據(jù)堆參數(shù)這一種造法。
馬毅在接受《晚點(diǎn)》采訪時(shí)說(shuō),「如果你的信仰就是Scaling Laws,覺(jué)得把現(xiàn)在的系統(tǒng)做大就能實(shí)現(xiàn)AGI,我覺(jué)得你該改行了。因?yàn)槟阋呀?jīng)不可能有作為了,你就只能做一個(gè)螺絲釘」。大模型是有極限的,隨著語(yǔ)料庫(kù)耗盡,Scaling Law 失效,以及算力和電力幾何級(jí)數(shù)增加,內(nèi)部黑箱無(wú)法破解,也許有一天,生成式AI的發(fā)展出現(xiàn)停滯,不是不可能。
我想起,在AlphaGo/Zero大展威力的時(shí)代,人們對(duì)AI的能力感到格外驚奇和恐懼,代表人類(lèi)最強(qiáng)棋手的李世石最后輸給AI,似乎為碳基生命的命運(yùn)寫(xiě)下最后注腳。但從現(xiàn)在回看,并沒(méi)有那么悲涼。
當(dāng)時(shí),我偶然和人工智能早期先驅(qū)、《GEB》作者侯世達(dá)(Douglas Hofstadter)見(jiàn)過(guò)一面,我問(wèn)他,你覺(jué)得Alphago是否實(shí)現(xiàn)了某種意義上的「智能」?他說(shuō),非也,即使Alphago戰(zhàn)勝了人類(lèi),但相比于人類(lèi),AI還是太簡(jiǎn)單,如同缸中之腦,對(duì)現(xiàn)實(shí)一無(wú)所知。他確信深度學(xué)習(xí)無(wú)法抵達(dá)智能,但可以很好地解決一些問(wèn)題。
Sora出現(xiàn)時(shí),人們討論它是否理解物理世界(盡管它內(nèi)置了牛頓定律),物理主義者可能會(huì)認(rèn)為 AI= 大腦 = 智能 = 有無(wú)限潛力的理解工具,但擁有常識(shí)的人則會(huì)認(rèn)為這是錯(cuò)誤的問(wèn)題。
如果沒(méi)有AI,AI前進(jìn)的動(dòng)力和目標(biāo)在哪里?
OpenAI聯(lián)合創(chuàng)始人Greg Brockman有一個(gè)很好的比喻,人工智能被「烘焙」進(jìn)了經(jīng)濟(jì)之中。意思是,如何部署 AI,需要融入其他「原料」混合,它們以不同的方式運(yùn)作,等待一段時(shí)間后,開(kāi)始發(fā)揮作用。從消費(fèi)者的角度來(lái)看,與 ChatGPT的對(duì)話只是調(diào)用一次API,就如同訪問(wèn)一次網(wǎng)站,下載一部電影。隨著技術(shù)進(jìn)化,公司把AI做細(xì),AI融入軟件之間、用戶界面以及無(wú)數(shù)中間層,功能變得越來(lái)越細(xì)微,用戶就會(huì)習(xí)慣AI。
Apple對(duì)AI深度整合,即使平庸,至少可用。在未來(lái),也許AI能服務(wù)每個(gè)人的日常生活,最后,你無(wú)需感受到AI的存在。大模型還沒(méi)有誕生殺手級(jí)應(yīng)用,但手機(jī)形態(tài)可能會(huì)比大多軟件商活得更久,這是2024WWDC能隱約看到的圖景。
作者 | 向輝
編輯 | 周天
本文由人人都是產(chǎn)品經(jīng)理作者【周天產(chǎn)業(yè)分析】,微信公眾號(hào):【周天財(cái)經(jīng)】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來(lái)自Unsplash,基于 CC0 協(xié)議。
- 目前還沒(méi)評(píng)論,等你發(fā)揮!