騰訊和字節(jié)的幽靈在中國AI的上空徘徊
在看似新生的AI明星產(chǎn)品背后,一個有意思的現(xiàn)象越來越明顯,即我們總能從這些產(chǎn)品身上找到一些騰訊和字節(jié)的影子。而騰訊和字節(jié)的產(chǎn)品風格區(qū)別暗含著的一個本質(zhì)問題,其實是技術(shù)與產(chǎn)品之間的平衡。
2023年4月,產(chǎn)品經(jīng)理松鵝(化名)從騰訊離職兩天后,就從深圳來到北京,加入一家基座大模型的初創(chuàng)公司。彼時,這家公司還沒什么資本追捧和用戶聲量,只有一個聽起來挺拗口的中文名字:月之暗面。
那時候這家公司的產(chǎn)品團隊,只有松鵝一個人。
同月,曾經(jīng)在字節(jié)跳動全程參與搭建抖音和TikTok等產(chǎn)品的王長虎,在中美都狂“卷”文生圖時,創(chuàng)業(yè)成立一家文生視頻公司:愛詩科技。
幾乎也是同一時間,在嘗試了AI口語軟件、AI換臉、AI心理咨詢等多個AI項目之后,用戶量的激增、投資人的熱情讓身在騰訊的萬磊發(fā)現(xiàn):屬于AI的風口真的到了。
大模型最終要靠產(chǎn)品來落地,這是這些嗅覺靈敏的產(chǎn)品經(jīng)理們看到的機會。而故事也就此開始。
松鵝來到月暗6個月后,他們做出了Kimi,又過了6個月,Kimi在全網(wǎng)爆了;在Sora沒火之前,愛詩的產(chǎn)品團隊已經(jīng)開始重點突破“一致性”的難題,反復(fù)進行迭代優(yōu)化;萬磊被投資人質(zhì)疑多次“AIGC應(yīng)用沒有核心技術(shù)壁壘,很容易被模仿”之后,在藍馳的閉門會上遇到了剛剛從蘇黎世聯(lián)邦理工大學畢業(yè),帶著大模型技術(shù)的姜昱辰。一個懂產(chǎn)品,一個有技術(shù),他們組成了波形智能。
如果拿移動互聯(lián)網(wǎng)的歷史來對照,一個技術(shù)滲透到普通人生活的必經(jīng)之路,就是應(yīng)用的井噴。大模型領(lǐng)域今天似乎正在經(jīng)歷相似的事情。每天都能看到一兩個新的產(chǎn)品誕生,走紅,被廣泛討論,它們的目標都是成為一款“AI Native”的超級應(yīng)用。
而在這些看似新生的AI明星產(chǎn)品背后,一個有意思的現(xiàn)象越來越明顯:
在它們身上你總能找到上個時代的影子,更確切一些,是騰訊和字節(jié)的影子——這兩個中國移動互聯(lián)網(wǎng)時期產(chǎn)品最強的公司,正像幽靈一樣,在中國大模型產(chǎn)品的上空徘徊。
一、騰訊的“門徒”
騰訊的人出來,總是很“騰訊”。他們做產(chǎn)品,也是忠誠的門徒。
松鵝的個人欄目叫《鵝庫》,而萬磊存著一堆張小龍的表情包。
鵝和張小龍,都是騰訊的“圖騰”。
在產(chǎn)品風格上,騰訊的產(chǎn)品經(jīng)理們深受張小龍這位“微信之父”的影響。產(chǎn)品,是馬化騰一直強調(diào)的“連接器”,它是技術(shù)和用戶之間的連接,在騰訊的產(chǎn)品體系中,2C產(chǎn)品就是要把使用體驗做到“極致”。
2023剛開年,松鵝還在騰訊會議團隊待的好好的,用他自己的話甚至可以說是“很開心”。
它是目前最可用的會議工具之一,甚至一度可以說是騰訊繼微信之后的下一個明星產(chǎn)品。在其他所有廠商將IM、會議、文檔、OA都打包整合成一個軟件的時候,騰訊把它們拆開了。
極簡,是張小龍時代提出的“少即是多”的理念,而松鵝離開騰訊會議后繼續(xù)執(zhí)行著這樣的理念。
松鵝曾在社交平臺上分享道:“做一個產(chǎn)品,添加一個功能很容易,不添加功能迭代用戶體驗很難,減少一個功能最難。大部分產(chǎn)品都是因為不停地加功能而變的臃腫。”簡直是張小龍產(chǎn)品語錄的翻譯版。
而Kimi身上確實也能找到對應(yīng)的烙印。
早期打開Kimi,除了對話框,幾乎什么都沒有。在不斷更新的版本中,它“長”出了幾個按鈕。
這些按鈕包括了“首頁”、“新會話”、“歷史會話”和“Kimi+”,和Kimi的特色能力“網(wǎng)頁鏈接”、“文件上傳”,將核心功能凝聚成一個個按鈕,是騰訊的另一個傳統(tǒng)。
為了讓用戶能夠了解按鈕的作用,Kimi中也存在著大量的“氣泡”,來進行進一步解釋。不僅如此,在Logo的下方,具有文藝感的文案,句句不同。
根據(jù)松鵝公開分享的一個有意思的例子,也能看出這種騰訊的烙印并非所有做產(chǎn)品的人都默認的原則。尤其是,當你的團隊也有了字節(jié)系的人——4月18號,在一些產(chǎn)品討論中,松鵝提出在產(chǎn)品的某個位置需要一個文案。而“一位來自字節(jié)的同事覺得無可厚非:在字節(jié)做產(chǎn)品從來不會有這種要求,這不會提升轉(zhuǎn)化?!彼窒淼?。
“但這里確實得有個文案,還得是比較有功底的文案。嗯,現(xiàn)在差點意思。”頓了頓,松鵝講道:“我們在騰訊做產(chǎn)品是這樣。”
把用戶的需求一個個拆到“事無巨細”,以人為本是騰訊做產(chǎn)品的靈魂。目前Kimi是唯一一個國內(nèi)大模型,兼具了網(wǎng)頁版、App小程序形態(tài)的大模型產(chǎn)品,一位獨立開發(fā)者對我們反饋道:“表面上Kimi設(shè)置的網(wǎng)頁版、APP版和小程序版和其他同類產(chǎn)品沒有太大的差別,但當其作為插件在網(wǎng)頁中使用時,Kimi的呈現(xiàn)效果要更好?!?/p>
右側(cè)為Kimi插件
靈活的產(chǎn)品形態(tài)讓Kimi更具有大眾性和普遍性,Kimi插件可以直接翻譯+整理重要信息,同時還可以進行自定義調(diào)整需求,進行個性化設(shè)置。根據(jù)公開信息,網(wǎng)頁插件版本是開發(fā)者自發(fā)調(diào)用API生成的,并不出自月暗團隊。
同樣由騰訊系產(chǎn)品經(jīng)理打磨的蛙蛙寫作,產(chǎn)品形態(tài)上和Kimi有很多風格相似的地方。對于不同場景的拆解和功能介紹、教程導覽,在很多細節(jié)上的“較真”和“死磕”。
比如,對于一款生成文本內(nèi)容的AI產(chǎn)品,萬磊的團隊發(fā)現(xiàn),目前的模型生成能力往往并不能夠直接生成整篇可用的內(nèi)容,往往部分可用需要進行二次甚至三次調(diào)整。他們給出的答案很騰訊——在大模型的生成結(jié)果中,添加了“滑詞”功能,以便于AI生產(chǎn)后的二次優(yōu)化。
與此同時,騰訊的另一個靈魂“社交”,也快速展示在這些產(chǎn)品身上。
大學畢業(yè)之后,萬磊進入了騰訊,在全民K歌中負責社交關(guān)系鏈的部分,后又轉(zhuǎn)到“創(chuàng)新項目”部門,不斷追趕互聯(lián)網(wǎng)風口,做過數(shù)字人、元宇宙游戲,陌生人交友,也做了一堆和AI相關(guān)的小項目,在不斷的探索中,他對于產(chǎn)品的思考越來越寬。
全民K歌推出之前,K歌已經(jīng)有了標桿產(chǎn)品“唱吧”。那時的唱吧已經(jīng)吸引和培養(yǎng)了一大批KOL,也在產(chǎn)品細節(jié)比如調(diào)音、制作MV上下足了功夫。
這盤逆風局,怎么打?參考了以前微信借勢QQ、企業(yè)微信借勢微信的套路,全民K歌更加強調(diào)“誰在聽”而不是“誰在唱”。和微信打通之后,社交關(guān)系鏈自然而然的轉(zhuǎn)移到了K歌平臺,也為后續(xù)的發(fā)展創(chuàng)造了土壤。
當你打開蛙蛙寫作就會發(fā)現(xiàn),和其他產(chǎn)品不同的是,它更強調(diào)社交傳播,“邀請送會員”、“進群有禮”讓人夢回2018年全網(wǎng)都在“裂變”拉新之際。
我們曾與多位Agent創(chuàng)業(yè)者聊過當下的創(chuàng)業(yè)環(huán)境,他們的反饋往往是,“如今面臨的不是做不出來,而是做出來給誰用的問題”。
“找用戶”,無論是在移動互聯(lián)網(wǎng)時代還是AI時代,都是第一個核心問題。對于文案寫作工具而言,寫出來是一方面,給誰看是另一方面。在群里,用戶可以溝通和交流經(jīng)驗,互相分享成果,甚至通過蛙蛙寫作的渠道報名參加小說比賽。
萬磊分享道:“我們光電話訪談的用戶累計有上百個了,有時候我們會把關(guān)鍵用戶叫到辦公室,當著我們的面使用產(chǎn)品,發(fā)現(xiàn)問題后產(chǎn)品團隊立刻進行調(diào)整,我們希望借助自研模型把工具做細膩做透,和市面上其他套殼的寫作工具拉開差距?!?/p>
這些產(chǎn)品風格上的“路徑依賴”正隨著產(chǎn)品的長大而凸顯,這些主觀、細碎甚至有些執(zhí)念的做法,很騰訊。
二、字節(jié)的“繼承者”
但字節(jié)的風格幾乎是光譜的另一端。體現(xiàn)在新的一批AI產(chǎn)品上,則是它不以人為載體傳承,而強調(diào)一種產(chǎn)品邏輯上徹底的創(chuàng)新。
字節(jié)的人出來創(chuàng)業(yè),帶著的是一種做產(chǎn)品的方法,而不是產(chǎn)品的風格。
“19年的時候我們組里來了一個字節(jié)的小女生,感覺很不一樣。雖然我們平時也會看數(shù)據(jù),但明顯她對數(shù)據(jù)和AB test更加敏感,所有的需求根據(jù)數(shù)據(jù)結(jié)果進行推演,包括好與不好,都是通過數(shù)據(jù)來評判。”萬磊回憶道。
字節(jié)系的產(chǎn)品跑得比較好的,產(chǎn)品模型基本長得很相似且粗暴簡單,推薦系統(tǒng)中臺+足夠規(guī)?;臄?shù)據(jù)input,從內(nèi)涵段子到頭條到抖音到后來小一點的懂車帝,番茄小說都一樣,而騰訊產(chǎn)品做得好的產(chǎn)品基本離不開社交關(guān)系鏈。
騰訊像文科生,做產(chǎn)品的都是人類社會學研究學者;而字節(jié)是理科生,灌數(shù)據(jù)、做AB測試,然后跑數(shù)據(jù),出結(jié)果。愛詩科技產(chǎn)品負責人牧之這樣總結(jié)。
算法是整個“字節(jié)系”產(chǎn)品的靈魂,公開資料顯示,王長虎在字節(jié)跳動負責了視覺算法平臺和業(yè)務(wù)中臺的搭建,用算法為代表的方法論來決定產(chǎn)品的樣貌,這種方式同樣帶到了他的愛詩科技。
“推薦算法技術(shù)中臺的打造是最困難的,他需要給足夠的空間和自由度,讓產(chǎn)品能夠在短時間內(nèi)完成更多需求測試,同時他也需要足夠開放,對未來產(chǎn)品發(fā)展空間的承壓能力和適應(yīng)空間。”牧之說道。
參考移動互聯(lián)網(wǎng)時代的抖音,幾百萬視頻播放量時搭出的推薦算法框架,到了幾百億觀看的規(guī)模,算法是不是仍然適用,仍然能夠高效的分析每個用戶的喜好。
這里我們舉個簡單例子,用雙向標簽對照的體系,為用戶打標簽,也為內(nèi)容打標簽,進行雙向匹配,這樣無論內(nèi)容體量多龐大,用戶體量如何增長,這樣的機制能夠保證實現(xiàn)“千人千面”。
字節(jié)系信奉這套方法論,在不同的場景、不同的行業(yè)這套方法論會出現(xiàn)不同的結(jié)果,也會遇到不同的難題。比如,對于愛詩來說,產(chǎn)品經(jīng)理想設(shè)計一套機制,跑一個推薦模型,怎么讓你的Tranformer或者Diffusion模型,通過產(chǎn)品能夠拿到足夠多的前期數(shù)據(jù)?
“第一重要的仍然是需要知道用戶到底要什么,他要這個視頻來做什么,對應(yīng)到我需要什么楊的數(shù)據(jù),第二是設(shè)計一套機制,無論是自己生產(chǎn)數(shù)據(jù),采買或者爬取數(shù)據(jù),還是強化學習來回收數(shù)據(jù)也好,input到你的模型?!蹦林v道。
所以在推出PixVerse之前,愛詩產(chǎn)品團隊做了很長時間的時間用戶調(diào)研,為了完成第一步。
通過對國內(nèi)外比較核心的專業(yè)視頻生產(chǎn)者的前期調(diào)查,愛詩發(fā)現(xiàn),清晰度是用戶的一個核心剛需,一致性是對視頻生成模型能否成為生產(chǎn)力的一個更高標準,產(chǎn)品通過市場調(diào)查反哺技術(shù),技術(shù)團隊對此進行模型突破。
對于AIGC的使用場景,在早期根據(jù)歷史軌跡的推演下,只能替代現(xiàn)有的一部分而很難開發(fā)新場景,且在技術(shù)發(fā)展的早期,比如文生視頻的時間只能有3-4秒的高質(zhì)量輸出,能夠滿足的需求有限,產(chǎn)品需要找到一個合適的切入點。
有了切入點以后的下一步,是建立一個良性的算法模型。
牧之舉了一個例子,在訓練鏡頭這個事情上,如果產(chǎn)品能明確好當下用戶其實最為需要的是一些專業(yè)性的鏡頭,那么你在做數(shù)據(jù)收集和數(shù)據(jù)標注以及清晰的時候,是會存在很強的傾向性的,就是需要這些專業(yè)鏡頭的數(shù)據(jù), 有了這樣的判斷,往往能用更少的數(shù)據(jù)和更低的訓練成本得到一個更好的結(jié)果。
隨著用戶量的增長,標注的元數(shù)據(jù)越來越多,算法也就越來越靈。
目前PixVerse在海外文生視頻產(chǎn)品榜單中下載量連續(xù)排名靠前,也通過不停的算法優(yōu)化和數(shù)據(jù)積累,形成了產(chǎn)品突破力,滾動的雪球開始有了實體。
三、技術(shù)與產(chǎn)品的新羈絆
騰訊和字節(jié)的產(chǎn)品風格區(qū)別,其實還暗含著一個本質(zhì)的問題:技術(shù)與產(chǎn)品之間的平衡。
騰訊系的產(chǎn)品誕生和成熟于互聯(lián)網(wǎng)時期和移動互聯(lián)網(wǎng)初期,技術(shù)是現(xiàn)成的,需要產(chǎn)品提供的對用戶需求的準確理解,來把它的價值體現(xiàn)出來。字節(jié)系的產(chǎn)品在移動互聯(lián)網(wǎng)的另一個階段快速成長,這時候以算法為核心的技術(shù),本身在一種不穩(wěn)定中快速進步,它帶來的強大能力是頭條和抖音這類產(chǎn)品可以出現(xiàn)的根本,產(chǎn)品經(jīng)理的“上帝”的角色就讓位給了算法技術(shù)。
這種產(chǎn)品與技術(shù)之間的牽絆在今天AI大模型時代,換了形式繼續(xù)籠罩在各個產(chǎn)品的制造過程中。
“如今做產(chǎn)品和移動互聯(lián)網(wǎng)最大的不同是,需要思考技術(shù)能解決的問題,和產(chǎn)品能解決的問題”。幾乎我們問到的所有產(chǎn)品經(jīng)理,都給出了這樣的答案。但同樣的,不同的底色依然決定著問題的答案。
對于視頻生成產(chǎn)品,一方面模型的效果本身就與技術(shù)資源密切相關(guān):比如顯卡、顯存的限制或者算力的不足會直接影響效果;另一方面,視頻本身存在著大量的敘事邏輯,和對于劇情的完全可控,這導致了無法滿足理想的產(chǎn)品形態(tài)。于是就像字節(jié)的產(chǎn)品那樣,愛詩的產(chǎn)品設(shè)計也要很大程度從算法技術(shù)出發(fā)思考。
一開始大多數(shù)的視頻生產(chǎn)產(chǎn)品只能生成4s的視頻,但一個電影的平均單個鏡頭都有6秒,技術(shù)要進步如何突破時長,而產(chǎn)品則需要思考,即便是4s的視頻,能夠使用在什么場景。
而即便是在4s的限制下,仍然能解決傳統(tǒng)的影視制作中,補缺一些空鏡頭和漏幀,解決重拍補拍的成本高昂的問題。
而且在底層大模型還在不停迭代的今天,對產(chǎn)品細節(jié)的追求,也要建立在技術(shù)差異之上,它甚至直接決定了產(chǎn)品的形態(tài)。Kimi和蛙蛙寫作看似都是文本生成類的大模型產(chǎn)品,但技術(shù)能力完全不同。
眾所周知Kimi擅長的是長文本的輸入,能夠一口氣讀完一本《三體》,但在應(yīng)用中就會發(fā)現(xiàn),Kimi的長文本輸出能力不夠強,無論給怎樣的提示詞,其輸出的內(nèi)容經(jīng)常為1000字左右,所以Kimi的使用場景經(jīng)常為“修改部分論文”、“寫小紅書文案”等等。
而蛙蛙寫作作為一款在創(chuàng)意文案生成上更垂類的產(chǎn)品,它的核心技術(shù)能力是長文本輸出和長期記憶,以小說功能作為切入點,通過對小說的背景、任務(wù)、主線劇情進行設(shè)定,蛙蛙寫作往往能夠生成幾千字的小說內(nèi)容,并能夠完整保存前序劇情。對于企業(yè)級的數(shù)據(jù)庫定制和固定文件的模仿輸出,也更游刃有余。
“在所有文本生成中,寫小說其實是最難的。它需要嚴格按照世界觀框架輸出、人物情緒刻畫要到位、人物臺詞要足夠擬人、故事反轉(zhuǎn)要緊扣設(shè)定等等。即便Sora是物理世界的模擬器,它仍然需要文字先將所有的前情全部設(shè)定好,再進行生成。未來文字創(chuàng)作內(nèi)容將作為底層,各個獨立的多模態(tài)技術(shù)真正要落地,還是要被底層所調(diào)用才能有更大的價值”萬磊講道。
但相信產(chǎn)品依然是個“手藝活”的人們,并不會就此把一切都交給技術(shù)。
你可以看到,國內(nèi)的通用大模型產(chǎn)品,在生成內(nèi)容底部,往往會出現(xiàn)一個“點贊”和“點踩”的按鈕,這是人類自主給大模型進行的評價和反饋。
萬磊講道:“如果讓技術(shù)自己識別哪些生成內(nèi)容是好的,哪些是不好的,靠技術(shù)實現(xiàn)很困難,但是在產(chǎn)品中加了一些設(shè)計,便可以反哺技術(shù),讓生成結(jié)果越來越精準?!?/p>
更重要的是,在這個階段,產(chǎn)品是扔向市場的一個“鉤子”,只有不斷的使用、不斷反饋才能不斷迭代不斷進化。只有產(chǎn)品鉤得住用戶,之后的一切才有意義。
“技術(shù)的高速發(fā)展最終的結(jié)果就是越來越同質(zhì)化,這時候需要產(chǎn)品形成差異性,我認為那時候產(chǎn)品經(jīng)理的空間將會更大?!蹦林f。
從做產(chǎn)品的方法,到所謂的產(chǎn)品哲學,再到產(chǎn)品與技術(shù)的關(guān)系,這些決定著中國AI未來走向的問題,某種程度都在延續(xù)著騰訊和字節(jié)在移動互聯(lián)網(wǎng)的故事,這兩個幽靈會繼續(xù)游蕩在中國AI的上空。
本文由人人都是產(chǎn)品經(jīng)理作者【硅星人】,微信公眾號:【硅星人Pro】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
目前Kimi是唯一一個國內(nèi)大模型,兼具了網(wǎng)頁版、App小程序形態(tài)的大模型產(chǎn)品?