從產(chǎn)品視角說說DeepSeek

0 評論 4437 瀏覽 6 收藏 9 分鐘
🔗 B端产品需要更多地依赖销售团队和渠道合作来推广产品,而C端产品需要更多地利用网络营销和口碑传播来推广产品..

近年來,DeepSeek憑借其卓越的技術(shù)實力和創(chuàng)新應(yīng)用,迅速走紅于市場。本文從應(yīng)用場景、數(shù)據(jù)服務(wù)和研發(fā)成本三個角度,深入探討DeepSeek的獨特之處,供大家參考。

近期,DeepSeek真可謂火出天際,相關(guān)的文章和報道猶如雨后春筍。集中討論的方向主要包括:中美博弈、開源勝利、技術(shù)解析,投資價值……

然而,作為一個產(chǎn)品人,只想從以下三個方面說說我對DeepSeek的理解。

一、應(yīng)用場景:DeepSeek 解鎖高時效、高精度的復(fù)雜分析決策場景

DeepSeek 的進展有望解鎖更多對“響應(yīng)時效和精度要求極高”的復(fù)雜分析決策場景,例如投資決策、科研輔助、家庭教育、兵棋推演、具身智能、案件分析等。

小參數(shù)模型的優(yōu)勢不僅在于算力成本低,更在于其能夠顯著提升響應(yīng)速度,并支持邊緣計算。

通過強化學(xué)習(xí)(RL)和模型蒸餾技術(shù),DeepSeek 使得較小參數(shù)的模型也能夠展現(xiàn)出長思維鏈和自我驗證的能力。

DeepSeek 為行業(yè)開啟了一個巨大的想象空間:

許多原本需要深度分析推理的“慢思考”場景,未來可能以“快思考”的速度完成。這并不是說 DeepSeek 已經(jīng)實現(xiàn)了這一目標(biāo),而是它正在推動這一趨勢的發(fā)展。

回顧 2017 年,AlphaGo 已經(jīng)能夠在圍棋這種有限規(guī)則的封閉場景中快速落子,而大語言模型(LLM)則能夠應(yīng)對更加多變、開放的無限場景。

正如《有限與無限的游戲》一書所描述的,這兩種場景共同構(gòu)成了人類社會的全部行為模式。

以往,只有人類的認(rèn)知能力能夠在無限游戲中實現(xiàn)瞬時響應(yīng),而未來 AI 也可能具備這種能力。

以馬斯克為例,他的每一句即興表達(dá)幾乎都遵循第一性原理,深度思考率接近 100%,這是一般普通人難以企及的。

類似地,福爾摩斯在第一次見到華生時,僅憑一眼就推斷出他是剛從阿富汗回來的軍醫(yī)。這種瞬間復(fù)雜推理的能力,即便給華生一年時間也難以完成。

通過大量強化訓(xùn)練,將原本需要“慢思考”的復(fù)雜邏輯推理問題,轉(zhuǎn)變?yōu)榻咏翱焖伎肌钡乃俣?。這種能力的人在專業(yè)領(lǐng)域內(nèi)幾乎無敵。

如果你讀過《思考,快與慢》,可能會更容易理解這一點。書中提到,人類有兩種思考系統(tǒng):

系統(tǒng) 1 ——快速、直覺的“快思考”;

系統(tǒng) 2—— 是緩慢、邏輯的“慢思考”。

通過長期訓(xùn)練,某些系統(tǒng) 2 的行為可以逐漸自動化,接近系統(tǒng) 1 的運作方式。DeepSeek 帶來的最本質(zhì)改變,正是讓復(fù)雜決策能夠?qū)崿F(xiàn)瞬時響應(yīng)。

二、數(shù)據(jù)服務(wù):高質(zhì)量專業(yè)數(shù)據(jù)成為稀缺資源

在復(fù)雜場景和垂直領(lǐng)域中,高質(zhì)量的專業(yè)數(shù)據(jù)比以往更加稀缺。

在 GPT-4 發(fā)布時,我曾提出一個觀點:通用訓(xùn)練數(shù)據(jù)已接近耗盡。

后來,Ilya 等業(yè)界大佬也表達(dá)了類似看法,印證了這一猜測。監(jiān)督微調(diào)(SFT)本身存在局限性,如果要進一步突破模型上限,強化學(xué)習(xí)是為數(shù)不多的可行路徑。

DeepSeek 的實踐表明,僅通過強化學(xué)習(xí)就能很好地完成模型的后訓(xùn)練(post-train),從而減少對標(biāo)注數(shù)據(jù)規(guī)模的依賴。

然而,這并不意味著不再需要標(biāo)注數(shù)據(jù)。如果希望大模型能夠解決更復(fù)雜的推理場景,就必須對數(shù)據(jù)結(jié)構(gòu)和標(biāo)注質(zhì)量提出更高要求——即提升評測標(biāo)準(zhǔn)。

具體來說,標(biāo)注評測標(biāo)準(zhǔn)的提升主要體現(xiàn)在兩個方面:專業(yè)化和擬人化。

那專業(yè)化需要達(dá)到什么程度?

我認(rèn)為,未來各行業(yè)的業(yè)務(wù)專家和領(lǐng)導(dǎo)者需要親自參與數(shù)據(jù)貢獻(xiàn),將他們的認(rèn)知復(fù)刻到大模型中。通用場景數(shù)據(jù)和中低端數(shù)據(jù)外包服務(wù)將不再重要,因為開發(fā)者可以通過導(dǎo)師模型合成數(shù)據(jù)來訓(xùn)練小參數(shù)模型。真正稀缺的是經(jīng)過精心設(shè)計、篩選、標(biāo)注、核驗和優(yōu)化的高質(zhì)量專家數(shù)據(jù)。

擬人化需要達(dá)到什么程度?

每一輪對話都應(yīng)像真人交流,而非機械地“念稿”?!跋裾嫒恕边@一標(biāo)準(zhǔn)可以無限高,例如像 AGI(通用人工智能)那樣,或者像馬斯克、王陽明那樣的頂尖人類。

那什么樣的數(shù)據(jù)才能訓(xùn)練出如此擬人的模型?

僅僅依賴微信、抖音等平臺上的內(nèi)容數(shù)據(jù)是遠(yuǎn)遠(yuǎn)不夠的。如果這些數(shù)據(jù)足夠有效,互聯(lián)網(wǎng)大廠的大模型性能早已遙遙領(lǐng)先,但事實并非如此。目前,DeepSeek 在模型性能上表現(xiàn)出色,而 AI 領(lǐng)域的其他新興力量也并未被大廠拉開質(zhì)的差距。

當(dāng)前主流的訓(xùn)練數(shù)據(jù)混合模式是“人工數(shù)據(jù) + 合成數(shù)據(jù)”,但合成數(shù)據(jù)的質(zhì)量遠(yuǎn)不如人類專家。因此,專家們需要親自下場,參與數(shù)據(jù)構(gòu)建。

我認(rèn)為,2025 年將是 AI 數(shù)據(jù)領(lǐng)域的分水嶺,勞動密集型的數(shù)據(jù)服務(wù)將逐漸被淘汰,取而代之的是專家密集型的高質(zhì)量數(shù)據(jù)服務(wù)。

這也是為什么 Scale AI 的創(chuàng)始人會因 DeepSeek 的崛起而感到焦慮,甚至呼吁限制中國 AI 發(fā)展——本質(zhì)上是因為他們的商業(yè)模式受到了沖擊。

三、研發(fā)成本:頭部 AI 公司將控制算力成本與團隊規(guī)模,并提升人才密度

1)算力成本:DeepSeek 展示了低成本、高 ROI(投資回報率)的模型研發(fā)路徑,讓更多玩家看到了應(yīng)用場景落地的可能性。

這將吸引更多應(yīng)用端玩家入場,并促使資金投入更加堅決。同時,DeepSeek 的崛起也加劇了中美 AI 軍備競賽,使得英偉達(dá)芯片斷供問題更加嚴(yán)峻。國產(chǎn)替代芯片的需求因此變得更加迫切,市場對低成本高端芯片的渴望也將推動國內(nèi)芯片產(chǎn)業(yè)的發(fā)展,這對國運而言是一大利好。

2)人力成本:DeepSeek 的成功揭示了 AI 大廠組織精簡的拐點已經(jīng)到來。

不僅是硅谷,國內(nèi)大廠同樣難以避免這一趨勢。與此同時,低成本、高效率的大模型研發(fā)機會將刺激更多新老軟件公司加速布局 AI,從而導(dǎo)致 AI 人才呈現(xiàn)結(jié)構(gòu)化流動的趨勢。

優(yōu)秀的 AI 公司永遠(yuǎn)缺乏頂尖人才。無論是在算法、工程還是產(chǎn)品領(lǐng)域,100 個普通工程師的價值可能遠(yuǎn)不如 1 個頂尖人才。

這就像房地產(chǎn)和股市中的現(xiàn)象:自 2021 年以來,房價暴跌,但一線城市的豪宅明顯比剛需房更具抗跌性,因為豪宅有其獨立的價值邏輯。

同樣,在股市中,投資者偏愛龍頭股,表面上是人性使然,但更深層的邏輯在于:龍頭股漲得最早、漲得最多,也跌得最晚。

本文由人人都是產(chǎn)品經(jīng)理作者【并步跳步交叉步】,微信公眾號:【一起侃產(chǎn)品】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!
专题
16760人已学习12篇文章
分销是互联网拉人头和推广的常用手段,能够在短时间内实现裂变营销。本专题的文章分享了分销体系设计指南。
专题
12478人已学习12篇文章
所谓SOP,即标准作业程序,指将某一事件的标准操作步骤和要求以统一的格式描述出来,用于指导和规范日常的工作。本专题的文章分享了SOP创作指南。
专题
13609人已学习12篇文章
作者B端的产品经理,要基于这个行业理解的大背景下去了解公司的业务全局。本专题的文章分享了B端产品经理如何了解业务全局。
专题
87424人已学习18篇文章
沉住气,学做事,更要学会做人。
专题
15263人已学习14篇文章
痛点是什么?为什么用户会有痛点?如何抓住用户痛点?优先解决哪些用户痛点?本专题的文章分享了以上的问题详解。
专题
35042人已学习22篇文章
从动效设计原则、动效工具、制作方法、标注技巧等全方位解读