DeepSeek席卷數(shù)據(jù)領(lǐng)域!BI新變革,是顛覆還是泡沫?
隨著DeepSeek在數(shù)據(jù)領(lǐng)域的廣泛應(yīng)用,BI(商業(yè)智能)工具正經(jīng)歷一場(chǎng)前所未有的變革。本文從數(shù)據(jù)分析的角度出發(fā),深入探討了DeepSeek對(duì)BI工具的影響,分析了其在優(yōu)化交互方式、降低數(shù)據(jù)分析門檻方面的優(yōu)勢(shì),同時(shí)也指出了其在業(yè)務(wù)理解上的局限性。
這個(gè)春節(jié),相信所有人都感受到了DeepSeek的熱浪,它在一片驚呼聲中席卷了各行各業(yè)。語言大模型自ChatGPT問世后大家已經(jīng)不陌生,但DeepSeek的獨(dú)特之處在于它具備更嚴(yán)謹(jǐn)?shù)倪壿?,仿佛一個(gè)智者在思考,使得回答更具說服力。所以,推理大模型成了當(dāng)下最炙手可熱的話題。
現(xiàn)在,很多軟件產(chǎn)品都已經(jīng)集成了DeepSeek,數(shù)據(jù)領(lǐng)域最明顯的就是BI產(chǎn)品。我相信,它很快會(huì)滲透到各種數(shù)據(jù)產(chǎn)品線。關(guān)于DeepSeek的話題很多,但今天先聚焦數(shù)據(jù)分析領(lǐng)域——這是各家企業(yè)最關(guān)注的,也是和大家切身利益最相關(guān)的領(lǐng)域。畢竟,在數(shù)據(jù)時(shí)代,數(shù)據(jù)分析是每家企業(yè)都繞不開的普適性工作。
我先拋個(gè)結(jié)論:你需要冷靜一下。當(dāng)然,我的文章不會(huì)無依據(jù)地下結(jié)論,很多讀者認(rèn)可我的分析接地氣、客觀,所以今天也會(huì)辯證地來看待DeepSeek。畢竟,大家都坐不住了,很多產(chǎn)品開始瘋狂宣傳自己接入DeepSeek后的“卓越”能力。
語言大模型的文章我以前已經(jīng)分析過不少了,有興趣的讀者可以翻翻歷史文章。這次之所以要再聊大模型,是因?yàn)镈eepSeek是當(dāng)前中國領(lǐng)先的推理大模型,在長文本理解、數(shù)學(xué)推理、代碼生成等方面表現(xiàn)突出。這點(diǎn)大家已經(jīng)感受到了,但很多人對(duì)它的推理能力仍然感到困惑,所以這個(gè)優(yōu)勢(shì)點(diǎn)必須重點(diǎn)拆解一下。
那么,推理大模型的推理能力到底來源于哪里?
首先,必須明確一點(diǎn):推理 ≠ 思考,推理的本質(zhì)是“概率匹配”。DeepSeek的推理能力主要依賴大規(guī)模數(shù)據(jù)訓(xùn)練和神經(jīng)網(wǎng)絡(luò)架構(gòu),它并不像人類一樣具備真正的“邏輯思考”能力,而是基于統(tǒng)計(jì)規(guī)律進(jìn)行概率推理。它學(xué)習(xí)了大量文本、數(shù)學(xué)公式、代碼、SQL語句等數(shù)據(jù),在此基礎(chǔ)上訓(xùn)練出概率分布模型,回答問題時(shí),本質(zhì)上是根據(jù)已有數(shù)據(jù)推測(cè)最可能的答案。
當(dāng)然,DeepSeek的訓(xùn)練過程中,還結(jié)合了多種技術(shù)架構(gòu),并且通過人類反饋不斷優(yōu)化,使得回答更符合用戶預(yù)期。但這并不意味著它真正“理解”了問題。
所以,分析它的推理能力時(shí),我們必須記?。耗P筒⒉痪邆渲鲃?dòng)思考的意識(shí),它所有的推理能力都源于深度學(xué)習(xí),而模型本身是有局限性的——它的上限取決于訓(xùn)練數(shù)據(jù)的質(zhì)量和范圍。
這意味著,我們?cè)诳吹酵评泶竽P蛢?yōu)秀能力的同時(shí),也要看到它的局限性。
比如,它缺乏因果推理能力。DeepSeek可以根據(jù)歷史數(shù)據(jù)預(yù)測(cè)“某產(chǎn)品銷量在冬季可能下降”,但它無法真正理解“因?yàn)樘鞖庾兝?,消費(fèi)者偏好發(fā)生變化”這種業(yè)務(wù)邏輯。
再比如,它容易受訓(xùn)練數(shù)據(jù)的限制。語言大模型的答案依賴于已有數(shù)據(jù),如果數(shù)據(jù)存在偏差或缺失,它也會(huì)得出錯(cuò)誤結(jié)論。比如,我們讓DeepSeek分析一家公司財(cái)務(wù)報(bào)表,它可以計(jì)算利潤率、資產(chǎn)負(fù)債比等指標(biāo),但如果要判斷該公司是否會(huì)面臨財(cái)務(wù)危機(jī),它可能無法結(jié)合市場(chǎng)環(huán)境、管理層決策、行業(yè)周期等復(fù)雜因素做出精準(zhǔn)判斷。
所以,DeepSeek的推理能力并非真正的“智能”,更像是一個(gè)高效的“數(shù)據(jù)助手”,能加快信息處理,但無法替代人類的邏輯思考。它仍然延續(xù)了我們此前分析ChatGPT時(shí)的工具屬性,但不得不承認(rèn),它比前代大模型又向前邁了一步,幻覺率進(jìn)一步降低了。
理解了推理大模型的推理能力后,我們?cè)賮砜此鼘?duì)BI工具的影響。DeepSeek到底給BI帶來了哪些變化?
BI工具一直是企業(yè)數(shù)據(jù)分析的重要工具,推理大模型對(duì)數(shù)據(jù)分析的影響,首先體現(xiàn)在BI產(chǎn)品的升級(jí)。不可否認(rèn),有了推理大模型的加入,BI工具在“智能化”上確實(shí)向前走了一步,但本質(zhì)上,它依然沒有突破BI的核心局限。
DeepSeek最大的貢獻(xiàn)是優(yōu)化了BI的交互方式,降低了數(shù)據(jù)分析的門檻,讓非技術(shù)人員也能更輕松地獲取數(shù)據(jù)。
比如,業(yè)務(wù)人員可以直接用口語查詢數(shù)據(jù):“請(qǐng)給我2023年各地區(qū)的銷售增長率?!盌eepSeek會(huì)自動(dòng)生成SQL并執(zhí)行查詢,甚至還能基于BI數(shù)據(jù)自動(dòng)歸納分析,提供總結(jié)性結(jié)論,減少人工整理數(shù)據(jù)的時(shí)間。它還能自動(dòng)生成可視化分析圖表或儀表盤,讓數(shù)據(jù)更直觀。歸根結(jié)底,它讓數(shù)據(jù)查詢、整理、展示的效率得到了大幅提升。
那么,BI產(chǎn)品集成推理大模型后,有沒有局限性?
前面我們已經(jīng)分析了推理大模型的本質(zhì)——它的推理能力來源于統(tǒng)計(jì)學(xué)習(xí),而不是對(duì)業(yè)務(wù)的理解。所以,BI產(chǎn)品集成DeepSeek后,仍然存在一個(gè)根本問題:它不理解業(yè)務(wù)背景。
這里必須說清楚,真正的數(shù)據(jù)分析,不是簡單地對(duì)數(shù)字進(jìn)行加減乘除,而是分析“業(yè)務(wù)”。數(shù)據(jù)的核心價(jià)值在于解讀業(yè)務(wù)邏輯,而這恰恰是大模型最大的短板。它可以告訴你某產(chǎn)品銷量下滑,但不知道這是供應(yīng)鏈問題、市場(chǎng)需求變化,還是競(jìng)爭對(duì)手搶占市場(chǎng)所致。數(shù)據(jù)背后的問題,不能靠大模型推理出來,它只能提升數(shù)據(jù)基礎(chǔ)解讀的效率,但無法提供真正的業(yè)務(wù)決策支持。
有人說,DeepSeek可以生成預(yù)測(cè)模型,但預(yù)測(cè)的準(zhǔn)確性依賴于訓(xùn)練數(shù)據(jù),這就是它的最大局限。網(wǎng)上已經(jīng)有很多DeepSeek的測(cè)評(píng),大家都認(rèn)可它在多個(gè)方面表現(xiàn)出色,但如果要將通用大模型應(yīng)用于商業(yè)場(chǎng)景,企業(yè)需要的是個(gè)性化的私有數(shù)據(jù),這個(gè)問題就從大模型本身轉(zhuǎn)移到了企業(yè)自身。而數(shù)據(jù)問題,才是當(dāng)前企業(yè)數(shù)字化轉(zhuǎn)型中的最大痛點(diǎn),并不會(huì)因?yàn)橐豁?xiàng)新技術(shù)的出現(xiàn)而立刻得到解決。
所以,很多產(chǎn)品集成DeepSeek是好事,但并不意味著它就實(shí)現(xiàn)了“智能化”或“自動(dòng)化”。企業(yè)的數(shù)據(jù)從生產(chǎn)到真正成為生產(chǎn)要素,中間涉及多個(gè)環(huán)節(jié),而許多前沿技術(shù)只能參與其中的一部分。像BI這樣的工具,本質(zhì)上仍然是提升效率的工具,而不是替代專業(yè)人士的解決方案。這也是為什么企業(yè)仍然需要數(shù)據(jù)運(yùn)營官、業(yè)務(wù)分析師等崗位。如果AI真的能完全替代這些職能,那現(xiàn)在市場(chǎng)上早該出現(xiàn)大規(guī)模崗位裁撤,但現(xiàn)實(shí)是,AI替代的往往只是一些初級(jí)、標(biāo)準(zhǔn)化的工作,而深度思考、依賴經(jīng)驗(yàn)的崗位,依然不可取代。
說到這里,很多人會(huì)關(guān)心:哪些崗位會(huì)被替代?
像初級(jí)數(shù)據(jù)處理工程師、數(shù)據(jù)統(tǒng)計(jì)人員、數(shù)據(jù)可視化工程師等,這些偏技術(shù)、重復(fù)性較高的工作,確實(shí)容易被替代。但真正有價(jià)值的,仍然是能把數(shù)據(jù)轉(zhuǎn)化為業(yè)務(wù)價(jià)值的人,也就是數(shù)據(jù)運(yùn)營人員,而不是單純的數(shù)據(jù)分析師。這也是為什么我一直強(qiáng)調(diào),大家應(yīng)該關(guān)注業(yè)務(wù)能力和思考能力,而不是一味追求技術(shù)技能。很多代碼類的工作,現(xiàn)在已經(jīng)可以被AI直接取代,語言大模型教你、代替你寫代碼,已成現(xiàn)實(shí)。
所以,回到文章主題,DeepSeek確實(shí)沖擊了數(shù)據(jù)領(lǐng)域,但在BI產(chǎn)品的集成上,我們?nèi)匀灰3掷潇o。要看到它的強(qiáng)大功能,更要清楚它的局限性,只有這樣,才能正確看待各種“DeepSeek賦能XX,業(yè)務(wù)被顛覆”之類的商業(yè)信息。
本文由人人都是產(chǎn)品經(jīng)理作者【風(fēng)姑娘的數(shù)字視角】,微信公眾號(hào):【風(fēng)姑娘的數(shù)字視角】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自Unsplash,基于 CC0 協(xié)議。
- 目前還沒評(píng)論,等你發(fā)揮!