Deepseek幫我生成了分析預(yù)測報告

0 評論 1601 瀏覽 1 收藏 12 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

隨著人工智能技術(shù)的飛速發(fā)展,AI工具在數(shù)據(jù)分析和預(yù)測領(lǐng)域的應(yīng)用越來越廣泛。本文作者通過實際操作,展示了如何利用DeepSeek這一AI工具,僅用31天的假訂單量數(shù)據(jù),成功預(yù)測未來7天的訂單量。

Deepseek+數(shù)據(jù)分析師,這個組合有點王炸。

數(shù)據(jù)分析師、商業(yè)分析師常處理的經(jīng)營情況分析、產(chǎn)品迭代分析、市場調(diào)研、規(guī)模預(yù)測等等這些工作,在deep seek的幫助下,一個人就是一個團(tuán)隊,大大提高了效率。以下是一個數(shù)據(jù)分析場景:未來趨勢預(yù)測。

什么場景下會用到時間序列分析

  • 每年年末或年初,做預(yù)算規(guī)劃或目標(biāo)設(shè)定時,會根據(jù)歷史基線、增長速度等給下一年定個目標(biāo)值。
  • 或者需要根據(jù)季節(jié)性、周期性特點,以及短期內(nèi)的銷售情況,對未來庫存進(jìn)行預(yù)估,更及時地進(jìn)行備貨調(diào)整。
  • 或者未來想開拓一個新業(yè)務(wù),預(yù)估未來市場有多大潛力空間。
  • 又或者在推薦等模型優(yōu)化時將預(yù)測值作為輸入特征。

……

Deepseek生成的時間序列分析報告

抱著好奇心態(tài),看看到底deep seek能解放我雙手多少,我給了它31天的假訂單量數(shù)據(jù),讓它幫我預(yù)測未來7天的訂單量。經(jīng)過幾輪對話達(dá)到了基本要求,內(nèi)容如下:

時間序列模型原理

適用于中短期

1. 移動平均

看公式很容易理解,間隔為n的時間窗口內(nèi)的平均值,該值可作為T+1的預(yù)估值,適用場景通常為趨勢穩(wěn)定的數(shù)據(jù),如果數(shù)據(jù)有周期性,會出現(xiàn)預(yù)測峰谷值同實際錯位的情況。

2. 簡單指數(shù)平滑

y^為預(yù)測值,y為實際值,α為平滑系數(shù),范圍(0,1),α越大近期更敏,感適合波動較大的數(shù)據(jù),反之越平滑適合穩(wěn)定趨勢。T+1的預(yù)測值,為t天實際值和預(yù)測值的加權(quán)所得。

3. Holt-Winters

包含水平平滑、趨勢平滑、季節(jié)性平滑。

水平平滑

趨勢平滑

季節(jié)性平滑

幾個參數(shù):

  • St:當(dāng)前季節(jié)分
  • m:季節(jié)周期(如m=12為以月為周期,12個月為一個循環(huán))
  • α、β、γ分別為水平、趨勢、季節(jié)性平滑參數(shù),范圍(0,1)
  • h:步長,預(yù)測是跨幾個步長進(jìn)行預(yù)測,一般是1
  • k=[(h-1)/m]+1

有點抽象,舉個例子說明,假如如下對應(yīng)每個季度的商品銷售量,現(xiàn)在想要預(yù)測2025Q1(t=9)的銷量

假設(shè)參數(shù)設(shè)定:α=0.3(水平) β=0.2(趨勢) γ=0.1(季節(jié)性),季節(jié)周期:m=4

初始化預(yù)測參數(shù):

  • l4=(100+120+140+160)/4=130,即前4個季度的平均值,
  • b4=平均季度增長=[(120-100)+(140-120)+(160-140)]/3=6.67s1=100-130=-30,
  • s2=120-130=-10,s3=140-130=10,s4=160-130=30

預(yù)測2024Q1(t=5):y5預(yù)估=l4+b4+s5-4=130+6.67-30=106.67,實際y5=120更新預(yù)測參數(shù),即t=5對應(yīng)的預(yù)估值,

  • l5=0.3(120+30)+0.7(130+6.67)=140.67
  • b5=0.2(140.67-130)+0.8*6.67=7.47
  • s5=0.1(120-130-6.67)+0.9(-30)=-28.67

以此類推,可得到y(tǒng)9預(yù)估值=l8+1*b8+s9-4*2=149.63

雖然手動算麻煩一點,但以上這兩種方式,確實可以通過計算看到數(shù)據(jù)和趨勢變化如何產(chǎn)生。

適用于中長期

接下來要聊的兩種方法,就不足以通過手動計算了。4. ARIMA(p,d,q)。時間序列預(yù)測很古典和著名的方法。

模型是由三部分組成:

1)自回歸部分AR

p為參數(shù),核心解決的是預(yù)測未來的數(shù)據(jù),應(yīng)該選歷史多少個時間點的數(shù)據(jù)更好,最遠(yuǎn)的時間是t-p,因此p為參數(shù)。

2)移動平均部分MA

q為參數(shù),要解決的是y實際值和y預(yù)測值之間的差,選擇歷史上多少個時間點更好,最遠(yuǎn)時間為t-q,因此q為參數(shù)。

3)差分部分,d為參數(shù),要解決的是 yt-yt-1這樣做幾階差分更好,為的是把非平穩(wěn)的數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)數(shù)據(jù)。先通過ADF檢驗對d進(jìn)行差分檢驗(與統(tǒng)計臨界值對比),在通過ACF(自相關(guān)函數(shù))和PACF(偏自相關(guān)函數(shù))分別對p和q進(jìn)行檢驗,通過AIC和BIC對模型復(fù)雜性評估后可得到更為合理的p、q值。

5. Prophet。時間序列進(jìn)化到Prophet,操作更友好了。

模型是由三個小模型組成:?t 為誤差項g(t):增長和分段線性模型(線性或者邏輯回歸函數(shù))s(t):周期性和季節(jié)性模型(正弦和余弦組合函數(shù))h(t):節(jié)假日或特殊事件模型(線性函數(shù))該模型很好理解,且命中了趨勢預(yù)測里經(jīng)常要思考的幾個問題:如果趨勢有上升和下降幾段趨勢怎么辦?周期性的數(shù)據(jù)并非完全自然周期怎么辦?遇上突發(fā)事件出現(xiàn)某個點異常怎么辦?過往的時間序列模型很難進(jìn)行擬合和描述,不過Prophet解決了這個問題。這里對具體公式不詳細(xì)展開,感興趣可在參考資料里了解,這里主要介紹模型參數(shù)的作用,對實操會更有幫助。

  • growth(增長函數(shù)類型):linear(默認(rèn)):線性增長,適用于無明確上限的趨勢(如銷售額),logistic:邏輯回歸增長,適用于有增長上限的場景(如用戶數(shù));
  • changepoint_prior_scale(變點靈敏度):0.001~0.5(默認(rèn) 0.05),若預(yù)測結(jié)果過于平滑(欠擬合)增大該值,若預(yù)測結(jié)果波動劇烈(過擬合),減小該值;
  • n_changepoints(變點數(shù)量):25(均勻分布在時間序列前80%區(qū)間),越大將趨勢變化切分越多;
  • seasonality_prior_scale(季節(jié)性強(qiáng)度):0.01~10(默認(rèn)10),值越大季節(jié)性波動越大;add_seasonality(傅里葉階數(shù)):name=’yearly’, period=365.25, fourier_order=12,fourier_order越大階數(shù)越高擬合越復(fù)雜,name對應(yīng)的是yearly,weekly,daily或者命名一個,period寫對應(yīng)周期;
  • holidays_prior_scale(節(jié)假日效應(yīng)強(qiáng)度):0.01~10(默認(rèn) 10),值越大節(jié)假日波動越強(qiáng)。節(jié)假日窗口,比如雙11大促 :holidays_df = pd.DataFrame({‘holiday’: ‘promo’,’ds’: pd.to_datetime([‘2022-11-11’, ‘2023-11-11’, ‘2024-11-11′]),’lower_window’: -30, #雙11前30天’upper_window’: 2 #雙11后2天})

后邊也有新的升級 Neural Prophet,如果感興趣也可以再查找了解。

如何評估模型效果

預(yù)測時數(shù)據(jù)會切分成兩部分,訓(xùn)練集和測試集,評估模型效果簡單來講就是拿訓(xùn)練集得到模型,后再去預(yù)測測試集對應(yīng)的數(shù)值,把測試集的真實結(jié)果同預(yù)測結(jié)果比對,差異越小說明預(yù)測越準(zhǔn)確,但也要兼顧魯棒性,注意不要過擬合。

幾個線性模型評價模型準(zhǔn)確度的指標(biāo)和計算公式如下,比較簡單就不做過多解釋了。MAE 平均絕對誤差

RMSE 均方根誤差

MAPE 平均絕對百分比誤差(使用時不能有0,且去量綱可比較不同數(shù)據(jù)集)

參考資料

知乎文章 《時間序列原理篇之Facebook Prophet算法》

知乎文章《時間序列模型(四):ARIMA模型》

作者:小王子和小企鵝,公眾號:小王子和小企鵝 ?

@小王子和小企鵝 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉(zhuǎn)載。

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
专题
15885人已学习12篇文章
区别于普通业务,中台能让系统更好地满足业务需求,提升系统效率。本专题的文章分享了如何搭建业务中台。
专题
12527人已学习13篇文章
通过仪表盘,用户可以查看并分析产品的数据和图表,还可以通过控件来控制数据的显示、过滤等功能。本专题的文章分享了仪表盘设计指南。
专题
15958人已学习12篇文章
数据中台是处于业务前台和技术后台的中间层。本专题的文章分享了如何搭建数据中台。
专题
16069人已学习12篇文章
对于产品经理来说,做用户调研是一项很重要的过程。本专题的文章分享了如何做好用户调研。
专题
53376人已学习14篇文章
标题党,又爱又恨。但是如果你是运营,连标题都起不好,那就呵呵哒了。
专题
19483人已学习13篇文章
什么是中台?为什么要建中台?中台建设的切入点在哪?本专题的文章将提供这些问题的解答。