国产欧美一级视频播放,大地影院MV在线观看视频免费

搜索

APP

起點課堂會員權(quán)益

職業(yè)體系課特權(quán)

線下行業(yè)大會特權(quán)

個人IP打造特權(quán)

30+門專項技能課

1300+專題課程

12場職場軟技能直播

12場求職輔導(dǎo)直播

12場專業(yè)技能直播

會員專屬社群

榮耀標(biāo)識

開通會員

發(fā)布

注冊 | 登錄

談?wù)勗贐端落地第三方大模型的步驟

檸檬餅干凈又衛(wèi)生

2023-09-05

2 評論 5293 瀏覽 18 收藏

在B端系統(tǒng)落地應(yīng)用大模型的過程中，企業(yè)可能會遇到哪些問題？又可以遵循怎樣的落地步驟，以避免或減少問題的發(fā)生？這篇文章里，作者便對在B端落地第三方大模型的步驟進(jìn)行了總結(jié)，一起來看一下。

一、引言

奇績創(chuàng)壇創(chuàng)始人兼CEO陸奇博士曾經(jīng)提出過“三位一體”的結(jié)構(gòu)模型：“信息 + 模型 + 行動”。其解釋了人類、組織等有機體的運作方式，也可用于概括互聯(lián)網(wǎng)產(chǎn)品的組成結(jié)構(gòu)：

談?wù)勗贐端落地第三方大模型的步驟

圖片引用于陸奇《我的大模型世界觀》

在B端系統(tǒng)中，我們可以采用“信息 + 模型 + 行動”的結(jié)構(gòu)來規(guī)劃和應(yīng)用人工智能的能力。利用業(yè)務(wù)所產(chǎn)生的數(shù)據(jù)作為輸入，經(jīng)過模型的規(guī)則總結(jié)，然后系統(tǒng)根據(jù)模型的預(yù)測結(jié)果來采取相應(yīng)的行動。例如，我們可以利用AI的語言處理能力實現(xiàn)翻譯功能，或者通過AI對客服問答進(jìn)行總結(jié)，實現(xiàn)智能機器人客服。最終的目標(biāo)是通過AI技術(shù)實現(xiàn)B端業(yè)務(wù)的成本降低和效率提升。

在當(dāng)前生成式人工智能蓬勃發(fā)展的背景下，許多中小型企業(yè)希望結(jié)合第三方提供的大型模型能力，將自己的產(chǎn)品“重新用AI打造”。大多B端產(chǎn)品經(jīng)理也在領(lǐng)導(dǎo)的要求下，被要求利用現(xiàn)有的大型AI模型來滿足相關(guān)需求。

然而，我們需要思考AI是否真正適合自身的業(yè)務(wù)，如何選擇適合的大型模型，以及如何在確保業(yè)務(wù)效果的前提下規(guī)避當(dāng)前AI所面臨的不可控問題。本文將對在實施AI落地過程中的一些思考進(jìn)行梳理。

二、落地難點

事實上，大多數(shù)中小企業(yè)并沒有自行訓(xùn)練大模型的能力，因此只能依賴第三方提供的大模型來進(jìn)行需求開發(fā)。而這種情況下存在一些影響企業(yè)應(yīng)用AI的問題：

1）AI的黑盒特性導(dǎo)致的不可控問題

目前的AI技術(shù)仍處于第二代系統(tǒng)階段，遠(yuǎn)未達(dá)到AGI水平。因此，AI的能力仍然存在一定的局限性，主要表現(xiàn)在以下幾個方面：

答案的可信度不確定：由于AI是基于已有信息的提煉和總結(jié)，對于新出現(xiàn)的問題和場景，AI可能無法提供有用的答案。尤其是在垂直領(lǐng)域的AI應(yīng)用，可能無法產(chǎn)生有用的信息。
答案的合規(guī)性不確定：AI是一種基于統(tǒng)計學(xué)的結(jié)果預(yù)測，本質(zhì)上沒有明確的是非判斷能力。因此，在涉及道德、法律等層面的問題上，AI無法進(jìn)行甄別或判斷，容易給企業(yè)帶來負(fù)面影響。

2）“大模型百家爭”下的技術(shù)方案不確定性

目前，國內(nèi)外的知名企業(yè)都在積極發(fā)展大模型，國內(nèi)有文心一言、通義千問、盤古、星火認(rèn)知大模型等數(shù)十家廠商。對于這些大模型的能力和邊界，我們了解甚少，因此在決策企業(yè)AI技術(shù)落地時，面臨著諸多問題，例如“應(yīng)該選擇哪些大模型”和“如何使用這些大模型”，這增加了企業(yè)決策AI技術(shù)落地的成本。

談?wù)勗贐端落地第三方大模型的步驟

圖片來源于網(wǎng)絡(luò)

三、實施步驟

AI技術(shù)在B端的應(yīng)用場景十分廣泛，但本文將專注于研討如何在發(fā)現(xiàn)一個可行的場景時，有效地實施落地的步驟，以解決企業(yè)在依賴第三方AI技術(shù)時面臨的不可控性和不確定性問題。以下為個人總結(jié)的落地步驟：

1. 快速驗證可行性

在明確B端系統(tǒng)要應(yīng)用AI的具體任務(wù)后，需要進(jìn)行快速的可行性驗證。盡管尚未確定最終選用哪個大型模型，但可以先使用一種評價較高的大型模型進(jìn)行驗證，并請技術(shù)團(tuán)隊和業(yè)務(wù)團(tuán)隊進(jìn)行評估。為了快速驗證，您可以嘗試搭建一個演示版本，以便迅速進(jìn)行業(yè)務(wù)驗證。為避免浪費開發(fā)成本，建議優(yōu)先選擇一些開源的技術(shù)實現(xiàn)方案，僅需支付部署費用即可。這樣能夠有效降低開發(fā)成本并提高開發(fā)效率。

其中測試的時候有兩種驗證方法可供嘗試：

1）角色扮演法：測試者扮演B端系統(tǒng)的用戶角色，模擬業(yè)務(wù)的交互流程并輸入信息，以評估AI的返回結(jié)果是否符合業(yè)務(wù)要求。例如，可以模擬用戶向智能機器人提問，觀察AI返回的問題是否能夠滿足業(yè)務(wù)要求，從中判斷AI是否能夠在該場景中提供解決方案的方法。

2）數(shù)據(jù)模擬法：通過在線業(yè)務(wù)數(shù)據(jù)獲取真實的樣本數(shù)據(jù)，并進(jìn)行人工篩選以確定具有代表性的數(shù)據(jù)案例。隨后，批量輸入這些數(shù)據(jù)到AI模型中以獲取輸出結(jié)果，并進(jìn)行大規(guī)模的評估。

2. 建立指標(biāo)體系進(jìn)行模型選型

當(dāng)確定AI技術(shù)可在B端上落地后，需要確定接入的模型能力。這里需要基于業(yè)務(wù)梳理模型評估體系，使用量化的指標(biāo)便于多個大模型之間的對比，以便綜合考量最終選取合適的大模型提供方。一般指標(biāo)會包含以下內(nèi)容：

1）召回率

召回率是模型訓(xùn)練中的概念，又稱“查全率”，是一個常用的衡量數(shù)據(jù)挖掘模型在查詢回歸程度的指標(biāo)。用簡單的話介紹就是“原本需要系統(tǒng)判斷出來的內(nèi)容中，大模型真的抓出來了多少”，用來判斷大模型能夠準(zhǔn)確判斷的范圍。

2）準(zhǔn)確率

準(zhǔn)確率同是模型訓(xùn)練中的概念，用于衡量模型預(yù)測正確的結(jié)果所占的比例。通俗地講，就是模型判斷正確了多少。

在大模型能力有限的情況下，召回率和準(zhǔn)確率一定程度上是沖突的。為了判斷得全，就會加大判斷錯誤的概率。為了判斷得正確，又會有案例沒有沒判斷到。

召回率和準(zhǔn)確性直接決定了大模型的服務(wù)能力。

3）安全性

由于是第三方服務(wù)，B端企業(yè)需要考慮到數(shù)據(jù)的安全問題，評估模型能否保護(hù)用戶數(shù)據(jù)的隱私和安全，并符合相關(guān)的數(shù)據(jù)保護(hù)法規(guī)和標(biāo)準(zhǔn)。

4）可解釋性

可解釋性是指模型的結(jié)果能否被理解?？山忉屝愿叩哪Ｐ停浜诤谐潭认鄬Ω?，更具有可控性。

對B端業(yè)務(wù)來說，模型的結(jié)果需要能夠被解釋和理解，以便用戶和業(yè)務(wù)決策者能夠理解模型的工作原理和結(jié)果依據(jù)。

5）穩(wěn)定性

結(jié)合自身業(yè)務(wù)端量級判斷評估模型的性能，包括響應(yīng)時間、吞吐量和并發(fā)處理能力。模型需要能夠在合理的時間內(nèi)處理大量的請求，并保持高效的性能和穩(wěn)定的服務(wù)。

6）成本

使用大模型是有成本的，例如使用ChatGPT需要按照token進(jìn)行收費。此外，不同版本的大模型收費標(biāo)準(zhǔn)也不同，例如ChatGPT4.0版本雖然效果更好，但成本卻是3.5版本的40倍到60倍。因此，在選擇大模型時，需要結(jié)合業(yè)務(wù)量級進(jìn)行成本評估，以確保AI需求真正能夠?qū)崿F(xiàn)”降本”的目標(biāo)。

7）發(fā)展?jié)摿?/strong>

評估大模型提供方的潛力，后續(xù)是否有可能提供更好的服務(wù)能力。

基于上方指標(biāo)進(jìn)行多個大模型之間的對比，按照指標(biāo)權(quán)重綜合考慮，最終選擇最合適的大模型以接入。

3. 海王思維，兩手準(zhǔn)備

隨著人工智能的快速發(fā)展，企業(yè)在選擇和應(yīng)用大型模型時面臨著不確定性。原本使用的大型模型可能隨時被新出現(xiàn)的更優(yōu)秀模型所取代，以滿足業(yè)務(wù)需求。這種替換可能會導(dǎo)致額外的成本，對企業(yè)的B端系統(tǒng)建設(shè)進(jìn)度產(chǎn)生不利影響。因此，在實施企業(yè)的人工智能需求時，需要具備一種“海王”思維：

1）做好隨時“分手”的準(zhǔn)備

確保基于大模型的需求實現(xiàn)方案不要過于定制和耦合，明確好自身系統(tǒng)和第三代模型的邊界。把第三方大模型當(dāng)作一個可隨時替換的“插件”，做好隨時替換的準(zhǔn)備，當(dāng)目前使用的大模型技術(shù)由于成本或者能力問題需要替換的時候，可以隨時抽身而退。

2）確定模型評估方案，定期勾搭市面上的其他模型

由于當(dāng)前AI發(fā)展日新月異，為了不讓企業(yè)落后，產(chǎn)品團(tuán)隊需要定期接入最新的模型進(jìn)行測試和驗證，利用前面搭建的“模型評估體系”判斷最新的模型與原有模型的差異，以用于判斷“是否替換”或是“保持使用”。

4. 確保兜底邏輯，規(guī)避AI的不可控風(fēng)險

由于AI輸出的答案存在不確定性問題，在涉及面向C端用戶的業(yè)務(wù)場景中，直接應(yīng)用AI輸出結(jié)果可能導(dǎo)致無法控制的影響。因此，為規(guī)避相關(guān)風(fēng)險，我們需要采取以下措施：

1）建立自主AI結(jié)果檢測程序，攔截?zé)o效輸出結(jié)果：我們可以通過建立AI結(jié)果檢測程序來識別可能對業(yè)務(wù)產(chǎn)生影響的內(nèi)容。通過使用詞庫和正則匹配等方法，我們可以甄別并攔截AI生成的錯誤結(jié)果。對于出現(xiàn)錯誤的結(jié)果，我們將重新執(zhí)行AI生成邏輯，直至獲得正確的輸出內(nèi)容。

2）引入人力兜底方案以應(yīng)對影響用戶的內(nèi)容：對于不直接影響用戶的內(nèi)容，我們可以直接采用AI的判斷結(jié)果。

然而，對于可能對用戶產(chǎn)生影響的內(nèi)容，最好由人力進(jìn)行兜底控制。例如，在審核環(huán)節(jié)中，我們可以引入“機審”和“人審”的組合，使用“機審”對內(nèi)容進(jìn)行初步篩選，而“人審”則負(fù)責(zé)處理AI無法準(zhǔn)確判斷的內(nèi)容。又例如，在智能對話客服環(huán)節(jié)，我們可以引入“人工入口”，以確保在機器無法解決問題的情況下，引導(dǎo)用戶尋求人工幫助，避免對用戶體驗造成影響。

四、總結(jié)

總體而言，使用第三方大模型可能會引發(fā)一系列問題，由于第三方技術(shù)的不可控性，這可能會影響中小企業(yè)在B端的實施。

為了避免這些問題，確定落地方案時需要快速進(jìn)行可行性驗證，并建立指標(biāo)體系來進(jìn)行選擇。同時，還需要做好兩手準(zhǔn)備和兜底邏輯，以應(yīng)對市場的快速發(fā)展和AI技術(shù)帶來的風(fēng)險。

本文由 @檸檬餅干凈又衛(wèi)生原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理，未經(jīng)許可，禁止轉(zhuǎn)載

題圖來自Unsplash，基于CC0協(xié)議

該文觀點僅代表作者本人，人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容，請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App

B端系統(tǒng)人工智能大模型落地

檸檬餅干凈又衛(wèi)生

游戲行業(yè)B端產(chǎn)品，歡迎加我交流，V：funjecSu

40篇作品 184108總閱讀量

為你推薦

高德上位，阿里打得下本地生活嗎？

02-242650 瀏覽

聊聊基金產(chǎn)品經(jīng)理必會：基金轉(zhuǎn)托管業(yè)務(wù)及交互流程

09-205753 瀏覽

微信“斷路”幕后：視頻號商業(yè)化棋至中局

09-053227 瀏覽

2023年已經(jīng)過去一半了？怎么才能高效地進(jìn)行項目復(fù)盤呢？

09-026802 瀏覽

集體上岸、大廠回春：灣區(qū)的求職市場回暖了

08-266058 瀏覽

評論

評論請登錄

勒布朗Jay

題主有做過在b端場景的落地項目嗎

最近來自北京回復(fù)

檸檬餅干凈又衛(wèi)生作者回復(fù)勒布朗Jay

嗯嗯

最近來自廣東回復(fù)

举报

為你推薦

拼多多出海，卷起新一輪電商大戰(zhàn)

05-252493 瀏覽

原型說明咋寫-單選器

11-033480 瀏覽

玩轉(zhuǎn)用戶增長 — 用戶留存的秘訣（下）

11-164577 瀏覽

推荐专题更多专题

专题
52116人已学习9篇文章

CRM产品该如何设计和运营

详细阐述：由点及面的CRM认知。
专题
15473人已学习16篇文章

如何做活动运营？

随着互联网时代的蓬勃发展，互联网平台活动运营对于互联网企业业务十分重要。本专题的文章分享了如何做活动运营。
专题
11725人已学习12篇文章

消费金融APP流程详解

金融产品的流程与常见策略规则类型是从事相关行业人员需要了解的重要内容。本专题的文章分享了消费金融APP流程详解。
专题
13557人已学习12篇文章

B端产品经理的通用工作流程

本专题的文章分享了B端产品经理的通用工作流程。
专题
15378人已学习12篇文章

如何做好服务设计？

服务设计在流程性和系统性的问题解决方面提供很好的思路和方法。本专题的文章分享了如何做好服务设计。
专题
12353人已学习13篇文章

如何进行产品改版升级？

本专题的文章分享了产品升级迭代应该怎么做，以及其中遇到的问题和思考。

社群
付费群 | 免费群

产品经理交流群加入
AI 学习交流群加入
华为鸿蒙交流群加入
运营增长交流群加入
小红书抖音视频号群加入
互联网中年转型交流群加入

快訊
查看更多

熱門文章

擠爆字節(jié)服務(wù)器的Agent到底啥水平？一手實測來了

04-24

封殺AI“照騙”，“淘寶們”終于不忍了

04-08

產(chǎn)品經(jīng)理必讀：如何從問題出發(fā)打造有價值的產(chǎn)品？

04-18

5000字深度長文：詳解科技圈爆火的MCP

04-18

釘釘刷新釘釘

04-05

我說：「給你 20 美金小費」，AI 掏出了收款碼…

04-21

入职半年，领导问起对公司有什么建议或看法时，应该说些什么？

在2021小米校招生培训上，雷军对新员工提出了一个建议，入职半年内先不要对公司战略和业务提意见，因为...

126.4k 点击45 回答
进入回答

微信通讯录中为什么会有“自己”？大家怎么看？

117.5k 点击69 回答
App怎么进行排期和安排第一版本功能？

17.7k 点击14 回答
B端产品是要注重业务功能的落地，还是要炫酷的交互效果？

14.8k 点击18 回答

文章導(dǎo)航

一、引言

二、落地難點

三、實施步驟

四、總結(jié)

關(guān)于
人人都是產(chǎn)品經(jīng)理（woshipm.com）是以產(chǎn)品經(jīng)理、運營為核心的學(xué)習(xí)、交流、分享平臺，集媒體、培訓(xùn)、社群為一體，全方位服務(wù)產(chǎn)品人和運營人，成立12年舉辦在線講座1000+期，線下分享會500+場，產(chǎn)品經(jīng)理大會、運營大會50+場，覆蓋北上廣深杭成都等20個城市，在行業(yè)有較高的影響力和知名度。平臺聚集了眾多BAT美團(tuán)京東滴滴360小米網(wǎng)易等知名互聯(lián)網(wǎng)公司產(chǎn)品總監(jiān)和運營總監(jiān)，他們在這里與你一起成長。

合作伙伴

鏈接

隱私政策

投稿須知

意見反饋

幫助中心

公眾號

視頻號

友情鏈接

PM265

產(chǎn)品經(jīng)理導(dǎo)航

起點課堂

豬八戒網(wǎng)

人才熱線

伙伴云表格

網(wǎng)易易盾

個推

友盟+

糧倉

創(chuàng)業(yè)邦

每日報告

鳥哥筆記

慕課網(wǎng)

旗下品牌: 起點課堂 | 運營派 | 糧倉企微管家
?2010-2024 - 人人都是產(chǎn)品經(jīng)理 - 粵ICP備14037330號-粵公網(wǎng)安備 44030502001309號
 廣播電視節(jié)目制作經(jīng)營許可證（粵）字第03109號增值電信業(yè)務(wù)經(jīng)營許可證粵B2-20190788 版權(quán)所有 ? 深圳聚力創(chuàng)想信息科技有限公司

談?wù)勗贐端落地第三方大模型的步驟

一、引言

二、落地難點

三、實施步驟

1. 快速驗證可行性

2. 建立指標(biāo)體系進(jìn)行模型選型

3. 海王思維，兩手準(zhǔn)備

4. 確保兜底邏輯，規(guī)避AI的不可控風(fēng)險

四、總結(jié)

一、引言

二、落地難點

三、實施步驟