幾乎所有創(chuàng)企都在用的Stable Diffusion,真的可能要甩賣了
最近,有消息稱Stability AI可能要把自己“甩賣”了,那么在這一消息背后,顯露出了Stability AI的哪些問題?一起來看看本文的解讀。
最近 Twitter 上大家在傳 The Information 報道的 Stability AI 打算把自己賣了的消息。從 2022 年 8 月推出 Stable Diffusion 以來,不到兩年的時間,淪落到出售公司的程度。甚至據(jù)很多業(yè)內(nèi)人士分析,Stability AI 真的放到市場上,可能賣不出多少錢。
The Information 報道該消息的文章|圖片來源:The Information
進(jìn)入 2024 年,Stability AI 風(fēng)波不斷。3 月 21 日,開發(fā) Stable Diffusion 的幾名核心研究人員離職。過了沒有兩天,Stability AI 的 CEO Emad Mostaque 宣布離任,并退出董事會。又過了沒到一個月,4 月 19 日,Stability AI 又宣布裁員 20 人,約占全體員工的 10%。
Stability AI 到底挖了多大的坑?根據(jù) The Information 的說法,Stability AI 私下表示 2023 年的營收只有 800 萬美金左右,這個數(shù)字比之前網(wǎng)傳的 1100 萬美金還低了不少。而根據(jù)彭博社在 2023 年 10 月的報道,Stability AI 一個月就要在員工工資和云計算等領(lǐng)域支出 800 萬美金,其他不算,公司利潤率怒達(dá)-1100%。
而 2024 年第一季度,Stability AI 收入不到 500 萬美元,貌似賺得多了點,但虧損超過 3000 萬美元,利潤率稍微好看了些,也就是-600%。
公司經(jīng)營結(jié)果一塌糊涂,還欠了不少外債,據(jù)傳 Stability AI 欠云計算供應(yīng)商和其他公司 1 億美元。相比之下,隔壁 Midjourney 只有十幾名員工,就能拿下 3 億美金左右年營收。
如此糟糕的財務(wù)狀況,幾乎所有生圖類產(chǎn)品都會用其底層模型的 Stability AI,到底問題出在哪?
一、開源+API 的商業(yè)模式陷阱
經(jīng)過一番資料的搜索,對于這個問題,筆者主要總結(jié)出了兩個方面的原因,一是公司的管理出現(xiàn)了問題,二是 Stability AI 的商業(yè)模式一直沒有跑通。
Stable Diffusion 其實并不是 Stability AI 開發(fā)的產(chǎn)品,這款模型最初是由項目負(fù)責(zé)人 Robin Rombach 攻讀博士學(xué)位的慕尼黑大學(xué)和另一個 AI 視頻創(chuàng)企 runway 共同開發(fā)的開源模型項目 Latent Diffusion。
而 Stability AI 最初只是為項目提供了計算資源,才取得了冠名權(quán)。而 2022 年,Stability AI 說服了負(fù)責(zé)人 Robin Rombach 和其他核心成員加入公司,這才“名正言順”地獲得了 Stable Diffusion 的所有權(quán)。
雖然獲得了所有權(quán),但是 Stability AI 的管理卻一地雞毛。有離職員工透露,CEO Mostaque 幾乎不懂研究,也不會為研發(fā)團(tuán)隊制定計劃、分配資源,加上他個人的學(xué)歷、經(jīng)歷造假、欺騙投資人、欠薪等丑聞,造成 Stability AI 管理混亂,負(fù)面新聞纏身。如果說管理層混亂是一個例外,Stability AI 選擇的商業(yè)化路徑在為很多做開源模型、API 收費的企業(yè)敲響警鐘。
Stability AI 商業(yè)模式圖解|圖片來源:FourWeekMBA
眾所周知,Stable Diffusion 是一款開源模型,所有人都可以免費下載和修改模型。
而 Stability AI 本身則是靠 API、企業(yè)服務(wù)、AI 相關(guān)的咨詢來賺錢。這個開源商業(yè)化模式,模仿的是 Linux 的提供商 RedHat,即靠開源打出知名度,再靠 API 和企業(yè)定制產(chǎn)品在 B 端賺錢。Stable Diffusion 在推出伊始就上線了 API。
目前來看,市面上絕大多數(shù)的生圖產(chǎn)品,使用的都是 SD 和它的衍生模型,受眾遠(yuǎn)比 Midjourney 和 DALL-E 等閉源模型要大很多,而為什么 Stable Diffusion 被那么多創(chuàng)企采用,官方做 API 卻不賺錢呢?
第一個原因其實是模型本身的設(shè)計,由于 SD 從一開始就是開源模型,所以在設(shè)計時就比閉源模型參數(shù)更少,更輕量,以滿足離線部署的需求,因此,SD 原模型的生圖效果其實是不如閉源模型的。
但是 SD 作為開源模型,本身設(shè)計上,留下了很大的“可調(diào)整空間”,例如對 SD 模型進(jìn)行微調(diào)可以得到 Checkpoint,可以優(yōu)化某種特定風(fēng)格的生圖質(zhì)量,進(jìn)一步還能在 Checkpoint 的基礎(chǔ)上對 cross-attention layer 進(jìn)行調(diào)整形成 LoRa 模型,來添加特定對象或?qū)崿F(xiàn)人物、風(fēng)格一致的效果。這些都給了用戶和開發(fā)者按需求/場景,實現(xiàn)更佳效果的可能。而在實際落地中,絕大多數(shù)開發(fā)者都會對 SD 模型進(jìn)行重新訓(xùn)練,來適應(yīng)電商、廣告、或者漫畫臉等場景。
而直接調(diào)用 API,單純做套殼產(chǎn)品,其實競爭力不大,無法滿足多數(shù)廠商的業(yè)務(wù)落地需求。
第二個原因成本問題。
信息來源:各公司官方網(wǎng)站
其實單看 API 費用的話,除了最新推出的 SD3 比較昂貴之外,SDXL 和 SD1.6 等已開源的模型的 API 可以說比 OpenAI 便宜不少了,與騰訊混元的文生圖 API 價格相當(dāng)。
用戶云上部署 SD 的成本核算分享|圖片來源:AI魔法學(xué)院
但是如上所述,很多廠商為了落地,會選擇自行部署。而 SDXL 和 SD1.6 都是完全開源模型,任何用戶都可以自行下載和部署這兩款模型。甚至,一些云廠商也會將 SD 這種完全開源的模型做成即插即用的插件放在自己的解決方案里。
AWS SD 插件概述|圖片來源:AWS官網(wǎng)
根據(jù)網(wǎng)絡(luò)上的分享,使用騰訊云部署 SD 1.5 的話,平均單張圖片花費 0.1-0.01 元人民幣,合 1 美金能生成 70-710 張圖片;而上面提到的 AWS 的云服務(wù),1 美金大約可生成 240 張圖片。而如果選用更便宜的云服務(wù)提供商的話,這個價格能做到更低。
那我們把云部署的費用更新到表格中,就會變成下面這樣:
這么一比,雖然 SD 在 API 價格對比層面,費用確實不高,但和其他一些方式比沒有成本優(yōu)勢。
谷歌搜索“SD API”結(jié)果(上),第三方 API 的價格(下)
最后,依然是因為完全開源,在 Stable Diffusion 出來不久,就已經(jīng)各路有三方 API 出現(xiàn)了,目前在谷歌搜索“Stable Diffusion API”第一條是官網(wǎng),第二條就是一個第三方 API 的網(wǎng)站,甚至這個網(wǎng)站提供無限次使用 API 的服務(wù),價格為 147 美金/月。
SD 使用的 Creative ML OpenRAIL-M license 協(xié)議關(guān)于“分發(fā)模型”的條款,注:SD 使用的協(xié)議是專為 AI 開源產(chǎn)品設(shè)計,而類似 DeepSeek 等國內(nèi)出海產(chǎn)品會使用針對一般開源軟件的 MIT 協(xié)議,兩者商業(yè)化條款的規(guī)定基本相同,前者在道德等層面上會做了更多的規(guī)定,促使人們安全地使用 AI。
對于其他企業(yè)使用開源模型做三方 API 的法律問題,我咨詢了法律專業(yè)人士。他表示能否提供三方 API 服務(wù)需要參考產(chǎn)品協(xié)議中列示的商用條款,如果違反條款,原開發(fā)者就有權(quán)進(jìn)行索賠。而 Stable Diffusion 所使用的協(xié)議,完全允許向第三方分發(fā)模型,包括銷售付費 API,這讓 SD 官方的 API 無形中又多了無數(shù)競爭對手。
目前,很多國內(nèi)大模型都在走開源+API 的路徑,但是在開源的基礎(chǔ)上,都會擁有能力更強(qiáng)的閉源模型,或干脆將開源閉源分成兩個系列(比如 Google 的 Gemini 和 Gemma),為自己的 API 保留一些差異,在開源和商業(yè)化方面找到平衡。
看下來,Stablity AI 陷入“瘋狂燒錢,但營收不利”的局面,其實就是沒有在開源的同時推出能夠區(qū)別于開源模型的差異化產(chǎn)品,在價格上也無法與自行部署模型來競爭。在價格更低、部署也并不麻煩的情況下,B 端用戶們自然會更傾向自行部署大模型、甚至直接使用部署了開源模型的云服務(wù),而不是調(diào)用 API,Stablity AI 自己的模型開源把自己的商業(yè)化路徑堵死了。
二、從開源轉(zhuǎn)向閉源,Stablity AI 的自救能成功嗎?
這樣的商業(yè)化困境,造成 Stablity AI 一直要靠融資維持,早在去年 11 月份,就有消息爆出,投資者對公司業(yè)績不滿而要求 CEO 辭職的新聞。
為此,Stability AI 開始密集進(jìn)行商業(yè)化嘗試,涵蓋 API、限制自行部署模型商用、ToC 訂閱付費等多種模式。
評論 Stablity AI 會員訂閱的X帖文|圖片來源:X
去年 12 月底 Stablity AI 針對自行部署模型用戶,變更了政策,簡單說就是不商用還可以免費用,但如果商用,就要買會員了。
這個政策變更覆蓋的模型有 SDXL Turbo、視頻生成模型 SVD 等(未來還會有 SD3)。與之前堅持的不限制商用的開源協(xié)議不同,Stablity AI 想通過限制“自部署”模型的商用權(quán)限獲得收入。
Stablity AI 宣布在 API 中推出 SD3 的 X 帖文|圖片來源:X
而且 SD3 宣布了很久,一直沒上線模型,只提供了 API 調(diào)用,Stablity AI 似乎有轉(zhuǎn)向閉源的趨勢。
4 月 17 日,Stablity AI 宣布 SD3 和SD3 Turbo 可以通過調(diào)用 API 中訪問模型,而且在 X 帖文中還提到,為了實踐開源的承諾,未來將在 Stablity AI 會員的權(quán)益中添加這兩款模型,但絕口不提完全開源的事情。
Stable Artisan 訂閱價格
除了收模型的會員費,在 5 月 9 日,Stablity AI 又宣布開始做 C 端生意了,推出基于 Discord 的 AI 圖像工具 Stable Artisan。
用戶可以在 Discord 中輸入提示詞,用 SD3、Stable Video 和 Stable Image Core 等最新模型進(jìn)行生圖、修圖、生成視頻等操作。商業(yè)化方面,Stable Artisan 采取訂閱制,用戶可以根據(jù)生圖數(shù)量的需求按月或年付費?!癉iscord 平臺+4 檔訂閱付費”,這幾乎已經(jīng)是照抄 Midjourney 的模式了,只不過訂閱價格略便宜一些。
但問題是,面對各路生圖模型的競爭,Stablity AI 還能收到 C 端用戶的錢嗎?
測試方式:用各生圖模型生成多組圖片,由人類進(jìn)行打分|圖片來源:數(shù)字生命卡茲克
CSDN 上另一個測評的結(jié)果|圖片來源:CSDN
要想探究這個問題,我們首先要看,Stablity AI 的模型能力是否有優(yōu)勢,這個答案是“似乎沒有”。我們以最新推出的 SD3 為例,雖然 Stablity AI 在論文中表示經(jīng)過測試,SD3 比市面上所有模型都要強(qiáng)。
但是根據(jù)國內(nèi)媒體進(jìn)行的測評,在細(xì)節(jié)質(zhì)量、語義理解和審美三個點的評分上,SD3 基本都低于 MidjourneyV6,雖然這個測評帶有不小的主觀性,但是綜合筆者看到的其他測評結(jié)果,至少可以得出結(jié)論,SD3 并沒有碾壓 Midjourney、DALL-E 的實力,不同模型在不同的維度上各有優(yōu)劣。
分別為負(fù)面提示詞、種子值、長寬比、模型(只有 SD3 和 Coreke xuan)、圖片數(shù)量
而且,與 API 有同樣的問題,Stable Artisan 也不能像市面上的其他生圖產(chǎn)品那樣調(diào)節(jié)更多的參數(shù)或使用 Lora,可控性上可能還不如那些使用了開源 SD 模型的產(chǎn)品。
此外,目前 Stable Artisan 只支持在 Discord 聊天框里輸入 Prompt,但是筆者看下來,幾乎沒有對用戶的指引,用戶雖然可以二次創(chuàng)作其他人生成的圖片,但只能像“原始版 Midjourney”那樣,在 Discord 中一頁一頁的翻找。更不要說,像很多生圖產(chǎn)品那樣有讓用戶點標(biāo)簽生成提示詞,或者像 SeaArt 一鍵做同款等方便用戶操作的設(shè)計了。
Discord 中用戶使用去背景功能后的效果|圖片來源:Stable Diffusion Discord
此外,筆者瀏覽了一下 Discord 中其他用戶的生圖記錄,絕大多數(shù)用戶都是在使用文生圖工具,使用線稿生圖或去背景/對象等其他功能的用戶并不太多,而且這個去背景的效果,似乎也不怎么好。
Discord 邀請頁面顯示的在線人數(shù)
從人氣來看,Stable Diffusion Discord 的在線人數(shù)只有 Midjourney 一個零頭。而目前,Midjourney 網(wǎng)站端的生圖功能已經(jīng)向生圖超過 100 張的用戶開放了,其他生圖產(chǎn)品基本都在網(wǎng)站端使用了。而 Stable Diffusion 才剛剛走上 Midjourney 等產(chǎn)品一年半前走的路。
寫在最后
作為一個 AI 時代的明星,Stable Diffusion 和 Stablity AI 已經(jīng)寫下濃墨重彩的一筆,但是不到 2 年的時間,就淪落到出售公司的程度,也令人唏噓不已。未來開源 AI 這條路能否走出“瘋狂燒錢,卻不掙錢”的死路,找到可行的商業(yè)模型,可能還要未來的 AI 創(chuàng)企們給出答案了。
參考文獻(xiàn):
- Stable Diffusion | SD 騰訊云 3 步部署,全程五分鐘,附價格費用清單
- Stability AI Facing Cash Crunch,Discusses Sale
- 曾經(jīng)爆紅的AI獨角獸,走到了樹倒猢猻散的邊緣
- 瘋狂燒錢、管理混亂,Stable Diffusion 背后企業(yè)瀕臨倒閉
- How does Stability AI make money? Stability AI business model analysis
作者:張凱然,編輯:殷觀曉;出品:白鯨出海編輯部
來源公眾號:白鯨出海(ID:baijingAPP),泛互聯(lián)網(wǎng)出海服務(wù)平臺。
本文由人人都是產(chǎn)品經(jīng)理合作媒體 @白鯨出海 授權(quán)發(fā)布,未經(jīng)許可,禁止轉(zhuǎn)載。
題圖來自 Unsplash,基于CC0協(xié)議。
該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。
- 目前還沒評論,等你發(fā)揮!