RunningHub:瞄準(zhǔn)圖形音視頻領(lǐng)域,做AIGC應(yīng)用共創(chuàng)平臺,它有何特點?

1 評論 1701 瀏覽 0 收藏 13 分鐘
🔗 B端产品经理需要更多地关注客户的商业需求、痛点、预算、决策流程等,而C端产品经理需要更多地关注用户的个人需求

本文將深入剖析RunningHub如何憑借其獨特的優(yōu)勢,降低創(chuàng)作門檻,激發(fā)創(chuàng)作者的想象力,并探索其在AIGC應(yīng)用共創(chuàng)平臺領(lǐng)域的廣闊前景。

2025第一季度,文生圖行業(yè)進步神速。

直觀層面,圖形的擬真度飛速提升。由此,其在廣告、宣傳、影視制作、游戲開發(fā)等領(lǐng)域的價值得到了空前開發(fā)。

而AI的發(fā)展不會到此為止。為了降低制作成本和時間,提高工作效率和視覺效果,國內(nèi)企業(yè)開始了新的進擊。

其中,圖像制作與工作流的結(jié)合成為趨勢。

海馬云CTO溫健對數(shù)科星球指出:當(dāng)下,每個行業(yè)的每個工種都可憑借制作工作流生成圖片,工作流的潛力還遠未被挖掘,而巨大的需求和巨大的供給遲早相互融合。

01 SD強大,但需要工作流補充

如今,人人皆知ChatGPT。

和OpenAI一樣,在圖片行業(yè),人人皆知StableDiffusion。其第一代于2022年8月22日正式向公眾發(fā)布,在發(fā)布至今,歷經(jīng)兩年,Stable Diffusion 已迭代至3.5版本。

據(jù)了解,StableDiffusion3.5Large新增了blur、canny和depth三種ControlNet功能。

  • 其中blur功能可實現(xiàn)高保真度的圖像放大,支持8k和16k分辨率,適合將低分辨率圖像平鋪成大型、詳細的視覺效果;
  • canny功能利用邊緣映射構(gòu)建生成圖像,對于插圖、建筑等場景生成具有清晰邊緣和結(jié)構(gòu)的圖像很有用,且能適應(yīng)所有風(fēng)格;
  • depth功能則使用深度圖指導(dǎo)圖像生成,適合建筑渲染、3d資產(chǎn)紋理制作等需要精確控制圖像合成的用例,便于生成3d效果的圖像。

底座模型雖然強大,但對于廣大圖片和視頻制作者而言,還是不夠方便。

比如,如對原始視頻素材進行細致分析,拆解其內(nèi)容結(jié)構(gòu),為后續(xù)制作提供基礎(chǔ),困難重重。制作者也無法依據(jù)從現(xiàn)有圖像中反推關(guān)鍵元素。

對于視頻制作者而言,還需要通過AI輔助構(gòu)建合理的分鏡腳本,規(guī)劃視頻情節(jié)和鏡頭等等需求。

對于圖片制作者而言,也需要自由選擇和組合各種節(jié)點,實現(xiàn)不同的圖像風(fēng)格,如卡通風(fēng)格、寫實風(fēng)格、抽象藝術(shù)風(fēng)格等。

此外,以圖生圖功能還較為欠缺。在數(shù)科星球的多方了解中發(fā)現(xiàn),大部分設(shè)計上希望對已生成圖像進行二次編輯和修改,如調(diào)整色彩、對比度、亮度等參數(shù),以及進行裁剪、拼接等操作,方便創(chuàng)作者對作品進行完善和優(yōu)化。

所以,為了滿足種種需求,以ComfyUI為代表的工作流開源平臺開始崛起。

ComfyUI采用節(jié)點式工作流架構(gòu),用戶可以通過拖放和連接不同的節(jié)點來構(gòu)建個性化的圖像生成工作流。每個節(jié)點代表一個特定的功能或操作,如文本提示、圖像輸入、風(fēng)格轉(zhuǎn)換、濾鏡應(yīng)用等,這使得用戶能夠更直觀地理解和控制圖像生成的每個步驟,輕松創(chuàng)建從簡單到復(fù)雜的各種圖像生成任務(wù)。

這極大降低了圖片制作的門檻。數(shù)科星球認為,ComfyUI的出現(xiàn)可比作圖形顯示系統(tǒng)之于DOS系統(tǒng)。它讓小白用戶也可具備專業(yè)的設(shè)計師能力,真正實現(xiàn)了設(shè)計平權(quán)。

02 ComfyUI的優(yōu)勢與劣勢

ComfyUI的出現(xiàn)好處多多,比他它可實現(xiàn)設(shè)計協(xié)同、用戶可自定義圖片生成流程、生成速度也大幅提升。

目前,由于節(jié)點多、開發(fā)者多,ComfyUI正在和WebUI等同質(zhì)平臺拉開差距,大有一統(tǒng)江湖的趨勢。

什么是節(jié)點,為什么節(jié)點需要開發(fā)?

為理解方便,我們制作了節(jié)點和功能說明圖。

由于是開源平臺,為了滿足更多的圖片/視頻制作需求,便需要搭建可開發(fā)更多的節(jié)點。但如此一來,平臺的復(fù)雜度便再一次提升了。

這主要有三點難以回避:

  • 它的界面相對復(fù)雜,對于新手用戶來說不夠友好,存在一定的學(xué)習(xí)曲線;
  • 雖然它支持多種 Stable Diffusion 模型及相關(guān)擴展,但在文生視頻等更廣泛的功能上可能需要用戶自行配置和擴展;
  • 它本身并不直接支持多人實時協(xié)作編輯,這在一定程度上限制了團隊合作的效率。所以,對于開源平臺本身,需要一個集大成者、用戶門檻足夠低的產(chǎn)品彌補市場空白。由此,海馬云旗下的RunningHub便出現(xiàn)了。

03 RunningHub的優(yōu)勢

RunningHub的定位是基于開源生態(tài)系的圖形音視頻AIGC應(yīng)用共創(chuàng)平臺。

“從整體角度而言,我們依據(jù)平臺集成Comfyui和眾多開源模型工具,打造算力平臺和開發(fā)者工具,鼓勵開發(fā)者共創(chuàng)各類AI應(yīng)用打通整條產(chǎn)業(yè)鏈”,溫健這樣說。

RunningHub出現(xiàn)的意義是,它將圖片/視頻生成成本從以往錨定設(shè)計師的人力成本轉(zhuǎn)換成為了算力成本。而這種算力不是基于英偉達的私有部署卡,而是基于廉價的公有云算力。

無需繁瑣的本地環(huán)境安裝,用戶打開網(wǎng)頁即可輕松投入到創(chuàng)作當(dāng)中,降低了使用門檻,節(jié)省了時間和精力。

類似用戶只需通過Claude3.5,無需掌握代碼知識就可編程。借由低代碼和拖拉拽,在RunningHub上,無設(shè)計基礎(chǔ)的用戶就可以生成高水平作品。

在海馬云的設(shè)計思路中,用戶除可根據(jù)節(jié)點編輯自己的智能體外,還能通過享用平臺中的既有智能體直接生成作品。

“可以這樣理解,我們把開發(fā)者開發(fā)的AI工作流應(yīng)用商店化了,用戶可以直接分發(fā)自己的AI應(yīng)用,可以直接將應(yīng)用分發(fā)至Web、小程序、抖音小程序和小紅書等渠道中,更可以直接讓私域用戶體驗,”溫健補充。

該平臺有著獨特的現(xiàn)實意義。

對于智能體制作者而言,RunningHub為普通人提供了一條新的賺錢渠道。在數(shù)科星球看來,直接的應(yīng)用付費模式類似“賣課”和知識付費,在未來將創(chuàng)造出極其可觀的收益。

溫健評價,RunningHub是行業(yè)內(nèi)最完整的ComfyUI開源節(jié)點平臺。

在該平臺中,創(chuàng)作者可以更直觀地構(gòu)建和管理圖像生成工作流,以快速實現(xiàn)復(fù)雜的創(chuàng)作想法。另外,其節(jié)點還包括圖像處理、生成算法等功能,用戶可在此選擇更豐富的創(chuàng)作工具和效果選項。

此平臺一經(jīng)搭建,獲得頗多好評。

一些開發(fā)者認為,使用現(xiàn)有的開源節(jié)點可以避免重復(fù)造輪子;通過節(jié)點分享,開發(fā)者還有機會獲得收益;對于新手而言,直觀的圖形界面和豐富的文檔方便了快速上手。

而未來,隨著節(jié)點的增多,不同行業(yè)和領(lǐng)域?qū)I作圖的多樣化需求也可得到滿足。

04 開源的想象力巨大

發(fā)布數(shù)個月,純靠開發(fā)者口碑傳播,目前RunningHub已經(jīng)有全球144個國家的用戶成為了Runninghub的用戶,其中付費會員用戶廣泛分布于中國、日本、阿聯(lián)酋、美國、英國、法國、克羅地亞、立陶宛、西班牙、波蘭、越南、巴西等各大洲國家。

是什么原因讓該產(chǎn)品獲得快速增長?數(shù)科星球認為,這歸功于開源和該行業(yè)的巨大潛力。

據(jù)相關(guān)報道,GitHub上2023年新增6.5萬個生成式AI項目,同比增長248%。而2024年被認為是AI視頻生成領(lǐng)域迎來寒武紀(jì)大爆發(fā)的一年,大量模型和應(yīng)用涌現(xiàn),促使更多開發(fā)者加入圖形音視頻領(lǐng)域的AI開發(fā)。

在功能上,該平臺除了能做海報、名片、PPT、邀請函、logo、微信設(shè)計圖等內(nèi)容,還可兼容繪本、數(shù)字人等基于AI的內(nèi)容呈現(xiàn)。

對于設(shè)計本身而言,它不需要用戶掌握Sketch、PS、AI等多種軟件能力,讓小白也能掌握設(shè)計能力。

現(xiàn)在,該平臺已積累7000+節(jié)點插件,每日更新,節(jié)點的數(shù)量和穩(wěn)定性遠超其他平臺。另外,該平臺還擁有1000個項目能力。按照一個項目覆蓋一個場景計算,該平臺能覆蓋眾多AIGC領(lǐng)域,其覆蓋率可達99%。

“我們希望用戶能用“搭樂高積木”的方式使用我們,”溫健補充。

搭積木的軟件生成方式有什么意義?答,可讓“妙鴨相機”這類軟件更多被制造出來。

在此之前,妙鴨相機依靠9.9元的付費便能時候能出個性化AI寫真功能一炮而紅。在其中用戶只需上傳自己的照片,就能生成多種風(fēng)格的AI照片。旋即,這類功能被各大互聯(lián)網(wǎng)大廠模仿,成為了全民喜聞樂見的形式。

如果平民開發(fā)者也能掌握這樣的技能,那么其效果無異于再造移動互聯(lián)網(wǎng)大潮。

從商業(yè)模式角度來看,因開源社區(qū)匯聚了大量不同背景和專業(yè)領(lǐng)域的開發(fā)者,使得他們能夠基于開源框架快速開發(fā)出各種新穎的AI應(yīng)用,這種集體智慧和協(xié)作開發(fā)模式極大地加速了創(chuàng)新的速度和多樣性。

此外,隨著開源平臺的逐漸強大,企業(yè)還可以通過提供增值服務(wù),如專業(yè)的數(shù)據(jù)分析、定制化的解決方案、高級功能解鎖等,向用戶收取費用;還可以與產(chǎn)業(yè)鏈上下游的企業(yè)進行合作,通過數(shù)據(jù)共享、聯(lián)合營銷、分成等模式實現(xiàn)互利共贏。

結(jié)尾:從短期來看,AI結(jié)合電商和教育的場景已被挖掘。從長期看,隨著底層模型的智能上限繼續(xù)被提升,其產(chǎn)生的增量空間將會更大。

從數(shù)科星球目前所看到的,一些電商賣家已不再需要“手模”(手部模特)、“腿?!绷?,其利用AI的背景替代功能就可取代這部分花銷。

更進一步地,打光、剪輯、導(dǎo)演和道具也都不需要了。

而在溫健看來,RunningHub這樣基于開源平臺的圖形音視頻AIGC應(yīng)用生態(tài)還有很大想象空間。“因為我們切切實實看到了,需求端非常龐大,而在未來只要供給能力加強,那么新的時代就會到來”,他對數(shù)科星球這樣說。

作者丨苑晶 編輯丨大兔;公眾號:數(shù)科星球(ID:digital-planet)

本文由 @數(shù)科星球 原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載

題圖來自 Pixabay,基于 CC0 協(xié)議

該文觀點僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 讓普通人也能輕松玩轉(zhuǎn)AI作圖,不用懂代碼,拖拖拽拽就能生成高質(zhì)量作品,還能賺錢,對很多設(shè)計小白來說都很友好

    來自北京 回復(fù)