AI產(chǎn)品調(diào)研|數(shù)字人交互視頻創(chuàng)作類產(chǎn)品

0 評論 469 瀏覽 2 收藏 10 分鐘

“AI 驅(qū)動數(shù)字人創(chuàng)作,市場潛力待挖掘?!?隨著科技的飛速發(fā)展,數(shù)字人交互視頻創(chuàng)作領(lǐng)域日益受到關(guān)注。在 AIGC 等技術(shù)的助力下,數(shù)字人如何在企業(yè)服務(wù)中發(fā)揮作用?其市場現(xiàn)狀和發(fā)展前景又如何?本文將深入調(diào)研分析,為您揭開這一領(lǐng)域的神秘面紗。

隨著 AIGC、3D 建模、文生視頻等技術(shù)發(fā)展,虛擬數(shù)字人能夠通過智能交互協(xié)助企業(yè)進(jìn)行知識傳遞、互動問答、智能咨詢、產(chǎn)品推介、服務(wù)導(dǎo)覽等;相較于真人,有「及時反饋互動性高、全天候服務(wù)、個性化和定制化、跨文化跨語言傳播、成本低效益高」等優(yōu)勢。

本次調(diào)研圍繞「數(shù)字人交互視頻創(chuàng)作」領(lǐng)域,專注于分析其海外市場情況、競爭產(chǎn)品、客戶分析、可行性等。

一、行業(yè)背景

數(shù)字人交互視頻:指通過虛擬角色(數(shù)字人)與企業(yè)客戶進(jìn)行互動的一種視頻形式。由 AI、3D 建模、語音合成等技術(shù)驅(qū)動的數(shù)字人,通過模擬真實(shí)人的外貌、行為和語言,來參與品牌推廣和用戶互動,實(shí)現(xiàn)與用戶的深度溝通,提升品牌影響力和用戶體驗(yàn)。整體而言,數(shù)字人交互視頻所處于的完整數(shù)字人企業(yè)服務(wù)市場規(guī)模:市場規(guī)模 44 億美元、復(fù)合年增長率 37.9%。

核心應(yīng)用場景面向于互動式在線教育與培訓(xùn)、客戶服務(wù)與產(chǎn)品介紹、虛擬會議與客戶交流、個性化營銷與廣告、虛擬導(dǎo)覽與沉浸式體驗(yàn)、虛擬面試與招聘、健康咨詢與支持等。這些場景的內(nèi)容共性均為預(yù)置內(nèi)容確定、面向受眾的通用性強(qiáng),同時其服務(wù)屬性偏向于互動范圍基于預(yù)置內(nèi)容為主,角色屬性強(qiáng)烈的場景。

二、市場概述

首先明確本次調(diào)研的市場范圍:面向企業(yè)服務(wù)的海外數(shù)字人交互視頻創(chuàng)作類產(chǎn)品,既能支持?jǐn)?shù)字人講解 PPT、又能交互性問答。

2.1 主要參與者(海外)

同時補(bǔ)充下國內(nèi)主要參與者以及其他相關(guān)方向廠商(如互動式 PPT 講解):

2.2 市場現(xiàn)狀

主要參與者的企業(yè)經(jīng)營現(xiàn)狀中,從 2017-2024 陸續(xù)都有融資,金額約在千萬級別,正在從早期的市場驗(yàn)證向更大規(guī)模的運(yùn)營過渡,員工人數(shù)平均約在 50-100,收費(fèi)模式訂閱制為主、約幾十美元 / 月,同時,chatGPT 預(yù)估這些廠商的平均客戶為數(shù)百個、個別數(shù)千個。市面上暫無直接相關(guān)的投融資數(shù)據(jù),只有從側(cè)面進(jìn)行收集:Y Combinator 近 3 年,暫無數(shù)字人創(chuàng)投項(xiàng)目,有個別語音 / 文字對話項(xiàng)目;ProductHunt 上搜數(shù)字人相關(guān),基本也是以生成數(shù)字人視頻類對主;企查查上搜「虛擬人」「數(shù)字人」「人工智能 視頻」融資事件,面向本細(xì)分領(lǐng)域的較少。整體而言,數(shù)字人目前投融資不是非常熱門。

三、產(chǎn)品調(diào)研

經(jīng)過對以下7款產(chǎn)品的詳細(xì)調(diào)研:

有如下關(guān)鍵調(diào)研發(fā)現(xiàn):

1.需求范圍廣:

除了美國外,韓國、歐洲、新西蘭、以色列等國家均有類似產(chǎn)品涉及,說明需求覆蓋度相對全球化、通用化

2.核心產(chǎn)品形態(tài)和流程類似:

選擇創(chuàng)建方式(文本 / 圖片 / URL/PPT/PDF 或模板,來生成視頻)

進(jìn)入視頻配置頁:配置語音、語言、腳本、屏幕、手勢

視頻高級設(shè)置:配樂等

視頻導(dǎo)出 / 分享

3.產(chǎn)品能力區(qū)別在于:

聲音、語音、語言、AI 頭像支持的數(shù)量和質(zhì)量程度不同

個別有團(tuán)隊(duì)素材管理能力、利于團(tuán)隊(duì)管理

個別有更易分享到其他平臺的打通能力

4.3 種形態(tài)廠商側(cè)重點(diǎn)發(fā)現(xiàn):只能支持?jǐn)?shù)字人講解 PPT 視頻,不支持問答的產(chǎn)品:因?yàn)檎嫒酥皇莾?nèi)容一小部分,因此擬人程度較弱,更發(fā)力在內(nèi)容在多個維度的預(yù)置豐富程度上

只能支持?jǐn)?shù)字人交互性問答的產(chǎn)品:真人在內(nèi)容幾乎占全屏,擬人能力極強(qiáng)、支持高度定制化

二者都能支持,但功能是獨(dú)立的的產(chǎn)品:注重在數(shù)字人交互領(lǐng)域各種能力的豐富度,不僅有視頻生成,還有視頻翻譯(例如給一個中文真人視頻換上英文的口音和嘴形)等能力

四、核心需求

分析在以下3類場景中,教育培訓(xùn)與產(chǎn)品介紹整體實(shí)現(xiàn)門檻低、數(shù)字人需求訴求高;客戶服務(wù)數(shù)字人訴求一般、實(shí)現(xiàn)門檻高;內(nèi)容營銷數(shù)字人訴求高、模板 / 行業(yè)要求高。同時,數(shù)字人行業(yè)目前仍舊存在用戶對虛擬人的接受程度、企業(yè)定制化要求程度高的問題。

五、實(shí)現(xiàn)可行性

結(jié)論:核心技術(shù)不建議自研,調(diào)用現(xiàn)有開源技術(shù)初步實(shí)現(xiàn)難度不大,但是要定制和精細(xì)還是需要非常資深的相關(guān)技術(shù)。核心產(chǎn)品架構(gòu)參考:商湯如影平臺架構(gòu)圖(2024 大模型賦能下的 AI-2.0 數(shù)字人平臺白皮書_商湯科技_2024-1.pdf)

戴爾:利用 uneeq 數(shù)字人服務(wù)商搭建自己的數(shù)字人服務(wù)(戴爾 dell:設(shè)計(jì)指南 —— 企業(yè)中的生成式人工智能數(shù)字助理.pdf)

綜合前述調(diào)研,整體而言,鑒于市場的增長潛力和用戶真實(shí)存在的需求,該方向可行度較高。

在打法策略上,前期重點(diǎn)面向教育培訓(xùn)與產(chǎn)品介紹(擬人要求低、數(shù)字人訴求高),與教育機(jī)構(gòu)、企業(yè)服務(wù)提供商等建立合作,共同開發(fā)市場,后續(xù)再鋪開客戶服務(wù)(擬人技術(shù)要求高)、短視頻營銷(模板要求高、語音 / 語言 / 頭像等維度要求復(fù)雜)。

在具體實(shí)現(xiàn)上,技術(shù)可調(diào)用開源和現(xiàn)有技術(shù),開發(fā)既能支持?jǐn)?shù)字人講解 PPT、又能交互性問答的產(chǎn)品;但同時產(chǎn)品也需要上手難度要夠低、交互要夠簡單(因?yàn)槊嫦虻娜巳罕旧矶疾皇呛苌瞄L做相關(guān)配置的角色,是一種新的產(chǎn)品試用習(xí)慣培育過程)。

本文由人人都是產(chǎn)品經(jīng)理作者【冰冰醬】,微信公眾號:【冰冰醬啊】,原創(chuàng)/授權(quán) 發(fā)布于人人都是產(chǎn)品經(jīng)理,未經(jīng)許可,禁止轉(zhuǎn)載。

題圖來自Unsplash,基于 CC0 協(xié)議。

更多精彩內(nèi)容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 目前還沒評論,等你發(fā)揮!