直播亮點(diǎn)回顧:如何用大模型和實(shí)時(shí)音視頻構(gòu)建社交應(yīng)用?

0 評(píng)論 3361 瀏覽 10 收藏 11 分鐘

人人都是產(chǎn)品經(jīng)理 x 即構(gòu)科技聯(lián)合舉辦的“AI驅(qū)動(dòng)社交創(chuàng)新:如何利用大模型和實(shí)時(shí)音視頻構(gòu)建社交應(yīng)用”主題直播已圓滿結(jié)束,干貨滿滿,一起來(lái)看。

隨著大模型技術(shù)的不斷演進(jìn),AI應(yīng)用正迅速融入各行各業(yè),深入到實(shí)際應(yīng)用場(chǎng)景的探索與創(chuàng)新中。特別是在AI社交領(lǐng)域,產(chǎn)品經(jīng)理面臨著全新的機(jī)遇和挑戰(zhàn):他們迫切希望了解AI大模型技術(shù)如何重塑社交行業(yè)格局,AI如何改變?nèi)藗兊纳缃环绞脚c體驗(yàn),以及AI實(shí)時(shí)互動(dòng)技術(shù)將帶來(lái)哪些創(chuàng)新的社交應(yīng)用場(chǎng)景。

為了幫助產(chǎn)品經(jīng)理深入了解AI技術(shù)加持下的社交應(yīng)用,人人都是產(chǎn)品經(jīng)理與即構(gòu)科技共同舉辦了一場(chǎng)直播活動(dòng)。

8月28日,我們邀請(qǐng)了臉臉科技CTO@黎平,即構(gòu)科技資深產(chǎn)品經(jīng)理/AI業(yè)務(wù)負(fù)責(zé)人@孫靖昆作為嘉賓。他們圍繞社交AI陪伴、實(shí)時(shí)互動(dòng)數(shù)字人等話題,探討了如何利用大模型和實(shí)時(shí)音視頻技術(shù)構(gòu)建創(chuàng)新性的社交應(yīng)用。

一、圓桌互動(dòng)問(wèn)答

直播開始,兩位老師就活動(dòng)主題帶來(lái)了精彩的對(duì)談,著重討論了AI趨勢(shì)及其對(duì)社交行業(yè)創(chuàng)新發(fā)展的推動(dòng)作用,突出了AI實(shí)時(shí)互動(dòng)技術(shù)在客服、情感娛樂(lè)、文旅等領(lǐng)域的廣泛應(yīng)用前景。

以下是概要的問(wèn)答對(duì)話:

Q1:AI趨勢(shì)、大模型技術(shù)對(duì)社交行業(yè)賽道的影響有哪些?

孫靖昆老師:

第一種是,社交本身的AI化轉(zhuǎn)變,之前是人與人之間的社交,現(xiàn)在慢慢變成一些人與AI之間的社交;

第二種是,AI對(duì)于內(nèi)容創(chuàng)作和審核方面的新的東西,如定制化頭像、人設(shè)皮膚、在社交平臺(tái)上發(fā)的文本,視頻等;

第三種是,AI在語(yǔ)言翻譯中的應(yīng)用,AI翻譯技術(shù)促進(jìn)了跨文化社交,使得不同文化之間的用戶可以通過(guò)AI來(lái)做到很好的跨語(yǔ)種之間的社交溝通。

Q2:用戶在線上線下的不同行為特點(diǎn)和習(xí)慣?

黎平老師:

我們?cè)谶\(yùn)營(yíng)的過(guò)程中發(fā)現(xiàn)線上跟線下的用戶其實(shí)可以分為幾類。

  • 確定性消費(fèi):比方說(shuō)去買一個(gè)飛利浦剃須刀,這種用戶基本上不去京東,不閑逛,可能幾分鐘就已經(jīng)下單完成,下午可能就送到貨了。
  • 半確定性消費(fèi):就是比方說(shuō)想買剃須刀,但還沒(méi)確定是買什么牌子,還需要看性價(jià)比、看價(jià)格、看功能介紹。這些人就可能就去了天貓,去淘寶,去逛。
  • 不確定性消費(fèi):就比方說(shuō)在購(gòu)物中心,每天3到4萬(wàn),周末6到8萬(wàn)的流量,這些人其實(shí)并不知道要買什么。因此怎么去創(chuàng)造買點(diǎn)是非常重要的。需要通過(guò)互動(dòng)加娛樂(lè),去創(chuàng)造消費(fèi)。

Q3:在眾多實(shí)時(shí)互動(dòng)云服務(wù)品牌中,臉臉科技為什么選擇了即構(gòu)?決策背后的考量?

黎平老師:

第一個(gè)是,整個(gè)公司的體量規(guī)模,即構(gòu)算是一個(gè)老牌的資深的公司。

第二個(gè)是,看我們要發(fā)展的AI跟數(shù)字,和即構(gòu)公司的技術(shù)沉淀跟主要的方向是不是一致。

第三個(gè)就是,看服務(wù)質(zhì)量的響應(yīng)速度。在落地一些AI數(shù)字人,包括一些模型訓(xùn)練上,即構(gòu)的響應(yīng)速度還是很快,解決問(wèn)題的速度也很快。

Q4:雙方合作過(guò)程中,有沒(méi)有遇到哪些問(wèn)題,又是如何解決的?

黎平老師:

臉臉科技一直在做商業(yè)場(chǎng)景,最近跨界到了文旅場(chǎng)景,做了一些景點(diǎn)的數(shù)字人的活化,通過(guò)我們的3D屏呈現(xiàn)出來(lái)。

我們?cè)谖骱吷嫌刑K軾的數(shù)字人,選擇的是一個(gè)年紀(jì)大的演員形象,所以他有胡子。在數(shù)字人在處理的時(shí)候,胡子的飄逸還是蠻難的。

在跟即構(gòu)合作的過(guò)程中,也跟工程師一直在探討,怎么去把這個(gè)胡子這種飄逸感,很自然的感覺能呈現(xiàn)出來(lái)。

孫靖昆老師:

其實(shí)站在即構(gòu)的技術(shù)角度來(lái)看,像AI實(shí)時(shí)互動(dòng)這種場(chǎng)景的挑戰(zhàn)性還是蠻大的。

  • 第一個(gè)是,效果的自然程度。黎總的這個(gè)文旅場(chǎng)景,演員模特有個(gè)長(zhǎng)須,從AI視覺上來(lái)說(shuō),其實(shí)是一個(gè)很難處理的問(wèn)題。因?yàn)樗皇且粋€(gè)很連貫,在圖像拼接上有很大技術(shù)挑戰(zhàn)的事情。
  • 第二個(gè)是,聲音的自然程度。說(shuō)話的時(shí)候,受到的情緒感染,是不是自然?這個(gè)最直觀的影響因素就是聲音,他的音色好不好聽,停頓語(yǔ)氣怎么樣。
  • 第三個(gè)是,延遲方面,對(duì)話的延遲?;旧掀胀ㄓ脩舻母惺苁浅^(guò)2秒就不能夠正常對(duì)話了。我們?cè)谡麄€(gè)工程化的鏈路上,把語(yǔ)音轉(zhuǎn)文本大模型,延遲都?jí)嚎s到了極致,現(xiàn)在是做到了1.5秒內(nèi)。

Q5:雙方合作中,AI和數(shù)字人的應(yīng)用場(chǎng)景有哪些?為線下流量場(chǎng)景帶來(lái)了哪些價(jià)值?

黎平老師:

比方說(shuō)給品牌做AI櫥窗。像傳統(tǒng)意義上的服裝品牌在全國(guó)各地有幾千家。每次上新款,所有的模特都去換一遍,成本蠻高的。通過(guò)數(shù)字人的方式,一鍵就能夠把所有門店的數(shù)字化櫥窗都換掉。

第二個(gè)就是文旅場(chǎng)景,包括一些文化展廳,都用到了一些數(shù)字的活化。一個(gè)數(shù)字人,去介紹他們的特產(chǎn)、文化。還有準(zhǔn)備跟文化展廳合作的一些AI文創(chuàng)商店,去把一個(gè)人風(fēng)格化,最后面呈現(xiàn)紀(jì)念品上。

Q6:AI實(shí)時(shí)互動(dòng)技術(shù)還有哪些行業(yè)和場(chǎng)景中的創(chuàng)新應(yīng)用?能否分享一些例子?

孫靖昆老師:

從場(chǎng)景上來(lái)說(shuō),目前是有兩大類的場(chǎng)景是比較能夠跑通商業(yè)化的。

第一大類是客服場(chǎng)景。重點(diǎn)在于幫企業(yè)顧客去解決問(wèn)題,增強(qiáng)了顧客的體驗(yàn)的流程,包括語(yǔ)音的實(shí)時(shí)問(wèn)答,甚至視頻去服務(wù)客戶。

第二類是一些面向to c的場(chǎng)景。比如說(shuō)AI陪伴,大部分做的是智能體,或者叫一個(gè)仔仔的概念。用戶自己去寫人設(shè),上傳視頻或者圖片,捏出自己的仔仔。跟這個(gè)仔仔去聊天、視頻通話等等,來(lái)獲得情感需求。從商業(yè)的收入上來(lái)看,賺的是會(huì)員費(fèi),跟仔仔互動(dòng)過(guò)程中,隨著聊天越來(lái)越多,展開背后的更多的情節(jié)和故事。從數(shù)據(jù)上看,轉(zhuǎn)化的漏斗是蠻高的。每個(gè)用戶的粘性非常大,是付費(fèi)的中堅(jiān)力量。

即構(gòu)在這兩種場(chǎng)景下提供了非常完善的解決方案。包括數(shù)字人形象的云端API的解決方案,語(yǔ)音轉(zhuǎn)文本和文本轉(zhuǎn)語(yǔ)音的多模態(tài)大模型,RTC實(shí)時(shí)音視頻的推拉流的能力,幾行代碼快速調(diào)用IM對(duì)話聊天消息,提供了一個(gè)完整的AI實(shí)時(shí)互動(dòng)的解決方案。

更詳細(xì)的互動(dòng)問(wèn)答內(nèi)容,可以在直播當(dāng)中一睹為快:https://vip.qidianla.com/course/detail/n2kv8.html#description

二、RTC+AI,泛娛樂(lè)社交AI新場(chǎng)景探索與實(shí)踐

兩位嘉賓互動(dòng)結(jié)束后,孫靖昆老師還帶來(lái)了主題分享,內(nèi)容聚焦RTC+AI在泛娛樂(lè)社交領(lǐng)域的最新進(jìn)展和應(yīng)用。首先,介紹了實(shí)時(shí)音視頻技術(shù)與AI的結(jié)合如何推動(dòng)娛樂(lè)和陪伴場(chǎng)景的發(fā)展,并強(qiáng)調(diào)了AI陪伴作為行業(yè)的一個(gè)重要發(fā)展方向,及其在內(nèi)容生成、編輯和實(shí)時(shí)互動(dòng)等方面的應(yīng)用。

孫老師指出,數(shù)字分身技術(shù)通過(guò)提供個(gè)性化的AI陪伴,已經(jīng)改變了社交媒體用戶的交互模式,并創(chuàng)造了新的商業(yè)模式。AI陪伴產(chǎn)品主要通過(guò)訂閱會(huì)員、內(nèi)購(gòu)及廣告營(yíng)收三種方式盈利。此外,GPT技術(shù)通過(guò)減少語(yǔ)音交互的延遲,實(shí)現(xiàn)了多模態(tài)交互與情緒識(shí)別,大大提高了人機(jī)對(duì)話的真實(shí)性和流暢性。

此次,還介紹了即構(gòu)科技提供的面向應(yīng)用層開發(fā)者的AI陪伴一站式解決方案,旨在提供全方位的絲滑互動(dòng)體驗(yàn)。討論還包括了直播過(guò)程中的具體執(zhí)行細(xì)節(jié)和面臨的挑戰(zhàn),如音視頻設(shè)置、內(nèi)容編輯、畫面切換策略以及抽獎(jiǎng)流程的準(zhǔn)備等。深入探討了RTC+AI技術(shù)在社交娛樂(lè)領(lǐng)域的應(yīng)用現(xiàn)狀和未來(lái)發(fā)展趨勢(shì)。

還有更多的內(nèi)容因?yàn)槠邢薏蝗空归_啦,感興趣的同學(xué)戳鏈接進(jìn)行觀看:https://vip.qidianla.com/course/detail/n2kv8.html#description

掃碼添加小助手領(lǐng)取產(chǎn)品體驗(yàn)demo

更多精彩內(nèi)容,請(qǐng)關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號(hào)或下載App
評(píng)論
評(píng)論請(qǐng)登錄
  1. 目前還沒(méi)評(píng)論,等你發(fā)揮!