VR 不完全科普指南
大家都了解VR是一種可以創(chuàng)建和體驗(yàn)虛擬世界的計(jì)算機(jī)仿真系統(tǒng),是利用計(jì)算機(jī)從而生成一種模擬環(huán)境,可以讓用戶沉浸到該環(huán)境中。下面這篇文章是筆者整理的關(guān)于VR的科普內(nèi)容,想要了解的同學(xué)可以進(jìn)來(lái)看一看。
一、上帝的畫筆
你有沒(méi)有想過(guò)創(chuàng)造一個(gè)世界?
或者,如果讓你當(dāng)創(chuàng)世神的話,你知道該怎么構(gòu)造這個(gè)世界嗎?
千百年來(lái),人類一直試圖回答這個(gè)問(wèn)題:用語(yǔ)言、用圖像、用視頻??墒沁€是不夠。我們從未能真正重現(xiàn)我們所感受的世界,只能憑借真實(shí)經(jīng)驗(yàn)的腦補(bǔ),將它們當(dāng)做真的而已。
媒介限制了我們對(duì)世界的描摹。
有沒(méi)有一種方式,能夠讓我們真正地拿起上帝的畫筆?
有一群人,試圖用 VR 給出答案。
VR 的歷史可以追溯至 20 世紀(jì) 60 年代,Philco (現(xiàn)被飛利浦收購(gòu))的兩位工程師 Charles Comeau 和 James Bryan 制造出了一款用于軍事目的頭戴式顯示器 HeadSight,該設(shè)備能夠顯示來(lái)自隔壁房間攝像頭的視頻畫面,攝像頭的位置可根據(jù)佩戴者的頭部移動(dòng)而移動(dòng),從而塑造出一種臨場(chǎng)感。
圖一,圖片來(lái)自 THE VR SHOP
作為人類歷史上的第一款量產(chǎn)頭戴式顯示器,Philco Headsight 的視場(chǎng)角僅有 40°,刷新率也僅有 10 Hz,而重量則是…未知。
60 余年過(guò)去了,早 Philco Headsight 五年的達(dá)特茅斯會(huì)議,經(jīng)歷過(guò)潮起潮落,終于在上一年迎來(lái)了它們最重磅的主角:ChatGPT。
而頭戴式設(shè)備也并非吳下阿蒙,空間定位、眼動(dòng)追蹤、手勢(shì)識(shí)別、Micro LED、Pancake 光學(xué)模組,硬件、算法與工程學(xué)的結(jié)合,讓上帝的畫筆呼之欲出。
接下來(lái),就讓我們進(jìn)一步走進(jìn) VR 的世界。
二、我們應(yīng)該如何呈現(xiàn)世界?
正如把大象塞進(jìn)冰箱需要三步,制造一臺(tái) VR 設(shè)備也是如此:
- 讓世界在我們的眼前呈現(xiàn)。
- 讓世界與我們進(jìn)行實(shí)時(shí)地交互。
- 把一切都塞到一臺(tái)頭戴式設(shè)備上,讓其獨(dú)立運(yùn)行。
我們先來(lái)談第一步。
讓世界在我們的眼前呈現(xiàn),這件事我們并不陌生,已然創(chuàng)造了一個(gè)賽博世界的我們,透過(guò)手機(jī)的屏幕,另一個(gè)世界的光映入眼中。把手機(jī)換成 VR 設(shè)備,道理也是一樣的:我們需要一塊屏幕,然后我們把屏幕的光映入眼中。
1. 一塊屏幕
我們需要一塊屏幕,以顯示另一個(gè)世界的豐富。古早的時(shí)候,因?yàn)榭粗?AMOLED 的色彩飽和度,VR 顯示屏用的都是 AMOLED,但 AMOLED 的像素密度低且難以提升,并且存在紗窗效應(yīng)(像素低導(dǎo)致的,人眼可以看到像素點(diǎn)),所以便更換成了 LCD 。
LCD 是液晶顯示屏,對(duì)比度、色域、亮度都不夠,同時(shí)刷新率低。為了改善 LCD,F(xiàn)ast-LCD 又被引入,顧名思義,F(xiàn)ast-LCD 采用了超速驅(qū)動(dòng)技術(shù),刷新率可以提升到 75-90 Hz,同時(shí)用了新的液晶材料,呈像效果上也有所改善。
但 Fast-LCD 仍然存在問(wèn)題,由于是背光技術(shù),不能自發(fā)光,需要有背光光源,所以面板上容易出現(xiàn)漏光現(xiàn)象。為了解決這個(gè)問(wèn)題,業(yè)內(nèi)通常采用 Fast-LCD + Mini LED 背光光源的方案,將 Mini LED 作為 Fast-LCD 的背光光源。Mini LED 實(shí)際上就是在背板上集成了尺寸更小的 LED 燈珠,所以亮度、對(duì)比度都會(huì)有所增強(qiáng)。
目前,F(xiàn)ast-LCD + Mini LED 背光光源已成為 XR 設(shè)備的主流方案, 但 Micro OLED 和 Micro LED 將是未來(lái)的探索方向。兩者都是自發(fā)光技術(shù),無(wú)需背光,無(wú)論從色域、亮度、對(duì)比度,還是功耗、分辨率等方面都領(lǐng)先其他方案。隨著Apple vision pro 采用 Micro OLED,Micro OLED 的發(fā)展將進(jìn)一步加速。
圖二,表格由 MicroDisplay 整理
2. 把光映入眼中
如果說(shuō)把手機(jī)的光映入眼簾,是一件再自然不過(guò)的事。VR 設(shè)備的光就有所講究了,從業(yè)者至少需要解決三個(gè)問(wèn)題:
- 近眼成像:視力正常者的最小物距(物體距離眼睛的距離)是 14 cm,而 VR 設(shè)備的屏幕物距僅 3-4 cm。
- 深度感知:VR 設(shè)備的屏幕呈現(xiàn)的是 2D 畫面,而沉浸式體驗(yàn)需要 3D 呈現(xiàn)。
- 視覺(jué)放大:VR 設(shè)備的屏幕僅為普通眼鏡大小,而 VR 畫面渲染需要與現(xiàn)實(shí)世界同等尺寸乃至更大。
乍聽起來(lái),三個(gè)問(wèn)題都如天方夜譚。然而受惠于神經(jīng)科學(xué)和認(rèn)知科學(xué)的發(fā)展,也得益于自托勒密時(shí)便興起的視錯(cuò)覺(jué)研究,看似無(wú)能為力的問(wèn)題亦都有了解法。
這都要從人的視覺(jué)機(jī)制說(shuō)起。
1)人眼的視覺(jué)機(jī)制
人眼是如何看到事物的?不妨以照相機(jī)作喻:人眼是凸透鏡成像,晶狀體是照相機(jī)鏡頭,視網(wǎng)膜是照相機(jī)膠片。
圖三,圖片來(lái)自網(wǎng)絡(luò)
物體光線從瞳孔進(jìn)入眼睛,經(jīng)由晶狀體(凸透鏡)折射,最終形成在視網(wǎng)膜上的倒立實(shí)像,經(jīng)由人腦的算法自行復(fù)為正位。
凸透鏡的成像原理,初中時(shí)都學(xué)過(guò),透鏡把平行光線匯聚于一點(diǎn),形成實(shí)像/虛像。近大遠(yuǎn)小實(shí)際上也是因?yàn)橥雇哥R的作用(經(jīng)過(guò)軸心的光線入射角減小,所以高度增加)。
圖四,表格來(lái)自均一教育
如圖所示,焦距固定,物距不同時(shí),成像的距離也有所不同。當(dāng)物距小于焦距時(shí),物體成虛像,也就是放大鏡的功效。
圖五,圖像來(lái)自百度百科
2)凸透鏡的作用
運(yùn)用凸透鏡成像的規(guī)律,把光映入眼中的其中兩個(gè)難題就可以解了。根據(jù)上圖可得,當(dāng)物體放置到透鏡的一倍焦距內(nèi),便會(huì)在一倍焦距到二倍焦距之間形成一道正立放大的虛像。
什么是虛像呢?即物體的光經(jīng)過(guò)反射而映入眼中的,光與光之間不能形成交匯,但人眼下意識(shí)覺(jué)得光是直線傳播的,所以會(huì)自動(dòng)反向延長(zhǎng)光線,使其交匯于一點(diǎn),從而形成虛像。
圖六,圖片來(lái)自光學(xué)影像與鏡頭
VR 的原理和人眼一樣,利用了凸透鏡的作用。通過(guò)在人眼和屏幕間放置一塊凸透鏡,屏幕放置于透鏡的一倍焦距內(nèi),使其在 2 倍焦距出形成了屏幕內(nèi)容的虛像,根據(jù) B 站 Up 主消失的模因推算,大概是 280 英寸的巨幕大屏。
圖七,圖片來(lái)自 Up 主消失的模因視頻截圖
由于凸透鏡的作用,屏幕的成像距離也被調(diào)整,如 Quest 2 的像距在 1.3 m,已經(jīng)能夠滿足人眼的觀看范圍了。
不過(guò),由圖六可知,人眼與透鏡、透鏡與屏幕間,都需要保持合適的距離。如果透鏡離人眼過(guò)近,像距也會(huì)被拉近,從而不能滿足人眼的觀看范圍。如果透鏡過(guò)遠(yuǎn)(仍要小于焦點(diǎn)),那整個(gè)設(shè)備的體積又會(huì)增大。
透鏡的距離也影響著 FOV 的大小。這里要再稍微解釋下 FOV 的概念,一般我們所談?wù)摰亩际撬?FOV(field of view),是指屏幕被透鏡折射,最頂部和最底部的兩道光線射入人眼所形成的夾角。
FOV 越大,人在屏幕中所看到的虛擬視野就越大。但問(wèn)題在于,想要增加 FOV,要么把透鏡后移,讓其更靠近人眼,或者增加鏡片的厚度。透鏡后移,會(huì)導(dǎo)致像距被拉近,不能滿足人眼的觀看需求;增加鏡片厚度,又會(huì)導(dǎo)致設(shè)備整體過(guò)重,并且同樣的,像距依然會(huì)有問(wèn)題。
實(shí)際上,F(xiàn)OV 并不是越大越好?,F(xiàn)實(shí)世界中,人正常聚焦的視野范圍一般在 110°,如果物體出現(xiàn)在 110° 外,人一般要轉(zhuǎn)頭去看,增加疲勞度。所以,只要保證 FOV 在 110° 左右,其實(shí)也就夠了。
另一方面,透鏡所呈現(xiàn)的放大版屏幕,實(shí)際上是原來(lái)屏幕的投射,屏幕分辨率是沒(méi)有變的,F(xiàn)OV 越大,對(duì)屏幕分辨率要求就越高,差的屏幕甚至能看到像素點(diǎn)。從工程學(xué)而言,找到 FOV 同屏幕、透鏡厚度、設(shè)備整體尺寸的平衡關(guān)系,才是實(shí)際的難點(diǎn)。
3)透鏡的演變
在實(shí)際工程中,透鏡的演變,或者說(shuō) VR 中光學(xué)方案的演變,大體可以從非球面鏡片到菲涅爾鏡片,再到 pancake 折疊光路。
圖八,圖片來(lái)自網(wǎng)絡(luò)
一般的球面鏡片,鏡面各處曲率相同,所以光從鏡片折射出來(lái),會(huì)聚焦在不同的位置,也因此導(dǎo)致模糊和外圍失真的情況,這種現(xiàn)象被稱為球面像差;非球面鏡片就是在球面鏡片的基礎(chǔ)上,改變表面的曲率,使得折射出來(lái)的光能夠匯聚在一點(diǎn)上。這樣,球面像差的問(wèn)題就能得到緩解或消除;但非球面鏡片有個(gè)問(wèn)題,它太重了。
于是菲涅爾鏡片被搬到了 VR 中,簡(jiǎn)單來(lái)說(shuō),透鏡的主要作用是為了折射光線,而透鏡中存在一部分區(qū)域不折射光線,既然如此,直接把這部分拿掉,也完全不影響透鏡的功能。菲涅爾憑著這樣的方式,減了一波重量。
但菲涅爾鏡頭各處曲率不變,焦距無(wú)法進(jìn)一步被壓縮,整體仍然較重,VR 眼睛也無(wú)法做得輕??;同時(shí)由于曲面不連續(xù),成像精度受限。非球面和菲涅爾鏡頭,都是采用平行光路的方案(光從透鏡中透出,進(jìn)入人眼)。想要再輕薄,目前最佳的實(shí)踐是采用折疊光路(拉近焦距,通過(guò)多重反射進(jìn)入人眼,既縮小焦距又保證成像)。
pancake 的名字也反映出了它的結(jié)構(gòu),就是像餅干一樣的四層鏡片(各家有不同,如果用 micro led 會(huì)有五層),它的光學(xué)原理不必深究(反正也搞不懂),只需記住它的解決方案是通過(guò)折疊光路使得焦距近一步被壓縮。
焦距被壓縮,其實(shí)不單改變厚度,也改變了視場(chǎng)角,近大遠(yuǎn)小,焦距變短,那視場(chǎng)角就會(huì)變大。當(dāng)然這只是理論上的(理論上限 pancake 可達(dá) 200°),現(xiàn)實(shí)中由于工藝的問(wèn)題,pancake 方案的視場(chǎng)角還沒(méi)有菲涅爾廣,在 60 – 90° 之間,而菲涅爾可以達(dá)到 100° 左右,當(dāng)然,離人眼的 120° 還有一段距離。
當(dāng)然,pancake 也有自己的問(wèn)題,因?yàn)橛袃纱畏瓷涞脑颍碚撋?pancake 的入射光線亮度只有一開始的 25%,這就要求光源本身得很亮。
同時(shí)由于多路反射,容易出現(xiàn)鬼影的情況,對(duì)工藝要求很高。但這些都是可解決的問(wèn)題,平行光路有它的上限,如果要塑造沉浸感 + 便攜的設(shè)備,折疊光路還是更好的方案。
由于 pancake 「損光」的特性,屏幕亮度就顯得尤為重要,目前主流的搭配仍然是 Fast LCD + Mini LED 背光+ Pancake,但更理想的方式是 Micro OLED + Pancake,相比于傳統(tǒng) LCD 的 500 尼特亮度,Micro OLED 的亮度可達(dá) 1000-6000 尼特。
另外值得一提的是,既然是折射,畫面一定會(huì)失真?,F(xiàn)行的光學(xué)方案都是先讓屏幕中顯示的畫面先失真(桶形畸變),再通過(guò)透鏡折射恢復(fù)正常(透鏡會(huì)通過(guò)枕形畸變將桶形畸變的圖像恢復(fù)正常)。
圖九,圖片來(lái)自 POMEAS
4)沉浸感的實(shí)現(xiàn)
如果說(shuō)凸透鏡解決了近眼成像和視覺(jué)放大的問(wèn)題,那么還留存著一個(gè)尚待解決的問(wèn)題:深度感知。這也是實(shí)現(xiàn) VR 沉浸感的關(guān)鍵。
解決方案其實(shí)再簡(jiǎn)單不過(guò),只需在透鏡前放置兩塊屏幕(或一塊屏幕隔成兩塊),分別呈現(xiàn)同一圖像的不同成像角度即可。
圖十,圖片來(lái)自網(wǎng)絡(luò)
人眼是個(gè)非常神奇的存在,本質(zhì)上當(dāng)我們看向三維物體時(shí),左右眼看到的其實(shí)是同一物體的不同角度的平面成像圖像。當(dāng)兩種不同角度的圖片到達(dá)人腦后,人腦內(nèi)置的視覺(jué)算法可以自動(dòng)將兩張平面圖片合成一張立體圖片。
VR 成像,由于所有的內(nèi)容都只呈現(xiàn)在屏幕上,而屏幕是平面的,所以無(wú)法像真實(shí)的三維物體一樣,由于視差(兩眼看到的角度差異)的存在而感受到立體感。所以,一不做二不休,干脆在兩塊屏幕上呈現(xiàn)同一物體的不同成像畫面,利用大腦的自動(dòng)合成功能,模擬立體感知。
雖然,雙目視差的機(jī)制讓 VR 眼鏡能夠模擬三維影像的立體感。但沉浸感除了立體,還有對(duì)于深度信息的感知。簡(jiǎn)言之,怎么區(qū)分物體離我們的距離。
5)遠(yuǎn)近感知
人眼感知世界的方式,主要依靠四種機(jī)制:
- 雙目匯聚(vergence)
- 雙目視差
- 單眼調(diào)節(jié)(Accommodation)
- 大腦補(bǔ)充
其中,雙目匯聚、單眼匯聚和大腦補(bǔ)充都能幫我們感知到世界的遠(yuǎn)近信息。在日常感知中,大腦補(bǔ)充其實(shí)是最為常見的體驗(yàn),因?yàn)槲覀冊(cè)谟^看視頻時(shí),視頻畫面本身是 2D 的,可我們卻能從中判斷出物體的遠(yuǎn)近,很重要的原因就是大腦補(bǔ)充。
大腦補(bǔ)充,簡(jiǎn)言之即人腦根據(jù)經(jīng)驗(yàn)的總結(jié),通過(guò)一些畫面線索進(jìn)行的距離判斷,比如近大遠(yuǎn)?。▽W(xué)名仿射)、遮擋關(guān)系(近處遮擋遠(yuǎn)處)、光照陰影、紋理差異、先驗(yàn)知識(shí)(比如飛機(jī)和風(fēng)箏同樣大,但飛機(jī)比風(fēng)箏遠(yuǎn))。這些知識(shí)學(xué)過(guò)畫畫的同學(xué)不會(huì)陌生。
雙目匯聚(vergence),簡(jiǎn)單理解,是指兩只眼睛看向同一物體,這個(gè)過(guò)程需要轉(zhuǎn)動(dòng)眼球肌肉,使得雙眼聚焦同一物體。當(dāng)物體靠近或遠(yuǎn)離眼睛時(shí),匯聚角(圖中所示的夾角)也會(huì)變大縮小,同時(shí)眼部肌肉會(huì)收縮或放松。也即,通過(guò)感知匯聚角的范圍和睫狀肌的緊張程度,人眼可以分辨物體的遠(yuǎn)近。
圖十一,圖片來(lái)自 Relative contributions to vergence eye movements of two binocular cues for motion-in-depth
單眼調(diào)節(jié)(Accommodation):眼睛依靠睫狀肌進(jìn)行聚焦控制,越靠近人眼的物體,成像會(huì)越模糊,通過(guò)模糊程度判斷物體的遠(yuǎn)近。當(dāng)眼睛聚焦在近處物體時(shí),遠(yuǎn)處物體會(huì)模糊;相反,當(dāng)聚焦在遠(yuǎn)處物體時(shí),近處物體會(huì)模糊。
單眼匯聚只依靠單眼即可判斷,一個(gè)典型的實(shí)驗(yàn)是:閉上一只眼睛,左右手分別豎起一只手指,與眼睛呈一條直線。當(dāng)眼睛聚焦于近處手指時(shí),遠(yuǎn)處手指模糊;反之亦然。本質(zhì)上,單眼匯聚和雙目匯聚是一體兩面的存在,前者告訴大腦物體離人眼的絕對(duì)距離,后者告訴大腦雙眼視線形成的絕對(duì)角度,兩者都是在物理上可測(cè)量的。
VR 中的遠(yuǎn)近信息傳遞,主要運(yùn)用了大腦補(bǔ)充,但因?yàn)槠聊坏木嚯x是固定的,透鏡的距離也是固定的(pancake 之前),所以雙目匯聚和單眼匯聚的信息是缺失的,而這也直接導(dǎo)致了所謂的 VAC 問(wèn)題。
在真實(shí)世界中,人眼的匯聚距離和調(diào)節(jié)距離應(yīng)該是一致的(觀看遠(yuǎn)處物體時(shí),眼睛聚焦到遠(yuǎn)處;觀看近處物體時(shí),眼睛聚焦到近處),反映在物理層面則是控制眼球轉(zhuǎn)動(dòng)的眼部肌肉和控制聚焦的睫狀肌同步運(yùn)動(dòng) 。但 VR 中,由于像距是固定的,因此無(wú)論觀看畫面中的遠(yuǎn)處或近處物體,眼睛都只能聚焦到屏幕上,這時(shí),雙眼肌肉與睫狀肌便不再同步了。
圖十二,來(lái)自維基百科
一般而言,有兩種方式解決 VAC 問(wèn)題。一種是光場(chǎng)技術(shù), VAC 的本質(zhì)是由于屏幕不含深度信息,而采用腦補(bǔ)的方式進(jìn)行模擬,從而導(dǎo)致了眼部肌肉與睫狀肌的不協(xié)調(diào)。
那如果讓屏幕發(fā)出的光,一開始就不相同(比如畫面中的遠(yuǎn)景發(fā) A 光,近景發(fā) B 光),人眼就可以獲得深度信息,問(wèn)題就得以解決了。另一種方式是通過(guò)可變焦距 + 眼動(dòng)追蹤解決(第三部分會(huì)詳述)。
眼動(dòng)追蹤確定用戶的注意焦點(diǎn),通過(guò)可變焦距實(shí)時(shí)改變焦點(diǎn)處的焦距,進(jìn)而改變成像距離,使得會(huì)聚距離與調(diào)節(jié)距離保持一致。
目前光場(chǎng)技術(shù)還不成熟,而業(yè)內(nèi)已采用的 pancake 方案可以實(shí)現(xiàn)多重變焦,有望在第二種方案上實(shí)現(xiàn)突破。
三、世界應(yīng)該如何與我們交互?
以上我們所討論的僅僅是靜態(tài)的呈現(xiàn),而真實(shí)世界是動(dòng)態(tài)的,我們每時(shí)每刻都在與世界本身交互。因此,盡管靜態(tài)的 VR 世界已經(jīng)如此龐大,我們?nèi)匀徊荒芡O聛?lái),駐足欣賞此刻的成果,更艱難的事情在于從照片到影像的躍升。請(qǐng)繼續(xù)保持耐心。
1. 空間定位
試想,當(dāng)我們觀察現(xiàn)實(shí)世界上,我們會(huì)移動(dòng),轉(zhuǎn)頭,于是我們看到事物的不同角度和大小。當(dāng)我們靠近,聲音變強(qiáng),畫面變大;當(dāng)我們遠(yuǎn)離,聲音減弱,畫面變?。划?dāng)我們圍繞物體,則看到它的側(cè)面。正是詩(shī)中所言:橫看成嶺側(cè)成峰,遠(yuǎn)近高低各不同。
有一個(gè)專業(yè)術(shù)語(yǔ),DOF(degrees of freedom),用于衡量人活動(dòng)的尺度。如果把空間分為 X,Y,Z 軸,則一共可以包括六種移動(dòng)方式:沿 X、Y、Z 平移;沿 X、Y、Z 旋轉(zhuǎn)。
所謂的 6DOF,其實(shí)便是指包含這六種情況的活動(dòng)類型。
圖十三,圖片來(lái)自網(wǎng)絡(luò)
VR 空間中,本質(zhì)上所有的信息都只是投射在眼前兩塊屏幕上的平面信息,遠(yuǎn)近、側(cè)面并不存在。所以它其實(shí)是模擬用戶發(fā)生相應(yīng)活動(dòng)后的視覺(jué)呈現(xiàn)效果,直接投射如人眼。
比如當(dāng)人靠近某個(gè)物體,屏幕畫面會(huì)放大;轉(zhuǎn)頭就能觀察整個(gè)空間的全景,不是用戶真的來(lái)到另一片空間,而是算法根據(jù)用戶的當(dāng)前活動(dòng)判斷,并進(jìn)行實(shí)時(shí)渲染。
目前的算法,主要是以頭盔的活動(dòng)情況為標(biāo)準(zhǔn),通過(guò) IMU 和追蹤攝像頭進(jìn)行空間定位??臻g定位是 VR 的核心之一,因此有必要具體闡述。
1)IMU
IMU,全稱為 Inertial Measurement Unit,翻譯為慣性測(cè)量單元,一般指測(cè)量物體角速率和加速度的裝置。我們經(jīng)??吹?,一個(gè)名詞 MEMS 與 IMU 伴隨出現(xiàn)。
MEMS 全稱 Microelectromechanical Systems,翻譯為微機(jī)電系統(tǒng)傳感器,指內(nèi)部結(jié)構(gòu)在微米級(jí)別的傳感器。
MEMS 有很多種,比如 MEMS 加速度計(jì)、MEMS 陀螺儀。
MEMS 和 IMU 是兩個(gè)獨(dú)立的概念,并不存在包含關(guān)系,不過(guò)兩者存在交集。比如上面提到的 MEMS 加速度計(jì) 和 MEMS 陀螺儀,既屬于 MEMS ,也屬于 IMU。
一般而言,IMU 又包含三種傳感器:加速度計(jì)、陀螺儀和磁力計(jì)。
- 加速度計(jì): 一般為三軸加速度計(jì),檢測(cè)物體在 X、Y、Z 三軸上的加速度,經(jīng)過(guò)積分換算,從而確定位移距離(實(shí)際上這樣確定位移不太準(zhǔn),加速度計(jì)算位移是靠積分換算,本身就有誤差,多次積分會(huì)導(dǎo)致誤差累計(jì),最終的位移距離會(huì)出現(xiàn)漂移)。
- 陀螺儀: 一般為三軸陀螺儀,檢測(cè)物體在 X、Y、Z 三軸上的角速度,根據(jù)角速度推算物體當(dāng)前的角度。
- 磁力計(jì):? 又稱電子羅盤,一般為三軸磁力計(jì),檢測(cè)物體在 X、Y、Z 上的磁分量,計(jì)算得到最終的磁向量,經(jīng)過(guò)算法糾偏,最終得到地磁北的方向,從而確定物體的所在方向。
市面上的一些叫法,如六軸陀螺儀,其實(shí)是三軸加速度計(jì)+三軸陀螺儀;九軸陀螺儀,則是三軸加速度+三軸陀螺儀+三軸磁力計(jì);十軸陀螺儀,是在九軸陀螺儀的基礎(chǔ)上再加一個(gè)氣壓傳感器,獲得海拔高度,從而獲得物體的高度。
在 VR 的應(yīng)用場(chǎng)景中,一般采用九軸陀螺儀,實(shí)現(xiàn) 3DOF 的檢測(cè)(Roll 、Picth、Yaw 三種動(dòng)作,見圖十二)。
但光靠 IMU 無(wú)法檢測(cè)到平移的動(dòng)作(沿三軸平移),一般還需要輔助攝像頭等其他設(shè)備。
2)追蹤攝像頭
這里要談到技術(shù)路徑的演變,最早的平移定位,采用的是外部定位方式,直到一體機(jī)的風(fēng)潮愈烈和 SLAM(空間定位算法)的發(fā)展,才漸漸轉(zhuǎn)為內(nèi)部定位。不過(guò)在一些要求超高精度的環(huán)境下(比如虛擬場(chǎng)館或動(dòng)捕),都還是采用外部定位的方法。
技術(shù)路徑的演變,從 Outside-in 到 Inside-out。
本質(zhì)的區(qū)別,Outside-in 是在外界空間中有一套錨定的裝置,構(gòu)建一個(gè)相對(duì)坐標(biāo)系。通過(guò)裝置與 VR 設(shè)備的互動(dòng),檢測(cè)頭盔和手柄的當(dāng)前位置。在由外而內(nèi)的系統(tǒng)中,多個(gè)固定的外部攝像頭用于跟蹤頭戴顯示設(shè)備的姿勢(shì)(3D位置和3D方向)。外部攝像頭跟蹤位于頭戴顯示設(shè)備和控制器(如果有)上的一組參考點(diǎn)。
Inside-out,是依靠光學(xué)追蹤,在 VR 頭盔上安置攝像頭,讓設(shè)備自己檢測(cè)當(dāng)前外部環(huán)境的變化,再經(jīng)過(guò) SLAM 算法(Simultaneous localization and mapping)計(jì)算出當(dāng)前的空間位置。
Outside-in
Outside-in 路徑中,最有名的有兩種技術(shù)方向:- Cculus 的 Constellation 紅外攝像頭定位系統(tǒng);- HTC 的 Lighthouse 定位;先說(shuō) Constellation,Oculus 的頭盔和手柄上都布滿了紅外傳感,以固定模式閃爍。
房間中布置了紅外攝像機(jī),攝像機(jī)以特定頻率拍攝頭盔和手柄,由此得到一組圖片,并得到這些紅外的點(diǎn)的特定坐標(biāo),由于頭盔和手柄的三維模型是已知的,通過(guò) Pnp 求解(可以理解為一種復(fù)雜的數(shù)學(xué)計(jì)算)能夠得到點(diǎn)的 6 DoF(加上 IMU 后)。
圖十四,圖片來(lái)自 GamesBeat
至于用紅外,則因紅外波可以規(guī)避大部分顏色的影響,不會(huì)出現(xiàn)誤判。但紅外容易被遮擋,所以在空間中要布置多臺(tái)紅外攝像機(jī),才能準(zhǔn)確判斷三維信息。實(shí)際上,Optitrack 和 Zero Latency 用的都是同樣的方案,只不過(guò) Zero Latency 用的是可見光,更容易受到顏色等噪聲干擾。
主動(dòng)式紅外光( Constellation)主要受到攝像頭精度(因?yàn)楦鶕?jù)圖像判斷)和光學(xué)算法的影響,同時(shí)價(jià)格昂貴,布置也比較麻煩,在移動(dòng)浪潮下不太適用了。
另一種則是 Lighthouse 定位,室內(nèi)安置了兩臺(tái)激光發(fā)射器,安放在房間對(duì)角,而在頭顯和手柄上有 70 多個(gè)光敏傳感器。激光發(fā)射器從水平和垂直方向掃射空間,發(fā)射器為 0 度時(shí),開始計(jì)時(shí),激光到光敏傳感器時(shí),光敏傳感器記錄到達(dá)時(shí)間。由于發(fā)射器的旋轉(zhuǎn)速度是已知的,所以根據(jù)時(shí)間和轉(zhuǎn)速能夠計(jì)算光敏傳感器相對(duì)發(fā)射器的角度,一次掃描完成后,就可以進(jìn)行空間定位。
圖十五,圖片來(lái)自 HTC VIVE LIGHTHOUSE CHAPERONE TRACKING SYSTEM EXPLAINED 視頻截圖
相比紅外,Lighthouse 的方法方便很多,沒(méi)有那么多光學(xué)計(jì)算,誤差和延時(shí)都有所保證,可以達(dá)到 20ms 以內(nèi)。但激光掃描區(qū)域一般在 5 * 5 * 2 m 范圍內(nèi),如果要擴(kuò)大,需要多個(gè)燈塔,這時(shí)候多空間的融合又會(huì)出現(xiàn)算法問(wèn)題。為了實(shí)現(xiàn)定位,光敏傳感器需要區(qū)分不同來(lái)源的激光,而光塔過(guò)多也會(huì)相互干擾。
另外,Lighthouse 在安裝和成本上仍然要比 inside-out 高,但延時(shí)性低,精度高,在需要特別擬真的環(huán)境仍然需要這種技術(shù)。
Inside-out
Inside-out,主要通過(guò)攝像頭拍攝周圍的畫面,通過(guò)圖像識(shí)別判斷房間景物的一些特征點(diǎn),通過(guò)與上一次拍攝時(shí)的特征點(diǎn)位置進(jìn)行對(duì)比,從而得到特征點(diǎn)的位移。與此同時(shí)借助 IMU 得到輔助數(shù)據(jù),通過(guò)算法得到頭顯的位移情況。同樣,在手柄上存在一些小白點(diǎn),攝像頭也通過(guò)捕捉小白點(diǎn)的位移判斷手柄的變化情況。
因?yàn)槭强梢姽庾R(shí)別,所以房間內(nèi)得保持一定的亮度,不能關(guān)燈。
此外,因?yàn)橐揽繑z像頭識(shí)別外部的標(biāo)記點(diǎn),如果角度識(shí)別精讀差異 1 度,整個(gè)距離可能偏移幾厘米,Inside-out 對(duì)精度要求十分之高。又由于需要計(jì)算圖像顯示,所以它的延時(shí)沒(méi)有辦法像 Lighthouse 一樣低。
Inside-out 主要依靠 VGA 攝像頭和深度識(shí)別攝像頭進(jìn)行 3D 空間定位。VGA 攝像頭,配合深度識(shí)別攝像頭,主要用來(lái)做頭部空間定位和手勢(shì)識(shí)別。VGA 是指的 VGA 格式的分辨率,640X480 ,黑白。深度識(shí)別攝像頭,主要用來(lái)識(shí)別物體的距離(實(shí)際上也可以識(shí)別骨骼點(diǎn),但不需要),主要有三種技術(shù):
- TOF:原理是傳感器發(fā)出經(jīng)調(diào)制的近紅外光,遇物體后反射,通過(guò)計(jì)算光線發(fā)射和反射時(shí)間差或相位差來(lái)?yè)Q算被拍攝物體的距離。
- 單目結(jié)構(gòu)光:該技術(shù)將編碼的光柵或線光源等投射到被測(cè)物上,根據(jù)它們產(chǎn)生的畸變來(lái)解調(diào)出被測(cè)物的三維信息。
- 雙目結(jié)構(gòu)光:和人眼一樣用兩個(gè)普通攝像頭以視差的方式來(lái)計(jì)算被測(cè)物距離。
2. 面部、眼動(dòng)和手勢(shì)追蹤
有了空間定位,VR 可以實(shí)時(shí)渲染出對(duì)應(yīng)的畫面結(jié)果。然而人不止和世界交互,也要和人交互。試想,如果我們想要在虛擬空間中同家人,親朋好友交流,那么我們勢(shì)必需要看到他們的神情,這其中最重要的便是面部表情和眼神。
圖十六,圖片來(lái)自 MARK ZUCKERBERG: FIRST INTERVIEW IN THE METAVERSE | LEX FRIDMAN PODCAST 視頻截圖,圖為 ZUCKERBERG 和 FRIDMAN 在 VR 世界中的面部重建
1)面部識(shí)別
面部識(shí)別主要靠攝像頭,放在頭顯內(nèi)部,追蹤如額頭、下巴、臉頰的變化情況,追蹤原理和空間定位差別不大。一般可以用在如下的場(chǎng)景下:
- 表情同步
- 面部重建
- 疲勞識(shí)別
- 情緒識(shí)別
- 用戶身份識(shí)別
面部識(shí)別存在的問(wèn)題是,當(dāng)戴上頭顯時(shí),人臉 60% 的地方是被遮住的。Magic Leap 的想法是,雖然有的地方被遮住,但可以根據(jù)周圍未被遮住的肌肉變化來(lái)推測(cè)。當(dāng)然,越多的攝像頭還是更有助于捕捉真實(shí)表情。
Oculus 在訓(xùn)練面部識(shí)別時(shí),用了 9 顆攝像頭,只是到了消費(fèi)級(jí),才用 3 顆攝像頭并配合 9 顆攝像頭訓(xùn)練出來(lái)的算法進(jìn)行面部追蹤。
2)眼動(dòng)追蹤
眼部追蹤主要靠眼動(dòng)追蹤攝像頭。眼動(dòng)追蹤的原理是利用光攝入瞳孔反射到角膜的原理,測(cè)算角膜和瞳孔的距離來(lái)判斷眼動(dòng)的情況。VR 的眼部周圍有一圈紅外光 LED 燈,向眼睛發(fā)射紅外光,光從瞳孔反射到角膜上,攝像頭拍攝圖像,判斷瞳孔和角膜的位置,從而判斷眼動(dòng)的情況。
眼動(dòng)追蹤帶來(lái)的益處很多,除了眼神與渲染的人物同步,最熟知的是眼動(dòng)交互,和手勢(shì)交互一起可以帶來(lái)自然的交互體驗(yàn)。另一個(gè)重要的好處在于,人類的視力在整個(gè)視野中并不均勻。中央凹是視網(wǎng)膜的中心區(qū)域,視力最好。
在中央凹區(qū)域外,視力逐漸下降到視網(wǎng)膜邊緣。這樣,實(shí)際上畫面的渲染只需要關(guān)注到視線聚焦處,這樣可以降低計(jì)算渲染成本。此外,有了眼動(dòng)追蹤后,VR 的瞳距可以根據(jù)佩戴者的身份自動(dòng)調(diào)節(jié);在運(yùn)營(yíng)層面,可以根據(jù)眼睛聚焦情況進(jìn)行數(shù)據(jù)分析。
還有一個(gè)隱藏的好處,主要是體驗(yàn)層面。VR 中的 3D 成像效果,是通過(guò)向每只眼睛顯示一個(gè)獨(dú)特的 2D 圖像來(lái)創(chuàng)造 3D 感覺(jué),其中每個(gè)圖像的渲染略有不同,以產(chǎn)生雙眼視差,從而帶來(lái) 3D 效果。
但是,用戶眼睛和圖像之間的距離(也即顯示屏與人眼的距離)是固定的,所以實(shí)際上會(huì)導(dǎo)致眩暈問(wèn)題,也就是所謂的視覺(jué)匯聚調(diào)節(jié)沖突(VAC)。通過(guò)眼動(dòng)追蹤 + 變焦顯示器,VAC 可以得到緩解。
變焦顯示器使用眼動(dòng)追蹤來(lái)主動(dòng)跟蹤眼睛的會(huì)聚,并使用具有可變焦距的聚焦元件來(lái)匹配眼睛的會(huì)聚。至于變焦技術(shù),主要是機(jī)械式變焦(電動(dòng)齒輪,改變鏡頭和物體、視線焦點(diǎn)的距離)。
3)手勢(shì)識(shí)別
有了面部表情和眼動(dòng)追蹤外,我們還需要手勢(shì)識(shí)別,以進(jìn)一步與虛擬世界交互,比如拾取、點(diǎn)擊,或只是簡(jiǎn)單的 say hello。手勢(shì)識(shí)別所用的攝像頭和空間定義一致,都是 VGA 攝像頭,識(shí)別原理類似。
手勢(shì)識(shí)別主要的難點(diǎn)在于:一般攝像頭的視場(chǎng)角都講究水平,垂直視場(chǎng)角的高度不夠,所以手跑到攝像頭的視線范圍之外就很難辦。而在人類大部分的自然任務(wù)中,手都是處于下視野的范圍,手勢(shì)追蹤的實(shí)際難度會(huì)很大。
另外,根據(jù)對(duì)照實(shí)驗(yàn),采用手勢(shì)追蹤的任務(wù)效率,會(huì)低于直接用手部控制器的方式,一是因?yàn)檠訒r(shí),二是因?yàn)榧兪謩?shì)交互缺乏觸覺(jué)提示和反饋,而人需要后兩者以定位操作對(duì)象。Apple vision Pro 通過(guò)手眼融合的方式,提供了一種視覺(jué)反饋,變相彌補(bǔ)了下純手勢(shì)交互的問(wèn)題。
此外,它還配了六顆攝像頭(一般是 4 顆),其中兩顆專門垂直向下以捕捉下視野的手。
4)全彩透視
如果說(shuō)空間定位和面部、眼動(dòng)追蹤是與虛擬世界交互。那么 VR 很快有了一個(gè)更大的野心:升級(jí)成 XR,捕捉現(xiàn)實(shí)世界的動(dòng)態(tài)。全彩透視,使用 VST RGB 攝像頭,用于捕捉帶著 VR 頭盔的用戶所看到的真實(shí)景象。VST 指 vedio see through,RGB 是圖片顏色格式。
VST 原先都是黑白的,用來(lái)看周圍空間,現(xiàn)在成了 MR 的入門券。無(wú)心插柳柳成蔭,原先是為了讓用戶能夠看到周圍的真實(shí)空間,以確定活動(dòng)范圍的透視,卻悄然一變,變成了與 AR 類似的功能。
不過(guò)囿于成本,VST 也沒(méi)有全部采用全彩。如 Quest pro 用 VST,兩顆黑白鏡頭建場(chǎng)景,一顆 RGB 攝像頭用來(lái)補(bǔ)色,不過(guò)現(xiàn)在也出現(xiàn)了雙目的 RGB,體驗(yàn)越來(lái)越好。
VST 要注意三點(diǎn):
- 清晰度:簡(jiǎn)言之就是看到的畫面要和現(xiàn)實(shí)中一模一樣。
- 延時(shí)性:要低,不然畫面和動(dòng)作不一致,用戶會(huì)暈。
- 視角偏差:攝像頭的位置和人眼的位置不一致,所以畫面容易產(chǎn)生視角偏差,長(zhǎng)時(shí)間使用可能出現(xiàn)視覺(jué)偽影,有點(diǎn)像水里折射的情況;所以要提前設(shè)置算法矯正。
其實(shí),雖然 VR 推出了全彩透視的功能,但并不意味著 VST 一定要放在一體機(jī)上,那樣相比于 AR 并沒(méi)有太大的優(yōu)勢(shì)。如果拿 PC 和手機(jī)類比 VR 和 AR,VR 是 PC 的延伸,承載的是重活,而 AR 更擅長(zhǎng)可移動(dòng)的小場(chǎng)景。VR 在肉眼可見的未來(lái),很難達(dá)到出街的可能,VST 的作用僅僅是家庭活動(dòng),例如游戲、音樂(lè)、繪畫。
圖十七,Hauntify Mixed Reality 讓鬼出現(xiàn)在家中真實(shí)房間
VR 的 VST 中,真實(shí)世界的元素更多成為一種背景,增加活動(dòng)本身的樂(lè)趣,但卻不是主體。試想,如果 VST 和 VR 主機(jī)分離,VST 作為 VR 的配件,可以配置到工廠、醫(yī)院,通過(guò)無(wú)線傳輸實(shí)時(shí)渲染,那是否能夠真正實(shí)現(xiàn)數(shù)字孿生?而 VR 也將真正闖入工業(yè)級(jí)的應(yīng)用。
四、把大象塞進(jìn)冰箱的最后一步
旅程到這里,其實(shí)已經(jīng)結(jié)束了。VR 的核心就是光學(xué)方案和空間定位,以及基于此的渲染和定位算法。不過(guò),為了方便讀者后續(xù)閱讀某些拆解報(bào)告時(shí),對(duì)上述內(nèi)容外的一些概念不太了解,特在最后一章附上相關(guān)的名詞解釋。
1. 頭盔、手柄
- 接近傳感器: VR 頭盔的接近傳感器一般用紅外,由一個(gè)紅外發(fā)射管和一個(gè)紅外接收管組成。紅外發(fā)射管會(huì)發(fā)射一調(diào)制紅外光信號(hào),該信號(hào)在遇到障礙物后被反射回來(lái),接收管通過(guò)接收該反射信號(hào)并根據(jù)反射信號(hào)的強(qiáng)度來(lái)判斷障礙物的遠(yuǎn)近。
- 玻纖: 頭盔所用材料,耐熱、絕緣、超輕。
- 霍爾芯片: 霍爾IC是將霍爾元件與運(yùn)算放大器組為一體的產(chǎn)品?;魻栐话阌迷谑直?,用于檢測(cè)扳機(jī)、側(cè)鍵是否按下;霍爾元件從元件本身獲得的電壓非常小,因此一般情況下需要配置運(yùn)算放大器等的放大電路。
- 馬達(dá)驅(qū)動(dòng)芯片: 馬達(dá)即電機(jī),控制馬達(dá)的正轉(zhuǎn)、反轉(zhuǎn)、剎車等,用于控制震動(dòng)馬達(dá)。
- 線性馬達(dá): 通電的線圈在磁場(chǎng)中受到洛倫茲力作用,帶著動(dòng)子沿固定方向往復(fù)運(yùn)動(dòng)產(chǎn)生振感,是一種能將電能直接轉(zhuǎn)換成直線運(yùn)動(dòng)機(jī)械能; 線性馬達(dá)的振動(dòng)頻率和波形均可編程,能根據(jù)使用場(chǎng)景,讓馬達(dá)做出不同方向、時(shí)間和強(qiáng)度的振動(dòng)反饋。
- X 軸線性馬達(dá): 動(dòng)子沿 X 軸方向移動(dòng)的馬達(dá),可以帶來(lái)前、后、左、右四個(gè)方向的震動(dòng)感覺(jué)(X、Y 軸)。
- Z 軸線性馬達(dá): 動(dòng)子沿 Z 軸方向移動(dòng)(x,y,z 軸),帶來(lái)上、下的震感。
手機(jī)上一般配 X 軸,因?yàn)槭謾C(jī)薄,Z 軸行程短,效果不好;手柄上就不是了,雙關(guān)齊下;早期還有一種轉(zhuǎn)子馬達(dá),利用電磁感應(yīng),用電流導(dǎo)致的磁場(chǎng)驅(qū)動(dòng)轉(zhuǎn)子旋轉(zhuǎn)而產(chǎn)生振動(dòng)。這種方法的問(wèn)題是延時(shí),缺乏方向性,震動(dòng)的手感不好。
2. 計(jì)算、通信、存儲(chǔ)
- IC: Integrated Circuit 集成電路芯片的簡(jiǎn)稱。集成電路芯片是一種電子元件,是將多個(gè)電子元件(如晶體管、電容、電阻等)集成在一起,通過(guò)半導(dǎo)體制造工藝制成的電路。集成電路芯片有很多類型,比如存儲(chǔ)器芯片、處理器芯片等。
- CPU: Central Processing Unit ,中央處理單元,主要用于計(jì)算機(jī)指令的邏輯計(jì)算和輸入、輸出控制。
- DRAM: Dynamic Random Access Memory,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器,RAM 的一種,用于數(shù)據(jù)的臨時(shí)存儲(chǔ),主要用于存儲(chǔ)運(yùn)行中的程序和數(shù)據(jù)。
- LPDDR5: DRAM 的一種,全稱Low Power Double Data Rate SDRAM,其中 SDRAM 是 Synchronous Dynamic Random Access Memory 的縮寫,表示同步動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器。LPDDR5 的讀取速度可以達(dá)到 6400MHz,表示內(nèi)存每秒鐘可以進(jìn)行6400萬(wàn)次數(shù)據(jù)讀寫。
- ROM: Read Only Memory,只讀存儲(chǔ)器,用于永久保存數(shù)據(jù),也即我們一般意義上的內(nèi)存。
- 閃存 UFS 3.1: Universal Flash Storage, 讀寫速度可以達(dá)到幾百M(fèi)B/s或甚至上千MB/s,一般插 U 盤在電腦上,數(shù)據(jù)從 U 盤上的讀取、寫入就看閃存的能力。
- MCU: Microcontroller Unit, 微控制器單元,集成了處理器核心(CPU)、存儲(chǔ)器(RAM)和輸入/輸出接口等功能。
- SoC: System on Chip, 系統(tǒng)級(jí)芯片,將系統(tǒng)的大部分或全部組件集成在一塊芯片上,通常包括處理器、內(nèi)存、輸入/輸出接口、模擬電路、數(shù)字電路和其他外圍設(shè)備等。SoC 可以簡(jiǎn)單理解為 MCU + 特定功能的外設(shè)集成。
- FEM: Front-end Modules,前端模塊,主要用于射頻信號(hào)的發(fā)送放大、接收放大、濾波等,用在手柄、頭盔(2.4 G、5G 射頻)的通信。
- FPGA: Field Programmable Gate Array,可編程的集成電路,優(yōu)勢(shì)是高速、實(shí)時(shí)處理大量數(shù)據(jù),用于對(duì)視覺(jué)畫面、傳感器數(shù)據(jù)等的并行處理。
3. 電源管理
- 鉭電容: 電容器,主要用來(lái)存儲(chǔ)電荷。
- 電壓電平芯片: 解決不同電壓電平之間兼容性問(wèn)題的集成電路芯片,電壓電平芯片可以將輸入信號(hào)的電壓范圍轉(zhuǎn)換為輸出信號(hào)的電壓范圍。電平電壓芯片將VR頭顯與計(jì)算機(jī)或游戲主機(jī)之間的信號(hào)進(jìn)行轉(zhuǎn)換,以確保它們能夠正常地進(jìn)行數(shù)據(jù)傳輸和通信。
- 穩(wěn)壓芯片: 將輸入電壓轉(zhuǎn)換為穩(wěn)定輸出電壓的集成電路芯片。
- 升壓芯片: 將輸入電壓升高到更高電壓的集成電路芯片,升壓芯片也有使用運(yùn)放的方案。
- 運(yùn)算放大器: Operational Amplifier,簡(jiǎn)稱Op-Amp,可以將微弱的模擬信號(hào)放大到適合后續(xù)處理的范圍,也放大輸入之間的電壓差;VR 中作為 LED 驅(qū)動(dòng)或者其他驅(qū)動(dòng)的放大器;運(yùn)放也有用在升壓芯片的方案。
- OTG 擴(kuò)展供: On-The-Go,USB 2.0 規(guī)范的補(bǔ)充,供電是指在使用OTG 功能時(shí),主機(jī)設(shè)備(比如電腦)為連接的外設(shè)(比如 VR 頭顯)提供電源供應(yīng)。
- 電源管理芯片: 顧名思義,對(duì)電源起到管理作用,具體包括。
- 電源變換:將輸入電源的電壓和電流轉(zhuǎn)換為適合系統(tǒng)需求的電壓和電流。
- 電源分配:將電能分配給不同的系統(tǒng)組件,以滿足其功耗需求。
- 電源檢測(cè):監(jiān)測(cè)電池電量、充電狀態(tài)和系統(tǒng)負(fù)載等信息,以提供電源管理的智能化控制。
- 其他電能管理功能:如電池保護(hù)、溫度監(jiān)測(cè)和功率管理等。
五、后記
這應(yīng)該是我自《張小龍 22 年》后寫的最長(zhǎng)的文章了,無(wú)論是字?jǐn)?shù)還是時(shí)間。寫長(zhǎng)文不容易,記得當(dāng)時(shí)寫張小龍的時(shí)候,大概花了一個(gè)星期,雖然在微信上沒(méi)發(fā)出多久就被騰訊封了,但在 pmcaff 上還有留存(鏈接放在了參考中),并得到了池建強(qiáng)老師的推薦,也算滿意了。
寫這篇文章,比寫人物要困難多了,太多的專業(yè)術(shù)語(yǔ),以及技術(shù)理解。原先我以為自己懂了的概念,其實(shí)真正串起來(lái),又延伸出許多枝蔓,又一點(diǎn)點(diǎn)去查。
好在有 perplexity 的幫助,簡(jiǎn)化了我的一些工作量。不過(guò)寫作的樂(lè)趣正在于此,它是一座迷宮,有時(shí)只想理解一個(gè)概念,又牽扯到另一個(gè)概念,概念與概念之間的關(guān)系又引發(fā)了新的著迷。
有一些很不錯(cuò)的信息源在此過(guò)程中也被發(fā)現(xiàn),例如雷鋒網(wǎng)的 VR 專題、知乎上胡癡兒的早年回答,以及 B 站 Up 主消失的模因的精彩視頻。可惜,前兩者已經(jīng)不再更新了。
當(dāng)然,最驚喜的是終于發(fā)現(xiàn)了一本介紹 VR 全貌的書籍,《The VR Book》,雖然成書于 2016 年,但作者功力深厚,仍然不失為理解 VR 的最佳材料之一。
這篇文章,大概可以 2 個(gè)月以來(lái),對(duì) VR 的研究結(jié)果,是給自己一個(gè)交代。里面一定有諸多問(wèn)題,受限于自己當(dāng)前的見識(shí),有所偏頗,但第一步既已踏出,便可以在后續(xù)的學(xué)習(xí)道路上增刪改查,可謂是寫完后最大的收獲了。我想,在消費(fèi)電子業(yè)無(wú)聊的狀態(tài)下,有一件有意思的事物可以研究,便很快慰了。
參考:
- 人類的視覺(jué)增強(qiáng)探索史:https://www.uisdc.com/evolution-of-ar-and-v
- XR 設(shè)備發(fā)展史:https://www.scaruffi.com/memejam/vr.html
- Philco HeadSight 介紹:https://www.virtual-reality-shop.co.uk/philco-headsight-1961/
- 凸透鏡成像原理:https://www.junyiacademy.org/junyi-science/science-high/science-high-history/s5p-99/junyi-geometric-optics/v/F-qVxGLJT1Y
- 了解 AR/VR 的光學(xué)原理:https://imgtec.eetrend.com/blog/2022/100557077.html
- VR視場(chǎng)角真的是越大越好嗎?- 大朋工程師的文章 – 知乎 https://zhuanlan.zhihu.com/p/22252592
- 重新認(rèn)識(shí)魚眼鏡頭:https://www.bilibili.com/video/BV1TL41117ti/?spm_id_from=333.1007.top_right_bar_window_history.content.click;vd_source=7cf1f568229c6f5b4a7c23f5a2e85cbc
- VR沉浸感的奧秘,人眼如何通過(guò)雙目視差硬解深度信:https://www.bilibili.com/video/BV11A411m7Sw/?share_source=copy_web;vd_source=c7e29439c97151c3755a46ccd4c8160a
- 如何充分利用視覺(jué)系統(tǒng)對(duì)深度的感知從而營(yíng)造更強(qiáng)的立體感與深度感?:https://www.zhihu.com/question/46552885
- 光場(chǎng)與人眼立體成像機(jī)理:http://vr.sina.cn/news/2018-10-24/detail-ifxeuwws7707633.d.html
- 維基百科 – Vergence-accommodation conflict:https://en.wikipedia.org/wiki/Vergence-accommodation_conflict
- MEMS傳感器1:3軸加速度計(jì)工作原理揭秘,與這些有關(guān):https://www.bilibili.com/video/BV1NJ41117B8/?share_source=copy_web;vd_source=c7e29439c97151c3755a46ccd4c8160a
- 深度解析 HTC Vive 的 Lighthouse 室內(nèi)定位技術(shù) – 虎嗅網(wǎng):https://www.huxiu.com/article/142795.html
- Lighthouse 激光定位技術(shù)開源了,但不是 Valve 做的 | 雷峰網(wǎng):https://www.leiphone.com/category/arvr/nu6Zln6hQTdMqSsy.html
- HTC Vive Lighthouse Chaperone tracking system Explained – YouTube:https://www.youtube.com/watch?v=J54dotTt7k0
- How the Vive Lighthouse Works – YouTube:https://www.youtube.com/watch?v=oqPaaMR4kY4
- Hypereal 突然開源?背后所涉的重磅信息都在這里了 | 愛范兒:https://www.ifanr.com/786928
- 目前最強(qiáng)的 VR 定位技術(shù),HTC 和 OptiTrack 是如何做到的?:https://wapbaike.baidu.com/tashuo/browse/content?id=2e7f4fcdd19a68101416efc6
- 深度干貨:詳解基于視覺(jué)+慣性傳感器的空間定位方法:https://www.leiphone.com/category/arvr/taExbGMOaYfbnnMw.html
- VR的空間定位技術(shù)是如何實(shí)現(xiàn)的?- 知乎:https://www.zhihu.com/question/46422259
- VR空間定位全解:如何在虛擬世界中行走?:https://www.leiphone.com/special/216/201607/577cd787225d6.html
- 「面部動(dòng)作捕捉」是一項(xiàng)什么技術(shù)?主要應(yīng)用于哪些場(chǎng)景?- 渲云渲染的回答 – 知乎:https://www.zhihu.com/question/321811525/answer/675319985
- 【VR速遞】OculusQuest面部識(shí)別;眼球追蹤的研發(fā)之路 – 載入圈VR的文章 – 知乎:https://zhuanlan.zhihu.com/p/410829378
- 面部表情追蹤技術(shù)在 VR 設(shè)備中的發(fā)展研究:https://m.fx361.com/news/2019/0106/6266425.html
- Eye Tracking in Virtual Reality: a Broad Review of Applications and Challenges:https://link.springer.com/article/10.1007/s10055-022-00738-z
- What is VR Eye Tracking? [And How Does it Work?]:https://imotions.com/blog/learning/best-practice/vr-eye-tracking/
- Hand Tracking for Immersive Virtual Reality: Opportunities and Challenges:https://www.frontiersin.org/articles/10.3389/frvir.2021.728461/full
- Quest手勢(shì)識(shí)別功能評(píng)測(cè):https://mp.ofweek.com/vr/a645693029046
- Meta RGB透視VR研究:攝像頭距離可調(diào)、分辨率720p:https://zhuanlan.zhihu.com/p/569886369
- 從典型案例看VST MR游戲的設(shè)計(jì)技巧:https://www.vrtuoluo.cn/536138.html
- 紅外 ToF 技術(shù)將大幅提升接近感應(yīng)傳感器的性能及可靠性:https://mouser.eetrend.com/content/2020/100048606.html
- 何謂霍爾IC?:https://www.ablic.com/cn/semicon/products/sensor/magnetism-sensor-ic/intro/
- 轉(zhuǎn)子馬達(dá)、X軸和Z軸線性馬達(dá)有啥差別?這篇文章總算說(shuō)明白了?。篽ttps://www.cfan.com.cn/2020/0729/134125.shtml
- MEMS mic之Amic(一)_麥克風(fēng)thdpn是什么不良代碼?:https://blog.csdn.net/weixin_44316365/article/details/124838502
- EPOS 波束成形麥克風(fēng)陣列技術(shù)優(yōu)化您的會(huì)議體驗(yàn).pdf
- 常用的音頻功放芯片-電子工程世界:http://news.eeworld.com.cn/qrs/ic628769.html
- 瑞蘇盈科為VR行業(yè)提供FPGA核心板解決方案:https://xilinx.eetrend.com/content/2023/100572176.html
- 同創(chuàng)國(guó)芯竇祥峰演講實(shí)錄:VR的FPGA應(yīng)用分析:https://cloud.tencent.com/developer/article/1137422
- Perplexity:https://www.perplexity.ai/
- 張小龍的 22 年和微信的 8 年:https://xie.infoq.cn/article/a70d189eaa18334868f8b2a45
專欄作家
善寶橘,微信公眾號(hào):善寶橘,人人都是產(chǎn)品經(jīng)理專欄作家,2019年年度作者。南大傳播學(xué)碩士,崇尚終身學(xué)習(xí)的互聯(lián)網(wǎng)斜杠青年,專注新媒體、游戲領(lǐng)域的運(yùn)營(yíng)策劃。
本文原創(chuàng)發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)許可,禁止轉(zhuǎn)載
題圖來(lái)自 Unsplash,基于CC0協(xié)議
該文觀點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺(tái)僅提供信息存儲(chǔ)空間服務(wù)。
講的很好,掃盲啦