蘋果iOS26的3D壁紙效果是如何實現(xiàn)的?
你隨手拍下的2D照片如何能夠“活起來”,轉(zhuǎn)化為可量化、可交互的三維空間?
這背后,正是空間智能技術(shù)不斷演進的結(jié)果。作為數(shù)字空間及空間智能綜合解決方案的引領(lǐng)者,如視始終堅持技術(shù)創(chuàng)新與突破,今天又帶來一大全新技術(shù)突破——空間大模型Argus。
Argus是目前已知首個支持全景輸入的空間深度推測大模型,能夠以毫秒級的速度從一個場景下的單張或多張全景圖像中推理出所有圖像的絕對尺度的相機位姿、深度、點圖等核心三維屬性,從而實現(xiàn)從2D圖像到3D空間的重建。
也就是說,你隨手拍的幾張照片,在Argus的處理下,可以瞬間還原出一個立體的3D世界。
如視realsee
三大突破特性
Argus基于Transformer架構(gòu)構(gòu)建,是一個前饋式神經(jīng)網(wǎng)絡(luò)模型。如視算法團隊依托如視積累的千萬級真實空間數(shù)據(jù)集對模型進行系統(tǒng)訓練,使其在兼容性、實時性與生成質(zhì)量三大維度實現(xiàn)行業(yè)突破。
No.1 兼容性
Argus是業(yè)界首個且唯一支持全景圖作為輸入的深度推測大模型。同時,它也支持輸入單張/多張全景照片、針孔照片、AI圖片等,具備多源適應(yīng)能力。
No.2實時性
Argus通過網(wǎng)絡(luò)架構(gòu)的設(shè)計,構(gòu)建了實時全景圖全局重建系統(tǒng),推理效率達毫秒級。從上傳圖像到生成 3D 結(jié)果,全流程無感知響應(yīng)。這不僅改變了三維重建的交互流程,長遠來看,更為實時動態(tài)三維重建等未來應(yīng)用打開了廣闊空間,讓動態(tài)空間的瞬時數(shù)字化成為可能。
No.3極優(yōu)生成
如視憑借硬件與算法深度融合的技術(shù)路徑,構(gòu)建了全球最大的實景三維空間數(shù)據(jù)庫,涵蓋超過5300萬高質(zhì)量、完備且高一致性的空間數(shù)據(jù)。Argus充分挖掘這一數(shù)據(jù)優(yōu)勢,在網(wǎng)絡(luò)架構(gòu)上適配了如視數(shù)據(jù)特性,產(chǎn)物效果更優(yōu);即便面對玻璃、鏡面、毛坯房、長走廊等三維重建傳統(tǒng)難點場景,Argus仍表現(xiàn)穩(wěn)定,顯著優(yōu)于當前業(yè)界缺乏真尺度或?qū)R能力的方案。
應(yīng)用場景
Argus打通了從2D到3D、從單視角到多視角的關(guān)鍵技術(shù)屏障,使各類平面圖像應(yīng)用得以延伸至三維物理空間,賦能諸如動態(tài)3D壁紙、實時監(jiān)控、新視點合成等多元場景。
以生成點云與深度為起點,依托如視完整的三維重建與空間智能應(yīng)用體系,Argus未來可進一步用于實時渲染的3DGS模型和精細Mesh模型,為空間漫游提供沉浸式數(shù)字基底。通過與如視自研的空間智能算法結(jié)合,它還能驅(qū)動空間CAD自動生成、高精度語義分割及白模構(gòu)建等高階應(yīng)用,實現(xiàn)從物理世界到數(shù)字空間,再賦能現(xiàn)實應(yīng)用的閉環(huán)。
開放數(shù)據(jù)集
空間生成是空間智能廣闊圖景的一部分。Argus 的實踐充分證明,如視積累的海量真實高質(zhì)量空間數(shù)據(jù),可以成為驅(qū)動空間智能應(yīng)用技術(shù)的基石。為加速領(lǐng)域研究演進,如視計劃于今年年底開放 10000 套空間數(shù)據(jù)集,賦能行業(yè)專業(yè)人士深耕前沿技術(shù),助力空間智能更深入的發(fā)展。

營業(yè)執(zhí)照公示信息