DeepMind近日已發展一人工智慧型系統,只要觀察2D影像就能建立其3D場景。DeepMind 團隊導入了 GQN(Generative Query Network)神經網路技術,透過將物件輸入到「代表網路(Representation Network)」中形成 3D 虛擬物件,並讓「生成網路(Generation Network)」進到其中,學習一個物件從各個角度中看起來應該會是如何,省去過去大量的標記學習。
相關的技術雖然在目前的發展上還有條件限制,例如說只能先用在虛擬物件上,但是 DeepMind 團隊對於這套技術很有信心,預期在未來導入高畫質照片,甚至是加入時間因素,讓 AI 可以生成物理運動狀態,借以製作動態模型。
DeepMind讓AI能憑2D影像描繪出3D場景
