Stačí několik fotografií z různých úhlů a umělá inteligence během několika sekund vygeneruje detailní 3D scénu. Technologie bude mít řadu praktických využití.
Vytvoření 3D scény z několika málo fotografií zní jako neřešitelný úkol. Umělá inteligence a strojové učení ale už dnes umožňují věci, které ještě před několika lety nebyly možné. 3D scény bez hluchých míst tak mohou vzniknout třeba ze čtveřice fotografií během několika sekund.
NVIDIA na vývojářské konferenci GTC představila technologii NeRF (Neural Radiance Field) schopnou vytvořit detailní 3D scénu a dopočítat potřebná místa scény během několika sekund. Až doposud bylo při podobných případech zapotřebí několik hodin a obrovské množství výpočetního výkonu. Výrobce čipů ve své verzi technologie Instant NeRF potřebuje na tréning umělé inteligence a strojové učení jen několik sekund. Důvodem je použití techniky zvané „multi-resolution hash grid encoding“, která je optimalizovaná na běh na grafických kartách NVIDIA. Pro svůj běh si vystačí i s obyčejnou grafickou kartou, i když nejlepších výsledků dosahuje na profesionálních GPU optimalizovaných pro AI výpočty.
NVIDIA technologii přirovnává k obrácenému Polaroidu. Před 75 lety umožnil Polaroid bleskové pořízení otisku 3D scény do 2D fotografie. Dnes dokáží výzkumníci a inženýři opak, z několika 2D snímků vygenerovat přesnou 3D scénu.
Jaké má technologie využití?
Výrobce polovodičů věří, že Instant NeRF by mohla být použita pro trénink robotů a autonomních řídicích systémů. Pomáhala by jim „pochopit“ a odhadnout tvary a velikosti objektů ve světě kolem. NVIDIA také vidí budoucnost technologie v zábavním průmyslu a architektuře, kde může být použita pro rychlou tvorbu 3D modelů reálných scén.
Už v minulosti byla technologie NeRF-W využita pro vygenerování 3D scén např. u slavných památek, kdy díky fotografiím turistů vznikl např. přesný 3D model fontány di Trevi.
Zdroj: NVIDIA
Úvodní fotografie: Se souhlasem NVIDIA