Imagens 2D transformadas em 3D rapidamente graças à IA revolucionária

Os humanos são capazes de ver uma imagem bidimensional e imaginar o que ela realmente é em três dimensões, mas máquinas não. Um novo dispositivo inventado por cientistas do MIT pode, no entanto, transformar imagens em três dimensões de imagens 2D. A ferramenta é de aprox. 15.000 vezes mais rápido do que dispositivos mais antigos.

Os cientistas conseguiram usar sistemas neurais para determinar imagens em tamanho real a partir de imagens 2D. No entanto, este método de aprendizado de máquina é um pouco lento demais para ser aplicável em vários trabalhos práticos.
Um dispositivo sensível comunicado com seu entorno deve ser capaz de determinar uma das imagens 3D a partir de imagens 2D. Os feixes de luz desenvolvidos por cientistas são capazes de reproduzir um feixe de luz após um único avistamento de uma imagem.
Como funciona ?
A técnica reproduz as imagens por um conjunto de raios de luz em 360 graus, passando por todos os pontos e seguindo todos os eixos. O conjunto de raios é codificado em um pipeline neuralpermitindo assim ter o resultado desejado muito mais rapidamente.
Quando um computador queria fazer esta operação, obter um objeto 3D de uma imagem envolve mapa muitos feixes de luz enviados da câmera. Atualmente, é possível fazê-lo, mas esse processo envolve muitos cálculos e, portanto, um longa espera.
Um Light Field Array (LFN) é capaz de transformar o feixe de luz de uma imagem 3D. Em seguida, associa a cada um dos raios da câmera no feixe de luz a cor vista por esse raio. No entanto, para reconstruir todos os raios, a rede neural deve primeiro identificar os materiais dos feixes de luz.
Então os cientistas têm colocar em teste seu dispositivo usando várias imagens bidimensionais. Assim que o exemplo aprendeu a forma de um campo de luz, foi capaz de transformar uma imagem 3D deimagem única.
Renderizações mais rápidas?
Os cientistas experimentaram seu dispositivo reconstruindo feixes de luz de 360 graus a partir de várias imagens únicas. Eles descobriram que os LFNs podem renderizar cenas a uma velocidade de cerca de 500 quadros por segundo. Além disso, objetos 3D renderizados por LFNs são muito mais claro do que os dados pelos antigos sistemas.
Um LFN também pergunta menos memória de armazenamento, com cerca de 1,6 megabytes ou 146 megabytes para um dispositivo muito mais antigo. No futuro, os cientistas gostariam de ter um dispositivo mais eficiente para aproveitá-lo para situações um pouco mais complexas do que as do momento.