İnternette İstediğiniz Gibi Çevrimiçi Para Kazanma!

MIT araştırmacıları, herhangi bir parlak nesneyi bir tür kameraya dönüştüren yeni bir bilgisayarlı görüş sistemi sunuyor: gözlemcinin köşelerin arkasını görmesine olanak tanıyor…

Yazıyı okuyorsunuz: MIT araştırmacıları, herhangi bir parlak nesneyi bir tür kameraya dönüştüren yeni bir bilgisayarlı görüş sistemi sunuyor: gözlemcinin köşelerin arkasını görmesine olanak tanıyor…

Bir nesnenin yansımasından yakın çevreye ilişkin değerli ve çoğunlukla gizli bilgiler elde edilebilir. Bunları kamera olarak yeniden kullanarak, duvarların arasından veya gökyüzüne bakmak gibi daha önce hayal edilemeyen görüntüleme becerileri gerçekleştirilebilir. Bu zordur çünkü nesnenin geometrisi, malzeme nitelikleri, 3 boyutlu ortam ve gözlemcinin bakış açısı gibi çeşitli faktörler yansımaları etkiler. İnsanlar, nesnenin geometrisini ve parıltısını ondan yansıyan aynasal parıltıdan dahili olarak ayrıştırarak, çevredeki kapalı kısımlar hakkında anlamsal ve derinlik ipuçları elde edebilir.

MIT ve Rice’taki bilgisayarlı görüntü araştırmacıları, gerçek ortamın görüntülerini üretmek için yansımaları kullanmaya yönelik bir yöntem geliştirdiler. Yansımaları kullanarak, parlak nesneleri “kameralara” dönüştürerek kullanıcının dünyaya seramik kahve kupası veya metal kağıt ağırlığı gibi sıradan nesnelerin “lensleri” aracılığıyla baktığı izlenimini veriyorlar.

Araştırmacıların kullandığı yöntem, belirsiz geometriye sahip parlak nesnelerin radyant alan odalarına dönüştürülmesinden oluşuyor. Ana fikir, çevreden yansıyan ışığı iki boyutlu olarak kaydetmek için nesnenin yüzeyini dijital sensör olarak kullanmaktır.

Araştırmacılar, yalnızca sahnedeki parlak nesne tarafından doğrudan görülebilen ancak gözlemci tarafından görülemeyen yeni görüşlerin temsili olan yeni görüş sentezinin, çevreden radyasyon alanlarının geri kazanılmasıyla mümkün olduğunu gösteriyor. Ek olarak, sahnedeki yakındaki nesnelerin radyasyon alanını kullanarak oluşturduğu tıkayıcıları da hayal edebiliyoruz. Araştırmacılar tarafından geliştirilen yöntem, nesnenin geometrisini, dağınık radyasyonunu ve 5 boyutlu ortamının radyasyon alanını eş zamanlı olarak tahmin etmek için nesnenin çok sayıda fotoğrafını kullanarak baştan sona öğretiliyor.

Araştırma, nesnenin dünyayı bir kamera gibi “görebilmesi” ve çevresini kaydedebilmesi için nesneyi yansımalarından ayırmayı amaçlıyor. Bilgisayarlı görme, şekli bilinmeyen bir 3 boyutlu sahnenin çarpık 2 boyutlu temsili olduğundan yansımalarla ilgili bir süredir sorunlar yaşamaktadır.

Araştırmacılar, nesnenin yüzeyini sanal bir sensör olarak modelliyor ve nesnenin etrafındaki 5 boyutlu ortamdan radyasyon alanının 2 boyutlu projeksiyonunu toplayarak, gördüğünüz dünyanın 3 boyutlu bir temsilini oluşturuyor. Çevredeki radyasyon alanının çoğu, nesneden gelen yansımalar dışında, gizlenmiştir. Görüş alanının ötesinde, yeni görüşlerin sentezi veya yalnızca sahnedeki parlak nesne tarafından doğrudan görülebilen ancak gözlemcinin göremediği yeni görüşlerin temsili, ortam radyasyon alanlarının kullanımıyla mümkün kılınır. Nesnenin derinliğinin ve çevresine olan ışınımının tahmin edilmesine izin verir.

Ekip özetle şunları yaptı:

  • Yalnızca sanal koniler kullanarak ortamlarının 3 boyutlu görüntülerini yakalama yeteneğiyle örtülü yüzeylerin nasıl sanal sensörlere dönüştürülebileceğini gösteriyorlar.
  • Birlikte nesnenin 5 boyutlu ortam radyasyon alanını hesaplarlar ve onun dağınık radyasyonunu tahmin ederler.
  • İnsan gözünün göremeyeceği yeni bakış açıları oluşturmak için çevredeki ortamın ışık alanının nasıl kullanılacağını gösteriyorlar.

Bu proje, şekli ve albedo’su bilinmeyen parlak bir elementin birçok fotoğrafından çevrenin 5 boyutlu radyasyon alanını yeniden yapılandırmayı amaçlamaktadır. Yansıtıcı yüzeylerden gelen parlama, görüş çerçevesi dışındaki sahne unsurlarını ortaya çıkarır. Spesifik olarak, parlak nesnenin yüzey normalleri ve eğriliği, gözlemcinin görüntülerinin gerçek dünyayla nasıl eşleştiğini belirler.

Araştırmacılar nesnenin şekli veya yansıtılan gerçekliği hakkında daha kesin bilgilere ihtiyaç duyabilir, bu da çarpıklığa katkıda bulunur. Parlak cismin renk ve dokusunun yansımalara karışması da mümkündür. Ayrıca, yansımalar üç boyutlu bir ortamın iki boyutlu izdüşümleri olduğundan, yansıyan sahnelerde derinliği ayırt etmek kolay değildir.

Araştırma ekibi bu engelleri aştı. Parlak nesneyi çeşitli açılardan fotoğraflayarak ve çeşitli yansımaları yakalayarak başlıyorlar. Orca (Işıyan Alan Kameraları gibi Nesneler), üç aşamalı süreçlerin kısaltmasıdır.

Orca, nesnenin çeşitli açılardan görüntülerini oluşturarak çoklu görüntü yansımalarını kaydedebilir; bu görüntüler daha sonra parlak nesne ile sahnedeki diğer nesneler arasındaki derinliği ve parlak nesnenin şeklini tahmin etmek için kullanılır. ORCa’nın 5D radyasyon alanı modeli, görüntüdeki her noktadan gelen ve ona çarpan ışık ışınlarının gücü ve yönü hakkında daha fazla bilgi yakalar. Orca, bu 5 boyutlu radyasyon alanından gelen veriler sayesinde daha doğru derinlik tahminleri yapabiliyor. Sahne 2 boyutlu bir görüntü yerine 5 boyutlu bir radyasyon alanı olarak görüntülendiğinden, kullanıcı köşelerin veya diğer engellerin gizleyebileceği ayrıntıları görebilir. Araştırmacılar, ORCa’nın 5D radyasyon alanını topladıktan sonra kullanıcının alanın herhangi bir yerine sanal bir kamera yerleştirebileceğini ve kameranın üreteceği sentetik görüntüyü oluşturabileceğini açıklıyor. Kullanıcı ayrıca bir öğenin görünümünü örneğin seramikten metale değiştirebilir veya sahneye sanal şeyler dahil edebilir.

Araştırmacılar, radyasyon alanının tanımını geleneksel görüş hattı radyasyon alanının ötesine genişleterek, çevreye ve onun içindeki nesnelere yönelik yeni araştırma yolları açabilirler. Yansıtılan sanal görünümleri ve derinliği kullanan çalışma, kameranın görüş alanı dışından bilgi elde etmek gibi sanal öğelerin ve 3 boyutlu algının eklenmesine yönelik olasılıkları açabilir.