Robotik’te Neden Algı (Perception) Önemlidir?

Kişisel robotlar, filmler de dahil olmak üzere medyanın gündeminde giderek daha fazla yer alıyor. Kişisel bir robota sahip olmak, her şeyimizi yapan kendi robot hizmetçiniz veya uşağınızın olması herkesin hayalidir. Ama bugünlerde tam olarak ne kadar gelişmişler?

Robotlar Gerçekten Göremez:

“Robot ve Frank”, bir robot uşağın yaşlı Frank’e temizlik yaparak, yemek pişirerek ve ilgi duyduğu bir hobiyle meşgul ederek yardım ettiği yakın gelecekte geçen bir filmdir. Frank’in robotu olarak anılacak olan bu filmdeki robot, tipik bir ev ortamında bir uşağın yapmasını istediği tüm aktiviteleri yapabilecek kapasitede.

Robot ve Frank Filminden Bir Kesit

Ancak gerçekte robotlarımız dünyayı insanlar gibi göremezler. Ambar otonom navigasyonu veya sanayi üretim hattı gibi ortamın yapılandırıldığı yerlerde robotların verimli bir şekilde çalışmasını sağlamada muazzam bir başarı elde ettik.

Figure 1: a) Warehouse robots in chinese firm moving thousands of packages,
Çinli firmadaki depo robotları binlerce paketi taşıyor
b) industrial manipulators in a car manufacturing unit Media Credits: gfycat.com & Giphy.com
Bir araba üretim biriminde endüstriyel manipülatörler

Perception (Algı):

Otonom kişisel robotlardan: a) kapalı ortamlarda insanlardan kaçınarak ve merdivenlerden kolaylıkla inerek zarif bir şekilde gezinmesi, b) insanlarla soru sormanın ve yanıtlamanın ötesinde etkileşime girmesi, fiziksel etkileşimler yoluyla engelli insanlara yakın bir şekilde hizmet etmesi, c) her gün ev işlerini gerçekleştirmek için nesneleri kavrama ve manipüle etmesi beklenmektedir. Örneğin, bir buzdolabından ve bir raftan sırasıyla süt kartonlarını ve tahıl kutularını almak ve kahvaltı hazırlama görevini tamamlamak için dökme eylemleri gerçekleştirmek.

Yukarıda bahsedilen yeteneklere ek olarak, robotun Frank’e yardım edebilmesi için bir araya getirilmesi gereken daha birçok yetenek vardır. Ancak tüm bu yönler, robotun herhangi bir karar verebilmesi için dünyayı insanlar gibi görmesini ve algılamasını gerektirir. Anlaşılabileceği gibi, robotun bir görev üzerinde üst düzey karar vermesini sağlamak için (kahvaltı hazırlama) birlikte birleştirilmesi gereken sensör gözlemlerinden çıkarılan algısal bilgi seviyeleri (süt kutusu mutfaktaki buzdolabındadır) vardır.

Bu yazıda, ardışık manipülasyon eylemlerini bilgilendirmek için sürekli olarak algılamayı içeren hedef odaklı görevler alanındaki bazı sorunları ve bunları ele almaya yönelik araştırma çabalarını tartışıcağız.

Manipülasyon:

Otonom bir ajana verilen her görev, bir hedef temsili ile ilişkilendirilebilir. Bu temsil, ajanın bir amacı gerçekleştirmek için yerine getirmesi gereken koşulları tanımlar. Örneğin, kahvaltı hazırlığında arzu edilen amaç, yemek masasında süt ve mısır gevreği içeren bir kaseye sahip olmaktır. Bu duruma gelebilmek için robotun dünyanın mevcut durumunun ne olduğunu algılaması ve algılaması gerekir. Yani kase, süt-karton ve mısır gevreği kutusunun nerede olduğunu ve bu nesneleri içeren buzdolabı, dolap gibi nesnelerin nerede olduğunu bilmek. Bunu, görevi tamamlamak için bu nesneleri kavramak (süt kutusunu kapmak) ve manipüle etmek (sütü kaseye dökmek) gibi eylemler takip etmelidir.

b) Fetch robot at PROGRESS lab sorting object from clutter (Professor Chad Jenkins et al.).
Robot dağınıklığı topluyor

Unutulmaması gereken bir nokta şudur ki, yemek hazırlama gibi ev işlerinin hem donanımda (tutucular ve manipülatörler) hem de yazılım da yapay zeka algoritmalarında ilerleme gerektirmesidir.

Donanım robotik platformları, karmaşık manipülasyon eylemleri gerçekleştirme yeteneğine sahiptir. Bu gelişmeleri donanım platformlarında AI algoritmalarıyla birleştirmek, robotların hedefe yönelik görev yürütmelerini gerçekleştirmesini sağlayabilir. Ancak bu platformlar genellikle dağınık olan ev ortamlarına getirebilmek için belirsiz gözlemler altında algılama yeteneğinin geliştirilmesi gerekmektedir.

Figure 2: a) PR2 Willow Garage robot making popcorn (Professor Michael Beetz et al.),
PR2 Willow Garage robotu patlamış mısır yapıyor

Ek olarak, özellikle robotun bir görevi tamamlamak için harekete geçmesi ve dünyayı değiştirmesi gerektiğinde, dünyayı algılamak son derece zordur. Gürültülü sensör verileri ve çok çeşitli nesne kategorileri ile son derece değişken çevresel koşullar gibi faktörler, robot algısını kişisel robotları eve getirmede gerçek bir darboğaz haline getirir.

Dağınıklık Problemi:

İnsan ortamları genellikle karmaşıktır ve mevcut robot sensörlerini kullanarak algılamayı zorlaştırır. Dağınıklık, çevresel tıkanıklıklar nedeniyle gözlemlerde yaratılan ve dünyadaki nesneleri tanımlamayı zorlaştıran belirsizlik olarak tanımlanabilir.

Dağınık bir mutfak düşünün, bir ev işiyle ilgili dağınık bir mutfakta belirsiz ve eksik bilgi altında robot için algılamak ve muhakeme yapmak zordur.

Vurgulamak için, aşağıdaki şekle bakın. Robotun tüm nesneleri lavabodan alıp bulaşık makinesine koyması gereken bir görevi düşünün.

Bir lavabo sahnesi

En azından bu görev, robotun bir sonraki adımda hangi nesneyi alması gerektiğine karar vermesini gerektirir. Bu nedenle, alma eylemi için hangi nesnenin hedef nesne olduğunu bilmek için lavaboda hangi nesnelerin olduğunu ve fiziksel olarak birbirlerini nasıl desteklediklerini algılamalıdır. Bu görev başlı başına zordur, ancak dağınıklık nedeniyle eksik sensör gözlemi altında çok daha zor hale gelir.

Perception Seviyeleri:

Çeşitli bileşenlerle oluşturulmuş bir robotun, bir ortamdaki göreceli konumunun bir tahmini ile birlikte propriyosepsiyona (kişinin kendi vücut bölümlerinin göreceli konum hissi) sahip olması gerekir. Örneğin robot, tanıdık bir ev ortamında “mutfak lavabosunun yanında” olduğunu tahmin edebilmelidir. Bir ortamda kendi kendine yerelleştirme kavramına ek olarak, robot dünyanın durumunu algılayabilmeli ve görevleri yerine getirmek için algılanan bilgileri soyutlayabilmelidir. Örneğin robot, akşam yemeği için sofrayı kurmak için yemek masasının, tabakların ve çatal-bıçakların nerede olduğunu algılamalıdır.

Bir robot dünyayı farklı seviyelerde anlayabilir. Üst düzey bir anlayış, bir dünyayı, robotun istenen bir konuma (yemek odasındaki yemek masası) gitmesini sağlayacak semantik yer konumlarının (oturma odası, yatak odası ve yemek odası) bir koleksiyonu olarak temsil etmeyle sonuçlanabilir. Düşük seviyeli bir soyutlama, bir görevi tamamlamak için nesneleri kavramaya uygun, konumları ve yönelimleri ile nesnelerin toplanmasıyla sonuçlanabilir.

Figure 4: Understanding a large scale scene as a collection of objects and semantic locations [8]
Nesnelerin ve anlamsal konumların bir koleksiyonu olarak büyük ölçekli bir sahneyi anlama
Figure 5: Understanding a scene as a collection of objects with their positions and orientations [7]
Bir sahneyi konumları ve yönelimleriyle birlikte bir nesneler topluluğu olarak anlama

Sensör gözlemleri gürültülü olduğunda ve her an çevre hakkında yalnızca kısmi bilgi yakalayabildiğinde, bu soyutlama seviyelerine yönelik sahne anlayışı son derece zorlaşır.

Sonuç:

Görüldüğü gibi robotikte algılama üzerine bir çok sorun mevcut. Şuanki araştırmalar , bu sorunları çözerek, Frank’e hizmet edecek ve ona sağlıklı bir kahvaltı hazırlayacak kişisel bir robot arkadaşına sahip olma hedefine doğru ilerliyor.


Bu yazıda kişisel ev robotlarında algı sorunu üzerine konuştuk. Okuduğunuz için teşekkür ederim.

Herhangi bir sorunuz olursa veya benimle iletişim kurmak isterseniz tüm sosyal medya hesaplarım bu linkte yer alıyor.

Yorum bırakın