انقلاب در بینایی کامپیوتری/ ماشینها میتوانند دنیا را مشابه انسانها ببینند!
در دنیای هوش مصنوعی، یکی از بزرگترین چالشها شبیهسازی نحوه پردازش اطلاعات بصری توسط انسانهاست. اخیراً تیمی از محققان MIT سیستمی جدید ساختهاند که به ماشینها این امکان را میدهد تا دنیای اطراف خود را به شیوهای مشابه انسانها تحلیل کنند. این فناوری جدید میتواند تأثیر چشمگیری در بهبود سیستمهای بینایی کامپیوتری مانند خودروهای خودران داشته باشد.
به گزارش پارسینه، بینایی کامپیوتری معمولاً به الگوریتمهای پیچیدهای برای تحلیل تصاویر متکی است، اما گاهی اوقات این سیستمها نتایج غیرمنتظرهای ارائه میدهند. برای مثال، ممکن است یک ربات یک ظرف غذا را نادیده بگیرد یا تصور کند که یک بشقاب در هوا شناور است. انسانها معمولاً قادرند چنین اشکالاتی را شناسایی کنند، اما این عدم دقت میتواند در کاربردهای حساس مانند خودروهای خودران و رباتهای خدماتی مشکلاتی ایجاد کند.
برنامهنویسی احتمالاتی برای حل مشکلات بینایی کامپیوتری
برای حل این مشکلات، محققان MIT از رویکرد «برنامهنویسی احتمالاتی» استفاده کردهاند. این روش به ماشینها اجازه میدهد تا تصاویر را از زوایای مختلف تحلیل کرده و از دادههای احتمالاتی برای پیشبینی خطاها و تطابق اشیاء استفاده کنند. این رویکرد نهتنها به تشخیص دقیقتر اشیاء کمک میکند بلکه اشتباهات رایج در الگوریتمهای یادگیری عمیق را نیز اصلاح مینماید. با بررسی روابط تماس بین اشیاء، این سیستم قادر است موقعیتهای دقیقتری از اجسام را پیشبینی کند که در سیستمهای خودروهای خودران بسیار حیاتی است.
یادگیری از تصاویر محدود: توانایی شبیهسازی با تنها چند تصویر
یکی از ویژگیهای منحصر بهفرد این سیستم جدید، توانایی یادگیری و شبیهسازی اشیاء در فضای سهبعدی تنها با مشاهده پنج تصویر است. برخلاف سیستمهای یادگیری عمیق که نیاز به هزاران نمونه داده دارند، این فناوری قادر است از تعداد محدودی تصویر اطلاعات دقیقی استخراج کند و سرعت یادگیری را به طور چشمگیری افزایش دهد.
دقت و سرعت بیشتر در شبیهسازی و پردازش بصری
محققان این سیستم را با مدلهای رایج یادگیری عمیق مقایسه کردهاند و نتایج نشان دادهاند که سیستم جدید دقت بالاتری در شبیهسازی اشیاء و صحنهها دارد. بهویژه در مواقعی که یک شیء جزئی از نظر بصری مسدود شده باشد، این سیستم میتواند موقعیت آن را به درستی پیشبینی کند. این ویژگی برای کاربردهای پیچیده مانند خودروهای خودران و رباتهای خدماتی بسیار حیاتی است.
آیندهای روشن برای بینایی کامپیوتری
این پیشرفتها در بینایی کامپیوتری نمایانگر گامی بزرگ به سوی رفع مشکلات رایج در سیستمهای خودران و رباتهاست. سیستم جدید MIT علاوه بر افزایش دقت، سرعت پردازش را نیز بهبود بخشیده است که میتواند در سیستمهای واقعی کاربردهای گستردهای داشته باشد. با پیشرفتهای بیشتر در این فناوری، شاهد تحولاتی اساسی در تعاملات انسان و ماشین خواهیم بود.
ارسال نظر