گوناگون

انقلاب در بینایی کامپیوتری/ ماشین‌ها می‌توانند دنیا را مشابه انسان‌ها ببینند!

در دنیای هوش مصنوعی، یکی از بزرگترین چالش‌ها شبیه‌سازی نحوه پردازش اطلاعات بصری توسط انسان‌هاست. اخیراً تیمی از محققان MIT سیستمی جدید ساخته‌اند که به ماشین‌ها این امکان را می‌دهد تا دنیای اطراف خود را به شیوه‌ای مشابه انسان‌ها تحلیل کنند. این فناوری جدید می‌تواند تأثیر چشمگیری در بهبود سیستم‌های بینایی کامپیوتری مانند خودروهای خودران داشته باشد.

به گزارش پارسینه، بینایی کامپیوتری معمولاً به الگوریتم‌های پیچیده‌ای برای تحلیل تصاویر متکی است، اما گاهی اوقات این سیستم‌ها نتایج غیرمنتظره‌ای ارائه می‌دهند. برای مثال، ممکن است یک ربات یک ظرف غذا را نادیده بگیرد یا تصور کند که یک بشقاب در هوا شناور است. انسان‌ها معمولاً قادرند چنین اشکالاتی را شناسایی کنند، اما این عدم دقت می‌تواند در کاربردهای حساس مانند خودروهای خودران و ربات‌های خدماتی مشکلاتی ایجاد کند.

برنامه‌نویسی احتمالاتی برای حل مشکلات بینایی کامپیوتری

برای حل این مشکلات، محققان MIT از رویکرد «برنامه‌نویسی احتمالاتی» استفاده کرده‌اند. این روش به ماشین‌ها اجازه می‌دهد تا تصاویر را از زوایای مختلف تحلیل کرده و از داده‌های احتمالاتی برای پیش‌بینی خطاها و تطابق اشیاء استفاده کنند. این رویکرد نه‌تنها به تشخیص دقیق‌تر اشیاء کمک می‌کند بلکه اشتباهات رایج در الگوریتم‌های یادگیری عمیق را نیز اصلاح می‌نماید. با بررسی روابط تماس بین اشیاء، این سیستم قادر است موقعیت‌های دقیق‌تری از اجسام را پیش‌بینی کند که در سیستم‌های خودروهای خودران بسیار حیاتی است.

یادگیری از تصاویر محدود: توانایی شبیه‌سازی با تنها چند تصویر

یکی از ویژگی‌های منحصر به‌فرد این سیستم جدید، توانایی یادگیری و شبیه‌سازی اشیاء در فضای سه‌بعدی تنها با مشاهده پنج تصویر است. برخلاف سیستم‌های یادگیری عمیق که نیاز به هزاران نمونه داده دارند، این فناوری قادر است از تعداد محدودی تصویر اطلاعات دقیقی استخراج کند و سرعت یادگیری را به طور چشمگیری افزایش دهد.

دقت و سرعت بیشتر در شبیه‌سازی و پردازش بصری

محققان این سیستم را با مدل‌های رایج یادگیری عمیق مقایسه کرده‌اند و نتایج نشان داده‌اند که سیستم جدید دقت بالاتری در شبیه‌سازی اشیاء و صحنه‌ها دارد. به‌ویژه در مواقعی که یک شیء جزئی از نظر بصری مسدود شده باشد، این سیستم می‌تواند موقعیت آن را به درستی پیش‌بینی کند. این ویژگی برای کاربردهای پیچیده مانند خودروهای خودران و ربات‌های خدماتی بسیار حیاتی است.

آینده‌ای روشن برای بینایی کامپیوتری

این پیشرفت‌ها در بینایی کامپیوتری نمایانگر گامی بزرگ به سوی رفع مشکلات رایج در سیستم‌های خودران و ربات‌هاست. سیستم جدید MIT علاوه بر افزایش دقت، سرعت پردازش را نیز بهبود بخشیده است که می‌تواند در سیستم‌های واقعی کاربردهای گسترده‌ای داشته باشد. با پیشرفت‌های بیشتر در این فناوری، شاهد تحولاتی اساسی در تعاملات انسان و ماشین خواهیم بود.