گام بعدی هوش مصنوعی برای همه به موضوعی چالش برانگیز تبدیل شده است. هوش مصنوعی در انجام بسیاری از کارها بهتر از انسان عمل می‌کند. پیش‌بینی وضع هوا، تشخیص بیماری و بازی شطرنج از جمله کارهایی است که هوش مصنوعی در انجام آنها عملکردی بهتر از انسان دارد. بی‌تردید هوش مصنوعی در بسیاری از امور به کار گرفته خواهد شد، اما شاید در پاسخ‌گویی به بعضی از پرسش‌ها که مستلزم استدلال عمیق است به گرد پای انسان هم نرسد.
اندازۀ استوانه‌ای که در سمت چپ جسم فلزی قهوه‌ای قرار دارد، چقدر است؟گام بعدی هوش مصنوعیحتی یک کودک شش ساله هم می‌تواند به سادگی به این پرسش پاسخ دهد، اما این قبیل از پرسش‌ها خارج از محدودۀ مدل‌های یادگیری عمیق سنتی هستند.

 

چرا یادگیری عمیق کافی نیست؟

مدل‌های یادگیری عمیق عملکرد خوبی در درک روابط میان خروجی‌ها و ورودی‌ها دارند، اما انتظار نمی‌رود از این سطح برود. چه یادگیری تقویتی باشد چه یادگیری نظارت‌شده، ورودی‌ها و خروجی‌ها به روشنی تعریف می‌شوند و درک آنها برای مدل آسان است. اگر محققان در نظر دارند تا مدل‌های هوش مصنوعی قابلیت تصمیم‌گیری داشته و از عقل سلیم استفاده کنند، باید زمینه را برای گسترش قوه استدلال در آنها فراهم کنند. گام بعدی هوش مصنوعی باید قابلیت تفکر انتزاعی داشته باشد.

استدلال عمیق

استدلال عمیق به حوزه‌ای اطلاق می‌شود که در آن، ماشین‌ها قابلیت درک روابط تلویحی میان مفاهیم مختلف را به دست می‌‍‌آورند. این مثال را در نظر بگیرید: «همه حیوانات آب می‌نوشند. گربه‌ها حیوان هستند.» در این مثال، رابطه تلویحی این است که همه گربه‌ها آب می‌نوشند، اما این برداشت به‌طور صریح ذکر نشده است. انسان‌ها این نوع استدلال منطقی و ارتباط چیزهای مختلف با یکدیگر را به خوبی درک می‌کنند، اما رایانه‌ها که بر اساس قوانین سخت و صریح عمل می‌کنند، به این سادگی این نوع روابط را درک نمی‌کنند.

پس چطور می‌توان رایانه‌ها را به قوه استدلال مجهز کرد؟

در این مقاله، محققان شرکت DeepMind توضیح می‌دهند که چطور توانستند یک مدل یادگیری عمیق را مجاب به پاسخ‌گویی به برخی پرسش‌های دشوار کنند. این مدل توانست با میزان دقت ۹۶ درصد به پرسش‌ها جواب دهد. اقدامات زیر با استفاده از سه شبکه به انجام رسید:

• ۱. یک شبکه حافظه طولانی_کوتاه مدت برای پردازش پرسش
• ۲. شبکه عصبی پیچشیبرای پردازش تصاویر
• ۳. شبکه رابطه برای درک ارتباط میان اشیای مختلف

اکنون می‌خواهیم نقش هر کدام از اجزای فوق را در حل مسئله بررسی کنیم.

پردازش زبان
شبکه‌های LSTM به دلیل قابلیت‌شان در بخاطر سپردن بخش‌های قبلیِ توالی، عملکرد خوبی در درک توالی‌ها دارند. این قابلیت می‌تواند در پاسخ‌گویی به پرسش‌ها و در کل زبان مفید باشد زیرا ابتدایِ جمله می‌تواند معنا یا اهمیت پایان جمله را تحت تاثیر قرار دهد. شبکه‌های حافظه طولانی کوتاه‌مدت مجموعه‌ای از پرسش‌ها را گردآوری کرده و کار را برای RN آسان‌تر می‌کند.

پردازش تصویر
CNN عملکرد درخشانی در شناسایی ویژگی تصاویر دارند. به همین منظور، محققان از CNN برای استخراج انواع مختلف ویژگی تصاویر در قالب بردارهای نقشه ویژگی استفاده کردند. بردارهای نقشه ویژگی اجسام را بهتر و کارآمدتر از پیکسل‌ها به نمایش می‌گذارند و کار را برای RN آسان‌تر می‌کنند.

درک منطقی
به محض اینکه مدل پرسش و تصویر را پردازش کرد، می‌تواند روابط میان اشیاء را در تصویر درک کند. این مدل می‌تواند از آن روابط برای جواب دادن به پرسش مورد نظر استفاده کند. شبکه RN با در نظر گرفتن روابط بالقوه میان جفت اشیاء (مثل استوانه قرمز و مکعب آبی)، یاد بگیرد که در خصوص روابط استنتاج کند. سپس این خروجی‌ها در اختیار شبکه ادراک چندلایه قرار داده می‌شوند. این خروجی‌ها خلاصه شده و به شبکۀ ادراک چندلایه نهایی ارسال می‌شوند تا از پاسخ خروجی گرفته شود.
شاید این فرایند قدری گیج‌کننده باشد. نمودار زیر مراحل مختلف این مدل را نشان می‌دهد.

 

گام بعدی هوش مصنوعی

اگرچه این مدل ساختار نسبتاً ساده‌ای دارد، اما گامی موثر در راستای هوش مصنوعی عمومی است و زمینه را برای ماشین‌ها فراهم می‌کند تا مثل انسان‌ها فکر کنند.

کاربردها

اکنون به برخی از کاربردهای بالقوه مدل‌های یادگیری عمیق در صورت انجامِ استدلال توجه کنید:

۱. اگر عامل‌ها بتوانند نحوه ارتباط بخش‌های مختلف محیط را درک کنند، آنها قادر خواهند بود به شکل هوشمندانه‌تری رفتار کنند.

۲. مدل‌سازی شبکه‌های اجتماعی

۳. حل مسائل انتزاعی

کلام آخر

• استدلال عمیق این فرصت را به هوش مصنوعی می‌دهد تا روابط انتزاعی میان چیزهای مختلف را درک کند.
• امکان تعبیۀ یک ماژول شبکه RN در مدل یادگیری عمیق نیز وجود دارد. با این کار، مدل می‌تواند قابلیت استدلال رابطه‌ای داشته باشد.
• استدلال عمیق ما را یک گام به هوش مصنوعی عمومی نزدیک‌تر می‌کند.

منبع: hooshio.com