مجله هوش مصنوعی

آخرین اخبار و تکنولوژی های هوش مصنوعی را در اینجا بخوانید.

مجله هوش مصنوعی

آخرین اخبار و تکنولوژی های هوش مصنوعی را در اینجا بخوانید.

برنامه پزشکی هوش مصنوعی گوگل راه‌اندازی می‌‌شود


برنامه پزشکی هوش مصنوعی گوگل خبر داغ این روزهای دنیای پزشکی و فناوری است. در طول هر سال، میلیاردها جستجو در گوگل از سوی افراد گوناگون در سراسر دنیا انجام می‌‌گیرد که برای کمک به کشف مشکل پوست‌شان به جعبه جادویی جستجوی وب مراجعه می‌‌کنند. اکنون، گوگل در حال آماده‌سازی و راه‌اندازی برنامه‌ای است که از الگوریتم‌های شناسایی تصویر برای ارائه کمک‌های تخصصی و شخصی استفاده می‌‌کند. یک نسخه آزمایشی مختصر در کنفرانس توسعه‌دهندگان شرکت گوگل در ماه گذشته نشان می‌‌دهد که این سرویس بر اساس عکس‌های آپلود شده، چندین بیماری پوستی را گزارش می‌‌دهد.

در مطالعاتی که الگوریتم‌ها و پزشکان روی تصاویر بیماران انجام می‌‌دادند، مشخص شد ماشین‌های مجهز به هوش مصنوعی که با دانش متخصصان پوست و مو آموزش دیده بودند، قادر بودند مشکل پوستی را از روی عکس تشخیص دهند و یا حتی از متخصصان بهتر عمل کنند. رکسانا دانشجو، متخصص پوست و محقق حوزه یادگیری ماشین و سلامت در این باره می‌‌گوید: «در حال حاضر شواهد بسیار  کمی از آزمایش‌های بالینی با استفاده از چنین فناوری وجود دارد و هیچ ابزار تجزیه و تحلیل تصویر هوش مصنوعی برای استفاده از متخصصان پوست در ایالات متحده تأیید نشده است.»

برنامه جدید گوگل هنوز از نظر بالینی تأیید نشده است، اما توانایی هوش مصنوعی این شرکت و ایجاد بخش‌هایی مربوط به مراقبت‌های بهداشتی، برنامه پزشکی هوش مصنوعی شرکت گوگل را قابل توجیه می‌‌کند. در کنفرانس توسعه‌دهندگان گوگل، کارن دسالوو، مدیر ارشد بهداشت گوگل، گفت که این شرکت قصد دارد به محض پایان سال جاری، آنچه را که ابزار کمکی تشخیص بیماری پوستی نام دارد و نوعی برنامه پزشکی هوش مصنوعی گوگل است را در اتحادیه اروپا راه‌اندازی کند.

امکان بهره‌برداری برنامه پزشکی هوش مصنوعی گوگل در اروپا

سخنگوی گوگل درباره ارائه برنامه پزشکی هوش مصنوعی گوگل گفت این شرکت مایل است این سرویس را در ایالات متحده ارائه دهد، اما زمان مشخصی برای ارائه آن به کشورهای آن سوی اقیانوس اطلس ندارد. سخنگوی گوگل از اظهار نظر درباره اینکه آیا شرکت با سازمان غذا و داروی ایالات متحده درباره این برنامه صحبت کرده است یا نه، امتناع کردند.

سخنگوی این شرکت می‌‌گوید: «برنامه پزشکی هوش مصنوعی گوگل به عنوان یک وسیله پزشکی کلاس یک در اتحادیه اروپا تعریف شده و تأیید شده است. به این معنی که می‌‌توان آن را در کشورهای اتحادیه اروپا و کشورهای دیگر که این استاندارد را تشخیص می‌‌دهند، به فروش رساند. هیو هاروی، مدیرعامل شرکت هاردیان هلث که یک موسسه مشاوره بهداشت دیجیتال در انگلستان است، می‌‌گوید که این شرکت برای تأمین شرایط ترخیص کالا با موانع نسبتاً کمی روبه‌رو شده است.

نسخه آزمایشی ماه گذشته برنامه پزشکی هوش مصنوعی شرکت گوگل نسخه‌ای بسیار مختصر بود و طراحی برنامه هنوز نهایی نیست. در طرحی که در نسخه نمایشی نشان داده شده است، کاربر می‌بایست سه عکس از لکه‌های پوستی خود را از زوایا و فواصل مختلف بگیرد و به هوش مصنوعی گوگل بفرستد. کاربر می‌‌تواند به صورت اختیاری اطلاعاتی مانند قسمت آسیب‌دیده بدن و مدت زمانی که این مشکل را داشته است را نیز به اطلاعات خود اضافه کند. با ضربه زدن روی دکمه «ارسال»، تصاویر برای گوگل فشرده و ارسال می‌‌شوند. این برنامه سپس «شرایط احتمالی» را نشان می‌‌دهد که وضعیت احتمالی نشان داده شده در تصاویر را شرح می‌‌دهد. با ضربه زدن روی یکی از این شرایط، لیستی از اطلاعات کلیدی مانند علائم، بیماری مسری و گزینه‌های درمانی در اختیار کاربر قرار می‌‌گیرد. این شرکت می‌‌گوید: «برنامه پزشکی هوش مصنوعی شرکت گوگل در مورد «صدها هزار تصویر پوستی» آموزش دیده است و می‌‌تواند ۲۸۸ بیماری پوستی را شناسایی کند؛ از جمله سرطان‌های پوست که تقریباً ۹۰ درصد از جستجوهای رایج در گوگل را شامل می‌‌شود.

ارزش پزشکی برنامه تشخیص بیماری پوستی گوگل

برنامه پزشکی هوش مصنوعی گوگل در پاسخ به عکس‌های کاربران حتی یک مورد را نیز به عنوان تشخیص نهایی بیماری ارائه نمی‌دهد و به کاربر همواره این هشدار را نشان می‌‌دهد که «شرایط احتمالی ذکر شده در اینجا تشخیص پزشکی نیست». سخنگوی شرکت گوگل، این اپلیکیشن را به یک موتور جستجو تشبیه کرد که نتایج را برای یک فرد نمایش می‌‌دهد و نتیجه‌گیری خود را درباره لک‌های پوستی ارائه می‌‌دهد.

با این حال گوگل همچنان بر ارزش پزشکی برنامه پوستی خود تأکید کرده است. دسالوو، رئیس گروه بهداشت این شرکت می‌گوید: «گوگل این برنامه را توسعه داده است، زیرا به اندازه کافی متخصص پوست برای کمک به هر فرد مبتلا به بیماری‌های پوستی در جهان وجود ندارد. سیستم هوش مصنوعی گوگل و برنامه پزشکی هوش مصنوعی گوگل می‌‌تواند به دقتی برسد که با متخصصان پوست مورد تایید هیئت مدیره ایالات متحده برابر باشد.»

جدیدترین اخبار هوش مصنوعی ایران و جهان را با هوشیو دنبال کنید

منبع: هوشیو

نقشه گوگل در جهت مبارزه با کرونا مکان‌های شلوغ را به صورت لحظه‌ای معرفی می‌کند‎

نقشه گوگل

نقشه گوگل توسط این شرکت در حال به روزرسانی است و قرار است اطلاعات مربوط به شلوغی را به صورت لحظه‌ای ارائه ‌دهد. با توجه به این که این روزها یافتن زمان شلوغی فضای عمومی یا ایستگاه‌های مترو فقط برای راحتی نیست، بلکه به طور بالقوه می‌تواند جان انسان‌ها را نجات دهد، این اقدام گوگل می‌تواند اهمیتی ویژه داشته باشد. همچنین این شرکت می‌گوید که در حال حاضر اطلاعات مربوط به زمان‌بندی را برای ۲۰ میلیون مکان در سراسر جهان فراهم کرده تا به شما کمک کند از ازدحام زیاد جلوگیری کنید.

نقشه گوگل بیش از یک سال است که به کاربران در زمینه شلوغ بودن خطوط اتوبوس، قطار یا مترو کمک می‌کند، اما به جای ارائه داده‌های لحظه‌ای، کار پیش‌بینی ترافیک را انجام می‌دهد. امروزه اما در صورتی که کاربران امکان دسترسی به موقعیت مکانی خود را از طریق تلفن همراهشان به نقشه گوگل بدهند، سرویس‌ جدید مبتنی بر هوش مصنوعی این شرکت با استفاده از داده‌های لحظه‌ای شرایط ترافیکی را برای کاربر تفسیر می‌کند.

نقشه گوگل

از آنجایی که بسیاری از ما قرار است حتی ماه‌های آینده را هم به دلیل همه‌گیری کرونا در خانه بگذرانیم، گوگل به دنبال راه‌اندازی سرویسی برای پیگیری لحظه‌ای خرید هم هست. برای مثال اگر از طریق برنامه نقشه گوگل سفارش غذا داده باشید و در ایالات متحده آمریکا، کانادا، آلمان، استرالیا، برزیل یا هند مستقر باشید، می‌توانید غذای خود را از آشپزخانه تا درب منزل دنبال کنید. این پلتفرم در حال حاضر این توانایی را دارد که زمان انتظار و تخمین هزینه‌های تحویل را با کمک گوگل و بخش نقشه آن ارائه دهد.

اما خدمات گوگل فقط به این برنامه محدود نمی‎‌شود. قرار است نقشه گوگل به زودی سرویس «حالت دستیار رانندگی» را ارائه دهد. این ویژگی پیش از این و در برنامه‌های هوش مصنوعی گوگل در سال ۲۰۱۹ مورد آزمایش قرار گرفته است. هنگام رانندگی، تلفن شما به یک صفحه نمایش اصلی تبدیل می‌شود که به شما این امکان را می‌دهد که ببینید کجا می‌روید، به پیام‌ها پاسخ دهید و موسیقی پخش کنید. تنها کاری که باید انجام دهید این است که از طریق فرمان صوتی با صدای خود به گوگل بگویید تنظیمات دستیار را باز کرده و حالت رانندگی را فعال کند.

 

انواع کاربردهای هوش مصنوعی در صنایع مختلف را در هوشیو بخوانید

منبع: hooshio.com

PEGASUS جدیدترین مدل خلاصه سازی انتزاعی گوگل


« PEGASUS: پیش‌آموزش با جملات استخراج شده برای خلاصه ‌سازی انتزاعی »هوش مصنوعی گوگل این مقاله را پیشنهاد داده است. خلاصه‌ سازی انتزاعی، مفهوم مهمی به شمار می‌آید. در مطلب حاضر می‌خواهیم مقاله‌ای را بررسی کنیم که به تازگی منتشر شده است:

شاید بهترین راه برای سنجش هوش افراد، توانایی آنها در خلاصه‌سازی باشد.لیتون استریچی

PEGASUS: پیش‌آموزش با جملات استخراج شده برای خلاصه سازی انتزاعی

مدل PEGASUS مانند هر مدل تبدیل جمله دیگری از معماری seq2seq استفاده میکند. نوآوری این مدل در معیار پیش‌آموزش خودنظارتیش نهفته است. یادگیری خودنظارتی ابزار جدید و کارآمدی در یادگیری عمیق است. این نوع یادگیری ما را از وابستگی داده‌ها به نمونه‌های برچسب‌دار بی‌نیاز می‌کند و باعث می‌شود حجم قابل ملاحظه‌ای از داده‌های بدون برچسب در فرایند آموزش در دسترس قرار گیرد. ترکیب مدل‌های مبتنی بر Transformer با روش پیش‌آموزش خودنظارتی (مثل BERT، GPT-2، XLNet، ALBERT، T5 و ELECTRA) در مدل‌سازی زبان تاثیر بسزایی بر جای گذاشته است.

روش GAP SENTENCES GENERATION: هدف خودنظارتی برای خلاصه سازی

خلاصه‌ سازی انتزاعی

روش پیش‌آموزش خودنظارتی در PEGASUS

ایده اصلی روش فوق این است که هر قدر روش پیش‌آموزش خودنظارتی به هدف و وظیفه اصلی نزدیکتر باشد، تنظیم دقیق به شکل بهتری انجام خواهد شد. همان طور که در شکل ملاحظه می‌کنید، در مدل PEGASUS، جملات کامل از سند حذف می‌شوند و مدل برای پیش‌بینی این جملات آموزش داده می‌شود. البته محققان بر این باورند که این کار حتی توسط انسان تقریباً امکان‌ناپذیر است. اما باید به این موضوع توجه داشت که این نوع آموزش باعث می‌شود درک بالاتری از تولید جملات به دست آوریم. این فرایند با عنوان Gap Sentences Generation یا به اختصار GSG نامیده می‌شود. افزون بر این، محققان اعلام کرده‌اند که گزینشِ مهم‌ترین جملات از سند می‌تواند بسیار کارآمد باشد. در همین راستا، بر اساس معیار سنجش ROUGE باید به دنبال جملاتی بود که شباهت بالایی به متن کامل دارند. ROUGE معمولاً برای ارزیابی کیفیت خلاصه مورد استفاده قرار می‌گیرد.

مدل زبان ماسک شده (MLM)

اگر چه ایده اصلی PEGASUS یک GSG است، اما معماری اصلی آن از یک رمزگشا و یک رمزگذار تشکیل یافته است؛ از این رو، منطقی است که بخواهیم رمزگذار را در قالب مدل زبان ماسک‌شده پیش‌آموزش دهیم.

 

خلاصه‌ سازی انتزاعی

مدل‌سازی زبان و مدل‌سازی زبان ماسک‌دار (Masked)

بر این اساس، واژه‌ها را بطور تصادفی از توالی جدا کرده و از دیگر واژه‌های توالی برای پیش‌بینی واژه‌های ماسک‌ شده استفاده می‌کنیم. طبق ایده‌ای که از مقالات گرفته‌ایم، ۱۵ درصد از واژه‌های توالی به صورت تصادفی ماسک‌ شده‌اند و مدل هم برای پیش‌بینی این واژه‌ها آموزش داده‌ می‌شود.

آموزش ترکیبی

هر دو روشی که در بخش‌های قبل در موردشان بحث شد، به کار گرفته می‌شوند. همچنین، Transformer به صورت ترکیبی آموزش داده می‌شود.

خلاصه‌ سازی انتزاعی

آموزش ترکیبی MLM و GSG در مدل PEGASUS

در مثال فوق هر دو روش‌ MLM و GSG به صورت همزمان به عنوان اهداف پیش آموزش داده شده کار برده می‌شوند. در ابتدا، سه جمله وجود دارد. یکی از جملات با [MASK1] ماسک شده و به عنوان متن تولیدی هدف GSG استفاده می‌شود. دو جمله دیگر در ورودی باقی می‌مانند، اما برخی کلمات به صورت تصادفی توسط [MASK2] ماسک می‌شوند.
نتایج
مدل بر روی ۱۲ دیتاست خلاصه سازی انتزاعی عمومی به صورت دقیق تنظیم می‌شود. همانطور که ملاحظه می‌کنید پیشرفت قابل توجهی در این زمینه حاصل شده و آموزش با نمونه‌های بسیار کمتری انجام شده است.

تنطیم دقیق

 

خلاصه‌ سازی انتزاعی

انواع گوناگون معیار سنجش ROUGE در چهار دیتاست منتخب. در این شکل به روشنی می‌بینیم که مدل PEGASUS با حداقل ۱۰۰۰ نمونه آموزش، عملکرد بسیار خوبی از خود بر جای گذاشته است.

 

خلاصه‌سازی توسط انسان

مدل PEGASUS در ۳ دیتاست موفق شده به نتایجی همسنگ با انسان دست پیدا کند. فرایند ارزیابی با امتیازدهی به خلاصه‌سازی انسان و خلاصه‌سازی مدل انجام گردیده است. در این فرایند، اصلاً معلوم نیست که کارها توسط مدل خلاصه شده‌اند یا توسط انسان. این آزمایش با سه دیتاست مختلف انجام شد. بر اساس نتایج، افرادی که به کارها امتیاز دادند، خلاصه‌سازی مدل را به انسان ترجیح دادند.

شمردن کشتی‌ها

استفاده از مدل PEGASUS باعث شد نتیجه جالب دیگری هم حاصل آید. مقاله مربوط به دیتاست Xsum، نام چهار کشتی را پیشنهاد داد. این کشتی‌ها عبارتند از HMS Cumberland، HMS Campbeltown، HMS Chatham و HMS Cornwall. مدل PEGASUS به درستی این مسئله را با عنوان «چهار فروند کشتی ناوگان سلطنتی» بررسی می‌کند، اگرچه اصلاً به عدد «چهار» در نمونه اشاره نمی‌شود. اگر ۲ تا ۵ نام وجود داشته باشد، مدل به درستی تعداد را خلاصه می‌کند. البته این مدل ۶ کشتی را با ۷ کشتی اشتباه گرفته بود. این نتیجه نشان می‌دهد که مدل فقط قادر است اسامی محدودی را در لیست خلاصه کند. حقیقت جالب اینکه مدل به نتایج بهتری نسبت به مدل اولیه مانند T5 دست یافت، این در حالی است که تنها از ۵% از تعداد پارامترهای T5 را شامل می‌شود.

نتیجه‌گیری

در مقاله حاضر، جدیدترین مدل خلاصه سازی انتزاعی گوگل بررسی شد. همچنین ما نشان دادیم که پیش آموزشی که شبیه به وظیفه نهایی است چگونه کارایی مدل را در تنظیم دقیق افزایش می‌دهد. اکنون زمینه برای مدل‌سازیِ فعالیت‌های پیش‌آموزش خودنظارتی فراهم شده است.

منبع: hooshio.com

OpenAI و مایکروسافت در هوش مصنوعی عمومی با یکدیگر همکاری می‌کنند


حدود یک سال پیش، شرکت مایکروسافت با انتشار خبری اعلام کرد که خواهان سرمایه‌گذاری یک میلیاردی در OpenAI است. هدف از همکاری OpenAI با مایکروسافت، توسعه فناوری‌های جدید برای پلتفرم ابری «Azure»در هوش مصنوعی عمومی مایکروسافت و گسترش قابلیت‌های هوش مصنوعی بزرگ‌مقیاس عنوان شد.

تحقق این هدف به بکارگیری هوش مصنوعی عمومی بستگی دارد. OpenAI نیز به نوبه خود توافق کرد تا بخشی از مالکیت فکری‌اش را در اختیار مایکروسافت بگذارد. به این ترتیب، مایکروسافت می‌تواند اقدام به تجاری‌سازی و فروش آن به شرکایش کرده و مدل‌های هوش مصنوعی را در Azure آموزش داده و به اجرا دربیاورد. در همین راستا، OpenAI در تلاش بوده تا سخت‌افزارهای رایانش نسل بعدی را توسعه دهد.در جریان کنفرانس توسعه‌دهندگان بیلد مایکروسافت در سال ۲۰۲۰، نخستین ثمرۀ همکاریِ میان این دو در قالب یک ابررایانه جدید اعلام شد. بنا به اعلام مایکروسافت، این ابررایانه با همکاری OpenAI در Azure ساخته شده است. شرکت مایکروسافت مدعی شده که این ابررایانه در مقایسه با TOP 500 پنجمین ماشین قدرتمند جهان به شمار می‌آید؛ گفتنی است که پروژه TOP 500 جزئیات پانصد ابررایانه برتر جهان را بررسی می‌کند. بر اساس جدیدترین رتبه‌بندی، ابررایانه «OpenAI» یک رتبه پایین‌تر از Tianhe-2A (متعلق به مرکز ملی ابررایانه چین) و یک رتبه بالاتر از Frontera (متعلق به مرکز رایانه پیشرفته تگزاس) قرار دارد. این رتبه‌بندی نشان می‌دهد که ابررایانه «OpenAI» قادر است بین ۳۸.۷ تا ۱۰۰.۷ کوادریلیون عملیات در هر ثانیه انجام دهد.

«OpenAI» از مدت‌ها پیش اعلام کرده قدرت رایانش خارق‌العاده‌ای برای تحقق اهداف هوش مصنوعی عمومی نیاز است. این پیشرفت به هوش مصنوعی نیز در یادگیری همه فعالیت‌های انسان کمک شایانی خواهد کرد. برخی افراد از قبیل «یوشوآ بنجیو» موسس Mila و «یان لِکان» دانشمند هوش مصنوعی بر این باورند که هوش مصنوعی عمومی نمی‌تواند وجود داشته باشد؛ اما بنیان‌گذاران و حامیان «OpenAI» که از جمله سرشناس‌ترینِ آنها می‌توان به گرِگ بروکمن، ایلیا ساتسکور، ایلان ماسک، راید هافمن، رئیس سابق Y Combinator به نام سَم آلتمن اشاره کرد، معتقد هستند که رایانه‌های قدرتمند می‌توانند در کنار یادگیری تقویتی و سایر روش‌‍‌ها به پیشرفت‌های کم‌نظیری در حوزه هوش مصنوعی دست یابند.

مزایای مدل‌های بزرگ

ماشین «OpenAI» حاوی بیش از ۲۸۵.۰۰۰ پردازنده مرکزی، ۱۰.۰۰۰ کارت گرافیکی و قابلیت اتصال ۴۰۰ گیگابیت بر ثانیه اتصال می‌باشد. این ماشین برای آموزشِ مدل‌های بزرگ هوش مصنوعی طراحی شده است؛ مدل‌هایی که با بررسی میلیاردها صفحه متن از کتاب‌ها، کتابچه‌های راهنما، دروس تاریخ، دستورالعمل‌های منابع انسانی و سایر منابعی که در دسترس عموم قرار دارند، اقدام به یادگیری می‌کند. از جمله این منابع می‌توان به مدل پردازش زبان طبیعیNVIDIA اشاره کرد که ۸.۳ میلیارد پارامتر را در دل خود جای داده است؛ یا حتی متغیرهای قابل تنظیمی که درون مدل تعبیه شده‌اند. مقادیرِ این متغیرها در انجام پیش‌بینی مورد استفاده قرار می‌گیرند. جزئیات منابع دیگر به صورت زیر خلاصه شده است:

  1. Turing NLG شرکت مایکروسافت (دارای ۱۷ میلیارد پارامتر) که پیشرفته‌ترین نتایج را در چند شاخص معیار زبانی به دست می‌آورد؛
  2. چارچوب ربات گفتگوی Blender متعلق به فیس‌بوک (با ۹.۴ میلیارد پارامتر)
  3. و مدل GPT-2 متعلق به «OpenAI» (با بیش از ۱.۵ میلیارد پارامتر) که قادر است متونی در سطح انسان ایجاد کند.

سَم آلتمن، مدیر عامل «OpenAI» اظهار داشت: «هر چه اطلاعات بیشتری در خصوص نیازها و محدودیت‎های مختلف اجزای سازنده ابررایانه‌ها به دست می‌آوریم، این پرسش برجسته‌تر می‌شود: سیستم رویایی مد نظرمان چه شکل و شمایل و چه ویژگی‌هایی خواهد داشت؟ مایکروسافت توانست جامه عمل به این هدف بپوشاند. اکنون شاهد این هستیم که سیستم‌های بزرگ‌مقیاس جزء بسیار مهمی در آموزشِ مدل‌های قدرتمند هستند.»

در هوش مصنوعی عمومی

ابزار پاسخگویی هوشمند Outlook از مدل‌های یادگیری عمیقی استفاده می‌کند که در یادگیری ماشین Azure آموزش دیده‌اند.

یافته‌ها حاکی از آن است که این مدل‌های بزرگ عملکرد بسیار خوبی از خود بر جای می‌گذارند زیرا قادر به درک نکات ظریف زبان، دستور زبان، دانش، مفاهیم و بافت هستند. افزون بر این، سیستم‌های مذکور می‌توانند گفتار را خلاصه کنند، اسناد حقوقی پیچیده را تجزیه و تحلیل نمایند و از GitHub کدنویسی را آغاز کنند. مایکروسافت از مدل‌های تورینگِ خود برای تقویت درک زبان در Bing، نرم‌افزار آفیس، Dynamics و سایر محصولات بهره‌وری‌اش استفاده کرده است. مدل‌ها توانستند در Bing نقش تقویتی مهمی در کپشن‌سازی و پاسخگویی به پرسش‌ها ایفا کنند. این مدل‌ها در نرم‌افزار آفیس هم نقش قابل توجهی در توسعۀ هر چه بیشتر ابزارهای Smart Lookup (جستجوی هوشمند) و Key Insights داشتند. Outlook از این مدل‌ها برای پاسخ‌های پیشنهادی استفاده می‌کند. این مدل‌ها در Dynamics 365 Sales Insights نیز به کمک فروشندگان شتافته‌اند تا تمهیدات مناسبی را با توجه به تعاملات پیشین با مشتریان در نظر بگیرند.

از دیدگاه فنی، مدل‌های بزرگ عملکرد بهتری نسبت به مدل‌های پیشین خود دارند و از قابلیت خود نظارتی بهره می‌برند؛ یعنی قادرند با بررسی روابط میان بخش‌های مختلف داده، برچسب‌ ایجاد کنند. به باور محققان، این کار ما را یک گام به تحقق هوش مصنوعی در سطح انسان نزدیک‌تر می‌کند. این اقدام بر خلاف الگوریتم‌های یادگیری با نظارت است؛ تنظیم این الگوریتم‌ها در اموری که به صنایع، شرکت‌ها و موضوعات خاصی اختصاص دارد، کار را دشوارتر می‌کند. «کِوین اسکات» مسئول فنی شرکت مایکروسافت بیان کرد: «نکته هیجان‌انگیزِ مدل‌های یاد شده این است که کاربردهای گوناگونی در بخش‌های مختلف دارند. این مدل‌ها قادرند صدها فعالیت مهم در حوزه پردازش زبان طبیعی و بینایی رایانه انجام دهند. در صورتی که این قلمروهای مختلف با یکدیگر ادغام شوند، شاهد کاربردهای جدیدی خواهیم بود که پیشتر تصور نمی‌شد.»

بکارگیری هوش مصنوعی در مقیاس بزرگ

مدل‌هایی که در خانواده تورینگ جای می‌گیرند، فاصله زیادی با هوش مصنوعی عمومی دارند؛ مایکروسافت اعلام کرده که در حال استفاده از یک ابررایانه برای بررسی آن دسته از مدل‌های بزرگی است که قادرند به صورت تعمیم یافته از متون، تصاویر و داده‌های ویدئویی یاد بگیرند. OpenAI نیز همین رویه را در پیش گرفته است. همان‌طور که مجله MIT Technology Review در ابتدای سال جاری اعلام کرد، یکی از تیم‌های فعال در OpenAI به نام Foresight در حال انجام آزمایش‌هایی برای بررسی ارتقای قابلیت‌های هوش مصنوعی است. تیم Foresight با حجم عظیمی از داده اقدام به آموزش الگوریتم‌ها می‌کند. بر اساس همین منبع خبری، OpenAI در حال توسعه سیستمی با استفاده از منابع محاسباتی عظیم است که از تصاویر، متون و سایر داده‌های برای کار آموزش کمک می‌گیرد. مدیران ارشد شرکت بر این باورند که این مسیر سرانجام می‌تواند به هوش مصنوعی عمومی ختم شود. بروکمن و آلتمن اعتقاد دارند که هوش مصنوعی عمومی قادر به ارائه عملکردی درخشان در بسیاری از حوزه‌ها خواهد بود. این فناوری خواهد توانست آن دسته از پیوندهای پیچیده‌ای را مورد شناسایی قرار دهد که کارشناسان انسان در بررسی آنها عاجز مانده‌اند. افزون بر این، محققان اظهار داشتند که اگر هوش مصنوعی عمومی با همکاری نزدیک محققان رشته‌های مرتبطی نظیر علوم اجتماعی به کار برده شود، زمینه برای رفع چالش‌های بزرگ در بهداشت و درمان، تغییرات آب و هوا و آموزش و پرورش فراهم خواهد آمد.

این موضوع کماکان در هاله‌ای از ابهام قرار دارد که آیا این ابررایانه جدید توان کافی برای رسیدن به سطح هوش مصنوعی عمومی را دارد یا خیر. بروکمن سال گذشته در مصاحبه با روزنامه «Financial Times» خاطرنشان کرد: «انتظار داریم کل سرمایه یک میلیاردیِ مایکروسافت را تا سال ۲۰۲۵ برای ساخت سیستمی هزینه کنیم که قابلیت اجرای یک مدل هوش مصنوعی به اندازه مغز انسان را داشته باشد.» در سال ۲۰۱۸، محققان OpenAI با انتشار مطالب تحلیلی اعلام کردند که میزان محاسباتِ بکار رفته در بزرگ‌ترین موارد آموزش هوش مصنوعی بیش از ۳۰۰.۰۰۰ برابر افزایش یافته است؛ یعنی هر ۳.۵ ماه دو برابر گردیده است. پس می‌بینیم که سطح عملکرد فراتر از پیش‌بینی قانون مورمی‌باشد. چندی پیش، IBM جزئیات مربوط به رایانه عصبیرا منتشر کرد؛ این رایانه از صدها تراشه برای آموزش هوش مصنوعی استفاده می‌کند. NVIDIA نیز به نوبه خود خبر از انتظار سرور ۵ پِتافلاپی بر پایه کارت گرافیکی A100 Tensor Core خود تحت عنوان A100 داد.

شواهد و قرائن حاکی از آن است که بهبود کارآیی شاید توان جبران نیازهای فزایندۀ محاسبات را داشته باشد. بر اساس یکی از نظرسنجی‌های اخیر OpenAI، میزان محاسبات لازم برای آموزش مدل‌های هوش مصنوعی از سال ۲۰۱۲ هر ۱۶ ماه یک بار تا دو برابر کاهش یافته است. اما این موضوع کماکان جای بحث و بررسی دارد که محاسبه تا چه اندازه در مقایسه با روش‌های الگوریتمی جدید موجب ارتقای سطح عملکرد می‌شود. البته نباید این موضوع را فراموش کرد که OpenAI با منابع اندکی که در اختیار دارد، به بازده هوش مصنوعی بالایی در بازی‌ها و حوزه‌ای تحت عنوان media synthesis دست یافته است. در پلتفرم ابری گوگل، سیستم OpenAI Five توانست بازیکنان حرفه‌ای Dota 2 را با کارت گرافیکی ۲۵۶ Nvidia Tesla P100 و ۱۲۸.۰۰۰ هسته پردازنده شکست دهد؛ کاری که عملاً به ۱۸۰ سال بازی نیاز داشت. شرکت گوگل به تازگی سیستمی را با ۶۴ کارت گرافیکی Nvidia V100 و ۳۲ هسته پردازنده آموزش داد تا مکعب روبیک را با دست رباتیک حل کند. البته باید به این نکته اشاره کرد که میزان موفقیت نسبتاً پایینی داشت. افزون بر این، مدل Jukebox متعلق به OpenAI اقدام به شبیه‌سازی با ۸۹۶ کارت گرافیکی V100 نمود تا در هر سبکی تولید موسیقی کند.

فرصت‌های جدید در بازار

در حال حاضر مشخص نیست که این ابررایانه گامی کوچک یا جهشی بزرگ در هوش مصنوعی عمومی است، اما ابزارهای نرم‌افزاریِ استفاده شده در طراحی آن می‌تواند فرصت‌های بازار جدیدی را برای مایکروسافت فراهم کند. مایکروسافت به واسطه طرح جدیدش در هوش مصنوعی منابع را در دسترس قرار می‌دهد تا مدل‌های بزرگی را در شبکه‌های هوش مصنوعی Azure آموزش دهد. در همین راستا، داده‌های آموزشی به پشته‌هایی تقسیم می‌شوند از آنها برای آموزش چندین مدل در خوشه‌ها استفاده می‌شود. از جمله این منابع می‌توان به نسخه جدید DeepSpeed (یک کتابخانه هوش مصنوعی برای چارچوب یادگیری ماشین PyTorch فیس‌بوک) اشاره کرد که مدل‌ها را با زیرساخت یکسان تا ۱۰ برابر سریع‌تر آموزش می‌دهد. آموزش توزیع شدهدر ONYX در صورتی که با DeepSpeed استفاده شود، این قابلیت را در اختیار مدل‌ها قرار می‌دهد تا سطح عملکرد تا ۱۷ برابر ارتقاء پیدا کند. «کِوین اسکات» مسئول فنی شرکت مایکروسافت در پایان خاطرنشان کرد: «ما با توسعه زیرساخت‌های پیشرفته برای آموزش مدل‌های بزرگ هوش مصنوعی قصد داریم Azure را ارتقاء دهیم. ساخت رایانه‌های بهتر، سیستم‌های توزیع شدۀ بهتر، شبکه‌های بهتر و دیتاسنترهای بهتر در دستور کار ما قرار دارد. این اقدامات به ارتقای سطح عملکرد و انعطاف‌پذیریِ ابر Azure کمک کرده و منجر به صرفه‌جویی در هزینه‌ها خواهد شد.»

منبع: hooshio.com

مایکروسافت کیت بینایی هوش مصنوعی را در دسترس عموم قرار داد


در ماه مه سال ۲۰۱۸، مایکروسافت در کنفرانس سالانه خود در سیاتل تحت عنوان «Build» از همکاری با کوالکام خبر داد. هدف از این همکاری، ساخت کیت توسعه‌دهنده بینایی با استفاده از کامپیوتر بود.

این کیت بینایی هوش مصنوعی مایکروسافت، یک پایه سخت‌افزاری ساخته شده بر روی بستر اطلاعاتی ویژوال کوالکام است؛ که برای اجرای مدل‌های هوش مصنوعی بصورت لوکال و ادغام در سرویس‌های ابری مایکروسافت Azure ML و Azure IoT Edge طراحی و ساخته شده است؛ لازم به ذکر می‌باشد که Azure ML و Azure IoT Edge در ماه اکتبر گذشته در دسترس عموم قرار گرفتند.

مایکروسافت و کوالکام مدتی پیش اعلام کردند که کیت بینایی هوش مصنوعی ساخته شده توسط eInfochips اکنون با قیمت ۲۴۹ دلار از طریق توزیع کننده Arrow Electronics به صورت انبوه در دسترس عموم می‌باشد.

این کیت نرم‌افزار دارای کدهای ویژوال استودیو با ماژول‌های پایتون، یک ترکیب پیش‌ساز گسترش یافته Azure IoT و یک افزونه کیت بینایی هوش مصنوعی مایکروسافت برای ویژوال استودیو در Github است. یک ماژول پیش‌فرض هم دارد که بیش از ۱۸۳ شیء مختلف را تشخیص می دهد. باید به این نکته اشاره کرد که Github یک کمپانی امریکایی ارائه‌دهنده سرویس های هاستینگ است.

«آنه یانگ» مدیر پروژه مایکروسافت اظهار داشت که کیت توسعه‌دهنده بینایی ماشین هوش مصنوعی می‌تواند برای ساخت آن دسته از نرم‌افزارهایی مورد استفاده قرار بگیرد که این اطمینان را بدهد که همه افراد محل‌های ساخت‌وساز از کلاه ایمنی استفاده می‌کنند.این کیت یک ابزار کاملا کاربردی است.

وی در وبلاگ خود نوشت:

«در پروسه هوش مصنوعی از میلیاردها مگابایت اطلاعات و میلیاردها محاسبات استفاده می‌شود. اکنون با این سخت‌افزار می‌توان پروژه‌ها و کارهایی را در زمان کم تحویل داد. افزون بر این، امکان ارسال خروجی برای نرم‌افزارهای پایین‌دستی با سرویس ابری نیز وجود دارد.»

کیت بینایی هوش مصنوعی مایکروسافت

مایکروسافت

توسعه دهندگانی که با این کیت سر و کار دارند می توانند از سرویس Azure برای ساخت مدل، نظارت بر آن و همچنین از ابزارهای تخصصی برای سرویس Edge هم بهره ببرند. این کیت ها برای ساخت مدل های هوش مصنوعی مبتنی بر بینایی ماشین، ابتدا عکس های برچسب خورده را به فضای ذخیره سازی Azure آپلود می کنند، سپس بقیه کار را به صورت سفارشی به سرویس یادگیری ماشین Azure (AML) می سپارند.

مدل های ساخته شده به فرمت DLC تبدیل می شوند و در نهایت به صورت بسته بندی شده به ماژول IOT Edge تحویل داده می شوند.

کیت بهبود بینایی هوش مصنوعی مایکروسافت که با سیستم عامل Yocto Linux کار می کند دارای یک Qualcom Snapdragon 603 در هسته خود می‌باشد که با ۴ گیگابایت LDDR4X و ۶۴ گیگابایت حافظه پردازنده عمل می‌کند. حسگر دوربین ۸ مگاپیکسلیِ آن قادر به ضبط فیلم با کیفیت ۴K UHD است. چهار میکروفون مخصوص نیز صداها و دستورات را ضبط می‌کند.

امکان اتصال به کیت بهبود بینایی هوش مصنوعی مایکروسافت باWi-Fi وجود دارد که مشخصات آن به شرح زیر است:

(۸۰۲.۱۱b/g/n 2.4Ghz/5Ghz). اما دارای درگاه HDMI خروجی، درگاه‌های صوتی داخل و خارج و پورتUSB-C برای انتقال داده و کارت Micro SD برای افزایش فضای ذخیره‌سازی است.

موتور پردازش عصبی snapdragon در سامانه موسوم به Qualcomm’s Vision Intelligence 300 توسط سرویس‌های Azureمورد پشتیبانی قرار می‌گیرد. این سامانه، کیت تقویت بینایی هوش مصنوعی را به اولین سامانه فوق‌سریع تبدیل می‌کند که توسط Azure پشتیبانی می‌شود.

«آنه یانگ» مدیر پروژه مایکروسافت در ادامه بیان کرد:

«با استفاده از کیت تقویت بینایی هوش مصنوعی، می‌توانید بدون در نظر گرفتن سطح مهارت فعلی یادگیری ماشین خود، مدل‌های بینایی را در عرض چند دقیقه توسعه دهید.»

کیت تقویت بینایی هوش مصنوعی رقیبی به نام «AWS DeepLens» در آمازون دارد که این فرصت را در اختیار توسعه‌دهندگان قرار می‌دهد تا مدل‌های یادگیری عمیق را به صورت محلی در دوربین‌های سفارشی به اجرا در بیاورند.

لذا بر اساس آنچه این دوربین می‌بیند و ذخیره می‌کند، امکان تجزیه و تحلیل و اقدام وجود دارد. شرکت گوگل نیز که نمی‌خواست از قافله عقب بماند، «Coral Dev Board» را چندی پیش روانه بازار کرد؛ یک کیت سخت‌افزاری برای محاسبات هوش مصنوعی که به دوربین USB ‌خور مجهز می‌باشد.

منبع: hooshio.com