مجله هوش مصنوعی

آخرین اخبار و تکنولوژی های هوش مصنوعی را در اینجا بخوانید.

مجله هوش مصنوعی

آخرین اخبار و تکنولوژی های هوش مصنوعی را در اینجا بخوانید.

فناوری هوش مصنوعی و چالش‌های جهانی


فناوری هوش مصنوعی

هر کشوری که پیشرفته‌ترین فناوری هوش مصنوعی را در اختیار داشته باشد می‌تواند بر دنیا حکومت کند. هوش مصنوعی مهم‌ترین فناوری قرن بیست و یکم به شمار می‌رود به همین دلیل باید از برنامه‌ها و فعالیت‌های سایر کشورها در حوزه هوش مصنوعی آگاه باشیم.

در مقاله پیش رو جایگاه فناوری هوش مصنوعی را در سطح جهانی بررسی می‌کنیم و به دنبال آن مسائلی همچون مباحثات سیاسی، داده‌ها، مسائل اقتصادی، کسب‌وکارهای نوپا، تأمین مالی، تحقیق و پژوهش و زیرساخت را مورد مطالعه و بررسی قرار می‌دهیم. در این مقاله مروری اجمالی خواهیم داشت بر ابرقدرت‌های کنونی این حوزه یعنی چین و ایالات متحده و در آینده در مقالاتی جداگانه جایگاه و موقعیت فن‌آوری هوش مصنوعی را در این دو کشور توضیح خواهیم داد. سؤالی که در نهات مطرح می‌شود این است که بشر چگونه با چالش‌های جهانی هوش مصنوعی مقابله خواهد کرد.

 

سیاست‌مداران باید توجه بیشتری به فناوری هوش مصنوعی نشان دهند

اولین موج دیجیتالی کردن در حالی بسط و گسترش پیدا کرد که دولت‌ها دخالت و تأثیر چندانی در شکل‌گیری آن نداشتند. اگرچه طرح‌هایی در دست اقدام است تا انحصار گوگل شکسته شود ( ایالات متحده و اروپا)، برای مثال کشورهای اروپایی شرکت‌های گوگل و فیسبوک را به پرداخت جریمه‌های نقدی محکوم می‌کنند، اما سیاست‌مداران بیش از یک دهه است که از این بازار غافل بوده‌اند.

برای اولین بار در تاریخ و با در نظر گرفتن اهمیت فن‌آوری هوش مصنوعی متوجه شدم که دولت‌های بسیاری اقدامات، طرح‌های ابتکاری و استراتژی‌های متعددی در حوزه هوش مصنوعی تدوین کرده‌اند و این در حالی است ‌که هر کدام از این دولت‌ها اهداف گوناگونی را دنبال می‌کنند و رویکردهای متفاوتی در این راستا اتخاذ کرده‌اند.

فناوری هوش مصنوعی مسئله‌ای است که سیاست‌مداران و دولت‌ها ناگزیر با آن مواجه هستند و خواهند بود. فناوری‌های هوش مصنوعی می‌توانند در پیش‌گیری از تغییرات آب‌و‌هوایی و سیاست‌های اقتصادی مؤثر واقع شوند. علاوه بر این هوش مصنوعی مدیریت و حاکمیت صنایع داخلی، امنیت و حریم خصوصی شهروندان را تحت تأثیر قرار می‌دهد.

از این روی ضروری است دولت‌ها استراتژی بلند مدتی برای پایه‌ریزی  و توسعه فناوری هوش مصنوعی تدوین کنند. اما تدوین چنین استراتژی‌ای هزینه‌بر خواهد بود. برای مثال اروپا در تدوین استراتژی‌های بلند مدت و استراتژی‌های سرمایه‌گذاری با مشکلاتی مواجه است.

فناوری هوش مصنوعی

در مقابل کشور چین برنامه مشخصی برای کنترل و نظارت بر فناوری هوش مصنوعی دارد. چین معتقد است فناوری هوش مصنوعی ابزار مهمی برای سیاست‌های خارجی قوی، سلطه نظامی، پیشرفت اقتصادی و هم‌چنین کنترل و نظارت بر جمعیت یک کشور است.

ایالات متحده تحقیقات و پژوهش‌های بی‌شماری در حوزه هوش مصنوعی انجام می‌دهد و از وجود شرکت‌های بزرگی همچون گوگل، مایکروسافت، فیسبوک و آمازون بهره‌مند است و این در حالی است که هر کدام از این شرکت‌ها در زمینه توسعه فناوری هوش مصنوعی پیشگام هستند.

هرچند دونالد ترامپ تاکنون اقدمات ویژه‌ای در زمینه هوش مصنوعی انجام نداده اما دولت ایالات متحده دهه‌ها است که از طریق وزارت‌خانه‌ها و سرویس‌های مخفی خود به تحقیق و پژوهش در زمینه هوش مصنوعی مشغول است و فن‌آوری‌های هوش مصنوعی را در حوزه‌های گوناگون پیاده‌سازی و اجرا می‌کند.

دو کشور کانادا و فلسطین اشغالی از اهمیت یکسانی برخوردار هستند اما نسبت به سایر کشورهایی که بر سر هوش مصنوعی با یکدیگر به رقابت می‌پردازند، پیشرفت‌های کمتری دارند.

فلسطین اشغالی در حوزه فناوری پیشتاز است و تعداد شرکت‌های هوش مصنوعی این کشور نسبت به مجموع شرکت‌های هوش مصنوعی آلمان و فرانسه بیشتر است ( برای کسب اطلاعات بیشتر به چشم‌انداز جهانی هوش مصنوعی رجوع کنید). دانشگاه‌های متعددی در فلسطین اشغالی وجود دارد و علاوه بر این، این کشور به بازارهای سرمایه آسیا و آمریکا دسترسی دارد و با دولت و صنایع نظامی همکاری‌های نزدیکی دارد. Intel یکی از شرکت‌های این کشور موسوم به Mobileye را به قیمت ۱۵ میلیارد دلار خریداری کرد و  این تنها نمونه کوچکی از فضای پویای هوش مصنوعی در فلسطین اشغالی است.

طی ۷ سال گذشته کشور کانادا تا حد زیادی از مزایای فن‌آوری یادگیری عمیق بهره‌مند شده است. جفری هینتون، یان لوگن، یوشیا بنگیومشهورترین پژوهش‌گران این حوزه هستند. هر سه پژوهش‌گر مذکور در دوره‌های مختلف در مؤسسه تحقیقات پیشرفته کانادا مشغول به تحقیق و پژوهش بوده‌اند. این سه پژوهش‌گر توانستند از آخرین «زمستان هوش مصنوعی» عبور کنند و از آن زمان به بعد در حال شکل‎‌دهی بازار هستند.

کشور کانادا استراتژی مشخصی برای هوش مصنوعی در اختیار دارد و  سال‌ها است که به تحقیق و پژوهش، سرمایه‌گذاری و پیاده‌سازی و اجرای فن‌آوری‌های هوش مصنوعی مشغول است.

علاوه بر این سه کشور ژاپن، کره و هند نیز پیش‌نیازهای لازم برای آن‌که طی سال‌های آتی نقش مؤثری در حوزه هوش مصنوعی ایفا کنند را در اختیار دارند.

برای کسب اطلاعات بیشتر در این زمینه می‌توانید گزارش استراتژی‌های ملی هوش مصنوعی که توسط Konrad Adenauer Foundation تدوین شده را مطالعه کنید (بخش اول و بخش دوم).

 

قدرت اقتصادی و فناوری هوش مصنوعی

هرچند وظیفه تدوین و تنظیم ضوابط و مقررات لازم برای تحقیق و پژوهش، تأمین منابع مالی، آموزش، داده و ارتقاء بر عهده دولت‌ها است اما در نهایت این شرکت‌ها هستند که باید فناوری هوش مصنوعی را توسعه دهند و آن را به بازار عرضه کنند.

پیش از هر چیز باید منافع ملی را در نظر گرفت. به بیانی دیگر شرکت‌های سراسر دنیا باید در طرح‌ها، تحقیقات و محصولات هوش مصنوعی خود منافع ملی را در نظر بگیرند. به عقیده من گوگل (Alphabet)، آمازون، مایکروسافت رهبری هوش مصنوعی در جهان را در دست دارند. بزرگ‌ترین شرکت‌های اینترنتی کشور چین موسوم به Alibaba، Baidu و Tencent نیز در این حوزه پیشتاز هستند.

دو نوع شرکت در حوزه هوش مصنوعی فعالیت دارند: شرکت‌هایی که هوش مصنوعی را توسعه می‌دهند و آن را به عنوان محصولی بنیادی به فروش می‌رسانند و شرکت‌هایی که از هوش مصنوعی در راستای تکمیل زنجیره ارزشی خود استفاده می‌کنند.

در هر حال هر شرکتی که امروزه مشغول به فعالیت است ناگزیر به استفاده از فناوری هوش مصنوعی است. از یک سو هوش مصنوعی می‌تواند جایگزین مدل‌های کسب‌و‌کار موجود شود و از سوی دیگر می‌توان از این فن‌آوری در فرایندهای بی‌شمار شرکت‌ها  از جمله حسابداری، اداره کردن، تولید، بازاریابی، فروش، امور اداری، مدیریت پرسنل و استخدام بهره جست.

در هر حال یکی از اصلی‌ترین انگیزه‌های استفاده از هوش مصنوعی کاهش هزینه‌ها و به حداکثر رساندن سود است. البته کنترل این فناوری هم مهم است. هوش مصنوعی جایگزین مشاغلی می‌شود که پیش از این انسان‌ها انجام می‌دادند. اغلب مواقع پس از آن‌که هوش مصنوعی برای مدتی آموزش دید سریع‌تر، کارآمدتر از انسان‌ها عمل می‌کند و هزینه‌های استفاده از آن نیز در مقایسه با انسان‌ها کمتر خواهد بود. انسان‌ها مریض می‌شوند، به تعطیلات، غذا و خواب نیاز دارند. انسان‌ها نیاز به سرگرمی دارند و استعفا می‌دهند و یا بازنشسته می‌شوند. فن‌آوری هوش مصنوعی می‌تواند به صورت تمام وقت کار می‌کند و این در حالی است که نیازی نیست حقوق آن‌ را افزایش داد. هرچه شرکت‌ها بیشتری از فن‌آوری هوش مصنوعی استفاده کنند، کمتر به نیروهای کار (انسان) نیاز خواهند داشت.

 

داده یک مزیت رقابتی است

پایه و اساس تمامی فناوری‌های هوش مصنوعی داده است. از این روی در بخش‌های مختلفی به داده نیاز خواهیم داشت. پیش از هر چیز برای آموزش و تحقیق و پژوهش در زمینه هوش مصنوعی محدودبه داده نیاز داریم. هر چه سطح دیجیتالی بودن مدل کسب‌و‌کار شما بیشتر باشد، داده‌های بیشتری خواهید داشت. به همین دلیل پیشتازان بازاریابی (گوگل، فیسبوک)، شرکت‌های نرم‌افزاری ( Salesforce، Microsoft) و خرده‌فروش‌های الکترونیک (Zalando، Amazon) سال‌ها است که در حوزه فن‌آوری هوش مصنوعی فعالیت می‌کنند.

تعدادی از بانک‌ها نیز سریعاً متوجه اهمیت هوش مصنوعی شدند. از این روی گلدمن ساکسو جی پی مورگانکارمندان زیادی استخدام کردند که همگی در زمینه یادگیری ماشین و علوم داده تخصص دارند و فعالیت می‌کنند. شرکت‌هایی که خودشان داده دارند بر سایر شرکت‌ها برتری دارند و می‌توانند به مزیت رقابتی بزرگی دست پیدا کنند. شرکت‌هایی که داده‌ ندارند باید داده‌ها را جمع‌آوری، ذخیره و ارزیابی کنند.

مسائل مربوط به داده موجب شده کشورها قوانین مختلفی در زمینه عدم افشای اطلاعات وضع کنند و به همین دلیل اروپا در شرایط نابسامان و نابرابری قرار گرفته است. هدف از تنظیم قانون عمومی عدم افشای اطلاعاتایجاد بازار داخلی داده در اروپا بوده اما در حال حاضر نقطعه ضعف بزرگی برای اروپا است.

ترس از قانون و مقررات تمامی صنایع را فلج می‌کند. با گفت‌و‌گو با درمان‌گاه‌ها و پزشکان متوجه شدم که صنعت بهداشت و درمان دیگر داده‌های خود را با دیگران به اشتراک نمی‌گذارد. عدم به اشتراک‌گذاری داده‌های پزشکی و درمانی با دیگران به قیمت جان دیگران تمام می‌شود، چرا که این داده‌ها برای پژوهش در زمینه سلامتی و الگوریتم‌های افزایش طول عمر اهمیتی حیاتی دارند.

عدم قطعیت راجع به داده‌ها در حال فلج کردن صنعت اروپا است. ترس از مجازات و جریمه موجب شده ‌کسی داده‌ها را جمع‌آوری نکند. در عصری که داده‌ها نقاط قوت ما هستند، کاری کرده‌ایم که داده‌ها باعت ترس و وحشت دیگران شده‌اند.

اروپا مهم‌ترین بازار داده در دنیا است اما ما در حال هدر دادن توا‌نمندی‌های خود هستیم. از سوی دیگر چین نقطه مقابل اروپا است. دولت چین به طور فعالانه به تبادل و متمرکز‌سازی داده‌ها کمک می‌کند ( در بخشی که به کشور چین اختصاص داده‌ام بیشتری راجع به آن توضیح خواهم داد). علاوه بر این شهروندان آزادنه داده‌های خود را به اشتراک می‌گذارند و نگرانی کمتری راجع به این موضوع دارند. در واقع در قرن بیست و یک حریم خصوصی معنایی ندارد. تمامی فعالیت‌های دیجیتالی محاسبه و ذخیره می‌شوند. با این وجود اروپا کماکان راه قدیمی در پیش گرفته است.

 

کسب‌و‌کارهای نوپای هوش مصنوعی غول‌های هوش مصنوعی فردا هستند

کسب‌وکارهای نوپا اهمیت زیادی برای اقتصاد یک کشور دارند چرا که دو عملیات اساسی و ضروری یک زیست‌بوم را بر عهده دارند. کسب‌و‌کارهای نوپا عامل نوآوری و خلاقیت هستند. این شرکت‌های جوان معمولاً نسبت به شرکت‌های قدیمی‌تر شجاعت، سرعت و انعطاف‌پذیری بیشتری در تولید و توسعه محصولات جدید دارند. از آن‌جایی‌که معمولاً کسب‌و‌کارهای نوپا توسط منابع مالی صندوق‌های خطرپذیر و فرشتگان کسب‌و‌کارها پشتیبانی و حمایت می‌شوند، ریسک‌پذیری بیشتری دارند و انتظار دارند به موفقیت‌های بزرگ‌تر و چشمگیری نائل شوند.

هرچند ۹۵ درصد از کسب‌و‌کارهای نوپا همان پنج سال اول از بازار خارج می‌شوند و نمی‌توانند به فعالیت خود ادامه دهند اما زیست‌بوم از مزایای آن‌ها بهره‌مند می‌شود.

شرکت‌ها می‌توانند شرکت‌های دیگر را به تملک خود درآورند و از این طریق محصولات و نوآوری‌ها و ابتکارات جدیدی به دست آورند. کارفرمایان سابق نیز شغل‌های جدیدی پیدا می‌کنند و دانش خود را منتقل می‌کنند. از سوی دیگر سرمایه‌گذاران و بنیان‌گذاران هم دانش خود را در پروژه‌های جدید به کار می‌بندند و در همان حال می‌توانند دانش جدید کسب می‌کنند.

چنان‌چه شرکت‌های جوان بتوانند پنج‌سال اول را تاب بیاورند منابع مالی آن‌ها ( از سرمایه‌گذاری‌های بذر و عرضه عمومی اولیه) تأمین می‌شود، استعدادها و نخبگان به سوی آن‌ها جذب می‌شوند، رشد می‌کنند و محصولاتی توسعه می‌دهند که مصرف‌کنندگان حاضرند هزینه استفاده از آن را پرداخت کنند و در نهایت به یک شرکت تبدیل می‌شوند. فیسبوک، گوگل، اَپل، آمازون و Uber کار خود را به عنوان کسب‌و‌کارهایی نوپا آغاز کردند و امروزه کنترل و رهبری بازار را در دست دارند.

چارلز ادوارد بویمدیر عامل Ronald Berger در کنفرانس ۲۰۱۸ ظهور هوش مصنوعی
 اظهار داشت موج بعدی شرکت‌های تریلیون دلاری شرکت‌هایی خواهند بود که در زمینه هوش مصنوعی فعالیت دارند. تحقق این هدف بدون وجود کسب‌و‌کارهای نوپا عملی نخواهد شد. به همین دلیل باید افراد و گروه‌‌ها را به تأسیس کسب‌و‌کارهای نوپا تشویق کنیم.

 

تحقیق و پژوهش اهمیتی بیش از پیش دارد

کشف مجدد یادگیری عمیق آغاز راه بود. این حوزه با بهره‌گیری از رویکردهای جدید CNN و GAN و الگوریتم‌های پیشرفته تکامل پیدا کرد ( سخنرانی علمی پروفسور دامیان بروث در کنفرانس ۲۰۱۷ ظهور هوش مصنوعی مقدمه مناسبی بر یادگیری عمیق است). زبان‌شناسی محاسباتی پیرامون پردازش زبان طبیعیو تولید زبان طبیعینیز پیشرفت‌های چشمگیری را تجربه کرده است.

امروزه و پس از آن‌که در سال ۲۰۱۲ توان محاسباتی لازم را کسب کردیم و امکان دسترسی به داده‌ها برای ما فراهم شد تعداد کثیری از برنامه‌های کاربردی هوش مصنوعی محدودحاصل نتایج تحقیقات و پژوهش‌های سی سال گذشته هستند.

سرمنشأ تحقیقات و پژوهش‌های هوش مصنوعی کجاست؟

از یک سو می‌توان گفت که سر منشأ این پژوهش‌ها دانشگاه‌ها هستند. دانشگاه اِم آی تی، استنفورد، دانشگاه کارنگی ملونو برکلیپیشتازان تحقیق و پژوهش در زمینه هوش مصنوعی هستند  ( برای کسب اطلاعات بیشتر به گزارش AI index که توسط دانشگاه استنفورد گردآوری شده رجوع کنید).

دانشگاه MIT به تنهایی تا سال ۲۰۲۰، ۱ میلیارد دلار در زمینه آموزش برنامه‌های مدارج جدید هوش مصنوعی سرمایه‌گذاری خواهد کرد. از سوی دیگر شرکت‌ها نیز به یکی از پیشگامان تحقیق و پژوهش در زمینه هوش مصنوعی تبدیل شده‌اند. حتماً اسم DeepMind شرکت گوگل به گوش شما خورده است. شرکت مایکروسافت بیش از ۸۰۰۰ پژوهش‌گر هوش مصنوعی دارد. افراد نخبه با در اختیار داشتن داده‌ها و منابع مالی بیشتر تحقیقات و پژوهش‌هایی برای شرکت‌ها انجام می‌دهند: ریچارد سوچر
 (Salesforce، یان لوکن (فیسبوک)، اندور اِن جی(تا سال ۲۰۱۷ در Baidu) یا دمیس هسابیس
(گوگل).

در مقابل شرکت‌ها و دانشگاه‌های اروپایی از پیشگامان تحقیق و پژوهش در زمینه هوش مصنوعی نیستند. البته اروپا از وجود افرادی همچون پروفسور یورگن اِشمیتد، پروفسور فرانچسکا روسی و پروفسور هانس اوسکوغیتبهره‌مند است.
علاوه بر این در مؤسسه فناوری کارلسروهه، دانشگاه صنعتی مونیخ، دانشگاه صنعتی برلین، دانشگاه استابروک( علوم شناختی)، آکسفورد و دانشگاه کمبریج دوره‌هایی با محوریت هوش مصنوعی برگزار می‌شود. اما درجه اهمیت تمامی مواردی که به آن‌ها اشاره شد  متوسط است و در سطح بین‌المللی به عنوان پژوهش‌هایی با کیفیت بالا شناخته نمی‌‍شوند.

در مقابل نمؤسسه تحقیقاتی هوش مصنوعی آلما، چندین مؤسسه ماکس پلانکمؤسسه ماکس پلانکو مؤسسه فرونوفردر آلمان تحقیقات و پژوهش‌های کاربردی انجام می‌دهند. با این وجود حتی این مؤسسات نمی‌توانند در رقابت بر سر جذب نخبگان، سرمایه و داده موفقیت چندانی کسب کنند. اما در دهه‌های آتی و در زمان طرح این سؤال که چه کسی اولین هوش مصنوعی عمومی را توسعه خواهد داد، تحقیقات و پژوهش‌ها عامل تعیین‌کننده‌ای خواهند بود.

پیشنهاد ویدئو: سخنرانی علمی پروفسور هانس اوسکوغیت با موضوع ابرهوش در کنفرانس ۲۰۱۷ ظهور هوش مصنوعی

 

بدون وجود زیرساخت هوش مصنوعی هم وجود نخواهد داشت

در این‌جا منظور از زیرساخت صرفاً امکان دسترسی به داده‌ها نیست. در این مقاله واژه زیرساخت توان محاسباتی و عملیاتی را نیز در بر می‌گیرد. پیش از این NVIDIA  به خاطر تولید کارت‌ گرافیک‌ شناخته می‌شد. در حال حاضر NVIDIA یکی از تولیدکنندگان پیشگام GPUها است که به طور فزاینده‌ای در پیاده‌سازی و اجرای برنامه‌های کاربردی هوش مصنوعی مورد استفاده قرار می‌گیرد. گوگل و Intel و شرکت‌های زیاد دیگری به توسعه انواع و اقسام گوناگون تراشه‌های هوش مصنوعیمشغول هستند. در همین زمان شرکت‌های مایکروسافت، AWS، گوگل، IBM نیز ظرفیت سرویس‌های ابری خود را در سراسر جهان افزایش می‌دهند تا بتوانند پاسخ‌گوی تقاضا‌ی رو به افزایش برای این فن‌آوری باشند. کشور چین تا حد زیادی بر توسعه  ۵G تمرکز کرده اما اروپا در این حوزه نیز فعالیت چندانی ندارد؛ فن‌آوری ۵G برای برنامه‌های کاربردی لحظه‌ای هوش مصنوعیو صنعت شبکهاهمیتی حیاتی دارد.

 

ضرورت تأمین منابع مالی هوش مصنوعی

توسعه فن‌آوری هوش مصنوعی هزینه‌بر است. تعداد پژوهشگران برتر هوش مصنوعی اندک است و سالانه حقوقی تا ۳۰۰.۰۰۰ یورو دریافت می‌کنند. داده‌ها را باید جمع‌آوری، ذخیره و برچسب‌گذاری کرد. برای توسعه مدل‌های هوش مصنوعی باید زمان زیادی صرف آزمایش، خطاها و روش‌های جدید کرد.

فن‌آوری‌های هوش مصنوعی به داده نیاز دارند و باید آن‌ها را آموزش دارد. شرکت‌ها، کسب‌و‌کارهای نوپا، سرمایه‌گذاران و دولت‌ها هزینه‌های توسعه فن‌آوری‌های هوش مصنوعی را پرداخت می‌کنند. کشور چین با آگاهی به این موضوع در حال سرمایه‌گذاری بیش از ۱۳۰ میلیارد یورو در بازار هوش مصنوعی چین است. استان‌هایی از جمله پکن، شانگهای و تیانجیندر حال سرمایه‌گذاری میلیاردها یورو در صنعت هوش مصنوعی بومی خود هستند. در ایالات متحده نیز شرکت‌های گوگل، IBM، مایکروسافت، آمازون، فیسبوک و اَپل تا سال ۲۰۱۵ بیش از ۵۵ میلیارد دلار در این حوزه سرمایه‌گذاری کرده‌اند. بدون پول هوش مصنوعی هم وجود نخواهد داشت. و اروپا در این زمینه نیز از سایر کشورها عقب مانده و مبالغ کمی در این حوزه سرمایه‌گذاری می‌کند.

در سال ۲۰۱۸ پارلمان فدرال آلمان، بوندستاگ، منابع مالی فن‌آوری هوش مصنوعی را تا سقف ۵۰۰.۰۰۰ یورو تأمین کرد. قرار است بوندستاگ ۵۰۰ یک سرمایه‌گذاری میلیون یورویی دیگر در این حوزه انجام دهد اما هنوز این سرمایه‌گذاری را انجام نداده است. با سرمایه‌گذاری این مبالغ ناچیز نمی‌توان به موفقیت چندانی دست یافت.

در همین زمان چین منابع مالی ۴۰۰ کُرسی جدید برای هوش مصنوعی را تأمین کرده است. اما تا به امروز  ۱۰۰ کُرسی استادی جدیدی که در استراتژی هوش مصنوعی آلمان به آن اشاره شده اقدام و فعالیت خاصی انجام نداده‌اند. اما بریتانیای کبیر ، علی‌رغم برگزیت، رویکرد متفاوتی با سایر بخش‌های اروپا در پیش گرفته است.  در بریتانای کبیر سرمایه‌گذاری‌های بیشتری در کسب‌و‌کارهای نوپا و دانشگاه‌های فعال در زمینه هوش مصنوعی انجام می‌شود.

برای کسب اطلاعات بیشتر در زمینه جایگاه و موقعیت کنونی هوش مصنوعی می‌توانید گزارش ۲۰۱۹ جایگاه هوش مصنوعی را مطالعه کنید و ویدئوی سخنرانی‌ من در کنفرانس ظهور هوش مصنوعی را تماشا کنید.

 

جایگاه اروپا در مسابقه تسلیحات هوش مصنوعی

همان‌گونه که پیش از این نیز گفتیم، در حال حاضر اروپا در حوزه هوش مصنوعی از کشورهای دیگر عقب مانده است. درحالی‌که اروپا هنوز به این فکر می‌کند که آیا وارد این رقابت شود یا خیر، چین و ایالات متحده، فلسطین اشغالی، بریتانیا، کانادا بر سر داده، بازارها و نخبگان با یکدیگر به رقابت می‌پردازند. مشکلاتی که در اروپا با آن مواجه هستیم را خودمان به وجود آورده‌ایم، این مشکلات در نتیجه عدم جاه‌طلبی، بینش ناکافی ما شکل گرفته‌اند.

علاوه بر این در اروپا مبالغ کمی به آموزش اختصاص داده می‌شود. بودجه کافی به مدارس و دانشگاه‌ها و هم‌چنین دانش‌آموزان و دانشجویان تعلق نمی‌گیرد. به بیانی دیگر کودکان اروپایی به حد کافی در زمینه مهارت‌های دیجیتالی آموزش نمی‌بینند. دانش‌آموزان اروپایی به ندرت موضوعات و دروس مرتبط با هوش مصنوعی را انتخاب می‌کنند. علاوه بر تمامی مواردی که به آن‌ها اشاره شد امکان آموزش مجدد برای نیروی کار هم اندک است؛ در صورتی که نیرو‌های کار دوباره آموزش ببینند می‌توانند دانش و مهارت‌های لازم برای صنعت دیجیتالی را فرا بگیرند.

نتایج حاصل از تحقیقات و پژوهش‌ها به کندی به صنعت منتقل می‌شود. نتایج حاصل از تحقیقات و پژوهش‌ها یا نادیده گرفته می‌شوند و یا بروکراسی‌های مربوط به انتقال مالکیت فکری به ویژه برای شرکت‌های نوپا و شرکت‌های اسپین‌آففرایند دشواری است.

منابع مالی کسب‌و‌کارهای نوپای هوش مصنوعی در اروپا به اندازه کافی تأمین نمی‌شود. شرکت‌ها باید محصولاتی مانند دوچرخه و یا اسکوتر برقی بفروشند تا بتوانند سرمایه‌گذاری‌های سرمایه‌گذاران را جذب کنند اما اگر بخواهند در حوزه فن‌آوری فعالیت کنند شانس کمی برای جذب سرمایه‌گذاری‌ها دارند. به عبارت دیگر هر چه محصول پیچیده‌تر باشد ، امکان جذب سرمایه‌ هم کمتر است. از سوی دیگر هر چه مدل کسب‌و‌کار ساده‌تر باشد، سرمایه‌گذاران بیشتر به سوی آن جذب می‌شوند و سرمایه‌های خود را در آن سرمایه‌گذاری می‌کنند.

هرچند بسیاری از نخبگان آسیایی و آمریکایی تمایل دارند در اروپا مشغول به کار شوند اما به لحاظ بروکراسی عملی اشتغال آن‌ها کار دشواری است. از زمان هجوم موج‌های پناهندگان به اروپا ادارات دچار آشفتگی شده‌اند. تقریباً غیر ممکن است که بتوان توسعه‌دهندگان هوش مصنوعی ایرانی، روسی یا چینی را استخدام کرد. در حال حاضر امکان عدم پذیرش نخبگان در اروپا بیشتر از پذیرش آن‌ها است.

علاوه بر این اروپا فاقد استراتژی هوش مصنوعی است. کشورهایی همچون فنلاند، سوئد، هلند و یا فرانسه استراتژی‌های هوش مصنوعی خود را تدوین کرده‌اند و جاه‌طلبی لازم را هم دارند.

زمانی که در سال ۲۰۱۸ در کمیسیون اروپابودم یکی از پژوهشگران بلغاری گفت که خوش می‌شود اگر کشورش فقط یک طرح برای هوش مصنوعی داشته باشد. به گفته این پژوهشگر وضعیت تمامی بخش‌های اروپا بدتر از اروپای غربی است.

من نمی‌گویم که سیاست‌مداران باید تمامی مشکلات را حل کنند. شرکت‌های کماکان باید به ساخت محصولات ادامه دهند، بنیان‌گذاران باید کسب‌و‌کارهای نوپا تأسیس کنند، صندوق‌های سرمایه‌گذاری خطرپذیر باید منابع مالی کسب‌و‌کارهای نوپا را تأمین کنند و پژوهشگران هم باید وقت خود را صرف تحقیق و پژوهش کنند.

اما سیاست‌مداران می‌توانند یک استراتژی مشخص تدوین کنند و از این طریق از ما حمایت و پشتیبانی کنند. سیاست‌مداران به جای آنکه مانع چارچوب‌های قانونی و نظارتی شوند باید چارچوب‌های نظارتی و قانون تنظیم کنند. دولت باید در سرمایه‌گذاران انگیزه سرمایه‌گذاری ایجاد کند و الگوی آن‌ها باشد. علاوه بر این سیاست‌مداران باید از آموزش دانش‌آموزان، دانشجویان و تحصیلات باکیفیت حمایت و پشتیبانی کنند.

در مقالات راجع به مواردی که به آن‌ها اشاره شد بحث و گفت و گو شده (استراتژی هوش مصنوعی دولت فدرال آلمان) اما در عمل کاری از پیش نمی‌برند.

 

چالش‌های جهانی برای بشریت

اروپا بخشی از جهان را تشکیل می‌دهد و باید با مراتب قدرت جهان سازگار شود. از این روی صنعت رو به رشد هوش مصنوعی با چالش‌های زیادی مواجه می‌شود. اولین چالشی که هوش مصنوعی با آن مواجه است مسئله عدم افشا و حفاظت از اطلاعات است. چه استانداردهایی باید اجرا شود؟ در حال حاضر اروپا استانداردهای مشخصی تنظیم و تدوین کرده است که بر مبنای آن‌ها شرکت‌ها باید فن‌آوری‌های هوش مصنوعی را خارج از اتحادیه اروپا توسعه دهند.

آیا در آینده قانون عدم افشای اطلاعات را کنار می‌گذاریم و همچون چین رویکرد آزادنه‌ای نسبت به داده‌ها خواهیم داشت؟ یا اروپا رویکرد میانه ای در پیش خواهد گرفت؟

 

کنترل و نظارت بر فناوری هوش مصنوعی ضروری است

علاوه بر این تمامی دولت‌ها باید فناوری هوش مصنوعی را تحت کنترل و نظارت داشته باشند و قوانینی برای این حوزه وضع کنند. فن‌آوری هوش مصنوعی به طور فزاینده‌ای رسانه‌ها، صنایع، آموزش، امنیت، صنایع نظامی و بازارهای مالی را تحت تأثیر قرار می‌دهد. به همین دلیل لازم است قوانین و مقرراتی برای چگونگی کنترل و نظارت بر هوش مصنوعی ( و شرکت‌هایی که آن را طراحی می‌کنند ) وضع شود.

برای مثال یک شرکت چینی موسوم به Squirrel AI  به میلیون‌ها دانش‌آموز کمک کرد تا محتوای آموزشی فردی و شخصی تولید کنند که مطابق با مهارت‌ها و سرعت یادگیری آن‌ها است. اما در اروپا چه کسی فن‌آوری‌های هوش مصنوعی را به لحاظ محتوا و موضوع کنترل و نظارت می‌کند؟ به عقیده من وزارت‌های آموزش بومی در جایگاهی نیستند که بتوانند این کار را انجام دهند. به همین دلیل مقامات مسئل باید متخصصین لازم را استخدام کنند، مفاهیم را تدوین کنند و آن‌ها را به اجرا درآورند. این کار زمان‌بر است باید پیش از آن‌که دیر شود انجام شود.

 

لزوم تدوین چارچوب اخلاقی برای فناوری هوش مصنوعی

فناوری هوش مصنوعی به طور مداوم در حال تصمیم‌گیری است و تقریباً  در هر تصمیم‌گیری باید مسائل اخلاقی را در نظر گرفت. اخلاقیات و اصول و ضوابط اخلاقی هوش مصنوعی از اجزای جدایی ناپذیر تحقیقات و پژوهش‌ها و به‌کار گیری فن‌آوری هوش مصنوعی هستند.

فناوری هوش مصنوعی می‌تواند مانع و یا باعث تشدید تعصب، نژادپرستی، فساد و تبعیض جنسی شود. به همین دلیل لزوم تدوین و تنظیم یک چارچوب اخلاقی برای فن‌آوری هوش مصنوعی به شدت احساس می‌شود. در سطوح بالاتر، تمامی مناطق فرهنگی ناگزیر به استفاده از آن هستند. به چه نوع فناوری هوش مصنوعی نیاز داریم؟ این فناوری‌ها چه ارزش‌هایی باید برای ما به ارمغان می‌آورند؟

هر چه زودتر باید راجع به اصول و ضوابط اخلاقی هوش مصنوعی تصمیم‌گیری کنیم. در حال حاضر، فن‌آوری‌های هوش مصنوعی در حال توسعه داده می‌شوند که هیچ‌گونه نظارت اخلاقی بر آن‌ها صورت نمی‌گیرد. تصمیم‌گیری راجع به این‌که در آینده ماشین‌ها چگونه عمل کنند به توسعه‌دهندگان بستگی دارد. اما جامعه هم باید نسبت به درست و غلط بودن امور این‌چنین سخت‌گیری داشته باشد.

از این روی تمامی ملت‌ها، سیستم‌های دولتی و گروه‌های نژادی باید راجع به چارچوب‌های اخلاقی فن‌آوری‌های هوش مصنوعی خود به بحث و گفت‌و‌گو بنشینند.

شرکت‌ها ‌هم باید همین رویه را در پیش بگیرند. تمامی شرکت‌ها همان‌گونه که یک متخصص عدم افشا و حفاظت از اطلاعات و متخصص داده‌ دارند باید یک متخصص علم اخلاق هوش مصنوعی را هم به استخدام خود در آورند. وظیفه متخصص علوم اخلاقی هوش مصنوعی این است که از ‌شود که مطمئین شود داده‌ها عاری از هر گونه سوگیری هستند و تبعیض ایجاد نمی‌کنند.

 

ظهور  فناوری‌های پیشرفته هوش مصنوعی

علاوه بر این لازم است مسئله رشد و پرورش هوش و هم‌چنین تأثیر فناوری هوش مصنوعی را نیز مد نظر قرار دهیم. اخیراً مایکروسافت یک میلیارد دلار دیگر برای تحیقیق و پژوهش در زمینه هوش مصنوعی عمومی در اختیار OpenAI گذاشته است، علاوه بر این ایلان ماسکنیز یک میلیارد دلار دیگر به این طرح اختصاص داده است. ماسک، زاکربرگ، هاوکینگو گیتسراجع به هوش مصنوعی اخطار داده‌اند. در حال حاضر ممکن است سیریاحمق به نظر برسد اما تا ده سال آینده هوشمندی آن بیشتر از انسان‌ها خواهد بود.

هوش مصنوعی هر روز باهوش‌تر، سریع‌تر، تواناتر و داناتر می‌شود. برخلاف ماهیت زیست‌شناختی انسان‌ها، فن‌آوری‌های هوش مصنوعی هیچ محدودیتی ندارند. در نتیجه هر روز باید عمیقاً راجع به هوش مصنوعی عمومی، هوش مصنوعی قویو هوش مصنوعی سوپرفکر کنیم. علاوه بر این موضوعاتی همچون رابط های عصبی و سیستم عامل‌های انسانی را نیز باید مد نظر قرار دهیم.

پیشنهاد ویدئو: سخنرانی علمی دکتر لیندراجع به هوش مصنوعی قوی در کنفرانس ۲۰۱۹ ظهور هوش مصنوعی.

 

ماشین‌ها به انرژی نیاز دارند

یکی دیگر از چالش‌های جهانی فناوری هوش مصنوعی نیاز ماشین‌ها به انرژی است. ذهن انسان‌ها به اندازه یک لامپ به الکتریسیته نیاز دارد، اما نرم‌افزارهای کاربردی هوش مصنوعی انرژی بر هستند. در نتیجه اگر می‌خواهیم در زمینه فناوری رشد و پیشرفت کنیم، باید مشکلات کمبود انرژی را برطرف کنیم. در غیر این صورت همه مردم نمی‌توانند مدت زمان زیادی عمر کنند و زندگی سالمی داشته باشند.

 

جامعه‌ای بدون کار؟

علاوه بر این ما به عنوان یک جامعه باید راجع به تأثیرات فناوری‌های هوش مصنوعی بر مشاغل‌مان بحث و  گفت‌و‌گو کنیم. ما به ویژه آلمانی‌ها می‌ترسیم که هوش مصنوعی جایگزین شغل‌های‌ ما بشود.

من شخصاً خوشحال می‌شوم اگر هوش مصنوعی بتواند به جای من کار کند. اما هوش مصنوعی شغل‌های شما را از رده خارج نمی‌کند. طبق برآوردهای من و با توجه به این‌که ماشین‌ها سریع‌تر هستند و هزینه استفاده از آن‌ها ارزان‌تر است تا ۲ سال آینده ۵۰ درصد از مشاغل انسان‌ها را ماشین‌های انجام خواهند دارد.

در همان حال که توسعه و پیشرفت موضوع مثبت است چالش هم است. مشاغل جدید بسیاری به وجود خواهد آمد که امروزه حتی فکر کردن به چنین مشاغلی برای ما دشوار است. این مشاغل شامل مربی‌های مهدکودک هوش مصنوعی، تعلیم‌دهندگان هوش مصنوعی، متخصصین علوم اخلاق هوش مصنوعی و کنترل‌کنندگان هوش مصنوعی می‌شود.

از این روی باید راجع به چگونگی بازآموزی افرادی که امروز مشاغلی برعهده دارند و در آینده ماشین‌ها جایگزین مشاغل آن‌ها می‌شوند تعمق کنیم. این بازآموزی بزرگ‌ترین بازآموزی نیروهای کار در سراسر تاریخ انسان‌ها خواهد بود. برخی از افراد در مقابل بازآموزی مقاومت خواهند کرد، چه اتفاقی برای این افراد خواهد افتاد؟

برخی از آن‌ها آزادی در پیش می‌گیرند و زندگی‌های‌شان را مجدداً طراحی می‌کنند. امیدوارم در آینده زندگی به معنای کار کردن نباشد بلکه زندگی لذت بردن از زندگی باشد. امیداورم در آینده به مرحله ای برسیم که مردم برای این‌که که می‌خواهند کار کنند نه برای این‌که مجبور هستند. بگذارید ماشین‌های کارهایی را انجام دهند که کسی نمی‌خواهد سراغ آن‌ها برود. و در نهایت به افرادی که فعالیت‌های اجتماعی مهمی از جمله رشد و پرورش کودکان، آموزش دانش‌آموزان و پرستاری از سالمندان را انجام می‌دهند حقوق بیشتری پرداخت کنیم.

 

چگونگی توزیع ثروت

احتمالاً یکی از چالش‌هایی که با آن مواجه می‌شویم چگونگی توزیع ثروت است. اگر شرکت‌ها برای رسیدن به همان میزان بهره‌وری به نیروی کار کمتری نیاز داشته باشند سود ‌آن‌ها ‌ها افزایش پیدا می‌کند. اما معمولاً شرکت‌ها در مالکیت خانواده‌ها و صندوق‌های مشخصیی هستند. امروزه ۴۰ درصد از تمامی شرکت‌های سهامی عام ایالات متحده در مالکیت چهار صندوق بزرگ هستند. در نتیجه این روند افراد ثروتمند رو به روز ثروتمندتر می‌شوند. بخش کوچکی از این ثروت به بخش اداری و اجرایی ( وکلا، بانک‌دارها، کارآفرینان، سرمایه‌گذاران) می‌رسد و مقدار ناچیزی برای ۹۹ درصد باقی‌مانده جمعیت باقی می‌ماند.

پیشنهاد کتاب: «سرمایه در قرن بیست و یکم» اثر توماس پیکتی.

 

جنگ داخلی یا زندگی آرام و بی‌دغدغه؟

با روی کارآمدن فناوری هوش مصنوعی این روند تشدید می‌شود. این‌ فکر که تا ۳۰ سال آینده ۱۰۰ نفر کنترل جهان خواهند گرفت مرا نگران می‌کند. در این‌جا منظور از کنترل بر جهان فقط پول و ثروت نیست بلکه دسترسی به کدهای ماشین و در نتیجه کنترل بر اقتصاد جهانی، صنایع نظامی و اطلاعات است. اگر اکثر مردم اهمیت و کارایی کنونی‌شان را برای سیستم به ویژه در حوزه اشتغال و مصرف از دست بدهند، چه اتفاقی می‌افتاد؟ آیا ایده Club of Rome به حقیقت می‌پیوندد و تعدادمان را (علیرغم میل باطنی) به ۵۰۰ میلیون نفر کاهش می‌دهیم؟

فناوری هوش مصنوعی این کار را ممکن می‌سازد. در نتیجه برای جلوگیری از وقوع جنگ داخلی، باید ثروت را پیشاپیش توزیع کرد. در هر حال بخشی از این ثروت باعث می‌شود که دیگر کسی از فقر و گرسنگی و بی‌خانمانی رنج نبرد. رویکردها و ایده‌های زیادی وجود دارد. در آینده زمان بیشتری را صرف بحث و گفت‌و‌گو راجع به آن‌ها از جمله درآمد و نقدینگی می‌کنیم.

و باید مطمئن شویم در دنیایی زندگی می‌کنیم که هوش مصنوعی در خدمت تمامی انسان‌ها است.

منبع: hooshio.com

یک مدل یادگیری ماشین که می‌تواند کارهای روزمره ما را انجام دهد

مدل یادگیری ماشین

محققان یک مدل یادگیری ماشین را آموزش می دهند تا بتواند عملکردی هم سطح انسان در شناخت مفاهیم انتزاعی موجود در فیلم ها داشته باشد.

توانایی استدلال انتزاعی درباره وقایع لحظه‌ای یکی از شاخص‌های تعیین‌کننده هوش انسانی است. ما به‌طور غریزی می‌دانیم که گریه‌ کردن و نوشتن، ابزارهایی برای برقراری ارتباط هستند و پاندایی که از روی درخت سقوط می‌کند و هواپیمایی که فرود می‌آید نشانگر کم شدن شاخص ارتفاع است. کامپیوترها از عهده دسته‌بندی جهان در طبقات انتزاعی بر نمی‌آیند اما در سال‌های اخیر محققان با آموزش مدل‌های یادگیری به این هدف نزدیک‌تر شده‌اند. این مدل‌ها در مورد کار روی کلمات و تصاویری که با اطلاعات دنیای پیرامونمان ترکیب‌ شده‌اند و چگونگی ارتباط اشیاء، حیوانات و کنش‌ها و رفتارهای ما است.

در یک مطالعه جدید که در کنفرانس اروپایی بینایی ماشین در ماه گذشته برگزار شد ، محققان از یک مدل ترکیبی از بینایی ماشین و پردازش زبان طبیعی رونمایی کردند که می‌تواند مجموعه‌ای از رویدادهای پویای ضبط‌ شده در فیلم را با هم مقایسه  کند یا تضاد بین آن‌ها را نشان دهد تا به مفاهیم سطح بالایی که آن‌ها را به هم متصل می‌کند، پی برد. مدل آن‌ها در دو نوع  استدلال بصری، یا به‌ خوبی انسان عمل کرده یا بهتر از انسان‌ها بوده است؛ انتخاب ویدئویی که به‌طور مفهومی به بهترین شکل مجموعه را کامل می‌کند و انتخاب ویدئویی که مناسب نیست.

به‌ عنوان ‌مثال فیلم‌هایی از پارس کردن یک سگ و زوزه کشیدن یک مرد در کنار سگ خود را به سیستم نشان دادند و مدل برای کامل کردن این مجموعه از تصاویر از بین ۵ کلیپ، ویدیوی مربوط به گریه کردن یک کودک را انتخاب کرد. محققان نتایج خود را در دو دیتاست برای آموزش سیستم‌های هوش مصنوعی در تشخیص عمل تکرار کردند: MIT’s Multi-Moments in Time و Deep Mind’s Kinetics.

مدل یادگیری ماشین

آود اولیوا نویسنده ارشد این مقاله که دانشمند ارشد تحقیقات در MIT  است دراین‌باره می‌گوید: “ما نشان دادیم که شما می‌توانید توانایی درک مفاهیم انتزاعی را در سیستم‌های هوش مصنوعی ایجاد کنید تا بتوانند کارهای مربوط به استدلال بصری را در سطحی نزدیک به سطح انسان‌ها انجام دهند. مدیر آزمایشگاه هوش مصنوعی MIT-IBM Watson نیز می‌گوید “مدلی که بتواند وقایع و مفاهیم انتزاعی را تشخیص دهد پیش‌بینی‌های منطقی و دقیق‌تری را ارائه می‌دهد و برای تصمیم‌گیری مفیدتر است.”

هم‌زمان که شبکه‌های عصبی عمیق در تشخیص اشیاء و کنش‌های موجود در عکس‌ها و فیلم‌ها توانمندتر می‌شوند، محققان در حال کار روی نقطه عطف بعدی هستند؛ یعنی انتزاع و آموزش مدل‌ها برای آنکه بتوانند درباره آنچه می‌بینند استدلال کنند. در یک رویکرد، محققان قدرت تطبیق الگوهای شبکه‌های عمیق را با منطق برنامه‌های نمادین تلفیق کرده‌اند تا یک مدل آموزش دهند که بتواند روابط پیچیده اشیا را  در یک صحنه تفسیر کند. رویکرد دیگر این است که  محققان از روابط موجود در معنای کلمات بهره ببرند تا به مدل خود قدرت استدلال بصری دهند.

ماتیو مونفورت یکی از نویسندگان این مقاله که از محققان آزمایشگاه علوم رایانه‌ای و هوش مصنوعی MIT است می‌گوید: “بازنمایی‌های زبانی به ما امکان می‌دهد تا اطلاعات متنی آموخته‌شده از پایگاه داده‌های متنی را در مدل‌های تصویری خود ادغام کنیم. کلماتی مانند دویدن، بلندکردن و بوکس دارای برخی از ویژگی‌های مشترک هستند که باعث می‌شود آن‌ها را بیشتر به مفهوم ورزش نزدیک کند تا رانندگی.

محققان با استفاده از WordNet که یک پایگاه داده‌ای از معانی کلمات است، رابطه هربرچسب موجود در دو دیتاست Moments و Kinetics را با سایر برچسب‌های هر دو دیتاست ترسیم کردند. به‌عنوان‌مثال کلماتی مانند مجسمه‌سازی، کنده‌کاری و برش به مفاهیم سطح بالاتری همچون صنایع‌دستی، هنر و آشپزی مرتبط شدند. ازاین‌ پس هرگاه مدل فعالیتی مانند مجسمه‌سازی را تشخیص دهد، می‌تواند فعالیت‌های مشابه مفهومی را در دیتاست انتخاب کند.

این گراف وابستگی مربوط به طبقه‌های انتزاعی برای آموزش مدل به منظور انجام دو کار اساسی استفاده می‌شود. با توجه به مجموعه‌ای از ویدئوها، مدل به هر ویدیو عددی اختصاص می‌دهد که با همان کلماتی که بیانگر اقدامات نشان داده‌شده در ویدئو است همسو هستند. سپس یک ماژول انتزاعی با عدد اختصاص داده‌شده به  هر ویدئو در مجموعه ترکیب می‌شود تا شماره اختصاصی مجموعه جدید  ایجاد شود. به ‌این ترتیب از این می‌توان برای شناسایی دیگر مفاهیم انتزاعی به اشتراک گذاشته‌شده از طریق همه فیلم‌های مجموعه استفاده شود.

محققان برای سنجش نحوه عملکرد این مدل در مقایسه با انسان‌ها، از افراد خواستند که همان مجموعه وظایف استدلال بصری را که مدل انجام داده به‌صورت آنلاین انجام دهند. در کمال تعجب، این مدل در بسیاری از سناریوها عملکردی به‌خوبی برخی از انسان‌ها داشت و حتی گاهی اوقات نتایج غیرمنتظره بود. در یک سنجش دیگر، به مدل ویدیویی از فردی که در حال کادو کردن است نشان دادند سپس مدل ویدیویی را از فردی در ساحل نشان می‌دهد که در حال ریختن ماسه بر روی شخص دیگری است. کامیلو فوسکو، دانشجوی دکترای MIT که نویسنده اول این مقاله است می‌گوید: این مفهوم پوشاندن را به‌خوبی نشان می‌دهد.

تمایل به تأکید بیش ‌از حد روی برخی از ویژگی‌ها از معایب و محدودیت‌های این مدل است. به‌طور مثال در یک مورد مدل پیشنهاد داد مجموعه‌ای از فیلم‌های ورزشی را می‌توان با یک فیلم از یک کودک و یک توپ تکمیل کند که نشان می‌دهد مدل، توپ‌ها را همواره با ورزش و رقابت همراه می‌کند.

محققان می‌گویند یک مدل یادگیری عمیق که می‌تواند برای “فکر کردن” به‌صورت انتزاعی آموزش ببیند ممکن است بتواند با داده‌های کمتری نیز قابلیت یادگیری را داشته باشد.  به‌طورکلی انتزاع راه را برای استدلال‌های سطح بالاتر و انسانی‌تر باز می‌کند.

اولیوا می‌گوید: یکی از ویژگی‌های بارز شناخت انسان این است که می‌تواند چیزهای مختلف را در رابطه باهم توصیف و مقایسه کند یا تضاد بین آن‌ها را مشخص نماید.  این یک روش غنی و کارآمد برای یادگیری است که درنهایت می‌تواند به انواع مدل یادگیری ماشین آموزش داده شود تا قیاس‌ها را درک کنند و ازنظر هوشمندی بسیار به ما نزدیک‌تر هستند.

منبع: hooshio.com

محدودیت ‌های یادگیری ماشین

محدودیت ‌های یادگیری ماشین

یادگیری ماشین چه‌کارهایی را می‌تواند انجام دهد و چه‌کارهایی را نمی‌تواند انجام دهد؟

پیش از هر چیز لازم است بدانیم که یادگیری ماشین یک قدرت مطلق نیست. از تحقیقات ۵۰ سال گذشته این‌گونه برمی‌آید که یادگیری ماشین یک نوع  روش کسب دانش بدون برنامه‌نویسی صریح است با مرزهای مشخص است. درست همانند محاسبات که همچون دیگر فرایندها دارای محدودیت‌های ذاتی است، محدودیت ‌های یادگیری ماشین نیز وجود دارند، محدودیت‌هایی که حتی باوجود استفاده از gpu ها و کامپیوترهای سریع نیز نمی‌توانیم بر آن‌ها غلبه کنیم. ممکن است این موضوع برای بسیاری از مشتاقان یادگیری ماشین ناامیدکننده به نظر برسد، اما باید بپذیریم که یادگیری ماشین قرار نیست ناجی همه‌چیز باشد. روش‌های دیگری برای دستیابی به اطلاعات وجود دارد و افراد علاوه بر “یادگیری” از این موارد نیز استفاده می‌کنند.

 

موانع یادگیری زبان

بگذارید به‌عنوان مثال اصلی، مشکل یادگیری زبان از طریق شنیدن را مثال بزنیم. این موضوع بیش از ۵۰ سال است که محل مناقشه و بحث‌های عمیق نه‌تنها در هوش مصنوعی بلکهر  فلسفه، زبانشناسی، روانشناسی، زیست‌شناسی و علوم اعصاب نیز بوده است. جالب است بدانید ما هنوز هم نمی‌دانیم چگونه انسان‌ها و به‌طور خاص کودکان از همان ۲ سالگی زبان اول خود را یاد می‌گیرند. در کنار کارهای شگفت‌انگیز زیادی که برای مستندسازی این فرایند صورت گرفته است تئورهای ختلفی نیز وجود دارد. درهرحال ، امروز نمی‌توانید از فروشگاه یک ماشین یادگیری مثل الکسا بخرید که در خانه شما بنشیند و هر آنچه را که در خانه شما صحبت می‌شود را بشنود و طی یک یا دو سال دیگر با شما شروع به صحبت کردن کند! ناراحت‌کننده است که باوجود میلیون‌ها سروری که در گوگل، آمازون، مایکروسافت و شرکت‌های بزرگ فناوری وجود دارد و البته ظرفیت بالای ذخیره‌سازی در مراکز داده، ما کماکان نمی‌توانیم این مشکل را حل کنیم!

شاید دارید به چت‌بات‌ها فکر می‌کنید. نه آن‌ها نمی‌توانند زبان را یاد بگیرند. اگر تاکنون از یکی از این برنامه‌ها استفاده کرده باشید دریکی دو دقیقه متوجه این موضوع خواهید شد.

اکنون، شما احتمالاً در مورد قدرت چشم‌گیر راه‌حل‌های یادگیری عمیق، مانند LSTM یا GRU در انجام کارهایی مانند ترجمه زبان شنیده‌اید. لازم است باز تکرار کنیم که این سیستم‌ها فاصله بسیار زیادی با یادگیری زبان دارند و حتی  در حال حاضر می‌توان گفت عملکرد آن‌ها در ترجمه زبان در مقایسه با انسان‌ها بسیار بد است. حتی مترجم گوگل نیز آن‌چنان کارآمد نیست. معماری LSTM و GRU نمی‌توانند زبان را “درک” کنند. آن‌ها مدل‌های آماری ساده‌ای ایجاد می‌کنند که برخی از اطلاعات مربوط به کلمات گذشته را حفظ می‌کنند و بیشتر در سطح جمله هستند. برای مثال مترجم گوگل کماکان قادر به درک اهمیت جنسیت در ترجمه های خود نیست.

محدودیت ‌های یادگیری ماشین

بنابراین، با توجه به این مثال از یادگیری زبان محدودیت ‌های یادگیری ماشین چیست؟ در اصل دو محدودیت وجود دارد، که برمی‌گردند به ذات یادگیری ماشین و همان‌طور که گفته شد این محدودیت‌ها با استفاده از داده‌های بیشتر و یا محاسبات قدرتمندتر قابل حل نیسنتد. به همین دلیل شناختن چنین مواردی بسیار مهم است ، به‌این‌ترتیب فرد متوجه می‌شود با یادگیری ماشین چه چیزی را می‌تواند انجام دهد و چه‌کاری را نمی‌تواند انجام دهد. همان‌طور که فیلسوف مشهور چینی کنفوسیوس سال‌ها پیش گفته است :

کسی که می‌داند چه چیزی را می‌داند و چه چیزی را نمی‌داند کسی است که واقعاً می‌داند

اولین محدودیت را در ۵۰ سال قبل مارک گلد در یک قضیه معروف اثبات کرده است. مطالعات زیادی نشان داده‌اند که کودکان نمونه‌های درست و مثبت زبان طبیعی را به یاد می‌سپارند. به‌طورکلی، والدین اشتباهات تلفظی و قواعدی کودکان را تصحیح نمی‌کنند، در عوض آنچه را که کودک در تلاش برای گفتن است تفسیر می‌کنند. همچنین کودکان نمی‌دانند که زبانی که قرار است یاد بگیرند چیست (درواقع اگر شما در آمریکا به دنیا آمده‌اید، به برخی ژن‌های جادویی “یادگیری انگلیسی” مجهز نیستید).

بنابراین آنچه گلد اثبات کرد این است که مهم نیست چند نمونه مثبت را ببینید؛ درهرصورت یک سیستم یادگیری ماشین هرگز نمی‌تواند گرامری مستقل از متن استنتاج کند که رشته‌های زبان را تولید می‌کند. فرض کنید به شما رشته‌هایی داده‌اند که با استفاده از زبان مستقل از متن ناشناخته تولیدشده‌اند. مهم نیست که چند رشته را می‌بینید و چه مقدار توان محاسبه در دسترس دارید، به‌هرحال هیچ‌وقت نمی‌توانید بگویید که قواعد تولید زبان را دقیقاً مشخص کرده‌اید. این واقعاً نتیجه خیره‌کننده‌ای بود.

ازآنجاکه زبان‌های ژاپنی و انگلیسی و آلمانی و فرانسوی از زبان‌های مستقل از  متن قدرتمندتر هستند ، باید بدان معنی باشد که فضای زبان‌های موجود در مغز ما همه مستقل از متن و یا همه حساس به متننیستند اما برخی از طبقه‌های محدودتر هستند که فقط از نمونه‌های مثبت قابل‌شناسایی است. اما طبقهچیست؟ زبان شناسان ۵۰ سال است که به دنبال آن هستند، و هنوز پاسخ آن را پیدا نکرده‌اند، اگرچه پیشرفت‌های زیادی صورت گرفته است.

اما به محدودیت دوم بپردازیم. محدودیتی که خود ریشه در محدودیت ذاتی دو اصل یادگیری ماشین دارد؛ یعنی احتمال و آمار. امروزه، این دو حیطه ریاضی نه‌تنها در یادگیری ماشین بلکه در بسیاری از زمینه‌های دیگر علوم و مهندسی فوق‌العاده قدرتمند و مفید هستند. با این اوصاف سخت بتوان با این ادعا مخالفت کرد که کار فیشر در آزمایش‌های تصادفی و برآورد حداکثر احتمال یکی از نقاط عطف تحقیقات در قرن بیستم بود، کاری که بسیاری از موارد دیگر را نیز ممکن ساخت. همان‌طور که نیمان، پیرسان، روبین و اخیراً پیرل نشان داده‌اند، بااین‌حال، استدلال آماری ذاتاً محدود است. نظریه احتمال نمی‌تواند ماهیت علیتی جهان را فاش کند. با این تئوری نه می‌توان فهمید که صاعقه باعث رعدوبرق می‌شود و نه می‌توان فهمید بیماری‌ها باعث بروز علائم می‌شوند. بنابراین با استناد به ‌احتمال، آمار و یادگیری ماشین نمی‌توان این موارد را تعیین کرد. یک‌بار دیگر باید تأکید کنیم که این ‌یک محدودیت ذاتی است و نمی‌تواند با داده‌های بیشتر، سیستم‌های بیشتر و پول بیشتر این مشکل را برطرف کرد.

بنابراین، در پایان باید این واقعیت را قبول کرد که علم داده باوجود تعهد و تمام توان بالقوه خود، نمی‌تواند نقطه پایانی بر این ماجرا باشد. درهرصورت یک ‌راه‌حل اعجاب‌انگیز برای مشکل هوش مصنوعی، مساله یادگیری زبان و مشکل کشف علت با استفاده از مشاهده وجود ندارد و باید ابزارهای بیشتری تهیه کرد. به‌عنوان مثال ، پیرل و روبین دقیقاً چنین نظریه احتمالی مانند نظریه نتیجه احتمالی و عملگرهای do-calculus را توسعه داده‌اند. توصیه می‌کنیم جدیدترین کتاب پیرل به نام “چرا” را بخوانید. این کتاب سه سطح معماری شناختی دارد. در پایین‌ترین سطح، مدل‌سازی آماری از مشاهده قرار دارد، در دومین لایه استدلال علیتی با مداخلات و در لایه‌ی بالا  استدلال تخیلی با خلاف واقع قرار دارد. این یکی از جالب‌ترین ایده‌های اخیر در مورد چگونگی گسترش علم داده است و می‌توان به‌نوعی آن را “علم تخیل” نامید، حوزه‌ای که هنوز وجود ندارد، اما احتمالا طی دهه‌های آینده وقتی که محدودیت ‌های یادگیری ماشین و عام داده آشکارتر می‌شود محبوبیت بیشتری پیدا خواهد کرد.

این بدین معنی نیست که علم داده مفید نیست، بسیار هم مفید است و می‌توان از آن برای مدل‌سازی بسیاری از پدیده‌ها استفاده کرد ، از شبکه‌های اجتماعی گرفته تا بیماری‌های پزشکی و مشکلات اجتماعی مانند تیراندازی در مدارس. بااین‌حال بسیار حیاتی است که بدانید علم داده به شما نمی‌گوید که چگونه این مشکلات را حل کنید! بله، تیراندازی در مدارس یک لکه ننگ در محیط آموزشی آمریکا است و می‌توان با به‌کارگیری علم داده و یادگیری عمیق مدل‌های مفصلی ساخت که خلاصه‌ای از وقایع مربوط به تیراندازی در مدارس را  به شما بدهد.

اما مشکل این نیست. مسئله واقعی، مداخله است! چگونه می‌توان تیراندازی در مدارس را کاهش داد یا از بین برد؟ همان‌طور که پریل استدلال می‌کند، مداخلات ربطی به مسائل آماری ندارد و توزیع احتمالات  به‌خودی‌خود ، نسخه‌ای برای تغییر ندارد.

برخی از مداخلات ارائه‌شده برای کاهش خشونت اسلحه شامل ممنوعیت فروش اسلحه، بررسی دقیق سابقه خریداران احتمالی اسلحه، تجهیز معلمان به اسلحه (به نظر می‌رسد رئیس‌جمهور آمریکا موافق این راهکار است) و حتی لغو قانون آزادی اسلحه است. تمام این‌ها به‌نوعی مداخله محسوب می‌شود. آن‌ها خشونت‌های مرتبط با اسلحه را به‌نوعی کاهش می‌دهند. کدام‌یک مؤثرترین مداخله است؟ سؤال واقعی این است، و متأسفانه علم داده پاسخی برای این سؤال نخواهد داشت، زیرا به مدل‌های علی (مدل لایه ۲ معماری شناختی پریل) نیاز دارد.

درک مداخلات کلید اصلی برای  کاهش خشونت مرتبط با اسلحه و بسیاری از مشکلات دیگر جامعه است.

تغییرات اقلیمی را در نظر بگیرید. ما می‌توانیم انبوهی از داده‌های  مربوط به گرمایش جهانی را جمع‌آوری کنیم و از یادگیری عمیق برای ساخت مدل‌های پیشرفته انتشار دی‌اکسید کربن استفاده کنیم. اما بازهم سؤال مهمی که در اینجا وجود دارد این است که چه مداخله‌ای لازم است؟ آیا باید اتومبیل‌ها و کامیون‌های بنزینی را به‌طور کامل از رده خارج کنیم؟ این موضوع چقدر برای ما زمان می‌خرد؟ پیش‌بینی‌های ترسناکی وجود دارد که نشان می‌دهند نقشه ایالات‌متحده در طی ۱۰،۰۰۰ سال چگونه به نظر می‌رسد. بنابراین، عواقب ناشی از گرم شدن کره زمین کاملاً نگران‌کننده است و درنهایت بقای ما به‌عنوان یک‌گونه را تهدید می‌کند.

پس سؤال این است که در این مورد چه باید کرد؟ چه مداخلاتی بیشترین تأثیر را خواهند داشت و چگونه باید آن‌ها را اجرا کرد. توجه داشته باشید این علم داده نیست. وقتی مداخله می‌کنید ( فرض کنید شهری مانند پکن یا لندن تصمیم دارد مقررات جدید ترافیکی را وضع کند و در یک روز به  پلاک‌های زوج اجازه تردد در شهر دهد و روز دیگر پلاک فرد) توزیع داده‌های اساسی را ازآنچه در حال حاضر است تغییر می‌دهید، و بنابراین ، تمام داده‌های قبلی شما بی‌فایده می‌شود.

بنابراین، مدل‌های علت و معلولی برای درک طیف وسیعی از چالش‌های اجتماعی که در قرن بیست و یکم رواج پیداکرده‌اند، کاملاً موردنیاز است. اگر هوش مصنوعی می‌خواهد در بهبود جامعه مشارکت داشته باشد بستگی به این دارد که محققان این حوزه محدودیت ذاتی پارادایم فعلی که یادگیری ماشین آماری است را درک کنند و این موضوع را تبیین کنند که ما به‌عنوان یک جامعه چرا باید به سمت پارادایم‌های قوی‌تر حرکت کنیم. حیات ما به‌عنوان یک‌گونه ممکن است به توسعه پارادایم بعدی هوش مصنوعی که قدرتمندتر از علم داده است بستگی داشته باشد.

همچنین، تنها کاری که کماکان به دلیل یادگیری خودکار بدون نظارت موفق به انجام آن نشده‌ایم، تنوع کارکردهایی است که هوش مصنوعی می‌تواند انجام دهد. یادگیری ماشین همچنین در جایگزین کردن کارهایی همچون درک معانی از متن و بازی‌های ویدیویی پیچیده سه‌بعدی موفق نشده است.  ایجاد یک هوش مصنوعی که انسان‌ها را در بازی شطرنج و بازی‌های ویدئویی شکست بدهد  یا حتی برای تشخیص بیماران و انجام عمل‌های جراحی کاملاً ممکن است. اما در حال حاضر، آن‌ها فقط برای یک نوع استفاده تعریف‌شده‌اند. آن‌ها هنوز قادر به یادگیری چیزهای کاملاً ناشناخته و تولید آن نیستند و حتی نمی‌توانند آن را بهبود ببخشند. در حال حاضر ما تقریباً در این نقطه قرار داریم.

شما در مورد محدودیت ‌های یادگیری ماشین چه فکر می کنید؟

منبع: hooshio.com

بهترین دیتاست ‌های یادگیری ماشینی برای مبتدیان


اگر به شیوه‌های آموزش الگوریتم‌های یادگیری ماشینی در ۵ یا ۱۰ سال گذشته بنگرید و آن را با شیوه‌های جدید مقایسه کنید، متوجه تفاوت‌های بزرگی می‌شوید. امروزه آموزش الگوریتم‌ها در یادگیری ماشینی بهتر و کارآمدتر از گذشته است و دلیل آن نیز حجم زیاد داده‌هایی است که امروزه در دسترس ما قرار گرفته‌اند. اما یادگیری ماشینی چگونه از این داده‌های استفاده می‌کند؟
به تعریف اصطلاح «یادگیری ماشینی» دقت کنید: «در یادگیری ماشینی، رایانه‌ها یا ماشین‌ها بدون برنامه‌نویسی مستقیم و به‌طور خودکار از تجربیات گذشته می‌آموزند». منظور از آموزش ماشین‌ها درواقع همان عبارت «از تجربیات می‌آموزند» است. طی این فرآیند، داده‌ها و اطلاعات نقش مهمی ایفا می‌کنند. اما ماشین‌ها چگونه آموزش داده می‌شوند؟ پاسخ دیتاست‌ها هستند. به همین دلیل است که دادن اطلاعات و داده‌های درست به ماشینی که قرار است مسئله مدنظر شما را حل کند، مسئله‌ای حیاتی است. در این مقاله دیتاست های یادگیری ماشینی را معرفی می‌کنیم.

اهمیت دیتاست‌ها در یادگیری ماشینی چیست؟

پاسخ این است که ماشین‌ها نیز همچون انسان‌ها توانایی یادگیری مسائل را دارند و تنها کافی است اطلاعات مرتبط با آن موضوع را مشاهده کنند. اما تفاوت آن‌ها با یک انسان، در مقدار داده‌ای است که برای یادگیری یک موضوع نیاز دارند. داده‌هایی که به یک ماشین می‌دهید، از لحاظ کمیت باید چنان باشد که ماشین درنهایت، کاری که از آن خواسته‌اید را انجام دهد. به همین دلیل، برای آموزش ماشین‌‌ها به حجم زیادی از داده‌ها نیاز داریم.

داده‌های یادگیری ماشینی را می‌توان مشابه داده‌های جمع‌آوری‌شده برای انجام یک پژوهش درنظر گرفت، بدین معنا که هر چه حجم داده‌های نمونه شما بزرگ‌تر و نمونه گیری شما کامل‌تر باشد، نتایج حاصل از آن پژوهش معتبرتر خواهد بود. اگر حجم نمونه کافی نباشد، نمی‌توانید تمامی متغیرها را مدنظر قرار دهید. این مسئله منجر به کاهش دقت یادگیری و استخراج ویژگی های میشود که اصلا بیانگر داده ها نیستند و در نهایت استنتاج اشتباه ماشین خواهد شد.

دیتاست‌ها داده‌های موردنیاز شما را در اختیارتان قرار می‌دهند. دیتاست‌ها مدلی آموزش می‌دهند که قادر است واکنش‌های مختلفی نشان دهد. آن‌ها مدلی از الگوریتم‌ها می‌سازند که می‌تواند روابط را آشکار کند، الگوها را تشخیص دهد، مسائل دشوار را درک کند و تصمیم بگیرد.

نکته مهم در استفاده از دیتاست‌ها این است که دیتاست موردنیاز خود را به‌درستی انتخاب کنید. یعنی دیتاستی را انتخاب کنید که دارای فرمت مناسب و ویژگی‌ها و متغیرهای معناداری در رابطه با پروژه شما باشد، زیرا عملکرد نهایی سیستم به آن‌چه که از داده‌ها یاد گرفته، بستگی دارد. علاوه براین، دادن داده‌های درست به ماشین، متضمن این خواهد بود که ماشین عملکرد کارآمدی داشته باشد و بتواند بدون دخالت انسان، به نتایج دقیقی برسد.

برای مثال، اگر برای آموزش یک سیستم بازشناسی گفتار از دیتاستی حاوی داده‌های مربوط به کتب درسی انگلیسی زبان استفاده کنیم، این ماشین در درک مطالب غیر درسی دچار مشکل خواهد شد. زیرا در این دیتاست، داده‌های مربوط به دستورزبان محاوره‌ای، لهجه‌های خارجی و اختلالات گفتاری وجود ندارد و ماشین نیز نمی‌تواند چیزی در این خصوص بیاموزد. بنابراین، برای آموزش این سیستم باید از دیتاستی استفاده کرد که متغیرهای گسترده‌ای که در زبان محاوره و در بین جنسیت‌های مختلف، سنین متفاوت و لهجه‌های مختلف وجود دارد را شامل شود.

بنابراین، باید بخاطر داشته باشید که داده‌های آموزشی شما باید هر سه ویژگی کیفیت، کمیت و تنوع را داشته باشند، زیرا تمامی این عوامل در موفقیت مدل‌های یادگیری ماشینی مؤثر هستند.

برترین دیتاست ‌های یادگیری ماشینی برای مبتدیان

امروزه دیتاست‌های فراوانی برای استفاده در فرآیند یادگیری ماشینی دردسترس قرار گرفته‌اند. به همین دلیل، ممکن است مبتدیان در تشخیص و انتخاب دیتاست درست برای یک پروژه دچار سردرگمی شوند.
بهترین راه‌حل برای این مسئله، انتخاب دیتاستی است که به‌سرعت دانلود و با مدل سازگار شود. به‌علاوه، همیشه از دیتاست‌های استاندارد، قابل‌درک و پرکاربرد استفاده کنید. بدین ترتیب، شما می‌توانید نتایج کارتان را با نتایج حاصل از کار سایر افرادی که از همان دیتاست استفاده کرده‌اند، مقایسه کنید و پیشرفت خود را بسنجید.
دیتاست خود را می‌توانید براساس نتیجه‌ای که از فرآیند یادگیری ماشین انتظار دارید، انتخاب نمایید. در ادامه، مروری خلاصه بر پرکاربردترین دیتاست‌ها در حوزه‌های مختلف یادگیری ماشینی از پردازش تصویر و ویدیو گرفته تا بازشناسی متن  سیستم‌های خودمختار خواهیم داشت.

پردازش تصویر

همان‌طور که گفته شد، دیتاست‌های یادگیری ماشینی متعددی در دردسترس ما قرار دارند، اما برای انتخاب دیتاست باید کارکردی که از برنامه کاربردی خود انتظار دارید را درنظر بگیرید. پردازش تصویر در یادگیری ماشینی برای پردازش تصاویر و استخراج اطلاعات مفید از آن‌ها به‌کار گرفته می‌شود.برای مثال، اگر روی یک نرم‌افزار ساده تشخیص چهره کار می‌کنید، می‌توانید آن را با استفاده از دیتاستی که حاوی تصاویری از چهره انسان‌هاست، آموزش دهید. این همان روشی است که فیس‎بوک برای شناسایی یک فرد در عکس‌های دسته‌جمعی استفاده می‌کند. همچنین، گوگل و سایت‌های جست‌وجوی تصویری محصول نیز در بخش جست‌وجوی تصویری خود از چنین دیتاست‌هایی استفاده کرده‌اند.

نام دیتاستتوضیح مختصر
۱۰k US Adult Faces Databaseاین دیتاست شامل ۱۰.۱۶۸ عکس از چهره طبیعی افراد و ۲.۲۲۲ معیار از چهره است. برخی از معیارهایی که در این دیتاست برای چهره‌ درنظر گرفته شده‌اند عبارتند از: به‌یادماندنی بودن، بینایی یارانه‌ای و صفات روانشناختی. تصاویر این دیتاست در فرمت JPEG هستند، وضوح تصاویر ۷۲ پیکسل در هر اینچ و ارتفاع آن‌ها‌ها ۲۵۶ پیکسل است.
Google’s Open ImagesOpen Image دیتاستی است متشکل از ۹ میلیون نشانی اینترنتی که شما را به تصاویر موجود در اینترنت هدایت می‌کند. این تصاویر دارای برچسب‌های توضیحی هستند که در ۶۰۰۰ دسته مختلف طبقه‌بندی شده‌اند. این برچسب‌ها بیشتر عناصر واقعی را شامل می‌شوند. تنها تصاویری در این دیتاست قرار می‌گیرند که مجوز انتساب مشترکات خلاقانه را دریافت کرده باشند.
Visual Genomeاین دیتاست حاوی بیش از ۱۰۰ هزار تصویر است که کاملاً تفسیر شده‌اند. نواحی هر یک از این تصاویر به‌ این صورت توصیف شده‌اند؛ توضیح ناحیه: دختری که به فیل غذا می‌دهد، شیء: فیل، صفت: بزرگ، رابطه: غذا دادن.
Labeled Faces in the Wildدر این دیتاست بیش از ۱۳.۰۰۰ تصویر از چهره افراد جمع‌آوری شده است. این تصاویر، تصاویری هستند که در فضای اینترنت به ‌اشتراک گذاشته‌ شده بودند و در برچسب هر تصویر، نام فرد درون تصویر ذکر شده است.

 

ایده‌هایی‌ آسان و سرگرم‌کننده برای استفاده از دیتاست‌های تصویری

• گربه یا سگ: با استفاده از دیتاست گربه‌ها و دیتاست استنفورد که حاوی تصاویر سگ‌ها است، برنامه شما می‌تواند تشخیص دهد که در تصویر داده‌شده، سگ وجود دارد یا گربه؟
• طبقه‌بندی گل‌های زنبق: می‌توانید به کمک دیتاست گل‌های زنبق یک برنامه کاربردی مبتنی بر یادگیری ماشینی طراحی کنید که گل‌ها را در ۳ گونه گیاهی طبقه‌بندی کند. با اجرای این پروژه دسته‌بندی صفات فیزیکی برپایه محتوا را خواهید آموخت که به شما در طراحی برنامه‌ها و پروژه‌های کاربردی همچون ردیابی کلاه‌برداری،شناسایی مجرمین، مدیریت درد (برای مثال، برنامه ePAT را درنظر بگیرید که با استفاده از فن‌آوری تشخیص چهره، نشانه‌های درد را در صورت فرد شناسایی می‌کند.) و غیره کمک می‌کند.
• هات‌داگ است یا نه؟: برنامه شما با استفاده از دیتاست Food 101، قادر خواهد بود تا غذاها را شناسایی کند و به شما بگوید که آیا این غذا ساندویچ هات‌داگ است یا خیر.

تحلیل احساس

حتی مبتدیان نیز می‌توانند با استفاده از دیتاست‌های تحلیل احساس برنامه‌های جالبی طراحی کنند. در یادگیری ماشینی می‌توان ماشین‌ها را با به‌کارگیری دیتاست‌های تحلیل احساس به نحوی آموزش داد که عواطف و احساسات موجود در یک جمله، یک کلمه یا یک متن کوتاه را تحلیل و پیش‌بینی کنند. به‌طور معمول، از این قبیل برنامه‌ها برای تحلیل فیلم‌ها و نظرات مشتریان درمورد محصولات استفاده می‌شود. اگر کمی خلاقیت به خرج دهید، می‌توانید برنامه‌ای طراحی کنید که با استفاده از تحلیل‌های احساسی، موضوعی که بحث‌برانگیزتر از سایرین خواهد بود را شناسایی کند.

 

 

 

نام دیتاستتوضیح مختصر
Sentiment140این دیتاست حاوی ۱۶۰.۰۰۰ توییت است که شکلک‌های استفاده‌شده در آن‌ها حذف شده‌اند.
Yelp Reviewsاین دیتاست یک دیتاست رایگان است که توسط شرکت Yelp منتشر شده و حاوی بیش از ۵ میلیون نظر درباره رستوران‌ها، فروشگاه‌ها، تفریح‌های شبانه، غذاها، سرگرمی‌ها و غیره است.
Twitter US Airline Sentimentدر این دیتاست داده‌های مربوط به خطوط هواپیمایی آمریکا در شبکه اجتماعی توییترT از سال ۲۰۱۵ جمع‌آوری شده و به هر یک از آن‌ها یکی از برچسب‌های مثبت، منفی و خنثی داده شده است.
Amazon reviewsدر این دیتاست بیش از ۳۵ میلیون نظر ثبت‌شده در وب‌سایت آمازون طی دوره زمانی ۱۸ ساله جمع‌آوری شده است. داده‌های موجود شامل اطلاعاتی درخصوص محصولات، امتیاز کاربران و نظرات متنی هستند.

 

ایده‌هایی‌ آسان و سرگرم‌کننده برای استفاده از دیتاست‌های تحلیل احساسی

مثبت یا منفی: با استفاده از دیتاست Spambase در مدل خود، توییت‌ها را تحلیل کنید و آن‌ها در دو دسته مثبت و منفی طبقه‌بندی کنید.
راضی یا ناراضی: با استفاده از دیتاست Yelp Reviews پروژه‌ای تعریف کنید که در آن یک ماشین بتواند با مشاهده نظر یک فرد درخصوص یک محصول تشخیص دهد که فرد از آن محصول راضی بوده یا ناراضی.
خوب یا بد: می‌توانید با استفاده از دیتاست Amazon reviews، یک ماشین را به نحوی آموزش دهید که خوب یا بد بودن نظرات کاربران را تشخیص دهد.

پردازش زبان طبیعی

در فن‌آوری پردازش زبان طبیعی ماشین‌ها درجهت تحلیل و پردازش حجم زیادی از داده‌های مربوط به زبان‌های طبیعی آموزش می‌بینند. موتورهای جست‌وجو همچون گوگل به کمک این فن‌آوری می‌توانند آن‌چه شما در بخش جست‌وجو می‌نویسید را پیدا کنند. شما نیز می‌توانید با استفاده از این قبیل دیتاست‌ها، یک برنامه کاربردی جالب پردازش زبان طبیعی و مبتنی بر یادگیری ماشینی طراحی کنید.

 

نام دیتاستتوضیح مختصر
Speech Accent Archiveاین دیتاست حاوی ۲۱۴۰ نمونه صوتی است که در آن‌ها افرادی از ۱۷۷ کشور و ۲۱۴ ریشه زبانی مختلف حضور دارند و متن واحدی را به زبان انگلیسی می‌خوانند.
Wikipedia Links dataاین دیتاست حاوی تقریبا ۱.۹ میلیارد واژه است که از بیش از ۴ میلیون مقاله جمع‌آوری شده‌اند. در این دیتاست می‌توان واژه‌ها، عبارات یا بخشی از یک پاراگراف را جست‌وجو کرد.
Blogger Corpusاین دیتاست متشکل  از ۶۸۱.۲۸۸ پست از وبلاگ‌های مختلف است که از وب‌سایت Blogger.com جمع‌آوری شده‌اند. در هر یک از این وبلاگ‌های منتخب، حداقل ۲۰۰ واژه پرکاربر انگلیسی استفاده شده است.

 

ایده‌هایی‌ جالب برای استفاده از دیتاست‌های پردازش زبان طبیعی:

• هرزنامه یا مفید: با استفاده از دیتاست Spambase می‌توانید برنامه‌ای طراحی کنید که قادر باشد ایمیل‌های هرزنامه را از ایمیل‌های مفید و خوب تشخیص دهد.

پردازش ویدیو

با استفاده از دیتاست‌های پردازش ویدیو، ماشین‌ شما می‌آموزد که صحنه‌های مختلف یک ویدیو و اشیاء، احساسات و کنش و واکنش‌های درون آن را شناسایی و تحلیل کند. به این منظور، شما باید حجم زیادی از داده‌های مربوط به واکنش‌ها، اشیاء و فعالیت‌ها را به ماشین خود بدهید.

نام دیتاستتوضیح مختصر
UCF101 – Action Recognition Data Setاین دیتاست شامل ۱۳.۳۲۰ ویدیو است که براساس عملی که در آن‌ها اتفاق می‌افتد در ۱۰۱ گروه دسته‌بندی شده‌اند.
Youtube 8MYoutube 8M دیتاستی متشکل از تعداد زیادی ویدیوهای برچسب گذاری شده است. این دیتاست شامل شناسه‌های میلیون‌ها ویدیو از یوتیوب و تفسیرهای ماشینی بسیار باکیفیت از این ویدیوهاست. در این تفسیرهای ماشینی از بیش از ۳.۸۰۰ واژه مربوط به اشیاء دیداری استفاده شده است.

 

یک ایده جالب یرای استفاده از دیتاست‌های پردازش ویدیو

  • تشخیص عمل: با استفاده از دیتاست‌های  UCF101 – Action Recognition Data Set یا Youtube 8M  می‌توانیدبه برنامه کاربردی خود آموزش دهید تا اعمال مختلف چون راه‌رفتن یا دویدن را در یک ویدیو شناسایی کند.

تشخیص گفتار

تشخیص گفتار به این معناست که یک ماشین می‌تواند واژه‌ها و عبارات را در زبان گفتاری شناسایی یا تحلیل کند. اگر کیفیت و کمیت داده‌هایی که به ماشین خود داده‌اید مناسب باشد، عملکرد بهتری در حوزه تشخیص گفتار خواهد داشت. با ترکیب دو فن‌آوری پردازش زبان طبیعی و پردازش گفتار می‌توانید دستیار شخصی شبیه به الکسا طراحی کنید که بتواند خواسته شما را به درستی متوجه شود.

 

 

 

نام دیتاستتوضیح مختصر
Gender Recognition by Voice and speech analysisاین دیتاست براساس ویژگی‌های آوایی صدا و گفتار، صدای زنان را از مردان تمیز می‌دهد. این دیتاست حاوی ۳.۱۶۸ فایل صوتی ضبط‌شده از صدای زنان و مردان مختلف در هنگام سخن گفتن است.
Human Activity Recognition w/Smartphoneدیتاست Human Activity Recognition حاوی ویدیوهایی است که از ۳۰ فرد در حین انجام فعالیت‌های روزانه‌شان گرفته شده است. در حین انجام این فعالیت‌ها یک گوشی موبایل (سامسونگ گلکسی S2) نیز به کمر آن‌ها متصل شده بود.
TIMITاز دیتاست TIMIT در مطالعات آواشناسی آکوستیک و توسعه سیستم‌های خودکار تشخیص گفتار استفاده می‌شود. این دیتاست متشکل از فایل‌های صوتی ضبط‌شده از ۶۳۰ نفر است که با ۸ گویش رایج انگلیسی آمریکایی صحبت می‌کردند. هر یک از افراد حاضر در این فرآیند باید  کلمات، مصوت‌ها و جملاتی را می‌خواندند که از لحاظ آوایی بسیار غنی بودند.
Speech Accent Archiveاین دیتاست حاوی ۲۱۴۰ نمونه صوتی است که در آن‌ها افرادی از ۱۷۷ کشور و ۲۱۴ ریشه زبانی مختلف حضور دارند و متن واحدی را به زبان انگلیسی می‌خوانند.

 

ایده‌هایی جالب برای استفاده از دیتاست‌های تشخیص گفتار

• تشخیص لهجه: با استفاده از دیتاست Speech Accent Archive، برنامه کاربردی شما قادر خواهد بود لهجه‌های مختلف را از میان لهجه‌های نمونه تشخیص دهد.
• شناسایی عمل: با استفاده از دیتاست Human Activity Recognition w/Smartphone می‌توانید برنامه‌ای طراحی کنید که فعالیت‌های انسان‌ را تشخیص دهد.

تولید زبان طبیعی

تولید زبان طبیعی به معنای توانایی ماشین‌ها در شبیه‌سازی گفتار انسان است. به کمک این فن‌آوری می‌توان مطالب نوشته‌شده را به فایل‌های شنیداری تبدیل کرد. همچنین این فن‌آوری می‌‌تواند با خواندن مطالبی که روی صفحه نقش بسته‌اند، به افراد کم‌بینا و دارای نقص بینایی کمک کند. این درواقع همان روشی است که دستیارهای هوشمندی چون الکسا و سیری به شما پاسخ می‌دهند.

 

نام دیتاستتوضیح مختصر
Common Voice by Mozillaدیتاست Common Voice حاوی داده‌های گفتاری است که در وب‌سایت Common Voice توسط کاربران خوانده شده‌اند. متون خوانده شده در این وب‌سایت، از منابع عمومی همچون پست‌های کاربران در وبلاگ‌ها، کتاب‌های قدیمی و فیلم‌ها است.
LibriSpeechاین دیتاست شامل حدود ۵۰۰ ساعت فایل صوتی است. این فایل‌ها حاوی کتاب‌های صوتی هستند که توسط افراد مختلف و به زبانی روان خوانده شده‌اند. در این دیتاست فایل صوتی و متن اصلی هر کتاب به تفکیک فصول آن، موجود است.

 

ایده‌هایی جالب برای استفاده از دیتاست‌های تولید زبان طبیعی

• تبدیل متن به گفتار: با استفاده از دیتاست Blogger Corpus،  می‌توانید برنامه‌ای طراحی کنید که متون موجود در وب‌سایت را با صدای بلند بخواند.

اتومبیل‌های خودران

شما نیز می‌توانید یک برنامه یادگیری ماشینی ساده برای اتومبیل‌های خودران طراحی کنید. دیتاست‌های یادگیری ماشینی موجود در حوزه اتومبیل‌های خودران برای درک محیط و هدایت خودرو بدون نیاز به دخالت انسان، به شما کمک خواهند کرد. از این الگوریتم‌ها می‌توان برای هدایت اتومبیل‌های خودران، پهبادها، ربات‌های انباردار و غیره استفاده کرد. اهمیت دیتاست‌ها در این حوزه بیشتر از سایر حوزه‌های یادگیری ماشینی است، زیرا ریسک دراین حوزه بیشتر است و هزینه یک اشتباه ممکن است جان یک انسان باشد.

 

نام دیتاستتوضیح مختصر
Berkeley DeepDrive BDD100kاین دیتاست یکی از بزرگ‌ترین دیتاست‌های موجود در حوزه اتومبیل‌های خودران مبتنی بر هوش مصنوعی است. این دیتاست حاوی بیش از ۱۰۰.۰۰۰ ویدیو از بیش از ۱۰۰۰ ساعت رانندگی در شرایط آب‌وهوایی ساعات مختلف روز می‌باشد.
Baidu ApolloscapesBaidu Apolloscapes دیتاستی بزرگ متشکل از ۲۶ قلم شیء معنایی از جمله خودرو، دوچرخه، عابرین پیاده، ساختمان، چراغ برق و غیره است.
Comma.aiاین دیتاست حاوی بیش از ۷ ساعت ویدیو از رانندگی در بزرگراه است. این داده‌ها شامل اطلاعاتی درخصوص سرعت، شتاب، زاویه فرمان و مختصات مکانی خودرو می‌شوند.
Cityscape Datasetاین دیتاست متشکل از حجم زیادی از داده‌های ویدیوی تهیه‌شده از خیابان‌های ۵۰ شهر مختلف است.
nuScenesاین دیتاست حاوی بیش از ۱۰۰۰ تصویر از مناظر، حدود ۱.۴ میلیون تصویر، ۴۰۰.۰۰۰ داده درخصوص وسعت دید سیستم لیدار (سیستمی که با استفاده از لیزر، فاصله بین اجسام را می‌سنجد) و ۱.۳ میلیون کادر محاطی ۳ بعدی (که با کمک دوربین‌های RGB، رادارها و لیدار اشیاء را شناسایی می‌کند) است.

ایده‌هایی جالب برای استفاده از دیتاست‌های اتومبیل‌های خودران

• طراحی برنامه‌ای ساده برای اتومبیل‌های خودران: با استفاده از یکی از دیتاست‌های بالا و داده‌های مربوط به تجربیات مختلف رانندگی در شرایط آب‌وهوایی متفاوت، برنامه خود را آموزش دهید.

اینترنت اشیاء

کاربردهای یادگیری ماشینی در حوزه اینترنت اشیاء روزبه‌روز درحال گسترش است. شما به عنوان یک مبتدی در دنیای یادگیری ماشینی ممکن است دانش لازم برای طراحی برنامه‌های اینترنت اشیاء کاربردی و پیشرفته که از یادگیری ماشینی استفاده می‌کنند را نداشته باشید، اما قطعاً می‌توانید با شناخت دیتاست‌های مربوطه، به این دنیای شگفت‌انگیز قدم بگذارید.

 

نام دیتاستتوضیح مختصر
Wayfinding, Path Planning, and Navigation Datasetاین دیتاست حاوی نمونه‌هایی از مسیریابی درون یک ساختمان (کتابخانه Waldo در دانشگاه غرب میشیگان) است. این داده‌ها به‌طورمعمول در نرم‌افزارهای مسیریابی به‌کار گرفته می‌شوند.
ARAS Human Activity Datasetاین دیتاست یک دیتاست در حوزه تشخیص فعالیت‌های انسانی است که از ۲ خانوار واقعی جمع‌آوری شده که شامل بیش از ۲۶ میلیون داده از حسگرها و بیش از ۳۰۰۰ فعالیت انجام‌شده می‌باشد.

یک ایده جالب برای استفاده از دیتاست‌های اینترنت اشیاء:

• طراحی یک دستگاه پوشیدنی برای پیگیری فعالیت‌های افراد: با استفاده از دیتاست ARAS Human Activity Dataset، یک دستگاه پوشیدنی را آموزش دهید تا بتواند فعالیت‌های افراد را تمیز دهد.

پس از به پایان رساندن مطالعه این لیست‌ها، نباید احساس محدودیت کنید. این دیتاست‌ها تنها تعدادی از دیتاست‌هایی هستند که می‌توانید در برنامه‌های کاربردی مبتنی بر یادگیری ماشینی از آن‌ها استفاده کنید. در فضای اینترنت می‌توانید دیتاست‌های بهتری نیز برای پروژه یادگیری ماشینی خود پیدا کنید.

می‌توانید در وب‌سایت‌های Kaggle، UCI Machine Learning Repository،  Kdnugget، Awesome Public Datasets,  و  Reddit Datasets Subredditدیتاست‌های بیشتری پیدا کنید.

حال وقت آن است که این دیتاست‌ها را در پروژه خود به کار بگیرید. اگر در حوزه یادگیری ماشینی مبتدی هستید این مقاله  نیز در آشنایی بیشتر با این فن‌آوری به شما کمک خواهد کرد.
جدا از این که تازه‌کار هستید یا مدتی در دنیای یادگیری ماشینی فعالیت داشته‌اید، باید همواره به‌خاطر داشته باشید که دیتاستی را انتخاب کنید که پرکاربرد باشد و بتوان آن را به‌سرعت از یک منبع قابل‌اعتماد  بارگیری کرد.

منبع: hooshio.com

استفاده از یادگیری ماشین در موبایل


تحولات یادگیری ماشین در مویایل کمک بزرگی به توسعه‌دهندگان نرم‌ افزارهای موبایل کرده است. این فناوری زمینه را برای تقویت نرم‌ افزار های موبایل فراهم کرده و تجربه بهتری به کاربران داده است. توصیه‌های دقیق بر اساس موقعیت مکانی و شناسایی بیماری‌های گیاهی از جمله دستاوردهای مهم این فناوری برشمرده می‌شود. پیشرفت سریع یادگیری ماشین در موبایل باعث شده تا تدابیر لازم برای رفع برخی از مسائل رایج در این حوزه اندیشیده شود؛ مسائلی که یادگیری ماشین کلاسیک در حل آنها عاجز مانده است. نرم ‌افزارهای موبایل درر آینده نیازمندِ سرعت پردازش بالا و تاخیر کمتر هستند.

شاید این پرسش به ذهن‌تان خطور کند که چرا نرم ‌افزارهای موبایل AI-first قادر به استنتاج در فضای ابر نیستند. چنین روش متمرکزی قادر نیست سرعت پردازش بالایی را برای تجربه نرم‌افزاری راحت با فناوری یادگیری ماشین ارائه کند. داده‌ها باید در این مرکز داده‌ای متمرکز پردازش شده و سپس به دستگاه مورد نظر ارسال شوند. این فرایند به زمان و هزینه نیاز دارد و نمی‌توان به راحتی حریم خصوصی داده‌ها را تضمین کرد. حال که مزایای عمده یادگیری ماشین در موبایل ذکر شد، بیایید به صورت جامع این موضوع را بررسی کنیم که چرا باید در انتظار انقلابی بزرگ در یادگیری ماشین در دستگاه‌های هوشمند باشیم.

لزوماً نیازی نیست کارشناس یادگیری ماشین باشید تا قابلیت‌های آن را رمزگشایی کنید. این تخصص را به عهده ما بگذارید. به راحتی اقدام به ساخت نرم‌افزارهایی کنید که قابلیت دیدن، شنیدن، حس کردن و فکر کردن با حساب رایگان Fritz AI داشته باشند.

تاخیر کمتر

توسعه‌دهندگان نرم ‌افزارهای موبایل به این موضوع واقف‌اند که تاخیر زیاد مانع بزرگی برای نرم‌افزار است؛ صرف‌نظر از اینکه ویژگی‌ها تا چه حد قوی هستند یا برند خوش‌آوازه و معتبر است. دستگاه‌های اندروید در گذشته در چندین نرم‌افزار ویدئویی با مشکل تاخیر روبرو بودند. این مشکل باعث می‌شد کاربران قادر به تماشای آسان ویدئو نباشند. برای مثال، عدم هماهنگی صدا و تصویر تجربه بدی را به کاربران می‌داد. به طور مشابه، آن دسته از نرم‌افزارهای شبکه اجتماعی که تاخیر بالایی دارند، ناامیدی و خستگیِ کاربران را به همراه دارند. امروزه استفاده از یادگیری ماشین در موبایل و دیگر دستگاه‌های هوشمند بیش از پیش اهمیت پیدا کرده است و دلیل آن را به مسئله تاخیر نسبت می‌دهند. فیلترهای شبکه‌های اجتماعی و توصیه رستوران بر حسب موقعیت مکانی را در نظر بگیرید؛ این‌ها جزو آن دسته از ویژگی‌های نرم‌افزاری هستند که قادر به ارائه بهترین نتایج با تاخیر کم می‌باشند.

همان‌طور که پیشتر اشاره شد، رایانش ابری می‌تواند با کُندی همراه باشد. به این منظور، توسعه‌دهندگان ترجیح می‌دهند تاخیر را به صفر برسانند زیرا تنها در این صورت است که ویژگی‌های یادگیری ماشین به شکل بهینه در نرم ‌افزارهای موبایل عمل می‌کنند. یادگیری ماشین در موبایل و دیگر دستگاه‌های هوشمند می‌تواند با تکیه بر قابلیت‌های داده‌پردازی‌اش، زمینه را برای تاخیرِ نزدیک به صفر مهیا کند.

تولیدکنندگان گوشی‌های هوشمند و بازیگران بزرگ در حوزه فناوری به این موضوع واقف‌اند. شرکت اپل با توسعه تراشه‌های پیشرفته‌تری برای گوشی‌های هوشمند، یکی از پیشروان اصلی این حوزه به حساب می‌آید. این شرکت برای حصول اهداف خود از سیستم Bionic استفاده کرده است؛ این سیستم از یک موتور عصبی یکپارچه بهره می‌برد که امکان اجرای مسقیم و بسیار سریع شبکه‌های عصبی در وسیله‌های هوشمند را فراهم می‌کند. اپل تمرکز ویژه‌ای هم به پلتفرم یادگیری ماشین Core ML دارد. این پلتفرم می‌تواند توجه عده کثیری از توسعه‌دهندگان نرم‌ افزارهای موبایل را به خود جلب کند. تنسورفلو (TensorFlow Lite) نیز هم‌اکنون قابلیت پشتیبانی از GPU را دارد.

گوگل نیز به نوبه خود سعی دارد ویژگی‌هایِ از پیش بارگذاری شده را به پلتفرم یادگیری ماشین خود یعنی ML Kit اضافه کند. توسعه‌دهندگان نرم ‌افزارهای موبایل می‌توانند از این فناوری‌ها برای توسعه آن دسته از نرم‌افزارهایی استفاده کنند که قابلیت پردازش داده‌ با سرعت خارق‌العاده دارند. در این صورت، تاخیر از بین رفته و خطاها کاهش می‌یابند. ترکیب دقت و تجربه بی‌نظیر برای کاربران نکته بسیار مهمی است که توسعه‌دهندگان باید در هنگام ساخت نرم‌افزارهای مبتنی بر یادگیری ماشین به آن توجه داشته باشند. در همین راستا، توسعه‌دهندگان باید توجه ویژه‌ای به یادگیری ماشین در دستگاه‌های هوشمند داشته باشند.

سطح بالای امنیت و حریم خصوصی

یکی دیگر از مزایای عمدۀ رایانش مرزی که امکان درک آن در حال حاضر وجود ندارد، چگونگی عملکرد آن در افزایش سطح امنیت و حریم خصوصی کاربرانش است. تضمینِ امنیت و حریم خصوصی داده‌های نرم‌افزار یکی از بخش‌های اساسی در فعالیت حرفه‌ایِ توسعه‌دهندگان نرم‌افزار برشمرده می‌شود؛ به ویژه با توجه به قانون سخت‌گیرانۀ «مقررات عمومی حفاظت از داده‌ها (GDPR)». این قوانین جدیدِ مربوط به حریم خصوصی قطعاً می‌تواند بر فعالیت‌های توسعه نرم‌افزارهای موبایل تاثیر بگذارد. از آنجا که نیازی نیست داده‌ها برای پردازش به سرور یا ابر ارسال شوند، متخلفان فضای مجازی فرصت اندکی برای سوء استفاده از کاربران آسیب‌پذیر در حین انتقال داده دارند از این رو، حریم داده‌ها حفظ می‌شود. پس این توسعه‌دهندگان نرم ‌افزارهای موبایل این امکان را دارند تا مقررات عمومی حفاظت از داده‌ها را به سادگی در زمینه امنیت داده پیاده‌سازی کنند.

راه‌حل‌های مربوط به یادگیری ماشین در وسیله‌های هوشمند رویکردی تحت عنوان تمرکززدایی پیشنهاد می‌دهند. این رویکرد تا حد زیادی به روش کارکرد بلاک‌چین شباهت دارد. به عبارت دیگر، هکرها نمی‌توانند به راحتی شبکه‌ای به‌هم پیوسته از وسیله‌های پنهان را با حملات DDoS مورد تخاصم قرار داده و به آن نفوذ کنند. این فناوری می‌تواند در زمینه ساخت پهپادها و اجرای قوانین نیز نقش مفید موثری ایفا کند. تراشه‌های گوشی‌ هوشمند اپل که در بالا اشاره شد نیز به افزایش امنیت و حریم خصوصی کاربران کمک شایانی می‌کنند و حتی بنیه اصلی Face ID را تشکیل می‌دهند. این ویژگی آیفون مبتنی بر شبکه عصبی است و داده‌ها را با توجه به شکل صورت کاربران گردآوری می‌کند. بنابراین، یک روش شناسایی امن و دقیق به شمار می‌آید. این فناوری به همراه سخت‌افزارهای آتی مبتنی بر هوش مصنوعی باعث خواهند شد تجربه راحت و امنی برای کاربران گوشی‌های هوشمند ارائه گردد. همچنین، توسعه‌دهندگان نرم‌افزارهای موبایل لایه رمزگذاری بیشتری برای حفاظت از داده‌های کاربران در اختیار خواهند داشت.

از بررسی موارد رایج استفاده گرفته تا چالش‌های فنیِ تبدیل مدل و غیره؛ Fritz AI Newsletter همه مسائل و اطلاعات مربوط به یادگیری ماشین در موبایل را پوشش می‌دهد.

لازم نیست به اینترنت وصل شوید.

فارغ از مسائل مربوط به تاخیر، ارسال داده به ابر مستلزم این است که همواره به اینترنت وصل شوید. اغلب اوقات کاربران در بخش‌های پیشرفته‎ترِ جهان به راحتی کارشان را به پیش می‌برند و در دسترسی به اینترنت هیچ مشکلی ندارند. اما آن دسته از مناطقی که دسترسی کمتری به اینترنت دارند، باید چه کار کنند؟ با برخورداری از یادگیری ماشین در وسیله‌های هوشمند، شبکه‌های عصبی در گوشی‌های موبایل در دسترس قرار خواهد گرفت. بنابراین، صرف‌نظر از میزان دسترسی به اینترنت، توسعه‌دهندگان قادر خواهند بود در هر وسیله و در هر زمانی این فناوری را به کار گیرند.

نکته مهم‌تر این است که کاربران برای اتصال به نرم‌افزارهایشان نیازی به اینترنت نخواهند داشت. بهداشت و درمان از جمله صنایعی است که می‌تواند بیشترین نفع را از یادگیری ماشین در موبایل ببرد؛ زیرا توسعه‌دهندگان قادر به ساخت ابزارهای پزشکی کارآمدی هستند که می‌توانند علائم حیاتی بدن را بررسی کنند. توسعه‌دهندگان می‌توانند زمینه را برای جراحی رباتیک از راه دور نیز فراهم کنند، بدون اینکه نیازی به اتصال اینترنتی باشد. حتی دانش‌آموزان و دانشجویان نیز می‌توانند در مکان‌هایی که امکان اتصال به اینترنت وجود ندارد، به مواد درسی‌شان دسترسی پیدا کنند و عملاً حضور مجازی در کلاس داشته باشند. توسعه‌دهندگان قادر به ساخت نرم‌افزارهایی خواهند بود که کاربران سراسر دنیا از مزایای آنها بهره‌مند شوند؛ بدون اینکه سطح دسترسی به اینترنت دردساز شود. با توجه به اینکه گوشی‌های هوشمند به سطح بالایی از پیشرفت رسیده‌اند، حتی در صورتی که امکان دسترسی به اینترنت وجود نداشته باشد، کاربران در هنگام استفاده از نرم‌افزارشان به صورت آفلاین با تاخیر روبرو نخواهند شد.

کاهش هزینه

یادگیری ماشین در موبایل می‌تواند از میزان هزینه‌ها بکاهد چرا که مجبور نخواهید بود برای اجرای این راه‌حل‌ها به اپراتورهای خارجی پول پرداخت کنید. آن طور که در بخش‌های پیشین ذکر شد، اجرای این راه‌حل‌ها مستلزم دسترسی به اینترنت یا ابر نیست. تراشه‌های مختص هوش مصنوعی و GPU گران‌ترین سرویس‌های ابر هستند. به لطف واحدهای پردازش عصبی (NPU) بسیار پیچیده‌ای که امروزه در گوشی‌های هوشمند تعبیه شده است، اجرای مدل در وسیله‌های هوشمند بدین معناست که نیازی به پرداخت هزینه به این دسته‌ها ندارید. اجتناب از کابوس داده‌پردازی میان موبایل و ابر می‌تواند تا حد زیادی از هزینه‌ها بکاهد؛ بالاخص برای کسب‌وکارهایی که راه‌حل‌های یادیگری ماشین را برای حل مسائل خود مورد استفاده قرار می‌دهند.


نتیجه‌گیری
جای تردید نیست که ابر (Cloud) نعمت بزرگی برای داده و محاسبات در دهه ۲۰۱۰ میلادی بوده است، اما صنعت فناوری با سرعت تصاعدی در حال پیشرفت است. یادگیری ماشین در موبایل نیز به زودی به استانداردی در نرم‌افزارهای موبایل و توسعه IoT تبدیل خواهد شد. بی‌تردید به لطف کاهش مدت تاخیر، امنیت بالا، قابلیت استفادۀ آفلاین و کاهش هزینه، توسعه‌دهندگان نرم‌افزار به آینده این فناوری خیلی امیدوار هستند. اگر علاقمند به کسب اطلاعات بیشتر درباره یادگیری ماشین در موبایل، چگونگی کارکرد و اهمیت ان در فضای توسعه موبایل هستید، می‌توانید به منابع زیر مراجعه کنید:

• Matthijs Holleman’s blog Machine, Think!
• Awesome Mobile Machine Learning:
• Artificial Intelligence at the Edge (video)
• Heartbeat

منبع: hooshio.com