بی شک فناوری هوش مصنوعی در طی سالهای اخیر رشد زیادی داشته است. در این میان یادگیری ماشینی به منظور پیش بینی رویداد ها و محاسبه بر اساس داده های عظیم بسیار قدرتمند است. حال اگر شخصی بخواهد در زمینه هوش مصنوعی و یادگیری ماشینی فعالیت کند، باید از کجا شروع کند؟ در این مقاله قصد داریم به معرفی 10 الگوریتم هوش مصنوعی بپردازیم که در زمینه یادگیری ماشینی نیز بسیار پرطرفدار هستند.

الگوریتم های یادگیری ماشین به 3 دسته تقسیم بندی میشوند:

  1. یادگیری نظارتی: برای مواردی که نوعی ویژگی خاص از یک مجموعه داده معلوم است ولی دیگر موارد در دسترس نیست یا باید پیش بینی شود.
  2. یادگیری غیر نظارتی: برای مواردی که کشف روابط ضمنی در یک وضعیت نامشخص مورد نیاز است.
  3. یادگیری تقویتی: بین دو حالت قبلی است. بطوریکه برخی حالات قابل پیش بینی از یک رویداد موجود است اما دقیق نیستند. که این نوع یادگیری کمی پیچیده تر از بقیه است.

یادگیری نظارتی

درخت تصمیم گیری

درخت تصمیم گیری ابزاری بصورت نمودار درختی است که به منظور تصمیم گیری در بین دو یا چند انتخاب ممکن و عواقب وابسته به آنهاست که شامل شانس ها، هزینه ها(از دست دادن فرصت ها) و بدست آوردن فرصت هاست.

decision-tree

درخت تصمیم گیری

درخت تصمیم گیری به عنوان یک روش به شما اجازه خواهد داد
مسائل را بصورت سیستماتیک در نظر گرفته و بتوانید نتیجه گیری منطقی از آن بگیرید.

روش نایو بیز

روش نایو بیز روشی است که به دسته بندی کردن پدیده ها بر اساس احتمال وقوع یا عدم وقوع آنها می پردازد.شکل زیر فرمول نایو بیز است.

nbclass

فرمول نایو بیز

برخی نمونه های استفاده از نایو بیز در هوش مصنوعی میتواند موارد زیر باشد:

  • گزینش یک ایمیل به عنوان اسپم یا غیر اسپم
  • دسته بندی خبرها درباره تکنولوژی، سیاسی یا ورزشی
  • چک کردن بخشی از متن درباره اینکه آن متن دارای احساسات منفی یا مثبت است

کمینهٔ مربعات معمولی

کمینه مربعات معمولی اصطلاحی در علم آمار است که اگر در زمینه آمار بدانید، درباره رگرسیون خطی نیز حتما شنیده اید. کمینه مربعات معمولی روشی برای یافتن پارامتر های مجهول از طریق حداقل کردن اختلاف بین دو متغیر در مجموعه داده ها است. کمینه مربعات معمولی روشی برای رگرسیون است. رابطه میزان تحصیلات والدین و شغل فرزند، رابطه بین جمعیت محل سکونت و میزان درآمد فرد، رابطه بین معدل دانش آموز و محیط زندگی و… از طریق رگرسیون بدست می آید. با توجه به شکل زیر این کار از طریق کشیدن خطی مستقیم در بین نقاط می باشد. که این نوع نقاط همان داده ها است. با اندازه گیری میزان فاصله عمودی بین نقطه و خط و سپس جمع آنها، خط قرمز رنگ میتواند مقدار کمینه باشد. برای اطلاعات بیشتر در زمینه تحلیل رگرسیون به Linear regression مراجعه کنید.

regression

کمینه مربعات معمولی

رگرسیون لجستیک (منطقی)

رگرسیون لجستیک روش آماری قدرتمندی برای مدل کردن یک خروجی دو جمله ای با یک یا چند متغیر است. این روش ارتباط بین متغیر وابسته و یک یا چند متغیر مستقل را از طریق حدس احتمالات با استفاده از توابع منطقی اندازه می گیرد. رگرسیون لجستیک میتواند برای اندازه گیری میزان موفقیت یک کمپین انتخاباتی، پیش بینی فروش یک محصول یا پیش بینی وقوع زلزله در یک شهر استفاده شود.

lr

رگرسیون لجستیک

 

ماشین بردار پشتیبانی

ماشین بردار پشتیبانی مخفف (Support vector machines) است. این روش یک نوع الگوریتم طبقه بندی دودویی است که با داشتن مجموعه ای از نقاط(داده ها) و تقسیم بندی آنها میتواند خطی را بدست آورد که حاشیه اطمینان بیشتری نسبت به نقاط داشته باشد. اطلاعات بیشتر.

svm

ماشین بردار پشتیبانی

از طریق SVM میتوان مسائل بزرگ و پیچیده ای از قبیل شناسایی تمایز انسان و بات ها در سایت ها، نمایش تبلیغات مورد علاقه کاربر، شناسایی جنسیت افراد در عکس ها و… را حل کرد.

روش Ensemble

این روش نوعی الگوریتم یادگیری است که مجموعه از دسته بندی ها را ترکیب کرده تا مدل قوی تری برای پیش بینی بسازد. اصلی ترین روش Ensemble، روش میانگین بیزی است اما الگوریتم های جدید شامل سیستم تصحیح خطا bagging و boosting می باشد.

learnalgo

الگوریتم Ensemble

یادگیری غیر نظارتی

الگوریتم خوشه بندی

الگوریتم خوشه بندی روشی برای گروه بندی اشیا بصورتی است که اشیایی که بیشتر شبیه هم اند در یک گروه قرار گیرند. هر الگوریتم خوشه بندی به شیوه متفاوت عمل میکند که میتواند شامل موارد زیر باشد:

  • گروه بندی بر اساس چگالی
  • گروه بندی براساس اتصال
  • گروه بندی بر اساس مرکز جرم
  • کاهش ابعاد
  • شبکه عصبی
clusteralgo

الگوریتم خوشه بندی

تحلیل مولفه های اصلی

تحلیل مولفه های اصلی یا Principal Component Analysis یک روش آماری است که داده های موجود را به روی دستگاه مختصات می برد بطوریکه داده ها از بزرگترین واریانس تا کوچکترین به ترتیب روی محورهای X و Y و الی آخر قرار میگرند. این کار میتواند چند بعدی بودن داده ها را مشخص کند و بتوان میزان تجمع داده ها روی یک محور خاص را فهمید.

pcanalysis

تحلیل مولفه های اصلی

تجزیه مقادیر منفرد

تجزیه مقادیر منفرد یا Singular Value Decomposition در جبر خطی، تجزیه مقادیر منفرد روشی برای فاکتورگیری از ماتریس های پیچیده است. در یک ماتریس m * n ماتریس تجزیه M است و U و V  ماتریس واحد و Σ ماتریس قطری است.

singvaluedecomposition

تجزیه مقادیر منفرد

اولین سیستم های تشخیص چهره با استفاده از الگوریتم تجزیه مقادیر منفرد (SVD) و تحلیل مولفه های اصلی (PCA) بوجود آمدند. الیته امروزه از روش های پیچیده تری استفاده میشود اما اساس کار تغییر نکرده است.

تحلیل مولفه های مستقل

تحلیل مولفه های مستقل یا Independent Component Analysis روشی آماری برای آشکار کردن مولفه های پنهان که وابسته به مجموعه از مقادیر تصادفی، اندازه گیری ها یا سیگنال ها می باشد بطوریکه مولفه های حاصل، غیرگوسی و مستقل باشند. الگوریتم ICA وابسته به PCA است و عکس های دیجیتال و ابزارهای اندازه گیری روان سنجی از این الگوریتم استفاده میکنند.

تحلیل مولفه های مستقل