توضیحات
عنوان: روش ها ی دسته بندی
معرفی انواع روش ها دسته بندی و اعتبار سنجی آنها
فرمت فایل: pdf حجم فایل: ۱٫۵۹ mb تعداد صفحات: ۷۵ صفحه
دسته بندی کلاس بندی یا طبقه بندی (Classification) و خوشه بندی (Clustering) از شاخه های علوم داده (Data Science) هستند که به اشکال مختلف برای به دست آوردن الگو ها و کسب دانش در مورد الگوی حاکم بر انواع مختلف داده مورد استفاده قرار می گیرند. روش های دسته بندی از روش های بسیار مهم و کاربردی در بسیاری از علوم مانند شیمی، زیست شناسی، داروسازی و پزشکی، جامعه شناسی، اقتصاد، بازاریابی و .. هستند. در فرآیند داده کاوی، ابتدا مجموعه بزرگی از داده های پردازش می شوند، سپس الگوهای بین داده ها شناسایی شده و روابط و تکنیک هایی برای انجام تجزیه و تحلیل داده ها و حل مسائل استفاده می شود. و در نهایت از این الگو ها برای پیش بینی استفاده می شود. پس به طور خلاصه دسته بندی یا طبقه بندی یک کار علمی بر روی داده هاست که برای پیش بینی مقدار متغیر طبقه بندی شده (هدف یا کلاس) با ساختن یک مدل بر اساس یک یا چند متغیر عددی و / یا دسته ای (پیش بینی کننده یا ویژگی) به کار می رود.
در مدلهای دسته بندی، از دادههای آموزشی برای ساخت یک مدل برای پیشبینی برچسب (label) کلاس برای یک نمونه جدید استفاده میشود. ارزیابی کارایی دسته بندی (Evaluation of classification performance) یک مرحله مهم و بسیار با اهمیت در ارزیابی روش دسته بندی و شاخصی برای رد یا قبول و موفقیت یا عدم موفقیت یک روش دسته بندی برای مجموعه داده مشخص است. عملکرد دسته بندی با مقادیر اسکالر عددی معیارهای مختلف مانند دقت، حساسیت و ویژگی نشان داده میشود.
در این فایل pdf، اصول و روش های دسته بندی همراه با ارزیابی و اعتبارسنجی این روش ها شرح داده می شود. فهرست مطالب ارائه شده در این فایل به شرح زیر می باشد.
فهرست
مقدمه…. ۵
انواع دسته بندی ۷
دسته بندی دوتایی یا باینری ۷
دسته بندی چند کلاسی ۸
دسته بندی خطی و غیر خطی ۹
یادگیری نظارت شده ۱۰
یادگیری نظارت نشده ۱۰
مراحل روش های دسته بندی ۱۱
پیش پردازش ۱۴
تبدیل داده ها ۱۴
روش های دسته بندی ۱۷
تجزیه مولفه های اصلی (PCA) 19
تکنیکهای تمایزی ۲۴
آنالیز تمایزی خطی (LDA) و درجه دوم (QDA) 25
آنالیز تمایزی حداقل مربعات جزئی (PLS-DA) 28
k- نزدیک ترین همسایه (KNN) 30
مدلسازی مستقل نرم قیاسهای طبقاتی (SIMCA) 32
شبکه عصبی مصنوعی ۳۳
تابع انتقال (Transfer function) 37
یادگیری شبکه ۳۹
انواع شبکه عصبی ۴۱
ماشین بردار پشتیبان ۴۲
ارزیابی کارایی دسته بندی ۴۵
ماتریس در هم ریختگی ۴۶
پارامترهای ارزیابی روش های دسته بندی ۵۰
صحت (Acc) 50
نرخ خطا (ERR) 50
نرخ دسته بندی اشتباه (MR) 51
حساسیت(Sn)، نرخ مثبت درست (TPR)، نرخ ضربه (hit rate)، یا یادآوری(recall) 51
ویژگی (Sp)، نرخ منفی درست (TNR)، یا یادآوری معکوس (inverse recall) 51
نرخ مثبت نادرست (FPR)نرخ هشدار نادرست (FAR) یا Fallout 53
نرخ منفی نادرست (FNR) یا نرخ فقدان (MR) 53
دقت (p) یا مقدار پیش بینی مثبت (PPV) 54
ارزش پیشبینی منفی (NPV)، دقت معکوس، یا دقت منفی واقعی(TNA) 54
نسبت درست نمایی (LR) 55
نسبت شانس تشخیصی (DOR) 56
شاخص یودن (YI) 56
ضریب همبستگی متیوز(MCC) 57
توان تشخیصی (DP) 57
معیار فیشر (F-measure) 58
نشانه گذاری (MK) 59
نرخ طبقه بندی متوازن یا صحت متعادل (BCR) 60
میانگین هندسی (GM) 60
دقت بهینه سازی (OP) 61
جاکارد (Jaccard) 62
منحنی راک (ROC) 62
سطح زیر منحنی راک (AUC) 64
مثال های کاربردی ۶۷
محاسبه پارامترهای ارزیابی دسته بندی دوتایی یا باینری ۶۷
محاسبه پارامترهای ارزیابی دسته بندی چندتایی ۷۰
معرفی نرم افزار های دسته بندی ۷۲
مراجع…. ۷۴
نقد و بررسیها
هنوز بررسیای ثبت نشده است.