آنالیز و آمار

رگرسیون خطی چندگانه

رگرسیون خطی چندگانه (MLR) چیست؟ رگرسیون خطی چندگانه (Multiple linear regression) با نام متداول MLR که به سادگی به عنوان رگرسیون چندگانه نیز شناخته می شود، یک تکنیک آماری است که از چندین متغیر توضیحی برای پیش بینی نتیجه یک متغیر پاسخ استفاده می کند. هدف رگرسیون خطی چندگانه مدل سازی رابطه خطی بین متغیرهای توضیحی (مستقل) و متغیرهای پاسخ (وابسته) است. در اصل، رگرسیون چندگانه گسترش رگرسیون حداقل مربعات معمولی (ordinary least-squares ) یا OLS است زیرا شامل بیش…

آزمون فرضیه

آزمون فرضیه  (hypothesis testing)، یک روال رایج و کاربردی در علم داده هاست و کاربرد زیادی در بیشتر علوم مانند اقتصاد، علوم اجتماعی، زیست شناسی، شیمی، داروسازی و .. دارد. هدف آزمون فرضیه آماری این است که از یک فرضیه ابتدایی و خام، به یک گزاره و قضیه موثر برسیم و یا به عبارتی هدف اطمینان از این موضوع است که با توجه به اطلاعات به دست آمده از داده های نمونه، حدسی که درباره مشخصه ای از جامعه می…

آنالیز واریانس

آنالیز واریانس یا تحلیل واریانس (Analysis of variance)، با کلمه مخفف آنووا (ANOVA)، از مباحث بسیار کاربردی و پرتکرار آماری ست که برای مقایسه میانگین چند گروه به کار می رود. مانند آزمون های آماری که در مقاله های قبلی بحث شد، تحلیل واریانس یک‌طرفه و تحلیل واریانس دوطرفه از انواع روش های تحلیل واریانس هستند. تحلیل واریانس از آزمون‌‌های فیشر (تست F) برای بررسی برابر بودن میانگین‌ها استفاده می‌کند که متعلق به سه یا تعدادی بیشتر از گروه‌ها هستند. …

ارزیابی و اعتبار سنجی روش های دسته بندی

ارزیابی و اعتبارسنجی روش های دسته بندی (Evaluation of classification performance) یک مرحله مهم و بسیار با اهمیت در ارزیابی روش دسته بندی و شاخصی برای رد یا قبول و موفقیت یا عدم موفقیت یک روش دسته بندی برای مجموعه داده مشخص است. عملکرد دسته بندی با مقادیر اسکالر عددی معیارهای مختلف مانند دقت، حساسیت و ویژگی نشان داده می‌شود. مقایسه روش های دسته بندی مختلف با استفاده از این معیارها آسان است، اما مشکلات زیادی مانند حساسیت به داده…

انواع روش های دسته بندی

  روش های دسته بندی بر خلاف روش های خوشه بندی براساس مدل سازی عمل می کنند. انواع روش های دسته بندی برای جحل مسایل و مشکلات مختلف برای آنالیز داده ها به کار می روند. این روش ها بسیار متنوع هستند. ما از انواع روش های دسته بندی مختلف چند روش متداول را در اینجا به اختصار شرح داده ایم. تجزیه مولفه های اصلی (PCA) یکی از متداول ترین روش های تشخیص الگو و خوشه بندی روش تجزیه مولفه…

اصول و مراحل روش های دسته بندی

در مقاله قبل بر لزوم آشنایی با روش های دسته بندی به ویژه در زمینه هایی که با تولید داده همراه است مانند روش های طیف سنجی تاکید شد. در ادامه سعی خواهیم کرد تا با بیانی ساده اصول و مراحل روش های دسته بندی را شرح دهیم. هدف روش های دسته بندی، پیش بینی پاسخ کیفی است، که تعلق به یک دسته خاص (y = 1، 2، 3،…، G؛ G که تعداد کل کلاس ها است) نمونه‌های آنالیز شده بر…

آشنایی با روش های دسته بندی

با افزایش توان فنی و پیشرفت های تکنولوژی، در چند دهه اخیر، شاهد رشد انفجاری تولید داده ها در حوزه های مختلف بوده ایم. این حجم عظیم از داده ها، نیازمند ابزارها و شیوه های مدرنی ست که در جمع آوری، ذخیره سازی و تبدیل داده های خام به اطلاعات و دانش به کار گرفته شوند. به نظر می رسد آشنایی با روش های دسته بندی یا روش های طبقه بندی و داده کاوی در بسیاری از زمینه های علمی،…

مراحل محاسبه عدم قطعیت

امروزه آشنایی با مباحث عدم قطعیت و مراحل محاسبه عدم قطعیت و اندازه‌گیری آن به منظور کنترل فرایندهای آزمایشگاهی، یک کلید ضروری برای به دست آوردن تائیدیه­ های آزمایشگاهی(Laboratory certification) شده است. و از آنجایی که برای تمامی مراحل صنعتی و پژوهشی نیاز به ارائه این تاییدیه ها ست پس آشنایی با این مباحث در مباحث آنالیز مواد شیمیایی به یک الزام تبدیل شده است.  براساس روش استاندارد ISO/IEC.17025 تمامی آزمایشگاه‌ها برای کالیبراسیون و تست‌های انجام شده باید کلیه روش‌های…

انحراف استاندارد و خطای استاندارد

انحراف استاندارد و خطای استاندارد هر دو از پارامترهای مهم آماری هستند که  در زمینه های مالی، پزشکی، زیست شناسی، مهندسی، روانشناسی و … برای ارائه مشخصات داده های نمونه و توضیح نتایج تجزیه و تحلیل آماری مورد استفاده قرار می گیرند.  از نظر آماری انحراف استاندارد و خطای استاندارد دو مفهوم متفاوت هستند که متاسفانه در بسیاری از مواقع تفسیر نادرستی از مفاهیم این دو واژه صورت می گیرد. در بسیاری از مواقع انحراف استاندارد و خطای استاندارد به…

نرم افزارهای آماری

با افزایش میزان تولید داده ها و توان محاسباتی کامپیوترها، نرم افزارهای آماری به بخش جدایی ناپذیر در بیشتر زمینه های صنعتی و تحقیقاتی و به ویژه روش های آنالیزمواد تبدیل شده اند. از رسم منحنی کالیبراسیون، اندازه گیری عدم قطعیت تا روش های دسته بندی، طبقه بندی و مدل سازی به راحتی با چند کلیک ساده امکان پذیر شده است. اما توجه کنید که مهم ترین مسئله در استفاده از انواع نرم افزارهای آماری میزان دانش، تخصص و تسلط…