آنالیز و آمار

اصول و مراحل روش های دسته بندی

در مقاله قبل بر لزوم آشنایی با روش های دسته بندی به ویژه در زمینه هایی که با تولید داده همراه است مانند روش های طیف سنجی تاکید شد. در ادامه سعی خواهیم کرد تا با بیانی ساده اصول و مراحل روش های دسته بندی را شرح دهیم. هدف روش های دسته بندی، پیش بینی پاسخ کیفی است، که تعلق به یک دسته خاص (y = 1، 2، 3،…، G؛ G که تعداد کل کلاس ها است) نمونه‌های آنالیز شده بر…

آشنایی با روش های دسته بندی

با افزایش توان فنی و پیشرفت های تکنولوژی، در چند دهه اخیر، شاهد رشد انفجاری تولید داده ها در حوزه های مختلف بوده ایم. این حجم عظیم از داده ها، نیازمند ابزارها و شیوه های مدرنی ست که در جمع آوری، ذخیره سازی و تبدیل داده های خام به اطلاعات و دانش به کار گرفته شوند. به نظر می رسد آشنایی با روش های دسته بندی یا روش های طبقه بندی و داده کاوی در بسیاری از زمینه های علمی،…

مراحل محاسبه عدم قطعیت

امروزه آشنایی با مباحث عدم قطعیت و مراحل محاسبه عدم قطعیت و اندازه‌گیری آن به منظور کنترل فرایندهای آزمایشگاهی، یک کلید ضروری برای به دست آوردن تائیدیه­ های آزمایشگاهی(Laboratory certification) شده است. و از آنجایی که برای تمامی مراحل صنعتی و پژوهشی نیاز به ارائه این تاییدیه ها ست پس آشنایی با این مباحث در مباحث آنالیز مواد شیمیایی به یک الزام تبدیل شده است.  براساس روش استاندارد ISO/IEC.17025 تمامی آزمایشگاه‌ها برای کالیبراسیون و تست‌های انجام شده باید کلیه روش‌های…

انحراف استاندارد و خطای استاندارد

انحراف استاندارد و خطای استاندارد هر دو از پارامترهای مهم آماری هستند که  در زمینه های مالی، پزشکی، زیست شناسی، مهندسی، روانشناسی و … برای ارائه مشخصات داده های نمونه و توضیح نتایج تجزیه و تحلیل آماری مورد استفاده قرار می گیرند.  از نظر آماری انحراف استاندارد و خطای استاندارد دو مفهوم متفاوت هستند که متاسفانه در بسیاری از مواقع تفسیر نادرستی از مفاهیم این دو واژه صورت می گیرد. در بسیاری از مواقع انحراف استاندارد و خطای استاندارد به…

نرم افزارهای آماری

با افزایش میزان تولید داده ها و توان محاسباتی کامپیوترها، نرم افزارهای آماری به بخش جدایی ناپذیر در بیشتر زمینه های صنعتی و تحقیقاتی و به ویژه روش های آنالیزمواد تبدیل شده اند. از رسم منحنی کالیبراسیون، اندازه گیری عدم قطعیت تا روش های دسته بندی، طبقه بندی و مدل سازی به راحتی با چند کلیک ساده امکان پذیر شده است. اما توجه کنید که مهم ترین مسئله در استفاده از انواع نرم افزارهای آماری میزان دانش، تخصص و تسلط…

داده های پرت

بسیاری از مواقع با نگاهی به اندازه گیری های تکراری متوجه می شوید که یک (یا چند) داده وجود دارد که “اشتباه به نظر می رسند”.  به این داده ها یا نقاط داده های پرت یا دور افتاده (outliers) گفته می شود. در تعریف ساده داده های پرت مقادیری هستند که خارج از محدوده طبیعی یک متغیر قرار دارند. با توجه به این که این داده ها می توانند نتایج آنالیز را تحت تاثیر قرار دهند، معمولا ساده ترین و…

تجزیه مولفه های اصلی (PCA)

یکی از متداول ترین روش های آنالیز فاکتوری (Factor analysis) یا بررسی عاملی، روش تجزیه مولفه های اصلی (principal component analysis) با نام اختصاری و متداول PCA است. این روش در بسیاری از زمینه های علوم شامل بیولوژی، کشاورزی، اقتصاد، گرافیک، شیمی، علوم اجتماعی و رفتاری و غیره جهت تشخیص الگو (pattern recognition)، دسته بندی (Clustering) و طبقه بندی (classification)، مدل سازی نرم (soft modeling) و ..کاربرد گسترده ای دارد.   برای مشاوره و انجام پروژه های آمار و کمومتریکس…

انحراف استاندارد

همان طور که در مقاله دقت و صحت گفته شد انحراف استاندارد (standard deviation) پرکاربردترین معیار برای اندازه گیری دقت اندازه گیری ست. این واژه یکی از پارامترهای اصلی در منحنی خطای نرمال یا گوسین (normal error or Gaussian curve) است. منحنی خطای نرمال برای فهم درست انحراف استاندارد یا انحراف معیار لازم است تا کمی در مورد منحنی خطای نرمال یا منحنی گوسین بیشتر بدانیم: شکل 1 دو منحنی برای توزیع فراوانی دو مجموعه تئوری داده را نشان می…

دقت و صحت

دقت و صحت دو مفهوم متداول و علمی برای ارزیابی نتایج خصوصا نتایج عددی هستند که حتی در مکالمات روزمره نیز عمومیت پیدا کرده اند. اما متاسفانه در بسیاری از مواقع واژه های دقت و صحت معادل هم یا به جای هم به کار می روند. با این که تکراری به نظر می رسد اما در اینجا مجددا دقت و صحت را تعریف می کنیم. این دو ویژگی داده های عددی، یعنی دقت و صحت، مهم ترین و بیشترین اشتباه…

معرفی روش های کمومتریکس

روش های محاسباتی کمومتریکس (Chemometrics) روش هایی مبتنی بر تجزیه و تحلیل آماری و ریاضی داده های شیمیایی هستند.  این روش های به عنوان روش هایی کارآمد برای خلاصه کردن اطلاعات مفید از یک سری داده مشخص و پیش بینی سری دیگر داده، شناخته شده اند. داده های (Data) به دست آمده از روش های اندازه گیری کمی یا کیفی، بر اساس تکنیک های آماری و ریاضی به کار رفته در روش  های کمومتریکس به اطلاعات(information) ارزشمندی تبدیل می شوند…