انواع روش های نرمال سازی داده ها

فهرست محتوا

نرمال سازی داده ها چیست؟

انواع روش نرمال سازی داده‌ها

  • نرمال سازی به روش بردار خطی
  • نرمال سازی به روش برداری (اُقلیدسی)
  • نرمال سازی به روش رومینا Rumina
  • نرمال سازی به روش استاندارد سازی میانگین

نرمال سازی داده‌ها در آمار

بهترین روش نرمال ساز داده‌ها کدام است؟

 

 

نرمال سازی دادهها چیست؟

نرمال سازی داده‌ها روشی است برای یکنواخت کردن بازه مقادیر متغیرهای مختلف در یک پژوهش که کمک می‌کند با بی‌مقیاس کردن داده‌ها امکان سنجش متغیرهای مختلف یک مطالعه برای محقق فراهم گردد. در واقع اگر در حال مطالعه روی یک موضوع باشید و متغیرها از نظر مقیاس  متفاوت از یکدیگر باشند، قطعا نمی‌توانید تصمیم گیری یا تحلیل خاصی روی آنها انجام دهید ولی در عین حال با کاربرد یک روش مناسب و منطقی می‌توانید مقیاس داده‌ها را تغییر داده و فرایند تحلیل را روی آنها انجام دهید.

روش‌های متفاوتی برای این منظور به کار گرفته می‌شود که در ادامه به معرفی آنها می‌پردازیم.

نرمال سازی داده ها یعنی چه؟

انواع روش‌های نرمال سازی داده‌ها

انتخاب روش نرمال سازی داده‌ها همواره به عوامل مختلفی بستگی دارد و نمی‌توان یک روش را برای هر موضوع و هدفی به صورت ثابت و دائم به کار گرفت. بنابراین برای آنکه بتوانید در این مورد بهترین تصمیم گیری را داشته باشید، لازم است ابتدا با انواع روش‌های نرمال سازی داده‌ها آشنا شوید و سپس براساس شرایط و قواعد اینکار، روش مورد نظر را انتخاب و اجرایی کنید. در این بخش به معرفی انواع روش‌های نرمال ساز داده خواهیم پرداخت:

  • نرمال سازی به روش بردار خطی

در این روش که به روش محاسبه بردار ویژه نیز معروف است، هر عدد از مجموعه بر مجموع عناصر آن مجموعه تقسیم می‌شود که در این صورت جمع کل عناصر پس از نرمال سازی داده‌ها برابر یک خواهد بود.

 

  • نرمال سازی به روش برداری (اُقلیدسی)

از این روش بیشتر در روش TOPSIS استفاده می‌شود. اگر پردازش داده‌ها با روش فاصله اقلیدسی(گشتاور مرتبه دوم)  انجام شده باشد، لازم است از روش برداری یا نرم اقلیدسی در نرمال سازی داده‌ها استفاده کرد:

  • نرمال سازی به روش رومینا Rumina

در اجرای تصمیم‌گیری‌های چند معیاره اغلب اوقات با معیارهای مثبت (سودمندی) و معیارهای منفی (زیان) مواجه هستیم که در این حالت روش رومینا به عنوان یک روش نرمال ساز مورد استفاده قرار می‌گیرد. در این حالت برای معیارهای مثبت، مقدار هر معیار بر بزرگترین مقدار آن و برای معیارهای منفی، کوچکترین مقدار آن معیار بر تک تک مقادیر تقسیم می‌شود:

  • نرمال سازی به روش استاندارد سازی میانگین

زمانی که قصد داریم از روش‌های آماری و انواع فرایندهای تجزیه و تحلیل داده‌ها استفاده کنیم، گاها با داده‌هایی برخورد می‌کنیم که از نظر مقدار تفاوت‌های زیادی با یکدیگر دارند و در بازه مناسبی پراکنده نیستند. در این حالت ممکن است اجرای تحلیل‌های آماری روی آنها موجب پرت شدن داده و اریب شدن نتایج گردد. بنابراین در این حالت استفاده از یک روش مناسب و منطقی می‌تواند از بروز چنین احتمالاتی بکاهد. به طور کلی روش استانداردسازی داده‌ها یا نرمال سازی داده‌ها به روش میانگین به صورت زیر انجام می‌شود:

X =  داده مورد نظر که باید نرمال شود.

Mean = میانگین داده‌های متغیری که قصد نرمال‌سازی داده‌های آن را داریم.

Max =  بزرگترین داده

Min =کوچکترین داده

S = انحراف معیار

نرمال سازی داده‌ها در آمار

معنا و مفهوم نرمال سازی داده‌ها در آمار تا حدودی با مفاهیمی که قبلا اشاره شد، متفاوت است. در واقع در اینجا منظور از نرمال کردن داده‌ها تبدیل آنها به داده‌هایی است که از توزیع نرمال تبعیت می‌کنند. در روش‌های آماری گاها برای اجرای برخی آزمون فرض‌ها لازم است داده‌ها دارای توزیع نرمال باشند و لذا اگر داده‌ای از این شرط پیروی نکند، لازم است از روش‌های دیگر در انجام آزمون‌ها استفاده گردد یا با روش‌های مختلف داده‌ها نرمال شوند.

بنابراین در اینجا اصطلاح نرمال سازی داده‌ها به مفهوم توزیع نرمال آنها اشاره دارد. از آنجا که شرط نرمال بودن داده‌ها در اجرای آزمون‌های آماری اهمیت بسیاری دارد، روش‌های مختلفی برای نرمال‌سازی داده‌ها در این زمینه معرفی شده‌اند که البته اجرای این روش‌ها معمولا با توجه به حجم عظیم داده‌ها ساده نیست و بهتر است از نرم‌افزارهای آماری چون R و SPSS استفاده کرد.

روش‌هایی مثل وارون سازی داده‌ها، لگاریتم، جانسون، ریشه دوم و باکس کاکس از جمله روش‌های نرمال ساز داده‌ها هستند که برای این منظور می‌توان از آنها استفاده کرد. کدهای دستوری و امکانات کاربری اجرای این روش‌ها به تفکیک در نرم‌افزارهای R  و  SPSS تعریف شده و فرایند اجرای آنها کار چندان دشواری نیست بلکه تنها به چند ساعت آموزش و تمرین نیاز دارد و البته با توجه به آنکه این روش‌ها برگرفته از روش‌های آماری هستند، توصیه می‌شود در زمینه یادگیری و اجرای آنها حتما از کارشناسان آماری کمک بگیرید.

نرمال سازی داده ها در spss

  

استفاده از روش‌های نرمال ساز داده‌ها در آمار همانطور که معنا و مفهوم این فرایند با سایر علوم متفاوت است، اجرای آن نیز با روش‌های دیگر تفاوت‌های بسیار زیادی دارد که از جمله این تفاوت‌ها می‌توان به شروط استفاده از روش‌های نرمال ساز داده اشاره کرد.

منظور از شروط در واقع فرضیات و قوانینی است که باید داده‌ها از آن تبعیت کنند. به عنوان مثال منفی نبودن داده‌ها یا کمی و کیفی بودن آنها شروطی است که اجرای فرایند نرمال سازی را به چالش می‌کشند و گاه این شرایط می‌تواند مانع از اجرای فرایند نرمال سازی داده ها باشد. بنابراین نرمال کردن داده‌ها در آمار با روش‌هایی که در ابتدای مقاله بدانها اشاره کردیم، بسیار متفاوت است و به آموزش کافی نیاز دارد تا بتوانید با دانش دقیق و اطلاعات جامع بهترین انتخاب و عملیات را در رسیدن به نتایج درست و منطقی داشته باشید.

بهترین روش نرمال ساز داده‌ها کدام است؟

انتخاب یک روش مناسب برای نرمال ساختن داده‌ها به عوامل و فاکتورهای مختلفی بستگی دارد. قطعا تمامی روش‌های معرفی شده‌ روش‌های مناسب و کاربردی هستند و از آنها می‌توان در نرمال سازی، استاندارد سازی و … داده‌ها استفاده کرد؛ اما اینکه کدام روش بر دیگری ارجحیت دارد یا کدام روش بهترین روش نرمال سازی داده‌ها است، قطعا مفهوم و تعریف چندان درستی نیست، چرا که در بعضی مواقع ممکن است تنها به مشابه سازی مقیاس‌ها نیاز داشته باشید و لذا در این حالت روش‌های نرمال سازی باکس کاکس و … که در نرمال کردن توزیع داده‌ها کاربرد دارند، چندان اهمیتی در اجرای روش تحقیق شما ندارند و بالعکس آن.

نرمال سازی داده ها در R

بنابراین تصمیم گیری در انتخاب روش نرمال سازی داده‌ها کار چندان راحتی نیست، چرا که اهداف متفاوتی در انجام این فرایند وجود دارد و چه بسا تنوع روش‌ها امکان و احتمال خطا در انتخاب را افزایش می‌دهد. بنابراین در این زمینه می‌توانید از متخصصین آمار که آشنا به تمام روش‌های نرمال ساز داده‌ها هستند، کمک بگیرید تا با انتخاب بهترین روش به نتایج درست و منطقی دست یابید.

به عنوان حسن ختام باید گفت شرکت آماری آگنا در این زمینه همراه با ارائه خدمات آماری، دوره‌های آموزشی متفاوتی را در قالب دوره‌های نرم‌افزار و دوره‌های آموزش مفاهیم آماری ارائه می‌کند که می‌توانید با مراجعه به سایت و یا ارتباط با کارشناسان آگنا از طریق راه‌های ارتباطی درخواست خود را مبنی بر دریافت خدمات آماری همچون جمع آوری، تجزیه و تحلیل داده‌ها و یا شرکت در دوره‌های آموزشی آگنا، به ما اعلام نمایید.