مقیاسسازی دادهها چیست و چگونه انجام میشود؟

 

 

مقیاسسازی دادهها چگونه انجام میشود؟

در مطالعه‌های آماری معمولا داده‌های جمع‌آوری شده در ابتدا به زبان اعداد تبدیل می‌شوند و سپس مطابق با اصول علمی، تجزیه و تحلیل‌های آماری روی آن‌ها انجام می‌گیرد. ماهیت روش اندازه‌گیری یا نوع مقیاس‌سازی داده‌ها تعیین می‌کند در تجزیه و تحلیل آن‌ها از چه روش آماری می‌توان استفاده کرد. در بررسی ویژگی‎های کمّی تبدیل داده‌ها به اعداد با ابزار دقیقی قابل انجام است؛ اما در خصوص ویژگی‎های کیفی این امر امکان‌پذیر نیست که در این حالت استفاده از نظام‎های مقیاس‌گذاری چون مقیاس‌های استیونز می‎تواند راهگشا باشد.

مقیاس‌ها از مهم‌ترین ابزارهای تحقیق در تمامی علوم شناخته می‌شوند. به کمک مقیاس‌ها، واقعیت مورد مطالعه دقیق‌تر سنجیده می‌شود و امکان رده‌بندی درونی اجزا فراهم می‌گردد. استیونز، چهار سطح کلی اندازه‌گیری را که شامل مجموعه قواعدی برای انتساب مقدار یا ارزش به آزمودنی هستند، به صورت مقیاس‌های اسمی، ترتیبی، فاصله‌ای و نسبتی طبقه بندی نموده است.

مقیاس‌های اسمی و ترتیبی در معرفی ویژگی متغیرهای کیفی و مقیاس‌های فاصله‌ای و نسبتی در اندازه‌گیری ویژگی متغیرهای کمّی کاربرد دارند. همانطور که می‌دانیم مقیاس‌سازی ویژگی متغیرها را به زبان اعداد بیان می‌کند و در واقع این اعداد هستند که در تحلیل‌ها و مدل‌سازی‌های آماری به کار برده می‌شوند؛ اما آیا نوع مقیاس‌ها تاثیری بر انتخاب روش‌های آماری دارد؟

مقیاس سازی داده ها در آمار

چگونه نوع مقیاسها در انتخاب روشهای آماری موثر است؟

در ابتدای مقاله اشاره شد که مقیاس‌سازی داده‌ها بر تحلیل آنها و انتخاب روش های آماری موثر است، یعنی در تحلیل داده‌های جمع‌آوری شده علاوه بر توجه بر اصول آماری لازم است که به نوع مقیاس‌ها نیز دقت کنید، چرا که مقیاس‌سازی داده‌های کیفی متفاوت از داده‌های کمی است و همین تفاوت می‌تواند در تحلیل داده‌ها نیز موثر باشد. البته فراموش نکنید که داده‌های کمی و کیفی از هر نظر تفاوت بسیاری دارند و لذا همین تفاوت موجب تفاوت در انتخاب مقیاس‌ها شده و در نهایت بر انتخاب روش‌ها و تکنیک‌های آماری در تحلیل داده‌ها موثر است.

در ادامه برای تفهیم بیشتر این اصل باید گفت که برخلاف مقیاس‌های نسبتی اعداد نسبت داده شده در مقیاس‌های اسمی تنها شناسه‌ای برای تمایز بین سطوح مختلف متغیرهای کیفی هستند. مقادیر این اعداد در مدل‌سازی‌ها قابل استفاده نیستند و تنها می‌توان از فراوانی آن‌ها استفاده کرد. در این حالت فراوانی داده‌ها از توزیع‌های گسسته تبعیت می‎کند و تحلیل آن‎ها برمدار روش‌های تحلیل داده‎های رسته‎ای می‎چرخد. این در حالی است که مقادیر متغیرهای اندازه‎گیری شده بر پایه مقیاس‌های نسبتی به طور کامل در مدل‌سازی‌های آماری نقش دارند و انواع روش‌های آماری به راحتی در تحلیل این داده‌ها به کار برده می‌شوند. بنابراین همانطور که مشخص است نوع مقیاس‌ها در انتخاب روش‌های آماری موثر است.

ضرورت و اهمیت کاربرد مقیاسسازی دادهها

مقیاس‌سازی داده‌ها در تحلیل‌های آماری بسیار مورد اهمیت هستند و در واقع محققین و کارشناسان آمار فرایند مقیاس‌سازی داده‌ها را اولین گام در انجام تحلیل‌های آماری معرفی می‌کنند. مقیاس سازی داده‌ها یکی از اقدامات مهمی است که شما باید پیش از انتخاب روش های تحلیل داده بدان پرداخته باشید، به طوری که در زمان سازماندهی و مرتب سازی داده‌ها، این فرایند باید به طور دقیق انجام شود و تا حدودی داده‌ها بر این اصل مرتب می‌شوند؛ اما چرا مقیاس‌سازی داده‌ها موضوع مهم و حساسی است؟

در پاسخ باید گفت داده‌ها وقتی به زبان اعداد تبدیل می‌شوند، قابلیت‌های بیشتری برای تفسیر آنها به وجود می‌آید. در واقع اعداد با قابلیت بسیار ویژه‌ای که در تحلیل‌های ریاضی دارند، می‌توانند در هر مبحث و موضوعی با پتناسیل بالای خود نتایج منطقی و قابل تاملی را ارائه دهند. بنابراین در مقیاس‌سازی داده‌ها نیز در واقع محققین در تلاش هستند تا داده‌ها را از آن زبان گنگ اولیه خود به زبانی قابل فهم‌تر یعنی زبان اعداد تبدیل کنند تا آنچه که درون آنها مخفی شده، به شکلی منطقی تفسیر شود.

با این تفاسیر مقیاس‌سازی داده‌ها در گام اول به این دلیل انجام می‌شود که پژوهشگر به زبان قابل فهمی از داده‌ها دست یابد و در گام بعدی بتواند از قابلیت تحلیل اعداد بهره‌مند شده و نتایج قابل درک و منطقی را از دل داده‌ها بیرون بکشد؛ اما در کنار این دو موضوع مهم، یک مسئله دیگر نیز وجود دارد و آن اینکه مقیاس‌سازی داده‌ها مانع از بروز اشتباهات مختلف در زمان اندازه‌گیری متغیرها می‌شود.

شاخص های اندازه گیری داده ها و روش های آماری

پیش‌تر هم اشاره کردیم که نوع مقیاس داده‌ها در انتخاب روش‌های آماری و تحلیل داده‌ها موثر است و مفصلا اشاره کردیم که این فرایند چگونه و بر چه اساسی اتفاق می‌افتد؛ اما چگونه مقیاس سازی می‌تواند از اشباهات اندازه‌گیری متغیرها جلوگیری کند؟

در واقع همانطور که گفتیم مقیاس‌سازی داده‌ها تاثیر زیادی در انتخاب روش‌های آماری و تجزیه و تحلیل داده‌ها دارد. بنابراین با همین اصل باید گفت داشتن اطلاعات کافی و شناخت انواع مقیاس‌سازی داده‌ها موجب می‌شود تا شما تصمیم درست تری در انتخاب ابزارهای اندازه‌گیری و در نهایت تحلیل داده‌ها داشته باشید. به عنوان مثال وقتی شما متغیری مثل کدهای پستی دارید، به خوبی می‌دانید که این کد تنها مقیاسی عددی است که ویژگی متغیر را توصیف می‌کند، یعنی یک مقدار عددی خاص نیست که بتوانید آن را با عبارات ریاضی جمع و تفریق کنید، لذا می‌دانید که نمی‌توان با میانگین گرفتن این داده یا متغیر را توصیف کرد.

بدین ترتیب شناخت مقیاس‌ها و استفاده از روش‌های مقیاس‌سازی داده‌ها مثل مقیاس‌های استیونز کمک می‌کند تا داده‌ها به زبانی قابل فهم تبدیل شده و با تبدیل به اعداد امکان تحلیل آنها فراهم شود. همچنین با این روش می‌توان بهتر و راحت‌تر متغیرها را اندازه‌گیری کرد.

معرفی مقیاسهای استیونز

استنلی اسمیت استیونز در سال 1946 در یک مقاله تحت عنوان “در مورد تئوری مقیاس‌های اندازه‌گیری”، چهار مقیاس کلی را برای سطوح سنجش معرفی کرد. این قاعده در ابتدا مورد نقد قرار گرفت؛ اما با اندازه‌گیری‌ها و مطالعات بسیار مشخص شد چهار مقیاس اندازه‌گیری استیونز می‌تواند در هر دو نوع داده کمی و کیفی مورد استفاده قرار گرفته و ابزار خوبی در تبدیل داده‌ها به اعداد باشد. امروزه در علم آمار و سایر حوزه‌ها از چهار مقیاس اسمی، فاصله‌ای، نسبتی و ترتیبی در اندازه‌گیری داده‌ها استفاده می‌شود.

مقیاس های اندازه گیری استیونز

در ادامه مختصرا به معرفی 4 مقیاس اندازه‌گیری استیونز و ویژگی‌های آنها می‌پردازیم:

  • مقیاس اسمی:

ساده‌ترین و ابتدایی ترین مقیاس اندازه گیری داده‌ها، مقیاس اسمی است که در بررسی ها مورد استفاده قرار می‌گیرد. مقادیری که در این مقیاس به سطوح یک متغیر (مانند جنسیت) نسبت داده می شود، تنها به عنوان یک ممیزی استفاده می شود. بنابراین مقادیر این مقیاس به هیچ‌وجه قابلیت تحلیل عددی و اجرای محاسبات ریاضی را ندارد. همچنین باید گفت که با این مقیاس امکان مرتب‌سازی براساس بزرگتری و کوچکتری داده‌ها را نداریم زیرا داده های نسبت داده شده به سطوح متغیر کاملا دلخواه است.

  • مقیاس ترتیبی:

با اختلاف بسیار کم مقیاس‌ ترتیبی به نسبت بهتر و پیشرفته‌تر از مقیاس اسمی معرفی می‌شود. در این حالت اعداد نسبت داده شده به سطوح یک متغیر با توجه به جایگاه سطوح متغیر به آنها نسبت داده می شود و معمولا در یک رابطه بزرگ تری- کوچکتری صدق می کنند. به عنوان مثال اعدادی که به رده های سنی یا دوره های زندگی نسبت داده می شوند می توانند از این نوع باشند.

  • مقیاس فاصلهای:

یکی از پرکاربردترین مقیاس‌های اندازه‌گیری، مقیاس فاصله‌ای است که با ارائه یک روش اندازه‌گیری مناسب در اغلب مطالعات کمی مورد استفاده محققین قرار دارد. در این روش اعداد نسبت داده شده هم در رابطه بزرگ تری- کوچک تری صدق می کنند و هم امکان جمع و تفریق برای مقادیر آنها میسر است. دمای اجسام یک مثال مناسب از این نوع مقیاس است.

  • مقیاس نسبتی:

مقیاس نسبتی از جمله انواع مقیاس فاصله‌ای است؛ اما با این تفاوت که در این روش اندازه‌گیری ما یک مبدا سنجش ثابت داریم، یعنی در زمان اندازه‌گیری یک ویژگی، با یک مبدا صفر واقعی مواجه هستیم که باید بر طبق آن اندازه‌گیری و مقیاس‌سازی داده‌ها انجام شود. اعداد نسبت داده شده در این مقیاس قابلیت استفاده در هر چهار عمل اصلی جمع، تفریق، ضرب و تقسیم را دارا هستند.