مقیاسسازی دادهها چیست و چگونه انجام میشود؟
مقیاسسازی دادهها چگونه انجام میشود؟
در مطالعههای آماری معمولا دادههای جمعآوری شده در ابتدا به زبان اعداد تبدیل میشوند و سپس مطابق با اصول علمی، تجزیه و تحلیلهای آماری روی آنها انجام میگیرد. ماهیت روش اندازهگیری یا نوع مقیاسسازی دادهها تعیین میکند در تجزیه و تحلیل آنها از چه روش آماری میتوان استفاده کرد. در بررسی ویژگیهای کمّی تبدیل دادهها به اعداد با ابزار دقیقی قابل انجام است؛ اما در خصوص ویژگیهای کیفی این امر امکانپذیر نیست که در این حالت استفاده از نظامهای مقیاسگذاری چون مقیاسهای استیونز میتواند راهگشا باشد.
مقیاسها از مهمترین ابزارهای تحقیق در تمامی علوم شناخته میشوند. به کمک مقیاسها، واقعیت مورد مطالعه دقیقتر سنجیده میشود و امکان ردهبندی درونی اجزا فراهم میگردد. استیونز، چهار سطح کلی اندازهگیری را که شامل مجموعه قواعدی برای انتساب مقدار یا ارزش به آزمودنی هستند، به صورت مقیاسهای اسمی، ترتیبی، فاصلهای و نسبتی طبقه بندی نموده است.
مقیاسهای اسمی و ترتیبی در معرفی ویژگی متغیرهای کیفی و مقیاسهای فاصلهای و نسبتی در اندازهگیری ویژگی متغیرهای کمّی کاربرد دارند. همانطور که میدانیم مقیاسسازی ویژگی متغیرها را به زبان اعداد بیان میکند و در واقع این اعداد هستند که در تحلیلها و مدلسازیهای آماری به کار برده میشوند؛ اما آیا نوع مقیاسها تاثیری بر انتخاب روشهای آماری دارد؟
مقیاس سازی داده ها در آمار
چگونه نوع مقیاسها در انتخاب روشهای آماری موثر است؟
در ابتدای مقاله اشاره شد که مقیاسسازی دادهها بر تحلیل آنها و انتخاب روش های آماری موثر است، یعنی در تحلیل دادههای جمعآوری شده علاوه بر توجه بر اصول آماری لازم است که به نوع مقیاسها نیز دقت کنید، چرا که مقیاسسازی دادههای کیفی متفاوت از دادههای کمی است و همین تفاوت میتواند در تحلیل دادهها نیز موثر باشد. البته فراموش نکنید که دادههای کمی و کیفی از هر نظر تفاوت بسیاری دارند و لذا همین تفاوت موجب تفاوت در انتخاب مقیاسها شده و در نهایت بر انتخاب روشها و تکنیکهای آماری در تحلیل دادهها موثر است.
در ادامه برای تفهیم بیشتر این اصل باید گفت که برخلاف مقیاسهای نسبتی اعداد نسبت داده شده در مقیاسهای اسمی تنها شناسهای برای تمایز بین سطوح مختلف متغیرهای کیفی هستند. مقادیر این اعداد در مدلسازیها قابل استفاده نیستند و تنها میتوان از فراوانی آنها استفاده کرد. در این حالت فراوانی دادهها از توزیعهای گسسته تبعیت میکند و تحلیل آنها برمدار روشهای تحلیل دادههای رستهای میچرخد. این در حالی است که مقادیر متغیرهای اندازهگیری شده بر پایه مقیاسهای نسبتی به طور کامل در مدلسازیهای آماری نقش دارند و انواع روشهای آماری به راحتی در تحلیل این دادهها به کار برده میشوند. بنابراین همانطور که مشخص است نوع مقیاسها در انتخاب روشهای آماری موثر است.
ضرورت و اهمیت کاربرد مقیاسسازی دادهها
مقیاسسازی دادهها در تحلیلهای آماری بسیار مورد اهمیت هستند و در واقع محققین و کارشناسان آمار فرایند مقیاسسازی دادهها را اولین گام در انجام تحلیلهای آماری معرفی میکنند. مقیاس سازی دادهها یکی از اقدامات مهمی است که شما باید پیش از انتخاب روش های تحلیل داده بدان پرداخته باشید، به طوری که در زمان سازماندهی و مرتب سازی دادهها، این فرایند باید به طور دقیق انجام شود و تا حدودی دادهها بر این اصل مرتب میشوند؛ اما چرا مقیاسسازی دادهها موضوع مهم و حساسی است؟
در پاسخ باید گفت دادهها وقتی به زبان اعداد تبدیل میشوند، قابلیتهای بیشتری برای تفسیر آنها به وجود میآید. در واقع اعداد با قابلیت بسیار ویژهای که در تحلیلهای ریاضی دارند، میتوانند در هر مبحث و موضوعی با پتناسیل بالای خود نتایج منطقی و قابل تاملی را ارائه دهند. بنابراین در مقیاسسازی دادهها نیز در واقع محققین در تلاش هستند تا دادهها را از آن زبان گنگ اولیه خود به زبانی قابل فهمتر یعنی زبان اعداد تبدیل کنند تا آنچه که درون آنها مخفی شده، به شکلی منطقی تفسیر شود.
با این تفاسیر مقیاسسازی دادهها در گام اول به این دلیل انجام میشود که پژوهشگر به زبان قابل فهمی از دادهها دست یابد و در گام بعدی بتواند از قابلیت تحلیل اعداد بهرهمند شده و نتایج قابل درک و منطقی را از دل دادهها بیرون بکشد؛ اما در کنار این دو موضوع مهم، یک مسئله دیگر نیز وجود دارد و آن اینکه مقیاسسازی دادهها مانع از بروز اشتباهات مختلف در زمان اندازهگیری متغیرها میشود.
شاخص های اندازه گیری داده ها و روش های آماری
پیشتر هم اشاره کردیم که نوع مقیاس دادهها در انتخاب روشهای آماری و تحلیل دادهها موثر است و مفصلا اشاره کردیم که این فرایند چگونه و بر چه اساسی اتفاق میافتد؛ اما چگونه مقیاس سازی میتواند از اشباهات اندازهگیری متغیرها جلوگیری کند؟
در واقع همانطور که گفتیم مقیاسسازی دادهها تاثیر زیادی در انتخاب روشهای آماری و تجزیه و تحلیل دادهها دارد. بنابراین با همین اصل باید گفت داشتن اطلاعات کافی و شناخت انواع مقیاسسازی دادهها موجب میشود تا شما تصمیم درست تری در انتخاب ابزارهای اندازهگیری و در نهایت تحلیل دادهها داشته باشید. به عنوان مثال وقتی شما متغیری مثل کدهای پستی دارید، به خوبی میدانید که این کد تنها مقیاسی عددی است که ویژگی متغیر را توصیف میکند، یعنی یک مقدار عددی خاص نیست که بتوانید آن را با عبارات ریاضی جمع و تفریق کنید، لذا میدانید که نمیتوان با میانگین گرفتن این داده یا متغیر را توصیف کرد.
بدین ترتیب شناخت مقیاسها و استفاده از روشهای مقیاسسازی دادهها مثل مقیاسهای استیونز کمک میکند تا دادهها به زبانی قابل فهم تبدیل شده و با تبدیل به اعداد امکان تحلیل آنها فراهم شود. همچنین با این روش میتوان بهتر و راحتتر متغیرها را اندازهگیری کرد.
معرفی مقیاسهای استیونز
استنلی اسمیت استیونز در سال 1946 در یک مقاله تحت عنوان “در مورد تئوری مقیاسهای اندازهگیری”، چهار مقیاس کلی را برای سطوح سنجش معرفی کرد. این قاعده در ابتدا مورد نقد قرار گرفت؛ اما با اندازهگیریها و مطالعات بسیار مشخص شد چهار مقیاس اندازهگیری استیونز میتواند در هر دو نوع داده کمی و کیفی مورد استفاده قرار گرفته و ابزار خوبی در تبدیل دادهها به اعداد باشد. امروزه در علم آمار و سایر حوزهها از چهار مقیاس اسمی، فاصلهای، نسبتی و ترتیبی در اندازهگیری دادهها استفاده میشود.
مقیاس های اندازه گیری استیونز
در ادامه مختصرا به معرفی 4 مقیاس اندازهگیری استیونز و ویژگیهای آنها میپردازیم:
- مقیاس اسمی:
سادهترین و ابتدایی ترین مقیاس اندازه گیری دادهها، مقیاس اسمی است که در بررسی ها مورد استفاده قرار میگیرد. مقادیری که در این مقیاس به سطوح یک متغیر (مانند جنسیت) نسبت داده می شود، تنها به عنوان یک ممیزی استفاده می شود. بنابراین مقادیر این مقیاس به هیچوجه قابلیت تحلیل عددی و اجرای محاسبات ریاضی را ندارد. همچنین باید گفت که با این مقیاس امکان مرتبسازی براساس بزرگتری و کوچکتری دادهها را نداریم زیرا داده های نسبت داده شده به سطوح متغیر کاملا دلخواه است.
- مقیاس ترتیبی:
با اختلاف بسیار کم مقیاس ترتیبی به نسبت بهتر و پیشرفتهتر از مقیاس اسمی معرفی میشود. در این حالت اعداد نسبت داده شده به سطوح یک متغیر با توجه به جایگاه سطوح متغیر به آنها نسبت داده می شود و معمولا در یک رابطه بزرگ تری- کوچکتری صدق می کنند. به عنوان مثال اعدادی که به رده های سنی یا دوره های زندگی نسبت داده می شوند می توانند از این نوع باشند.
- مقیاس فاصلهای:
یکی از پرکاربردترین مقیاسهای اندازهگیری، مقیاس فاصلهای است که با ارائه یک روش اندازهگیری مناسب در اغلب مطالعات کمی مورد استفاده محققین قرار دارد. در این روش اعداد نسبت داده شده هم در رابطه بزرگ تری- کوچک تری صدق می کنند و هم امکان جمع و تفریق برای مقادیر آنها میسر است. دمای اجسام یک مثال مناسب از این نوع مقیاس است.
- مقیاس نسبتی:
مقیاس نسبتی از جمله انواع مقیاس فاصلهای است؛ اما با این تفاوت که در این روش اندازهگیری ما یک مبدا سنجش ثابت داریم، یعنی در زمان اندازهگیری یک ویژگی، با یک مبدا صفر واقعی مواجه هستیم که باید بر طبق آن اندازهگیری و مقیاسسازی دادهها انجام شود. اعداد نسبت داده شده در این مقیاس قابلیت استفاده در هر چهار عمل اصلی جمع، تفریق، ضرب و تقسیم را دارا هستند.