داده چیست؟

در هر جایی که هستید نگاهی به پیرامون خود بیندازید؛ چه می‎بینید؟ من در حال حاضر در اطراف خودم وسایل مختلفی را می‎بینم که در گوشه و کنار خانه چیده شده است: تلویزیون در گوشه‎ای از اتاق است، یک میز و چهار صندلی به دور آن در گوشه دیگری است، ده‎ها عکس قاب شده از فرزندانم بر دیوارها نصب شده است، در گوشه دیگری از اتاق بخاری در حال سوختن است و شعله آن آبی رنگ است و …

هر ویژگی درباره جهان پیرامون ما یک داده است. ویژگی‎ها می‎توانند مانند آنچه در بالا گفته شد، مرتبط با فعالیت‎های بشری باشد و یا مانند کهکشان‎ها و عناصر موجود در آنها خارج از محدوده فعالیت‎های بشری باشد.

منشا داده چیست؟

با تعریفی که در بخش قبلی از داده آمد، چنین به نظر می‎رسد که هر عنصری در جهان خلقت می‎تواند مولد داده باشد. به عبارت دیگر داده به صورت ذاتی وجود دارد. در مثال‎هایی که از پیرامون خودم مطرح کردم، می‎توان در مورد نوع تلویزیون، اندازه آن، رنگ آن، وزن آن و قیمت آن هم فکر کرد؛ بدون شک هر یک از این موارد داده دیگری است که از تلویزیون سرچشمه می‎گیرند.

خلق داده

چنانکه در بخش قبل گفتیم داده به صورت ذاتی موجود است اما کشف شکل‎ها و ابعاد مختلف داده به ذهن کاوشگر ما بستگی دارد و می‎تواند به صورت‎های مختلفی، که زائیده ذهن ماست، خلق شود. در مثال بالا، رنگ تلویزیون را می‎توان به رنگ قاب آن، رنگ پایه آن، رنگ نوشته‎ها (نام برند آن)، رنگ پشت آن و موارد مشابه تقسیم کردو برای هر کدام داده‎ی مجزایی ثبت کرد. همانطور که ملاحظه می‎کنیم با اندیشیدن در هر داده‎ای می‎توان داده جدیدی خلق کرد.

صاحب داده

با صحبت‎هایی که در بالا مطرح شد، بسیاری از داده‎ها را می‎توان به عنوان محصول اندیشه و فکر بشر در نظر گرفت. در نتیجه بحث مالکیت آن کاملا بدیهی است. با این حال برخی از داده‎ها فارغ از هرگونه فکر و اندیشه‎های جزء ظاهری عناصر هستند و صاحب داده همان کسی است که مالک عنصر است.

ارزش آفرینی با داده

داده‎ها به خودی خود دارای ارزش خاصی نیستند ولی با فراوری و پردازش بر روی آنها دارای ارزش می‎شوند. در مثال بالا گفتم که در پیرامون من یک بخاری در حال سوختن است. این داده حداقل دو اطلاع به ما منتقل می‎کند: (۱) خانه‎ای که در مورد آن صحبت می‎شود شوفاژ ندارد و (۲) زمان نوشتن این گزارش فصل سرماست.

از اینکه شنیدید یک میز و چهار صندلی در خانه است به طور قطعی نمی‎توانید نتیجه بگیرید که ما چند نفر هستیم اما وقتی داده مربوط به نصب تابلو عکس قاب شده فرزندانم بر دیوار را در کنار آن می‎گذارید با یقین بیشتری درباره آنکه من دو فرزند دارم می‎توانید صحبت کنید.

محصول داده

ملاحظه می‎کنید که داده‎ها در شناخت محیط پیرامون به ما کمک می‎کنند و از کنار هم قرار گذاردن داده‎ها به اطلاعات دقیق‎تری درباره پیرامون خود دست پیدا می‎کنیم. بشر از بدو تولد در حال یادگیری و افزایش آگاهی نسبت به محیط پیرامون خود است. داده‎ها همان مواد خام برای کسب آگاهی هستند. حتی یک نوزاد، خیلی سریع متوجه می‎شود که با گریه کردن می‎تواند توجه اطرافیان را به خود جلب کرده و بقاء خود را تضمین کند! به مرور با عمل مشاهده و آزمایش و خطا بسیاری از فعالیت‎های دیگر را یاد می‎گیرد. در سال‎های اخیر بسیار کوشش می‎کنند که این فرآیند یادگیری از داده‎ها را تسریع کرده و در شاخه‎ای به نام هوش مصنوعی بر روی آن بسیار کار می‎شود.

نگهداری داده‎ها

در هزاره‎های گذشته داده‎ها بر روی لوح‎های گلی و در مقیاس محدود ثبت می‎شد و نگهداری و انتقال آن کار آسانی نبود. بعدها با کشف کاغذ و امکان نوشتن بر روی آنها، ثبت داده‎ها وسعت بیشتری پیدا کرد. این ماجرا پس از اختراع فناوری‎های کامپیوتری بسیار متحول شد و امروزه حجم غیرقابل تصوری از داده‎ها در یک فضای فیزیکی بسیار کوچک قابل ذخیره و نگهداری است.

مه داده‎ها

با ثبت نام دانش‎آموزان و مراجعه آنها به مدارس مشخص می‎شود که آمار دانش‎آموزان هر مقطع در هر سال چند نفر است. مشتریان یک بانک در پایان هر روز با خواندن آخرین داده‎ای که اعلام شده است مشخص می‎شود. میزان دانلود مشتریان یک اپراتور مخابراتی در هر لحظه تغییر می‎کند و عدد جدیدی قابل ملاحظه است. پس همانطور که ملاحظه می‎کنید تواتر تغییر برخی از داده‎ها بلندمدت، بریا برخی کوتاه‎مدت و برای برخی به صورت لحظه‎ای است. چندسالی است که به واسطه فناوری‎های دیجیتالی سرعت تولید داده‎ها بسیار افزایش پیدا کرده است. داده‎های به وجود آمده از پدیده‎هایی که به صورت لحظه‎ای و با تواتر بسیار بالایی هستند به عنوان مه‎داده تعریف شده است.