داده چیست؟
در هر جایی که هستید نگاهی به پیرامون خود بیندازید؛ چه میبینید؟ من در حال حاضر در اطراف خودم وسایل مختلفی را میبینم که در گوشه و کنار خانه چیده شده است: تلویزیون در گوشهای از اتاق است، یک میز و چهار صندلی به دور آن در گوشه دیگری است، دهها عکس قاب شده از فرزندانم بر دیوارها نصب شده است، در گوشه دیگری از اتاق بخاری در حال سوختن است و شعله آن آبی رنگ است و …
هر ویژگی درباره جهان پیرامون ما یک داده است. ویژگیها میتوانند مانند آنچه در بالا گفته شد، مرتبط با فعالیتهای بشری باشد و یا مانند کهکشانها و عناصر موجود در آنها خارج از محدوده فعالیتهای بشری باشد.
منشا داده چیست؟
با تعریفی که در بخش قبلی از داده آمد، چنین به نظر میرسد که هر عنصری در جهان خلقت میتواند مولد داده باشد. به عبارت دیگر داده به صورت ذاتی وجود دارد. در مثالهایی که از پیرامون خودم مطرح کردم، میتوان در مورد نوع تلویزیون، اندازه آن، رنگ آن، وزن آن و قیمت آن هم فکر کرد؛ بدون شک هر یک از این موارد داده دیگری است که از تلویزیون سرچشمه میگیرند.
خلق داده
چنانکه در بخش قبل گفتیم داده به صورت ذاتی موجود است اما کشف شکلها و ابعاد مختلف داده به ذهن کاوشگر ما بستگی دارد و میتواند به صورتهای مختلفی، که زائیده ذهن ماست، خلق شود. در مثال بالا، رنگ تلویزیون را میتوان به رنگ قاب آن، رنگ پایه آن، رنگ نوشتهها (نام برند آن)، رنگ پشت آن و موارد مشابه تقسیم کردو برای هر کدام دادهی مجزایی ثبت کرد. همانطور که ملاحظه میکنیم با اندیشیدن در هر دادهای میتوان داده جدیدی خلق کرد.
صاحب داده
با صحبتهایی که در بالا مطرح شد، بسیاری از دادهها را میتوان به عنوان محصول اندیشه و فکر بشر در نظر گرفت. در نتیجه بحث مالکیت آن کاملا بدیهی است. با این حال برخی از دادهها فارغ از هرگونه فکر و اندیشههای جزء ظاهری عناصر هستند و صاحب داده همان کسی است که مالک عنصر است.
ارزش آفرینی با داده
دادهها به خودی خود دارای ارزش خاصی نیستند ولی با فراوری و پردازش بر روی آنها دارای ارزش میشوند. در مثال بالا گفتم که در پیرامون من یک بخاری در حال سوختن است. این داده حداقل دو اطلاع به ما منتقل میکند: (۱) خانهای که در مورد آن صحبت میشود شوفاژ ندارد و (۲) زمان نوشتن این گزارش فصل سرماست.
از اینکه شنیدید یک میز و چهار صندلی در خانه است به طور قطعی نمیتوانید نتیجه بگیرید که ما چند نفر هستیم اما وقتی داده مربوط به نصب تابلو عکس قاب شده فرزندانم بر دیوار را در کنار آن میگذارید با یقین بیشتری درباره آنکه من دو فرزند دارم میتوانید صحبت کنید.
محصول داده
ملاحظه میکنید که دادهها در شناخت محیط پیرامون به ما کمک میکنند و از کنار هم قرار گذاردن دادهها به اطلاعات دقیقتری درباره پیرامون خود دست پیدا میکنیم. بشر از بدو تولد در حال یادگیری و افزایش آگاهی نسبت به محیط پیرامون خود است. دادهها همان مواد خام برای کسب آگاهی هستند. حتی یک نوزاد، خیلی سریع متوجه میشود که با گریه کردن میتواند توجه اطرافیان را به خود جلب کرده و بقاء خود را تضمین کند! به مرور با عمل مشاهده و آزمایش و خطا بسیاری از فعالیتهای دیگر را یاد میگیرد. در سالهای اخیر بسیار کوشش میکنند که این فرآیند یادگیری از دادهها را تسریع کرده و در شاخهای به نام هوش مصنوعی بر روی آن بسیار کار میشود.
نگهداری دادهها
در هزارههای گذشته دادهها بر روی لوحهای گلی و در مقیاس محدود ثبت میشد و نگهداری و انتقال آن کار آسانی نبود. بعدها با کشف کاغذ و امکان نوشتن بر روی آنها، ثبت دادهها وسعت بیشتری پیدا کرد. این ماجرا پس از اختراع فناوریهای کامپیوتری بسیار متحول شد و امروزه حجم غیرقابل تصوری از دادهها در یک فضای فیزیکی بسیار کوچک قابل ذخیره و نگهداری است.
مه دادهها
با ثبت نام دانشآموزان و مراجعه آنها به مدارس مشخص میشود که آمار دانشآموزان هر مقطع در هر سال چند نفر است. مشتریان یک بانک در پایان هر روز با خواندن آخرین دادهای که اعلام شده است مشخص میشود. میزان دانلود مشتریان یک اپراتور مخابراتی در هر لحظه تغییر میکند و عدد جدیدی قابل ملاحظه است. پس همانطور که ملاحظه میکنید تواتر تغییر برخی از دادهها بلندمدت، بریا برخی کوتاهمدت و برای برخی به صورت لحظهای است. چندسالی است که به واسطه فناوریهای دیجیتالی سرعت تولید دادهها بسیار افزایش پیدا کرده است. دادههای به وجود آمده از پدیدههایی که به صورت لحظهای و با تواتر بسیار بالایی هستند به عنوان مهداده تعریف شده است.