23-08-2016, 02:59 PM
تقریبا همه مواردی که اشاره شده درسته منتهی این یک محدودیتی هست که تقریبا در همه حوزه های جمع آوری داده و آمار وجود داره و استدلال هم بر اینه که وجود یک آمار تقریبی از یک پدیده همواره بهتر از نبود اون آمار هست. در بسیاری از دیتابیس ها یک متادیتا (meta data) هم تهیه میشه که شیوه تفسیر داده های موجود در دیتابیس اصلی رو توضیح میده. مثلا اگر دما در دیتابیس اصلی ۲۰ گزارش شده در متادیتا گفته میشه که سانتیگراد بوده یا کلوین و دیگر شرایط فیزیکی اندازه گیری مثل فشار و غیره که در تفسیر اون داده خاص تاثیرگذاره آورده میشه. تهیه چنین متادیتایی معمولا توسط کارشناس خاصی صورت می گیره و در جایی که داده ها توسط افراد مختلفی با سلیقه های مختلف وارد میشه تهیه اون زیاد ساده نیست و به مهارت خواننده یا استفاده کننده از داده ها بستگی داره که با پردازش اون داده ها یک برداشت عمومی و تقریبی برای خودش به دست بیاره.
برای نمونه در مورد داده هایی که اشتباه وارد میشه فرض بر اینه که درصد کمی رو به خودشون اختصاص میدن و در نتیجه خواننده میتونه اونها رو به عنوان outlier یا به اصطلاح داده پرت شناسایی کنه و در پردازش اولیه اونها رو نادیده بگیره.
در مورد شهریه بیشتر هدف کاربر اینه که بدونه اساسا اون فرد تونسته با اون شرایط فاندی بگیره یا خیر و نوع اون از درجه اهمیت چندانی در تصمیم گیری خیلی از متقاضیان اثرگذار نیست. چون نبود فاند در اغلب اوقات باعث میشه اون گزینه کلا برای متقاضی منتفی بشه. یا مثلا در مورد اسم دانشگاه ها متقاضی بیشتر میخواد بدونه که فردموردنظر سراسری بوده یا غیر سراسری یا کمی جزیی تر مثلا سراسری معروف بوده یا غیرمعروف (بعید هم می دونم همبستگی خاصی بین اسم دانشگاه ها در حد جزیی تر وجود داشته باشه چون دانشگاه های مقصد با جزییات خیلی زیاد دانشگاه های ایران رو نمی شناسند). وجود داده های جزیی تر طبیعتا خیلی خوبه ولی گاهی وارد کننده ها حوصله واردسازی اطلاعات با جزییات خیلی بالا رو ندارند و در چنین شرایطی شاید داشتن همون معیار کلی هم برای خیلی ها کفایت کنه.
در مورد نوع مقالات و تفکیک مهارت های زبانی هم همین صحبت اخیر صدق می کنه و در نبود جزییات، فرض بر همون متوسط گیری هست. همون طور که معدل یک فرد هم معیار دقیقی از شیوه توزیع و چولگی (skewness) نمرات اون فرد به دست نمیده ولی خلاصه ترین و کوتاهترین داده ای است که تقریب معقولی از کم و کیف نمرات اون فرد به دست میده. برای اطلاعات بهتر به ماکزیمم و مینیمم و توزیع نمرات اون فرد در دروس تخصصی و غیرتخصصی و در ترم های مختلف نیازه ولی همونطور که اشاره کردم هر فردی حوصله واردسازی این داده ها رو با این جزییات زیاد نداره و حتی در صورت وجود هم ردیف های جدول رو خیلی زیاد می کنه و نیازمند صفحات واسطه برای آوردن جزییات میشه.
در مجموع هر چند وجود چنین جزییاتی به حتم اطلاعات خیلی بهتری به دست میده، نمیشه اهمیت همون داده های کلی و متوسط گیری شده رو هم در ارایه یک معیار کلی برای شانس پذیرش کاربر نادیده گرفت.
برای نمونه در مورد داده هایی که اشتباه وارد میشه فرض بر اینه که درصد کمی رو به خودشون اختصاص میدن و در نتیجه خواننده میتونه اونها رو به عنوان outlier یا به اصطلاح داده پرت شناسایی کنه و در پردازش اولیه اونها رو نادیده بگیره.
در مورد شهریه بیشتر هدف کاربر اینه که بدونه اساسا اون فرد تونسته با اون شرایط فاندی بگیره یا خیر و نوع اون از درجه اهمیت چندانی در تصمیم گیری خیلی از متقاضیان اثرگذار نیست. چون نبود فاند در اغلب اوقات باعث میشه اون گزینه کلا برای متقاضی منتفی بشه. یا مثلا در مورد اسم دانشگاه ها متقاضی بیشتر میخواد بدونه که فردموردنظر سراسری بوده یا غیر سراسری یا کمی جزیی تر مثلا سراسری معروف بوده یا غیرمعروف (بعید هم می دونم همبستگی خاصی بین اسم دانشگاه ها در حد جزیی تر وجود داشته باشه چون دانشگاه های مقصد با جزییات خیلی زیاد دانشگاه های ایران رو نمی شناسند). وجود داده های جزیی تر طبیعتا خیلی خوبه ولی گاهی وارد کننده ها حوصله واردسازی اطلاعات با جزییات خیلی بالا رو ندارند و در چنین شرایطی شاید داشتن همون معیار کلی هم برای خیلی ها کفایت کنه.
در مورد نوع مقالات و تفکیک مهارت های زبانی هم همین صحبت اخیر صدق می کنه و در نبود جزییات، فرض بر همون متوسط گیری هست. همون طور که معدل یک فرد هم معیار دقیقی از شیوه توزیع و چولگی (skewness) نمرات اون فرد به دست نمیده ولی خلاصه ترین و کوتاهترین داده ای است که تقریب معقولی از کم و کیف نمرات اون فرد به دست میده. برای اطلاعات بهتر به ماکزیمم و مینیمم و توزیع نمرات اون فرد در دروس تخصصی و غیرتخصصی و در ترم های مختلف نیازه ولی همونطور که اشاره کردم هر فردی حوصله واردسازی این داده ها رو با این جزییات زیاد نداره و حتی در صورت وجود هم ردیف های جدول رو خیلی زیاد می کنه و نیازمند صفحات واسطه برای آوردن جزییات میشه.
در مجموع هر چند وجود چنین جزییاتی به حتم اطلاعات خیلی بهتری به دست میده، نمیشه اهمیت همون داده های کلی و متوسط گیری شده رو هم در ارایه یک معیار کلی برای شانس پذیرش کاربر نادیده گرفت.
ای دگرگون کننده ی دل ها و چشم ها / ای گرداننده ی روزها و شب ها / ای تغییر دهنده ی روزگار و انسان ها / حال ما را به بهترین حال دگرگون فرما
.We are all visitors to this time, this place. We are just passing through. Our purpose here is to observe, to learn, to grow, to love... and then we return home
Aboriginal Proverb -