وقتی درباره تحلیل داده ها و بررسی های آماری صحبت میکنیم، دو واژه ی کلیدی خودنمایی میکنند : «تحلیل» و «داده ها». ابتدا باید دید چقدر «داده» گردآوری کرده ایم و از چه نوع داده هایی صحبت میکنیم. بگذارید مثال روشن تری برایتان بزنم.
اگر کسب و کاری دارید که میخواهید حجم سفارشات دریافتی آنرا نسبت به پراکندگی جغرافیایی مشتریان بدانید ، تا امکان برنامه ریزی تبلیغات برای جلب سفارش دهندگان از برخی مناطق را گسترش دهید، ابتدا نیاز دارید که بدانید بطور مثال ، طی یک سال گذشته ، چه حجم سفارشی روی کدام کالاها و از کدامین مناطق جغرافیایی داشته اید. این به نظر خیلی بدیهی می آید.
اما حالا سوال بعدی مطرح میشود : آیا در سیستم ثبت سفارشات کمپانی شما، منطقه جغرافیایی سفارش دهنده نیز ثبت شده است؟ و آیا حجم سفارش ها (منظور تعداد اقلام سفارش داده شده طی هر خرید) نیز ثبت شده؟ داده ها در سیستم های کامپیوتری موجود هستند، یا روی برگه های کاغذی؟ داده ها در یک سیستم مجتمع هستند یا پراکنده اند؟ از کی شروع به جمع آوری آنها نموده اید؟ شاید فقط شش ماه از تاریخ شروع گردآوری آنها گذشته باشد (که البته اشکالی هم ندارد، فقط در نتیجه نمیتوان تا شش ماه بعد، به آمارهای سالیانه دست یافت)
همانطور که در مثال بالا با هم دیدیم، مسئله را از آخر به اول حل کردیم. یعنی سر رشته از اینجا شروع شد که در نهایت به چه نوع گزارشاتی نیاز خواهیم داشت؟ به عبارت بهتر، اگر در گزارشات نهایی به اطلاعاتی نیاز خواهیم داشت که در حال حاضر جمع آوری نمیشوند، لازمست پیش از اقدام به ایجاد رویه های تحلیل داده، نسبت به جمع آوری آنها اقدام کنیم.
موضوع در «تحلیل داده ها» دقیقاَ همین شکل را دارد. یعنی مسئله «از آخر به اول» باید حل شود. به قول معروف باید «چاله» اش را از خیلی قبل تر کنده باشیم. مواد اولیه را باید از خیلی قبل تر شروع کنیم به جمع آوری کردن. اما این تنها بخش ماجرا نیست. نحوه ی گزارش دهی، شناخت علم رنگ ها، توسعه ی فرهنگ تصمیم گیری براساس داده ها در سطح کمپانی (که شاید سخت ترین بخش این کار باشد)، و انتخاب platform مناسب (ابزار، زیر ساخت، رویه های جمع آوری دیتا در انباره های داده، رویه های monitoring و حصول اطمینان از اینکه داده ها از زیرسیستم های مختلف، به موقع و درست به انباره ی داده منتقل میشوند، و …) همه و همه مستلزم برنامه ریزی های بلند مدت و آگاهانه مدیران است. خلاصه کار راحت و کم دردسر و یا حتی کم هزینه ای نیست. اما اگر حجم داده های زیاد و پراکنده ای دارید، قطعاَ به زحمتش می ارزد. فی الواقع باید گفت امروزه برای تصمیم گیری درست، «راه دیگری وجود ندارد»!
1 دیدگاه. دیدگاه تازه ای بنویسید
بسیار خوب و روان توضیح داده بودید. متشکرم.