کلان‌داده‌ها در دنیای امروز

مایکل کازینسکی

مایکل کازینسکی محقق دانشگاه استنفورددر زمینه رفتار انسان ها است. وی دانش آموخته رشته روانشناسی از کمبریج است.تحقیقات وی بر تفاوت فردی در رفتار،ترجیحات و عملکرد انسان‌ها متمرکز است.مسائلی مانند شخصیت و مطالعه بر آن حوزه مورد علاقه کازینسکی است. او این کار را از طریق روش داده‌کاوی از میلیون‌ها‌مخاطب انجام می دهد. او در یاداشتی اختصاصی که آن را در اختیار روزنامه دنیای اقتصاد قرار داده به بررسی نقش کلان‌داده‌ها در روان‌سنجی پرداخته است.

وقتی سخن از کلان داده‌ها و این حیطه به میان می‌آید، افراد عموما در مورد اینکه ماهیت آن چیست، دچار تضادهایی هستند. برای من کلان داده‌ها در واقع اطلاعاتی هستند که باید به وسیله انسان‌ها مورد پردازش قرار ‌گیرند. بنابراین بسیار جالب است که یک تکه از اطلاعات بسته به آنکه چگونه به آن نگاه می‌کنید، می‌تواند بزرگ یا کوچک باشد. برای مثال پروفایل‌های فیسبوک را در نظر بگیرید. در نگاه اول تنها اطلاعات کوچکی دارد که تقریبا به سادگی می‌توان دریافت پشت این تصویر چیست: چهره را می‌بینیم، جنسیت را تشخیص می‌دهیم و اطلاعاتی از این دست را کسب می‌کنیم. حال اگر همین تصویر را در چارچوب کلان داده‌ها مورد بررسی قرار دهیم، گویی با یک دوربین عکاسی بسیار با کیفیت بالا به آن نگاه می‌کنیم، اطلاعات زیادی وجود دارد که می‌توان با زوم کردن بر آن از عکس استخراج کرد: تمام لکه‌های روی پوست و بسیاری چیزهای دیگر را که انسان‌ها قادر به تحلیل آن نیستند، مشاهده کرد. رایانه‌ها این کار را به راحتی انجام می‌دهند.

روش «اقیانوسی»یا همان ۵ بزرگ، یک چارچوب شخصیتی مناسب ارائه می‌کند. شخصیت اساسا از نظر روانشناسی به دنبال توصیف عوامل پیچیده‌ای است که افراد رفتار می‌کنند و با یکدیگر تفاوت دارند، اما این تفاوت‌ها تصادفی نیستند. برای مثال افرادی که دوستانه برخورد می‌کنند، رفتارهایی مانند دوست داشتن دیگران، پر حرف بودن، خونگرم بودن و برون‌گرایی را از خود نشان می‌دهند. برعکس افراد درون‌گرا بیشتر فکر می‌کنند، کمتر حرف می‌زنند، از تنها بودن و کتاب خواندن لذت می‌برند و رفتاری این چنینی دارند. در گذشته ما شخصیت را با استفاده از پرسش نامه، سنجش می‌کردیم که برخی فاقد شواهد کافی بودند، در کنار آن سایر خصیصه‌ها را نیز اندازه‌گیری می‌کردیم مانند هوش و بسیاری چیزهای دیگر. روش اوشن تنها یک چارچوب شخصیتی ارائه می‌کند که محبوب است و تفاوت میان رفتارهای موجود بین افراد را توصیف می‌کند.

استفاده از پرسش‌نامه‌ها چند محدودیت دارد: نخست اینکه دروغ گفتن در آن بسیار ساده است، دوم اینکه افراد به دلیل برخی تورش‌ها و تعصباتی که در ناخودآگاه آنها وجود دارد، پاسخ نادرستی می‌دهند، برای مثال اگر آنان بپرسید که آیا آنان شخصیتی دوستانه دارند، معمولا پاسخ می‌دهند بله. با استفاده از روش اوشن می‌توان بر این موارد غلبه کرد. به نرم‌افزارهایی فکر کنید که در مورد یافتن و انتخاب شغل و انتخاب همسر از این روش استفاده می‌کنند. افراد صادق نیستند بنابراین این نرم‌افزار به نوعی به این کار کمک می‌کند زیرا تقلب کردن در یک آزمون شخصیت برای کسب شغل آسان است. با این حال بسیاری از کمبودها در این راه وجود دارند که گران بودن و نیاز زیاد به زمان و اتلاف آن از این جمله است. من و همکارانم چند سال پیش دریافتیم که ما به جای این کار تنها می‌توانیم به ردپاهای دیجیتال افراد نگاه کنیم و به جای اینکه از آنان بپرسیم آیا کتاب خواندن را دوست دارید (که همان تعصب انسانی را در پاسخ دادن موجب می‌شود) به ردپاهای دیجیتال آنها در زمینه خرید، نظر دادن و خواندن کتاب‌ها توجه کنیم.

برای این کار البته از افراد اجازه گرفته شده بود. با این روش می‌توان میزان هوش، سلایق جنسی، گرایش سیاسی و سایر موارد را شناسایی کرد. وقتی ما استنباط‌هایی از این طریق راجع به افراد به دست می‌آوریم، ما سیگنال‌های کافی نیاز داریم. برای مثال اگر به شما بگویم من از اوباما خوشم می‌آید، شما می‌توانید بفهمید که من جمهوری‌خواه یا دموکرات هستم، اگر به شما بگویم من از فلان نوع موتور خوشم می‌آید، شما نمی‌توانید چنین برداشتی داشته باشید زیرا در جهان کلان داده همه چیز به هم مربوط است. این داده تورش کمی دارد و مردم کمتر از آن پیامی سیاسی دریافت می‌کنند. با این حال وجود اطلاعات کلان در مورد هر فرد، می‌تواند هر تکه از اطلاعات کوچک را جمع‌آوری کرده و ناگهان یک مدل دقیق از اطلاعات شما ارائه کند. من فکر می‌کنم کلان داده‌ها مانند نوعی محیط غرب وحشی دیجیتال خواهد بود. اشتباهاتی اتفاق خواهند افتاد اما راه حل این نیست که از فیسبوک، گوگل و سایر محیط‌ها فرار کنیم. البته نوعی تعصب در رسانه‌ها نسبت به گزارش‌های منفی در این خصوص وجود دارد. کلان داده‌ها در کنار مشکلاتی که دارند، اما مزایای خوبی نیز همچون استفاده از امکاناتی که گوگل در اختیار ما قرار داده است، مانند نقشه‌ها و جست‌وجو گرفته تا عدم وجود اسپم‌های ایمیل، عدم هک با وجود اینکه بسیاری تمایل دارند صاحبان حساب‌های بانکی را هک کنند و برخی موارد دیگر در حال حاضر وجود دارند که باید افراد را به فکر کردن در مورد پیشرفت هر روز کلان داده‌ها وادارد.