مترجم: فریبا ولیزاده

پردازش‎های موردنیاز برای آماده‎سازی داده‎های بدون ساختار برای تجزیه و تحلیل می‎تواند فرآیندی دست‎وپا گیر و نیز مستعد خطا باشد، به همین دلیل سازمان‎ها باید برای سازماندهی اطلاعات خود حتی پیش از اقدام به جمع‎آوری آنها اقداماتی را مدنظر داشته باشند.داده‎های فاقد ساختار به اطلاعاتی اطلاق می‎شود که به صورت از پیش تعریف شده سازمان یافته نیستند و امروزه به صورت گسترده در دسترس هستند اما به‌منظور استفاده از این اطلاعات در فرآیندهای تجزیه و تحلیل سازمانی که به معنی پردازش‎های خاص است، باید آنها را تحت ساختار مشخصی سازمان‎دهی کرد. این پردازش می‎تواند مشکل‎ساز باشد.

فرآیندهای تجزیه و تحلیل امروزی نیز در حال‌حاضر اطلاعات فاقد ساختار را به کمک کیمیاگری مدرن به ارزشی برای کسب‎وکار تبدیل می‎کنند. سیستم‌های امروزی هرجا که باشند هر داده قابل تصوری را مورد استفاده و پایش قرار می‎دهند. فناوری‎هایی نظیر Hadoop وNoSQL این گنجینه‎های اطلاعاتی را به‌راحتی در همان شکل بدون ساختارشان ذخیره می‎کنند. پردازشگر‎های زبان طبیعی، استخراج ویژگی و تشخیص گفتار اکنون به صورت روزمره مقادیر عظیمی از متون بدون ساختار، تصاویر، اطلاعات صوتی و تصویری مختلف را برای تجزیه و تحلیل آماده می‎کنند. این فرآیندها بسیار شگفت‎آور بوده و با هدف ایجاد نظم در دل بی‌نظمی‎ها انجام می‎شوند.متاسفانه درحالیکه مراحل مختلف این پردازش‎ها قابل‌توجه هستند، نمی‎توان آنها را عاری از خطا هم تصور کرد. به جرات می‌توان گفت بهترین جایگزین برای چنین مواردی اجتناب از نیاز به پردازش‎های جامع و عظیم است. ما همه به خوبی می‎دانیم که چگونه هر مرحله از پردازش، اطلاعات را دچار خدشه می‎کند. با انجام اشتباهات حتی کوچک تحریف اطلاعاتی گسترش پیدا کرده و عدم اطمینان به سرعت در لایه‌های مختلف گسترش پیدا می‌کند.

سازمان‎ها درگیر بازی گسترده‎‎ اطلاعاتی هستند و داده‎های فاقد ساختار این بازی را بسیار پیچیده و دشوارتر می‎کند. در شرایطی که فعالیت‎های مصرف کننده ۵۰ الی ۸۰ درصد از داده‌های کمیاب را مصرف می‌کند، هر مرحله از فرآیند پردازش مستلزم دقت، تلاش و زمان بیشتری از سوی سازمان است و این در حالی است که معدودی از سازمان‎ها این سه مولفه را در اختیار دارند.هر مرحله از فرآیند پردازش می‎تواند هزینه توسعه و نگهداری بالایی برای سازمان دربر داشته باشد اما گسترش اهمیت به اشتراک‎گذاری اطلاعات میان سازمان‎ها یکی از مهم‎ترین دغدغه‎های عصر حاضر به‌شمار می‎رود. در گزارشی که اخیرا توسط MIT منتشر شده است، موضوع ارزش کسب‎وکار و اهمیت به اشتراک‌گذاری اطلاعات میان سازمان‎ها در قالب اینترنت اشیا مورد بررسی قرار گرفته است. مطالعات دیگر حاکی از نتایج مشابه در زمینه‌های گسترده‎تر تجزیه و تحلیل‎های اطلاعاتی است. در واقع با هر بار انتقال داده، فرآیندهای توسعه و نگهداری بیشتری موردنیاز خواهد بود.حذف واسطه‎ها از جمله راهکارهایی است که با حذف مراحل میانی مراحلی را پشت‌سر می‌گذارد که شاید در دوره‌ای ارزش افزوده‌ای دربر داشته است اما هم‌اکنون ارزشی ایجاد نمی‎کنند. سازمان‌ها می‌توانند به دو روش واسط‎ فرآیندهای اطلاعاتی خود را حذف کنند.

• ساختار یافته‌تر کردن اطلاعات از طریق یک رابط نرم‌افزاری رسمی: با ارائه اطلاعاتی که فرمت‎های ساده‌ای دارند، سازمان می‌تواند در میزان تلاش‌هایی که صرف پیاده‌سازی این فرآیند می‌کند، صرفه‌جویی کند.

• ساختاربخشی به اطلاعات در مبدا: با رشد فناوری‎های ذخیره داده‎های فاقد ساختار‌‎، ذخیره این دست از اطلاعات بسیار آسانتر شده است. طراحی فرآیندهایی که از این فناوری‎ها به‌منظور ذخیره اطلاعات بدون ساختار استفاده می‎کنند با ایده امکان سازماندهی در آینده بسیار وسوسه انگیز است اما هرچه داده بیشتری از مبدا جمع‌آوری شود، امکان سازمان‎دهی مطلوب کاهش پیدا خواهد کرد.

جان هورتون در تجربه کاری خود در oDesk متوجه این موضوع شد که سیستم‎هایی که اصولا به افراد اجازه به اشتراک‌گذاری اطلاعات می‎دهند از ورودی‎های فاقد ساختار بهره می‎برند، در نتیجه کاربران این سیستم‌ها بیش از صدهزار ورودی لغوی مجزا با اشتباهات متعدد ایجاد کردند (مثلMS Powerpoint Microsoft Power Point). هرچند حدود ۱۴ درصد از ورودی‎های سیستم بیش از یکبار استفاده شده بودند اما بسیاری از موارد تکراری بودند و در واقع منظور یک ورودی واحد بوده است. بدتر اینکه هر سازمان یا سیستمی که از این اطلاعات استفاده می‌کرد مجبور به ایجاد فرآیندهایی بود تا منظور کاربر را تفسیر کند. به این ترتیب oDesk با طراحی مجدد نحوه ورود اطلاعات به سیستم خود لیستی سازمان‎دهی شده فراهم کرد که به طرز شگفت‎آوری فرآیندهای داخلی شرکت برای تحلیل اطلاعات و فرآیندهای مورد نیاز سازمان‎ها در استفاده از سیستم oDesk را به مراتب بهبود بخشیده است. به‌طور قطع، مهارت‎های جمعی ما در سازمان‌دهی اطلاعات فاقد ساختار در هر مرحله از فرآیند تحلیل موثر بوده و بهبودهایی را در پی داشته است. اما این کیمیاگری مدرن کاری دشوار است و مستلزم صرف تلاش، هزینه و زمان بسیار است.

منبع: sloanreview.mit