up
Search      menu
مدیریت و اقتصاد :: مقاله داده کاوي PDF
QR code - داده کاوي

داده کاوي

داده کاوي چيست؟

تغيير روند توجه سازمان ها از منابع مالي به سرمايه هاي انساني، فراهم آمدن زمينه هاي تراکم و حتي انفجار اطلاعات از طريق فن آوري اطلاعات و ارتباطات در سازمان ها، الزام و اهميت مديريت دانش را بيش از گذشته به رخ کشيده است. استخراج اطلاعات مناسب از ميان انبوه داده ها و تبديل آنها به دانش مورد نياز سازمان، به ويژه در تصميم گيري هاي سازماني و ديدن آينده درست نيازمند استفاده از روش هاي نوين در اين حوزه است. داده کاوي يکي از اين ابزار و رويکردهاست که در فضاي مديريت دانش سازمان ها به کشف دانش از پايگاه داده ها کمک مي کند.
● مديريت دانش
امروزه در عصر يادگيري، کارکنان از ارزشمندترين منابع سازمان به شمارمي آورند. کارکنان، حجم عظيم داده ها، اطلاعات و دانش سازمان را توليد کرده و به کار مي بندند. از اين رو در سازمان هاي نوين، همکاري مديريت دانش و مديريت منابع انساني، به امري ضروري تبديل شده است. مديريت دانش، رويکردي سيستمي و يکپارچه است که تمامي دارايي هاي اطلاعاتي سازمان، اعم از: مستندات، پايگاه داده ها، خطي مشي ها، رويه ها و تجربيات کارکنان و سازمان را در برمي گيرد و به اشتراک مي گذارد.
مديريت دانش، سکوي تسهيل کننده استخراج، ذخيره سازي، يکپارچه سازي، انتقال، مشاهده، تجزيه و تحليل و استفاده از دانش در سازمان است. مديريت دانش به منظور حفظ، تجزيه و تحليل، سازماندهي، بهبود و تسهيم تجارب کسب و کار، به عنوان ابزار، روش و راهبرد در سازمان به کارمي رود. در واقع، مديريت دانش متدولوژي استخراج سيستمي و استفاده از دانش در سازمان است که از طريق همين دانش و سرمايه فکري، ثروت و ارزش مي آفريند. در نگرش سيستمي به مديريت دانش، سه مولفه اصلي: منابع انساني، فرايندها و فن آوري دخالت و با يکديگر همپوشاني دارند.
● نسبت مديريت دانش و داده کاوي
براي به کارگيري مديريت دانش در سازمان، از ابزار متفاوتي استفاده مي شود که يکي از مهم ترين آنها، داده کاوي است. هنگامي که طراحي مجدد فرآيندهاي کسب و کار (BRP) مورد نظر است، داده کاوي به عنوان تکنيک، در خدمت مديريت دانش قرار مي گيرد. در هر بنگاه صنعتي، اقتصادي و تجاري نيز دانش با ارزش در مورد مشتري، محصول و بازار را مي توان از طريق داده کاوي به دست آورد. با بزرگ تر شدن حجم داده ها و اطلاعات سازمان ها، اهميت اين مسئله روزبه روز بيشتر مي شود. هنگامي که حجم داده ها زياد است، براي مديريت آنها از سيستم هاي پايگاه داده ها
(DBS DBMS) استفاده مي شود. در حالت زياد بودن حجم داده ها، داده کاوي براي استخراج و به دست آوردن دانش به کار مي آيد. هنگامي که حجم دانش زياد است، از سيستم مديريت دانش (KMS) استفاده مي شود.
داده کاوي
پيشينه طرح موضوع داده کاوي به دهه ۱۹۸۰ و به صورت جدي، به دهه ۱۹۹۰ برمي گردد. پيش از آن از سيستم هاي جمع آوري و مديريت داده ها و اصطلاحا لايروبي داده ها استفاده مي شد، اما به مرور زمان، استخراج و کشف سريع و دقيق اطلاعات با ارزش و پنهان از پايگاه داده ها، به عنوان داده کاوي مورد توجه قرار گرفت. به اين شکل بود که فرايند داده کاوي به عنوان فرايند آماري و تجزيه و تحليل در فرايند کشف دانش در پايگاه داده ها (KDD) پررنگ شد، به حدي که گاه، داده کاوي (DM) به عنوان مترادف کشف دانش در پايگاه داده ها (KDD) مورد استفاده قرار مي گرفت. امروزه فرآيند استخراج اطلاعات معتبر، از پيش ناشناخته، قابل فهم و قابل اعتماد از پايگاه داده هاي بزرگ و استفاده از آن در تصميم گيري و در فعاليت هاي تجاري «داده کاوي » ناميده مي شود. در تعاريف متعدد و متنوع براي داده کاوي بر موضوعاتي نظير: استخراج دانش کلان، کاوش در داده ها، تجزيه و تحليل داده ها و يافتن روابط و الگوهاي مطمئن بين داده ها تاکيد مي شود. هدف نهايي داده کاوي، ايجاد سيستم هاي پشتيباني تصميم گيري سازماني است. داده کاوي، به استخراج اطلاعات مفيد و دانش ا ز حجم زياد داده ها مي پردازد. داده کاوي، الگوهاي حاوي اطلاعات را در داده هاي موجود جست وجو مي کند. اين الگوها و الگوريتم ها، مي توانند توصيفي باشند، يعني داده ها را توصيف کنند و يا جنبه پيش بيني داشته باشند، يعني متغيرها براي پيش بيني ارزش هاي ناشناخته ساير متغيرها به کار روند. داده کاوي توصيفي، به دنبال يافتن اگرها در فعاليت ها يا اقدامات گذشته است و داده کاوي پيش بينانه با نگاه به سابقه، رفتار آينده را پيش بيني مي کند.
داده کاوي چيست وچه نيست
موارد زير در حوزه داده کاوي قرار مي گيرند:
استخراج يا کاوش دانش از ميان حجم عظيم داده ها ، استخراج اطلاعات و مدل کردن الگوهاي پنهاني در ميان انبوه داده ها، استخراج اطلاعات غير منتظره، ناشناخته و بالقوه مفيد از داده ها، استخراج اطلاعات يا الگوهاي مفيد و جالب از داده ها در پايگاه داده هاي بزرگ.
موارد زير در محدوده داده کاوي قرار نمي گيرند:
انبارش داده ها ، پردازش قياسي داده ها ، سيستم هاي خبره (ES) ، فرايند تجزيه و تحليل مستقيم ، ابزار تجزيه و تحليل آماري ، مشاهده گري داده ها.
● حوزه هاي داده کاوي
داده کاوي در سه حوزه مستقل به کار مي رود و در آنها ريشه دوانده است:
۱) آمار کلاسيک و الگوهاي آماري
۲) هوش مصنوعي
۳) يادگيري خودکار و شبکه هاي عصبي
در داده کاوي، هوش مصنوعي، يادگيري خودکار، تئوري پايگاه داده ها و علم آمار در هم آميخته شده است. براي انجام داده کاوي از ابزار مختلف نظير: تفکيک کردن، دسته بندي، درخت تصميم گيري، تحليل قواعد وابستگي و تحليل خوشه ها و الگوريتم هاي عمومي استفاده مي شود.
● مراحل فرآيند
هدف داده کاوي، تجزيه و تحليل اکتشافي داده ها، کشف الگوها و قواعد و الگوريتم ها، مدل سازي پيش بينانه و جست وجوي انحرافات است. براي انجام اين هدف، فرآيند داده کاوي در جهت کشف دانش در مراحل مختلف انجام مي شود که عبارت است از:
۱) اولين گام در داده کاوي، شناسايي هدف و فهم حوزه کاربرد آن است و مشخص مي کند که چه کاري، در چه حوزه اي انجام خواهد شد.
۲) انتخاب داده ها يعني تعيين اهداف براي تجزيه و تحليل و کشف آن
۳) آماده سازي داده ها شامل تميز سازي داده ها
۴) اتخاذ بهترين روش داده کاوي براي دست يابي به اهداف
۵) اجراي داده کاوي يعني به کارگيري الگوريتم
۶) ارزيابي و اعتبارسنجي يافته ها
۷) استفاده از نتايج و تثبيت و تحکيم دانش کشف شده
۸) تصميم گيري براساس دانش کشف شده.
● موانع و چالش ها
با وجود مزاياي فراوان که داده کاوي براي مديريت دانش سازمان ها و دست يابي به دانش براي تصميم گيري سازماني دارد، اين حوزه با موانع و چالش هايي روبه روست که عبارتند از:
۱) فقدان داده براي پشتيباني تجزيه و تحليل
۲) قدرت محدود محاسبه براي به دست آوردن محاسبات رياضي مورد نياز الگوريتم هاي داده کاوي
۳) عدم مطلوبيت و جذابيت بيشتر الگوها
۴) خطر وجود داده هاي آلوده و کسب نتايج کاملا غلط
۵) تمرکز بيش از حد بر الگوريتم ها
۶) هزينه نسبتا گران سرمايه گذاري در همه حوزه ها
۷) عدم پوشش کامل همه حوزه ها
● کاربرد داده کاوي
امروزه داده کاوي در حوزه هاي بسيار متنوع و متفاوت استفاده مي شود:
▪ حوزه علم: شيمي، فيزيک، داروسازي، تجزيه و تحليل تصاوير پزشکي، تعيين نوع رفتار با بيماران و پيشگويي ميزان موفقيت هاي اعمال پزشکي، تعيين ميزان موفقيت روش هاي درماني در برخورد با بيماري هاي سخت، بيوشيمي، حسگرهاي کنترل در اقمار مصنوعي، بيوعلم شامل توصيف ژن ها و تقسيم بندي گروه پروتئين ها و توسعه داروها. خرده فروشي: تجزيه و تحليل سبد خريد بازار، تعيين الگوهاي خريد مشتريان.
▪ بانکداري: پيش بيني الگوهاي کلاهبرداري از طريق کارت هاي اعتباري، تعيين ميزان استفاده از کارت هاي اعتباري براساس گروه هاي اجتماعي فروش و بازاريابي: تجزيه و تحليل سهام و سرمايه، تعيين مشتريان وفادار، مديريت ريسک و پيش بيني فروش بيمه: تجزيه و تحليل دعاوي و پيشگويي ميزان جريمه بيمه نامه هاي جديد توسط مشتريان ديگر حوزه ها: ورزش و سرگرمي، فضانوردي و ديگر حوزه هاي علم.

فلش ديسک يکي از ويژگي هاي قابل توجه کامپيوتر ، قابليت ذخيره و بازيابي اطلاعات بر روي رسانه هاي ذخيره سازي متفاوت است . هارد ديسک ، فلاپي ديسک و ديسک ه ...

رويدادهاي طبيعي همواره در اطراف ما رخ مي دهند و تکرار اين رويدادها سبب مي شود از ديدن آنها چندان حيرت نکنيم و گاه بي تفاوت از کنار آنها بگذريم، ولي گا ...

پوست ، بزرگترين عضو بدن و محافظي انعطاف پذير است که رطوبت بدن را نگه مي دارد و از طريق سيستم پيچيده ايجاد سرما و گرما ، از بافت هاي ظريف بدن محافظت مي ...

هرکسي استعدادي دارد. شايد استعداد شما پاشيدن شير از دماغتان باشد...اما هرچه که باشد اين هم استعدادي است. و تقريباً از همه استعددها مي شود پول درآورد. ...

ستاره شناسان همواره اجرام تازه اي در آسمان ميابند.اکتشافات اغلب ثمره نوآوريها نوين يا بهبود هاي تازه در فن آوري است.مثلا تلسکوپ به جهشي در دانش ما از ...

زن و مرد هر کدام نسبت به ديگري حق و حقوقي دارد که طرف مقابل بايد آنها را رعايت کند.حقوقي که زنان بر عهده مردان دارند متفاوت است مثلا حقي که بر پرداخت ...

1- مقدمه: رمزنگاري از دير بازبه عنوان يك ضرورت براي حفاظت ازاطلاعات خصوصي در مقابل دسترسي - هاي غير مجاز درتجارت و سياست و مسايل نظامي وجود داشته است ...

مقدمه مديريت اطلاعات امروزه به مفهومي پيچيده تبديل شده است ، زيرا اطلاعات موجود حجمي ناباورانه به خود گرفته و روزبه روز بر اين حجم افزوده مي شود. همه ...

دانلود نسخه PDF - داده کاوي