مقاله پایان نامه تحقیقاتی با موضوع داده کاوی یا data mining در قالب فایل ورد قابل ویرایش 33 صفحه ای برای دانشجویان کامپیوتر و علاقه مندان جمع آوری شده است. در ادامه بخش هایی از این مقاله را به همراه فهرست مطالب آن مشاهده خواهید کرد.
مقدمه
از سال 1950 به بعد که رایانه، در تحلیل و ذخیره سازی داده ها به کار رفت، حجم اطلاعات ذخیره شده درآن پس از حدود 20 سال دو برابر شد و همزمان با پیشرفت فناوری اطلاعات، حجم داده ها در پایگاه داده ها هر دو سال یک بار، دو برابر شد و همچنان باسرعت بیش تری نسبت به گذشته حجم اطلاعات ذخیره شده بیش تروبیش تر می شود.
با وجود شبکه جهانی وب، سیستم های یکپارچه اطلاعاتی، سیستم های یکپارچه بانکی، تجارت الکترونیکی و... لحظه به لحظه به حجم داده ها در پایگاه داده ها اضافه شده و باعث به وجود آمدن انبارهای ( توده های ) عظیمی از داده ها شده است، به طوری که ضرورت کشف و استخراج سریع و دقیق دانش از این پایگاه داده ها را بیش از پیش نمایان کرده است.
شدت رقابت ها در عرصه های علمی، اجتماعی، اقتصادی، سیاسی و نظامی نیز اهمیت سرعت یا زمان دسترسی به اطلاعات را دو چندان کرده است. بنا براین نیاز به طراحی سیستم هایی که قادر به اکتشاف سریع اطلاعات مورد علاقه کاربران با تاکید بر حداقل مداخله انسانی باشند از یک سو و روی آوردن به روش های تحلیل متناسب با حجم داده های حجیم ازسوی دیگر، به خوبی احساس می شود. در حال حاضر، داده کاوی مهم ترین فناوری برای بهره وری موثر، صحیح و سریع ازداده های حجیم است و اهمیت آن رو به فزونی است.
تاریخچه
با توجه به وجود اطلاعات ارزشمند در پایگاه های داده ای در اواخر دهه 80 میلادی، تلاش برای استخراج و استفاده از اطلاعات پایگاه های داده ای شروع شد. داده کاوی فرایندی است که در آغاز دهه 90 پا به عرصه ظهور گذاشته و با نگرشی نو، به مسئله استخراج اطلاعات از پایگاه داده ها می پردازد.
در سال 1989 و 1991 کارگاه های کشف دانش از پایگاه داده ها توسط پیاتتسکی و همکارانش و در فاصله سال های 1991 تا 1994 کارگاه های فوق، توسط فایاد و پیا تتسکی و دیگران برگزار شد. به طور رسمی اصطلاح داده کاوی برای اولین بار توسط « فیاض » در اولیـن کنفرانس بین المللی « کشف دانش و داده کاوی » در سال 1995 مطرح شد. از سال 1995 داده کاوی به صورت جدی وارد مباحث آمار شد.و در سال 1996، اولین شماره مجله کشف دانش از پایگاه داده ها منتشر شد.
موضوع داده کاوی چیست
موضوع داده کاوی شناخت چیزهای جدید و با ارزش، بالقوه مفید، رابطه های منطقی و الگوهای موجود در داده ها است در جوامع مختلف یافتن الگو های مفید در داده ها با عناوین متعددی ( مانند داده کاوی ) بیان می شود. برای مثال از عنوان هایی نظیر استخراج دانش، کشف اطلاعات، برداشت اطلاعات، پردازش الگوهای داده ها می توان نام برد.
عبارت «داده کاوی» توسط آمار شناسان، محققان پایگاه های داده ها و سیستم های اطلاعات مدیریتی و جوامع بازرگانی به کار برده می شود. عبارت کشف دانش در پایگاه داده ها عموما برای اشاره به فرایند کلی کشف دانش مفید از داده هایی که داده کاوی گام مهمی دراین فرایند است، مورد استفاده قرار می گیرد گام های دیگری در فرایند کشف دانش در پایگاه داده ها نظیر آماده کردن داده ها، انتخاب داده ها، تمیز کردن داده ها و درک درست از فرایند داده کاوی مــــوجب می شود تا اطلاعاتی که برای ما مفید هستند از داده ها استخراج شوند. داده کاوی از تحلیل های سنتی داده ها و رویکردهای آماری نشات گرفته است به طوری که شامل فنون تحلیلی ای است که از شاخه های دیگری تشکیل شده است.
چند مثال در مورد مفهوم داده کاوی
یکی از نمونه های بارز داده کاوی را می توان در فروشگاه های زنجیره ای مشاهده نمود، که در آن سعی می شود ارتباط محصولات مختلف هنگام خرید مشتریان مشخص گردد. فروشگاه های زنجیره ای مشتاقند بدانند که چه محصولاتی با یکدیگر به فروش می روند.
برای مثال طی یک عملـیات داده کاوی گستـرده در یـک فروشـگاه زنجیره ای در آمریکای شمالی که بر روی حجـم عظیمـی از داده های فروش صورت گرفت، مشخص گردید که مردانی که برای خرید قنداق بچه به فروشگاه می روند معمولا آب جو نیز خریداری می کنند. همچنین مشخص گردید مشتریانی که تلویزیون خریداری می کنند، غالبا گلدان کریستالی نیز می خرند.
فهرست مطالب مقاله
-
مقدمه
-
تاریخچه
-
موضوع داده کاوی چیست؟
-
تحلیل های عددی
-
تعاریف داده کاوی
-
چند مثال در مورد مفهوم داده کاوی
-
تفاوت داده کاوی و آنالیز های آماری
-
آنالیز آماری
-
داده کاوی
-
روش آنالیز آماری
-
روش داده کاوی
-
کاربردهای داده کاوی
-
فواید و نقش داده کاوی در فعالیت شرکتها
-
مراحل داده کاوی
-
مرحله اول Business Understanding
-
مرحله دوم Data Understanding
-
جمع آوری داده ها
-
انبار داده Data Warehouse (DWH)
-
معماری DWH
-
بحث شرح و توصیف داده ها
-
مرحله سوم Data Preparation
-
Data selecting انتخاب داده
-
مرحله چهارم Modelling
-
مرحله پنجم Evaluation
-
مرحله ششم Deployment
-
مفاهیم اساسی در داده کاوی
-
پیشرفت در تکنولوژیهای داده پردازی
-
دیتامارت
-
انبار داده ها
-
عناصر داده کاوی
-
فنون داده کاوی
-
گام نهایی فرایند داده کاوی، گزارش دادن است
-
نرم افزار
-
کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی
-
مدیریت و خدمات کتابخانه
-
مدیریت موسسات دانشگاهی
-
محدودیت ها
-
کلام آخر
-
منابع