انجام پایان نامه

درخواست همکاری انجام پایان نامه  بانک مقالات رایگان انجام پایان نامه

سفارش پایان نامه

|

انجام پایان نامه ارشد

انجام پایان نامه داده کاوی

انجام پایان نامه |داده کاوی

32 صفحه

جهان پيرامون ما سرشار از داده ها و اطلاعات گوناگون مي‌باشد. براي پيش بيني گرايشات و جريان هاي آتي و به منظور اتخاذ تصميم گيري بهتر در زمينه علوم، تكنولوژي ، صنعت، بازار وغيره.
انسان همواره با اشتياقي حريصانه به دنبال كشف دانش از اين موداب داده ها بوده است. قديمي ترين دست نوشت ها كشف شده بر روي لوح هاي گلي مربوط به چهار قرن قبل از ميلاد مسيح مي‌باشد. با ساخت كاغذ داده هاي فراواني بر روي هزاران جلد كتاب وساير مستندات ديگر وغيره شد.
توامروزه نيز با افزايش روز افزون كاربرد كامپيوتر ها حجم عظيمي از داده ها ديسك هاي سخت را به صورت اطلاعات ديجيتالي پر كرده اند. با دراختيار داشتن حجم عظيم داده ها مساله اصلي چگونگي يا فتن جمع‌آوري و به كارگيري روش هايي است كه بتوان آنها را در كشف دانش از داده ها  و به كارگيري دانش كشف شده در موارد مختلف به كار گرفت.
اگر چه در دهه هاي اخير زمينه جديد با عنوان داده كاوي به رواج يافته است ولي عملكردها و وظايف اين علم مثل دسته بندي و جداسازي، از سالها پيش وجودداشته و به كار گرفته مي شده اند. با توجه به اينكه هدف داده كاوي كشف الگوهاي ناشناخته از داده ها مي‌باشد روش هاي اين علم از آموزش ماشين،هوش مصنوعي، آمار وغيره مشتق شده اند. با گسترش اين علم روش هاي داده كاوي در زمينه هايي خارج از علوم كامپيوتر وهوش مصنوعي همچون دنياي تجارت وخطوط مونتا كارخانه ها نيز به كار گرفته شد.
بدين ترتيب قابليت هاي داده كاوي در زمينه هايي چون افزايش رقابت در بازار تجاري تشخيص كلاه برداري، تشخيص بيماريها با توجه به مدارك پزشكي وغيره نيز مورد آزمايش قرار گرفت و به اثبات رسيد.
معمولا در يك سيستم داده كاوي قابليت هايي به منظور جمع آوري ذخيره سازي دسترسي پردازش و نهايتا توصيف ونمايش مجموعه هاي داده اي در نظر گرفته شود. جنبه هاي مختلف داده كاوي را ميتوان به صورت مجزا مورد بررسي قراردارد. اگر چه جمع آوري وذخيره سازي اطلاعات در داده كاوي فوقالعاده با اهميت مي باشند ولي گاها اين دو مورد را جز وظايف داده كاوي به شمار نمي آورد. در اين ميان افزونگي وگاها نامربوط بودن اطلاعات موجود در مجموعه هاي داده ها كاوي فوق العاده با اهميت مي باشند ولي گاها اين دو مورد جزء وظايف داده كاوي به شمار نمي آورد. در اين ميان افزودگي وگاها نامربوط بودن اطلاعات موجود در مجموعه هاي داده ها وهمچنين قالب هاي ناسازگار مجموعه هاي داده اي جمع آوري شده را ميتوان از جمله عواملي برشمرد كه روند داده كاوي را با مشكل مواجه مي كنند وحتي ممكن است باعث به وجود‌آمدن مسيرهاي جستجوي گمراه كننده يا پايين آوردن كيفيت نتايج داده كاوي شوند. اين مسائل وقتي بروز مي دهند كه افرادي كه وظايف جمع آوري وپردازش كاويدن اطلاعات را بر عهده دارنددر يك گروه وكنار هم كارنكننده كه در بسياري از موارد راههاي جمع آوري شده از ابتدا به منظور داده كاوي فراهم نشده اند.
داده كاوي اصول وروش كار:
عمليات داده كاوي را به صورت هاي مختلفي مي توان دسته بندي كرد.در اين متن ما به بررسي روش كار و روندعمليات در داده كاوي مي پردازيم ودسته بندي اين عمليات را به صورت پيش پردازش داده ها مدل سازي داده كاوي وتوصيف دانش مورد مطالعه قرار ميدهيم شكل 1 عمليات پيش پردازش داده ها را ميتوان شامل حذف نوفد انتخاب مشخصه ها، افراز داده ها، تبديل داده ها، الحاق داده ها، پردازش داده هاي مفقود كاهش اندازه داده وغيره در نظر گرفت. در ادامه به بررسي بخش هاي مختلف يك سيستم داده كاوي مي پردازيم.
كاهش اندازه داده ها:
كاهش اندازه داده ها ميتواند باعث كاهش فضاي جستجوي مفروض كاهش در جمع آوري داده ها  هزينه هاي ذخيره سازي شود. همچنين ميتواند نتايجي را چون افزايش كارايي داده كاوي وساده سازي نتايج آن را به دنبال داشته باشد.
يكي از روشهاي كاهش اندازه داده ها استخراج مشخصه مي‌باشد كه در اين روش مشخصه هاي جديد از مشخصه هاي اصلي موجود استخراج شده تا با به كاري گيري اين مشخصه هاي جديد توان وكارايي محاسباتي وهمچنين دقت دسته بندي را افزايش داد.روش هاي استخراج مشخصه ها معمولا با تبديل هاي غيرخطي سروكار دارند. از اين ميان ميتوان به روش هايي چون شبكه هاي عصبي تا كردن تبديل مختصات پيمانه اي و انتشار غير خطي اشاره كرد. روش هاي مبتني بر تبديل هيا غيرخطي در ترتيب خوب عمل مي كنند و همچنين در مواجهه با مسائل غيرخطي عملياتي قدرتمند هستند اين روش ها ممكن است عوارضي جانبي غيرقابل پيش بيني وناخواسته اي در داده ها به وجود آورند. همچنين اين روش ها معمولا برگشت ناپذير بوده و دانش آموخته شده به وسيله اعمال يكي از روش هاي مبتني بر تبديل هاي غيرخطي در يك فضاي مشخصه قابل تبديل به فضاي مشخصه ديگر نمي باشد. از ديگر روش هاي معمول براي استخراج مشخصه ها ميتوان به تحليل تكنيكي خطي وتحليل مولفه هاي اصلي اشاره كرد.در استخراج مشخصه ها معاني مشخصه هاي جديد به سختي قابل تفسير مي باشند.
يكي ديگر از روشهاي كاهش اندازه داده ها انتخاب مشخصه ها مي‌باشد. در اين روش زير مجموعه اي از مشخصه هاي اصلي را به عنوان مشخصه هاي جديد انتخاب مي كنيم كه در سيستم هاي استقرايي مثل سيستم دسته بندي به خوبي عمل مي‌كند معمولا جستجوبراي زير مجموعه اي بهينه از مشخصه ها مشكل مي‌باشد وحتي براي بسياري از مسائل انتخاب مشخصه ها ثابت شده است. كه Np-hard هستند روش هاي انتخاب مشخصه ها به طور وسيعي مورد مطالعه قرار گرفته اند زيرا مشخصه هاي انتخاب شده از مشخصه هاي اصي در مقايسه با مشخصه هاي جديدي كه از مجموعه مشخصه هاي اصلي استخراج شده اند به سادگي قابل تفسير مي باشند در موارد بسياري چون دسته بندي مستندات داده كاري، بازشناسي اجسام وپردازش تصوير براي پيش پردازش داده ها از روش هاي انتخاب مشخصه ها كمك گرفته مي شود.
انجام پایان نامه کامپیوتر

برای دریافت فایل کامل مقاله از لینک زیر استفاده نمایید

دانلود

سفارش پایان نامه