دانلود پاورپوینت داده کاوی الگوهای تکرارشونده در جريان دادهها
نوع فایل: power point
فرمت فایل: pptx
قابل ویرایش
تعداد اسلاید : 40 صفحه
قسمتی از پاورپوینت :
بسياری از برنامه های کاربردی نوع داده جديدی به نام جريان داده را توليد و تحليل می کنند که در آن داده ها به صورت پويا به يک بستر ( يا پنجره ) وارد و يا از آن خارج می شوند .
خواص جريان داده :
حجم زياد و گاه نامحدود
تغييرپويا
جريان به درون و خارج با يک ترتيب مشخص
پيمايش يکبار يا تعدا د محدود
نيازمند زمان پاسخ سريع ( اغلب بلادرنگ )
ممکن است دارای چندين منبع باشند .
در جريان داده تعدادی يا همه داده های ورودی که بايد روی آنها عمليات انجام شود روی ديسک يا حافظه اصلی قرار ندارند و بيشتر به صورت جريان داده پيوسته می رسند .
جريان داده ها از داده های ذخيره شده در موارد زير متفاوت اند :
عناصر داده ها به صورت بر خط می رسند .
سيستم هيچ گونه کنترلی روی ترتيب عناصر دادهای ( روی عناصر جريان يا جريانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .
جريانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .
يک عنصر از جريان داده پس از پردازش يا ناديده در نظر گرفته می شود يا آرشيو می شود .دادهکاوی استخراج اطلاعات مفيد و دانش از حجم زياد داده ها است .
تکنيک هايی دادهکاوی :
تحليل قواعد وابستگی : کشف قواعد وابستگی است که هر قاعده وابستگی به صورت جفت صفت- مقدار هايی است که اغلب با هم در يک مجموعه داده اتفاق می افتند .
کلاسهبندی : فرايند يافتن مجموعه مدلهايی است که کلاس های داده را توصيف و مشخص میکنند تا بدين وسيله بتوان کلاس اشيايی را که نامشخص است مشخص کرد .
تحليل خوشه ها : اشيا بر اساس قاعده " زياد کردن شباهت بين عناصر کلاس و کم کردن شباهت بين کلاس ها " ، اشيا را به خوشه هايی تقسيم می کند . اشيا داده ای موجود در يک خوشه بيشترين شباهت را با هم دارند و با اشيا ساير خوشه ها بسيار متفاوت هستند .
نوع فایل: power point
فرمت فایل: pptx
قابل ویرایش
تعداد اسلاید : 40 صفحه
قسمتی از پاورپوینت :
بسياری از برنامه های کاربردی نوع داده جديدی به نام جريان داده را توليد و تحليل می کنند که در آن داده ها به صورت پويا به يک بستر ( يا پنجره ) وارد و يا از آن خارج می شوند .
خواص جريان داده :
حجم زياد و گاه نامحدود
تغييرپويا
جريان به درون و خارج با يک ترتيب مشخص
پيمايش يکبار يا تعدا د محدود
نيازمند زمان پاسخ سريع ( اغلب بلادرنگ )
ممکن است دارای چندين منبع باشند .
در جريان داده تعدادی يا همه داده های ورودی که بايد روی آنها عمليات انجام شود روی ديسک يا حافظه اصلی قرار ندارند و بيشتر به صورت جريان داده پيوسته می رسند .
جريان داده ها از داده های ذخيره شده در موارد زير متفاوت اند :
عناصر داده ها به صورت بر خط می رسند .
سيستم هيچ گونه کنترلی روی ترتيب عناصر دادهای ( روی عناصر جريان يا جريانهای دادهای ) ، که جهت پردازش میرسند ، ندارد .
جريانهای داده ای به صورت ذاتی از نظر اندازه نامحدود هستند .
يک عنصر از جريان داده پس از پردازش يا ناديده در نظر گرفته می شود يا آرشيو می شود .دادهکاوی استخراج اطلاعات مفيد و دانش از حجم زياد داده ها است .
تکنيک هايی دادهکاوی :
تحليل قواعد وابستگی : کشف قواعد وابستگی است که هر قاعده وابستگی به صورت جفت صفت- مقدار هايی است که اغلب با هم در يک مجموعه داده اتفاق می افتند .
کلاسهبندی : فرايند يافتن مجموعه مدلهايی است که کلاس های داده را توصيف و مشخص میکنند تا بدين وسيله بتوان کلاس اشيايی را که نامشخص است مشخص کرد .
تحليل خوشه ها : اشيا بر اساس قاعده " زياد کردن شباهت بين عناصر کلاس و کم کردن شباهت بين کلاس ها " ، اشيا را به خوشه هايی تقسيم می کند . اشيا داده ای موجود در يک خوشه بيشترين شباهت را با هم دارند و با اشيا ساير خوشه ها بسيار متفاوت هستند .