پیشرفت در جمع آوری و ذخیره داده در طول دهه های گذشته موجب انفجار داده در بیشتر موارد شده است. محققان در بسیاری از حیطه ها مانند مهندسی، ستاره شناسی، اقتصاد و تعاملات مصرف کننده، با مشاهدات و شبیه سازی بزرگ و بزرگتری روبه رو شده اند. چنین مجموعه داده ها در مقابل با مجموعه داده های کوچکتری که در گذشته مطالعه می شدند، چالش های جدیدتر در تحلیل داده ها به وجود آورده اند. به دلیل افزایش تعداد مشاهدات و از آن مهمتر به دلیل افزایش تعداد متغیرهای مربوط به هر ...