توضیحات
عنوان: داده کاوی چیست
- هدف از داده کاوی
- تاریخچه
- اهمیت داده کاوی
- انواع داده
- تفاوت داده کاوی و تحلیل های آماری
- کاربرد داده کاوی در فرایند ها
- موارد استفاده
- کاربرد داده کاوی در بازار های مالی
- تجزیه و تحلیل داده
- داده کاوی چگونه کار می کند؟
- منابع داده
- تراکنشهای کسبوکار
- داده های علمی
- دادههای شخصی و پزشکی
- تصاویر و ویدئوهای نظارتی
- رقابتهای ورزشی
- رسانههای دیجیتال
- دنیای مجازی
- جهانهای مجازی
- گزارشها و اسناد متنی
- فرایند دادهکاوی
- پاکسازی داده
- یکپارچهسازی دادهها
- انتخاب داده
- تبدیل داده
- دادهکاوی
- ارائه دانش
- نرم افزارهای ذخیره سازی و استخراج داده
- گام های پردازش
- درک تجاری
- درک داده ها
- تهیه اطلاعات
- تبدیل داده ها
- مدل سازی
- ارزیابی
- گسترش
- پیش پردازش
- داده کاوی
- چالش های داده کاوی
- امنیت
- مدل های داده کاوی
- مدل سازی توصیفی
- مدل سازی پیش بینی
- مدل سازی نسخه ای
- مشکلات داده کاوی
- مسائل روش شناسی داده کاوی
- مسائل کارایی
- مسائل منابع داده
- انواع روش های داده کاوی
- Agent Mining
- Anomaly detection یا تشخیص ناهنجاری
- Association rule learning یا یادگیری قانون وابستگی
- Bayesian network یا شبکه بیزی
- Statistical classification یا طبقه بندی آماری
- Cluster analysis یا آنالیز خوشه ای
- Decision Tree یا درخت تصمیم گیری
- Ensemble learning یا آموزش یادگیری جمعی
- Factor analysis یا تحلیل عاملی
- Genetic algorithmیا الگوریتم ژنتیک
- Intention mining یا استخراج عمدی
- Learning classifier system یا سیستم طبقه بندی یادگیری
- Multilinear subspace learningیا یادگیری فضایی چند خطی
- Artificial neural network شبکه های عصبی مصنوعی
- Regression analysis یا تجزیه و تحلیل رگرسیون
- Sequential pattern mining یا استخراج الگوی متوالی
- Structured data analysis یا تجزیه تحلیل داده های ساختاری
- Support vector machine یا ماشین بردار پشتیبانی
- Text mining یا استخراج متن
- Time series یا سری زمانی
- یادگیری ماشین و هوش مصنوعی
- پردازش حافظه طولانی مدت
- نمایش یا تجسم
- ماهیت مساله دادهکاوی
- بهینه سازی با ابزارهای داده کاوی
- دامنه های استفاده
- Analytics یا تجزیه و تحلیل
- Behavior informatics
- Big Data یا کلان داده
- Bioinformatics
- Business intelligence یا هوش تجاری
- Data analysis
- Data warehouse یا پایگاه داده تحلیلی
- Decision support system یا سیستم پشتیبانی تصمیم گیری
- Domain driven data mining یا داده کاوی دامنه محور
- Drug discovery
- Exploratory data analysis یا تجزیه و تحلیل داده های اکتشافی
- Predictive analytics یا تجزیه و تحلیل پیش بینی
- Web mining یا وب کاوی
- مزایا و معایب دادهکاوی
- مزایا
- معایب
- اثرات مثبت
- اثرات منفی
- کاربردهای دادهکاوی
- کسبوکار
- پژوهشهای ژنوم
- بازیابی اطلاعات
- سیستمهای ارتباطی
- نرم افزار و برنامه های کاربردی استخراج داده
- Carrot
- Chemicalize
- ELKI
- GATE
- KNIME
- NLTK
- OpenNN
- R
- scikitlearn
- Torch
- Microsoft Analysis Services
- Oracle Data Mining
- Google Cloud Platform
- Amazon SageMaker
- نمونه هایی که از داده کاوی استفاده می کنند
- تشخیص اتوماتیک شماره پلاک در انگلستان
- آژانس امنیت ملی
- رابطه ساختار و فعالیت کمی
- داده کاوی در قالب های دیگر
- استخراج شبکه های اجتماعی
- Web scraping
- آینده داده کاوی و رایانش ابری
- خلاصه
- نتیجه گیری
داده کاوی فرایند یافتن ناهنجاری ها، الگوها و همبستگی ها در مجموعه داده های بزرگ برای پیش بینی نتایج است. با استفاده از طیف گسترده ای از تکنیک ها، می توان از این اطلاعات برای افزایش درآمد، کاهش هزینه ها، بهبود روابط با مشتری، کاهش خطرات و موارد دیگر استفاده کرد. این فرایند شامل روش هایی در تقاطع یادگیری ماشین، آمار و سیستم های پایگاه داده است. داده کاوی یک زیرشاخه بین رشته ای علوم کامپیوتر و آمار با هدف کلی استخراج اطلاعات (با روش های هوشمند) از یک مجموعه داده و تبدیل اطلاعات به یک ساختار قابل درک برای استفاده بیشتر است. فرایندهای داده کاوی برای ساخت مدل های یادگیری ماشین مورد استفاده قرار می گیرند که برنامه های کاربردی از جمله فناوری موتور جستجو و برنامه های توصیه وب سایت را تأمین می کنند. به زبان ساده تر، به مجموعهای از روش های قابل اعمال بر پایگاه داده های بزرگ و پیچیده به منظور کشف الگوهای پنهان و جالب توجه نهفته در میان دادهها، داده کاوی گفته می شود. روش های داده کاوی تقریبا همیشه به لحاظ محاسباتی پر هزینه هستند. علم میانرشتهای دادهکاوی، پیرامون ابزارها، متدولوژیها و تئوریهایی است که برای آشکارسازی الگوهای موجود در دادهها مورد استفاده قرار میگیرند و گامی اساسی در راستای کشف دانش محسوب میشود.
اما چرا امروزه داده کاوی رشد سریع تری را نسبت به دهه های گذشته تجربه می کند؟ پاسخ این سوال در زیر شامل موارد زیر است.
رشد انفجاری دادهها در گستره وسیعی از زمینه ها در صنعت و دانشگاه که توسط موارد زیر پشتیبانی میشود:
دستگاههای ذخیرهسازی نسبت به گذشته ارزانتر و با ظرفیت نامحدود، مانند فضاهای ذخیرهسازی ابری
ارتباطات سریعتر با سرعت اتصال بیشتر
سیستمهای مدیریت پایگاه داده و پشتیبانی نرمافزاری بهتر
۲. قدرت پردازش کامپیوتری به سرعت در حال افزایش
با چنین حجم بالا و متنوعی از دادههای موجود، روش های دادهکاوی به استخراج اطلاعات از دادهها کمک میکنند. انجام تحقیق
روشهای دادهکاوی دارای انواع گوناگونی هستند و از رگرسیون گرفته تا روشهای تشخیص الگوی پیچیده و دارای هزینه محاسباتی بالا که ریشه در علوم کامپیوتر دارند را شامل میشوند. هدف اصلی روشهای یادگیری (دادهکاوی) انجام پیشبینی است، ولی این تنها هدف دادهکاوی نیست. امروزه داده کاوی موضوعی بسیار محبوب است. برخلاف چند سال پیش، اکنون همه چیز با داده ها پیوند خورده است و ما قادر به مدیریت خوب این نوع داده های بزرگ با کمک علم داده کاوی هستیم. داده کاوی غالباً با منابع مختلف داده از جمله داده های سازمانی که توسط سازمانی تأمین می شود و دارای مسائل حریم خصوصی است، ترکیب می شود و گاهی چندین منبع از جمله داده های شخص سوم، اطلاعات جمعی از مشتریان و داده های مالی و غیره ادغام می شوند. در مواقع در این علم مقدار داده های موجود یک عامل مهم است. از آنجا که در این شاخه ما قصد داریم الگو هایی را در داده های پی در پی یا غیر پی در پی کشف کنیم، همبستگی ها، برای تعیین اینکه آیا مقدار داده های بدست آمده کیفیت خوبی دارد یا خیر، به اندازه حجم داده ها اهمیت دارد.
بیایید با یک مثال شروع کنیم. فرض کنید برخی از داده های مربوط به ورود به سیستم برای یک برنامه وب را بدست آورده ایم. به طور کلی، می توان گفت که این مجموعه داده ها به تنهایی هیچ ارزشی ندارد. این داده ها ممکن است شامل نام کاربری کاربر، زمان ورود به سیستم ، زمان صرف شده برای خروج از سیستم ، فعالیت های انجام شده و غیره باشد. اگر نگاهی اجمالی به این موضوع بیندازیم، می توان گفته که داده موجود کاملاً آشفته است. اما می توانیم برای استخراج اطلاعات مفید، این مورد را تجزیه و تحلیل کنیم.
به عنوان مثال، می توان از این داده ها برای کشف عادت منظم یک کاربر خاص استفاده کرد. بعلاوه، تجزیه و تحلیل این داده ها کمک خواهد کرد تا ساعات اوج سیستم را بدست بیاورید. از این اطلاعات استخراج شده می توان برای افزایش کارایی سیستم و کاربر پسند بودن سیستم استفاده کرد. داده کاوی انواع مختلفی دارد، از جمله داده کاوی تصویری، متن کاوی، کاوش شبکه های اجتماعی، وب کاوی و استخراج صدا و فیلم و غیره.
هدف از داده کاوی
داده کاوی فرایندی است که توسط سازمان ها برای تبدیل داده های خام به اطلاعات مفید مورد استفاده قرار می گیرد. با استفاده از نرم افزار و ابزار های موجود برای جستجوی الگوها در تعداد زیادی از داده ها، مشاغل می توانند با اطلاعات بیشتر درباره مشتریان خود، استراتژی های بازاریابی موثرتر، فروش و کاهش هزینه ها را توسعه دهند.
تاریخچه
روند کاوش در داده ها برای کشف اتصالات پنهان و پیش بینی روندهای آینده، سابقه طولانی دارد. گاهی اوقات به عنوان “کشف دانش در پایگاه های داده” شناخته می شود ، اصطلاح “داده کاوی” تا دهه 1990 ابداع نشده بود. اما بنیاد آن شامل سه رشته علمی بهم پیوسته است: آمار (مطالعه عددی روابط داده ها) ، هوش مصنوعی (هوش انسانی مانند انسان که توسط نرم افزار و / یا ماشین ها نمایش داده می شود) و یادگیری ماشین (الگوریتم هایی که می توانند از داده ها برای پیش بینی پیش بینی کنند). برخی بر این عقیده اند که اصلاح داده کاوی نامی اشتباه است، چرا که هدف اصلی استخراج الگو ها و دانش از مقدار زیادی داده است و نه استخراج خود داده ها، و این نام تنها برای اهداف بازاریابی مورد استفاده قرار می گیرد. در حال حاضر فناوری داده کاوی برای همگام شدن با ظرفیت بی حد و حصر داده های بزرگ و قدرت محاسباتی مقرون به صرفه، در حال پیشرفت است. در حال حاضر، یادگیری آماری، «تحلیل داده» و علم داده (Data Science) از دیگر عباراتی هستند که با معنای مشابه دادهکاوی مورد استفاده قرار میگیرند، حال آنکه گاه تفاوتهای ظریفی میان این موارد وجود دارد. از روشهای دادهکاوی در فرآیند طویل پژوهش و توسعه محصول استفاده میشود. از همین رو، تکامل دادهکاوی نیز از هنگامی آغاز شد که دادههای کسبوکارها روی کامپیوترها ذخیره شدند. دادهکاوی به کاربران امکان حرکت در میان دادهها را در زمان واقعی میدهد. از دادهکاوی در جامعه کسب و کار بدین دلیل استفاده میشود که از سه فناوری بلوغ یافته استفاده میکند.
این فناوریها عبارتند از:
- گردآوری داده انبوه
- کامپیوترهای چند پردازندهای قدرتمند
- الگوریتمهای دادهکاوی
توجه:
برای دانلود فایل کامل ورد لطفا اقدام به خرید نمایید.
لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.