توضیحات
عنوان فارسی: وب کاوی (web mining)
- مقدمه
- تعریف وب کاوی
- روش های کاوش محتوای وب
- متن کاوی
- استفاده از متن کاوی و وب کاوی در سیستم های توصیه گر
- تاریخچه وب کاوی
- روش ها و متدها
- نحوه انجام متن کاوی در عملیات های وب کاوی
- استخراج اطلاعات
- روش های متن کاوی
- استخراج ویژگیها
- آنالیز
- منابع
مقدمه
از آنجایی که حجم اطلاعات الکترونیکی و آنلاین در وب سایت ها روز به روز بیشتر می شود دسترسی سریع و صحیح به منابع مهم و مورد علاقه، یكی از دغدغه های استفاده از این منبع اطلاعاتی بسیار بزرگ است. ارایه ابزاهایی كه با بررسی متون بتواند تحلیلی روی آنها انجام دهند منجر به شكل گیری این زمینه در هوش مصنوعی شده كه به متن کاوی معروف است[1].
2-تعریف وب کاوی
وب کاوی اشاره به کلیه فعالیتهای داده کاوی و فنون وابسته دارد که برای کشف خودکار و استخراج دانش از اسناد و خدمات وب به کار میروند. در پس منابع عظیم اطلاعاتی وبگاه ها اطلاعات ساختاری و داده های موجود در وب و سرورهای آن دانشی نهفته است که دسترسی به آن در حالت عادی کاری دشوار است ضمن آنکه دانش برای کاربران و مدیران و اداره کنندگان وب بسیار مفید است. وب کاوی و فنون وابسته به آن امکان کشف و شناسایی این دانش پنهان را میسر ساخته اند. برحسب انواع کارکردها وب کاوی شامل سه روش است[1]
- کاوش محتوای وب
- کاوش ساختار وب
- کاوش کاربرد وب
وب کاوی به حجم بالایی از اطلاعات به صورت ابراتصال میپردازد و با کاربر به صورت تعاملی در ارتباط است. برخی ملزومات وب کاوی عبارتند از[1]
- نیاز به کارهای مبتنی بر متن و درخواست های غیر دقیق
- نیاز به خلاصه سازی و قیاس
- نیاز به شخصی سازی و یادگیری
3-روش های کاوش محتوای وب
هم اکنون کاوش محتوای وب به دو صورت انجام می گیرد[1]
- عامل های وب
- پایگاه داده
عامل های وب ابزاری هوشمند برای بازیابی اطلاعات است که غالبا با فنون مورد استفاده در وب کاوی توسعه یافته اند و بدین ترتیب داده های موجود در وب را به لحاظ ساختاری مدیریت میکنند. تفاوت عمده بین عامل های وب همیشه توسط یک دانش خاص پشتیبانی میشوند و لذا در مورد موضوعات خاص میتوانند جست و جوهای دقیق تر و موثرتری داشته باشند همچنین نتایج حاصل شده را به خوبی دسته بندی می کنند[3].
در حالت پایگاه داده ای داده های بدون ساختار و ناهمگون وب به داده های ساختاریافته تغییر شکل میدهند تا بتوان آنها را به راحتی در پایگاه داده ذخیره کرد و برای آنها دستورات پرس و جو نوشت به طوری که می توان بسیاری از مکانیزم های استاندارد دستکاری داده ها و فنون داده کاوی را روی پایگاه داده مذکور به کار برد. حتی می توان پایگاههای داده چند لایه هم داشت که در آن هر داده در سطح بالا از دانش استخراج شده در لایه های پایین تر حاصل شده باشد[3].
امروزه کاوش محتوای وب بیشتر به شکل متن کاوی در وب صورت می گیرد ولی پیشرفت های اخیر چند رسانه ای کاوی یا دسترسی وسیع به تصاویر و صوت ها و ویدیو ها و غیره را نیز میسر کرده است.
4-متن کاوی
متن کاوی (که با عنوان کاوش داده متنی یا کشف دانش در پایگاه داده متنی نیز شناخته می شود) یک فرآیند نیمه خودکار استخراج الگو (اطلاعات و دانش کاربردی) از میان مقادیر زیادی از منابع داده غیر ساخت یافته می باشد[3]
حوزه دیگر که پردازش خودکار متون غیرساخت یافته تحت تاثیر قرار داده تعاملات و ارتباط الکترونیک و ایمیل است. متن کاوی نه تنها به منظور دسته بندی ایمیل ها و فیلتر کردن ایمیل های نادرست؛ بلکه می تواند ایمیل ها را اولویت بندی کرده و حتی به طور اتوماتیک براساس اولویت بندی پاسخ دهی کند[3].
نمونه هایی از کاربردهای متن کاوی شامل موارد زیر است[4]
- استخراج اطلاعات
- موضوعات ردیابی
- خلاصه سازی
- دسته بندی
- خوشه بندی
- پیوند مفاهیم
- پاسخ دهی سوالات
5-استفاده از متن کاوی و وب کاوی در سیستم های توصیه گر
یکی از کاربردهای مهم و گسترده از متن کاوی و وب کاوی در سیستم های توصیه گر میباشد که از سال 1990 شروع به گسترش کردند. سیستم توصیه گر سیستمی است که برای ارائه پیشنهاد به تصمیم گیرنده در زمانی که چندین انتخاب دارد می باشد. نمونه ای از این سیستم ها در پزشکی و آموزش و فیلم و سرگرمی کاربرد دارد[3].
برای ساخت یک سیستم توصیه گر روش های مختلفی مانند آمار و وب کاوی و متن کاوی وجود دارد.
6–تاریخچه وب کاوی
اصطلاح وب کاوی اولین بار در سال 1996 توسط اتزیونی در مقاله ای به نام شبکه جهان گسترباتلاق یا معدن طلا مطرح شد. در این مقاله وب کاوی به عنوان یک شیوه وظیفه مدار توصیف شده است. در سال 1997 کولی و مباشر و سیروستا از دیدگاه داده محور به تعریف کامل وب کاوی در مقاله ای به نام وب کاوی کشف اطلاعات و الگوها در شبکه جهان گستر در نهمین کنفرانس بین المللی موسسه بین المللی مهندسان برق و الکترونیک در زمینه ابزارههای هوش مصنوعی پرداختند[2].
در سال 2006 آگراوال سیستم توصیه گری را پیشتهاد کرد که بر اساس روش های مختلف آماری انجام میشد و در آن ویژگیهای مورد نظر وزن دهی می شد و بر این اساس یک انتخاب به کاربر معرفی می شد[2].
در سال 2007 سیستم توصیه گری برای امنیت وب طراحی شد. در این سیستم از عامل ها استفاده می شد و این عامل ها اطلاعاتی را جمع آوری و سپس با استفاده از روش های فازی یک نمونه را برای توصیه انتخاب می کردند[2].
سیستم دیگری در سال 2007 معرفی شد که بر اساس رابطه بین کاربر و نمونه های موجود در پروفایل کاربر بود. این سیستم از زبان owl برای مدل سازی کاربر و گزینه هایش استفاده می کرد. در این روش شباهت های بین کاربر و آیتم ها با استفاده از زبان owl پیدا شده و با استفاده از تشکیل ماتریس بر مبنای این اطلاعات گزینه ای را به کاربر معرفی می کرد[2].
7-روش ها و متدها
سیستم توصیه کر برای کمک به کاهش زمان جستجو و جلوگیری از جستجوهای تکراری به کار می رود. برای ساخت سیستم توصیه گر به یکی از روش های زیر باید اقدام کرد[2]
- سیستم توصیه گر بر مبنای محتوا
- سیستم توصیه گر اشتراکی
- سیستم توصیه گر ترکیبی
که در سیستم ترکیبی می توان ابتدا دو سیستم جداگانه را طراحی و سپس نتایج را ترکیب کرد . یا اینکه از ابتدا مدلی جداگانه را طراحی کرد. یا اینکه ویژگیهای مدل محتوا را در مدل اشتراکی وارد کرد و یا بالعکس.
رو ش دیگر بر مبنای آنتالوژی است. که برای بازنمایی دانش از روش درخت استفاده می کند و هر نود و یا زیر شاخه بیانگر یک مفهوم است و اطلاعات با جستجو در دخت پیدا می شوند و از زبان owl استفاده می کند.
روشدیگر شخصی سازی وب است. در این روش باید اطلاعات کاربر جمع آوری شود. برای جمع آوری اطلاعات یا از کارها و جستجوهایی که کاربر انجام داده است باید استفاده کرد یا از اطلاعاتی که مستقیما از خود کاربر گرفته می شود. برای اولین بار که کاربر جستجویی را انجام می دهد سیستم در مرحله یادگیری است و پس از آن می تواند برای پیشنهاد به کاربر موضوعاتی را بیان کند.
در روش شخصی سازی وب برای جمع آوری اطلاعات کاربر از چندین روش می توان قدام کرد[2]
1-روش های تکنیکی
متن کاویکاربر ممکن است چندین کلمه را جستجو کند که مربوط به علایق باشد یا نباشد.این تحلیل به عهده متن کاوی است که سیستم بتواند متن های کاربر را تجزیه و تحلیل کند و اطلاعات با کیفیتی را استخراج کند. این کار با استفاده از الگوها و شناخت االگوها و یادگیری امکان پذیر است. لذا این کار در جستجوی مرحله اول امکان پذیر نیست و هر چه تعداد جستجوها بیشتر شود دقت سیستم نیز بالاتر رفته و اطلاعات با کیفیت تری را تولید می کند.
اسکن qr این روش هم اکنون برای انتقال اطلاعات به کار می رود.زمانی که کاربر جستجویی را انجام می دهد ممکن است چندین نتیجه را مشاهده کند ولی در این روش کاربر دقیقا نتایج جستجو شده را مشاهده می کند لذا از هدررفتن وقت وی جلوگیری می شود.
تصویر کاوی
در این روش با استفاده از سه تکنیک اصلی شناسایی الگو و شناسایی رنگ و شناسایی تصاویر برای کمک به تولید اطلاعات درباره کاربر استفاده میکنند.
توجه:
- برای دانلود فایل word کامل ترجمه از گزینه افزودن به سبد خرید بالا استفاده فرمایید.
- لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.