توضیحات
عنوان فارسی: فهم پترن های زبان شناختی سرقتی ،ویژگی های متنی و روش های آشکارسازی
عنوان انگلیسی:
Understanding Plagiarism Linguistic Patterns, Textual Features, and Detection Methods
مقدمه:
سرقت میتواند ماهیت های مختلفی داشته باشد ،از کپی کردن متن گرفته تا انتخاب ایده ها بدون ارجاع به منشا آن. این مقاله یک طبقه بندی از انواع سرقت را ارائه میدهد که تفاوت بین سرقت های مقالات و سرقت هوشمند را از نقطه نظر رفتاری سرقت مشخص میکند. طبقه بندی فهم عمیق از پترن های زبان شناختی مختلف را در تقلب رخ داده را پشتیبانی میکند. برای مثال ، تغییر مفهوم متن با کلمات مختلف و کوتاه کردن متن با حفظ مفهوم کلی و انتخاب ایده های دیگران. ویژگی های متنی متفاوت با تقلب های مختلف بحث شده اند. قالب کارهای معنایی و روش های تک زبانی خارجی و داتی و آشکارسازی تقلب چند زبانی آشکار میشود و اصلاح میگردد توسط انواع تقلب هایی که در این طبقه بندی لیست شده اند. ما روی تکنیک های حالت – هنر مطالعه میکنیم که شامل مبتنی بر کاراکتر n- گرمی (CNG)، مبتنی بر بردار (VEC)،مبتنی بر لغت (SYN)،مبتنی بر معنا (SEM)، مبتنی بر فازی (FUZZY)،مبتنی بر ساختار (STRUCT)،مبتنی بر سبک (STYLE) و تکنیک های بین زبانشناختی (CROSS) است. مطالعه ما اثبات میکند که سیستم های موجود برای آشکارسازی سرقت تمرکز میکند بر روی کپی کردن متن اما در تشخیص تقلب هوشمند دچار خطا میشود هنگامی که ایده اصلی با کلمات متفاوتی بیان میشود.
کلمات کلیدی: الگوهای زبانی، سرقت ادبی، تشخیص سرقت ادبی، طبقه بندی، ویژگی های متنی
معرفی
مساله تقلب اخیرا افزایش یافته است چون متن های دیجیتال بر روی اینترنت سراسری در دسترس هستند. آشکارسازی تقلب در زبان های طبیعی با روش های ساتاتیک و کامپیوتری از سال 1990 آغاز شد و توسط مطالعات مکانیسم های آشکارسازی کپی در متن های دیجیتالی دنبال شد. قبل از آشکارسازی تقلب در زبان های طبیعی ، آشکارسازی کپی کد و سواستفاده نرم افزاری از سال 1970 شروع شد توسط مطالعاتی برای آشکارسازی تقلب کد برنامه نویسی در پاسکال و c. الگوریتم های آشکارسازی در زبان های طبیعی و زبان های برنامه نویسی ، تفاوت قابل توجهی دارند.اولی با ویژگی های متنی مختلفی گلاویز است در حالیکه دومی بر روی نگه داری شمخصات اندازه گیری مانند تعداد نقطه ها ،متغیر ها ،حالت ها ،زیر برنامه ها ،فراخوانی زیر برنامه ها و سایر پارامترها تمرکز میکند.در طول دهه اخیر ، تحقیق روی آشکارسازی سرقت اتوماتیک در زبان های طبیعی به صورت فعالی درگیر شده است که از مزیت های توسعه های اخیر در زمینه های مرتبط مانند اصلاح اطلاعات (IR)، اصلاح اطلاعات چندزبانی (CLIR)،پردازش زبان طبیعی ،زبان شناختی محاسباتی ،هوش مصنوعی و محاسبات نرم افزاری است.در این مقاله یک بررسی از مزیت های اخیر در آشکارسازی سرقت اتوماتیک در نوشته های متنی انجام شده است که در سال 2005 آغاز شد.
این مقاله پترن های سرقت را با ویژگی های متنی کنار هم می آورد برای کاراکترسازی هر پترن و از روش های کامیپوتری برای آشکارسازی استفاده میکند. قسمت های مهم این مقاله به صورت زیر است:
اول :انواع مختلفی از تقلب ها در داخل یک طبقه بندی سازماندهی شده است که مطالعات و نوشته های اخیر در مورد قراردادهای تقلب جمع آوری شده است. طبقه بندی توسط پترن های سرقت مختلف پشتیبانی شده است. دوم ، ویژگی های متنی مختلفی ارائه شده است برای نمایش نوشته های متنی به منظور آشکارسازی سرقت.سوم روش های اصلاح کاندید و آشکارسازی سرقت ارزیابی و اصلاح شدند توسط انواع تقلب هایی که در طبقه بندی آورده شده اند.
مقاله به صورت زیر تنظیم شده است:
فصل II طبقه بندی سرقت و پترن های زبان شناختی را توضیح میدهد. فصل III قرارداد سیستم آشکارسازی سرقت را با روش های مختلف نشان میدهد: طراحی جعبه سیاه نسبت به جعبه سفید ،پروژه های خارجی نسبت به پروژه های داخلی و سیستم های تک زبانی نسبت به سیستم های چند زبانی. بخش IV ویژگی های متنی مختلف را برای کمی کردن متن ها به عنوان یک محدودیت شرط در آشکارسازی سرقت ارائه میدهد. بخش V – تحقیق بین آشکارسازی سرقت خارجی و IR و بین آشکارسازی سرقت بین زبانی و CLRL وسایر روش های آشکارسازی مبتنی بر کاراکتر nگرم (CNG) مبتنی بر بردار (VEC)،مبتنی بر لغت (SYN)،مبتنی بر معنا (SEM)، مبتنی بر فازی (FUZZY)، مبتنی بر ساختار (STRUCT)،مبتنی بر سبک (STYLE) و تکنیک های بین زبانشناختی (CROSS) را بیان میکند. فصل VI روش هاو انواع سرقت ها را در طبقه بندی ما را نشان میدهد و فصل VII نتیجه گیری را ترسیم میکند.
توجه:
- برای دانلود فایل word کامل ترجمه لطفا اقدام به خرید فرمایید.
- پس از خرید بلافاصله لینک دانلود فایل برای شما ایمیل خواهد شد.
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.