توضیحات
تحقیق بررسی روش های مبتنی بر ویژگی در تشخیص تشابه متون علمی
با افزایش تحقیقات علمی و نگارش های علمی بحث در مورد عدم یکسان بودن و یافتن شباهت در بین متون علمی نیز کاربرد فراوانی پیدا کرده است. روش های مختلفی برای پردازش زبان طبیعی برای پیدا کردن تشابه در بین متون ارائه شده است که برخی مختص زبان فارسی و برخی در هر دو زبان انگلیسی و فارسی کاربرد دارند.
کپی برداری[1] در هر زمینه ای مانند موزیک، نویسندگی، متون علمی و … در دنیای امروز امکان پذیر است. زیرا در دنیای امروزه با افزایش تکنولوژی و افزایش حجم اطلاعات هر شخص میتواند به راحتی به منابع اطلاعاتی دسترسی یابد. کپی برداری به معنای استفاده از کل یا قسمتی از یک متن است بدون اینکه به متن اصلی ارجاع داده شود. در علم کامپیوتر اصولا دو نوع کپی برداری اتفاق میافتد:
1-کپی برداری متون که اغلب در بین محققان و دانشجویان اتفاق میافتد.
2-کپی برداری سورس کد که در بین برنامه نویسان شایع است.
تشخیص شباهت در متون کاربردهای زیادی دارد که از جمله این کاربردها میتوان به موارد زیر اشاره کرد:
1-بسیاری از سایت ها از مطالب دیگر سایت ها کپی کرده و استفاده مینمایند. با استفاده از روش های تشخیص شباهت متن میتوان این سایت ها را شناسایی و حذف کرد.
2-ایده ها و نتایج تحقیقات علمی که با استفاده از یک نام دیگر به صورت آگاهانه و یا غیر آگاهانه به شخص دیگری تعلق پیدا میکند.
3-برای کاهش فضای جستجو میتوان صفحات تکراری در وب را جستجو از نمایه گذاری آنها جلوگیری کرد.
با توجه به کاربرد فراوان این موضوع در فضای اطلاعاتی امروزه در این سمینار روش های مختلف مبتنی بر ویژگی را برای یافتن شباهت در متون علمی مورد بررسی قرار داده و انواع این روش ها را بیان خواهیم کرد.
…
فهرست مطالب تحقیق بررسی روش های مبتنی بر ویژگی در تشخیص تشابه متون علمی
- 1-1-مقدمه: 10
- 1-2-بیان مسئله: 10
- 1-3-اهمیت موضوع: 11
- 1-4-مباحث تحت پوشش سمینار: 11
- 1-5-ساختار تحقیق: 12
- 2-1-مقدمه: 16
- 2-2- انواع تشابه در متون: 16
- 2-2-1-کشف تشابه متنی: 17
- 2-2-2-کشف تشابه مبتنی بر ارجاع: 18
- 2-2-3- کشف تشابه مبتنی بر شکل ها و فلوچارت ها: 20
- 2-3-تکنیک های کشف تشابه متنی: 22
- 2-4-مرور سوابق: 25
- 3-1-مقدمه: 29
- 3-2-الگوریتم های کشف شباهت: 29
- 3-2-1-استفاده از روش های احتمالی: 31
- 3-2-2-روش کیسه لغات: 32
- 3-2-3-مقایسه شباهت با استفاده از فرمول کسینوسی: 33
- 3-3-الگوهای وزن دهی: 35
- 3-3-1-الگوهای وزن دهی محلی: 35
- 3-3-2-الگوهای وزن دهی سراسری: 36
- 3-4-فاکتورهای نرمال سازی: 36
- 3-5-پیش پردازش اسناد: 37
- 3-5-1-تشخیص زنجیره مرجعیتی: 38
- 3-5-2-برچسب زنی نقش معنایی کلمات: 38
- 3-5-3-برچسب زنی نحوی لغات: 38
- 3-5-4-حذف کلمات زائد: 38
- 3-5-5-ریشه یابی کلمات: 39
- 3-6-تشخیص با استفاده از مدل فضای برداری: 39
- 3-7-تشخیص شباهت با استفاده از موقعیت سنجی: 42
- 3-8-شخیص شباهت با استفاده از شباهت جملات: 43
- 4-1-مقدمه: 45
- 4-2-روش پیشنهادی: 45
- 4-3-ارزیابی: 46
- 4-4-نتیجه گیری: 46
منابع تحقیق بررسی روش های مبتنی بر ویژگی در تشخیص تشابه متون علمی
- Agirre, Eneko; Carmen Banea, Daniel Cer, Mona Diab & other; Semantic Textual Similarity, Monolingual and Cross-Lingual Evaluation, Proceedings of SemEval-2016, San Diego, California, 2016, pages 497–511.
- Brin, Sergey, James Davis, and Hector Garcia-Molina. “Copy detection mechanisms for digital documents.” ACM SIGMOD Record. Vol. 24. No. 2. ACM, 1995.
- Broder, A. Z.; N. Eiron; M. Fontoura; M. Herscovici, R. Lempel; J. Mcpherson; R. Qi; E. Shekita; Yahoo Inc and Google Inc, “Indexing shared content in information retrieval systems” in Proc. of the 10th Int. Conf. on Extending Database Technology, 2006.
- Budanitsky, Hirst, “Semantic distance in Word-Net: An experimental application-oriented evaluation of five measures”. In Proceedings of the NAACL Workshop on Word-Net and Other Lexical Resources, 2001.
- Engels, Steve; Vivek Lakshmanan, Michelle Craig; Plagiarism detection using feature-based neural networks, ACM SIGCSE Bulletin, Volume 39 Issue 1, March 2007, Pages 34-38
- Fetterly, D.; M. Manasse and M. Najork, “On the Evolution of Clusters of Near-Duplicate Web Pages”, in the Evolution of Clusters of Near-Duplicate Web Pages Congress, 2003.
- Gomaa, Wael H. and Aly A. Fahmy, “A Survey of Text Similarity Approaches”, International Journal of Computer Applications, Volume 68– No.13, April 2013, pp.13- 18
- Hoad, T. C. and J. Zobel, “Methods for Identifying Versioned and Plagiarised Documents”, Journal of the American Society for Information Science and Technology, pp. 203-215, 2003.
- Kent, Chow Kok; Naomie Salim; Features Based Text Similarity Detection, JOURNAL OF COMPUTING, VOLUME 2, ISSUE 1, JANUARY 2010, pp. 53- 57.
- Lintean, Mihai and Vasile Rus, “Measuring Semantic Similarity in Short Texts through Greedy Pairing andWord Semantics”, Proceedings of the Twenty-Fifth International Florida Artificial Intelligence Research Society Conference, 2012, pp. 244- 249.
- Ma, Weicheng and Torsten Suel, “Structural Sentence Similarity Estimation for Short Texts”, Proceedings of the Twenty-Ninth International Florida Artificial Intelligence Research Society Conference, 2016, pp. 232- 237.
- Mihalcea, Rada; Courtney Corley and Carlo Strapparava, “Corpus-based and nowledge-based Measures of Text Semantic Similarity”, American Association for Artificial Intelligence, 2006.
- Pradhan, Nitesh; Manasi Gyanchandani & Rajesh Wadhvani, “A Review on Text Similarity Technique used in IR and its Application”, Volume 120 – No.9, June 2015, International Journal of Computer Applications, pp. 29- 34.
- Rada Mihalcea, Courtney Corley, and Carlo Strapparava. “Corpus-based and Knowledge-based Measures of Text Semantic Similarity”, In Proceedings of AAAI, Boston, July, 2006.
- Rensch, Calvin R. “Calculating lexical similarity”, In Eugene H. Casad (ed.), Windows on bilingualism, pp 13-15 1992.
- Sahami, Mehran Sahami, Timothy D. Heilman, “A web-based Kernel Function for Measuring the Similarity of Short Text Snippets”, Proceedings of the 15th International Conference on World Wide Web, pp: 377-386, 2006.
- Yazdani, Majid and Andrei Popescu-Belis, “Computing Text Semantic Relatedness using the Contents and Links of a Hypertext Encyclopedia: Extended Abstract”, Proceedings of the Twenty-Third International Joint Conference on Artificial Intelligence, 2013, pp. 3185- 3189.
- صفوی، کورش؛ نگاهی به پیشینه زبان فارسی، نشر مرکز، 1367
- A.Hiremath , M.S.Otari,” Plagiarism Detection-Different Methods and Their Analysis: Review”, International Journal of Innovative Research in Advanced Engineering (IJIRAE) ISSN: 2349-2163 Volume 1 Issue 7 (August 2014)
- Ferreira, R. Lins, F. Freitas, S. Simske and M. Riss, “A new sentence similarity assessment measure based on a three-layer sentence representation,” ACM Symposium on Document Engineering, DocEng 2014, pp. 25-34, 2014. [6] T. T. ZHU and M. LAN, “ECNUCS: Measuring Short Text Semantic Equivalence Using Multiple Similarity
- Measurements,” Second Joint Conference on Lexical and Computational Semantics (*SEM), pp. 124-131, 2013.
- Lee, J. Chang and T. Hsieh, “A grammar-based semantic similarity algorithm for natural language sentences”, The Scientific World Journal, 2014.
- Dan and P. Bhattacharyya, “CFILT-CORE: Semantic Textual Similarity using Universal Networking Language,” Second Joint Conference on Lexical and Computational Semantics (*SEM), pp. 216-220, 2013
- Grozea,C.Geh, M. Popescu. (2009). ENCOPLOT: Pairwise Sequence Matching in Linear Time Applied to Plagiarism Detection. Workshop “Uncovering Plagiarism, Authorship and Social Software Misuse” (pp. 10-18). Donostia, Spain, 2009: ENCOPLOT
- J.Fillmore. (1968). The case for case. In C.J.Fillmore. New York: Holt, Rinehart, and Winston: In Bach and Harms (Ed.): Universals in Linguistic Theory.
- GIPP, N. MEUSCHKE. (2011). Citation pattern matching algorithms for citation-based plagiarism detection. Proceedings of the 11th ACM symposium on Document engineering (pp. 249-258). New York, NY, USA : ACM
- Lyon, ,J.A.Malcolm,R.G.Dickerson. (2001). Detecting Short Passages of Similar text in large document. the 2001 Conference on Empirical Methods in Natural Language Processing (pp. 1-8). New York: Cornell University.
- ثریا عنایتی شیراز، فرزین یغمایی، محمد کریم سهرابی و ” ارائه یک روش اتوماتیک جهت تشخیص پلاگاریسم در متن دو زبانه”و هشتمین سمپوزیوم پیشرفته در علوم و تکنولوژی”
توجه:
تحقیق بررسی روش های مبتنی بر ویژگی در تشخیص تشابه متون علمی شامل یک فایل ورد 50 صفحه ای می باشد.
لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.