توضیحات
تحقیق تشخیص جنسیت نویسنده از روی متن
چکیده
امروزه اینترنت در زندگی روزمره اکثر مردم حرف اول را میزند جایی که هر لحظه هزاران پیغام و متن در اینترنت منتشر میشود. نویسندگان این پیامها همیشه هویت خود را در فضای اینترنتی بروز نمیدهند و همین مسئله باعث به وجود آمدن چالشی است به نام تشخیص هویت نویسنده. یکی از زیرمجموعههای تشخیص هویت نویسنده، تشخیص جنسیت آن فرد از روی متن نوشته توسط آن فرد است. این مسئله نهتنها در بستر اینترنت، بلکه در کاربردهای دیگری مثل تشخیص هویت با استفاده از متن، دروغسنجی افراد، کاربرد در پزشکی قانونی و غیره میتوان اشاره کرد. تشخیص جنسیت از روی متن نیازمند استفاده از دانش و مطالعات علومی مانند روانشناسی و زبانشناسی است. استفاده از این علوم میتواند به یادگیری ماشین کمک کند تا بتوان به صورت خودکار این مسئله را یاد گرفته و انجام دهد. در این گزارش تعدادی از روشهایی که در مسئله تشخیص جنسیت استفاده میشود را بازگو کرده و در مورد انواع ویژگیهای مهمی که میتوان از متن استخراج کرد به طور مفصل صحبت کردهایم و در پایان نتایجی که روی دو پیکره فارسی (پیکره داستان و پیکره نظرات) و چند پیکره انگلیسی هست را بررسی کردهایم.
فهرست مطالب تحقیق تشخیص جنسیت نویسنده از روی متن
- چکیده
- 1. مقدمه
- 1.1. تاریخچه
- 2. دادگان
- 2.1. آمادهسازی دادگان
- 3. استخراج ویژگی
- 3.1. ویژگیهای مبتنی بر کاراکتر
- 3.2. ویژگیهای مبتنی بر کلمه
- 3.3. ویژگیهای نحوی
- 3.4. ویژگیهای ساختاری
- 3.5. ویژگیهای تابعی مبتنی بر کلمه
- 3.6. جمعبندی
- 3.7. تفاوت ویژگیهای متون لاتین و فارسی
- 3.8. ویژگیهای متون نظرات
- 4. آموزش مدلهای یادگیری
- 4.1. دستهبند بیز ساده
- 1.2. درخت تصمیم
- 1.3. ماشین بردار پشتیبان
- 1.4. شبکه عصبی
- 2. نتایج آزمایشات
- 6. نتیجهگیری
- روش پیشنهادی
- نحوه آموزش در حال بی نظارت
- مراجع
منابع تحقیق تشخیص جنسیت نویسنده از روی متن
Cheng, N., R. Chandramouli, and K. Subbalakshmi, Author gender identification from text. Digital Investigation, 2011. 8(1): p. 78-88.
Kokkos, A. and T. Tzouramanis, A robust gender inference model for online social networks and its application to LinkedIn and Twitter. First Monday, 2014. 19(9).
Abbasi, A. and H. Chen, Applying authorship analysis to extremist-group web forum messages. IEEE Intelligent Systems, 2005. 20(5): p. 67-75.
4. Abbasi, A. and H. Chen. Visualizing authorship for identification. in International Conference on Intelligence and Security Informatics. 2006. Springer.
5. Alwajeeh, A., M. Al-Ayyoub, and I. Hmeidi. On authorship authentication of arabic articles. in Information and Communication Systems (ICICS), 2014 5th International Conference on. 2014. IEEE.
6. Talbot, M.M., Language and Gender: An Introduction Cambridge: Polity. 1998.
7. Zheng, R., et al., A framework for authorship identification of online messages: Writing‐style features and classification techniques. Journal of the American Society for Information Science and Technology, 2006. 57(3): p. 378-393.
8. Mendenhall, T.C., The characteristic curves of composition. Science, 1887: p. 237-249.
9. Mendenhall, T.C., A Mechanical Solution of a Literacy Problem. 1901.
10. Mosteller, F. and D. Wallace, Inference and disputed authorship: The Federalist. 1964.
11. Apte, C., et al. Text mining with decision trees and decision rules. in In Proceedings of the Conference on Automated Learning and Discorery, Workshop 6: Learning from Text and the Web. 1998. Citeseer.
12. Baker, P., Using corpora to analyze gender. 2014: A&C Black.
13. Lakoff, G. and H. Thompson. Introducing cognitive grammar. in Annual Meeting of the Berkeley Linguistics Society. 1975.
14. Rezaei, A.M., Author Gender Identification from Text. 2014, Eastern Mediterranean University (EMU)-Doğu Akdeniz Üniversitesi (DAÜ).
15. Ding, S.H., et al., Learning Stylometric Representations for Authorship Analysis. arXiv preprint arXiv:1606.01219, 2016.
16. Holmes, D.I., Authorship attribution. Computers and the Humanities, 1994. 28(2): p. 87-106.
17. Peng, F., et al. Automated authorship attribution with character level language models. in 10th Conference of the European Chapter of the Association for Computational Linguistics (EACL 2003). 2003.
18. Chung, C.K. and J.W. Pennebaker, Linguistic Inquiry and Word Count (LIWC). 2012.
19. Boser, B.E., I.M. Guyon, and V.N. Vapnik. A training algorithm for optimal margin classifiers. in Proceedings of the fifth annual workshop on Computational learning theory. 1992. ACM.
20. Hinton, G.E., S. Osindero, and Y.-W. Teh, A fast learning algorithm for deep belief nets. Neural computation, 2006. 18(7): p. 1527-1554.
مرادی مهدی، بحرانی محمد. تشخیص خودکار جنسیت نویسنده در متون فارسی. پردازش علائم و دادهها
توجه:
تحقیق تشخیص جنسیت نویسنده از روی متن شامل یک فایل ورد 18 صفحه ای می باشد
لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
نقد و بررسیها
هنوز بررسیای ثبت نشده است.