توضیحات
عنوان تحقیق: بررسی انواع پایگاه داده های نو اس کیو ال و ویژگی های آنها
- چکیده
- مقدمه
- فصل یکم
- تعریف
- خواص اسید
- خواص base
- مفاهیم و اصطلاحات
- فصل دوم
- دسته بندی مدل های NOSQL پایگاه داده کلید مقدار
- پایگاه داده اسناد محور
- پایگاه داده خانواده ستون
- پایگاه های داده گراف محور
- فصل سوم
- ارزیابی بین پایگاه داده رابطهای و NOSQL
- فصل چهارم
- مقایسه پایگاه داده NOSQL
- فصل پنجم
- جمعبندی و نتیجهگیری
- منابع و مراجع
مقدمه
در دهه اخیر با افزایش برنامه های تحت وب بزرگ، تحقیق درباره کنترل داده در مقیاس معطوف شده است . یکی از خروجی های این گونه تحقیقات پایگاه داده غیررابطه ای است که در حالت کلی به صورت پایگاه داده NOSQL نامیده می شود.
یک اصطالح عمومی می باشد که جهت اشاره به هر داده ذخیره شده که از مدل سیستم مدیریت پایگاه داده رابطه ای سنتی تبعیت نمی کند به کاربرده می شود مخصوصا داده های غیر رابطه ای وداده هایی که از زبان پرس و جوی SQL استفاده نمی کنند . این اصطالح جهت اشاره به پایگاه داده هایی که تلاش می کنند مسائل مقیاس پذیری و دسترس پذیری را در مقابل یکپارچگی یا سازگاری حل کنند به کار برده می شود. از ویژگی های مشترک پایگاه های داده NOSQL می توان به مقیاس پذیری بالا و قابلیت اطمینان ، مدل داده های بسیار ساده ، زبان پرس و جو بسیار ساده ( ابتدایی ) ، فقدان مکانیسمی برای اداره و مدیریت سازگاری داده ها و جامعیت در محدودیت نگهداری اشاره کرد. نسل جدیدی است ازپایگاه های داده که غالبا غیر رابطه ای توزیع پذیر، متن باز و با قابلیت توسعه افقی می باشند . یکی ازانواع ذخیره داده می باشدوراهی است برای ذخیره سازی و بازیابی سریع داده ها . اولین جرقه های این نوع پایگاه داده در سال 2009 زده شد و بعد از آن با سرعتی باور نکردنی پیشرفت کرد . در حال حاضر بیشتر از 122 سیستم مدیریت پایگاه داده NOSQL وجود دارد و وب سایت های بزرگی چون گوگل ، آمازن ، فیس بوک ، توییتر و ……. از این نوع پایگاه ها استفاده می کنند.
فصل یک:تعریف
1-1- خواص اسید
- یکپارچگی (Atomicity) : همه چیز در یک تراکنش موفقیت آمیز می گردد تا مبادا به حالت اولیه باز گردد.
- سازگاری (Consistency) : یک تراکنش نمی تواند پایگاه داده را در یک وضعیت ناسازگار قرار دهد.
- انزوا (Isolation): یک تراکنش نمی تواند در کار دیگری مداخله کند.
- پایداری (Durability): یک تراکنش کامل پایدار است حتی بعد از اینکه برنامه ها از نو آغاز شوند.
برنامه های سیستم مدیریت پایگاه داده رابطه ای سنتی بر روی تراکنش های ACID تمرکز دارند.
هر چند ممکن است این ویژگی ها ضروری به نظر برسند ولی آنها کاملا با دسترس پذیری و کارایی برنامه های در مقیاس وب ناسازگار می باشند.
نکته ای که من سعی می کنم در اینجا به آن اشاره کنم این است که ما ناگزیریم فراتر از ACID بنگریم چیزی که به نقل از آقای اریک برورBASE نامیده می شود.
1-2- خواص BASE عبارت اند از:
- دسترس پذیری پایه (Basic availability) : هر درخواستی یک پاسخ را گارانتی می کند اجرای موفق یا ناموفق
- حالت نرم(Soft state) : وضعیت سیستم ممکن است در طول زمان در زمانهای بدون ورودی تغیر کند (برای سازگاری احتمالی)
- سازگاری احتمالی(Eventual consistency): پایگاه داده ممکن است موقتا ناسازگار باشداما در نهایت سازگار خواهد شد.
- به طور كلی برای بیان ویژگی های پایگاه داده های NoSql تینیک های مختلفی به كار می رود، ییکی از روش هایی كه برای دسته بندی پایگاه داده های NoSql به كار می رود استفاده از تئوری CAP می باشد
- برای یک سیستم کامپیوتری توزیع شده سازگاری دسترس پذیری و تحمل پارتیشن همزمان امری غیر ممکن است از این موضوع معمولا به عنوان قضیه CAPنام برده می شود با این وجود درمواردی همانند معاملات بازار سهام یا بانکی که معاملاتی حیاتی هستند داده های ذخیره شده یا وضعیت داده به تنهایی درست کار نخواهد کرد پس به طور یقین NO SQL راهکاری برای همه مسائل مربوط به پایگاه داده نمی باشد.
در این دیاگرام سه گوشه اصلی نشان گر ثبات (Consistency) در دسترس بودن (Availability) و قابلیت بخش بخش سازی (Partition Tolerance) هستند. ثبات در اینجا یعنی همه کلاینت ها همواره به دادههای مشابه دسترسی داشته باشند، در دسترس بودن یعنی همه کلاینت ها امکن خواندن و نوشتن را داشته باشند و قابلیت بخش بخش سازی نیز به معنای این است که سیستم کلی بتواند در تمام بخشهای شبیه فیزیکی کارکند. بر اساس نظریه CAPتنها دو عنصر از این سه عنصر در سیستمهای واقعی قابل انتخاب هستند و بر همین اساس، برای داشتن هر جفت مشخصه، میت وان راه حلی را که روی ضلع مشترک آنها آورده شده است، انتخاب کرد. بررسی کامل این دیاگرام خود محتاج توضیح و تبیین بسیاری است که در حوصله این مقاله نمی گنجد. راه کار های NOSQL برای مسائلی بسیار فراتر از دنیای سنتی پایگاه های دادهای بهکارمیروند و عملکردی به شدت بهتر از همتایان سنتی خود ارائه می کنند. لازم به تأکید است که گذار به سمت راه کارهای NoSQL ،به دلیل مشکلات و محدودیتهای زبان SQL نبوده است، بلکه به دلیل محدودیت های مدل رابطهای پایگاه داده ای است.
1-3:مفاهیم و ا صطلاحات
مقیاس پذیری : مقیاس پذیری به دو صورت عمودی و افقی امکان پذیر است
مقیاس پذیری عمودی :
افزایش یا كاهش منابع یک سرور را مقیاس پذیری عمودی میگوییم. به عنواق مثال دو یا چند برابر كردن تعداد پردازنه ها، حافظه اصلی و … . كه با این كار عملکرد با افزایش كارایی سرور بهبود میابد
مقیاس پذیری افقی :
افزایش تعداد ماشین های مجازی و تقسیم بار بین ان ها را مقیاس پذیری افقی میگوییم. لازم است نرم افزار مشتری با توجه به این تکنولوژی طراحی و پیاده سازی شده باشد. لازم به ذکر است كه بهترین نحوه استفاده از فضای رایانش ابری، مقیاس پذیری افقی است ، نه عمودی . در پایگاه داده SQL از مقیاس پذیری عمودی استفاده میشود
فرمت JSON:
BSON نمایش باینری JSON هست . در MongoDb داده در اسناد به شکل فیلد و مقدار نمایش داده می شود. نام فیلد در دابل كوتیش و به دنبال ان” :” و سپس مقدار قرار می گیرد. كه مقادیر می تواند اسناد ، ارایه یا ارایه ای از اسناد باشد. جداكننده ی هر جفت كاراكتر ” ، ” میباشد. شروع و پایان اسناد با كاراكتر ” {}” مشخص میشود و ارایه ها هم بین ” [ ]” قرار می گیرد
Sharding
در sharding اطلاعات پایگاه داده بین چند نود(سرور) تقسیم می شود و در نتیجه هر سرور اطلاعات متفاوتی از سایر سرورها دارد.
كاربرد اصلی sharding بالا بردن ظرفیت ذخیره سازی اطلاعات در پایگاه داده است.
: HDFS
سیستم فایلی توزیع شده، مقیاس پذیر و قابل حمل است كه با زبان جاوا برای هادوپ نوشته شده است . این سیستم فایل برای ارتباطات از لایه ی TCP/IP استفاده میكند .برای از بین بردن محدودی حجم فایل در HDFS داده به صورت فایل و پوشه سازماندهی می شهود و سپس فایلها به اجزا یک اندازه كه بلاک نامیده می شوند تقسیم شده و سپس در سراسر گره های خوشه توزیع می شود. كه برای كاهش هزینه های جستجو و افزایش كارایی اندازه ان از اندازه استاندارد بیشتر است. این سیستم برای افزایش قابلیت اعتماد، داده ها را در میزبان های مختلفی تکثیر می كند و به همین دلیل به قابلیت RAID روی میزبان ها احتیاجی ندارد. با مقدار پیشفرض تکثیر، داده ها روی سه نود ذخیره می شوند كه از ای سه نود، دو نود در یک رک و یکی در رک دیگری واقع شده است . و همچنین برای افزایش سرعت دسترسی در این سیستم فایل از نزدیک ترین كپی در رک مشابه استفاده م یشود. به دلیل اینکه در این سیستم فایل عملیات نوشت هزینه بر است تنها برای خواندن و یا افزودن قابل دسترسی است
: Hadoop
هادوپ یک فریم ورک نرم افزاری است كه كاربردهای توزیع شده با داده های فراوان را تحت یک مجوز ازاد، پشتیبانی میكند. این فریم ورک به برنامه ها امکان می دهد كه با هزاران نود و داده هایی در اندازه های پتابایت كار كنند. هادوپ از مقالات مرتبط با سیستمMap Reduceگوگل و همچنین سیستم فایل ان ، (GFSالهام گرفته است
فصل دوم – دسته بندی مدل های داده ای NOSQL
به لحاظ ساختار و مدل میتوان NOSQL را به چهار دسته تقسیمبندی كرد. جدول (1) نشان میدهد كه از چه ساختاری برای مدل كردن دادهها استفاده شده است.
توجه:
- برای دانلود فایل word کامل ترجمه از گزینه افزودن به سبد خرید بالا استفاده فرمایید.
- لینک دانلود فایل بلافاصله پس از خرید بصورت اتوماتیک برای شما ایمیل می گردد.
به منظور سفارش تحقیق مرتبط با رشته تخصصی خود بر روی کلید زیر کلیک نمایید.
سفارش تحقیق
دیدگاهها
هیچ دیدگاهی برای این محصول نوشته نشده است.