ظهر دیتابیس‌های مبتنی بر جی پی یو

چیزی که در این سال ها بسیار بی سر و صدا در دنیای کامپیوتر جلو اومد و کم کم گستره اش رو به بخش های مختلف تحمیل کرد، جی پی یو بود. الان حتی سرویس دهنده های کلاود دارن سرویس های جی پی یو ارائه می دن و حالا حتی به نظر می رسه در دنیای دیتابیس هم وارد شدن. مزیت اصلی جی پی یو در مقایسه با سی پی یوهای سنتی وقتی ظاهر می شه که بخواین کارهای تکراری رو روی حجم عظیمی داده انجام بدین. جی پی یو ها می تونن هزارها هسته داشته باشن و پهنای باند زیاد روی هر کور پس در جاهای مختلف گزینه های برنده شدن از جمله توی یادگیری ماشین و ماین کردن بیت کوین.

ولی دیتابیس چی؟ توی کاربردهای جدید خیلی از دیتاهای ما نیاز به پروسس شدنی بیشتر از قبل دارن. مثلا فرض کنین من یک استوریج هدوپ دارم که اطلاعاتی رو نگهداری میکنه که در هر بار درخواست باید پردازش بشن. نمونه واقعی سیستم پست آمریکا است که با داشتن ۱۵۴ میلیون آدرس و تقریبا ۲۰۰هزار مسیر پست لازمه در هر لحظه بتونه مکان هر پستچی رو حساب کنه. چنین کاری اول نیازمند دریافت کلی اطلاعات است و بعد پروسس اون اما چی می شه اگر یک دیتابیس مبتنی بر جی پی یو دیتا در همون سری ای که بازیابی می شه، پروسس هم بشه و سیستم پست بتونه برای هر بسته زمان تقریبی دریافت رو اعلام کنه؟ این مساله واقعا عملیاتی شده و داره کار میکنه. نمونه های دیگه بانک ها هستن و سکتورهای اقتصادی ای که اطلاعات زیادی رو ذخیره و دائما پردازش می کنن و سوییچ کردنشون به دیتابیس های جی پی یو، جواب خوبی داده.

پیاده سازی های فعلی اکثرا مبتنی بر دیتابیس های کلاسیکی هستن که کنارشون جی پی یوهایی هست برای پروسس اطلاعات ولی حدس زده می شه اینها به هم نزدیکتر بشن و سیستم هایی داشته باشیم که خود دیتابیس مسوولیت پروسس دیتا رو هم بر عهده بگیره.