23 إيجابيات وسلبيات Amazon Redshift

Amazon Redshift هي خدمة تخزين بيانات بحجم بيتابايت موجودة في السحابة تتم إدارتها بالكامل من أجلك. إنها توفر لك الفرصة للبدء بعدة مئات من الجيجابايت من البيانات ثم توسيع نطاق عملك حسب الحاجة. يمكّنك هذا الهيكل من اكتساب رؤى جديدة من خلال الحصول على بيانات حول عملائك وفرص العمل والاحتياجات اليومية الأخرى.

ابدأ بهذه الفرصة من خلال إطلاق مجموعة من العقد. تُعرف هذه باسم “مجموعة Amazon Redshift.” بعد توفير الكتلة ، يمكن تحميل بياناتك. من هناك ، يمكنك تشغيل استعلامات التحليل في حزمة المعلومات الخاصة بك. يستخدم نفس الأدوات المستندة إلى SQL التي تستخدمها معظم الشركات للاحتياجات الداخلية ، مما يجعل الوصول إلى بياناتك أسرع وأكثر أمانًا لأنك لست مضطرًا لاستضافتها في موقعك الفعلي.

في وقت كتابة هذا التقرير ، تقدم Amazon لجميع مستخدمي Redshift الجدد نسخة تجريبية مجانية لمدة شهرين من خدمة تخزين البيانات هذه لمعرفة ما إذا كانت تلبي احتياجاتهم. إذا بدأت صغيرة ، يبدأ السعر بعد الإصدار التجريبي المجاني من 0.25 دولارًا أمريكيًا فقط للساعة ، وينخفض ​​إلى 250 دولارًا فقط سنويًا لكل تيرابايت تخزنه. وهذا يجعله حوالي 10٪ من تكلفة حل مماثل.

إذا كنت تبحث عن حلول تخزين بيانات سريعة وقابلة للتطوير اليوم ، فإليك إيجابيات وسلبيات Amazon Redshift التي يجب مراعاتها.

قائمة مزايا Amazon Redshift

1. هو واحد من أسرع الحلول من نوعها المتاحة اليوم.

عندما يتعلق الأمر بتحميل بياناتك أو الاستعلام عنها لأغراض التحليل أو إعداد التقارير ، فهناك عدد أقل من المنافسين الذين يمكنهم مطابقة ما يقدمه Redshift. يستخدم بنية MPP (معالجة متوازية ضخمة) لتحميل بياناتك بسرعات لن تصدقها. كما أنه سيوازي ويوزع استفساراتك عبر ملاحظات متعددة للوصول السريع عند الحاجة. لديك أيضًا خيار مع هذه الخدمة لاستخدام مخازن البيانات المستندة إلى SSD ، مما يجعل من الممكن تشغيل استعلام معقد دون التزام وقت طويل.

2. الحصول على حل مستودع عالي الأداء.

يتيح لك تصميم Redshift الاستفادة من التوازي في عمليات النسخ الاحتياطي والاستعادة ، بالإضافة إلى متطلبات تحميل البيانات لديك. يوفر لك هذا الهيكل معدلات ضغط بيانات فعالة ، مما يسمح لك بتحسين استفساراتك وتوزيعك بالكامل ، بغض النظر عن كمية البيانات التي تخزنها. أصبحت هذه الفوائد ممكنة من خلال قاعدة بيانات التخزين العمودي التي يتم تقديمها لك ، والتي تم تحسينها للبيانات المتكررة. يتم تقليل عمليات الإدخال / الإخراج على القرص ، مما يؤدي إلى تحسين أدائه نتيجة لذلك.

3. الحصول على حق الوصول إلى عملية التعلم الآلي.

يستخدم Redshift التعلم الآلي لضمان حصولك على الحد الأقصى بناءً على أعباء العمل لديك. يقوم بذلك عن طريق استخدام خوارزميات معقدة تتنبأ بأوقات تنفيذ الاستعلامات الواردة. ثم تقوم بتعيينها إلى أي قائمة انتظار تعمل على تحسين سرعة المعالجة لك. وهذا يعني أن تقاريرك أو استعلامات لوحة المعلومات تمر عبر قائمة انتظار سريعة بدلاً من هيكل توجيه قياسي ، مما يؤدي إلى تحسين سرعة المعالجة لتقديم نتائج فورية.

4. يقدم نتائج التخزين المؤقت.

يستخدم Redshift أيضًا التخزين المؤقت للنتائج لتوفير وقت استجابة أقل من ثانية واحدة عندما تكون هناك استعلامات متكررة. ستتلقى أدوات ذكاء الأعمال المرئية ولوحات المعلومات التي تقوم بتشغيل استعلامات متكررة تعزيزًا كبيرًا في الأداء بسبب هذا الهيكل. يبحث في ذاكرة التخزين المؤقت لتحديد ما إذا كان التشغيل السابق قد أدى إلى إنشاء نتيجة مخزنة مؤقتًا. إذا كان هناك واحد ولم تتغير البيانات ، فسترى النتيجة المخزنة مؤقتًا بدلاً من إعادة تشغيل الاستعلام.

5. ستجد أنه سهل التنفيذ للغاية.

يعد Amazon Redshift أحد أسهل حلول تخزين البيانات المتاحة اليوم للتهيئة والتشغيل من منظور الأعمال. كل ما عليك فعله هو تسجيل الدخول إلى وحدة تحكم AWS الخاصة بك ثم اتباع الأوامر الموجودة لنشر مستودع البيانات الجديد الخاص بك. سيقوم تلقائيًا بتوفير البنية التحتية الخاصة بك في هذه المرحلة. يتم أيضًا أتمتة العديد من المهام الإدارية ، بما في ذلك النسخ المتماثل والنسخ الاحتياطي ، مما يعني أنه يمكنك التركيز على بياناتك بدلاً من إدارتها. يمكنك أيضًا إجراء تعديلات لتناسب أعباء عمل محددة.

6. يتكامل مع أدوات الطرف الثالث.

يمكنك اختيار تحسين تفاعلاتك مع Redshift من خلال العمل مع قائمة واسعة من البائعين الخارجيين الذين يساعدون في تحويل وتصور بياناتك. هناك شركاء ذكاء الأعمال وخبراء في تكامل البيانات واستشارات ومساعدة تكامل الأنظمة والاستعلام وفرص نمذجة البيانات ، وكل ذلك مع حلول معتمدة مضمونة للعمل مع Amazon.

7. سوف تكتشف أنه حل مربح لعملك.

إذا كنت تريد أن تبدأ صغيرًا ، فيمكنك الاستفادة من معدل عدم الالتزام البالغ 0.25 دولارًا في الساعة. Redshift هو المزود الوحيد من نوعه الذي يقدم أسعارًا عند الطلب بدون تكاليف مسبقة. ومع ذلك ، إذا التزمت بفترة 3 سنوات ، فيمكنك توفير ما يصل إلى 75٪ من احتياجات تخزين البيانات المستندة إلى مجموعة النظراء. يعتمد السعر بالساعة على عدد العقد ونوعها في مجموعتك. حتى مع التخزين الكثيف ، فإن التكلفة القصوى لمنتجات الجيل الحالي تبلغ حوالي 7 دولارات للساعة.

8. يمكنك اختيار نوع العقدة عند العمل مع Amazon Redshift.

هناك نوعان من العقد المتاحة لتحسين احتياجات تخزين البيانات الخاصة بك إذا اخترت Amazon Redshift. يتيح لك الخيار الأول ، المسمى Dense Compute ، إنشاء حل عالي الأداء لوحدات المعالجة المركزية السريعة ، ومحركات الأقراص ذات الحالة الصلبة ، والكميات الكبيرة من الذاكرة. يمكنك التوسع بشكل أكبر لاستخدام عقد التخزين الكثيف التي توفر محرك أقراص ثابتة أكبر (HDD) بأسعار أقل. إذا كنت ترغب في التبديل بين العقد أو توسيع نطاق المجموعة الخاصة بك ، فإن استدعاء API واحد أو بضع نقرات من وحدة التحكم الخاصة بك هو كل ما يتطلبه الأمر لإنجاز المهمة.

9. يوفر نسخة احتياطية متسقة من البيانات الخاصة بك.

يوفر Amazon Redshift نسخة احتياطية متسقة من بياناتك وملفاتك. كما أنه يتعافى منها عند حدوث عطل أو تلف. تتضمن المهام الفرعية المتاحة لك في هذا المجال المساعدة في استعادة البيانات بشكل مستمر وتلقائي ، حتى في حالة فشل محرك أقراص أو عقدة. إنها تساعد في النسخ الاحتياطي للتعافي من الكوارث للحد من مقدار فقد البيانات الذي تواجهه. تحدث استعادة البيانات أيضًا من مناطق مختلفة ، اعتمادًا على كيفية إعداد حسابك. تنطبق هذه المزايا حتى إذا تجاوزت أول بيرابايت تخزنه في السحابة باستخدام هذه الخدمة.

10. احصل على التشفير من طرف إلى طرف مع Amazon Redshift.

كل ما عليك القيام به هو تكوين خاصية تكوين المعلمة الخاصة بك لاستخدام SSL لتحسين أمان البيانات أثناء النقل. يستخدم نظام تخزين البيانات هذا أيضًا التشفير المعجل للأجهزة AES-256 لبياناتك عندما تكون في حالة سكون. عند تحديد التشفير لبياناتك في حالة السكون ، فإن كل ما تتم كتابته على القرص ، بما في ذلك أي نسخ احتياطية قد تكون لديك ، يتلقى ميزة التشفير هذه. يتعامل Redshift مع إدارة المفاتيح افتراضيًا.

11. يوفر عزل الشبكة.

يمنحك اختيار Amazon Redshift ميزة تكوين قواعد جدار الحماية للتحكم في وصول الشبكة إلى المجموعات التي يتألف منها مخزن البيانات الخاص بك. يمكنك تشغيل Redshift داخل Amazon VPC لعزل مجموعاتك من خلال شبكتك الافتراضية الخاصة. يمكنك بعد ذلك توصيل هذا بالبنية الأساسية الحالية لتكنولوجيا المعلومات إذا كنت ترغب في استخدام IPsec VPN مشفر لزيادة الوصول المستمر إلى البيانات.

12. يمكنك تدقيق جميع استدعاءات API الخاصة بك من خلال Redshift.

نظرًا لأن Amazon Redshift يتكامل مع CloudTrail ، يمكنك تدقيق جميع استدعاءات واجهة برمجة التطبيقات التي يتم إجراؤها من خلال النظام. يسجل جميع عمليات SQL الخاصة بك ، بما في ذلك الاستعلامات وتغييرات قاعدة البيانات ومحاولات الاتصال. يمكنك بعد ذلك الوصول إلى المعلومات باستخدام استعلامات SQL مقابل جداول النظام أو اختيار تنزيلها على Amazon S3 في مكان آمن. يتوافق النظام مع SOC1 و SOC2 و SOC3. كما أنه يفي بمتطلبات PCI DSS Level 1.

13. يتكامل أصلاً مع نظام تحليلات AWS البيئي.

عندما تختار Amazon Redshift لاحتياجات تخزين البيانات الخاصة بك ، ستجد أنها تتكامل تمامًا مع نظام تحليلات AWS.

• يمكنك استخدام AWS Glue لاستخراج البيانات وتحويلها وتحميلها إلى Redshift.

• التقاط وتحويل وتحميل البيانات المتدفقة إلى Redshift باستخدام Amazon Kinesis Data Firehose لتحليلات في الوقت الفعلي تقريبًا.

• إنشاء لوحات معلومات ، وتصورات ، وتقارير من خلال Amazon QuickSight.

يمكنك حتى استخدام AWS Database Migration Service إذا كنت ترغب في تحسين سرعة نقل البيانات إلى Redshift من خلال إصدار تجريبي مجاني لمدة 6 أشهر من خدمة DMS الخاصة بهم.

14. يمكنك الوصول إلى عدد كبير من المواد التدريبية لـ Amazon Redshift.

إذا قمت بالوصول إلى صفحة مستندات Amazon Redshift ، فستجد مجموعة متنوعة من الموارد المتاحة لك كمستخدم جديد. هناك نظرة عامة كاملة حول كيفية إدارة النظام عندما يكون لديك احتياجات لتخزين البيانات. لديك حق الوصول إلى دليل “البدء” الذي يرشدك خلال جميع الخطوات المطلوبة لإنشاء مجموعات وجداول قاعدة بيانات واستعلامات اختبار. سيوضح لك دليل إدارة المجموعة كيفية إدارة المجموعات الخاصة بك بشكل صحيح ، بينما يوفر دليل مطور قواعد البيانات تفسيرات حول كيفية إنشاء المعلومات التي تشكل أساس مستودع البيانات الخاص بك وتصميمها والاستعلام عنها والمحافظة عليها.

قائمة عيوب Amazon Redshift

1. يتطلب منك فرض التفرد من جانبك.

في الوقت الحالي ، لا يوجد إطار عمل متاح في وقت كتابة هذا التقرير يسمح لـ Amazon Redshift بمساعدتك في الحفاظ على تكامل البيانات باستخدام فهارس فريدة. أنت مسؤول عن هذا الهيكل في نهاية عملية تخزين البيانات. هذا يعني أنه لا توجد عمليات تدقيق للقيم في التعبيرات أو الأعمدة لتحديد ما إذا كان مفتاح الفهرس قد تم اختراقه بأي شكل من الأشكال.

قيود “الاختيار” و “الفريدة” غير مدعومة بسبب هذه البنية. هذا يعني أنه لا يمكن الإعلان عنها ، مما يخلق بعض القيود على بعض الوكالات.

2. مدعوم فقط للتحميل المتوازي ببيانات محددة.

يتم دعم التحميل الموازي لـ DynamoDB و SE و Amazon EMR عندما تختار Redshift كحل لتخزين البيانات المستند إلى السحابة. تستخدم هذه الهياكل MPP الذي يمنحك السرعات العالية اللازمة لاستفساراتك. ومع ذلك ، إذا كان لديك مصدر آخر لبياناتك ، فإن هذه الميزة غير مدعومة على الإطلاق. يجب أن تستخدم إدخالات أو نصوص JDBC لتحميل البيانات في Redshift. سيكون خيارك الآخر هو استخدام حل ETL الذي يقوم بتحميل بياناتك في المستودع من مصدر مختلف.

3. يجب أن تفهم مفاتيح التوزيع والتصنيف.

ستحدد مفاتيح التوزيع والفرز كيفية فهرسة بياناتك وتخزينها عندما تختار Redshift لاحتياجات تخزين البيانات الخاصة بك. تنطبق هذه العملية على جميع العقد. هذا يعني أنه يجب أن يكون لديك فهم قوي للمفاهيم الكامنة وراء هذه المفاتيح ، بما في ذلك معرفة كيفية تكوينها بشكل صحيح في الجداول الخاصة بك لإنشاء الأداء الأمثل الذي تريده من خلال هذا الحل.

يمكن أن يكون هناك مفتاح توزيع واحد فقط لكل جدول. لا يمكنك تغييره لاحقًا ، مما يعني أنه يتعين عليك توقع أعباء العمل المستقبلية قبل اتخاذ قرار. يمكن أيضًا الإعلان عن المفاتيح الأساسية ، ولكن لا يتم فرضها.

4. لا يعمل كقاعدة بيانات تطبيق حية.

ستجد أن Amazon Redshift يقوم بعمل ممتاز في تشغيل الاستعلامات بكمية كبيرة من البيانات ، وتشغيل التقارير ، والتعامل مع التحليلات ، وما شابه ، لكنه لا يزال غير حل إذا كنت تحاول تشغيل تطبيقات ويب مباشرة. ستحتاج إلى إدخال البيانات في طبقة التخزين المؤقت أو اختيار مثيل Postgres ، إذا كنت تقدم البيانات من Redshift إلى أي تطبيق ويب.

خلال فرصة تدريب Redshift ، أجرى Lars Kamp استطلاعًا للحضور حول المشكلات التي واجهوها مع هذا الحل. أفاد 91٪ أن استفساراتهم كانت بطيئة للغاية. قال 64٪ أن مجالسهم كانت بطيئة أيضًا. قال 55٪ أنه كان من الصعب فهم ما كان يحدث مع قاعدة البيانات. يستغرق الأمر وقتًا لإيجاد حلول لهذه المشكلات لجعل Redshift الأداة القوية التي يمكن أن تكون.

5. أنت تضع بياناتك في نظام قائم على السحابة.

هناك مزايا وعيوب فريدة يجب مراعاتها عند تشغيل الأنظمة المستندة إلى مجموعة النظراء. في حين أن وجود طرف ثالث يدير بياناتك خارج الموقع قد يزيد من مخاوف الأمان المادي ، فإنك تضع أيضًا أمان بياناتك في أيدي شخص آخر.

قد يكون لدى بعض الشركات مخاوف تتعلق بالخصوصية عند استخدام Redshift نظرًا لقيمة ملكيتها الفكرية. لديك أيضًا مشكلات في الاتصال يجب التفكير فيها ، نظرًا لأن عدم الوصول إلى مزود خدمة الإنترنت يحد من قدرتك على الوصول إلى هذه الخدمات. هناك أيضًا احتمال انقطاع التيار ، مما يعني أن أي فشل سيكون علنيًا.

6. لقد تأخرت قليلاً في إعداد Postgre الخاص بك.

يعتمد إطار عمل Amazon Redshift على PostgreSQL 8.0.2. هذه النسخة عمرها أكثر من عقد في الوقت الحالي. لقد شهد تحسينات ملحوظة في مناطق متعددة منذ ذلك الحين ، لكن هذه الميزات غير متوفرة حاليًا إذا اخترت حل تخزين البيانات هذا. ستجد أن العديد من الميزات الأساسية التي تتوقعها مع SQL المحدث غير متوفرة من خلال هذا النظام.

7. يجب عليك إدارة تكاليف تكامل البيانات وترحيلها.

نظرًا لأنك تعمل مع حل تخزين بيانات على مستوى perabyte ، يجب مراعاة النطاق الترددي الذي ستحتاجه لنقل هذه البيانات أثناء المراحل الأولية لهذا المشروع. يجب أن ترسل أنظمتك الداخلية المعلومات إلى نظام Redshift المستند إلى السحابة أو إرسالها عبر محركات أقراص USB إلى AWS من المرسل المفضل لديك. إذا كنت شركة صغيرة لا تزال تعمل باستخدام بيانات محدودة ، فقد لا تتمكن من إرسال جميع بياناتك للتخزين.

8. لا توجد إجراءات مخزنة متاحة لك في Amazon Redshift.

عندما تقرر استخدام Redshift لاحتياجات تخزين البيانات الخاصة بك ، فستحتاج إلى تحليل ملفات SQL النصية وتشغيلها بعبارة واحدة في كل مرة. هذا لأنه لا توجد إجراءات مخزنة متاحة لك. يقوم بفحص الصفوف المتأثرة وحسابها ، ثم يقوم بتشغيل استعلام ارتباط معقد مقابل بعض طرق العرض أو الجداول على نظامك لإنشاء النتائج الضرورية. ما لم تكن معتادًا على أنظمة إدارة قواعد البيانات ، سيكون منحنى التعلم لهذه العمليات مرتفعًا جدًا بالنسبة للشخص العادي.

9. انخفاض مستويات أدائهم مع زيادة المجموعات.

إذا كنت ترغب في تحقيق نتائج متسقة عند استخدام Amazon Redshift ، فيجب عليك الاحتفاظ بمجموعاتك أقل من 75٪ للحصول على أفضل النتائج. إذا تركت المجموعات مثقلة بطلبات بحث متعددة ، فستبدأ في مواجهة مشكلات في الأداء أيضًا. ابذل قصارى جهدك لتقتصر على 10 استفسارات متزامنة أو أقل عند العمل باستخدام حل تخزين البيانات هذا. ستحتاج إلى إجراء عمليات الصيانة أو الأحمال الثقيلة خلال فترات الهدوء ، والتي قد تقع خارج الإطار الزمني الذي تتخيله لهذه العملية.

إذا كنت تبحث عن حل تخزين بيانات فعال وبأسعار معقولة ، فمن الضروري مراجعة إيجابيات وسلبيات Amazon Redshift. هناك بعض القيود على هذه الخدمة ، لكنك ستجد أيضًا أنها تسبق بعض المنافسين بسنوات ضوئية ، مثل Snowflake. يستغرق التعلم بعض الوقت ، خاصة إذا كنت بحاجة إلى نصوص مخصصة للوصول إلى البيانات في الوقت الفعلي ، على الرغم من أن معظم الوكالات التي تستخدم هذه الخدمة تجد أن دقتها واتساقها وقابليتها للتوسع هي بالضبط ما تحتاجه لتحقيق نجاح أكبر.