كيفية تصميم رقائق GPU
Chapter 9 Power Energy and Thermal Management

الفصل 9: القوة والطاقة وإدارة الحرارة

مع تطور وحدات معالجة الرسومات (GPU) لتصبح مسرعات قابلة للبرمجة والتوازي العالي القدرة على تقديم معدل أداء حسابي هائل، أصبحت إدارة استهلاك الطاقة وانبعاث الحرارة أمرًا متزايد الأهمية. لا يؤدي استهلاك الطاقة المرتفع فقط إلى زيادة تكاليف الطاقة وانخفاض عمر البطارية في الأجهزة المحمولة، ولكن يتطلب أيضًا حلول تبريد متقدمة وتقنيات تغليف لضمان التشغيل الموثوق. في هذا الفصل، سنستكشف مصادر استهلاك الطاقة في وحدات معالجة الرسومات (GPU)، وتقنيات إيقاف الساعة والطاقة، والتعديل الديناميكي للجهد والتردد (DVFS)، وأساليب التبريد المختلفة وأساليب التغليف لوحدات معالجة الرسومات (GPU).

مصادر استهلاك الطاقة في وحدات معالجة الرسومات (GPU)

من أجل إدارة استهلاك الطاقة في وحدات معالجة الرسومات (GPU) بفعالية، من الضروري فهم المصادر الرئيسية للتبديد الحراري. يمكن تصنيف استهلاك الطاقة في وحدات معالجة الرسومات (GPU) بشكل عام إلى طاقة ديناميكية وطاقة ساكنة.

الطاقة الديناميكية

الطاقة الديناميكية هي الطاقة المستهلكة من قبل وحدة معالجة الرسومات (GPU) عندما تكون نشطة في معالجة البيانات وتنفيذ التعليمات. ويمكن التعبير عن استهلاك الطاقة الديناميكية لوحدة معالجة الرسومات (GPU) باستخدام المعادلة التالية:

P_dynamic = α * C * V^2 * f

حيث:

  • α هو عامل النشاط، الذي يمثل نسبة المحولات التي يتم تبديلها
  • C هي السعة الإجمالية للمحولات المتبدلة
  • V هو جهد الإمداد
  • f هو التردد التشغيلي

من هذه المعادلة، يمكننا أن نرى أن استهلاك الطاقة الديناميكية متناسب مع مربع جهد الإمداد وطرديًا مع التردد التشغيلي. لذلك، فإن تقليل الجهد أو التردد يمكن أن يؤدي إلى انخفاضات كبيرة في استهلاك الطاقة الديناميكية.

يعتمد عامل النشاط α على الحمل المحدد الذي يتم تنفيذه والاستخدام المتزايد لمكونات وحدة معالجة الرسومات (GPU) المختلفة. على سبيل المثال، ستكون لحمل حسابي مكثف يبقي أنوية وحدة معالجة الرسومات (GPU) مشغولة عامل نشاط أعلى مقارنة بحمل مرتبط بالذاكرة والذي يقضي المزيد من الوقت في الانتظار.### الطاقة الثابتة

الطاقة الثابتة، والتي تُعرف أيضًا باسم طاقة التسرب، هي الطاقة التي تستهلكها وحدة المعالجة المركزية (GPU) حتى عندما تكون في حالة خمول ولا تعالج البيانات بنشاط. وترجع الطاقة الثابتة بشكل رئيسي إلى تيارات التسرب في الترانزستورات، وتصبح مكونًا متزايد الأهمية من إجمالي استهلاك الطاقة مع استمرار تقلص حجم الترانزستورات.

ويمكن التعبير عن استهلاك الطاقة الثابتة باستخدام المعادلة التالية:

P_static = I_leakage * V

حيث:

  • I_leakage هو إجمالي تيار التسرب
  • V هو الجهد التغذية

ويتأثر تيار التسرب بعوامل مثل حجم الترانزستور وجهد العتبة والحرارة. وكلما أصبحت الترانزستورات أصغر، زاد تيار التسرب، مما أدى إلى زيادة استهلاك الطاقة الثابتة. وأيضًا، تؤدي درجات الحرارة الأعلى إلى زيادة تيار التسرب، مما ينشئ حلقة تغذية موجبة قد تؤدي إلى الانهيار الحراري إذا لم يتم إدارتها بشكل صحيح.

ويوضح الشكل 9.1 تفكيك استهلاك الطاقة الديناميكية والطاقة الثابتة في وحدة المعالجة المركزية (GPU) النموذجية.

        الطاقة الديناميكية (70%)
       /                  \
      /                    \
     /                      \
    /                        \
   /                          \
  /                            \
 /                              \
/                                \
|----------------------------------|
|                                  |
|         الطاقة الثابتة (30%)      |
|                                  |
|----------------------------------|

الشكل 9.1: تفكيك استهلاك الطاقة الديناميكية والطاقة الثابتة في وحدة المعالجة المركزية (GPU) النموذجية.

تقنيات إيقاف الساعة وإيقاف الطاقة

إيقاف الساعة وإيقاف الطاقة هما تقنيتان واسعتا الاستخدام لخفض استهلاك الطاقة في وحدات المعالجة المركزية (GPUs) من خلال تعطيل المكونات غير المستخدمة أو الخاملة بشكل انتقائي.

إيقاف الساعة

إيقاف الساعة هي تقنية تعطل إشارة الساعة لمكون أو وحدة وظيفية محددة عندما لا تكون قيد الاستخدام. وبمنع إشارة الساعة من الوصول إلى المكونات الخاملة، يؤدي إيقاف الساعة إلى القضاء على الطاقة الديناميكيةهذا هو الترجمة إلى العربية للملف المقدم:

استهلاك الطاقة المرتبط بالتبديل غير الضروري للترانزستور.

الشكل 9.2 يوضح مفهوم تفعيل الساعة.

           ساعة
             |
             |
             |
             |
             |
         تفعيل الساعة
         إشارة تمكين
             |
             |
             |
             |
             |
        +---------+
        |         |
        |  متفعل  |
        |  ساعة   |
        |         |
        +---------+
             |
             |
             |
             |
        الوحدة الوظيفية

الشكل 9.2: مفهوم تفعيل الساعة.

في هذا المثال، يتم تفعيل إشارة الساعة بواسطة إشارة التمكين، والتي يتم التحكم فيها بواسطة وحدة إدارة الطاقة في وحدة معالجة الرسومات. عندما لا تكون الوحدة الوظيفية مطلوبة، يتم إلغاء تفعيل إشارة التمكين، مما يمنع إشارة الساعة من الوصول إلى الوحدة الوظيفية ويلغي استهلاك الطاقة الديناميكي لها.

يمكن تطبيق تفعيل الساعة بدرجات مختلفة، تتراوح من الوحدات الوظيفية الفردية إلى أنوية وحدة معالجة الرسومات بأكملها أو حتى أنظمة فرعية أكبر. يوفر تفعيل الساعة بدقة عالية تحكمًا أكثر دقة في استهلاك الطاقة ولكن يتطلب منطق تحكم أكثر تعقيدًا وقد يؤدي إلى تكاليف إضافية. من ناحية أخرى، فإن تفعيل الساعة بشكل خشن أكثر سهولة في التنفيذ ولكن قد ينتج عنه توفير للطاقة أقل الأمثل.

تفعيل الطاقة

تفعيل الطاقة هي تقنية تقوم بفصل إمداد الطاقة عن مكون أو وحدة وظيفية محددة عندما لا يكون في استخدام. عن طريق قطع إمداد الطاقة، يلغي تفعيل الطاقة كل من استهلاك الطاقة الديناميكي والساكن المرتبط بالمكون.

الشكل 9.3 يوضح مفهوم تفعيل الطاقة.

           إمداد الطاقة
                |
                |
            مفتاح الطاقة
                |
                |
        +--------------+
        |              |
        |  الوحدة     |
        |  الوظيفية   |
        |              |
        +--------------+

الشكل 9.3: مفهوم تفعيل الطاقة.

في هذا المثال، يتم استخدام مفتاح الطاقة لهنا الترجمة إلى اللغة العربية للملف المذكور:

تتم إزالة الطاقة من الوحدة الوظيفية عند عدم الحاجة إليها، حيث يتم إيقاف مفتاح الطاقة مما يؤدي إلى فصل إمداد الطاقة عن الوحدة الوظيفية تمامًا، وبالتالي القضاء على استهلاك الطاقة الديناميكي والساكن.

يمكن تطبيق إغلاق الطاقة على مستويات مختلفة، بدءًا من الوحدات الوظيفية الفردية إلى أنوية وحدة المعالجة الرسومية بأكملها أو حتى أنظمة فرعية أكبر. يوفر إغلاق الطاقة الدقيق تحكمًا أكثر دقة في استهلاك الطاقة ولكن يتطلب منطق تحكم أكثر تعقيدًا وقد يؤدي إلى تكاليف إضافية. من ناحية أخرى، فإن إغلاق الطاقة الخشن أبسط من حيث التنفيذ ولكن قد ينتج عنه توفير طاقة أقل من الأمثل.

تتطلب تنفيذ إغلاق الطاقة مراعاة اعتبارات تصميم دقيقة، مثل:

١. منطق التحكم في إغلاق الطاقة: هناك حاجة إلى دوائر إلكترونية لتحديد متى يتم تشغيل وإيقاف إغلاق الطاقة بناءً على نشاط الوحدة الوظيفية. يجب أن يقلل هذا منطق التحكم من التأثير على الأداء.

٢. الاحتفاظ بالحالة: عندما يتم إغلاق الطاقة عن وحدة وظيفية، يتم فقد حالتها الداخلية (مثل قيم السجلات). إذا كان من الضروري الحفاظ على الحالة عبر دورات إغلاق الطاقة، فسيكون هناك حاجة إلى آليات إضافية للاحتفاظ بالحالة، مثل السجلات الظلية أو الذاكرة.

٣. تكلفة إغلاق الطاقة: يؤدي تشغيل وإيقاف إغلاق الطاقة إلى تأخير وتكاليف طاقة معينة. يجب تقليل هذه التكلفة لضمان تفوق فوائد إغلاق الطاقة على التكاليف.

٤. تقسيم مجال الطاقة: يجب تقسيم معمارية وحدة المعالجة الرسومية إلى مجالات طاقة مناسبة، كل منها له إغلاق طاقة منفصل، لتحقيق أقصى توفير في الطاقة مع الحد من تأثيرها على الأداء.

مثال: إغلاق الطاقة لوحدات التنفيذ في معمارية Fermi من NVIDIA في معمارية Fermi من NVIDIA، يحتوي كل محول بث متعدد (SM) على 32 نواة CUDA، منظمة في مجموعتين من 16 نواة لكل منهما. عندما تقوم وحدة المعالجة الرسومية بتنفيذ حمل عمل بتوازٍ محدود، قد لا تحتاج إلى جميع 32 نواة CUDA في كل SM لتكون نشطةتحويل الملف بتنسيق markdown إلى اللغة العربية مع الإحفاظ على التعليقات للشيفرة البرمجية:

ه. في هذه الحالة، يمكن لهندسة Fermi تشغيل بوابة مجموعة واحدة من 16 نواة CUDA لتقليل استهلاك الطاقة.

الشكل 9.4 يوضح تشغيل بوابة الطاقة لوحدات التنفيذ في وحدة معالجة الرسومات (SM) من Fermi.

                 SM
        +-----------------+
        |                 |
        |   CUDA Cores    |
        |   (المجموعة 1)  |
        |                 |
        |   مفتاح الطاقة  |
        |                 |
        |   CUDA Cores    |
        |   (المجموعة 2)  |
        |                 |
        +-----------------+

الشكل 9.4: تشغيل بوابة الطاقة لوحدات التنفيذ في وحدة معالجة الرسومات (SM) من Fermi.

عندما لا تتطلب الحمولة جميع 32 نواة CUDA، يمكن إيقاف تشغيل مفتاح الطاقة، وتشغيل بوابة الطاقة للمجموعة الثانية من 16 نواة CUDA، مما يقلل من استهلاك طاقة وحدة معالجة الرسومات (SM).

التحكم الديناميكي في الجهد والتردد (DVFS)

التحكم الديناميكي في الجهد والتردد (DVFS) هو تقنية تضبط ديناميكيًا الجهد والتردد لوحدة معالجة الرسومات بناءً على حمل العمل الحالي ومتطلبات الأداء. من خلال تقليل الجهد والتردد خلال فترات انخفاض الاستخدام، يمكن أن يؤدي DVFS إلى تقليل استهلاك الطاقة بشكل كبير دون التأثير كثيرًا على الأداء.

يتناسب استهلاك الطاقة لوحدة معالجة الرسومات بشكل مربع مع الجهد وبشكل خطي مع التردد، كما هو موضح في معادلة الطاقة الديناميكية:

P_dynamic = α * C * V^2 * f

حيث:

  • α هو عامل النشاط
  • C هي السعة
  • V هو الجهد
  • f هو التردد

من خلال تقليل الجهد والتردد، يمكن لـ DVFS تحقيق انخفاض مكعبي في استهلاك الطاقة الديناميكية.

يتم تنفيذ DVFS باستخدام مزيج من تقنيات الأجهزة والبرامج:

  1. مجالات الجهد والتردد: يتم تقسيم وحدة معالجة الرسومات إلى العديد من مجالات الجهد والتردد المستقلة، والتي يمكن التحكم بها بشكل مستقل. هذا يسمح بالتحكم الدقيق في استهلاك الطاقة والأداء.

  2. مراقبة الأداء: يتم استخدام عدادات الأداء وأجهزة الاستشعار لمراقبة حمل العمل ودرجة حرارة وحدة معالجة الرسومات.هذه المعلومات تستخدم بواسطة منطق التحكم DVFS لاتخاذ قرارات حول متى وكيف يتم ضبط الجهد والتردد.

  3. منطق التحكم DVFS: يكون منطق التحكم البرمجي أو الأجهزة مسؤولاً عن تحديد إعدادات الجهد والتردد المناسبة بناءً على حمل العمل الحالي ومتطلبات الأداء. قد يستخدم هذا منطق التحكم خوارزميات مختلفة، مثل البحث في جدول أو التحكم بالتغذية المرتدة المغلقة، لاتخاذ قرارات DVFS.

  4. مسح الجهد والتردد: بمجرد أن يحدد منطق التحكم DVFS الجهد والتردد المستهدف، يتم ضبط منظم الجهد وموِّلد الساعة على الإعدادات الجديدة. قد يستغرق هذا العملية بضع دورات ساعة للإكتمال، والذي خلاله قد يحتاج معالج الرسومات إلى التعطيل أو العمل بمستوى أداء منخفض.

مثال: DVFS في معمارية Fermi من NVIDIA

تتضمن معمارية Fermi من NVIDIA وحدة تحكم DVFS بالأجهزة التي يمكنها ضبط الجهد والتردد لمعالج الرسومات بشكل ديناميكي بناءً على حمل العمل الحالي والظروف الحرارية. تدعم معمارية Fermi نطاقات جهد وتردد متعددة، مما يسمح بالتحكم المستقل في نواة معالج الرسومات والنظام الفرعي للذاكرة.

يوضح الشكل 9.5 نظام DVFS في معمارية Fermi.

        +--------------------+
        |                    |
        |   نطاق نواة معالج الرسومات |
        |                    |
        +--------------------+
                 |
                 |
        +--------------------+
        |                    |
        |  وحدة التحكم DVFS   |
        |                    |
        +--------------------+
                 |
                 |
        +--------------------+
        |                    |
        | نطاق الذاكرة       |
        |                    |
        +--------------------+

الشكل 9.5: نظام DVFS في معمارية Fermi.

تراقب وحدة التحكم DVFS حمل العمل والظروف الحرارية لمعالج الرسومات وتضبط إعدادات الجهد والتردد وفقًا لذلك. على سبيل المثال، إذا كان معالج الرسومات يعمل تحت حمل ثقيلهذا هو الترجمة العربية للملف:

عندما يتم تشغيل حمل حسابي مكثف والحرارة أقل من حد معين، قد يقوم مُتحكم DVFS بزيادة الجهد والتردد لتحسين الأداء. وعلى العكس، إذا كان الـ GPU خاملًا أو يُنفِّذ حمل عمل مرتبط بالذاكرة، فقد يقوم مُتحكم DVFS بخفض الجهد والتردد لتوفير الطاقة.

يمكن أن يقلل DVFS من استهلاك الطاقة للـ GPU بشكل كبير مع الحفاظ على أداء جيد. ومع ذلك، فهو أيضًا يُدخل بعض التحديات، مثل:

  1. زمن التأخير: إن تغيير إعدادات الجهد والتردد ينتج عنه بعض زمن التأخير، والذي خلاله قد يحتاج الـ GPU إلى التوقف أو التشغيل بمستوى أداء منخفض. ويجب تقليل هذا الزمن للتأكد من أن فوائد DVFS تفوق التكاليف.

  2. الاستقرار والموثوقية: إن تغيير الجهد والتردد يمكن أن يؤثر على استقرار وموثوقية الـ GPU. ويجب على مُتحكم DVFS التأكد من أن إعدادات الجهد والتردد ضمن نطاقات التشغيل الآمنة، وأن الانتقالات بين الإعدادات المختلفة تكون سلسة وخالية من الأخطاء.

  3. التفاعل مع تقنيات إدارة الطاقة الأخرى: قد يتفاعل DVFS مع تقنيات إدارة الطاقة الأخرى، مثل إغلاق الساعة وإغلاق الطاقة. ويجب على مُتحكم DVFS التنسيق مع هذه التقنيات الأخرى لضمان التوازن الأمثل بين الطاقة والأداء.

مثال: DVFS في GPU محمول

لاحظ GPU محمول يدعم ثلاث إعدادات للجهد والتردد:

  1. عالي: 1.0 فولت، 500 ميجاهرتز
  2. متوسط: 0.9 فولت، 400 ميجاهرتز
  3. منخفض: 0.8 فولت، 300 ميجاهرتز

وهذا الـ GPU يُنفِّذ لعبة تتبادل بين مراحل حسابية مكثفة ومراحل مرتبطة بالذاكرة. وأثناء المراحل الحسابية المكثفة، يقوم مُتحكم DVFS بضبط الـ GPU على الإعداد العالي لتحقيق أقصى أداء. وأثناء المراحل المرتبطة بالذاكرة، يقوم مُتحكم DVFS بخفض الجهد والتردد إلى الإعداد المتوسط لتوفير الطاقة دون التأثير بشكل كبير على الأداء.

وإذا تجاوزت درجة حرارة الـ GPU حداً معينًا، فقد يقوم مُتحكم DVFS بخفض الجهد والتردد إلى الإعداد المنخفض لتوفير المزيد من الطاقة.هنا الترجمة العربية للملف المرفق مع عدم ترجمة الشفرات البرمجية، وترجمة التعليقات فقط:

حلول تبريد بطاقة الرسومات والتغليف

مع تطور بطاقات الرسومات وزيادة كثافة الطاقة، أصبحت حلول التبريد الفعالة وتقنيات التغليف أمرًا بالغ الأهمية لضمان التشغيل الموثوق والأداء الأمثل. تم تصميم حلول التبريد لإزالة الحرارة من بطاقة الرسومات والحفاظ على درجة حرارة الشريحة ضمن الحدود الآمنة للتشغيل. تُستخدم تقنيات التغليف لتوفير واجهات حرارية فعالة بين بطاقة الرسومات وحل التبريد، وكذلك لحماية بطاقة الرسومات من التلف المادي والعوامل البيئية.

التبريد الهوائي

التبريد الهوائي هو الحل الأكثر شيوعًا وفعالية من حيث التكلفة لبطاقات الرسومات. وينطوي على استخدام مشتتات الحرارة والمراوح لتبديد الحرارة من بطاقة الرسومات إلى الهواء المحيط. مشتت الحرارة هو عنصر سلبي ينقل الحرارة بعيدًا عن بطاقة الرسومات ويوفر مساحة سطح كبيرة لتبديد الحرارة. المروحة هي عنصر نشط يدفع الهواء على مشتت الحرارة لتعزيز انتقال الحرارة بالحمل.

الشكل 9.6 يوضح حل التبريد الهوائي النموذجي لبطاقة رسومات.

        المروحة
         |
         |
    _____|_____
   |           |
   |  مشتت الحرارة |
   |___________|
         |
         |
        بطاقة الرسومات

الشكل 9.6: حل التبريد الهوائي لبطاقة رسومات.

تعتمد فعالية حل التبريد الهوائي على عدة عوامل، مثل:

  1. تصميم مشتت الحرارة: يجب أن يكون مشتت الحرارة ذا مساحة سطحية كبيرة وموصلية حرارية فعالة لزيادة تبديد الحرارة. النحاس والألومنيوم هي المواد الأكثر شيوعًا لمشتتات الحرارة بسبب موصليتهما الحرارية العالية.

  2. أداء المروحة: يجب أن توفر المروحة تدفق هواء كافٍ على مشتت الحرارة لإزالة الحرارة بفعالية. يمكن تحسين سرعة المروحة وتصميم الريش لتحقيق التوازن بين أداء التبريد ومستويات الضوضاء.

  3. مادة الواجهة الحرارية (TIM): TIM مثل عجينة الحرارة أوهنا هي الترجمة الى اللغة العربية للملف المذكور أعلاه:

المادة الحرارية، والمستخدمة لملء الفجوات بين وحدة المعالجة الرسومية والبالوعة الحرارية، مما يضمن وجود تلامس حراري جيد. ويجب أن تتميز المادة الحرارية بموصلية حرارية عالية ومقاومة حرارية منخفضة.

  1. إدارة تدفق الهواء: ينبغي تحسين تدفق الهواء الكلي داخل حاوية وحدة المعالجة الرسومية لضمان سحب الهواء البارد وطرد الهواء الساخن بكفاءة. وقد يتضمن ذلك استخدام المراوح الإضافية أو قنوات الهواء أو فتحات التهوية لتوجيه تدفق الهواء.

يُعتبر التبريد الهوائي مناسبًا لمعظم وحدات المعالجة الرسومية للمستهلكين العاديين وبعض وحدات المعالجة الرسومية للاستخدام المهني ذات استهلاك الطاقة المعتدل. ومع ذلك، بالنسبة لوحدات المعالجة الرسومية عالية المستوى ذات الكثافة الحرارية العالية جدًا، قد لا يكون التبريد الهوائي كافيًا للحفاظ على درجات الحرارة المقبولة، وقد تكون هناك حاجة إلى حلول تبريد أكثر تقدمًا.

التبريد بالسوائل

التبريد بالسوائل هو حل تبريد متقدم يستخدم سائل تبريد لإزالة الحرارة من وحدة المعالجة الرسومية. يمكن أن يوفر التبريد بالسوائل أداءً حراريًا أفضل من التبريد الهوائي، حيث تتميز السوائل بسعة حرارية أعلى وموصلية حرارية أعلى مقارنة بالهواء. هناك نوعان رئيسيان من حلول التبريد بالسوائل لوحدات المعالجة الرسومية: مبردات السوائل المتكاملة (AIO) وحلقات التبريد بالسوائل المخصصة.

تُعتبر مبردات السوائل المتكاملة (AIO) أنظمة مغلقة مسبقة التجميع تتكون من كتلة مائية وشعاع حراري ومضخة وأنابيب. يتم تركيب كتلة المياه مباشرةً على وحدة المعالجة الرسومية، ويتم ضخ سائل التبريد من خلال الكتلة لامتصاص الحرارة من وحدة المعالجة الرسومية. ثم ينساب السائل الساخن إلى الشعاع الحراري، حيث يتم تبريده بواسطة المراوح قبل العودة إلى كتلة المياه. تعتبر مبردات السوائل المتكاملة (AIO) سهلة التركيب والصيانة نسبيًا، مما يجعلها خيارًا شائعًا لوحدات المعالجة الرسومية عالية المستوى للألعاب.

أما حلقات التبريد بالسوائل المخصصة فهي أكثر تعقيدًا وقابلية للتخصيص من مبردات السوائل المتكاملة. وتتكون من مكونات منفصلة، مثل كتل المياه والشعاعات الحرارية والمضخات والخزانات والأنابيب، والتي يتم تجميعها بواسطة المستخدم. توفر الحلقات المخصصة مرونة أكبر من حيث اختيار المكونات وتخطيطها، مما يسمح بتبريد وتصميم أكثر كفاءة. ومع ذلك، فإنها تتطلب خبرة أكبر لتصميمها وتركيبها.هذا هو الترجمة إلى اللغة العربية للملف الذي قدمته:

الشكل 9.7 يوضح حل التبريد السائل النموذجي لبطاقة الرسومات.

        المشع الحراري
           |
           |
        أنابيب
           |
           |
        كتلة المياه
           |
           |
          بطاقة الرسومات

الشكل 9.7: حل التبريد السائل لبطاقة الرسومات.

يمكن أن يوفر التبريد السائل العديد من المزايا مقارنة بالتبريد الهوائي، مثل:

  1. درجات حرارة أقل لبطاقة الرسومات: يمكن للتبريد السائل الحفاظ على درجات حرارة أقل لبطاقة الرسومات مقارنة بالتبريد الهوائي، مما يسمح بساعات تشغيل أعلى وأداء أفضل.

  2. تشغيل أهدأ: يمكن لأنظمة التبريد السائل العمل بسرعات منخفضة للمروحة مقارنة بالمبردات الهوائية، مما ينتج عنه تشغيل أهدأ.

  3. إمكانات التحميل الزائد أفضل: إن درجات الحرارة الأقل والمجال الحراري الأفضل التي يوفرها التبريد السائل يمكن أن يُمكّن من التحميل الزائد للبطاقة الرسومية بشكل أكثر عدوانية.

ومع ذلك، فإن للتبريد السائل أيضًا بعض العيوب، مثل التكلفة الأعلى والتعقيد والاحتمال المحتمل للتسريبات. الصيانة السليمة، مثل استبدال السائل المبرد بشكل منتظم والتحقق من عدم وجود تسريبات، أمر حاسم لضمان الموثوقية طويلة المدى لأنظمة التبريد السائل.

تقنيات التغليف

تلعب تقنيات التغليف دورًا حاسمًا في إدارة الحرارة والموثوقية لبطاقات الرسومات. يوفر التغليف الواجهة بين رقاقة بطاقة الرسومات والحل التبريدي، بالإضافة إلى الحماية من الأضرار المادية والعوامل البيئية. بعض تقنيات التغليف الشائعة المستخدمة لبطاقات الرسومات تشمل:

  1. صفيف الكرات الشبكية المنقلبة (FC-BGA): في تغليف FC-BGA، يتم قلب رقاقة بطاقة الرسومات واتصالها بلوحة التغليف باستخدام صفيف من كرات القصدير. توفر كرات القصدير اتصالاً كهربائيًا ودعمًا ميكانيكيًا. يسمح FC-BGA بكثافة دبابيس عالية وأداء حراري جيد، حيث يمكن تثبيت موزع الحرارة مباشرةً على الجزء الخلفي من رقاقة بطاقة الرسومات.

  2. رقاقة على شريحة على الركيزة (CoWoS): CoWoS هي تقنية تغليف متقدمة تسمح بتكامل العديد من الرقاقات، مثل بطاقة الرسومات وذاكرة HBM، في حزمة واحدة. يتم ربط الرقاقات أولاً بالشريحة ثم تركيبها على الركيزة.فيما يلي الترجمة العربية لهذا الملف المتقن:

باستخدام وسيط من السيليكون مع نقاط التوصيل الدقيقة، ثم يتم ربط الوسيط بركيزة العبوة باستخدام تقنية الرقاقة المقلوبة. يُمكِّن CoWoS من روابط عالية النطاق الترددي ومنخفضة الزمن التأخيري بين المعالج الرسومي والذاكرة، فضلاً عن تحسين توصيل الطاقة وإدارة الحرارة.

  1. الربط المباشر للرقاقة (DCA): في تعبئة DCA، يتم تركيب رقاقة المعالج الرسومي مباشرةً على لوحة الدائرة المطبوعة باستخدام لاصق موصل أو لحام. يؤدي هذا إلى إلغاء الحاجة إلى ركيزة عبوة منفصلة، مما يقلل من المقاومة الحرارية ويحسن توصيل الطاقة. ومع ذلك، يتطلب DCA تصميمًا وتجميعًا دقيقَيْن للوحة الدائرة المطبوعة لضمان التوصيلات الموثوقة والحيلولة دون تلف رقاقة المعالج الرسومي.

  2. وحدة الرقاقات المتعددة (MCM): تنطوي تعبئة MCM على تكامل رقائق متعددة، مثل المعالج الرسومي والذاكرة، على ركيزة عبوة واحدة. تتصل الرقائق باستخدام روابط سلكية أو تقنية الرقاقة المقلوبة، وتوفر ركيزة العبوة روابط الربط بين الرقائق والأقطاب الخارجية. تسمح تعبئة MCM بكثافة تكامل أعلى وزيادة في سلامة الإشارة مقارنةً بالعبوات المنفصلة.

ينبغي أن توفر تقنيات التعبئة الفعالة ما يلي:

  1. توصيل حراري جيد: يجب أن تكون للعبوة مقاومة حرارية منخفضة للسماح بنقل الحرارة الفعال من رقاقة المعالج الرسومي إلى حل التبريد.

  2. توصيلات كهربائية موثوقة: يجب أن توفر العبوة توصيلات كهربائية مستقرة ومنخفضة المقاومة بين رقاقة المعالج الرسومي ولوحة الدائرة المطبوعة أو الوسيط.

  3. حماية ميكانيكية: يجب أن تحمي العبوة رقاقة المعالج الرسومي من التلف الفيزيائي، مثل الصدمات والاهتزازات والانحناء.

  4. حماية بيئية: يجب أن تحمي العبوة رقاقة المعالج الرسومي من العوامل البيئية، مثل الرطوبة والغبار والتداخل الكهرومغناطيسي.

مع استمرار زيادة كثافة طاقة المعالجات الرسومية، تصبح تقنيات التعبئة المتقدمة، مثل التكامل ثنائي وثلاثي الأبعاد، أمرًا بالغ الأهمية لتمكين إدارة الحرارة الفعالة والروابط عالية الأداء.

الخلاصة

إن إدارة الطاقة والطاقة والحرارة هي جوانب حرجة فيفيما يلي الترجمة العربية لهذا الملف الmarkdown. بالنسبة للشفرات البرمجية، لم يتم ترجمة الشفرات البرمجية نفسها، بل تمت ترجمة التعليقات فقط:

تصميم وتشغيل وحدة المعالجة الرسومية (GPU)

مع زيادة قوة ووكثافة الطاقة في وحدات المعالجة الرسومية (GPU)، فإن تقنيات الإدارة الفعالة أمر أساسي لضمان الأداء الأمثل وكفاءة الطاقة والموثوقية.

فهم مصادر استهلاك الطاقة، بما في ذلك الطاقة الديناميكية والثابتة، أمر حاسم لتطوير استراتيجيات إدارة الطاقة الفعالة. تعتبر تقنيات إيقاف الساعة والحجب الكهربائي للطاقة من التقنيات الشائعة لتقليل استهلاك الطاقة الديناميكية والثابتة على التوالي، وذلك عن طريق تعطيل المكونات غير المستخدمة أو الخاملة.

تعتبر تقنية التحكم الديناميكي في الجهد والتردد (DVFS) تقنية قوية أخرى يمكن أن تقلل بشكل كبير من استهلاك طاقة وحدة المعالجة الرسومية مع الحفاظ على أداء جيد. من خلال الضبط الديناميكي للجهد والتردد بناءً على حمل العمل والظروف الحرارية، يمكن لتقنية DVFS تحقيق توازن جيد بين الأداء وكفاءة الطاقة.

تُعد الحلول الفعالة لتبريد الأجهزة والتقنيات التغليفية أيضًا أمرًا حاسمًا لإدارة الإخراج الحراري لوحدات المعالجة الرسومية الحديثة. يُعد التبريد الهوائي الحل الأكثر شيوعًا وفعالية من حيث التكلفة، ولكن التبريد السائل يمكن أن يوفر أداءً حراريًا أفضل لوحدات المعالجة الرسومية عالية المستوى ذات كثافات طاقة عالية جدًا. كما يمكن أن تمكّن التقنيات المتقدمة للتغليف، مثل CoWoS وMCM، من إدارة حرارية فعالة وواجهات اتصال عالية الأداء.

مع استمرار تطور معمارية وحدات المعالجة الرسومية وزيادة كثافات الطاقة، ستكون التقنيات الجديدة لإدارة الطاقة والطاقة والحرارة أمرًا أساسيًا لضمان الزيادة المستمرة في أداء وكفاءة وحدات المعالجة الرسومية. ستلعب الأبحاث في مجالات مثل خوارزميات DVFS المتقدمة وأجهزة تنظيم الجهد المتكاملة والتقنيات المتقدمة للتغليف دورًا حاسمًا في تمكين الجيل القادم من وحدات المعالجة الرسومية عالية الأداء وكفيئة الطاقة.