با تبدیل شدن هرچه بیشتر دستگاهها به «دستگاههای هوشمند» حاوی پردازندههای تعبیهشده با اتصال به اینترنت و اغلب دوربینها، انفجار ایجاد داده با سرعت تصاعدی ادامه مییابد. هوش مصنوعی (AI) و محاسبات با عملکرد بالا (HPC) چشم انداز محاسباتی را متحول می کنند و امکان تجزیه و تحلیل این مجموعه داده های عظیم را فراهم می کنند که منجر به تجزیه و تحلیل با کیفیت بالاتر، خدمات خودکار، امنیت پیشرفته و بسیاری اهداف دیگر می شود. چالش: مقیاس این محاسبات پیشرفته نیاز به مصرف انرژی بیشتر و بیشتری دارد.
AMD بهعنوان پیشرو در ایجاد پردازندههای با کارایی بالا برای پرداختن به تحلیلهای مورد نیاز جهان، بهرهوری انرژی را در توسعه محصول خود در اولویت قرار داده است. ما این کار را با رویکرد جامع به طراحی برای بهینهسازی قدرت در معماری، بستهبندی، اتصال و نرمافزار انجام میدهیم. تمرکز ما بر بهره وری انرژی کاهش هزینه ها، حفظ منابع طبیعی و کاهش اثرات آب و هوایی است.
اولویت بندی بهره وری انرژی در AMD چیز جدیدی نیست. در واقع، ما به طور داوطلبانه در سال 2014 هدفی را برای خود تعیین کردیم تا بهره وری انرژی مصرف معمولی پردازنده های موبایل خود را تا سال 2020 به 25 برابر افزایش دهیم. ما به این هدف دست یافتیم و با دستیابی به بهبود 31.7 برابری از آن فراتر رفتیم.
سال گذشته ما چشمانداز جدیدی را اعلام کردیم – یک هدف 30×25 – برای دستیابی به 30 برابر بهبود بهرهوری انرژی تا سال 2025 نسبت به پایه سال 2020 برای گرههای محاسباتی مرکز داده شتابدهی ما.[i] این گرهها که با پردازندههای AMD EPYC™ و شتابدهندههای AMD Instinct™ ساخته شدهاند، برای برخی از سریعترین نیازهای محاسباتی جهان در آموزش هوش مصنوعی و برنامههای HPC طراحی شدهاند. این برنامهها برای تحقیقات علمی در پیشبینیهای آب و هوا، ژنومیک و کشف دارو، و همچنین آموزش شبکههای عصبی هوش مصنوعی برای تشخیص گفتار، ترجمه زبان، و سیستمهای توصیه متخصص ضروری هستند. تقاضاهای محاسباتی برای این برنامه ها به طور تصاعدی در حال افزایش است. خوشبختانه، ما معتقدیم که میتوان مصرف انرژی را برای این و دیگر کاربردهای گرههای محاسباتی شتابدار از طریق نوآوریهای معماری بهینه کرد.
عنوان: گرههای محاسباتی شتابدار خاص برنامه، کارایی بیشتری را ممکن میسازند
AMD، همراه با صنعت ما، فرصت دستاوردهای بهره وری مرکز داده را برای کمک به کاهش انتشار گازهای گلخانه ای و افزایش پایداری زیست محیطی درک می کند. به عنوان مثال، اگر همه نودهای سرور جهانی هوش مصنوعی و HPC به دستاوردهای مشابهی دست یابند، پیشبینی میکنیم که تا 51 میلیارد کیلووات ساعت (کیلووات ساعت) برق نسبت به روندهای صنعت پایه از سال 2021 تا 2025 صرفهجویی شود که به مبلغ 6.2 میلیارد دلار در سال است. صرفه جویی در مصرف برق و همچنین مزایای کربن حاصل از رشد 600 میلیون نهال درخت به مدت 10 سال.[ii]
از نظر عملی، دستیابی به هدف 30 برابری به این معنی است که در سال 2025، توان مورد نیاز برای این گرههای محاسباتی شتابدار AMD برای تکمیل یک محاسبه، 97 درصد کمتر از سال 2020 خواهد بود. رسیدن به آن آسان نخواهد بود. برای دستیابی به این هدف به این معنی است که ما باید بازده انرژی یک گره محاسباتی شتابدار را با سرعتی بیش از 2.5 برابر سریعتر از بهبود کل صنعت در دوره 2015-2020 افزایش دهیم.[iii]
به روز رسانی یک ساله پیشرفت
خوب چگونه اینکار را انجام دهیم؟ تقریباً در اواسط سال 2022، ما در مسیر دستیابی به 30×25 هستیم و با استفاده از یک گره محاسباتی تسریع شده با یک CPU نسل سوم AMD EPYC و چهار پردازنده گرافیکی AMD Instinct MI250x، به 6.79 برابر بهبود در بهره وری انرژی نسبت به پایه سال 2020 رسیده ایم. گزارش پیشرفت ما از یک روش اندازه گیری استفاده می کند[iv] توسط محقق و نویسنده مشهور کارایی انرژی محاسباتی، دکتر جاناتان کومی تایید شده است.
عنوان: به روز رسانی 2022 در مورد هدف بهره وری انرژی 30×25. دستاوردهای واقعی AMD در مسیر دستیابی به هدف 30 برابری و بسیار بالاتر از روند بهبود صنعت از 2015-2020 است.
عنوان: پیشبینیهای مصرف انرژی مقایسهای برای گرههای محاسباتی مرکز داده در سطح جهانی که بارهای کاری آموزشی هوش مصنوعی و HPC را اجرا میکنند. منبع: AMD Internal Data
همانطور که در نمودار بالا مشاهده میشود، «روند صنعت پایه» طبق معمول، مصرف انرژی جهانی را برای سالهای 2020-2025 بر اساس همان روند تاریخی مشاهده شده در دادههای 2015-2020 برآورد میکند. خط روند هدف AMD مصرف انرژی جهانی را بر اساس افزایش بهره وری نشان داده شده توسط هدف AMD 30×25 با نتیجه مطلوب مصرف انرژی کمتر نشان می دهد. خط روند واقعی AMD مصرف انرژی جهانی را بر اساس افزایش بهره وری انرژی گره محاسباتی AMD نشان می دهد که تا به امروز گزارش شده است.
در حالی که برای رسیدن به هدف 30×25 ما چیزهای بیشتری باقی مانده است، من از کار مهندسان خود راضی هستم و از نتایج تا کنون دلگرم هستم. من از شما دعوت می کنم تا با ما تماس بگیرید، زیرا ما همچنان به گزارش سالانه پیشرفت ادامه می دهیم.
##
بیانیه احتیاط
این وبلاگ حاوی بیانیه های آینده نگر در مورد Advanced Micro Devices, Inc. (AMD) مربوط به هدف AMD 30×25 است که بر اساس مقررات Safe Harbor قانون اصلاح دعاوی اوراق بهادار خصوصی در سال 1995 ساخته شده است. اظهارات آینده نگر معمولاً توسط کلماتی مانند «میخواهد»، «ممکن است»، «انتظار میرود»، «باور میکند»، «برنامهریزی میکند»، «قصد»، «پروژهها» و اصطلاحات دیگری با معنای مشابه. به سرمایهگذاران هشدار داده میشود که اظهارات آیندهنگر در این وبلاگ مبتنی بر باورها، مفروضات و انتظارات فعلی است، فقط از تاریخ این ارائه صحبت میکند و شامل خطرات و عدم قطعیتهایی است که میتواند باعث شود نتایج واقعی از نظر مادی با انتظارات فعلی متفاوت باشد. چنین اظهاراتی در معرض خطرات و عدم قطعیت های شناخته شده و ناشناخته ای هستند، که پیش بینی بسیاری از آنها دشوار است و عموماً خارج از کنترل AMD است، که می تواند باعث شود نتایج واقعی و سایر رویدادهای آتی از نظر مادی با موارد بیان شده یا ضمنی یا پیش بینی شده توسط AMD متفاوت باشد. اطلاعات و اظهارات آینده نگر از سرمایهگذاران خواسته میشود تا ریسکها و عدم قطعیتهای موجود در پروندههای کمیسیون بورس و اوراق بهادار AMD، از جمله، اما نه محدود به آخرین گزارشهای AMD در مورد فرمهای 10-K و 10-Q را با جزئیات بررسی کنند. AMD هیچ گونه تعهدی برای به روز رسانی اظهارات آینده نگر ارائه شده در این وبلاگ را نمی پذیرد، و بدین وسیله آن را رد می کند، مگر اینکه ممکن است قانون الزامی باشد.
[i] شامل شتابدهندههای CPU و GPU با عملکرد بالا AMD است که برای آموزش هوش مصنوعی و محاسبات با عملکرد بالا در پیکربندی میزبانی CPU با 4 شتابدهنده استفاده میشود. محاسبات هدف بر اساس نمرات عملکردی است که با معیارهای عملکرد استاندارد اندازهگیری میشود (HPC: Linpack DGEMM kernel FLOPS با اندازه ماتریس 4k. آموزش هوش مصنوعی: هستههای GEMM با نقطه شناور ریاضی با تمرکز بر تمرین با دقت پایینتر مانند FP16 یا BF16 FLOPS که بر روی ماتریسهای 4k کار میکنند) تقسیم بر مصرف توان نامی یک گره محاسباتی شتابدار نماینده شامل میزبان CPU + حافظه و 4 شتاب دهنده GPU.
[ii] راسناریویی مبتنی بر تمام گرههای سرور AI و HPC در سطح جهانی که دستاوردهای مشابهی با هدف AMD 30x دارد و منجر به صرفهجویی تجمعی تا 51.4 میلیارد کیلووات ساعت برق از سال 2021-2025 نسبت به روندهای پایه 2020 میشود. 0.12 دلار در هر کیلووات ساعت x 51.4 میلیارد کیلووات ساعت = 6.2 میلیون دلار آمریکا فرض می شود. متریک تن انتشار CO2e، و برآورد معادل برای کاشت درخت، بر اساس وارد کردن صرفهجویی در مصرف برق به محاسبهگر معادل گاز گلخانهای EPA ایالات متحده در تاریخ 1/12/2021 است. https://www.epa.gov/energy/greenhouse-gas-equivalencies-calculator
[iii] بر اساس روندهای صنعت 2015-2020 در افزایش بهره وری انرژی و مصرف انرژی مرکز داده در سال 2025.
[iv] محاسبه شامل 1) پیشبینیهای استفاده پایه موردی کیلووات ساعت در سال 2025 با کومی آنالیتیکس بر اساس تحقیقات و دادههای موجود انجام شد که شامل حجمهای استقرار پیشبینیشده در سال 2025 و اثربخشی استفاده از مرکز داده (PUE) از جمله نصبهای GPU HPC و یادگیری ماشین (ML) و 2) مصرف انرژی سوکت CPU و گره GPU AMD با درصد استفاده خاص بخش (فعال در مقابل بیکار) و ضرب در PUE برای تعیین کل مصرف انرژی واقعی برای محاسبه عملکرد در هر وات.
6.79x = (مورد استفاده پایه HPC نود کیلووات ساعت در 2025 x بهبود عملکرد پرف/وات AMD 2022 با استفاده از DGEMM و مصرف انرژی معمولی + پیشبینی استفاده از گره پایه ML در سال 2025 * بهبود پرف/وات 2022 AMD با استفاده از ریاضیات ML و مصرف انرژی معمولی ) /(2020 perf/Watt * استفاده پایه کیلووات ساعت پیش بینی شده در سال 2025). برای اطلاعات بیشتر در مورد هدف و روش، مراجعه کنید https://www.amd.com/fa/corporate-responsibility/data-center-sustainability