Linpack با کارایی بالا (HPL) یک پیاده سازی قابل حمل از معیار Linpack است که برای اندازه گیری قدرت محاسباتی ممیز شناور سیستم استفاده می شود. معیار HPL یک سیستم خطی متراکم (تصادفی) را با دقت مضاعف (64 بیت) در رایانههای با حافظه توزیعشده حل میکند که نرخ اجرای ممیز شناور سختافزار زیربنایی را اندازهگیری میکند.
در یک سیستم پیچیده HPC، هیچ کار محاسباتی به تنهایی نمی تواند عملکرد کلی قابلیت های محاسباتی آن را به طور دقیق منعکس کند. به منظور استانداردسازی پیرامون مجموعهای از عملیات محاسباتی برای اندازهگیری قابلیتهای یک سیستم HPC، معیار HPL به یک استاندارد صنعتی تبدیل شده است و به طور گسترده توسط مراکز پیشرو ابرکامپیوتر پذیرفته شده است.
HPL اغلب یکی از اولین برنامه هایی است که بر روی تاسیسات کامپیوتری بزرگ اجرا می شود تا نتیجه ای را ایجاد کند که می تواند به TOP500 ارسال شود. این به عنوان یک معیار مرجع برای ارائه داده ها برای رتبه بندی سیستم در لیست TOP500 استفاده می شود و آن را با ابررایانه های سراسر جهان مقایسه می کند.
لیست TOP500 ژوئن 2022، ابررایانه Frontier را در آزمایشگاه ملی Oak Ridge با استفاده از شتاب دهنده های AMD Instinct™ و پردازنده های AMD EPYCTM به نمایش گذاشت و به نقطه عطف تاریخی بیش از 1 ExaFlop عملکرد در HPL رسید. AMD اکنون منبع باز شاخه کد rocHPL مورد استفاده در اجرای Exascale در Frontier است و به صنعت دسترسی به کد rocHPL را برای اجرا بر روی طیف گسترده ای از پلتفرم های مجهز به شتاب دهنده AMD Instinct می دهد. علاوه بر کد rocHPCG منبع باز قبلی، rocHPL به تعهد AMD به فلسفه منبع باز ادامه می دهد. همچنین، AMD تنها فروشنده HPC است که کدهای HPL و HPCG را به جای باینری منبع باز دارد.
rocHPL و rocHPCG پورتهای معیاری هستند که بر اساس برنامههای بنچمارک HPL و HPCG هستند که در بالای پلتفرم AMD ROCm، زمان اجرا و زنجیرههای ابزار پیادهسازی شدهاند. rocHPL و rocHPCG با استفاده از زبان برنامه نویسی HIP ایجاد شده و برای آخرین پردازنده های گرافیکی AMD Instinct™ بهینه شده اند. HIP (واسط محاسباتی ناهمگن برای حملپذیری) یک الگوی برنامهنویسی باز است که نه تنها بر روی پردازندههای گرافیکی AMD اجرا میشود، بلکه برای اجرا بر روی پردازندههای گرافیکی و پردازندههای دیگر فروشنده نیز قابل حمل است.
AMD rocHPL یک پیاده سازی نوآورانه است که مزایای منحصر به فرد پردازنده AMD EPYC نسل سوم و سیستم مجهز به شتاب دهنده AMD Instinct MI250 را برجسته می کند. rocHPL فاکتورسازی پانل را بر روی CPU ها انجام می دهد، در حالی که بیشتر محاسبات را روی شتاب دهنده های Instinct انجام می دهد. طراحی سیستم منحصربهفرد که این پردازندههای EPYC و شتابدهندههای Instinct را با اتصال درونی AMD Infinity Fabric™ با حافظه نهان منسجم یکی میکند، فناوریهایی بودند که برای فعال کردن Frontier برای دستیابی به عملکرد لازم برای دستیابی به Exascale مورد استفاده قرار گرفتند.
نمودار زیر مزیت عملکردی 2.8 برابری rocHPL و مزیت عملکردی بیش از 1.6 برابری را در rocHPCG با استفاده از چهار شتابدهنده AMD Instinct MI250 و پشته ROCm SW در برابر پردازندههای گرافیکی A100 از یک فروشنده GPU دیگر نشان میدهد.
شکل 1: عملکرد HPL در شتاب دهنده های AMD Instinct™ MI250.
شکل 2: عملکرد HPCG در شتاب دهنده های AMD Instinct™ MI250.
کد منبع باز در لینک های زیر موجود است.
rocHPL: https://github.com/ROCmSoftwarePlatform/rocHPL
rocHPCG: https://github.com/ROCmSoftwarePlatform/rocHPCG
ظروف HPL و HPCG همراه با دستورالعمل در AMD Infinity Hub موجود است.
استفاده از پلت فرم ROCm را حتی آسان تر می کند
برای کاربران و توسعهدهندگان ROCm، AMD بهطور مداوم به دنبال راههایی برای آسانتر کردن استفاده از ROCm، استقرار آسانتر روی سیستمها و ارائه ابزارهای یادگیری و اسناد فنی برای پشتیبانی از این تلاشها است.
منابع مفید:
- درباره جدیدترین ما بیشتر بدانید شتاب دهنده های AMD Instinct، از جمله پردازنده گرافیکی جدید Instinct MI210 PCIe® که اخیراً به خانواده شتاب دهنده های سری AMD Instinct MI200 اضافه شده است و راه حل های سرور شریک پشتیبانی در ما کاتالوگ راه حل های سرور AMD Instinct.
- این ROCm صفحات وب یک نمای کلی از پلتفرم و مواردی که شامل آن می شود، همراه با بازارها و حجم کاری که پشتیبانی می کند، ارائه می دهند.
- پورتال اطلاعات ROCm یک پورتال یک مرحله ای جدید برای کاربران و توسعه دهندگان است که آخرین نسخه های ROCm را به همراه API و اسناد پشتیبانی پست می کند. این پورتال همچنین اکنون میزبان مرکز آموزشی ROCm است تا به معرفی پلتفرم ROCm به کاربران جدید کمک کند و همچنین به کاربران فعلی ویدیوهای سرپرستی شده، وبینارها، آزمایشگاهها و آموزشها برای کمک به توسعه و استقرار سیستمها در این پلتفرم کمک کند. جايگزين سايتهاي اسناد و يادگيري سابق ميشود.
- AMD Infinity Hub به شما امکان دسترسی به برنامه های HPC و چارچوب های ML را می دهد که به صورت کانتینر بسته بندی شده و آماده اجرا هستند. شما همچنین می توانید دسترسی داشته باشید کاتالوگ برنامه ROCm، که شامل لیستی به روز از برنامه های کاربردی دارای ROCm است.
- AMD Accelerator Cloud دسترسی از راه دور به کدهای آزمایشی و برنامههای کاربردی در فضای ابری، در جدیدترین شتابدهندههای AMD Instinct™ و نرمافزار ROCm را ارائه میدهد.
برایس مکین است در گروه بازاریابی محصولات AMD Instinct™ GPU برای AMD. پست های او نظرات خودش است و ممکن است مواضع، استراتژی ها یا نظرات AMD را نشان ندهد. پیوندها به سایتهای شخص ثالث برای سهولت ارائه میشوند و AMD هیچ مسئولیتی در قبال محتویات این سایتهای لینکشده ندارد و هیچگونه تاییدیهای ندارد، مگر اینکه به صراحت بیان شود.
یادداشت های پایانی:
- آزمایش توسط آزمایشگاه عملکرد AMD در تاریخ 8.22.2022 با استفاده از HPL با مقایسه دو سیستم انجام شد. سرور 2P EPYC™ 7763، SMT غیرفعال، با پردازندههای گرافیکی 1x، 2x و 4x AMD Instinct™ MI250 (128 گیگابایت HBM2e) 560W، ROCm 5.1.3 rocHPL: مخزن داخلی AMD: http://git.commer. رفع اشکال شعبه rocHPL/public-hostmem، rev 92bbf94 olus بهینهسازیهای AMD برای HPL که هنوز در دسترس نیستند. سرور AMD EPYC™ 7742 Vs.2P با 1x، 2x و 4x Nvidia Ampere A100 80GB GDA CUWM Drive1. نسخه 510.47.03. ظرف HPL (nvcr.io/nvidia/hpc-benchmarks:21.4-hpl) از https://catalog.ngc.nvidia.com/orgs/nvidia/containers/hpc-benchmarks به دست آمده است. سازندگان سرور ممکن است پیکربندیهای متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. عملکرد ممکن است بر اساس استفاده از آخرین درایورها و بهینه سازی ها متفاوت باشد. MI200-69
- MI200-70: آزمایش انجام شده توسط آزمایشگاه عملکرد AMD در 2022/8/22 با استفاده از HPCG 3.0 که دو سیستم را با هم مقایسه میکند: سرور 2P EPYC™ 7763، SMT غیرفعال، با 1x، 2x، و 4x AMD Instinct™ MI250 (6BM28GB) 5.0.0.50000-49، کانتینر HPCG 3.0: docker pull amdih/rochpcg:3.1.0_97 در https://www.amd.com/en/technologies/infinity-hub/hpcg در مقابل سرور 2P AMD EPYC™ 71742، 2x و 4x Nvidia Ampere A100 80GB SXM 400W GPU، CUDA 11.6. کانتینر HPCG 3.0: nvcr.io/nvidia/hpc-benchmarks:21.4-hpcg در https://catalog.ngc.nvidia.com/orgs/nvidia/containers/hpc-benchmarks. سازندگان سرور ممکن است پیکربندیهای متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. عملکرد ممکن است بر اساس استفاده از آخرین درایورها و بهینه سازی ها متفاوت باشد. MI200-70