کد ROCm™ HPL اکنون برای AMD Instinct™ منبع باز است ...

Linpack با کارایی بالا (HPL) یک پیاده سازی قابل حمل از معیار Linpack است که برای اندازه گیری قدرت محاسباتی ممیز شناور سیستم استفاده می شود. معیار HPL یک سیستم خطی متراکم (تصادفی) را با دقت مضاعف (64 بیت) در رایانه‌های با حافظه توزیع‌شده حل می‌کند که نرخ اجرای ممیز شناور سخت‌افزار زیربنایی را اندازه‌گیری می‌کند.

در یک سیستم پیچیده HPC، هیچ کار محاسباتی به تنهایی نمی تواند عملکرد کلی قابلیت های محاسباتی آن را به طور دقیق منعکس کند. به منظور استانداردسازی پیرامون مجموعه‌ای از عملیات محاسباتی برای اندازه‌گیری قابلیت‌های یک سیستم HPC، معیار HPL به یک استاندارد صنعتی تبدیل شده است و به طور گسترده توسط مراکز پیشرو ابرکامپیوتر پذیرفته شده است.

HPL اغلب یکی از اولین برنامه هایی است که بر روی تاسیسات کامپیوتری بزرگ اجرا می شود تا نتیجه ای را ایجاد کند که می تواند به TOP500 ارسال شود. این به عنوان یک معیار مرجع برای ارائه داده ها برای رتبه بندی سیستم در لیست TOP500 استفاده می شود و آن را با ابررایانه های سراسر جهان مقایسه می کند.

لیست TOP500 ژوئن 2022، ابررایانه Frontier را در آزمایشگاه ملی Oak Ridge با استفاده از شتاب دهنده های AMD Instinct™ و پردازنده های AMD EPYCTM به نمایش گذاشت و به نقطه عطف تاریخی بیش از 1 ExaFlop عملکرد در HPL رسید. AMD اکنون منبع باز شاخه کد rocHPL مورد استفاده در اجرای Exascale در Frontier است و به صنعت دسترسی به کد rocHPL را برای اجرا بر روی طیف گسترده ای از پلتفرم های مجهز به شتاب دهنده AMD Instinct می دهد. علاوه بر کد rocHPCG منبع باز قبلی، rocHPL به تعهد AMD به فلسفه منبع باز ادامه می دهد. همچنین، AMD تنها فروشنده HPC است که کدهای HPL و HPCG را به جای باینری منبع باز دارد.

rocHPL و rocHPCG پورت‌های معیاری هستند که بر اساس برنامه‌های بنچمارک HPL و HPCG هستند که در بالای پلتفرم AMD ROCm، زمان اجرا و زنجیره‌های ابزار پیاده‌سازی شده‌اند. rocHPL و rocHPCG با استفاده از زبان برنامه نویسی HIP ایجاد شده و برای آخرین پردازنده های گرافیکی AMD Instinct™ بهینه شده اند. HIP (واسط محاسباتی ناهمگن برای حمل‌پذیری) یک الگوی برنامه‌نویسی باز است که نه تنها بر روی پردازنده‌های گرافیکی AMD اجرا می‌شود، بلکه برای اجرا بر روی پردازنده‌های گرافیکی و پردازنده‌های دیگر فروشنده نیز قابل حمل است.

AMD rocHPL یک پیاده سازی نوآورانه است که مزایای منحصر به فرد پردازنده AMD EPYC نسل سوم و سیستم مجهز به شتاب دهنده AMD Instinct MI250 را برجسته می کند. rocHPL فاکتورسازی پانل را بر روی CPU ها انجام می دهد، در حالی که بیشتر محاسبات را روی شتاب دهنده های Instinct انجام می دهد. طراحی سیستم منحصربه‌فرد که این پردازنده‌های EPYC و شتاب‌دهنده‌های Instinct را با اتصال درونی AMD Infinity Fabric™ با حافظه نهان منسجم یکی می‌کند، فناوری‌هایی بودند که برای فعال کردن Frontier برای دستیابی به عملکرد لازم برای دستیابی به Exascale مورد استفاده قرار گرفتند.

نمودار زیر مزیت عملکردی 2.8 برابری rocHPL و مزیت عملکردی بیش از 1.6 برابری را در rocHPCG با استفاده از چهار شتاب‌دهنده AMD Instinct MI250 و پشته ROCm SW در برابر پردازنده‌های گرافیکی A100 از یک فروشنده GPU دیگر نشان می‌دهد.

شکل 1: عملکرد HPL در شتاب دهنده های AMD Instinct™ MI250.

شکل 2: عملکرد HPCG در شتاب دهنده های AMD Instinct™ MI250.

کد منبع باز در لینک های زیر موجود است.

rocHPL: https://github.com/ROCmSoftwarePlatform/rocHPL

rocHPCG: https://github.com/ROCmSoftwarePlatform/rocHPCG

ظروف HPL و HPCG همراه با دستورالعمل در AMD Infinity Hub موجود است.

استفاده از پلت فرم ROCm را حتی آسان تر می کند

برای کاربران و توسعه‌دهندگان ROCm، AMD به‌طور مداوم به دنبال راه‌هایی برای آسان‌تر کردن استفاده از ROCm، استقرار آسان‌تر روی سیستم‌ها و ارائه ابزارهای یادگیری و اسناد فنی برای پشتیبانی از این تلاش‌ها است.

منابع مفید:

درباره جدیدترین ما بیشتر بدانید شتاب دهنده های AMD Instinct، از جمله پردازنده گرافیکی جدید Instinct MI210 PCIe® که اخیراً به خانواده شتاب دهنده های سری AMD Instinct MI200 اضافه شده است و راه حل های سرور شریک پشتیبانی در ما کاتالوگ راه حل های سرور AMD Instinct.
این ROCm صفحات وب یک نمای کلی از پلتفرم و مواردی که شامل آن می شود، همراه با بازارها و حجم کاری که پشتیبانی می کند، ارائه می دهند.
پورتال اطلاعات ROCm یک پورتال یک مرحله ای جدید برای کاربران و توسعه دهندگان است که آخرین نسخه های ROCm را به همراه API و اسناد پشتیبانی پست می کند. این پورتال همچنین اکنون میزبان مرکز آموزشی ROCm است تا به معرفی پلتفرم ROCm به کاربران جدید کمک کند و همچنین به کاربران فعلی ویدیوهای سرپرستی شده، وبینارها، آزمایشگاه‌ها و آموزش‌ها برای کمک به توسعه و استقرار سیستم‌ها در این پلتفرم کمک کند. جايگزين سايت‌هاي اسناد و يادگيري سابق مي‌شود.
AMD Infinity Hub به شما امکان دسترسی به برنامه های HPC و چارچوب های ML را می دهد که به صورت کانتینر بسته بندی شده و آماده اجرا هستند. شما همچنین می توانید دسترسی داشته باشید کاتالوگ برنامه ROCm، که شامل لیستی به روز از برنامه های کاربردی دارای ROCm است.
AMD Accelerator Cloud دسترسی از راه دور به کدهای آزمایشی و برنامه‌های کاربردی در فضای ابری، در جدیدترین شتاب‌دهنده‌های AMD Instinct™ و نرم‌افزار ROCm را ارائه می‌دهد.

برایس مکین است در گروه بازاریابی محصولات AMD Instinct™ GPU برای AMD. پست های او نظرات خودش است و ممکن است مواضع، استراتژی ها یا نظرات AMD را نشان ندهد. پیوندها به سایت‌های شخص ثالث برای سهولت ارائه می‌شوند و AMD هیچ مسئولیتی در قبال محتویات این سایت‌های لینک‌شده ندارد و هیچ‌گونه تاییدیه‌ای ندارد، مگر اینکه به صراحت بیان شود.

یادداشت های پایانی:

آزمایش توسط آزمایشگاه عملکرد AMD در تاریخ 8.22.2022 با استفاده از HPL با مقایسه دو سیستم انجام شد. سرور 2P EPYC™ 7763، SMT غیرفعال، با پردازنده‌های گرافیکی 1x، 2x و 4x AMD Instinct™ MI250 (128 گیگابایت HBM2e) 560W، ROCm 5.1.3 rocHPL: مخزن داخلی AMD: http://git.commer. رفع اشکال شعبه rocHPL/public-hostmem، rev 92bbf94 olus بهینه‌سازی‌های AMD برای HPL که هنوز در دسترس نیستند. سرور AMD EPYC™ 7742 Vs.2P با 1x، 2x و 4x Nvidia Ampere A100 80GB GDA CUWM Drive1. نسخه 510.47.03. ظرف HPL (nvcr.io/nvidia/hpc-benchmarks:21.4-hpl) از https://catalog.ngc.nvidia.com/orgs/nvidia/containers/hpc-benchmarks به دست آمده است. سازندگان سرور ممکن است پیکربندی‌های متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. عملکرد ممکن است بر اساس استفاده از آخرین درایورها و بهینه سازی ها متفاوت باشد. MI200-69
MI200-70: آزمایش انجام شده توسط آزمایشگاه عملکرد AMD در 2022/8/22 با استفاده از HPCG 3.0 که دو سیستم را با هم مقایسه می‌کند: سرور 2P EPYC™ 7763، SMT غیرفعال، با 1x، 2x، و 4x AMD Instinct™ MI250 (6BM28GB) 5.0.0.50000-49، کانتینر HPCG 3.0: docker pull amdih/rochpcg:3.1.0_97 در https://www.amd.com/en/technologies/infinity-hub/hpcg در مقابل سرور 2P AMD EPYC™ 71742، 2x و 4x Nvidia Ampere A100 80GB SXM 400W GPU، CUDA 11.6. کانتینر HPCG 3.0: nvcr.io/nvidia/hpc-benchmarks:21.4-hpcg در https://catalog.ngc.nvidia.com/orgs/nvidia/containers/hpc-benchmarks. سازندگان سرور ممکن است پیکربندی‌های متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. عملکرد ممکن است بر اساس استفاده از آخرین درایورها و بهینه سازی ها متفاوت باشد. MI200-70

منبع

Tags: ای ام دی

کد ROCm™ HPL اکنون برای AMD Instinct™ منبع باز است …

لینوکس 6.11 در بنچمارک های اولیه AMD Ryzen Threadripper خوب به نظر می رسد

ASRock سری Radeon RX 7900 با خنک کننده غیرفعال را معرفی کرد

(PR) ASRock کارت‌های گرافیک کاملاً غیرفعال Radeon RX 7900 را با کانکتور برق 12V-2×6 عرضه می‌کند.

محمدصادق مجدی

Recommended For You

لینوکس 6.11 در بنچمارک های اولیه AMD Ryzen Threadripper خوب به نظر می رسد

ASRock سری Radeon RX 7900 با خنک کننده غیرفعال را معرفی کرد

(PR) ASRock کارت‌های گرافیک کاملاً غیرفعال Radeon RX 7900 را با کانکتور برق 12V-2×6 عرضه می‌کند.

ASRock اولین مادربرد Thin Mini-ITX با سوکت AMD AM5 را راه اندازی کرد و از پردازنده های Ryzen 9000 پشتیبانی می کند.

ASRock X600TM-ITX، اولین مادربرد نازک Mini-ITX AM5 جهان را با Ryzen 9000 معرفی کرد. "65 وات" حمایت کردن

Saints Row - Out Now و بخشی از Raise the Gam...

نوشته‌های تازه

AMD مگ

دسته بندی

کد ROCm™ HPL اکنون برای AMD Instinct™ منبع باز است …

You might also like

Recommended For You

نوشته‌های تازه

AMD مگ

دسته بندی

برچسب ها