توسط: سام نفزیگر، معاون ارشد، همکار شرکتی و معمار فناوری محصول
تقاضا برای تجربههای بازی واقعی و فراگیر، دائماً مرزهای فناوری را پیش میبرد، پیشرفتها را برای پشتیبانی از ویژگیهایی مانند ردیابی پرتو، سایهزنی با نرخ متغیر و فناوریهای ارتقاء مقیاس پیشرفته هدایت میکند. این تجارب بهبودیافته، مستلزم بهبود عملکرد بیوقفه از پیشرفتهای مستمر در طراحی، معماری سیلیکونی است که به نوبه خود باعث مصرف انرژی بالاتر میشود.
به طور خاص، توان کارت گرافیک به سرعت به 400 وات رسیده است. در عین حال، مصرف برق به سرعت در حال تبدیل شدن به یک نگرانی بزرگ است برای گیمرهازیرا نه تنها قیمت انرژی در سرتاسر جهان سر به فلک کشیده است، بلکه قدرت بالاتر به این معنی است که کاربران باید با افزایش روزافزون اتلاف گرما و سیستم های بلندتر ناشی از نیاز به راه حل های خنک کننده بزرگتر مقابله کنند.
اصول اولیه طراحی سیلیکونی به گونه ای است که افزایش عملکرد از طریق افزودن ویژگی ها و افزایش فرکانس، قدرت را به صورت فوق خطی با عملکرد به عنوان راهی برای پاسخگویی به نیازهای بازی های سخت تر افزایش می دهد. اما با مهندسی و اصلاحات متفکرانه و نوآورانه، میتوانیم بدون بودجههای انرژی بالا عملکرد بهتری داشته باشیم – هزینههای کلی، گرما و نویز را پایینتر نگه داریم و در عین حال تجربههای پیشرفت و عملکرد را ارائه دهیم.
مدتی قبل در AMD، معماریهای اصلی خود را از ابتدا بازنگری و تغییر دادیم، و در انجام این کار، چندین شرط بزرگ برای بهبود طراحی و بهرهوری انرژی انجام دادیم. این شرطبندیها اکنون به روشهای معنیداری در تمام خطوط تولید ما به شکل عملکرد رهبری به ازای هر وات، سیستمهای ساکتتر، سبکتر، صورتحسابهای بالقوه کمتر انرژی و ردپای فیزیکی کوچکتر بهدست میآیند. به عنوان مثال، AMD اکنون با چهار ابررایانه برتر (1 تا 4) کارآمدترین ابرکامپیوترهای با کارایی بالا، بازدهی را در فضای ابررایانه پیشرو است.
عملکرد رهبری-در هر وات در بازی
AMD همچنان کارآمدترین و قدرتمندترین طراحی سیلیکونی را برای ارائه عملکرد پیشرو در گرافیک و بازی در اولویت قرار می دهد.
سه نسل آخر کارتهای گرافیک AMD Radeon™ بهبودهای باورنکردنی در عملکرد هر وات داشتهاند. در سال 2019، زمانی که معماری AMD RDNA با پردازندههای گرافیکی 7 نانومتری سری Radeon™ RX 5000 معرفی شد، AMD به طور متوسط 50 درصد بهبود عملکرد در هر وات را نسبت به معماری قدیمی GCN ارائه کرد. این معادل 50 درصد نرخ فریم بالاتر در بخش 2 با همان قدرت است[1].
در سال 2020، زمانی که معماری AMD RDNA™ 2 برای تقویت کارتهای گرافیک سری Radeon™ RX 6000 عرضه شد، ما تا 65 درصد عملکرد بهتری در هر وات نسبت به کارتهای گرافیک Radeon™ RX 5000 با همان فناوری 7 نانومتری ارائه کردیم.[2]، با نوآوری در معماری و طراحی سیلیکونی. این امر Radeon™ RX 6000 Series را در موقعیت بسیار رقابتی عملکرد بر وات در سراسر پشته قرار داد و یک بار دیگر تعهد AMD را به محاسبات قدرتمند و در عین حال کارآمد نشان داد.
[3]
اهمیت عملکرد در هر وات
بهترین عملکرد در هر وات برای گیمرها چه معنایی دارد؟ علاوه بر تولید گرمای کمتر و مصرف انرژی کمتر در حین ارائه عملکرد بالا در دورههای زمانی طولانی، یک مزیت صرفهجویی در هزینه نیز وجود دارد، همانطور که هنگام مقایسه قدرت طراحی حرارتی در سری فعلی کارتهای گرافیک AMD Radeon™ RX 6000 مشاهده میشود. در مقابل محصولات NVIDIA GeForce RTX 3000 Series.
ساخت طرحهای کارآمد با قدرت در DNA ما وجود دارد
به عنوان تنها شرکتی که امروزه پردازندهها و پردازندههای گرافیکی با کارایی بالا را توسعه میدهد، AMD بهطور منحصربهفردی موقعیتی را دارد که از یادگیریها در تیمهای مهندسی مرکزی ما استفاده کند و از بهترین IP در مجموعه محصولات خود استفاده کند. به عنوان مثال، به دنبال موفقیت پردازندههای دسکتاپ و موبایل AMD Ryzen که عملکرد و کارایی باورنکردنی را ارائه میدهند، تیمهای مهندسی با هم همکاری کردند تا آموختههای کلیدی حاصل از توسعه CPU “Zen” ما را در معماری گرافیکی Radeon ما اعمال کنند تا RDNA™ 2 را به یک بسیار کارآمد تبدیل کنند. معماری GPU
ما برخی از رویکردهای میکرومعماری CPU و روشهای طراحی «Zen» را در خط لوله گرافیکی خود گنجاندهایم، و ساختار فیزیکی قالب را سادهسازی میکنیم تا فرکانسهای بالاتر را ممکن کنیم. به عنوان مثال، ما از حافظه های متراکم CPU L3 برای پیاده سازی AMD Infinity Cache استفاده کردیم.™یک حافظه پنهان با چگالی بالا و کم مصرف، برای دسترسی آسانتر به دادههای پرکاربرد در حجمهای کاری بازی، افزایش چشمگیر پهنای باند و در عین حال کاهش توان مورد نیاز برای حافظه و کاهش تأخیر[4].
برای اصلاح و بهبود بیشتر معماری گرافیکی AMD RDNA™ 2 و ارائه بازده و عملکرد بیشتر، تیم چندین تغییر کلیدی دیگر را اجرا کرد، از جمله:
- سوئیچینگ بهینه شده – بهبود طراحی اساسی معماری برای اطمینان از اینکه هر دروازه و هر ساعت تغییر می کند مستقیماً به عملکرد کمک می کند، بنابراین هرگونه فعالیت هدر رفته و مسیریابی اضافی برای بهینه سازی خط لوله گرافیکی حذف می شود.
- طراحی فرکانس بالا – تنظیم طراحی برای سرعتهای کلاک بالا، فشار دادن فرکانسهای AMD RDNA™ 2 فراتر از AMD RDNA™ تا 30 درصد، که GPU را قادر میسازد با ولتاژ پایینتری کار کند تا اطمینان حاصل شود که معماری جدید میتواند همان سرعت ساعت را با توان کمتر حفظ کند.[5].
- مدیریت هوشمند انرژی – پیاده سازی مدیریت هوشمند انرژی در GPU، که بهترین فرصت ها را برای بهره برداری از فرکانس های بالاتر شناسایی می کند و این کار را تنها زمانی انجام می دهد که به طور مستقیم عملکرد را بهبود می بخشد، سپس کاهش می دهد، بنابراین مصرف انرژی اضافی را حذف می کند.
بعد چه می شود؟
با نگاهی به آینده، ما به تلاش خود برای بازی های کارآمدتر با معماری AMD RDNA™ 3 ادامه می دهیم. AMD RDNA™ 3 به عنوان اولین معماری گرافیکی AMD که از فرآیند 5 نانومتری و فناوری بستهبندی تراشههای ما بهره میبرد، در مسیر ارائه عملکردی بیش از 50 درصد در هر وات بهتر از معماری AMD RDNA™ 2 است.[6] – واقعاً عملکرد برتر بازی را برای گیمرها در طراحی های خنک، بی صدا و انرژی زا به ارمغان می آورد.
AMD RDNA™ 3 با کمک به این طراحی آگاهانه از انرژی، فناوری مدیریت توان تطبیقی AMD RDNA™ 2 را برای تنظیم نقاط عملیاتی مخصوص بار کاری اصلاح میکند و اطمینان حاصل میکند که هر جزء از GPU فقط از توان مورد نیاز برای عملکرد بهینه استفاده میکند. معماری جدید همچنین نسل جدیدی از AMD Infinity Cache را معرفی میکند که پیشبینی میشود حافظه نهان با تراکم بالاتر و قدرت کمتری را برای کاهش نیازهای انرژی حافظه گرافیکی ارائه دهد و به تقویت گرافیکهای AMD RDNA™ 3 و Radeon™ به عنوان یک رهبر واقعی کمک کند. در کارایی
ما از پیشرفتهایی که با AMD RDNA™ 3 و نسخههای قبلی آن انجام میدهیم هیجانزده هستیم و معتقدیم که از معماریها و فناوریهای فرآیند پیشرفتهای که میتوانیم استفاده کنیم، عملکرد بینظیری در هر وات در سراسر پشته ارائه میکنیم. برای بازی بهتر
AMD مسئولیتی در قبال محتویات سایت های شخص ثالث ندارد و هیچ تاییدیه ای به طور ضمنی وجود ندارد. GD-5
[1] RDNA به طور متوسط 1.54 برابر عملکرد هر وات را نسبت به GCN در بازی Division 2 ارائه می دهد. آزمایش توسط آزمایشگاه های عملکرد AMD در تاریخ 5/23/19، با استفاده از تنظیمات Division 2 @ 25×14 Ultra انجام شد. پیکربندی سیستم: گیگابایت Z390 AORUS ELITE، CPU Intel Core i7-9700K، 16 گیگابایت DDR4، Win 10 Pro. عملکرد ممکن است بر اساس استفاده از آخرین درایورها متفاوت باشد. سازندگان لپتاپ ممکن است پیکربندیهای متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. RX-325
[2] آزمایش انجام شده توسط آزمایشگاههای عملکرد AMD در 10/21/20، اندازهگیری امتیازات FPS فردی و محاسبه میانگین امتیاز FPS در عناوین زیر: Assassins Creed Odyssey (DX11، Ultra)، Battlefield V (DX12، Ultra)، Borderlands 3 (DX12، Ultra)، کنترل (DX12، High)، Death Stranding (DX12 Ultra)، Division 2 (DX12، Ultra)، F1 2020 (DX12، Ultra)، Far Cry 5 (DX11، Ultra)، Gears of War 5 (DX12، Ultra , Hitman 2 (DX12, Ultra), Horizon Zero Dawn (DX12, Ultra), Metro Exodus (DX12, Ultra), Resident Evil 3 (DX12, Ultra), Shadow of the Tomb Raider (DX12, Highest), Strange Brigade ( DX12، Ultra)، Total War Three Kingdoms (DX11، Ultra)، Witcher 3 (DX11، Ultra no HairWorks) با کیفیت 4K. سیستمهای آزمایشی پیکربندی شده با پردازنده Core i9-9900K، پردازنده گرافیکی Radeon(TM) RX 6900 XT با درایور گرافیک AMD Radeon(TM) 27.20.12031.1000، حافظه 32 گیگابایت و Win 10 در مقابل یک سیستم با پیکربندی مشابه با RXon(TM) GPU 5700 XT و درایور گرافیک AMD Radeon(TM) 26.20.13001.9005. عملکرد بر وات با تقسیم TBP هر پردازنده گرافیکی ضربدر میانگین امتیاز FPS در همه عناوین محاسبه میشود. سازندگان لپتاپ ممکن است پیکربندیهای متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. عملکرد ممکن است متفاوت باشد. RX-554.
[3] آزمایش انجام شده توسط آزمایشگاههای عملکرد AMD در تاریخ 31 مه 2022، روی (11) کارت گرافیک AMD Radeon™ RX 6000 Series، با استفاده از سیستمهای پیکربندی شده با پردازندههای Ryzen™ 9 5900X و Ryzen™ 5 5600X، هر کدام با 16 گیگابایت DDRMHz-360 Smart Access و AMD فعال، Win 10 Pro در مقابل سیستمهایی با پیکربندی مشابه با (11) پردازندههای گرافیکی Nvidia GeForce RTX 3000 Series، GeForce GTX 1650 و GTX 1050 Ti که هر کدام ReBAR را فعال کردهاند.
عملکرد در 20 بازی با وضوح 4K، 1440P و 1080P در تنظیمات MAX، و در بین 12 بازی در تنظیمات متوسط 1080P برای هر یک از (22) پردازندههای گرافیکی AMD و NVIDIA تست شده است. عملکرد به ازای هر وات محاسبه شده با استفاده از توان کل برد (TBP) (22) واحد پردازش گرافیکی AMD و NVIDIA نسبت به میانگین امتیازات FPS. عملکرد به ازای هر دلار با استفاده از قیمتگذاری جزئی Newegg USD برای واحدهای گرافیکی AMD و NVIDIA و تا 22 اوت 2022، بیش از میانگین امتیازات FPS (22) کل GPUها محاسبه شده است. سازندگان لپتاپ ممکن است پیکربندیهای متفاوتی داشته باشند و نتایج متفاوتی را به همراه داشته باشند. عملکرد ممکن است متفاوت باشد. RX-785.
[4] اندازهگیریهای محاسبهشده توسط مهندسی AMD، روی کارت گرافیک Radeon RX 6000 Series با 128 مگابایت AMD Infinity Cache و 256 بیت GDDR6. با اندازهگیری میانگین بازیهای 4K، نرخ بازدید AMD Infinity Cache 58 درصد در میان عناوین برتر بازی، ضرب در حداکثر پهنای باند نظری از 16 64B AMD Infinity کانال های فابریک که کش را به موتور گرافیکی با فرکانس تقویت تا 1.94 گیگاهرتز متصل می کند. RX-535.
[5] بر اساس مدلسازی داخلی مهندسی AMD در اکتبر 2020، مصرف انرژی 3D Mark11 فقط با موتور گرافیکی متوسط در مقابل فرکانس پردازندههای گرافیکی Radeon RX 5700 XT و Radeon RX 6900 XT، تقسیم بر تعداد واحدهای محاسباتی (به ترتیب 40 و 80). RX-536
[6] بر اساس برآوردهای اولیه مهندسی داخلی AMD از اوت 2022. نتایج ممکن است با عرضه محصولات در بازار تغییر کند.
© 2022 Advanced Micro Devices, Inc. کلیه حقوق محفوظ است. AMD، آرم AMD Arrow، RDNA، Radeon، Ryzen، Smart Access Memory، Infinity Cache و ترکیبی از آنها علائم تجاری Advanced Micro Devices, Inc. Unreal و نشان آن علائم تجاری یا علائم تجاری ثبت شده Epic Games، Inc. در ایالات متحده و در جای دیگر نام های دیگر محصولات استفاده شده در این نشریه فقط برای اهداف شناسایی هستند و ممکن است علائم تجاری صاحبان مربوطه باشند.