اینتل می‌گوید شتاب‌دهنده Gaudi2 آن چیزی بیش از یک همتای Nvidia A100 است


به طور خلاصه: اینتل رقابتی را بین شتاب‌دهنده جدید Gaudi2 خود و انویدیا A100 پیشتاز دو ساله بازار ایجاد کرده است. در دو معیار مناسب با جایگاه خود، شتاب‌دهنده جدید با نام زیبا جلوتر می‌آید.

Gaudi2 توسط Habana Labs، یک شرکت اسرائیلی که در پایان سال 2019 آن را به قیمت 2 میلیارد دلار خریداری کرد، برای اینتل ساخته شده است. هابانا در واقع دو نوع شتاب دهنده تخصصی می سازد: برخی برای آموزش شبکه های عصبی مانند Gaudi2. و دیگران برای اجرا (یعنی “استنتاج”) آنها، مانند گویا و گرکو.

کارایی

هابانا و اینتل Gaudi2 را در ماه مه راه‌اندازی کردند، اما تا هفته گذشته منتظر ماندند تا امتیازات بنچمارک خود را در پایگاه داده عمومی MLPerf بارگذاری کنند. آنها در نمودارهای خود امتیازات سیستم Gaudi2 خود را با امتیازات عمومی سیستم های مجهز به A100 از Nvidia و Dell مقایسه می کنند.

ResNet-50 توانایی سخت افزار برای آموزش هوش مصنوعی برای طبقه بندی تصاویر را آزمایش می کند. سیستم Gaudi2 هابانا فقط 18 دقیقه طول کشید تا هوش مصنوعی را به خوبی آموزش دهد تا بتواند آزمایش را پشت سر بگذارد و به راحتی از سیستم A100 انویدیا که تقریباً نیم ساعت زمان نیاز داشت، پیشی گرفت.

سیستم Gaudi2 هابانا فقط 17 دقیقه طول کشید تا مدل BERT را آموزش دهد و زمان سیستم A100 انویدیا را حدود یک دقیقه شکست دهد. BERT یک مدل پردازش زبان طبیعی است و در این آزمون خود را با مقالات ویکی پدیا آموزش می دهد.

برای هر دو معیار، همه سیستم ها از هشت شتاب دهنده/GPU استفاده کردند. سیستم Habana سیستم آنها را با یک جفت CPU 40 هسته ای Intel Xeon 8380 و Nvidia از دو CPU 64 هسته ای AMD Epyc 7742 جفت کرد.

مشخصات فنی

Gaudi2 دارای 24 TPC (هسته های پردازشگر تانسور) و دو MME (موتورهای ضرب ماتریس) است که تا حدی به صورت موازی کار می کنند. این مجموعه گسترده ای از انواع داده ها، از جمله FP32، TF32، BF16، FP16 و FP8 را پشتیبانی می کند. همچنین دارای یک موتور رسانه ای اختصاصی برای پردازش رسانه های صوتی و تصویری به عنوان ورودی است.

برای حافظه، Gaudi2 دارای شش پشته 16 گیگابایتی HBM2e است که مجموعاً 96 گیگابایت و 2.45 ترابایت بر ثانیه از کل پهنای باند حافظه را شامل می شود. داخل آن یک کش 48 مگابایتی دارد. برای اتصال، از یک اتصال x16 PCIe 4.0 استفاده می‌کند و دارای پورت‌های 24×100 مگابیت بر ثانیه RoCE2 (RDMA بر روی اترنت همگرا 2) است.

رقابت

هابانا به وضوح یک رقیب واقعی A100 برای اینتل ایجاد کرده است. با توجه به اینکه انویدیا H100 را سه ماه پیش معرفی کرد، زمان بندی آن می تواند بهتر باشد، اما این دو محصول به قدری متفاوت هستند که اگرچه ممکن است در بنچمارک ها با هم رقابت کنند، ممکن است واقعاً برای اسلات مادربرد رقابت نکنند.

در حالی که A100 و H100 غول‌های همه کاره هستند، Gaudi2 یک شتاب‌دهنده ساده است که تلاش می‌کند کاری متفاوت انجام دهد، و دیدن موفقیت یا عدم موفقیت آن بسیار جذاب خواهد بود.



منبع