رقابت برای برتری هوش مصنوعی در میان غولهای فناوری تازه آغاز شده است و در حال حاضر فراتر از ارائه مقادیر عظیم داده به مدلهایی مانند ChatGPT معروف (یا بدنام، بسته به دیدگاه شما) است که تقریباً بخشی از هر چرخه خبری است.
گزارشی از The Information ادعا می کند که مایکروسافت در حال حاضر در حال توسعه یک تراشه هوش مصنوعی سفارشی برای آموزش مدل های خود است. این قطعه مرموز سیلیکون با نام رمز “آتنا” شناخته می شود و طبق گزارش ها، شرکت کار بر روی آن را در سال 2019 آغاز کرده است. در حال حاضر، تنها گروه کوچکی از کارمندان مایکروسافت و OpenAI به آن دسترسی دارند تا نحوه عملکرد آن را هنگام استفاده برای مدل های زبان بزرگ آزمایش کنند. مانند GPT-4.
مشکل اینجاست که انویدیا تنها می تواند تعداد زیادی پردازنده گرافیکی A100 و H100 بسازد و هر یک از آنها هزینه کمی دارند. پردازندههای گرافیکی A100 هر کدام حدود 10000 دلار قیمت دارند و پردازندههای گرافیکی مدرنتر H100 در eBay بیش از 40000 دلار قیمت دارند. تیم گرین از تقاضای سرخورده آنقدر خوشحال است که بخشی از ظرفیت تولید پردازندههای گرافیکی GeForce RTX 4090 را به سمت تولید پردازندههای گرافیکی H100 تغییر میدهد.
با توجه به اینکه 300 نفر بر روی تراشه Athena کار می کنند و چندین نسل برای سال های آینده برنامه ریزی شده اند، جالب است که ببینیم شراکت موجود مایکروسافت با انویدیا چه می شود. در هر صورت، غول ردموند مشغول پختن فناوری هوش مصنوعی در هر محصول یا خدماتی است که ارائه میکند، خواه مرورگر Edge، موتور جستجوی Bing، مجموعه Microsoft 365، GitHub و موارد دیگر.
بنابراین، نباید تعجبآور باشد که شرکتهایی مانند مایکروسافت تلاش میکنند تا اتکای خود به یک فروشنده را برای تلاشهای یادگیری ماشینی خود کاهش دهند. این همچنین می تواند منجر به صرفه جویی قابل توجهی در هزینه ها شود، به همین دلیل است که آمازون، متا و گوگل همان مسیر را برای ساخت تراشه های داخلی دنبال می کنند.
چرا مهم است: با توجه به رشد سریعتر مدلهای هوش مصنوعی مولد نسبت به قابلیتهای محاسباتی مورد نیاز برای آموزش و اجرای آنها، جای تعجب نیست که شرکتهایی مانند مایکروسافت در حال بررسی راهحلهای داخلی بهعنوان جایگزینی برای سختافزار خارج از قفسه از شرکت غالب در بخشهای اختصاصی هستند. فضای GPU
جالب اینجاست که یک گزارش جداگانه از Thurrott نشان می دهد که مایکروسافت همچنین در حال توسعه یک واحد پردازش عصبی (NPU) برای خط دستگاه های Surface خود است. در حال حاضر از پردازندهها و SoCهای Intel، AMD و Qualcomm استفاده میکند – تا کنون تنها نسخه کوالکام سرفیس پرو 9 دارای NPU است.
شرکتهای بزرگ و کوچک در حال استفاده از هر پردازنده گرافیکی انویدیا درجه سازمانی هستند تا بتوانند سیستمهای قدرتمندی را که برای آموزش مدلهای هوش مصنوعی با استفاده از مجموعههای دادهای انتخابشده مورد نیاز است، بسازند. این همان سخت افزاری است که آن ها برای اجرای مدل ها و انجام کاری به نام «استنتاج» استفاده می کنند – فرآیندی که اطلاعات یا ورودی های دنیای واقعی را می گیرد و محتوای مفیدی را برای یک برنامه خاص تولید می کند.