گوگل از مجموعه‌ای از پیشرفت‌های داده باز و هوش مصنوعی در Cloud Next رونمایی می‌کند


در متن: وقتی صحبت از محصولات فناوری می شود، مفاهیم اغلب زیباتر از واقعیت هستند. قابلیت‌ها و عملکردهایی که منطقی و ساده به نظر می‌رسند، اغلب بسیار پیچیده‌تر یا دشوارتر از آنچه در ابتدا به نظر می‌رسند نشان می‌دهند.

البته بخشی از مشکل این است که بسیاری از پیشرفته ترین فناوری ها پیچیده هستند و زنده کردن آنها می تواند بسیار دشوار باشد. اما مشکل رایج‌تر این است که الزامات از پیش موجود به طور کامل توضیح داده نشده‌اند، یا تعداد مراحل مورد نیاز می‌تواند بسیار چالش‌برانگیزتر از آنچه در ابتدا به نظر می‌رسد باشد.

به بیان ساده، «شیطان در جزئیات است».

این در مورد بسیاری از فناوری های ابری و هوش مصنوعی صادق است. ایده‌های محصول سطح بالا، مانند توانایی تجزیه و تحلیل سریع هر نوع داده برای کمک به تولید مدل‌های مبتنی بر هوش مصنوعی (AI) یا یادگیری ماشین (ML) با استفاده از انواع جدید شتاب‌دهنده‌های سخت‌افزاری، سالهاست که در مورد آن صحبت می‌شود.

همانطور که گوگل از طریق چندین اعلامیه در رویداد Cloud Next خود به صراحت اعلام کرد، با این حال، جزئیات مهم زیادی وجود دارد که باید برای تحقق این ایده ها وجود داشته باشد.

برای شروع، همه ابزارهای تجزیه و تحلیل داده ها و پلت فرم های داده نمی توانند با هر نوع داده ای کار کنند. به همین دلیل است که توانایی وارد کردن یا وارد کردن انواع داده با فرمت های جدید و متفاوت در طیف وسیع تری از ابزارهای تحلیلی بسیار مهم است. باز کردن امکان دسترسی پلتفرم‌های داده مانند Elastic به داده‌های ذخیره‌شده در Google Cloud و ارائه پشتیبانی Google از Elastic به خط جدید توسعه یافته Looker از ابزارهای تحلیل کسب‌وکار، تنها دو مورد از بسیاری از اعلامیه‌های مرتبط با داده‌های باز است که در Cloud منتشر شده است. بعد.

به طور مشابه، انواع مختلف داده ها اغلب در قالب های مختلف ذخیره می شوند، و ابزارهای تجزیه و تحلیل باید به طور خاص پشتیبانی از این ساختارهای داده را فعال کنند تا آنها را برای طیف وسیع تری از کاربران و توسعه دهندگان برنامه مفیدتر کنند.

به عنوان مثال، در زمینه رو به رشد دریاچه‌های داده، جایی که «دریاچه‌های» بزرگ از داده‌های بدون ساختار، مانند ویدیو و صدا، با انواع ابزارهای موجود در انبارهای داده ساختاریافته، امکان پرس‌وجو دارند، قالب جدول منبع باز Apache Iceberg به طور فزاینده ای محبوب می شود.

به همین دلیل است که گوگل پشتیبانی از آن و فرمت های دیگر، از جمله Delta و Hudi را به موتور ذخیره سازی BigLake خود اضافه کرد و پشتیبانی از تجزیه و تحلیل داده های بدون ساختار را به ابزارهای تجزیه و تحلیل داده BigQuery اضافه کرد. این نه تنها انعطاف‌پذیری بیشتری را فراهم می‌کند، بلکه به این معنی است که داده‌های بدون ساختار می‌توانند از ابزارهای جستجوی بزرگ Google Cloud Platform (GCP) از جمله عملکردهای ML مانند تشخیص گفتار، بینایی رایانه، پردازش متن و غیره استفاده کنند.

یکی دیگر از زمینه های مهم توسعه مربوط به استفاده از انواع مختلف تراشه های شتاب دهنده سخت افزاری برای بهبود عملکرد مدل هوش مصنوعی است. به عنوان مثال، گوگل چندین نسل از TPU ها (واحدهای پردازش تانسور) ایجاد کرده است که مزایای مهمی را برای برنامه هایی مانند آموزش مدل هوش مصنوعی یا استنتاج ارائه می دهند. علاوه بر این، اخیراً اعلامیه‌های زیادی از سوی شرکت‌های نیمه‌رسانای معتبر مانند اینتل، AMD، انویدیا، و کوالکام و همچنین تعداد زیادی از استارت‌آپ‌های تراشه‌ای که بر روی این حوزه در حال رشد متمرکز شده‌اند، منتشر شده است.

همانطور که ممکن است انتظار داشته باشید، هر یک از این شرکت های تولید تراشه از تکنیک های مختلفی برای انجام شتاب مدل های هوش مصنوعی و ML استفاده می کنند. چیزی که واضح نیست این است که روش های لازم برای نوشتن نرم افزار یا ایجاد مدل برای شتاب دهنده های مختلف نیز اختصاصی است. در نتیجه، برای توسعه‌دهندگان نرم‌افزار و سازندگان مدل‌های AI/ML چالش‌برانگیز است که از این تراشه‌های مختلف استفاده کنند، زیرا یادگیری همه این رویکردهای منحصربه‌فرد چقدر می‌تواند دشوار باشد.

برای پرداختن به این موضوع، چند اعلامیه جذاب‌تر گوگل از Cloud Next، راه‌اندازی یک کنسرسیوم صنعتی جدید به نام پروژه OpenXLA و معرفی ابزارهای نرم‌افزاری منبع باز جدید است که برای تسهیل فرآیند کار با انواع مختلف شتاب‌دهنده‌های سخت‌افزاری طراحی شده‌اند. .

OpenXLA برای افزایش انعطاف‌پذیری انتخاب‌هایی که توسعه‌دهندگان AI/ML دارند با ایجاد ارتباط بین بسیاری از فریم‌ورک‌های front-end محبوب مورد استفاده برای ساخت مدل‌های AI – از جمله TensorFlow، PyTorch و JAX – و مجموعه‌ای از باطن‌های شتاب‌دهنده سخت‌افزاری طراحی شده است. ابزارهای نرم افزاری اولیه منتشر شده شامل یک کامپایلر ارتقا یافته XLA و مجموعه ای قابل حمل از عملیات محاسباتی ML به نام StableHLO است.

شرکت هایی که در این ابتکار به گوگل پیوسته اند عبارتند از اینتل، خدمات وب آمازون، AMD، Nvidia، Arm، Meta و غیره. گنجاندن اینتل جالب است زیرا از بسیاری جهات، هدف پروژه OpenXLA شبیه به OneAPI خود اینتل است، که هدف آن اجازه دادن به توسعه دهندگان برای استفاده از چندین نوع معماری محاسباتی اینتل مانند پردازنده‌ها، پردازنده‌های گرافیکی و شتاب‌دهنده‌های هوش مصنوعی Habana Gaudi است. بدون نیاز به یادگیری نحوه برنامه نویسی برای هر یک از انواع مختلف تراشه. OpenXLA این مفهوم را به سطح صنعت می برد و به لطف گنجاندن بسیاری از بازیگران کلیدی محاسبات ابری، باید تعدادی فرصت مهم جدید را باز کند و در پذیرش شتاب دهنده های سخت افزاری سرعت بخشد.

مانند بسیاری از اعلامیه‌های گوگل در Cloud Next، مزایای واقعی پروژه OpenXLA و ابزارهای مرتبط با آن مدتی طول می‌کشد تا تأثیر قابل‌توجهی داشته باشد. در تصویر کلی از روندهای صنعت فناوری، این ابزارها ممکن است به خودی خود کمی ساده به نظر برسند. با این حال، در مجموع، آنها گام‌های بسیار مهمی را به جلو نشان می‌دهند و نشان‌دهنده انواع تلاش‌هایی هستند که گوگل برای مفیدتر کردن ابزارهای خود برای مخاطبان گسترده‌تری انجام می‌دهد.

آنها همچنین تاکید زیادی بر ابزارهای منبع باز و تمایل به ایجاد شفافیت و انعطاف پذیری بیشتر پلتفرم Google Cloud و پیشنهادات مرتبط با آن دارند. روند استفاده از تمام ابزارهای فناوری که گوگل ارائه می دهد بدون شک هنوز پیچیده است، اما با مجموعه گسترده ای از اعلامیه هایی که این شرکت در Cloud Next رونمایی کرد، واضح است که تکامل این شرکت به عنوان یک ارائه دهنده بزرگ ابری همچنان در حال پیشرفت است.

Bob O’Donnell بنیانگذار و تحلیلگر ارشد TECHnalysis Research، LLC یک شرکت مشاوره فناوری است که خدمات مشاوره استراتژیک و تحقیقات بازار را به صنعت فناوری و جامعه مالی حرفه ای ارائه می دهد. می توانید او را در توییتر دنبال کنید @bobodtech.





منبع