در متن: وقتی صحبت از محصولات فناوری می شود، مفاهیم اغلب زیباتر از واقعیت هستند. قابلیتها و عملکردهایی که منطقی و ساده به نظر میرسند، اغلب بسیار پیچیدهتر یا دشوارتر از آنچه در ابتدا به نظر میرسند نشان میدهند.
البته بخشی از مشکل این است که بسیاری از پیشرفته ترین فناوری ها پیچیده هستند و زنده کردن آنها می تواند بسیار دشوار باشد. اما مشکل رایجتر این است که الزامات از پیش موجود به طور کامل توضیح داده نشدهاند، یا تعداد مراحل مورد نیاز میتواند بسیار چالشبرانگیزتر از آنچه در ابتدا به نظر میرسد باشد.
به بیان ساده، «شیطان در جزئیات است».
این در مورد بسیاری از فناوری های ابری و هوش مصنوعی صادق است. ایدههای محصول سطح بالا، مانند توانایی تجزیه و تحلیل سریع هر نوع داده برای کمک به تولید مدلهای مبتنی بر هوش مصنوعی (AI) یا یادگیری ماشین (ML) با استفاده از انواع جدید شتابدهندههای سختافزاری، سالهاست که در مورد آن صحبت میشود.
همانطور که گوگل از طریق چندین اعلامیه در رویداد Cloud Next خود به صراحت اعلام کرد، با این حال، جزئیات مهم زیادی وجود دارد که باید برای تحقق این ایده ها وجود داشته باشد.
برای شروع، همه ابزارهای تجزیه و تحلیل داده ها و پلت فرم های داده نمی توانند با هر نوع داده ای کار کنند. به همین دلیل است که توانایی وارد کردن یا وارد کردن انواع داده با فرمت های جدید و متفاوت در طیف وسیع تری از ابزارهای تحلیلی بسیار مهم است. باز کردن امکان دسترسی پلتفرمهای داده مانند Elastic به دادههای ذخیرهشده در Google Cloud و ارائه پشتیبانی Google از Elastic به خط جدید توسعه یافته Looker از ابزارهای تحلیل کسبوکار، تنها دو مورد از بسیاری از اعلامیههای مرتبط با دادههای باز است که در Cloud منتشر شده است. بعد.
به طور مشابه، انواع مختلف داده ها اغلب در قالب های مختلف ذخیره می شوند، و ابزارهای تجزیه و تحلیل باید به طور خاص پشتیبانی از این ساختارهای داده را فعال کنند تا آنها را برای طیف وسیع تری از کاربران و توسعه دهندگان برنامه مفیدتر کنند.
به عنوان مثال، در زمینه رو به رشد دریاچههای داده، جایی که «دریاچههای» بزرگ از دادههای بدون ساختار، مانند ویدیو و صدا، با انواع ابزارهای موجود در انبارهای داده ساختاریافته، امکان پرسوجو دارند، قالب جدول منبع باز Apache Iceberg به طور فزاینده ای محبوب می شود.
به همین دلیل است که گوگل پشتیبانی از آن و فرمت های دیگر، از جمله Delta و Hudi را به موتور ذخیره سازی BigLake خود اضافه کرد و پشتیبانی از تجزیه و تحلیل داده های بدون ساختار را به ابزارهای تجزیه و تحلیل داده BigQuery اضافه کرد. این نه تنها انعطافپذیری بیشتری را فراهم میکند، بلکه به این معنی است که دادههای بدون ساختار میتوانند از ابزارهای جستجوی بزرگ Google Cloud Platform (GCP) از جمله عملکردهای ML مانند تشخیص گفتار، بینایی رایانه، پردازش متن و غیره استفاده کنند.
یکی دیگر از زمینه های مهم توسعه مربوط به استفاده از انواع مختلف تراشه های شتاب دهنده سخت افزاری برای بهبود عملکرد مدل هوش مصنوعی است. به عنوان مثال، گوگل چندین نسل از TPU ها (واحدهای پردازش تانسور) ایجاد کرده است که مزایای مهمی را برای برنامه هایی مانند آموزش مدل هوش مصنوعی یا استنتاج ارائه می دهند. علاوه بر این، اخیراً اعلامیههای زیادی از سوی شرکتهای نیمهرسانای معتبر مانند اینتل، AMD، انویدیا، و کوالکام و همچنین تعداد زیادی از استارتآپهای تراشهای که بر روی این حوزه در حال رشد متمرکز شدهاند، منتشر شده است.
همانطور که ممکن است انتظار داشته باشید، هر یک از این شرکت های تولید تراشه از تکنیک های مختلفی برای انجام شتاب مدل های هوش مصنوعی و ML استفاده می کنند. چیزی که واضح نیست این است که روش های لازم برای نوشتن نرم افزار یا ایجاد مدل برای شتاب دهنده های مختلف نیز اختصاصی است. در نتیجه، برای توسعهدهندگان نرمافزار و سازندگان مدلهای AI/ML چالشبرانگیز است که از این تراشههای مختلف استفاده کنند، زیرا یادگیری همه این رویکردهای منحصربهفرد چقدر میتواند دشوار باشد.
برای پرداختن به این موضوع، چند اعلامیه جذابتر گوگل از Cloud Next، راهاندازی یک کنسرسیوم صنعتی جدید به نام پروژه OpenXLA و معرفی ابزارهای نرمافزاری منبع باز جدید است که برای تسهیل فرآیند کار با انواع مختلف شتابدهندههای سختافزاری طراحی شدهاند. .
OpenXLA برای افزایش انعطافپذیری انتخابهایی که توسعهدهندگان AI/ML دارند با ایجاد ارتباط بین بسیاری از فریمورکهای front-end محبوب مورد استفاده برای ساخت مدلهای AI – از جمله TensorFlow، PyTorch و JAX – و مجموعهای از باطنهای شتابدهنده سختافزاری طراحی شده است. ابزارهای نرم افزاری اولیه منتشر شده شامل یک کامپایلر ارتقا یافته XLA و مجموعه ای قابل حمل از عملیات محاسباتی ML به نام StableHLO است.
شرکت هایی که در این ابتکار به گوگل پیوسته اند عبارتند از اینتل، خدمات وب آمازون، AMD، Nvidia، Arm، Meta و غیره. گنجاندن اینتل جالب است زیرا از بسیاری جهات، هدف پروژه OpenXLA شبیه به OneAPI خود اینتل است، که هدف آن اجازه دادن به توسعه دهندگان برای استفاده از چندین نوع معماری محاسباتی اینتل مانند پردازندهها، پردازندههای گرافیکی و شتابدهندههای هوش مصنوعی Habana Gaudi است. بدون نیاز به یادگیری نحوه برنامه نویسی برای هر یک از انواع مختلف تراشه. OpenXLA این مفهوم را به سطح صنعت می برد و به لطف گنجاندن بسیاری از بازیگران کلیدی محاسبات ابری، باید تعدادی فرصت مهم جدید را باز کند و در پذیرش شتاب دهنده های سخت افزاری سرعت بخشد.
مانند بسیاری از اعلامیههای گوگل در Cloud Next، مزایای واقعی پروژه OpenXLA و ابزارهای مرتبط با آن مدتی طول میکشد تا تأثیر قابلتوجهی داشته باشد. در تصویر کلی از روندهای صنعت فناوری، این ابزارها ممکن است به خودی خود کمی ساده به نظر برسند. با این حال، در مجموع، آنها گامهای بسیار مهمی را به جلو نشان میدهند و نشاندهنده انواع تلاشهایی هستند که گوگل برای مفیدتر کردن ابزارهای خود برای مخاطبان گستردهتری انجام میدهد.
آنها همچنین تاکید زیادی بر ابزارهای منبع باز و تمایل به ایجاد شفافیت و انعطاف پذیری بیشتر پلتفرم Google Cloud و پیشنهادات مرتبط با آن دارند. روند استفاده از تمام ابزارهای فناوری که گوگل ارائه می دهد بدون شک هنوز پیچیده است، اما با مجموعه گسترده ای از اعلامیه هایی که این شرکت در Cloud Next رونمایی کرد، واضح است که تکامل این شرکت به عنوان یک ارائه دهنده بزرگ ابری همچنان در حال پیشرفت است.
Bob O’Donnell بنیانگذار و تحلیلگر ارشد TECHnalysis Research، LLC یک شرکت مشاوره فناوری است که خدمات مشاوره استراتژیک و تحقیقات بازار را به صنعت فناوری و جامعه مالی حرفه ای ارائه می دهد. می توانید او را در توییتر دنبال کنید @bobodtech.