AlphaEvolve: یک عامل برنامه‌نویسی مبتنی بر Gemini برای طراحی الگوریتم‌های پیشرفته است

عامل هوش مصنوعی جدیدی با ترکیب خلاقیت مدل‌های زبانی بزرگ و ارزیاب‌های خودکار، الگوریتم‌هایی را برای ریاضیات و کاربردهای عملی در رایانش توسعه می‌دهد.

مدل‌های زبانی بزرگ (LLM) از انعطاف‌پذیری شگفت‌انگیزی برخوردارند. آن‌ها می‌توانند اسناد را خلاصه کنند، کد تولید کنند یا حتی ایده‌های جدید ارائه دهند. اکنون ما این توانایی‌ها را گسترش داده‌ایم تا مسائل بنیادی و بسیار پیچیده در ریاضیات و رایانش مدرن را هدف قرار دهیم.

امروز، AlphaEvolve را معرفی می‌کنیم — یک عامل برنامه‌نویسی تکاملی که با استفاده از مدل‌های زبانی بزرگ برای کشف و بهینه‌سازی الگوریتم‌های عمومی طراحی شده است. AlphaEvolve توانایی حل مسئله خلاقانه مدل‌های Gemini را با ارزیاب‌های خودکار که پاسخ‌ها را بررسی می‌کنند ترکیب می‌کند، و با استفاده از یک چارچوب تکاملی، ایده‌های امیدوارکننده را بهبود می‌بخشد.

AlphaEvolve باعث افزایش بهره‌وری در مراکز داده گوگل، طراحی تراشه و فرآیندهای آموزش هوش مصنوعی — از جمله آموزش مدل‌های زبانی بزرگی که خود AlphaEvolve بر پایه آن‌ها ساخته شده — شده است. این عامل همچنین به طراحی الگوریتم‌های سریع‌تر برای ضرب ماتریس‌ها و یافتن راه‌حل‌های جدید برای مسائل باز ریاضی کمک کرده است، و نویدبخش کاربردهای گسترده‌ای در زمینه‌های مختلف است.

طراحی الگوریتم‌های بهتر با استفاده از مدل‌های زبانی بزرگ

در سال ۲۰۲۳، برای نخستین‌بار نشان داده شد که مدل‌های زبانی بزرگ قادرند توابعی را به‌صورت کد رایانه‌ای تولید کنند که در کشف دانش جدید و اثبات‌پذیر در یک مسئله علمی باز نقش دارند. AlphaEvolve عاملی است که فراتر از کشف یک تابع عمل می‌کند و توانایی تکامل پایگاه‌های کد کامل و توسعه الگوریتم‌های بسیار پیچیده‌تر را دارد.

AlphaEvolve از مجموعه‌ای از پیشرفته‌ترین مدل‌های زبانی بزرگ بهره می‌برد. Gemini Flash، سریع‌ترین و کارآمدترین مدل این مجموعه، برای گسترش دامنه ایده‌های بررسی‌شده به کار گرفته می‌شود، در حالی‌که Gemini Pro، قدرتمندترین مدل، عمق تحلیلی مورد نیاز را از طریق پیشنهادهای دقیق و بینش‌محور فراهم می‌کند. این مدل‌ها در کنار هم برنامه‌هایی رایانه‌ای تولید می‌کنند که راه‌حل‌های الگوریتمی را در قالب کد پیاده‌سازی می‌نمایند.

تصویر 1) نموداری که نشان می‌دهد چگونه نمونه‌گیر دستورات (prompt sampler) ابتدا یک دستور (prompt) را برای مدل‌های زبانی ایجاد می‌کند، سپس این مدل‌ها برنامه‌های جدیدی تولید می‌کنند. این برنامه‌ها توسط ارزیاب‌ها (evaluators) ارزیابی شده و در پایگاه داده برنامه‌ها ذخیره می‌شوند. این پایگاه داده از یک الگوریتم تکاملی استفاده می‌کند که تعیین می‌کند کدام برنامه‌ها در دستورات آینده به کار گرفته شوند.

AlphaEvolve برنامه‌های پیشنهادی را با استفاده از معیارهای ارزیابی خودکار اجرا، بررسی و امتیازدهی می‌کند. این معیارها ارزیابی‌ای عینی و قابل اندازه‌گیری از دقت و کیفیت هر راه‌حل ارائه می‌دهند. همین ویژگی باعث می‌شود AlphaEvolve در حوزه‌های متنوعی که پیشرفت در آن‌ها به‌صورت روشن و سیستماتیک قابل سنجش است — مانند ریاضیات و علوم کامپیوتر — بسیار مفید واقع شود.

بهینه‌سازی اکوسیستم محاسباتی

در سال گذشته، الگوریتم‌هایی که توسط AlphaEvolve کشف شده‌اند در سراسر اکوسیستم محاسباتی گوگل، از جمله مراکز داده، سخت‌افزار و نرم‌افزار این شرکت به‌کار گرفته شده‌اند. تأثیر هر یک از این بهبودها در زیرساخت‌های هوش مصنوعی و محاسباتی گوگل چند برابر شده است تا اکوسیستمی دیجیتال قدرتمندتر و پایدارتر برای تمامی کاربران ایجاد شود.

تصویر 2) نموداری که نشان می‌دهد چگونه AlphaEvolve به گوگل کمک می‌کند تا اکوسیستم دیجیتال کارآمدتری ارائه دهد، از زمان‌بندی مراکز داده و طراحی سخت‌افزار گرفته تا آموزش مدل‌های هوش مصنوعی.

بهبود زمان‌بندی مراکز داده

AlphaEvolve یک روش ساده اما بسیار مؤثر را کشف کرد تا به سیستم بورگ (Borg) کمک کند مراکز داده وسیع گوگل را به‌صورت بهینه‌تری مدیریت کند. این راه‌حل که بیش از یک سال است در حال استفاده است، به‌طور متوسط ۰.۷٪ از منابع محاسباتی جهانی گوگل را به‌طور مداوم بازیابی می‌کند. این افزایش پایداری در بهره‌وری به این معناست که در هر لحظه می‌توان کارهای بیشتری را با همان ظرفیت محاسباتی انجام داد. راه‌حل AlphaEvolve نه تنها عملکرد قوی‌ای ارائه می‌دهد، بلکه مزایای عملی قابل توجهی نیز دارد، از جمله کد قابل فهم برای انسان که قابلیت تفسیر، رفع اشکال، پیش‌بینی و سهولت در پیاده‌سازی را فراهم می‌کند.

کمک به طراحی سخت‌افزار

AlphaEvolve پیشنهادی برای بازنویسی کد Verilog ارائه داد که بیت‌های غیرضروری را در یک مدار حسابی کلیدی و بسیار بهینه‌شده برای ضرب ماتریس حذف می‌کند. نکته مهم این است که این پیشنهاد باید از روش‌های تأیید صحت قوی عبور کند تا اطمینان حاصل شود که مدار اصلاح‌شده عملکرد صحیح خود را حفظ می‌کند. این پیشنهاد در یک واحد پردازش تنسور (TPU) آینده، شتاب‌دهنده‌ی سفارشی هوش مصنوعی گوگل، ادغام شد. با ارائه تغییرات به زبان استاندارد طراحان تراشه، AlphaEvolve رویکردی تعاملی میان هوش مصنوعی و مهندسان سخت‌افزار را ترویج می‌دهد تا طراحی تراشه‌های تخصصی آینده را تسریع کند.

بهبود آموزش و استنتاج هوش مصنوعی

AlphaEvolve عملکرد هوش مصنوعی و سرعت تحقیقات را تسریع می‌بخشد. با یافتن روش‌های هوشمندانه‌تر برای تقسیم عملیات ضرب ماتریس بزرگ به زیرمسائل قابل مدیریت‌تر، این عامل توانست بخش حیاتی معماری Gemini را ۲۳٪ سریع‌تر کند که منجر به کاهش ۱٪ در زمان آموزش مدل Gemini شد. از آنجا که توسعه مدل‌های هوش مصنوعی مولد به منابع محاسباتی قابل توجهی نیاز دارد، هر بهینه‌سازی به صرفه‌جویی قابل‌توجهی در هزینه‌ها منجر می‌شود. علاوه بر افزایش عملکرد، AlphaEvolve به طور چشمگیری زمان مهندسی مورد نیاز برای بهینه‌سازی هسته‌های محاسباتی را از هفته‌ها تلاش کارشناسان به چند روز آزمایش خودکار کاهش می‌دهد و به پژوهشگران اجازه می‌دهد سریع‌تر نوآوری کنند.

AlphaEvolve همچنین قادر است دستورالعمل‌های سطح پایین GPU را بهینه کند. این حوزه بسیار پیچیده معمولاً توسط کامپایلرها به شدت بهینه شده است و مهندسان معمولاً مستقیماً آن را تغییر نمی‌دهند. AlphaEvolve توانست تا ۳۲.۵٪ سرعت بخشیدن به اجرای هسته FlashAttention در مدل‌های هوش مصنوعی مبتنی بر Transformer را محقق کند. این نوع بهینه‌سازی به کارشناسان کمک می‌کند تا گلوگاه‌های عملکرد را شناسایی کرده و به‌راحتی بهبودها را در پایگاه کد خود وارد کنند، که بهره‌وری آن‌ها را افزایش داده و صرفه‌جویی‌های آینده در محاسبات و انرژی را ممکن می‌سازد.

AlphaEvolve: یک عامل برنامه‌نویسی مبتنی بر Gemini برای طراحی الگوریتم‌های پیشرفته است