AlphaEvolve: یک عامل برنامهنویسی مبتنی بر Gemini برای طراحی الگوریتمهای پیشرفته است

عامل هوش مصنوعی جدیدی با ترکیب خلاقیت مدلهای زبانی بزرگ و ارزیابهای خودکار، الگوریتمهایی را برای ریاضیات و کاربردهای عملی در رایانش توسعه میدهد.
مدلهای زبانی بزرگ (LLM) از انعطافپذیری شگفتانگیزی برخوردارند. آنها میتوانند اسناد را خلاصه کنند، کد تولید کنند یا حتی ایدههای جدید ارائه دهند. اکنون ما این تواناییها را گسترش دادهایم تا مسائل بنیادی و بسیار پیچیده در ریاضیات و رایانش مدرن را هدف قرار دهیم.
امروز، AlphaEvolve را معرفی میکنیم — یک عامل برنامهنویسی تکاملی که با استفاده از مدلهای زبانی بزرگ برای کشف و بهینهسازی الگوریتمهای عمومی طراحی شده است. AlphaEvolve توانایی حل مسئله خلاقانه مدلهای Gemini را با ارزیابهای خودکار که پاسخها را بررسی میکنند ترکیب میکند، و با استفاده از یک چارچوب تکاملی، ایدههای امیدوارکننده را بهبود میبخشد.
AlphaEvolve باعث افزایش بهرهوری در مراکز داده گوگل، طراحی تراشه و فرآیندهای آموزش هوش مصنوعی — از جمله آموزش مدلهای زبانی بزرگی که خود AlphaEvolve بر پایه آنها ساخته شده — شده است. این عامل همچنین به طراحی الگوریتمهای سریعتر برای ضرب ماتریسها و یافتن راهحلهای جدید برای مسائل باز ریاضی کمک کرده است، و نویدبخش کاربردهای گستردهای در زمینههای مختلف است.
طراحی الگوریتمهای بهتر با استفاده از مدلهای زبانی بزرگ
در سال ۲۰۲۳، برای نخستینبار نشان داده شد که مدلهای زبانی بزرگ قادرند توابعی را بهصورت کد رایانهای تولید کنند که در کشف دانش جدید و اثباتپذیر در یک مسئله علمی باز نقش دارند. AlphaEvolve عاملی است که فراتر از کشف یک تابع عمل میکند و توانایی تکامل پایگاههای کد کامل و توسعه الگوریتمهای بسیار پیچیدهتر را دارد.
AlphaEvolve از مجموعهای از پیشرفتهترین مدلهای زبانی بزرگ بهره میبرد. Gemini Flash، سریعترین و کارآمدترین مدل این مجموعه، برای گسترش دامنه ایدههای بررسیشده به کار گرفته میشود، در حالیکه Gemini Pro، قدرتمندترین مدل، عمق تحلیلی مورد نیاز را از طریق پیشنهادهای دقیق و بینشمحور فراهم میکند. این مدلها در کنار هم برنامههایی رایانهای تولید میکنند که راهحلهای الگوریتمی را در قالب کد پیادهسازی مینمایند.

تصویر 1) نموداری که نشان میدهد چگونه نمونهگیر دستورات (prompt sampler) ابتدا یک دستور (prompt) را برای مدلهای زبانی ایجاد میکند، سپس این مدلها برنامههای جدیدی تولید میکنند. این برنامهها توسط ارزیابها (evaluators) ارزیابی شده و در پایگاه داده برنامهها ذخیره میشوند. این پایگاه داده از یک الگوریتم تکاملی استفاده میکند که تعیین میکند کدام برنامهها در دستورات آینده به کار گرفته شوند.
AlphaEvolve برنامههای پیشنهادی را با استفاده از معیارهای ارزیابی خودکار اجرا، بررسی و امتیازدهی میکند. این معیارها ارزیابیای عینی و قابل اندازهگیری از دقت و کیفیت هر راهحل ارائه میدهند. همین ویژگی باعث میشود AlphaEvolve در حوزههای متنوعی که پیشرفت در آنها بهصورت روشن و سیستماتیک قابل سنجش است — مانند ریاضیات و علوم کامپیوتر — بسیار مفید واقع شود.
بهینهسازی اکوسیستم محاسباتی
در سال گذشته، الگوریتمهایی که توسط AlphaEvolve کشف شدهاند در سراسر اکوسیستم محاسباتی گوگل، از جمله مراکز داده، سختافزار و نرمافزار این شرکت بهکار گرفته شدهاند. تأثیر هر یک از این بهبودها در زیرساختهای هوش مصنوعی و محاسباتی گوگل چند برابر شده است تا اکوسیستمی دیجیتال قدرتمندتر و پایدارتر برای تمامی کاربران ایجاد شود.

تصویر 2) نموداری که نشان میدهد چگونه AlphaEvolve به گوگل کمک میکند تا اکوسیستم دیجیتال کارآمدتری ارائه دهد، از زمانبندی مراکز داده و طراحی سختافزار گرفته تا آموزش مدلهای هوش مصنوعی.
بهبود زمانبندی مراکز داده
AlphaEvolve یک روش ساده اما بسیار مؤثر را کشف کرد تا به سیستم بورگ (Borg) کمک کند مراکز داده وسیع گوگل را بهصورت بهینهتری مدیریت کند. این راهحل که بیش از یک سال است در حال استفاده است، بهطور متوسط ۰.۷٪ از منابع محاسباتی جهانی گوگل را بهطور مداوم بازیابی میکند. این افزایش پایداری در بهرهوری به این معناست که در هر لحظه میتوان کارهای بیشتری را با همان ظرفیت محاسباتی انجام داد. راهحل AlphaEvolve نه تنها عملکرد قویای ارائه میدهد، بلکه مزایای عملی قابل توجهی نیز دارد، از جمله کد قابل فهم برای انسان که قابلیت تفسیر، رفع اشکال، پیشبینی و سهولت در پیادهسازی را فراهم میکند.
کمک به طراحی سختافزار
AlphaEvolve پیشنهادی برای بازنویسی کد Verilog ارائه داد که بیتهای غیرضروری را در یک مدار حسابی کلیدی و بسیار بهینهشده برای ضرب ماتریس حذف میکند. نکته مهم این است که این پیشنهاد باید از روشهای تأیید صحت قوی عبور کند تا اطمینان حاصل شود که مدار اصلاحشده عملکرد صحیح خود را حفظ میکند. این پیشنهاد در یک واحد پردازش تنسور (TPU) آینده، شتابدهندهی سفارشی هوش مصنوعی گوگل، ادغام شد. با ارائه تغییرات به زبان استاندارد طراحان تراشه، AlphaEvolve رویکردی تعاملی میان هوش مصنوعی و مهندسان سختافزار را ترویج میدهد تا طراحی تراشههای تخصصی آینده را تسریع کند.
بهبود آموزش و استنتاج هوش مصنوعی
AlphaEvolve عملکرد هوش مصنوعی و سرعت تحقیقات را تسریع میبخشد. با یافتن روشهای هوشمندانهتر برای تقسیم عملیات ضرب ماتریس بزرگ به زیرمسائل قابل مدیریتتر، این عامل توانست بخش حیاتی معماری Gemini را ۲۳٪ سریعتر کند که منجر به کاهش ۱٪ در زمان آموزش مدل Gemini شد. از آنجا که توسعه مدلهای هوش مصنوعی مولد به منابع محاسباتی قابل توجهی نیاز دارد، هر بهینهسازی به صرفهجویی قابلتوجهی در هزینهها منجر میشود. علاوه بر افزایش عملکرد، AlphaEvolve به طور چشمگیری زمان مهندسی مورد نیاز برای بهینهسازی هستههای محاسباتی را از هفتهها تلاش کارشناسان به چند روز آزمایش خودکار کاهش میدهد و به پژوهشگران اجازه میدهد سریعتر نوآوری کنند.
AlphaEvolve همچنین قادر است دستورالعملهای سطح پایین GPU را بهینه کند. این حوزه بسیار پیچیده معمولاً توسط کامپایلرها به شدت بهینه شده است و مهندسان معمولاً مستقیماً آن را تغییر نمیدهند. AlphaEvolve توانست تا ۳۲.۵٪ سرعت بخشیدن به اجرای هسته FlashAttention در مدلهای هوش مصنوعی مبتنی بر Transformer را محقق کند. این نوع بهینهسازی به کارشناسان کمک میکند تا گلوگاههای عملکرد را شناسایی کرده و بهراحتی بهبودها را در پایگاه کد خود وارد کنند، که بهرهوری آنها را افزایش داده و صرفهجوییهای آینده در محاسبات و انرژی را ممکن میسازد.
دیدگاهتان را بنویسید