الگوریتمهای جدید، یادگیری ماشین کارآمد با دادههای متقارن را ممکن میسازند

الگوریتمهای جدید، یادگیری ماشین کارآمد با دادههای متقارن را ممکن میسازند
اگر تصویری از یک ساختار مولکولی را بچرخانید، انسان بهراحتی متوجه میشود که تصویر چرخیدهشده همان مولکول قبلی است، اما یک مدل یادگیری ماشین ممکن است تصور کند با یک دادهی جدید روبهروست. در اصطلاح علوم کامپیوتر، گفته میشود مولکول دارای «تقارن» (symmetry) است، یعنی ساختار بنیادی آن حتی پس از برخی تبدیلات مانند چرخش، بدون تغییر باقی میماند.
اگر مدلی برای کشف دارو نتواند تقارن را درک کند، ممکن است پیشبینیهای نادرستی دربارهی ویژگیهای مولکولها انجام دهد. با وجود برخی موفقیتهای تجربی، تاکنون مشخص نبود که آیا روش محاسباتی کارآمدی برای آموزش مدلی وجود دارد که بهطور تضمینی تقارن را رعایت کند یا نه.
مطالعهای جدید از پژوهشگران MIT به این پرسش پاسخ میدهد و نخستین روشی را معرفی میکند که یادگیری ماشین با دادههای متقارن را بهصورت اثباتشده و کارآمد از نظر محاسبات و مقدار دادهی مورد نیاز ممکن میسازد.
این نتایج به یک پرسش بنیادی در حوزه یادگیری ماشین پاسخ میدهند و میتوانند به پژوهشگران در توسعه مدلهای هوش مصنوعی قدرتمندتر که برای مدیریت دادههای متقارن طراحی شدهاند، کمک کنند. چنین مدلهایی در کاربردهای متنوعی مفید خواهند بود، از کشف مواد جدید گرفته تا شناسایی ناهنجاریهای نجومی و رمزگشایی از الگوهای پیچیده آبوهوایی.
بهروز طهماسبی، دانشجوی تحصیلات تکمیلی MIT و نویسنده اول این مطالعه، میگوید:
«این تقارنها مهم هستند چون نوعی اطلاعات از سوی طبیعت دربارهی دادهها به ما منتقل میکنند، و باید آنها را در مدلهای یادگیری ماشین خود لحاظ کنیم. ما اکنون نشان دادهایم که یادگیری ماشین با دادههای متقارن به شیوهای کارآمد امکانپذیر است.»
او در این مقاله با اشکان سلیمانی (نویسنده اول مشترک و دانشجوی کارشناسی ارشد MIT)، استفانی یگلکا (استادیار مهندسی برق و علوم کامپیوتر، و عضو مؤسسه داده، سامانهها و جامعه [IDSS] و آزمایشگاه علوم کامپیوتر و هوش مصنوعی [CSAIL])، و نویسنده ارشد پاتریک ژیهیه (استاد کرسی Dugald C. Jackson در مهندسی برق و علوم کامپیوتر و پژوهشگر ارشد در آزمایشگاه سامانههای اطلاعات و تصمیمگیری [LIDS]) همکاری کرده است.
این پژوهش بهتازگی در «کنفرانس بینالمللی یادگیری ماشین» (International Conference on Machine Learning) ارائه شده است.
بررسی تقارن
دادههای متقارن در بسیاری از حوزهها، بهویژه علوم طبیعی و فیزیک، دیده میشوند. مدلی که بتواند تقارن را تشخیص دهد، قادر خواهد بود یک شیء مانند خودرو را شناسایی کند، فارغ از اینکه آن شیء در کجای تصویر قرار دارد.
اگر یک مدل یادگیری ماشین برای درک تقارن طراحی نشده باشد، ممکن است دقت کمتری داشته باشد و در مواجهه با دادههای متقارن جدید در شرایط واقعی دچار خطا شود. در مقابل، مدلهایی که از تقارن بهره میبرند، میتوانند سریعتر عمل کنند و به دادههای آموزشی کمتری نیاز داشته باشند.
با این حال، آموزش مدلی که بتواند دادههای متقارن را پردازش کند، کار سادهای نیست.
یکی از روشهای رایج برای این کار، افزایش داده (data augmentation) است، که در آن پژوهشگران هر دادهی متقارن را با اعمال تغییراتی به چندین داده تبدیل میکنند تا مدل بتواند بهتر تعمیم دهد. برای مثال، میتوان ساختار یک مولکول را چندین بار بچرخاند تا دادههای آموزشی جدیدی تولید شود. اما اگر پژوهشگران بخواهند تضمین کنند که مدل حتماً تقارن را رعایت کند، این کار میتواند از نظر محاسباتی بسیار پرهزینه باشد.
راهکار جایگزین، رمزگذاری تقارن در معماری مدل است. یکی از نمونههای شناختهشدهی این روش، شبکههای عصبی گرافی (GNN) هستند که بهصورت ذاتی توانایی پردازش دادههای متقارن را دارند، چون معماری آنها برای چنین کاری طراحی شده است.
طهماسبی میگوید:
«شبکههای عصبی گرافی سریع و کارآمد هستند و تقارن را بهخوبی مدیریت میکنند، اما واقعاً کسی نمیداند این مدلها چه چیزی یاد میگیرند یا چرا جواب میدهند. درک عملکرد GNNها یکی از انگیزههای اصلی کار ما بود، بنابراین با یک ارزیابی نظری از وضعیت دادههای متقارن آغاز کردیم.»
آنها در این پژوهش، مبادله میان آمار و محاسبات (statistical-computational tradeoff) در یادگیری ماشین با دادههای متقارن را بررسی کردند. این مبادله به این معناست که روشهایی که به دادهی کمتری نیاز دارند، معمولاً هزینه محاسباتی بالاتری دارند؛ بنابراین پژوهشگران باید تعادلی مناسب بین این دو برقرار کنند.
بر پایه این ارزیابی نظری، پژوهشگران یک الگوریتم کارآمد برای یادگیری ماشین با دادههای متقارن طراحی کردند.
ترکیبهای ریاضیاتی
برای تغییر این متن بر روی دکمه ویرایش کلیک کنید. لورم ایپسوم متن ساختگی با تولید سادگی نامفهوم از صنعت چاپ و با استفاده از طراحان گرافیک است.
برای دستیابی به این هدف، پژوهشگران از مفاهیم جبر برای کوچکسازی و سادهسازی مسئله بهره گرفتند. سپس، با استفاده از ایدههایی از هندسه، مسئله را به شکلی بازفرموله کردند که بتواند تقارن را بهطور مؤثری درک و ثبت کند.
در نهایت، آنها جبر و هندسه را در قالب یک مسئله بهینهسازی ترکیب کردند که میتوان آن را بهصورت کارآمد حل کرد، و این فرایند منجر به الگوریتم جدید آنها شد.
بهروز طهماسبی میگوید:
«بیشتر نظریهها و کاربردهای قبلی یا فقط بر جبر تمرکز داشتند یا بر هندسه. ما اینجا فقط این دو را با هم ترکیب کردیم.»
این الگوریتم نسبت به روشهای کلاسیک به نمونههای دادهی کمتری برای آموزش نیاز دارد، که این امر موجب بهبود دقت مدل و افزایش توانایی آن در سازگاری با کاربردهای جدید میشود.
با اثبات اینکه میتوان الگوریتمهایی کارآمد برای یادگیری ماشین با دادههای متقارن طراحی کرد و با نشان دادن چگونگی انجام این کار، این نتایج میتوانند زمینهساز توسعه معماریهای جدیدی در شبکههای عصبی شوند که هم دقیقتر هستند و هم منابع محاسباتی کمتری نیاز دارند.
دانشمندان همچنین میتوانند از این تحلیل بهعنوان نقطه شروعی برای بررسی عملکرد درونی شبکههای عصبی گرافی (GNN) استفاده کنند و ببینند که این مدلها چگونه از نظر عملکرد با الگوریتمی که پژوهشگران MIT توسعه دادهاند تفاوت دارند.
اشکان سلیمانی اضافه میکند:
«وقتی این موضوع را بهتر درک کنیم، میتوانیم معماریهای شبکه عصبی را طراحی کنیم که قابلتفسیرتر، مقاومتر و کارآمدتر باشند.»
این پژوهش با حمایت مالی جزئی از سوی بنیاد تحقیقات ملی سنگاپور، آزمایشگاههای ملی DSO سنگاپور، دفتر تحقیقات نیروی دریایی ایالات متحده، بنیاد ملی علوم آمریکا، و کرسی الکساندر فون هومبولت تأمین شده است.
دیدگاهتان را بنویسید