قوانین کنونی مقیاس‌بندی هوش مصنوعی: چالش‌ها و ضرورت تغییر مسیر در آزمایشگاه‌های هوش مصنوعی

۱۴۰۳-۰۹-۰۱
مسعود حمداللهی
وبلاگی
0

آزمایشگاه‌های هوش مصنوعی که در حال توسعه سیستم‌های فوق‌هوشمند هستند، به این نتیجه رسیده‌اند که ممکن است نیاز داشته باشند مسیر خود را تغییر دهند. در این مقاله به چالش ها و ضرورت تغییر قوانین کنونی مقیاس‌بندی هوش مصنوعی در آزمایشگاه های هوش مصنوعی خواهیم پرداخت.

به گفته چندین سرمایه‌گذار، بنیان‌گذار و مدیرعامل در حوزه هوش مصنوعی که با TechCrunch گفتگو کرده‌اند، “قوانین مقیاس‌بندی هوش مصنوعی” که آزمایشگاه‌ها در پنج سال گذشته برای افزایش قابلیت‌های مدل‌های خود به کار می‌بردند، اکنون نشانه‌هایی از کاهش بازده را نشان می‌دهد. این احساسات نشان‌دهنده گزارش‌های اخیر است که حاکی از آن است که مدل‌های موجود در آزمایشگاه‌های پیشرو هوش مصنوعی، نسبت به گذشته، با سرعت کمتری بهبود می‌یابند.

اکنون به نظر می‌رسد که همه به این نکته اذعان دارند که نمی‌توان با استفاده از محاسبات و داده‌های بیشتر در حین پیش‌آموزش مدل‌های زبانی بزرگ، انتظار داشت که این مدل‌ها به نوعی خدای دیجیتالی دانا تبدیل شوند. شاید این موضوع واضح به نظر برسد، اما قوانین مقیاس‌بندی به عنوان یک عامل کلیدی در توسعه و بهبود ChatGPT و همچنین تأثیرگذاری بر بسیاری از مدیران عامل برای پیش‌بینی‌های جسورانه درباره ورود هوش عمومی مصنوعی (AGI) در چند سال آینده، مطرح بوده است.

ایلیا سوتسکِور، بنیان‌گذار OpenAI و Safe Super Intelligence، هفته گذشته به رویترز گفت که «همه به دنبال چیز بعدی هستند» تا مدل‌های هوش مصنوعی خود را تغییر دهند. همچنین، اوایل این ماه، مارک آندرسن، یکی از بنیان‌گذاران a16z، در یک پادکست اشاره کرد که به نظر می‌رسد مدل‌های هوش مصنوعی در حال حاضر به یک سقف از توانایی‌ها نزدیک می‌شوند.

اما اکنون، تقریباً بلافاصله پس از بروز این روندهای نگران‌کننده، مدیران عامل، محققان و سرمایه‌گذاران در حوزه هوش مصنوعی اعلام کرده‌اند که ما وارد دوره جدیدی از قوانین مقیاس‌بندی شده‌ایم. این دوره که به “محاسبات زمان آزمایش” معروف است، به مدل‌های هوش مصنوعی زمان بیشتری می‌دهد تا قبل از پاسخ دادن به سؤال، “فکر” کنند. این رویکرد به‌ویژه به عنوان یک رقیب امیدوارکننده برای تبدیل شدن به گام بعدی در توسعه هوش مصنوعی مطرح شده است.

ساتیا نادلا، مدیرعامل مایکروسافت، روز سه‌شنبه در کنفرانس مایکروسافت Ignite با اشاره به تحقیقات محاسباتی آزمایشی مبتنی بر مدل o1 اوپن ای آی اعلام کرد: «ما در حال مشاهده ظهور یک قانون مقیاس‌بندی جدید هستیم.» او تنها کسی نیست که اکنون به o1 به عنوان آینده اشاره می کند.

آنجنی میدا، شریک شرکت آندرسن هوروویتز و عضو هیئت مدیره Mistral و سرمایه‌گذار فرشته در Anthropic، در مصاحبه‌ای اخیر با TechCrunch اظهار داشت: «ما اکنون در مرحله دوم قوانین مقیاس‌بندی قرار داریم که به مقیاس‌بندی زمان آزمایش مربوط می‌شود.»

اگر موفقیت غیرمنتظره و اکنون کند شدن ناگهانی قوانین قبلی مقیاس‌بندی هوش مصنوعی چیزی را به ما نشان می‌دهد، آن این است که پیش‌بینی چگونگی و زمان بهبود مدل‌های هوش مصنوعی بسیار دشوار است. با این حال، به نظر می‌رسد که یک تغییر پارادایم در حال وقوع است: روش‌هایی که آزمایشگاه‌های هوش مصنوعی برای ارتقای مدل‌های خود در پنج سال آینده به کار می‌برند، احتمالاً با آنچه در پنج سال گذشته استفاده کرده‌اند، تفاوت خواهد داشت.

قوانین مقیاس بندی هوش مصنوعی چیست؟

پیشرفت های سریع مدل‌های هوش مصنوعی که از سال ۲۰۲۰ توسط OpenAI، Google، Meta و Anthropic به دست آمده، عمدتاً به یک بینش کلیدی مربوط می‌شود: استفاده از محاسبات و داده‌های بیشتر در طول مرحله پیش‌آموزش مدل‌های هوش مصنوعی.

زمانی که محققان در این مرحله به سیستم‌های یادگیری ماشینی منابع فراوانی ارائه می‌دهند، هوش مصنوعی قادر است الگوها را در مجموعه داده‌های بزرگ شناسایی و ذخیره کند. این امر باعث می‌شود که مدل‌ها در پیش‌بینی کلمه یا عبارت بعدی عملکرد بهتری داشته باشند.

این اولین نسل از قوانین مقیاس‌بندی هوش مصنوعی تأثیر زیادی بر مجموعه کارهایی که رایانه‌ها قادر به انجام آن بودند، گذاشت. مهندسان با افزایش تعداد پردازنده‌های گرافیکی و مقدار داده‌های ورودی، این تغییرات را به وجود آوردند. اگرچه این روش خاص ممکن است به پایان خود رسیده باشد، اما پیش از آن نقشه راه را به‌طور کامل تغییر داده است. در حال حاضر، تمامی شرکت‌های بزرگ فناوری به‌طور گسترده‌ای از هوش مصنوعی استفاده می‌کنند و انویدیا، که پردازنده‌های گرافیکی را برای این شرکت‌ها تأمین می‌کند، اکنون به عنوان باارزش‌ترین شرکت سهامی عام در جهان شناخته می‌شود.

اما این سرمایه‌گذاری‌ها با این امید انجام شد که مقیاس‌پذیری به همان شکل که انتظار می‌رفت، ادامه یابد.

توجه به این نکته ضروری است که قوانین مقیاس‌بندی، قوانین طبیعت، فیزیک، ریاضی یا دولت نیستند. هیچ چیز یا کسی نمی‌تواند تضمین کند که این روندها با همان سرعت ادامه خواهند یافت. حتی قانون مور، که یکی از قوانین معروف مقیاس‌بندی به شمار می‌رود، در نهایت به پایان رسید، هرچند که به‌طور قطع مدت زمان بیشتری دوام آورد.

رابرت نیشیهارا، یکی از بنیانگذاران و مدیرعامل سابق Anyscale، در مصاحبه‌ای با TechCrunch اظهار داشت: “اگر تنها به افزایش محاسبات و داده‌ها بپردازید و مدل را بزرگ‌تر کنید، با پدیده‌ای به نام بازدهی کاهشی مواجه خواهید شد.” او همچنین تأکید کرد که برای حفظ قوانین مقیاس‌بندی و ادامه نرخ پیشرفت، به ایده‌های جدید نیز نیاز داریم.

نیشیهارا به خوبی با قوانین مقیاس‌بندی هوش مصنوعی آشنا است. شرکت Anyscale که با توسعه نرم‌افزاری که به OpenAI و دیگر توسعه‌دهندگان مدل‌های هوش مصنوعی کمک می‌کند تا حجم کار آموزشی خود را به ده‌ها هزار GPU افزایش دهند، به ارزش میلیارد دلاری دست یافته است. Anyscale یکی از بزرگ‌ترین ذینفعان پیش‌آموزش قوانین مقیاس‌بندی در حوزه محاسبات به شمار می‌رود، اما حتی یکی از بنیان‌گذاران آن نیز به این نکته اذعان دارد که فصل جدیدی در حال آغاز است.

با اشاره به محدودیت‌های مقیاس‌بندی داده‌ها، او گفت: «زمانی که میلیون‌ها نقد را در Yelp خوانده‌اید، ممکن است بررسی‌های بعدی در این پلتفرم دیگر آنقدر برای شما مفید نباشند. اما این یک پیش‌آموزش است. من می‌توانم بگویم که روش‌شناسی مربوط به مرحله پس از تمرین هنوز کاملاً ناپخته است و جای زیادی برای بهبود دارد.»

برای روشن شدن موضوع، توسعه‌دهندگان مدل‌های هوش مصنوعی احتمالاً به دنبال خوشه‌های محاسباتی بزرگ‌تر و مجموعه‌های داده وسیع‌تری برای پیش‌آموزش خواهند بود و به احتمال زیاد پیشرفت‌های بیشتری برای خروج از این روش‌ها وجود خواهد داشت. ایلان ماسک به‌تازگی ساخت یک ابررایانه به نام Colossus را که شامل ۱۰۰,۰۰۰ پردازنده گرافیکی است، برای آموزش مدل‌های آینده xAI را به پایان رسانده است. بنابراین، در آینده شاهد خوشه‌های بزرگ‌تر و بیشتری خواهیم بود.

اما روندها نشان می‌دهند که دستیابی به رشد نمایی تنها با افزایش تعداد پردازنده‌های گرافیکی و استفاده از استراتژی‌های موجود ممکن نیست. به همین دلیل، روش‌های جدید ناگهان توجه بیشتری را به خود جلب کرده‌اند.

محاسبات زمان آزمایش: شرط بزرگ بعدی در صنعت هوش مصنوعی

زمانی که OpenAI پیش‌نمایشی از مدل o1 خود را منتشر کرد، این استارتاپ اعلام کرد که این مدل بخشی از سری جدیدی از مدل‌هاست که از GPT جدا می‌باشد.

OpenAI مدل‌های GPT خود را عمدتاً از طریق قوانین مقیاس‌بندی سنتی بهبود بخشید: با استفاده از داده‌های بیشتر و قدرت محاسباتی بیشتر در حین پیش‌آموزش. اما به نظر می‌رسد که این روش اکنون دیگر کارایی لازم را ندارد. چارچوب مدل o1 بر اساس یک مفهوم جدید به نام “محاسبات زمان آزمون” بنا شده است، که به این دلیل این نام را به خود گرفته که منابع محاسباتی پس از یک اعلان مورد استفاده قرار می‌گیرند، نه قبل از آن. این تکنیک هنوز در زمینه شبکه‌های عصبی به‌طور گسترده‌ای مورد بررسی قرار نگرفته است، اما در حال حاضر نویدبخش به نظر می‌رسد.

برخی از کارشناسان در حال حاضر به محاسبات زمان آزمون به عنوان روش بعدی برای مقیاس‌بندی سیستم‌های هوش مصنوعی اشاره می‌کنند.

میدا از a16z گفت: «تعدادی از آزمایش‌ها نشان می‌دهند که حتی اگر قوانین مقیاس‌بندی پیش‌آموزشی به کندی پیش بروند، قوانین مقیاس‌بندی در زمان آزمون (جایی که به مدل در فرآیند استنتاج محاسبات بیشتری می‌دهید) می‌تواند به افزایش عملکرد منجر شود.»

یوشوا بنجیو، محقق مشهور در حوزه هوش مصنوعی، روز سه‌شنبه در مقاله‌ای اظهار داشت: «O سری جدید OpenAI را به جلو می‌برد و برای این کار به منابع محاسباتی و در نتیجه انرژی بیشتری نیاز دارد. بنابراین، ما شاهد ظهور یک شکل جدید از مقیاس‌بندی محاسباتی هستیم. این تنها به معنای استفاده از داده‌های آموزشی بیشتر و مدل‌های بزرگ‌تر نیست، بلکه زمان بیشتری نیز صرف “تفکر” در مورد پاسخ‌ها می‌شود.»

در یک بازه زمانی ۱۰ تا ۳۰ ثانیه‌ای، مدل o1 چندین بار به خود درخواست می‌دهد و یک مشکل بزرگ را به مجموعه‌ای از مشکلات کوچکتر تقسیم می‌کند. با اینکه ChatGPT از عبارت «فکر کردن» استفاده می‌کند، اما در واقع کاری را انجام نمی‌دهد که انسان‌ها انجام می‌دهند. با این حال، روش‌های حل مسئله‌ای که از بیان مجدد واضح یک مشکل و ارائه راه‌حل‌های مرحله‌ای بهره می‌برند، الهام‌بخش اصلی این رویکرد بوده‌اند.

حدود یک دهه پیش، نوام براون، که اکنون رهبری پروژه o1 در OpenAI را بر عهده دارد، در تلاش بود تا سیستم‌های هوش مصنوعی بسازد که بتوانند انسان‌ها را در بازی پوکر شکست دهند. در یک صحبت اخیر، براون اشاره کرد که در آن زمان متوجه شده بود که چگونه بازیکنان پوکر انسانی قبل از بازی با دست، سناریوهای مختلف را در نظر می‌گیرند. در سال ۲۰۱۷، او روشی را معرفی کرد که به یک مدل اجازه می‌دهد ۳۰ ثانیه قبل از بازی فکر کند. در آن زمان، هوش مصنوعی در حال انجام بازی‌های فرعی مختلف بود و متوجه می‌شد که چگونه سناریوهای مختلف برای تعیین بهترین حرکت اجرا می‌شوند.

در نهایت، هوش مصنوعی به طرز چشمگیری هفت برابر بهتر از تلاش‌های قبلی او عمل کرد.

بدون شک، تحقیقات براون در سال ۲۰۱۷ از شبکه‌های عصبی استفاده نکرد، زیرا در آن زمان این تکنولوژی چندان محبوب نبود. با این حال، محققان MIT هفته گذشته مقاله‌ای منتشر کردند که نشان می‌دهد محاسبات زمان آزمون به طور قابل توجهی عملکرد مدل‌های هوش مصنوعی را در وظایف استدلال بهبود می‌بخشد.

هنوز مشخص نیست که محاسبات زمان آزمون چگونه مقیاس خواهد شد. این ممکن است به این معنا باشد که سیستم‌های هوش مصنوعی برای فکر کردن به سوالات دشوار به زمان بسیار طولانی‌تری نیاز دارند، شاید ساعت‌ها یا حتی روزها. رویکرد دیگری که می‌تواند مورد استفاده قرار گیرد، این است که به یک مدل هوش مصنوعی اجازه داده شود به طور همزمان از طریق پرسش‌هایی درباره تعداد زیادی از تراشه‌ها فکر کند.

اگر محاسبات زمان آزمون به عنوان مرحله بعدی برای مقیاس‌بندی سیستم‌های هوش مصنوعی مطرح شود، میدا اشاره می‌کند که تقاضا برای تراشه‌های هوش مصنوعی که در استنتاج با سرعت بالا تخصص دارند، می‌تواند به طرز چشمگیری افزایش یابد. این موضوع می‌تواند خبر خوبی برای استارتاپ‌هایی مانند Groq و Cerebras باشد که در زمینه تراشه‌های استنتاج سریع هوش مصنوعی فعالیت می‌کنند.

به نظر می‌رسد که اکثر فعالان این حوزه نسبت به کاهش سرعت قوانین قدیمی مقیاس‌بندی نگران نیستند. حتی اگر محاسبات زمان آزمون به عنوان موج بعدی مقیاس‌بندی مطرح نشود، برخی بر این باورند که ما تنها در حال خراشیدن سطح برنامه‌های کاربردی مدل‌های فعلی هوش مصنوعی هستیم.

محصولات محبوب جدید می‌توانند به توسعه‌دهندگان مدل‌های هوش مصنوعی زمان بیشتری بدهند تا راه‌های جدیدی برای بهبود مدل‌های زیربنایی پیدا کنند.

میدا اظهار داشت: «من کاملاً متقاعد شده‌ام که تنها از طریق کار در سطح برنامه، حداقل ۱۰ تا ۲۰ برابر افزایش عملکرد مدل را شاهد خواهیم بود. این امر با اجازه دادن به مدل‌ها برای درخشش از طریق پیام‌های هوشمندانه، تصمیم‌گیری‌های بهینه در تجربه کاربری و انتقال زمینه در زمان مناسب محقق می‌شود.»

به عنوان مثال، حالت صوتی پیشرفته ChatGPT یکی از کاربردی‌ترین ویژگی‌های مدل‌های فعلی هوش مصنوعی به شمار می‌رود. با این حال، این بیشتر یک نوآوری در تجربه کاربری است تا یک فناوری بنیادی. می‌توان مشاهده کرد که چگونه نوآوری‌های بیشتر در زمینه تجربه کاربری، مانند دسترسی به این ویژگی از طریق وب یا برنامه‌های موبایل، می‌تواند کیفیت محصول را به طرز چشمگیری بهبود بخشد.

کیان کتان فروش، مدیر عامل استارت‌آپ AI Workera و مدرس کمکی استنفورد در زمینه یادگیری عمیق، به TechCrunch می‌گوید که شرکت‌هایی که برنامه‌های کاربردی هوش مصنوعی مانند او می‌سازند، لزوماً برای ساخت محصولات بهتر نیازی به مدل‌های هوشمندتر ندارند. او همچنین می‌گوید محصولات موجود در مدل‌های فعلی فضای زیادی برای بهتر شدن دارند.

کتان فروش می‌گوید: «فرض کنید شما در حال ساخت برنامه‌های هوش مصنوعی هستید و هوش مصنوعی شما در یک کار خاص دچار توهم می‌شود. برای جلوگیری از این مشکل دو راه وجود دارد: یا باید مدل‌های زبانی بزرگ (LLM) بهبود یابند و توهم‌سازی را متوقف کنند، یا ابزارهای اطراف آن باید بهتر شوند تا فرصت‌هایی برای رفع این مشکل فراهم شود.»

در حال حاضر، کاربران ممکن است برای مدتی تأثیرات تغییرات اخیر در حوزه هوش مصنوعی را احساس نکنند. اما باید توجه داشت که آزمایشگاه‌های هوش مصنوعی به طور مداوم در تلاش هستند تا مدل‌های بزرگ‌تر، هوشمندتر و سریع‌تری را توسعه دهند و به بازار عرضه کنند. این به این معناست که چندین شرکت پیشرو در فناوری در حال تغییر روش‌های خود برای پیشبرد مرزهای هوش مصنوعی هستند و به دنبال نوآوری‌های جدید می‌باشند.

منبع: techcrunch

برچسب ها:هوش مصنوعی