هوش مصنوعی هنوز در بازی‌های ویدیویی از انسان‌ها شکست می‌خورد

هوش مصنوعی با وجود داشتن مهندسان متخصص، در مقابل تجربه زیسته و مهارت‌های یادگیری انسان‌ها حرفی برای گفتن ندارد.

شاید اگر از کسی بخواهید پیشرفت مدل‌های هوش مصنوعی در دهه‌های گذشته را شرح دهد، به توانایی آن‌ها در بازی کردن اشاره کند. در سال ۱۹۹۷ میلادی، مدل Deep Blue شرکت IBM، گری کاسپاروف، قهرمان شطرنج جهان را مغلوب کرد. نزدیک به دو دهه بعد، مدل AlphaGo گوگل، قهرمان بازی Go را که تصور می‌شد شکست‌ناپذیر باشد، شکست داد.

از آن زمان به بعد، مدل‌های هوش مصنوعی با داده‌های غنی‌تر، از بازی‌های رومیزی به بازی‌های ویدیویی راه یافتند. مدل‌های مختلف با استفاده از روش یادگیری تقویتی (تکنیکی که در آموزش چت‌بات‌های هوش مصنوعی مانند ChatGPT نیز نقش دارد) ماشین‌ها را آموزش دادند تا یاد بگیرند و در طیف وسیعی از بازی‌های آتاری از انسان‌ها بهتر عمل کنند. اخیراً نیز یادگیری تقویتی به ماشین‌ها آموخته است تا بازی‌های استراتژیک بسیار پیچیده‌ای مانند Dota 2 و Starcraft II را نیز استادانه بازی کنند.

اما هنوز یک حوزه در بازی‌ها وجود دارد، حداقل در حال حاضر، که کامپیوترها در آن به پای انسان‌ها نمی‌رسند. آن‌ها هنوز در یادگیری سریع انواع مختلف بازی‌های باز و بدون پایان، عملکرد خوبی ندارند. هنگامی که صحبت از انتخاب یک بازی تصادفی از فروشگاه بازی می‌شود که قبلاً آن را ندیده‌اند، بازیکنان انسانی هنوز بسیار سریع‌تر از پیشرفته‌ترین مدل‌های هوش مصنوعی، اصول بازی را فرا می‌گیرند.

این همان استدلالی است که در یک مقاله‌ جدید توسط جولیان توگلیوس، استاد علوم کامپیوتر در دانشگاه نیویورک و همکارانش ارائه شده. آن‌ها می‌گویند که این تمایز صرفاً یک تعریف ساده از انسان‌ها نیست، بلکه ممکن است به درک عنصری کلیدی از هوش منحصر به فرد انسان و چرایی طولانی بودن راه هوش مصنوعی برای رسیدن به هوش سطح انسانی، چه رسد به پیشی گرفتن از آن، کمک کند.

نویسندگان مقاله می‌نویسند: «اگر یک مدل زبانی بزرگ (LLM) را در مقابل یک بازی که قبلاً ندیده است قرار دهیم، نتیجه تقریباً قطعاً شکست خواهد بود.»

بازی‌ها به دلیل داشتن قوانین قابل پیش‌بینی، اهداف مشخص و مکانیک‌های متنوع، دهه‌هاست که به عنوان بسترهای آزمایشی مفیدی برای مدل‌های هوش مصنوعی عمل کرده‌اند. این اصول اساسی به ویژه برای یادگیری تقویتی که در آن مدل، یک بازی را بارها و بارها در شبیه‌سازی (گاهی میلیون‌ها بار) از طریق آزمون و خطا بازی می‌کند تا به تدریج بهبود یابد و به سطح مهارت برسد، بسیار مناسب است. اساساً، این همان روشی بود که DeepMind در سال ۲۰۱۵ توانست بازی‌های آتاری را یاد بگیرد. همین منطق بر مدل‌های زبانی بزرگ محبوب امروزی نیز تأثیر می‌گذارد، هرچند با کل اینترنت به عنوان داده‌های آموزشی.

با این حال، این روش هنگام تعمیم دادن با مشکل مواجه می‌شود. مدل‌های هوش مصنوعی در بازی‌های رومیزی و برخی بازی‌های ویدیویی انسان‌ها را شکست می‌دهند زیرا محدودیت‌ها واضح و اهداف نسبتاً سرراست هستند. در نهایت، توگلیوس و همکارانش استدلال می‌کنند که آن مدل‌ها، هرچند چشمگیر به نظر برسند، هنوز در انجام یک کار بسیار خاص بسیار خوب می‌شوند. حتی تغییرات کوچک در طراحی کلی یک بازی می‌تواند کل آن را از کار بیندازد. یک مدل ممکن است هنگام بازی در یک بازی خاص، فراانسانی باشد، اما وقتی از آن خواسته شود بداهه‌پردازی کند، کاملاً ناتوان خواهد بود.

این تمایز با توجه به ترند گسترده‌تر در بازی‌های مدرن به سمت عناوین انتزاعی‌تر، حتی واضح‌تر می‌شود. بازی شطرنج را در مقابل یک بازی ماجراجویی سوم شخص با بودجه بالا مانند Red Dead Redemption در نظر بگیرید. در حالی که هر دو به معنای اساسی بازی هستند، آنچه برای موفقیت یا پیروزی در هر کدام مهم است، کاملاً متفاوت خواهد بود.