شرکت هوش مصنوعی xAI ایلان ماسک مدل هوش مصنوعی پیشرفتهی جدید خود با عنوان Grok 4 را معرفی کرد و در کنار آن از طرح اشتراک ماهانهی جدیدی به نام SuperGrok Heavy با قیمت ۳۰۰ دلار پرده برداشت. Grok بهعنوان رقیبی برای مدلهایی مانند ChatGPT متعلق به OpenAI و Gemini متعلق به گوگل طراحی شده و قابلیت تحلیل تصاویر و پاسخ به پرسشها را دارد. در ماههای اخیر، Grok بهصورت عمیقتری در شبکه اجتماعی X، که اخیراً تحت مالکیت xAI قرار گرفته، ادغام شده است. با این حال، همین موضوع موجب شده رفتارهای نادرست این مدل بیش از پیش در معرض دید میلیونها کاربر قرار گیرد.
Grok 4 بهعنوان قدرتمندترین مدل هوش مصنوعی جهان معرفی شده و انتظارات از آن بسیار بالا است. این مدل جدید قرار است با مدل آیندهی OpenAI با عنوان GPT-5 که در تابستان امسال منتشر خواهد شد، مقایسه شود. ایلان ماسک اعلام کرد: «در حوزهی سؤالات علمی، Grok 4 در تمامی رشتهها از سطح دکترای تخصصی نیز بالاتر است، بدون هیچ استثنایی.» او افزود: «البته در برخی مواقع ممکن است فاقد درک عقل سلیم باشد و هنوز موفق به ابداع فناوریهای جدید یا کشف قوانین نوین فیزیک نشده، اما این نیز مسئلهای است که با گذشت زمان محقق خواهد شد.»
رونمایی از گروک ۴ در حالی صورت گرفت که هفتهای پرآشوب برای شرکتهای تحت رهبری ایلان ماسک در جریان بود. پیشتر در همان روز، لیندا یاکارینو پس از حدود دو سال فعالیت، از سمت مدیرعاملی X استعفا داد. شرکت X هنوز جانشین او را معرفی نکرده است. استعفای یاکارینو تنها چند روز پس از آن اتفاق افتاد که حساب رسمی خودکار Grok در X، به برخی کاربران با پیامهایی حاوی اظهارات یهودیستیزانه و ستایش از هیتلر پاسخ داده بود. این پیامها در انتقاد از «مدیران یهودی» هالیوود منتشر شده بودند. در پی این اتفاق، xAI ناچار شد بهطور موقت فعالیت حساب Grok را محدود کرده و پستهای توهینآمیز را حذف نماید. در واکنش به این ماجرا، بهنظر میرسد xAI بخشی از راهنمای عمومی Grok، که دستورالعملهایی برای عملکرد این چتبات محسوب میشود، و اخیراً افزوده شده بود و آن را از پرهیز در بیان مطالب «نادرست سیاسی» بازمیداشت، حذف کرده باشد.
رهبران xAI و خود ماسک بهطور کلی از پرداختن به این حادثه خودداری کرده و تمرکز خود را بر عملکرد و توانمندیهای Grok 4 قرار دادند. xAI در روز چهارشنبه دو مدل را منتشر کرد: Grok 4 و نسخهی پیشرفتهتر آن، Grok 4 Heavy که دومی نسخهی چندعاملی این شرکت محسوب میشود و تواناییهای ارتقایافتهای دارد. ماسک عنوان کرد که Grok 4 Heavy چند عامل را بهطور همزمان برای حل یک مسئله فعال میکند و سپس خروجیهای آنها با یکدیگر مقایسه میشوند، مشابه یک گروه مطالعاتی، تا بهترین پاسخ انتخاب گردد.
بر اساس ادعای xAI مدل گروک ۴ در چندین ارزیابی علمی پیشرفته عملکردی در سطح مرزهای توانمندی نشان داده است، از جمله در آزمون Humanity’s Last Exam، که یک تست دشوار برای سنجش توان هوش مصنوعی در پاسخگویی به هزاران پرسش در حوزههایی مانند ریاضیات، علوم انسانی و علوم طبیعی است. طبق گزارش این شرکت، Grok 4 بدون استفاده از ابزارها، امتیاز ۲۵.۴% را در این آزمون کسب کرده و از مدل Gemini 2.5 Pro گوگل با امتیاز ۲۱.۶% و مدل o3 (high) شرکت OpenAI با امتیاز ۲۱% پیشی گرفته است.
همچنین، مدل Grok 4 Heavy با بهرهگیری از ابزارها موفق شده امتیاز ۴۴.۴% را کسب کند که از عملکرد Gemini 2.5 Pro با ابزارها که امتیاز ۲۶.۹% را ثبت کرده، فراتر رفته است. سازمان غیرانتفاعی Arc Prize اعلام کرده که مدل Grok موفق شده رکورد جدیدی را در آزمون ARC-AGI-2 ثبت کند؛ این آزمون شامل مسائل الگومحور تصویری است که هوش مصنوعی باید الگوهای بصری را تشخیص دهد. Grok موفق به کسب امتیاز ۱۶.۲% شده که تقریباً دو برابر امتیاز دومین مدل تجاری قدرتمند یعنی Claude Opus 4 است.
در کنار مدلهای Grok 4 و Grok 4 Heavy، شرکت xAI گرانترین طرح اشتراک خود را نیز با عنوان SuperGrok Heavy معرفی کرده که هزینهی ماهانهی آن ۳۰۰ دلار است. مشترکین این طرح زودتر از دیگر کاربران به نسخهی Grok 4 Heavy و قابلیتهای آیندهی آن دسترسی خواهند داشت. این طرح مشابه سطحهای اشتراک بسیار پیشرفتهی ارائهشده توسط شرکتهایی مانند OpenAI، گوگل و Anthropic است، با این تفاوت که در حال حاضر xAI گرانترین گزینه را در میان ارائهدهندگان اصلی عرضه میکند.
مشترکین SuperGrok Heavy ممکن است دسترسی اولیه به برخی محصولات جدیدی که xAI قصد دارد در ماههای آینده منتشر کند، داشته باشند. این شرکت روز چهارشنبه اعلام کرد که یک مدل کدنویسی هوش مصنوعی در ماه اوت، یک عامل چندحالته در ماه سپتامبر و یک مدل تولید ویدیو در ماه اکتبر منتشر خواهد شد. xAI در تلاش است Grok 4 را از طریق API در اختیار توسعهدهندگان قرار دهد تا آنها بتوانند اپلیکیشنهایی مبتنی بر این مدل بسازند. با وجود اینکه بخش شرکتی xAI تنها دو ماه از تأسیس آن گذشته، این شرکت برنامه دارد تا با ارائهدهندگان خدمات ابری در مقیاس بزرگ همکاری کند تا Grok را از طریق پلتفرمهای آنها در دسترس قرار دهد.
اگرچه Grok در آزمونهای بنچمارک پیشرفته عملکرد درخشانی داشته، اما ممکن است عبور از مشکلات اخیر برای xAI دشوار باشد؛ بهویژه زمانی که این شرکت تلاش میکند Grok را بهعنوان جایگزینی جدی برای ChatGPT، Claude و Gemini به بازار کسبوکار معرفی کند. اینکه آیا شرکتها آمادگی پذیرش Grok را با تمام نقاط ضعف و قوت آن، دارند یا خیر، هنوز مشخص نیست.
دیدگاه ها