دیپ سیک مدل هوش مصنوعی بهبودیافته V3 AI را معرفی کرد

9 فروردین 1404 ساعت 15:13

سه ماه پس از رونمایی اولیه از مدل DeepSeek V3، نسخه بهبود یافته آن عرضه شده است. این مدل جدید، با ارتقای چشمگیر عملکرد و قابلیت‌های خود، امکان خلق صفحات وب جذاب و نگارش گزارش‌های شیوا به زبان چینی را برای کاربران فراهم می‌کند.

شرکت DeepSeek، یکی از پیشگامان عرصه هوش مصنوعی در چین، نسخه جدید مدل زبانی بزرگ V3 خود را بعد از چند ماه منتشر کرده است. مدل V3 با وجود نیاز به سخت‌افزار آموزشی بسیار کمتر، زمان آموزش کوتاه‌تر و هزینه‌های کمتر API، توانست عملکردی قابل قیاس با رقبای قدرتمندی همچون مدل‌های GPT شرکت OpenAI ارائه دهد و تحسین همگان را برانگیزد.

مدل به‌روزرسانی‌شده‌ی V3، یک سامانه‌ی هوش مصنوعی غیر استدلالی است که به جای صرف زمان اضافی برای تحلیل مسائل پیچیده، مانند مدل دیپ‌سیک R1، تلاش می‌کند تا به سرعت به پرسش‌ها پاسخ دهد. حجم پارامترهای این مدل که بالغ بر ۶۸۵ میلیارد واحد بوده، آن را در زمره‌ی بزرگترین مدل‌های زبان بزرگ قابل دسترس برای عموم قرار می‌دهد. این مدل جدید، تحت مجوز MIT قابل بهره‌برداری است.

دیپ سیک مدل هوش مصنوعی بهبودیافته V3 AI را معرفی کرد

مدل جدید در بنچمارک‌های هوش مصنوعی، بین ۵.۳ تا ۱۹.۸ درصد نسبت به نسخه‌ی اصلی V3 پیشرفت دارد. عملکرد این مدل، با سایر سیستم‌های هوش مصنوعی قدرتمند، مانند GPT-4.5 و کلاد سونت ۳.۷ قابل مقایسه است.

این مدل جدید، مجموعه‌ای از قابلیت‌های پیشرفته و بهبودیافته را به کاربران ارائه می‌دهد. یکی از مهم‌ترین آن‌ها، توانایی چشمگیرش در طراحی و ایجاد صفحات وب و همچنین رابط‌های کاربری حرفه‌ای برای بازی‌های آنلاین است. این مدل در زمینه‌های جستجو، نگارش متون و ترجمه به زبان چینی نیز عملکردی بسیار قوی‌تر و دقیق‌تر از نسخه‌های قبلی خود دارد.

برای کاربرانی که تمایل دارند مدل جدید DeepSeek-V3 با حجم ۶۸۵ میلیارد پارامتر را مورد آزمایش قرار دهند، حداقل ۷۰۰ گیگابایت فضای ذخیره‌سازی خالی و چندین پردازنده گرافیکی قدرتمند Nvidia A100 یا H100 مورد نیاز است. با این حال، نسخه‌های کوچک‌تر و تقطیرشده این مدل، با پارامترهای کمتر، قابلیت اجرا روی یک پردازنده گرافیکی واحد، مانند Nvidia 3090 را دارند.