سه ماه پس از رونمایی اولیه از مدل DeepSeek V3، نسخه بهبود یافته آن عرضه شده است. این مدل جدید، با ارتقای چشمگیر عملکرد و قابلیتهای خود، امکان خلق صفحات وب جذاب و نگارش گزارشهای شیوا به زبان چینی را برای کاربران فراهم میکند.
شرکت DeepSeek، یکی از پیشگامان عرصه هوش مصنوعی در چین، نسخه جدید مدل زبانی بزرگ V3 خود را بعد از چند ماه منتشر کرده است. مدل V3 با وجود نیاز به سختافزار آموزشی بسیار کمتر، زمان آموزش کوتاهتر و هزینههای کمتر API، توانست عملکردی قابل قیاس با رقبای قدرتمندی همچون مدلهای GPT شرکت OpenAI ارائه دهد و تحسین همگان را برانگیزد.
مدل بهروزرسانیشدهی V3، یک سامانهی هوش مصنوعی غیر استدلالی است که به جای صرف زمان اضافی برای تحلیل مسائل پیچیده، مانند مدل دیپسیک R1، تلاش میکند تا به سرعت به پرسشها پاسخ دهد. حجم پارامترهای این مدل که بالغ بر ۶۸۵ میلیارد واحد بوده، آن را در زمرهی بزرگترین مدلهای زبان بزرگ قابل دسترس برای عموم قرار میدهد. این مدل جدید، تحت مجوز MIT قابل بهرهبرداری است.

مدل جدید در بنچمارکهای هوش مصنوعی، بین ۵.۳ تا ۱۹.۸ درصد نسبت به نسخهی اصلی V3 پیشرفت دارد. عملکرد این مدل، با سایر سیستمهای هوش مصنوعی قدرتمند، مانند GPT-4.5 و کلاد سونت ۳.۷ قابل مقایسه است.
این مدل جدید، مجموعهای از قابلیتهای پیشرفته و بهبودیافته را به کاربران ارائه میدهد. یکی از مهمترین آنها، توانایی چشمگیرش در طراحی و ایجاد صفحات وب و همچنین رابطهای کاربری حرفهای برای بازیهای آنلاین است. این مدل در زمینههای جستجو، نگارش متون و ترجمه به زبان چینی نیز عملکردی بسیار قویتر و دقیقتر از نسخههای قبلی خود دارد.
برای کاربرانی که تمایل دارند مدل جدید DeepSeek-V3 با حجم ۶۸۵ میلیارد پارامتر را مورد آزمایش قرار دهند، حداقل ۷۰۰ گیگابایت فضای ذخیرهسازی خالی و چندین پردازنده گرافیکی قدرتمند Nvidia A100 یا H100 مورد نیاز است. با این حال، نسخههای کوچکتر و تقطیرشده این مدل، با پارامترهای کمتر، قابلیت اجرا روی یک پردازنده گرافیکی واحد، مانند Nvidia 3090 را دارند.
دیدگاه ها