مایکروسافت در حال ادامه دادن به عرضه مدل‌های هوش مصنوعی داخلی خود است و به این ترتیب، وابستگی‌اش به همکاری دیرینه با OpenAI را بیش از پیش کاهش می‌دهد. امروز، این شرکت MAI-Image-1 را معرفی کرد، که اولین مدل هوش مصنوعی تولید تصویر توسعه‌یافته داخلی مایکروسافت محسوب می‌شود.

بر اساس پست وبلاگی منتشر شده، مدل MAI-Image-1 به‌ویژه در ایجاد نتایج فوق‌العاده واقع‌گرایانه (Photorealistic) مهارت دارد و می‌تواند نورپردازی طبیعی و مناظر خیره‌کننده‌ای تولید کند. در حال حاضر، این مدل در LMArena در حال آزمایش است و مایکروسافت اعلام کرد که قصد دارد MAI-Image-1 را «به‌زودی» در اختیار کاربران Copilot و ابزار Bing Image Creator قرار دهد.

پیش از این، مایکروسافت تابستان امسال با رونمایی از دو مدل آموزش‌دیده داخلی خود، یعنی MAI-Voice-1 و MAI-1-preview، اولین گام‌ها را برای کاهش همکاری با OpenAI برداشت. در آن زمان، مصطفی سلیمان، رهبر بخش هوش مصنوعی مایکروسافت، در مصاحبه‌ای اظهار داشت که این شرکت «یک نقشه راه عظیم پنج‌ساله» را در پیش گرفته و فصلی در آن سرمایه‌گذاری می‌کند. تاکنون، به نظر می‌رسد این نقشه راه با سرعت قابل قبولی در حال اجرا است.

مایکروسافت مدل‌های Claude از Anthropic را به Copilot 365 اضافه می‌کند

مایکروسافت از اولین مولد تصویر هوش مصنوعی توسعه‌یافته داخلی خود رونمایی کرد - دیجینوی

بر اساس گزارش‌های خبری چند هفته پیش، مایکروسافت ۳۶۵ Copilot در حال اضافه کردن مدل‌های هوش مصنوعی شرکت Anthropic است. مایکروسافت امروز اعلام کرد که دسترسی به مدل‌های Claude برای کاربران بتای Copilot در حال فراهم شدن است. در ابتدا، این مدل‌ها در ابزار Researcher و ابزار توسعه عامل‌های هوش مصنوعی Copilot Studio ادغام می‌شوند.

مایکروسافت در اطلاعیه خود سریعاً تأکید کرد: «Copilot همچنان توسط جدیدترین مدل‌های OpenAI قدرت خواهد گرفت.» با این حال، پس از انتشار گزارش‌هایی درباره تنش‌های فزاینده میان این دو شریک در اوایل ماه جاری و همچنین گزارش‌هایی مبنی بر مذاکرات دشوار، تصور وجود اختلاف میان این دو شرکت آسان بود.

خواه این شایعات صحت داشته باشند یا خیر، مدل‌های OpenAI مانند GPT-5 هنوز هم نیروی محرکه اصلی اکثر عملکردهای Copilot هستند… فعلاً. اما اکنون ابزار Researcher در مایکروسافت ۳۶۵ به آزمایش‌کنندگان اجازه می‌دهد تا از مدل Claude Opus 4.1 متعلق به Anthropic استفاده کنند. ابزار استدلال (reasoning tool) Copilot که اوایل امسال معرفی شد، برای کمک به کاربران در «رسیدگی به تحقیقات پیچیده و چند مرحله‌ای» طراحی شده است.

نحوه فعال‌سازی:

  • مایکروسافت ویدیویی منتشر کرد که یک دکمه جدید با عنوان «Try Claude» را در گوشه سمت راست بالای رابط کاربری عامل تحقیقاتی نشان می‌دهد.
  • Copilot Studio، که ابزار توسعه‌دهنده عامل‌های هوش مصنوعی مایکروسافت است، قابلیت مشابهی را ارائه می‌دهد. در آنجا، یک منوی کشویی به شما اجازه می‌دهد بین مدل‌های OpenAI و Anthropic یکی را انتخاب کنید.

ادغام Anthropic در حال حاضر از طریق برنامه Frontier مایکروسافت (برنامه بتای اختیاری برای پیش‌نمایش‌های هوش مصنوعی) در حال اجرا است. پس از ثبت‌نام، باید گزینه استفاده از Anthropic را فعال کنید. انتظار می‌رود این قابلیت در آینده به طور گسترده‌تری برای عموم منتشر شود.

چارلز لامانا از مایکروسافت این ادغام را هیجان‌انگیز توصیف کرده و نوید داده است که «مدل‌های Anthropic تجربه‌های بسیار قدرتمندتری را به Microsoft 365 Copilot خواهند آورد.»

مایکروسافت تلاش می‌کند «Vibe Working» را جا بیندازد

مایکروسافت از اولین مولد تصویر هوش مصنوعی توسعه‌یافته داخلی خود رونمایی کرد - دیجینوی

مایکروسافت با الهام از جریان‌های کاری مبتنی بر هوش مصنوعی مانند “Vibe Coding”، اکنون قصد دارد مفهوم “Vibe Working” را به واقعیت تبدیل کند (بله، این دقیقاً کلماتی است که شرکت انتخاب کرده است). در حالی که سؤالات مهمی مانند اینکه آیا هوش مصنوعی در محیط کار واقعاً خروجی‌های ارزشمندی ایجاد می‌کند یا آیا توانایی یادگیری مغز ما را به خطر می‌اندازد، بی‌پاسخ مانده‌اند، مایکروسافت با اعتماد به نفس می‌گوید: «Vibe Working همانی است که باید باشد.»

با استفاده از ابزار Office Agent در داخل برنامه‌های آفیس یا چت Copilot، کاربران می‌توانند با یک فرمان ساده، یک سند را آغاز کنند و سپس به صورت تکرارشونده و تعاملی در کنار Copilot کار کنند تا یک محصول نهایی توسعه دهند. مایکروسافت این روش را «الگوی جدید کار برای همکاری انسان-عامل هوش مصنوعی» می‌نامد. ابزار Agent Mode از جریان‌های کاری در Excel و Word پشتیبانی می‌کند و مایکروسافت اعلام کرده که پشتیبانی از PowerPoint به زودی اضافه خواهد شد.

این شرکت درباره در دسترس بودن «تمام قدرت اکسل» تنها برای کاربران خبره صحبت می‌کند و وعده می‌دهد که یک Agent Mode که می‌تواند «به زبان اکسل صحبت کند»، همه این محدودیت‌ها را تغییر خواهد داد. در داده‌های منتشر شده، مایکروسافت اعلام کرد که Agent Mode در اکسل در بنچمارک SpreadsheetBench به دقت ۵۷.۲ درصد دست یافته است. این در حالی است که امتیاز عملکرد انسان در این تست ۷۱.۳ درصد بوده است (البته مشخص نیست این امتیاز مربوط به کاربران عادی یا حرفه‌ای است). با این حال، امتیازها هنوز عالی نیستند!

Agent Mode در Word نیز برای خلاصه کردن، ویرایش و البته کمک به ایجاد پیش‌نویس کامل اسناد کار می‌کند. Agent Mode در Excel و Word توسط جدیدترین مدل‌های OpenAI قدرت می‌گیرند. در مقابل، Office Agent در چت Copilot توسط مدل‌های Anthropic پشتیبانی می‌شود و می‌تواند اسناد Word و ارائه پاورپوینت را در آنچه مایکروسافت «تجربه چت-اول» می‌نامد، ایجاد کند.

Agent Mode برای Excel و Word، و همچنین Office Agent، از امروز از طریق برنامه Frontier در دسترس هستند. Agent Mode در حال حاضر به نسخه‌های مبتنی بر وب Word و Excel محدود شده و به زودی به دسکتاپ خواهد آمد.

برنامه Sora از OpenAI با سرعت بیشتری از ChatGPT به یک میلیون دانلود رسید

Sora، برنامه و شبکه اجتماعی OpenAI برای ویدیوهای تولید شده توسط هوش مصنوعی، طبق گفته بیل پیبلز، رئیس Sora، تاکنون بیش از یک میلیون بار دانلود شده است. پیبلز می‌گوید این برنامه در کمتر از پنج روز به یک میلیون دانلود رسید و حتی سریع‌تر از ChatGPT عمل کرده است. این موفقیت با وجود اینکه OpenAI تنها این برنامه را در آمریکای شمالی عرضه کرده و برای استفاده از آن نیاز به دعوت‌نامه است، به دست آمده است.

Sora، شبیه به تیک‌تاک، یک فید عمودی و بی‌پایان از ویدیوها را ارائه می‌دهد؛ با این تفاوت که ویدیوهای Sora به‌جای اینکه توسط کاربران بارگذاری شوند، تولید شده توسط هوش مصنوعی هستند. ساخت یک ویدیوی ۱۰ ثانیه‌ای فقط با نوشتن یک فرمان متنی به مدل Sora 2 در برنامه امکان‌پذیر است. علاوه بر این، از طریق قابلیت Cameo، می‌توانید ویدیوهایی از خود و هر کسی که برای اشتراک‌گذاری چهره خود رضایت داده است، ایجاد کنید.

مسائل مربوط به محتوا و حق نسخه‌برداری:

  • پیبلز در شبکه X نوشت: «Sora در کمتر از ۵ روز به ۱ میلیون دانلود برنامه رسید، حتی سریع‌تر از ChatGPT (با وجود نیاز به دعوت‌نامه و تمرکز تنها بر آمریکای شمالی)!»
  • ریل‌های محدود که OpenAI برای Sora قرار داده است، از همین حالا منجر به تولید ویدیوهایی با چهره سم آلتمن (مدیرعامل OpenAI) و محتوایی شده که به وضوح حق نسخه‌برداری را نقض می‌کند. این واقعیت که Sora می‌تواند به راحتی ویدیوهایی از شخصیت‌های شناخته‌شده مانند پیکاچو بسازد، سؤالاتی را در مورد منابع آموزشی مدل OpenAI ایجاد کرده و طبیعتاً با واکنش منفی صنعت سرگرمی مواجه شده است.

در پاسخ به این نگرانی‌ها، شرکت Sora را به‌روزرسانی کرده تا کاربران کنترل بیشتری بر اینکه چهره‌شان در چه ویدیوهایی ظاهر شود، داشته باشند. آلتمن گفته است که OpenAI قصد دارد کنترل‌های مشابهی را برای دارندگان حقوق نیز ارائه دهد و به آن‌ها «امکان مشخص کردن نحوه استفاده از شخصیت‌هایشان (حتی عدم استفاده از آن‌ها)» را بدهد.

Microsoft 365 Premium برای ارائه ارزش هوش مصنوعی بیشتر از ChatGPT Plus

مایکروسافت در حال اضافه کردن یک طرح اشتراکی جدید به لیست قیمت‌های خود است. طرح جدید Microsoft 365 Premium که ۲۰ دلار در ماه هزینه دارد، مجموعه استاندارد برنامه‌های آفیس را همراه با دسترسی به جدیدترین مدل‌های هوش مصنوعی OpenAI و محدودیت‌های استفاده بالاتر از هوش مصنوعی ارائه می‌دهد.

مایکروسافت این طرح را به عنوان یک اشتراک با ارزش بالاتر نسبت به ChatGPT Plus (که آن هم ۲۰ دلار در ماه قیمت دارد) معرفی می‌کند، زیرا مزیت داشتن برنامه‌های آفیس و ۱ ترابایت فضای ذخیره‌سازی OneDrive را نیز شامل می‌شود.

تغییرات در اشتراک‌ها:

  • خوشبختانه، مایکروسافت فعلاً قیمت‌گذاری طرح‌های ارزان‌تر خود، مانند MS 365 Personal (۱۰ دلار در ماه) یا MS 365 Family (۱۳ دلار در ماه) را تغییر نمی‌دهد.
  • نماینده مایکروسافت اعلام کرد که اشتراک Copilot Pro دیگر برای خرید در دسترس نیست، اما مشترکین موجود می‌توانند بدون مشکل به استفاده از آن ادامه دهند. مایکروسافت این کاربران را به طور خودکار به طرح MS 365 Premium منتقل نخواهد کرد.

به گفته شرکت، Microsoft 365 Premium به کاربران امکان دسترسی به مدل‌های GPT-5 و GPT-4o، و همچنین عامل‌های هوش مصنوعی پیشرفته‌ای از جمله «Actions, Researcher and Analyst» را می‌دهد. این قابلیت‌ها مستقیماً با طرح OpenAI که از ChatGPT Agents استفاده می‌کند، قابل مقایسه است. کاربران MS 365 Premium همچنین می‌توانند ویژگی‌های جدید هوش مصنوعی را به محض در دسترس شدن آزمایش کنند، اما به GPT‌های سفارشی OpenAI یا قابلیت تولید ویدیوی Sora دسترسی نخواهند داشت.