دستگاه‌های اندرویدی سال‌هاست که دارای یک قابلیت صفحه‌خوان داخلی به نام TalkBack هستند. این ویژگی به افراد دارای مشکلات بینایی کمک می‌کند تا محتوای نمایش‌داده‌شده روی صفحه‌نمایش گوشی خود را درک کرده و با استفاده از صدا آن را کنترل کنند. در سال ۲۰۲۴، گوگل هوش مصنوعی Gemini را به این قابلیت اضافه کرد تا توصیف دقیق‌تری از تصاویر ارائه دهد.

اکنون گوگل این ویژگی را با یک لایه جدید از تعاملات راحت‌تر برای کاربران تقویت کرده است. تا پیش از این، Gemini فقط تصاویر را توصیف می‌کرد. اما اکنون کاربران هنگام مشاهده تصاویر می‌توانند سوالات تکمیلی درباره آن‌ها بپرسند و گفت‌وگوی دقیق‌تری داشته باشند.

این قابلیت چگونه به افراد با مشکلات بینایی کمک می‌کند؟

گوگل می‌گوید: دفعه بعد که یکی از دوستانتان عکسی از گیتار جدیدش برایتان بفرستد، می‌توانید توصیفی از آن دریافت کرده و سوالاتی مانند نوع و رنگ آن یا حتی اینکه چه چیزهای دیگری در تصویر هستند بپرسید. این قابلیت بر پایه‌ی ارتقای دسترسی‌پذیری‌ای است که در اواخر سال گذشته، Gemini را در سیستم TalkBack ادغام کرد.

گوگل جمینی وب‌گردی را برای کاربران دارای مشکلات بینایی و شنوایی آسان‌تر می‌کند - دیجینوی
توصیف صفحه اندروید با هوش مصنوعی گوگل

در منوی TalkBack در اندروید، اکنون گزینه‌ای اختصاصی به نام Describe Screen (توصیف صفحه) دیده می‌شود که Gemini را در مرکز کنترل قرار می‌دهد. به‌عنوان مثال، اگر کاربران در حال مرور یک کاتالوگ پوشاک باشند، Gemini نه تنها آنچه روی صفحه است را توصیف می‌کند، بلکه به سوالات مرتبط نیز پاسخ می‌دهد.

برای نمونه، کاربران می‌توانند سوالاتی مانند «کدام لباس برای یک شب سرد زمستانی مناسب‌تر است؟» یا «کدام سس برای ساندویچ بهتر است؟» را بپرسند. Gemini همچنین قادر خواهد بود کل صفحه را تحلیل کرده و اطلاعات دقیقی درباره محصولات یا تخفیف‌های موجود ارائه دهد.

در دیجینوی بخوانید:

استفاده یوتیوب از هوش مصنوعی برای تبلیغات بین ویدیوها

توصیف‌های تصویری غنی‌تر و بهبود بزرگ‌نمایی متن

در مرورگر Chrome، گوگل به زیرنویس‌های خودکار ویدیوها بهبودهایی کوچک اما مهم داده است. فرض کنید در حال تماشای یک مسابقه فوتبال هستید؛ زیرنویس‌ها دیگر تنها به تکرار کلمات گزارشگر بسنده نمی‌کنند، بلکه احساسات و لحن او را نیز منتقل خواهند کرد.

برای مثال، به‌جای نمایش صرف کلمه «گل»، افراد دارای مشکلات شنوایی ممکن است ببینند «گــــــــل» که هیجان بیشتری را منتقل می‌کند. گوگل این نوع جدید زیرنویس‌ها را Expressive Captions (زیرنویس‌های احساسی) نامیده است.

گوگل جمینی وب‌گردی را برای کاربران دارای مشکلات بینایی و شنوایی آسان‌تر می‌کند - دیجینوی
زیرنویس احساسی با هوش مصنوعی جمینای

این زیرنویس‌ها علاوه بر گفتار انسانی، صداهای مهم دیگری مانند سوت، تشویق یا حتی صاف کردن گلو را نیز شامل خواهند شد. زیرنویس‌های احساسی در دستگاه‌هایی با سیستم‌عامل Android 15 یا نسخه‌های جدیدتر، در کشورهای آمریکا، بریتانیا، کانادا و استرالیا در دسترس خواهند بود.

یکی دیگر از تغییرات مهم در مرورگر Chrome، قابلیت بزرگ‌نمایی تطبیقی متن (Adaptive Text Zoom) است. این ویژگی نسخه‌ای بهبود‌یافته از سیستم بزرگ‌نمایی صفحه در گوشی‌های اندرویدی است. اکنون با بزرگ‌کردن متن، چیدمان سایر بخش‌های صفحه تغییر نخواهد کرد.

گوگل می‌گوید: «می‌توانید مشخص کنید چقدر می‌خواهید بزرگ‌نمایی داشته باشید و این تنظیم را به‌راحتی برای تمام صفحات یا فقط صفحات خاص اعمال کنید.» کاربران می‌توانند با استفاده از یک لغزنده (Slider) در پایین صفحه، دامنه بزرگ‌نمایی را تنظیم کنند.