جمینی به قابلیت تحلیل زنده صفحه‌نمایش و ویدئو مجهز شد

13 اسفند 1403
ارسال توسط دکتر شین

در جریان کنگره جهانی موبایل (MWC) 2025، گوگل از دو قابلیت جدید برای دستیار هوش مصنوعی خود، جمینی، رونمایی کرد. این قابلیت‌ها شامل “Screenshare” برای تحلیل زنده صفحه‌نمایش و “Gemini Live” برای پردازش ویدئوهای زنده هستند. این ویژگی‌ها جمینی را به ابزاری قدرتمندتر برای تعامل چندرسانه‌ای تبدیل می‌کنند.

تحلیل زنده صفحه‌نمایش با Screenshare

ویژگی Screenshare به کاربران اجازه می‌دهد صفحه نمایش گوشی خود را با جمینی به اشتراک بگذارند و از آن سوالاتی مرتبط با محتوای نمایش داده‌شده بپرسند. برای نمونه، در یکی از دموهای ارائه‌شده، کاربری تصویری از یک جفت شلوار جین را روی یک صفحه وب به جمینی نشان داد و از آن برای دریافت پیشنهادهای استایل مناسب درخواست کرد.

این قابلیت نسخه پیشرفته‌تری از Google Lens محسوب می‌شود که پیش‌تر امکان شناسایی اشیا را بر اساس هایلایت صفحه فراهم می‌کرد. اما ترکیب این ویژگی با یک دستیار صوتی که توانایی مکالمه طبیعی دارد، باعث شده کاربران بتوانند به شکل روان‌تری با آن تعامل داشته باشند.

پردازش ویدئوهای زنده با Gemini Live

ویژگی دیگری که گوگل معرفی کرده، Gemini Live نام دارد. این قابلیت به کاربران امکان می‌دهد از طریق دوربین گوشی خود، ویدئوهای زنده را به جمینی نمایش دهند و از آن درخواست راهنمایی کنند.

در یک نمونه، کاربری دوربین گوشی خود را روی یک گلدان تنظیم کرد و از جمینی درباره رنگ‌های مناسب برای آن مشورت گرفت. این فناوری می‌تواند در زمینه‌هایی مانند طراحی داخلی، خرید آنلاین و دریافت راهنمایی‌های عملی در لحظه، بسیار کاربردی باشد.

بیشتر بخوانید:

رقابت گوگل و OpenAI بر سر هوش مصنوعی چندرسانه‌ای

با اضافه شدن این قابلیت‌ها، جمینی یک گام دیگر به سمت هوش مصنوعی چندرسانه‌ای پیشرفته مشابه ChatGPT برداشته است. نسخه‌های جدید ChatGPT در حالت صوتی پیشرفته می‌توانند ویدئوها را به‌صورت زنده تحلیل کنند و گوگل نیز با معرفی این قابلیت‌ها، در مسیر رقابت با آن‌ها حرکت می‌کند.

عرضه برای کاربران نسخه پریمیوم

گوگل اعلام کرده که ویژگی‌های جدید جمینی به‌زودی برای کاربران طرح Google One AI Premium در دسترس قرار خواهند گرفت. این طرح علاوه بر دسترسی به Gemini Advanced، شامل 2 ترابایت فضای ذخیره‌سازی ابری نیز می‌شود.

آینده هوش مصنوعی در زندگی روزمره

این به‌روزرسانی‌ها نشان می‌دهند که گوگل در حال حرکت به سمت یکپارچه‌سازی بیشتر هوش مصنوعی با زندگی روزمره کاربران است. اکنون، تعامل صوتی، تحلیل بصری و پردازش داده‌های چندرسانه‌ای در لحظه، همگی در یک دستیار هوشمند گرد هم آمده‌اند. با معرفی قابلیت‌هایی مانند Screenshare و Gemini Live، گوگل گام مهمی در رقابت با سایر شرکت‌های پیشرو در حوزه هوش مصنوعی برداشته است.

برگرفته از notebookcheck.net

389