خانهاخبار
انقلابی در جیب شما: جمنای و دنیای جدید تعامل با گوشی‌های هوشمند

انقلابی در جیب شما: جمنای و دنیای جدید تعامل با گوشی‌های هوشمند

به روزرسانی‌های جدید گوگل برای جمینای و جستجوی حلقه‌ای (Circle to Search) نگاهی به چگونگی تغییر و چرخش سیستم عامل اندروید به سمت هوش مصنوعی ارائه می‌دهند

۱۴۰۳/۲/۲۸

تقریبا ده سال پیش، گوگل در اندروید مارشملو قابلیت هیجان انگیزی به نام Now on Tap معرفی کرد. با نگه داشتن دکمه خانه، اطلاعات مفیدی بر اساس محتوای صفحه نمایش داده میشد. مثلا در حال چت با دوستانتان درباره فیلمی بودید، Now on Tap بدون نیاز به خارج شدن از برنامه پیام رسان، جزئیات فیلم را برایتان پیدا میکرد. یا اگر به رستورانی در یلپ نگاه میکردید، با یک ضربه، لیست پیشنهادی OpenTable برای رزرو میز نمایش داده میشد. در آن زمان این پیشرفت‌ها جادویی به نظر می‌رسیدند. توانایی گوشی در فهمیدن محتوای صفحه و پیش بینی کارهایی که ممکن است بخواهید انجام دهید، حسابی آینده‌نگرانه بود. Now on Tap یکی از ویژگی‌های هیجان انگیز در اندروید بود که بعدها به دستیار گوگل تبدیل شد. دستیار گوگل هم عالی بود ولی کارکردش دقیقا مشابه Now on Tap نبود.

در کنفرانس توسعه دهندگان گوگل I/O که در مانتین ویو، کالیفرنیا برگزار شد، ویژگی‌های جدیدی که گوگل برای سیستم عامل اندروید معرفی کرد، شباهت‌هایی به Now on Tap قدیمی دارند. این ویژگی‌ها با استفاده از اطلاعات محیطی اطراف شما، کار با گوشی را آسان‌تر می‌کنند. اما نکته کلیدی اینجاست که اینبار، این قابلیت‌ها با یک دهه پیشرفت در مدل‌های زبانی بزرگ تقویت شده‌اند. دیو برک، معاون مهندسی اندروید، چنین اظهار داشت: «نکته هیجان‌انگیز این است که ما اکنون فناوری ساخت دستیارهای واقعا قدرتمندی را در اختیار داریم. دستیارهایی که بتوانند آنچه را که می‌بینند درک کنند. چیزی که در آن زمان به خوبی نمی‌توانستیم انجام دهیم. اما حالا این امکان را داریم.»

هوش مصنوعی گوگل

سامیر سمات، رئیس اکوسیستم اندروید در گوگل، درباره تازگی‌های دنیای اندروید، دستیار هوش مصنوعی جدید جمنای و اینکه همه اینها برای آینده سیستم عامل اندروید چه معنایی دارد صحبت کرد و به این به‌روزرسانی‌ها به عنوان «فرصتی استثنایی برای اینکه دوباره تصور کنیم که یک گوشی چه کارهایی می‌تواند انجام دهد و کل سیستم عامل اندروید را بازنگری کنیم» اشاره کرد.
با قابلیت جدید گوگل به نام «جستجوی دایره‌ای» آشنا شوید  این قابلیت، رویکرد جدید گوگل برای جستجو در گوشی‌های موبایل است. جستجوی دایره‌ای که گوگل چند ماه پیش معرفی کرد، شبیه Now on Tap، تعاملی‌تر از تایپ کردن در کادر جستجو است. (شما به معنای واقعی کلمه، دور چیزی که می‌خواهید در موردش جستجو کنید، روی صفحه دایره می‌کشید.) برک می‌گوید: «این یک روش بسیار ملموس، سرگرم‌کننده و مدرن برای جستجو است ... به نظر می‌رسد کاربران جوان‌تر هم به خاطر سرگرم‌کننده بودنش بیشتر از آن استفاده می‌کنند.»

سمات ادعا می‌کند که گوگل بازخوردهای مثبتی از کاربران دریافت کرده است، اما آخرین ویژگی جستجوی دایره‌ای به طور خاص بر اساس بازخورد دانشجویان طراحی شده است. اکنون دانشجویان می‌توانند با کشیدن دایره به دور مسائل ریاضی و فیزیک، از قابلیت جستجوی دایره‌ای استفاده کنند. گوگل بدون اینکه کاربر از اپلیکیشن خلاصه‌نویسی خارج شود، راه حل مرحله به مرحله برای حل مسائل را ارائه می‌دهد. سمات تاکید کرد که  جمنای فقط پاسخ سوالات را ارائه نمی‌دهد بلکه به دانش‌آموزان نحوه حل مسائل را نیز نشان می‌دهد. تا اواخر امسال، جستجوی دایره‌ای قادر به حل مسائل پیچیده‌تر مانند نمودارها و شکل‌ها خواهد بود. این قابلیت‌ها همگی با مدل‌های LearnLM گوگل که برای آموزش بهینه‌سازی شده‌اند، کار می‌کنند.

جمنای در اندروید زمینه‌محورتر می‌شود

جمنای دستیار هوش مصنوعی گوگل است که در حال پیشرفت و ارتقای قابلیت‌های خود است. به طوری که در حال حاضر در بسیاری از گوشی‌های اندرویدی، به جای دستیار گوگل، می‌توانید از جمنای استفاده کنید. اما آیا این موضوع به معنای از رده خارج شدن دستیار گوگل است؟ سمات در پاسخ به این سوال گفت: «جمنای یک تجربه اختیاری در گوشی‌های اندرویدی است. به طور واضح، جمنای با گذشت زمان پیشرفته‌تر می‌شود و قابلیت‌های جدیدی به آن اضافه می‌شود. ما در حال حاضر خبر جدیدی برای اعلام نداریم، اما اگر کاربران بخواهند از این دستیار هوش مصنوعی جدید استفاده کنند، حق انتخاب دارند. آن‌ها می‌توانند جمنای را امتحان کنند و ما بازخوردهای مثبتی از کاربران دریافت کرده‌ایم.»

در کنفرانس توسعه‌دهندگان گوگل (I/O) اینطور عنوان شد که به‌روزرسانی‌های جمنای در اندروید باعث می‌شوند که این دستیار هوش مصنوعی، درست مانند Now on Tap در حدود یک دهه پیش، زمینه‌محورتر شود. تا پایان سال جاری، شما قادر خواهید بود با جمنای تصاویر ایجاد کنید و آن‌ها را به صورت درگ و دراپ (کشیدن و رها کردن) وارد برنامه‌هایی مانند جیمیل یا پیام‌های گوگل کنید. برک نمونه‌ای از تولید تصویر یک توپ تنیس با خیارشور توسط جمنای را در حالی که او در حال پاسخ دادن به پیام متنی کسی در مورد بازی پیکل‌بال بود، نشان داد. برک جمنای را که به صورت یک پوشش روی برنامه پیام‌رسان ظاهر شد، فراخواند و از آن خواست تا تصویر را تولید کند، سپس یکی از تصاویر را کشید و در چت رها کرد. بعد از آن، او یک ویدیوی یوتیوب در مورد قوانین پیکل‌بال را باز کرد. با فراخوانی جمنای در حین تماشای ویدیو، یک اعلان برای «پرسیدن سوال از این ویدیو» مشاهده خواهید کرد. این قابلیت به شما امکان می‌دهد تا از جمنای برای یافتن اطلاعات خاص در ویدیو بدون نیاز به اسکراب کردن کل ویدیو استفاده کنید. (چه کسی وقت برای این کار دارد؟) برک در مورد یک قانون خاص پیکل‌بال سوال کرد و جمنای به سرعت پاسخی مبتنی بر ویدیو ارائه داد. این عملکرد «خلاصه‌سازی» به ویژگی بارز بسیاری از ابزارهای هوش مصنوعی از جمله خلاصه‌سازی فایل‌های PDF، ویدیوها، یادداشت‌ها و اخبار تبدیل شده است.  

جمنای

راستی، به زودی می‌توانید یک فایل PDF را به جمنای ضمیمه کنید (که برای آن یک اعلان «پرسیدن سوال از این PDF» وجود خواهد داشت) و جمنای می‌تواند اطلاعات خاصی را ارائه دهد، در نتیجه شما را از نیاز به اسکرول کردن در چندین صفحه نجات می‌دهد. برک می‌گوید این ویژگی‌ها طی چند ماه آینده در دسترس میلیون‌ها دستگاه قرار خواهند گرفت، اگرچه ویژگی PDF تنها برای کاربران جمنای Advanced در دسترس خواهد بود؛ کاربرانی که برای دسترسی به قابلیت‌های پیشرفته مدل‌های هوش مصنوعی گوگل، اشتراک ماهانه 20 دلاری پرداخت می‌کنند. به طور کلی، جمنای بر اساس آنچه در صفحه نمایش اتفاق می‌افتد، پیشنهادات «پویاتر» بیشتری را نشان می‌دهد. این پیشنهادات درست بالای پوشش جمنای هنگام فعال کردن دستیار ظاهر خواهند شد.

ارتقاء برای جمنای نانو

جمنای نانو، مدل  بزرگ زبان گوگل است که برخی از قابلیت‌های خاص را به صورت مستقیم روی دستگاه در برخی گوشی‌های هوشمند، مانند سری پیکسل ۸، سری گلکسی اس ۲۴ سامسونگ و حتی پیکسل ۸A جدید، ارائه می‌کند. اجرای این قابلیت‌ها به صورت درون-دستگاهی به این معنی است که نیازی به ارسال اطلاعات به فضای ابری (cloud) نیست و در نتیجه باعث می‌شود این قابلیت‌ها از نظر حفظ حریم خصوصی کاربر، ایمن‌تر باشند. حتی امکان استفاده از آن‌ها به صورت آفلاین نیز وجود دارد. در حال حاضر، قابلیت نانو امکاناتی مانند «خلاصه‌ساز» را در برنامه ضبط صدای گوگل (Recorder) فراهم می‌کند که رونوشت‌ها را خلاصه می‌کند. همچنین، قابلیت «پاسخ هوشمند» را در برخی برنامه‌های پیام‌رسان خاص ارائه می‌دهد که پاسخ‌های خودکار متنی بیشتری را در پاسخ به پیام‌ها پیشنهاد می‌دهد. نسخه جدیدتر این مدل - جمنای نانو چندوجهی (Multimodality) - امسال و با گوشی‌های پیکسل عرضه خواهد شد. این نام کمی طولانی به نظر می‌رسد، اما به طور کلی به این معنی است که جمنای نانو قادر خواهد بود فراتر از پردازش متن عمل کند. برک می‌گوید: «این مدل یک مدل چندوجهی با ۳.۸ میلیارد پارامتر است. این اولین مدل چندوجهی داخلی است که به صورت درون‌دستگاهی کار می‌کند. این مدل بسیار قدرتمند است. بر اساس معیارهای دانشگاهی، عملکردی در حدود ۸۰ درصد از جمنای ۱.۰ را ارائه می‌دهد که برای یک مدل کوچک، بسیار عالی است.»

این مدل جدید، از این پس قابلیت خواننده صفحه نمایش «TalkBack» موجود گوگل در اندروید را که به کاربران نابینا و کم‌بینا در درک محتوای صفحه کمک می‌کند، تقویت خواهد کرد. گفته می‌شود جمنای نانو توضیحات غنی‌تر و دقیق‌تری از محتوای هر تصویر ارائه می‌دهد. گوگل می‌گوید به طور متوسط، کاربران TalkBalk روزانه «۹۰ تصویر بدون برچسب» را مشاهده می‌کنند، اما جمنای می‌تواند این شکاف را پر کند، زیرا قادر خواهد بود تصاویر روی صفحه را تجسم و درک کند و حتی زمانی که کاربر به صورت آفلاین است آن‌ها را توصیف کند. گوگل در چند سال گذشته بسیاری از توانایی‌های هوش مصنوعی خود را برای بهبود فناوری غربالگری تماس‌های تلفنی خود به کار گرفته است تا تماس‌های اسپم را محدود کند. به زودی، جمنای نانو چندوجهی به شما کمک می‌کند تا از کلاهبرداری‌های تلفنی - به صورت لحظه‌ای - جلوگیری کنید.

هوش مصنوعی گوگل

یک ویژگی جدید به نام «تشخیص کلاهبرداری» وجود دارد که جمنای را در تماس‌های تلفنی شما به گوش دادن وا می‌دارد و اگر عبارات یا درخواست‌های خاصی را از فردی که با او صحبت می‌کنید تشخیص دهد، یک هشدار مبنی بر اینکه احتمالاً درگیر یک تماس تلفنی کلاهبرداری هستید، صادر می‌کند. برک می‌گوید این مدل با استفاده از داده‌های وب‌سایت‌هایی مانند BanksNeverAskThat.com آموزش دیده است تا یاد بگیرد که یک بانک چه چیزی را از شما نمی‌پرسد – و یا چیزهایی که کلاهبرداران به طور معمول درخواست می‌کنند. او می‌گوید همه این فرآیند گوش دادن و تشخیص روی دستگاه انجام می‌شود، بنابراین از نظر حفظ حریم خصوصی کاربر، ایمن است. ما در اواخر امسال اطلاعات بیشتری در مورد این «ویژگی اختیاری» خواهیم شنید. بر خلاف روال معمول، گوگل اعلام کرده است که در روزهای آینده چند ویژگی جدید اندروید را معرفی خواهد کرد و قصد ندارد تمام موارد جدید را در اعلامیه‌های امروز فشرده کند، بنابراین برای اطلاعات بیشتر با ما همراه باشید. با ظهور ابزارهای سخت‌افزاری هوش مصنوعی که برای جایگزینی تلفن‌های هوشمند شما رقابت می‌کنند - و رابط‌های تولیدی بدون برنامه - از نظر سمات اندروید در پنج سال آینده چگونه تغییر خواهد کرد؟ او از دیدن نوآوری شرکت‌های جدید و موجود که چیزهای جدیدی را امتحان می‌کنند هیجان‌زده است - و اینکه گوگل نیز «در حال امتحان بسیاری از چیزها به صورت داخلی» است. اما او همه چیز را به یک قیاس با صنعت خودرو خلاصه کرد.

اگر شما یک ماشین بخرید، انتظار دارید ویژگی‌های استاندارد خاصی مانند فرمان داشته باشید. اما با هوش مصنوعی، یک جهش بزرگ این است که این ویژگی‌ها را حذف کنید - بدون فرمان، بدون رابط. سمات می‌گوید: «برخی از افراد از این ایده هیجان‌زده می‌شوند، در حالی که برخی دیگر شاید چندان خوشحال نباشند.» او معتقد است با کمک هوش مصنوعی، برخی از کارهایی که با گوشی‌هایمان انجام می‌دهیم، به شکل قابل توجهی «کمکی‌تر» خواهند شد. به عبارت دیگر، می‌توانیم انتظار داشته باشیم که برخی از ویژگی‌های رایج رابط کاربری به این ترتیب جایگزین شوند. سمات ادامه می‌دهد: «با پیشرفت هوش مصنوعی، شاهد فرصت‌هایی برای تغییر بنیادی رابط کاربری در برخی از زمینه‌ها خواهیم بود. این تغییر زمانی رخ می‌دهد که از مرحله‌ی «این قابلیت واقعا کمکی است» به مرحله‌ی «در واقع، باید روش کاملا جدیدی برای انجام این کار وجود داشته باشد» برسیم. همین موضوع است که کار روی این تکنولوژی را در حال حاضر هیجان‌انگیز و سرگرم‌کننده می‌کند. و عصر حاضر یک دوره‌ی فوق‌العاده برای کار بر روی این فناوری به شمار می‌رود.»

برچسب‌ها:

اخبار مشابه

برای ثبت نظر خود وارد حساب کاربری شوید.

دیدگاه‌ها (0 نظر)