خانهاخبار
هوش مصنوعی Gboard حالا می‌تواند حتی خط پزشکان را هم بخواند

هوش مصنوعی Gboard حالا می‌تواند حتی خط پزشکان را هم بخواند

اپلیکیشن کیبورد محبوب گوگل موسوم به Gboard اکنون به سطحی از هوش مصنوعی رسیده که قادر است دست‌خط‌های نامفهومی مثل دست‌خط پزشکان را هم تشخیص دهد.
۱۳۹۷/۱۲/۱۸

بر اساس گزارش تشریحی جدید گوگل، توسعه‌دهندگان بخش یادگیری ماشینی اپلیکیشن Gboard مدل جدیدی از این فناوری تولید کرده‌اند که می‌تواند حتی بدترین دست‌خط‌ها را تشخیص دهد.

حالت مبتنی بر هوش مصنوعی این کیبورد از زمان عرضه این برنامه پیشرفت‌های زیادی داشته اما مهم‌ترین چالش آن احتمالا هنوز فرا نرسیده است. اصلاحات جدیدی که با کمک پیشرفت‌های هوش مصنوعی در سیستم یادگیری ماشینی این اپلیکیشن حاصل شده و امکان تشخیص دست‌خط‌ها را فراهم می‌کند، حالا منجر به شکل گیری معماری‌ها و روش‌های آموزشی جدیدی شده که می‌تواند دقت این نرم‌افزار را ۲۰ تا ۴۰ درصد نسبت به نسخه قبلی افزایش دهد.

جدیدترین روشی که توسط مهندسان این شرکت به کار رفته در مقاله‌ای به طور کامل توضیح داده شده و ممکن است در نگاه اول بیش از حد پیچیده به نظر برسد، اما عملا سازوکار جذاب و خلاقانه‌ای دارد. این سیستم بر اساس شناسایی نقاط لمس، منحنی‌های بزیه و شبکه‌های عصبی بازگشتی (RNN)، به طور خاص شبکه‌های عصبی شبه-بازگشتی (QRNN)، کار می‌کند.

این یعنی نرم‌افزار گوگل دیگر به طور کامل بر «شاخصه‌های اکتشافیِ طراحی شده با دست» که ضربه‌ها را به کاراکترهای جداگانه تقسیم می‌کند وابسته نیست. این سیستم ابتدا نقاط تاچی را پیدا می‌کند که نقطه آغازین ضربه را نشان می‌دهند. این نقاط نشان می‌دهد که هر نشانه قرار بوده جزوی از کدام کاراکتر باشد اما در عین حال نرم‌افزار این نقاط را به زبان قابل خواندن کامپیوتر که همان منحنی‌های بزیه باشد ترجمه می‌کند.

روش QRNN با جابجا شدن میان لایه‌های تابیده و بازگشتی، پیش از رمزگشایی دست‌نوشته‌ها به متن دیجیتال، این خمیدگی‌ها و نقاط لمس را می‌خواند.

به طور خلاصه، هوش منصوعی هر کاراکتر را به همان صورتی می‌خواند که انسان‌ها هنگام نوشته شدن آن‌ها را مشاهده می‌کنند. این سازوکار به نرم‌افزار گوگل اجازه می‌دهد تا بر اساس مجموعه‌ای طبیعی‌تر از پارامترهایی که به راحتی توسط سیستم شناسایی می‌شوند، حدس بهتری داشته باشند. در این‌جا هر خمیدگی با مجموعه‌ای از داده‌ها مقایسه می‌شود تا احتمالات حاصله، خروجی پیش‌فرض و پیشنهادات ممکن تولید شود.

سرعت و سبکی

image

سوای از پیشرفت‌های مربوط به دقت حالت دست‌خط در Gboard، توسعه‌دهندگان این اپلیکیشن اطمینان یافته‌اند که این برنامه برای موبایل همچنان سبک بماند. آن‌ها برای حفظ دقت و افزایش سرعت پروسه‌ها، پیش از انتقال همه چیز به مدل‌های TensorFlow Lite، هوش مصنوعی خود را در TensorFlow آموزش داده‌اند. این کار باعث کاهش حجم کلی ابزار مربوطه شده و در عین حال حجم این ماژول آموزشی را در مقیاس «بایت به ازای وزن» تا ۷۵ درصد کاهش داده است.

این نکته اهمیت بسیار زیادی دارد چرا که یک کیبورد در وهله اول ابزاری برای ورود متن و برقراری ارتباط است. وقتی از این برنامه برای پیام‌رسانی یا یادداشت‌برداری استفاده می‌شود، حالت دست‌خط باید با حداکثر سرعت بتواند پاسخگوی نیاز کاربر باشد.

این قابلیت در حال حاضر فقط برای زبان‌های مبتنی بر حروف لاتین مثل انگلیسی و زبان‌هایی که مشابه آن هستند در دسترس است، اما به زودی می‌توانیم منتظر پشتیبانی از سایر زبان‌ها هم باشیم. اگرچه تاکنون تاریخی برای توسعه این قابلیت اعلام نشده، اما گوگل می‌گوید تیم آن‌ها مشغول کار است تا قابلیت مذکور را در اختیار بیش از ۱۰۰ زبانی قرار دهد که در حال حاضر در بخش زبان‌های دست‌خط این اپلیکیشن پشتیبانی می‌شوند.

اخبار مشابه

برای ثبت نظر خود وارد حساب کاربری شوید.

دیدگاه‌ها (0 نظر)