OpenAI مدل هوش مصنوعی سریعتر و ارزانتر GPT-4o را معرفی کرد
آپدیت جدید GPT4 هوش از سر شما میپراند!
در جریان رویدادی زندهی اینترنتی که روز دوشنبه برگزار شد، شرکت OpenAI از مدل جدید هوش مصنوعی خود به نام GPT-4o رونمایی کرد.
این مدل، نسخهی بهروزرسانیشدهی مدل GPT-4 است که در حال حاضر بیش از یک سال از عرضهی آن میگذرد. مدل جدید زبانِ بزرگ (Large Language Model) که با حجم عظیمی از دادههای اینترنتی آموزش داده شده است، میتواند به شکل بهتری و در زمان واقعی، متن، صدا و تصاویر را پردازش کند.
این بهروزرسانیها طی چند هفتهی آینده در اختیار کاربران قرار خواهد گرفت.
شرکت OpenAI اعلام کرده است که با پرسیدن یک سوال به صورت صوتی، سیستم میتواند با پاسخی صوتی در عرض چند میلیثانیه جواب دهد و به این ترتیب، گفتگویی روانتر را رقم بزند.
در نمایشی از قابلیتهای این مدل، محققان OpenAI و مدیر ارشد فناوری، میرا مراتى، با استفاده از صدای خود با نسخهی جدید ChatGPT گفتگو کردند.
این نمایش نشان داد که این ابزار میتواند به صورت صوتی پاسخ دهد. همچنین در طول ارائه، به نظر میرسید که این چتبات میتواند تقریباً به صورت آنی، گفتار را از یک زبان به زبان دیگر ترجمه کند و حتی با درخواست، بخشی از یک داستان را به صورت آواز بخواند.
خانم مراتى، مدیر ارشد فناوری OpenAI، در مصاحبهای با Bloomberg News گفت: "این اولین باری است که ما گامی بزرگ در زمینهی تعامل و سهولت استفاده برمیداریم. ما واقعاً این امکان را برای شما فراهم میکنیم که با ابزارهایی مانند ChatGPT همکاری کنید."
این بهروزرسانی برای کاربران رایگان چندین ویژگی جدید به همراه خواهد داشت که پیش از این تنها برای کاربران با اشتراک پولی ChatGPT در دسترس بود. این قابلیتهای جدید شامل مواردی مانند: امکان جستوجوی وب برای یافتن پاسخ به سوالات و صحبت کردن با چتبات و شنیدن پاسخ با صداهای مختلف دستور دادن به چتبات برای ذخیرهی اطلاعاتی که بتواند در آینده آنها را به یاد بیاورد است. با این قابلیتهای جدید، تعامل با مدلهای هوش مصنوعی مانند ChatGPTبسیار طبیعیتر و کاربرپسندانهتر خواهد شد.
انتشار GPT-4o عرصهی هوش مصنوعی را که به سرعت در حال پیشرفت است، تکان خواهد داد.
در این عرصه، GPT-4 همچنان به عنوان الگوی برتر شناخته میشود. با این حال، به تازگی تعداد زیادی از شرکتهای نوپا و غولهای فناوری، از جمله Anthropic، Cohere و Google زیرمجموعهی Alphabet Inc. مدلهای هوش مصنوعی خود را ارائه کردهاند که به گفتهی آنها، در معیارهای خاصی با عملکرد GPT-4 برابری میکنند یا از آن پیشی میگیرند.
انتشار مدل GPT-4o توسط OpenAI میتواند زمینهی هوش مصنوعی را که به سرعت در حال پیشرفت است، به طور قابل توجهی تحت تاثیر قرار دهد.
اگرچه GPT-4 همچنان به عنوان الگوی برتر شناخته میشود، اما به تازگی شرکتهای نوپا و غولهای فناوری بسیاری مانند Anthropic، Cohere و Google زیرمجموعهی Alphabet Inc. مدلهای هوش مصنوعی خود را ارائه کردهاند که ادعا میشود در معیارهای خاصی با عملکرد GPT-4 برابری میکنند یا حتی از آن پیشی میگیرند.
جالب است که اعلام OpenAI درست یک روز قبل از کنفرانس توسعهدهندگان Google I/O صورت میگیرد. گوگل، که از پیشگامان حوزهی هوش مصنوعی به شمار میرود، انتظار میرود از این رویداد برای رونمایی از بهروزرسانیهای جدید هوش مصنوعی خود استفاده کند.
این اقدام احتمالا تلاشی برای حفظ رقابت با شرکت OpenAI است که از حمایت مایکروسافت برخوردار است.
در یک پست وبلاگ نادر که روز دوشنبه منتشر شد، مدیرعامل OpenAI، سام آلتمن، گفت که در حالی که نسخهی اصلی GPT پیش نمایشی از نحوهی تعامل افراد با کامپیوترها از طریق زبان بود، استفاده از GPT-4o احساسی "کاملاً متفاوت" دارد.
این امر نشان میدهد که مدل جدید GPT-4o نه تنها از نظر سرعت و کارایی، بلکه از نظر تجربهی کاربری نیز یک پیشرفت قابل توجه نسبت به مدلهای قبلی به شمار میرود.
کاربران میتوانند انتظار تعاملات بسیار طبیعیتر و کاربرپسندانهتری با هوش مصنوعی را داشته باشند. برخلاف مدلهای قبلی که برای پردازش ورودیهای مختلف به چندین مدل هوش مصنوعی مجزا نیاز داشتند، GPT-4o (با "o" به معنای همه جانبه) صدا، متن و تصویر را در یک مدل واحد ترکیب می کند.
این موضوع باعث میشود تا سرعت آن از مدلهای پیشین بالاتر رود. برای مثال، اگر تصویری را به عنوان ورودی به سیستم بدهید، میتواند با یک تصویر دیگر پاسخ دهد. شرکت OpenAI اعلام کرده است که مدل جدید دو برابر سریعتر و به طور قابل توجهی کارآمدتر است.
مدیر ارشد فناوری OpenAI، میرا مراتى، دربارهی مزایای ترکیب چندین ورودی به یک مدل واحد توضیح داد: "وقتی شما از سه مدل هوش مصنوعی مجزا برای پردازش ورودیهای مختلف استفاده میکنید، تأخیر زیادی در عملکرد به وجود میآید و این امر باعث برهم خوردن تجربهی کاربر میشود. اما زمانی که یک مدل واحد به صورت ذاتی صدا، متن و تصویر را درک کند، تمام این تأخیرها برطرف شده و تعامل شما با ChatGPT بسیار شبیه به گفتگوی ما در حال حاضر خواهد بود.
"با وجود مزایای قابل توجه، مدل جدید در نمایش خود با چند چالش روبرو شد. صدای محققان در طول نسخه دمو چندین بار قطع شد. همچنین سیستم هوش مصنوعی، مخاطبان را غافلگیر کرد. هنگامی که این سیستم در حال آموزش حل یک مسئلهی جبر به یکی از محققان بود، با لحنی به نظر معاشرتی گفت: "وای، چه لباس قشنگی پوشیدهاید!"
در یک پست وبلاگ نادر که روز دوشنبه منتشر شد، مدیرعامل OpenAI، سام آلتمن، گفت که در حالی که نسخهی اصلی GPT پیش نمایشی از نحوهی تعامل افراد با کامپیوترها از طریق زبان بود، استفاده از GPT-4o احساسی "کاملاً متفاوت" دارد.
این امر نشان میدهد که مدل جدید GPT-4o نه تنها از نظر سرعت و کارایی، بلکه از نظر تجربهی کاربری نیز یک پیشرفت قابل توجه نسبت به مدلهای قبلی به شمار میرود.
کاربران میتوانند انتظار تعاملات بسیار طبیعیتر و کاربرپسندانهتری با هوش مصنوعی را داشته باشند.
آلتمن در ادامهی این پست گفت: "احساس میشود هوش مصنوعی از فیلمها وارد دنیای واقعی شده است؛ و هنوز کمی برایم عجیب است که این فناوری واقعی است." او اضافه کرد: "رسیدن به زمان پاسخدهی و قدرت بیان در سطح انسان، یک تغییر بزرگ است."
OpenAI اعلام کرده است که از امروز قابلیتهای جدید متن و تصویر GPT-4o را برای برخی از کاربران پولی ChatGPT پلاس و تیم (ChatGPT Plus and Team) فعال میکند و به زودی این قابلیتها را در اختیار کاربران سازمانی نیز قرار خواهد داد.
همچنین نسخهی جدید دستیار "حالت صدا" برای کاربران ChatGPT پلاس طی چند هفتهی آینده عرضه خواهد شد. بهعنوان بخشی از بهروزرسانیهای خود، OpenAI اعلام کرده است که دسترسی به فروشگاه GPT (GPT Store) را برای عموم آزاد میکند. این فروشگاه شامل چتباتهای سفارشیسازیشدهای است که توسط کاربران ساخته شدهاند. پیش از این، دسترسی به این فروشگاه تنها برای مشتریان پولی امکانپذیر بود.
در چند هفتهی اخیر، گمانهزنیها دربارهی عرضهی بعدی OpenAI به سرگرمی محافل فناوری تبدیل شده بود. یک چتبات جدید و مرموز پس از حضور در یک وبسایت معیارسنجی و عملکردی در حد و اندازهی GPT-4، هیجان زیادی را در میان ناظران حوزهی هوش مصنوعی ایجاد کرد.
آلتمن با اشارههای طعنهآمیز به این چتبات در پلتفرم X، شایعاتی را مبنی بر اینکه شرکت او پشت این چتبات قرار دارد، تقویت کرد. سرانجام در روز دوشنبه، یکی از کارمندان OpenAI در پلتفرم X تأیید کرد که چتبات مرموز همان GPT-4o است.
شرکت OpenAI در حال کار بر روی طیف گستردهای از محصولات، از جمله فناوریهای صوتی و نرمافزارهای ویدیویی است. همچنین طبق گزارشهای قبلی Bloomberg، OpenAI در حال توسعهی قابلیت جستجو برای GPT است. در روز جمعه، این شرکت با اعلام اینکه راهاندازی قریبالوقوع GPT-5، نسخهی بسیار مورد انتظار مدل خود که برخی در دنیای فناوری انتظار دارند از قابلیتهای بسیار بالاتری نسبت به سیستمهای هوش مصنوعی فعلی برخوردار باشد، به برخی از شایعات پایان داد. OpenAI همچنین اعلام کرد که رویداد دوشنبه قرار نیست محصول جدید جستجو، ابزاری که میتواند با گوگل رقابت کند، را رونمایی کند.
با انتشار این خبر، سهام گوگل کمی افزایش یافت. اما پس از پایان رویداد، آلتمن به سرعت باعث شد گمانهزنیها همچنان ادامه یابد. او در X نوشت: «به زودی موارد بیشتری برای به اشتراک گذاشتن خواهیم داشت.»
این جملهی کوتاه نشان میدهد که OpenAI در حال کار بر روی پروژههای هیجانانگیز دیگری است و احتمالا به زودی شاهد معرفی محصولات جدید و قابلیتهای نوآورانهی بیشتری از این شرکت خواهیم بود.
انتشار GPT-4o نشاندهندهی پیشرفت قابل توجهی در حوزهی هوش مصنوعی است. این مدل جدید با سرعت و کارایی بالاتر، قابلیتهای چندرسانهای و تجربهی کاربری طبیعیتر، نویدبخش تعاملات انسان و ماشین در سطحی جدید است.
دسترسی گستردهتر به برخی از قابلیتهای این مدل و عرضهی رایگان فروشگاه GPT، میتواند زمینهی فعالیت توسعهدهندگان و کاربران را بیش از پیش گسترش دهد. با وجود برخی چالشهای اولیه، OpenAI در حال رفع موانع و بهبود عملکرد این مدل است.
میتوان انتظار داشت که GPT-4o زمینهساز نوآوریهای بیشتری در حوزهی هوش مصنوعی شود.