خانهاخبار
OpenAI مدل هوش مصنوعی سریع‌تر و ارزان‌تر GPT-4o را معرفی کرد

OpenAI مدل هوش مصنوعی سریع‌تر و ارزان‌تر GPT-4o را معرفی کرد

آپدیت‌ جدید GPT4 هوش از سر شما می‌پراند!

۲۵ اردیبهشت ۱۴۰۳

تبلیغات

home_header

در جریان رویدادی زنده‌ی اینترنتی که روز دوشنبه برگزار شد، شرکت OpenAI از مدل جدید هوش مصنوعی خود به نام GPT-4o رونمایی کرد. 

این مدل، نسخه‌ی به‌روزرسانی‌شده‌ی مدل GPT-4 است که در حال حاضر بیش از یک سال از عرضه‌ی آن می‌گذرد. مدل جدید زبانِ بزرگ (Large Language Model) که با حجم عظیمی از داده‌های اینترنتی آموزش داده شده است، می‌تواند به شکل بهتری و در زمان واقعی، متن، صدا و تصاویر را پردازش کند. 

این به‌روزرسانی‌ها طی چند هفته‌ی آینده در اختیار کاربران قرار خواهد گرفت.

شرکت OpenAI اعلام کرده است که با پرسیدن یک سوال به صورت صوتی، سیستم می‌تواند با پاسخی صوتی در عرض چند میلی‌ثانیه جواب دهد و به این ترتیب، گفتگویی روان‌تر را رقم بزند. 

در نمایشی از قابلیت‌های این مدل، محققان OpenAI و مدیر ارشد فناوری، میرا مراتى، با استفاده از صدای خود با نسخه‌ی جدید ChatGPT گفتگو کردند. 

این نمایش نشان داد که این ابزار می‌تواند به صورت صوتی پاسخ دهد. همچنین در طول ارائه، به نظر می‌رسید که این چت‌بات می‌تواند تقریباً به صورت آنی، گفتار را از یک زبان به زبان دیگر ترجمه کند و حتی با درخواست، بخشی از یک داستان را به صورت آواز بخواند.

خانم مراتى، مدیر ارشد فناوری OpenAI، در مصاحبه‌ای با Bloomberg News گفت: "این اولین باری است که ما گامی بزرگ در زمینه‌ی تعامل و سهولت استفاده برمی‌داریم. ما واقعاً این امکان را برای شما فراهم می‌کنیم که با ابزارهایی مانند ChatGPT همکاری کنید." 

این به‌روزرسانی برای کاربران رایگان چندین ویژگی جدید به همراه خواهد داشت که پیش از این تنها برای کاربران با اشتراک پولی ChatGPT در دسترس بود. این قابلیت‌های جدید شامل مواردی مانند: امکان جست‌وجوی وب برای یافتن پاسخ به سوالات و صحبت کردن با چت‌بات و شنیدن پاسخ با صداهای مختلف دستور دادن به چت‌بات برای ذخیره‌ی اطلاعاتی که بتواند در آینده آن‌ها را به یاد بیاورد است. با این قابلیت‌های جدید، تعامل با مدل‌های هوش مصنوعی مانند ChatGPTبسیار طبیعی‌تر و کاربرپسندانه‌تر خواهد شد.

gpt 4o

انتشار GPT-4o عرصه‌ی هوش مصنوعی را که به سرعت در حال پیشرفت است، تکان خواهد داد. 

در این عرصه، GPT-4 همچنان به عنوان الگوی برتر شناخته می‌شود. با این حال، به تازگی تعداد زیادی از شرکت‌های نوپا و غول‌های فناوری، از جمله Anthropic، Cohere و Google زیرمجموعه‌ی Alphabet Inc. مدل‌های هوش مصنوعی خود را ارائه کرده‌اند که به گفته‌ی آن‌ها، در معیارهای خاصی با عملکرد GPT-4 برابری می‌کنند یا از آن پیشی می‌گیرند.

انتشار مدل GPT-4o توسط OpenAI می‌تواند زمینه‌ی هوش مصنوعی را که به سرعت در حال پیشرفت است، به طور قابل توجهی تحت تاثیر قرار دهد. 

اگرچه GPT-4 همچنان به عنوان الگوی برتر شناخته می‌شود، اما به تازگی شرکت‌های نوپا و غول‌های فناوری بسیاری مانند Anthropic، Cohere و Google زیرمجموعه‌ی Alphabet Inc. مدل‌های هوش مصنوعی خود را ارائه کرده‌اند که ادعا می‌شود در معیارهای خاصی با عملکرد GPT-4 برابری می‌کنند یا حتی از آن پیشی می‌گیرند. 

جالب است که اعلام OpenAI درست یک روز قبل از کنفرانس توسعه‌دهندگان Google I/O صورت می‌گیرد. گوگل، که از پیشگامان حوزه‌ی هوش مصنوعی به شمار می‌رود، انتظار می‌رود از این رویداد برای رونمایی از به‌روزرسانی‌های جدید هوش مصنوعی خود استفاده کند. 

این اقدام احتمالا تلاشی برای حفظ رقابت با شرکت OpenAI است که از حمایت مایکروسافت برخوردار است.

در یک پست وبلاگ نادر که روز دوشنبه منتشر شد، مدیرعامل OpenAI، سام آلتمن، گفت که در حالی که نسخه‌ی اصلی GPT پیش نمایشی از نحوه‌ی تعامل افراد با کامپیوترها از طریق زبان بود، استفاده از GPT-4o احساسی "کاملاً متفاوت" دارد. 

این امر نشان می‌دهد که مدل جدید GPT-4o نه تنها از نظر سرعت و کارایی، بلکه از نظر تجربه‌ی کاربری نیز یک پیشرفت قابل توجه نسبت به مدل‌های قبلی به شمار می‌رود. 

کاربران می‌توانند انتظار تعاملات بسیار طبیعی‌تر و کاربرپسندانه‌تری با هوش مصنوعی را داشته باشند. برخلاف مدل‌های قبلی که برای پردازش ورودی‌های مختلف به چندین مدل هوش مصنوعی مجزا نیاز داشتند، GPT-4o (با "o" به معنای همه جانبه) صدا، متن و تصویر را در یک مدل واحد ترکیب می‌ کند. 

این موضوع باعث می‌شود تا سرعت آن از مدل‌های پیشین بالاتر رود. برای مثال، اگر تصویری را به عنوان ورودی به سیستم بدهید، می‌تواند با یک تصویر دیگر پاسخ دهد. شرکت OpenAI اعلام کرده است که مدل جدید دو برابر سریع‌تر و به طور قابل توجهی کارآمدتر است.

مدیر ارشد فناوری OpenAI، میرا مراتى، درباره‌ی مزایای ترکیب چندین ورودی به یک مدل واحد توضیح داد: "وقتی شما از سه مدل هوش مصنوعی مجزا برای پردازش ورودی‌های مختلف استفاده می‌کنید، تأخیر زیادی در عملکرد به وجود می‌آید و این امر باعث برهم خوردن تجربه‌ی کاربر می‌شود. اما زمانی که یک مدل واحد به صورت ذاتی صدا، متن و تصویر را درک کند، تمام این تأخیرها برطرف شده و تعامل شما با ChatGPT بسیار شبیه به گفتگوی ما در حال حاضر خواهد بود.

"با وجود مزایای قابل توجه، مدل جدید در نمایش خود با چند چالش روبرو شد. صدای محققان در طول نسخه دمو چندین بار قطع شد. همچنین سیستم هوش مصنوعی، مخاطبان را غافلگیر کرد. هنگامی که این سیستم در حال آموزش حل یک مسئله‌ی جبر به یکی از محققان بود، با لحنی به نظر معاشرتی گفت: "وای، چه لباس قشنگی پوشیده‌اید!"

chat gpt

در یک پست وبلاگ نادر که روز دوشنبه منتشر شد، مدیرعامل OpenAI، سام آلتمن، گفت که در حالی که نسخه‌ی اصلی GPT پیش نمایشی از نحوه‌ی تعامل افراد با کامپیوترها از طریق زبان بود، استفاده از GPT-4o  احساسی "کاملاً متفاوت"  دارد. 

این امر نشان می‌دهد که مدل جدید GPT-4o نه تنها از نظر سرعت و کارایی، بلکه از نظر تجربه‌ی کاربری نیز یک پیشرفت قابل توجه نسبت به مدل‌های قبلی به شمار می‌رود. 

کاربران می‌توانند انتظار تعاملات بسیار طبیعی‌تر و کاربرپسندانه‌تری با هوش مصنوعی را داشته باشند. 

آلتمن در ادامه‌ی این پست گفت: "احساس می‌شود هوش مصنوعی از فیلم‌ها وارد دنیای واقعی شده است؛ و هنوز کمی برایم عجیب است که این فناوری واقعی است." او اضافه کرد: "رسیدن به زمان پاسخ‌دهی و قدرت بیان در سطح انسان، یک تغییر بزرگ است."

OpenAI اعلام کرده است که از امروز قابلیت‌های جدید متن و تصویر GPT-4o را برای برخی از کاربران پولی ChatGPT پلاس و تیم (ChatGPT Plus and Team) فعال می‌کند و به زودی این قابلیت‌ها را در اختیار کاربران سازمانی نیز قرار خواهد داد. 

همچنین نسخه‌ی جدید دستیار "حالت صدا" برای کاربران ChatGPT پلاس طی چند هفته‌ی آینده عرضه خواهد شد. به‌عنوان بخشی از به‌روزرسانی‌های خود، OpenAI اعلام کرده است که دسترسی به فروشگاه GPT (GPT Store) را برای عموم آزاد می‌کند. این فروشگاه شامل چت‌بات‌های سفارشی‌سازی‌شده‌ای است که توسط کاربران ساخته شده‌اند. پیش از این، دسترسی به این فروشگاه تنها برای مشتریان پولی امکان‌پذیر بود.

در چند هفته‌ی اخیر، گمانه‌زنی‌ها درباره‌ی عرضه‌ی بعدی OpenAI به سرگرمی محافل فناوری  تبدیل شده بود. یک چت‌بات جدید و مرموز پس از حضور در یک وب‌سایت معیارسنجی و عملکردی در حد و اندازه‌ی GPT-4، هیجان زیادی را در میان ناظران حوزه‌ی هوش مصنوعی ایجاد کرد. 

آلتمن با اشاره‌های طعنه‌آمیز به این چت‌بات در پلتفرم X، شایعاتی را مبنی بر اینکه شرکت او پشت این چت‌بات قرار دارد، تقویت کرد. سرانجام در روز دوشنبه، یکی از کارمندان OpenAI در پلتفرم X تأیید کرد که چت‌بات مرموز همان GPT-4o است.

شرکت OpenAI در حال کار بر روی طیف گسترده‌ای از محصولات، از جمله فناوری‌های صوتی و نرم‌افزارهای ویدیویی است. همچنین طبق گزارش‌های قبلی Bloomberg، OpenAI در حال توسعه‌ی قابلیت جستجو برای GPT است. در روز جمعه، این شرکت با اعلام اینکه راه‌اندازی قریب‌الوقوع GPT-5، نسخه‌ی بسیار مورد انتظار مدل خود که برخی در دنیای فناوری انتظار دارند از قابلیت‌های بسیار بالاتری نسبت به سیستم‌های هوش مصنوعی فعلی برخوردار باشد، به برخی از شایعات پایان داد. OpenAI همچنین اعلام کرد که رویداد دوشنبه قرار نیست محصول جدید جستجو، ابزاری که می‌تواند با گوگل رقابت کند، را رونمایی کند. 

با انتشار این خبر، سهام گوگل کمی افزایش یافت. اما پس از پایان رویداد، آلتمن به سرعت باعث شد گمانه‌زنی‌ها همچنان ادامه یابد. او در X نوشت: «به زودی موارد بیشتری برای به اشتراک گذاشتن خواهیم داشت.»

این جمله‌ی کوتاه نشان می‌دهد که OpenAI در حال کار بر روی پروژه‌های هیجان‌انگیز دیگری است و احتمالا به زودی شاهد معرفی محصولات جدید و قابلیت‌های نوآورانه‌ی بیشتری از این شرکت خواهیم بود. 

انتشار GPT-4o نشان‌دهنده‌ی پیشرفت قابل توجهی در حوزه‌ی هوش مصنوعی است. این مدل جدید با سرعت و کارایی بالاتر، قابلیت‌های چندرسانه‌ای و تجربه‌ی کاربری طبیعی‌تر، نویدبخش تعاملات انسان و ماشین در سطحی جدید است. 

دسترسی گسترده‌تر به برخی از قابلیت‌های این مدل و عرضه‌ی رایگان فروشگاه GPT، می‌تواند زمینه‌ی فعالیت توسعه‌دهندگان و کاربران را بیش از پیش گسترش دهد. با وجود برخی چالش‌های اولیه، OpenAI در حال رفع موانع و بهبود عملکرد این مدل است. 

می‌توان انتظار داشت که GPT-4o زمینه‌ساز نوآوری‌های بیشتری در حوزه‌ی هوش مصنوعی شود.