أوبن إيه آي تُطلق GPT-4o مع دعم للنصوص والصور والصوت
بدأت شركة OpenAI مرحلة جديدة من التطوير والابتكار في عالم الذكاء الاصطناعي، حيث أعلنت عن إطلاق نموذج GPT-4o الذي يُعد بمثابة تطور لنموذج GPT-4 الذي يُشغّل منتجها الرئيسي ChatGPT.
وفي إعلان مباشر عبر الإنترنت يوم أمس الاثنين، أوضحت ميرا موراتي المدير التنفيذي للتقنية في OpenAI، أن التحديث الجديد «أسرع بكثير» ويحسن «القدرات عبر النصوص والرؤية والصوت».
وأشارت موراتي إلى أنه سيكون مجانيًا لجميع المستخدمين، مع توفير حدود طاقة «تصل إلى خمس مرات» للمشتركين في شات جي بي تي بلس مقارنة لذوي الحسابات المجانية.
ووفقًا لما جاء في منشور للشركة، فإن قدرات GPT-4o «سيتم تطبيقها بشكل تدريجي»، مع بدء إطلاق قدرات النصوص والصور في ChatGPT ابتداءً من الأمس.
من جانبه، أكد الرئيس التنفيذي للشركة سام ألتمان أن النموذج «متعدد الأوجه بشكل أصلي»، مما يعني أن النموذج يمكنه إنشاء محتوى أو فهم الأوامر بالصوت أو النص أو الصورة.
وأضاف ألتمان أن المطورين الذين يرغبون في التعديل على GPT-4o سيكون لديهم وصول إلى واجهة برمجة التطبيقات API، والتي تكون بنصف السعر وضِعف السرعة مقارنة بنموذج GPT-4 Turbo.
مقطع فيديو يوضّح كيف يتفاعل GPT-4o الجديد صوتيًاpic.twitter.com/IemFiQUOMc
— عالم التقنية (@techwd) May 13, 2024
ومن المتوقع أن تتوفر ميزات جديدة في وضع الصوت في ChatGPT كجزء من النموذج الجديد، حيث سيكون النموذج قادرًا على العمل كمساعد صوتي يشبه فيلم Her، متجاوبًا في الوقت الفعلي ومراقبًا العالم من حولك.
وفي تدوينة على المدونة الرسمية للشركة، قدم سام ألتمان تقييمًا لمسار OpenAI، مؤكدًا تحول الرؤية الأصلية للشركة إلى توفير النماذج المتقدمة للمطورين من خلال واجهات برمجة التطبيقات المدفوعة.
وقبل إطلاق GPT-4o، كانت هناك تقارير متضاربة حول إعلان OpenAI لمحرك بحث ذكاء اصطناعي لمنافسة جوجل، أو مساعد صوتي مُدمج في GPT-4، أو نموذج جديد كليًا باسم GPT-5.
ويأتي إعلان OpenAI عن المميزات الجديدة قبيل مؤتمر Google I/O، حيث من المتوقع أن نرى إطلاق منتجات ذكاء اصطناعي متنوعة من فريق Gemini.