OpenAI, GPT-4o ‘omni’ modelini piyasaya sürüyor

OpenAI, ChatGPT’yi güçlendiren yeni üretken yapay zeka lisan modeli GPT-4o ‘omni’ modelini piyasaya sürüyor. GPT-4o kullanıcıların ChatGPT ile daha çok bir asistan gibisi etkileşime girmesine imkan tanıyor. 50 lisanda simultane çeviri yapabilecek,…

OpenAI, GPT-4o ‘omni’ modelini piyasaya sürüyor
Yayınlama: 14.05.2024
3
A+
A-

HANDE BERKTAN

OpenAI, bugün bahar güncellemesi etkinliğinde ChatGPT’yi güçlendiren yeni üretken yapay zeka lisan modeli, GPT-4o’yu tanıttı.

“o”, modelin metin, konuşma ve görüntüyü sürece marifetine atıfta bulunan “omni” manasına geliyor. GPT-4o, önümüzdeki birkaç hafta içinde şirketin geliştirici ve tüketiciye yönelik eserlerinde kullanıma sunulacak.

50 lisanda simultane çeviri yapabilecek, telefon kamerasıyla çevreyi görüp algılayabilecek, kullanıcılara bir matematik sorununun tahlil sürecine özel öğretmen benzeri eşlik edebilecek olan GPT-4o, önümüzdeki birkaç hafta içinde kullanıma sunulacak.

OpenAI Baş Teknoloji Sorumlusu Mira Murati, ChatGPT’nin artık bellek yeteneklerine de sahip olacağını, yani kullanıcılarla yapılan evvelki görüşmelerden öğrenebileceğini ve gerçek vakitli çeviri yapabileceğini söyledi. Mira Murati, GPT-4o’nun “GPT-4 düzeyinde” zeka sağladığını lakin GPT-4’ün çeşitli sistem ve ortamlardaki yeteneklerini geliştirdiğini söyledi.

OpenAI’nin evvelki “öncü” en gelişmiş “modeli olan GPT-4 Turbo, görsel ve metin kombinasyonuyla eğitilmişti ve görsellerden metin çıkarmak ve hatta bu görsellerin içeriğini tanımlamak gibisi misyonları gerçekleştirmek için görselleri ve metni tahlil edebiliyordu. Lakin GPT-4o karışıma konuşmayı da ekliyor.

GPT-4o’un özellikleri neler?

GPT-4o, ChatGPT’nin metin, ses ve kelamda manzara kullanarak etkileşim kurmasını sağlayacak. Bu, kullanıcılar tarafından yüklenen ekran imgelerini, fotoğrafları, dokümanları ya da grafikleri görüntüleyebileceği ve bunlar hakkında bir şeyler söyleyebileceği manasına geliyor. GPT-4o, metin, ses ve görüntü alanlarında daha süratli bir biçimde çalışıyor.

Model, kullanıcılarla gerçek vakitli olarak konuşurken, yetenekleriyle ChatGPT’nin ses modundan ayrışıyor. Bu yetenekler kapsamında model, ses tonlamaları ortasındaki farkı ayırt edebiliyor. Birebir halde farklı çeşitlerde sesler üretebiliyor. Modelin sesine tabirler ekleyerek ses tonunu değiştirebildiğini de belirtelim.

Etkinlikte, ChatGPT’nin telefon kamerasıyla çevreyi görebildiği ve algılayabildiği de gösterildi. Verilen bir yazılım kodunu algılayarak, kod hakkında bilgi verebilen ve kod hakkında sorulan sorulara yanıt vererek karşılıklı olarak sohbet edilebilen sistem, sesli bağlantıda ortaya girilebildiği için nitekim bir beşerle konuşuyormuş hissiyatı oluşturuyor.

GPT-4o, özel öğretmen benzeri matematik problemlerini konuşarak çözebiliyor

GPT-4o, kullanıcılara matematik sorunları çözmede de akıcı bir formda konuşarak dayanak oluyor. Gerçek vakitli olarak görüntüleri görebilen model, bir matematik sorununun tahlil sürecine eş vakitli olarak adım adım bir özel öğretmen benzeri eşlik etti.

GPT-4o kullanıcıların ChatGPT ile daha çok bir asistan gibisi etkileşime girmesine imkan tanıyor.

GPT-4o 50 lisanda simultane çeviri yapabilecek

GPT-4o, çeviri yetenekleriyle de öne çıktı. Model aktiflikte İtalyanca ve İngilizce ortasında simultane çeviri yaptı. Bu ortada model, 50 lisanı desteklemekte.
Daha akıllı ve 2 kat daha süratli olduğu belirtilen model, sürpriz formda kullanıcılara bedelsiz açılacak yalnızca bedelsiz kısımda limitler olacak.

Bir Yorum Yazın

Ziyaretçi Yorumları - 0 Yorum

Henüz yorum yapılmamış.