Amazon, insan konuşmasına yakın AI ses modeli Nova Sonic’i geliştirdi

Amazon, insan konuşmasına yüksek kalitede misal konuşma yetenekleri gösteren, sesi doğal olarak işleyip yazıya dökebilen yeni üretken yapay zeka modeli olan Nova Sonic’i geliştirdi. Amazon, Sonic’in performansının sürat, konuşma tanıma ve konuşma kalitesini ölçen kıyaslamalarda OpenAI ve Google’ın öncü ses modelleriyle rekabet ettiğini belirtiyor. Nova Sonic, ortalama karşılık müddeti 1,09 saniye ile Amazon’un evvelki sesli yapay zeka modellerine nazaran çok daha süratli cevap verebiliyor.

Ekonomi

Yayınlama: 09.04.2025

A⁺

A^-

HANDE BERKTAN

Amazon, doğal konuşmaları anlayıp süratle yazıya dökebilen ve insan konuşmasına yüksek kalitede emsal konuşma yetenekleri gösteren ve OpenAI’nin GPT 4.0 modelinden yaklaşık yüzde 80 daha ucuz olduğunu belirttiği yeni yapay zekâ ses modeli Nova Sonic’i tanıttı.

Teknoloji devi, Nova Sonic’in performansının sürat, konuşma tanıma ve konuşma kalitesini ölçen kıyaslamalarda OpenAI ve Google’ın öncü ses modelleriyle rekabet ettiğini belirtiyor. Nova Sonic, ortalama cevap müddeti 1,09 saniye ile Amazon’un evvelki sesli yapay zekalarına nazaran çok daha süratli karşılık verebiliyor.

Nova Sonic , farklı aksanlardaki konuşmaları tanıma ve kalabalık ortamlarda birden fazla konuşmacıyı ayırt etme testlerini muvaffakiyetle tamamladı. Şirket, bu modelin kullanıcı komutu olmadan internetten bilgi arayabildiğini, bilgi tabanlarını tarayabildiğini ve gerekli durumlarda harici uygulamaları kendi başına açabildiğini söz etti.

“Amazon’un yeni yapay zeka ses modeli, insan konuşmasına yüksek kalitede benzeri konuşma yetenekleri gösteriyor”

Amazon Yapay Genel Zeka Kıdemli Lider Yardımcısı Rohit Prasad, Amazon’un ses takviyeli teknoloji aracılığıyla müşteri tecrübelerini uygunlaştırma thhüdünü vurguladı. Prasad “Nova Sonic, birden fazla fonksiyonu tek bir modelde birleştirerek, daha hakikat, doğal ve ilgi cazip müşteri etkileşimleri sağlıyor. Nova Sonic kapsamlı testlerden geçmiş ve yüksek kaliteli, beşere emsal konuşma yetenekleri göstermiştir. Doğal diyalog sürece ve konuşma tanıma doğruluğunda güçlü performans sergilemiştir.” açıklamasını yaptı.

Nova Sonic, öteki AI ses modellerine kıyasla konuşma tanıma yanlışlarına daha az eğilimli, bu da modelin, mırıldansalar, yanlış konuşsalar ya da gürültülü bir ortamda olsalar bile bir kullanıcının niyetini anlamada nispeten âlâ olduğu manasına gelir. Amazon, Multilingual LibriSpeech isimli lisanlar ve lehçeler ortasında konuşma tanımayı ölçen bir kıyaslamada Nova Sonic’in İngilizce, Fransızca, İtalyanca, Almanca ve İspanyolcada ortalama alındığında sadece yüzde 4,2’lik bir söz kusur oranına (WER) ulaştığını söylüyor. Bu, modeldeki her 100 sözden yaklaşık dördünün bu lisanlardaki insan transkripsiyonundan farklı olduğu manasına geliyor.

Amazon, sesin ötesine geçerek manzara ve fizikî dünyadan alınan dataları işleyebilen daha gelişmiş yapay zeka modelleri üzerinde çalışmalar yürüttüğünü de açıkladı.

Amazon, Konuşma, Modeli, Ses, Tanıma

Benzer Konular

Dünya Kupası çalışanları grev tehdidinde bulundu

Los Angeles yakınlarındaki SoFi Stadyumu'nda çalışanlar, ABD futbol takımının Dünya Kupası'ndaki ilk maçına ev sahipliği yapmasından bir hafta önce, ücret talebiyle greve gitme kararı aldı.

06.06.2026

Trump: İran’dan çok kısa sürede ayrılacağız

ABD Başkanı Donald Trump, İran'la anlaşma sürecinde sona yaklaştıkları mesajını vererek "İran'dan çok kısa sürede ayrılacağız, ister bir anlaşma yoluyla isterse çok sert bir yöntemle olsun, her halükarda bu gerçekleşecek" dedi.

06.06.2026

İstanbul’da ormanlık alanlara girişler 15 Ekim’e kadar yasaklandı

İstanbul Valiliği, kent genelinde ormanlık alanlara girişlerin, mangal, tüp kullanımı ve nargile gibi sebeplerle ateş yakmanın 8 Haziran-15 Ekim tarihlerinde yasaklandığını duyurdu.

06.06.2026