İleriye dönük: Siri, Alexa ve Google Asistan’ın gerçekten yardımcı olacağını düşündüğümüz zamanı hatırlıyor musunuz? Evet ben de. Yıllardan günümüze hızlı bir şekilde ilerleyin ve dijital asistanların ne kadar ilerlediğini gösteren çok daha etkileyici demolar görmeye başlıyoruz. Olasılıklar hem ilgi çekici hem de merak uyandırıcı görünüyor.
Pazartesi günü OpenAI, yeni GPT-4o modelini ve ona eşlik eden ChatGPT güncellemesini tamamladı; bu güncelleme, yalnızca ChatGPT ile konuşmayı değil, aynı zamanda bunu ürkütücü derecede gerçekçi şekillerde yapmayı da mümkün kılıyor. Yeni model, biraz daha doğal bir konuşma akışı için konuşmayı kesmenize olanak tanıyor ve diğer dijital asistanlardan duyduğumuzdan daha fazla kişilik ve duyguyla yanıt veriyor.
İOS ve Android için güncellenen ChatGPT uygulamalarıyla, akıllı telefon kamerası aracılığıyla daha fazla şeyi görebilir ve anlayabilir. Örneğin OpenAI, kamerayı kullanarak öğrencilere basit matematik problemlerinde rehberlik edebilecek bir ev ödevi yardımcı uygulaması gösterdi.
Daha sonra Salı günü Google, I/O geliştirici etkinliğinde Gemini modeline yönelik, Android’in kendi içindeki benzer bir ev ödevi yardımcısı işlevi de dahil olmak üzere çok çeşitli güncellemeleri açıkladı. Google ayrıca Arama için Gemini destekli yapay zeka özetlerini, Gemini’nin Google Workspace’teki daha gelişmiş uygulamalarını ve OpenAI’nin yakın zamanda tanıtılan Sora modeline benzeyen Veo adlı yeni bir metinden videoya algoritmasını da tanıttı.
Her iki şirketin demoları, diğer birçok şirketin açıkça paralel olarak geliştirdiği benzer teknolojilerden yararlandı. Daha da önemlisi, akıllı dijital kişisel asistanlar yaratmak için gereken bazı temel yeteneklerin neredeyse ulaşılabilir olduğunun altını çizdiler.
// İlgili Öyküler
- Google Arama yakında AI tarafından oluşturulan özetleri her yere dahil edecek, ancak bu plandaki kusurlar hemen ortaya çıkıyor
- OpenAI daha hızlı ve ücretsiz GPT-4o modelini piyasaya sürüyor; yeni sesli asistan o kadar doğal konuşuyor ki, bunun sahte olduğunu düşüneceksiniz
Bunlardan ilki, ses, görüntü, görüntü ve daha karmaşık metin girdilerini alabilen ve ardından bunlar arasında bağlantı kurabilen çok modlu modellere yönelik giderek daha geniş bir destek sağlanmasıdır. Bu bağlantılar demoların büyülü görünmesini sağladı çünkü biz insanlar olarak çevremizdeki dünyayı nasıl algıladığımızı taklit ediyorlardı. Basitçe söylemek gerekirse, sonunda akıllı cihazlarımızın aslında nasıl “akıllı” olabileceğini gösterdiler.
Görünür bir başka gelişme de bizim adımıza eylemler yoluyla bağlamı, ortamı ve mantığı anlayan temsilcilerin giderek daha karmaşık hale gelmesidir. Özellikle Google’ın Project Astra gösterisi, bağlamsal zekanın muhakeme, kişisel/yerel bilgi ve hafızayla birleştiğinde, yapay zeka asistanının “gerçek” hissetmesini sağlayan bir etkileşimi nasıl yaratabileceğini gösterdi.
Şu anda yapay zeka destekli bir aracının ne olduğu ve neler yapabileceğine ilişkin tanımlar sektör genelinde tutarlı değil, bu da onların ilerlemelerini genelleştirmeyi zorlaştırıyor. Bununla birlikte, OpenAI ve Google’ın gösterdiği şeyin zamanlaması ve kavramsal benzerliği, işlevsel dijital asistanlara sahip olmaya çoğu insanın düşündüğünden çok daha yakın olduğumuzu açıkça ortaya koyuyor. Demolar mükemmel olmasa da gösterdikleri yetenekler ve ima ettikleri olasılıklar, cihazlarımızda yalnızca birkaç yıl önce bilim kurgu dünyasında olan yeteneklere sahip olmaya umut verici derecede yaklaştığımızı gösteriyor.
Potansiyel uygulamalar ne kadar büyük olursa olsun, insanları bu tür GenAI destekli yeteneklerin düzenli olarak kullanılmaya değer olduğuna ikna etme sorunu devam ediyor. ChatGPT ile ilgili ilk heyecanın geçen yılın sonuna doğru yavaşlamaya başlamasının ardından, teknolojinin bazı kişilerin beklediğinden daha mütevazı bir şekilde benimsenmesi gerçekleşti. Geriye bu tür dijital asistan uygulamalarının çok sayıda insanı GenAI destekli özellikleri kullanmaya istekli hale getiren tetikleyici olup olmayacağı henüz bilinmiyor. Aynı derecede önemli olan, bazılarının üretken yapay zekanın yapabileceğini öngördüğü şekilde insanların hayatlarını değiştirmeye başlayıp başlayamayacakları.
Beğenin ya da beğenmeyin, etkili bir dijital asistana sahip olmanın tek yolu dosyalarınıza, iletişimlerinize, çalışma alışkanlıklarınıza, kişilerinize (ve çok daha fazlasına) sınırsız erişim sağlamasıdır…
Elbette sorunun bir kısmı da, deneyimleri ve bilgileri kendilerine özgü bir şekilde kişiselleştirmek için tasarlanan diğer teknolojilerde olduğu gibi, insanların bu ürünlere ve bu şirketlerin hayatlarına her zamankinden daha derin erişime sahip olmasına izin vermeye istekli olmaları gerektiğidir. eğer onlardan tam olarak yararlanmak istiyorlarsa. Beğenin ya da beğenmeyin, etkili bir dijital asistana sahip olmanın tek yolu, dosyalarınıza, iletişimlerinize, çalışma alışkanlıklarınıza, kişilerinize ve çok daha fazlasına sınırsız erişim sağlamasıdır. Teknoloji şirketlerinin ve ürünlerinin etkisine ilişkin endişelerin arttığı bir dönemde bu, zorlu bir satış olabilir.
ABD’de pek çok şey Microsoft ve Apple’ın önümüzdeki haftalarda geliştirici konferanslarında hangi yetenekleri açıklayacağına bağlı olacak. iPhone’un ABD akıllı telefon pazarındaki hakim payı göz önüne alındığında, Apple’ın etkinleştirmeyi seçtiği GenAI destekli yetenekler, insanların kabul edilebilir ve önemli buldukları şeyleri önemli ölçüde etkileyecektir (ister kendi geliştirmesi yoluyla ister OpenAI veya Google aracılığıyla lisanslanarak, şirketin bunu yaptığı söyleniyor) ).
Buna Siri’nin intikamı diyebilirsiniz, ancak Apple’ın iOS’un bir sonraki sürümü için duyurduğu herhangi bir dijital asistan veya aracı teknolojisi, yakın gelecekte bu teknolojik gelişmeleri kaç kişinin göreceği üzerinde çok büyük bir etkiye sahip olacak.
Sonuç olarak soru, insanların dijital cihazlarına ve bunların etkinleştirdiği uygulama ve hizmetlere daha fazla bağlanma konusunda ne kadar istekli olduklarıyla da ilgili. Onlarla zaten harcadığımız muazzam ve giderek artan zaman göz önüne alındığında, bu kaçınılmaz bir sonuç olabilir. Ancak insanların bu dijital asistan özelliklerinden bazılarının çok ileri gittiğini algılayıp algılamayacakları sorusu hala mevcut. Kesin olan bir şey var: Bu trendi izlemek ilginç olacak.
Bob O’Donnell, teknoloji endüstrisine ve profesyonel finans topluluğuna stratejik danışmanlık ve pazar araştırması hizmetleri sağlayan bir teknoloji danışmanlık firması olan TECHnaliz Araştırma, LLC’nin kurucusu ve baş analistidir. Onu Twitter’da takip edebilirsiniz @bobodtech
Künye kredisi: Solen Feyissa