Ne var ne yok: Google, Gemini AI modelini birçok hizmetine getiriyor. Google Fotoğraflar, “Fotoğraf Sor” adlı bir destek alıyor. Bu özellik, kullanıcıların fotoğraf kitaplıklarında karmaşık ve bağlama duyarlı aramalar yapmak için doğal dil sorgularını kullanmalarına olanak tanır.
Bugün Google I/O’daki gösterinin yıldızı şüphesiz yapay zekaydı. Şirket, Google Fotoğraflar için “Fotoğraf Sor” adı verilen bir özellik de dahil olmak üzere bir dizi yapay zeka özelliğini duyurdu. Fotoğraf Sor, kullanıcıların basit doğal dil girişi kullanarak fotoğrafları arasında arama yapmasına ve onlar hakkında sorular sormasına olanak tanır.
Gemini destekli özellik, köpeğinizin fotoğraflarını istemenin çok ötesine geçiyor. Fotoğraflara Sor bağlamı anlar ve daha karmaşık soruları yanıtlar. Örneğin, çocuğunuzun su arıtırken çekilmiş bir fotoğrafını isteyin; size bunun bir veya daha fazla görüntüsünü verebilir. Ancak çocuğunuzun yüzmeyi öğrendiğini göstermesini istemek, suyun işlenmesini öğrenmekten yüzme sertifikası almaya kadar tüm süreci geri döndürecektir. İkizler yüzmeyi öğrenmenin içeriğini anlar ve bununla ilgili fotoğraflar çeker.
@GooglePhotos’a gelen yeni bir özellik olan Fotoğraflar’a Sor, Gemini modellerinin yardımıyla fotoğraflarınız ve videolarınız arasında arama yapmayı kolaylaştırıyor. Bağlamı anlamak ve daha karmaşık soruları yanıtlamak için basit aramanın ötesine geçer. #GoogleIO pic.twitter.com/OsYXZLo5S1
– Google (@Google) 14 Mayıs 2024
Gösterilen bir başka örnek de farklı tatil yerlerinin fotoğraflarını bulmaktı. Kullanıcılar yapay zekadan belirli bir şehirdeki tüm önemli noktaları aramasını isteyebilir veya Washington DC’ye yapılacak bir gezide Washington Anıtı, Lincoln Anıtı ve Beyaz Saray’ın fotoğraflarını bulabilir ve uygun sonuçları elde edebilir. Plaka numaranızı içeren resimleri bile bulabilir (fotoğrafınız olması koşuluyla). Google CEO’su Sundar Pichai yapay zekaya “Plaka numaram nedir?” diye sordu. Fotoğraflar uygulaması plaka numarasını başarıyla döndürdü. Bunu konum verilerine ve plaka numarası örneklerini ne sıklıkta bulduğu gibi diğer faktörlere dayanarak yaptı.
// İlgili Öyküler
- Şaşırtıcı bir şekilde, Google Pixel 8a yedi yıllık güncellemeyle 499 dolardan başlıyor
- Bulut bilişim geliştikçe Amazon’un AWS’si üretken yapay zekadaki rolünü arıyor
Bazı insanlar muhtemelen bu özelliği biraz ürkütücü bulsa da bu, Google’ın Gemini AI modelinin ne kadar gelişmiş olduğunu vurguluyor. Bu, birçok kişinin Google Fotoğraflar’da sakladığı yüzlerce (veya binlerce) görselde bir şeyler bulmasına yardımcı olabilir. Yapay zeka modelleri metin, ses ve görüntü işleme gibi “çok modlu” girdilere doğru hızlandıkça doğal dil girdisine odaklanmak da hayati önem taşıyor. OpenAI, bu hafta başında GPT-4o (Omni) modeliyle bunu dudak uçuklatan bir etkiyle gösterdi.
Üretken yapay zeka modellerinin yükselişi göz önüne alındığında, Google’ın yapay zekaya olan vurgusunun devam etmesi şaşırtıcı değil. Arama devi görünüşte her şeye yapay zekayı ekledi. OpenAI’nin yeni Omni modelini tanıtması, AI savaşlarının daha da kızıştığını gösteriyor. Apple, gelecek ay düzenlenecek Dünya Çapında Geliştirici Konferansı’nda üretken yapay zeka çalışmalarını açıklayarak bu mücadeleye katılmayı planlıyor.