İlk zamanlar sadece hesap makinesi olarak insanların işlerini kolaylaştırmak amacıyla kullanılan bilgisayarlar, son yıllarda yüksek hızlı işlem kapasitesi ile evrendeki sırları çözmeye yardımcı olmak gibi amaçlarla da kullanılıyorlar. Bizim de cebimize giren minik bilgisayarlarımız, yani telefonlarımız, ihtiyaçlarımız doğrultusunda işlevsellikleri ile günlük işlerimizi kolaylaştırmamıza yardımcı oluyorlar. Bu bilgisayar, telefon gibi işlevsel olan teknolojik aletler, genellikle insani fonksiyonlar göz önünde bulundurularak geliştiriliyorlar. Sesimizi iletip, görüntümüzü gönderiyorlar derken şimdi de yapay zeka sayesinde bizi anlayıp cevap vermeye de başladılar.
Düşünsenize, teknolojik aletler insan olsalardı, acaba hangi parçaları kulak işlevi görürdü?
Devam etmeden önce birkaç saniye düşünelim mi?
.
.
.
.
Ses dinleme işlemini bu teknolojik aletlerde mikrofonlar gerçekleştiriyor. WhatsApp, Zoom, Telegram ve bunlar gibi farklı iletişim uygulamaları, mikrofon aracılığıyla sesi karşı tarafa iletiyor.
Aklımıza şu soru gelebilir: Teknolojik aletler bizi anlıyorlar mı?
Tam olarak bizi anlayabildiklerini söyleyemesek de kesinlikle cevap verebildiklerini söyleyebiliriz. Bizim konuşmalarımızı dinleyip, isteklerimize göre sonuçlar gösteren veya cevap veren sistemlere sesli komut sistemleri deniyor. Bu sistemler birçok uygulamaya entegre edilip, farklı alanlarda kullanılabiliyorlar. Örneğin; akıllı ev sistemleri, güvenli araba kullanımını sağlamak için geliştirilen medya kontrol sistemleri, bunun yanında belki de en çok kullanılan sistemler olan Alexa, Siri, Google Asistan gibi yardımcı uygulamalar.
Peki, bu sistemler bizim isteklerimizi nasıl anlayıp gerçekleştiriyorlar?
İşte bu yazımızda en basit haliyle sesli komut sistemlerinin çalışma tekniğinden bahsedeceğiz.
Bilgisayar veya telefon gibi sistemleri bir insana benzetirsek, soruları şu şekilde cevaplayabiliyorlar:
- Kulak işlevi gören mikrofondan istenilen komut dinlenir.
- Duyulan konuşma doğal dil işleme dediğimiz bir Yapay Zeka aracı sayesinde kelimeler, sesler ve fikirlere dönüştürülür.
- Önemli kelimeler saptanarak istenilen komutun ne olduğu anlaşılmaya çalışılır. Örneğin; dünya kupası veya mercimek köftesi kelimeleri gibi.
OK Google, mercimek köftesi tarifi ver!
OK Google, 2018 Dünya Kupası şampiyonu kimdir?
OK Google kısmı sistemin aktive edilmesini sağlıyor. Daha sonra konuşma tanıma ve doğal işler dil işleme sistemleri yardımıyla bilgisayarlar komutları analiz ediyor, anlıyor ve cevap veriyorlar. Tabii ki her dil için bu sistem farklı yapılandırılıyor ve dilin özelliklerine göre ince ayarlar yapılıyor. En basit haliyle anlattığımız karmaşık asistan bize cevabı saniyeler içerisinde verebiliyor.
Sizce de sistemin bu işleyişi harika değil mi? Yoksa bu kadar hayatımıza ortak olmaları korkunç mu? Ne dersiniz?
Yorumlar