Monday, November 25, 2019

LANGANAnın Gösterdikleri


LANGANA İngilizceden Türkçeye Otomatik Tercüme Motoru Çalışmamın Gösterdikleri

2017’de LANGANA çalışmasını durduralı iki yıl oluyor.  Bunun nedeni Google’ın yeni tercüme motorunu çıkarması ve daha önceki haline göre oldukça başarılı olmasıydı.  Beklenti bu başarının devam etmesi ve %85 gibi olan başarı oranının daha da yükselmesiydi.

Malesef, Google çıkarmış olduğu son İngilizceden Türkçeye tercüme motorundan bu yana bir ilerleme kaydedemedi.  İşin kötüsü bilimsel ortamlarda var olan sinirsel ağ tabanlı uygulamaların sadece tek tek cümlelerde başarılı olduğu vb eleştiriler geldi.

İşin aslı yalnızca sinirsel ağları esas alarak yüksek ölçüde başarılı tercüme motoru yapmak bir hayaldir. Çünkü sinirsel ağlar algısal alanlarda, görme vb başarılıdır, oysa tercüme anlamsal alanlara ait, parse işlemine ve önceden öğrenilmiş kurallara göre yapılan bir işlemdir.  İnsan küçüklüğünden itibaren konuşmayı öğrenmesi sırasında belirli kurallar dizisini bilinçaltına yerleştirir.  Bu kurallar dizisi yalnızca tek bir seviyede değil bir çok seviyede çalışır.

LANGANA tek cümleler ve artı iki alt cümleler için şu anda çalışmaktadır.  LANGANA tıpkı bir çocuğun dil öğrenmesi gibi isimlerle başlayıp birleşik cümlelere kadar cümleleri parçalarına ayırmayı sonra tercüme kurallarına göre bunları yeniden düzenleyip, Türkçe kelimeleri ve eklerini ekleyip İngilizceden Türkçeye tercüme yapmaktadır.

Burada en kritik unsur:  LANGANA bütün bu işlemleri 30-40 bin satır JAVA kodu ile yapmaktadır.  Var olan İngilizce ve Türkçe’de karşılaşılabilecek bütün karışık yapıları etkilerseniz bu kod satır sayısı 100-200 bin haydı 1 milyon satır olsun.  Günümüzde var olan donanım ve yazılım araçları için bu önemli bir rakkam değildir.

Şimdi tuvalete yürüyerek gitmek varken Mercedese binmek niye?  Akademik araştırmalarda yeni bir şey yapmak zorunluluğu sinirsel ağları hiç geçerli olmayacakları alanlarda kullanma eğilimini doğuruyor.  Çünkü bu algısal bir şey.

Ali R+ SARAL

Son not: LANGANA eğer tamamlansaydı hiç sinirsel ağ kullanılmayacak mıydı? Belki evet, kelimelerin birden çok anlam taşıdığı durumlarda sözlükten doğru tercüme kelimeyi seçmek için kullanılabilirdi.