LANGANA İngilizceden Türkçeye Otomatik Tercüme Motoru
Çalışmamın Gösterdikleri
2017’de LANGANA çalışmasını durduralı iki yıl oluyor. Bunun nedeni Google’ın yeni tercüme motorunu
çıkarması ve daha önceki haline göre oldukça başarılı olmasıydı. Beklenti bu başarının devam etmesi ve %85
gibi olan başarı oranının daha da yükselmesiydi.
Malesef, Google çıkarmış olduğu son İngilizceden Türkçeye
tercüme motorundan bu yana bir ilerleme kaydedemedi. İşin kötüsü bilimsel ortamlarda var olan
sinirsel ağ tabanlı uygulamaların sadece tek tek cümlelerde başarılı olduğu vb
eleştiriler geldi.
İşin aslı yalnızca sinirsel ağları esas alarak yüksek ölçüde
başarılı tercüme motoru yapmak bir hayaldir. Çünkü sinirsel ağlar algısal alanlarda, görme vb
başarılıdır, oysa tercüme anlamsal alanlara ait, parse işlemine ve önceden
öğrenilmiş kurallara göre yapılan bir işlemdir.
İnsan küçüklüğünden itibaren konuşmayı öğrenmesi sırasında belirli
kurallar dizisini bilinçaltına yerleştirir.
Bu kurallar dizisi yalnızca tek bir seviyede değil bir çok seviyede
çalışır.
LANGANA tek cümleler ve artı iki alt cümleler için şu anda
çalışmaktadır. LANGANA tıpkı bir çocuğun
dil öğrenmesi gibi isimlerle başlayıp birleşik cümlelere kadar cümleleri
parçalarına ayırmayı sonra tercüme kurallarına göre bunları yeniden düzenleyip,
Türkçe kelimeleri ve eklerini ekleyip İngilizceden Türkçeye tercüme
yapmaktadır.
Burada en kritik unsur:
LANGANA bütün bu işlemleri 30-40 bin satır JAVA kodu ile
yapmaktadır. Var olan İngilizce ve
Türkçe’de karşılaşılabilecek bütün karışık yapıları etkilerseniz bu kod satır
sayısı 100-200 bin haydı 1 milyon satır olsun.
Günümüzde var olan donanım ve yazılım araçları için bu önemli bir rakkam
değildir.
Ali R+ SARAL
Son not: LANGANA eğer tamamlansaydı hiç sinirsel ağ kullanılmayacak
mıydı? Belki evet, kelimelerin birden çok anlam taşıdığı durumlarda sözlükten
doğru tercüme kelimeyi seçmek için kullanılabilirdi.