Kayıp Diller Yapay Zekâyla Çözümleniyor
Unutulmuş, kayıp dilleri deşifre etmek, arkeologları ve dilbilimcileri eskiden beri uğraştıran, bazen de büyük oranda sonuçsuz kalan bir iş. Yapay zekâ, burada da yardımımıza koşuyor. MIT (Massachusetts Teknoloji Enstitüsü) ve Google ortak çalışması yeni bir algoritma, unutulmuş dillerin yeniden okunabilmesi için umut verici gelişmeler kaydediyor.
Günümüzde, Dünya’da konuşulan 6.000 civarında dil olduğu düşünülüyor, fakat bazı tahminlere göre, insanlık tarihi boyunca kullanılmış dillerin toplam sayısı 30.000’in üzerinde! Bunların arasından geriye kanıt bırakmış, yani yüzlerce, binlerce yıl boyunca bozulmadan kalmış yazıtlara kazınmış olanların sayısı oldukça az.
Antik Mısır hiyerogliflerini deşifre etmemizi sağlayan meşhur Rosetta Taşı’nda, aynı metin üç farklı dilde yazılı. Bu sayede, farklı dillerde geçen aynı kelimeleri çözerek, bir süre sonra üç dil de deşifre edilebildi (Mısır hiyeroglifleri, yine Mısır’da günlük yaşamda kullanılan demotik ve Antik Yunanca). Bu şekilde karşılaştırmalı bir çalışma yapmamın mümkün olmadığı durumlardaysa, araştırmacıların işi çok zor.
MIT ve Google’ın geliştirdiği yapay zekâ algoritması, bilinmeyen bir dildeki sembolleri, aynı kökene sahip akraba dillerin alfabesiyle tek tek karşılaştırarak tercüme etmeyi deniyor. İnsan gücü ile başarılması imkânsız bu işlem, günümüz bilgisayar teknolojisiyle artık mümkün görünüyor.
Yapay zekâ, deşifre edilecek olan harfler veya karakterlerin dört farklı özelliğine odaklanıyor: dağılımsal benzerlik, tekdüze karakter eşlemesi, yapısal seyreklik ve önemli akrabalık örtüşmesi.
1953 yılında Michael Ventris’in çözdüğü Linear B (Mikenler’in kullandığı, bilinen en eski Yunan dili), bu özellikleri Linear B’nin akraba dilleriyle karşılaştırarak tarayan yapay zekâ tarafından, % 67 oranında yeniden deşifre edildi.
Belki de sırada, şimdiye kadar kimsenin tercüme etmeyi başaramadığı, milattan önce ikinci bin yılda Girit Adası’nda yaşamış Minos uygarlığının kullandığı Linear A olabilir. Veya yıllardır tüm dilbilimcileri uğraştıran İndus Vadisi Uygarlığı’nın sembolleri. Yine de, başka herhangi bir dille akrabalığı olmayan bir kayıp dilin nasıl tercüme edileceği, henüz belli değil.
Rosetta Taşı, 19. yüzyılın ilk yarısında, azimli ve biraz da takıntılı bazı bilim insanları tarafından, yıllar süren çabalar sonucu deşifre edildi ve hem arkeoloji dünyasında hem de dilbilim alanında büyük yankı uyandırdı. İnsanların yıllar süren çabalarla elde ettiği başarıların, çok daha kısa bir süre içinde bilgisayarlar tarafından elde edilme ihtimaliyse, bilim dünyası için oldukça umut verici.
REFERENCES
- 1. https://bigthink.com/technology-innovation/a-i-is-translating-messages-of-long-lost-languages
- 2. http://blogs.discovermagazine.com/d-brief/2019/07/18/ai-is-coming-closer-to-deciphering-lost-languages/#.XVpDn5MzbEY