الذكاء الاصطناعي يفك شيفرة اللغات المندثرة

  • 7/5/2019
  • 00:00
  • 10
  • 0
  • 0
news-picture

قد يأتي دور بعض اللغات التي لم يتم فك شيفرتها لترجمتها باستخدام الترجمة الآلية. في عام 1886، صادف عالم الآثار البريطاني آرثر إيفانز حجرا قديما يحمل مجموعة غريبة من النقوش بلغة غير معروفة. جاء أصل الحجر من جزيرة كريت المطلة على البحر المتوسط​، وسافر إيفانز على الفور إلى هناك للبحث عن المزيد من الأدلة. وسرعان ما وجد العديد من الحجارة والألواح التي تحمل نصوصا مشابهة وتم تأريخها من حوالي عام 1400 قبل الميلاد. هذا النقش تم اعتباره أحد أقدم أشكال الكتابة التي تم اكتشافها على الإطلاق. وقد لاحظ إيفانز بأن شكل النقش الخطي كان مستمدا بوضوح من الصور الخطية المخدوشة بعشوائية تنتمي إلى مهد الفن، وبالتالي أثبت أهميته في تاريخ اللغويات. قرر هو وآخرون في وقت لاحق أن الحجارة والألواح كانت مكتوبة بنصين مختلفين، ويرجع تاريخ أقدمها، التي تسمى “بالشكل الخطي أ”، إلى ما بين 1800 و1400 قبل الميلاد، عندما كانت الجزيرة تحت سيطرة حضارة العصر البرونزي. أما النص الآخر، “الشكل الخطي ب”، فهو أحدث، ولا يظهر إلا بعد عام 1400 قبل الميلاد، عندما تم احتلال الجزيرة بواسطة قبيلة الموكيانيين الذين قدموا من الأراضي اليونانية. حاول إيفانز وآخرون لسنوات عديدة فك رموز النصوص القديمة، لكن اللغات المندثرة قاومت كل المحاولات. وظلت المشكلة دون حل حتى عام 1953، عندما قام عالم لغوي هاوٍ يدعى مايكل فينتريس بتشكيل الشفرة الخاصة بالشكل الخطي ب. هل تنجح الترجمة الآلية في فك شيفرات اللغات المندثرة الأخرى وفق بعض القواعد الرياضية كما كان مع الشكل الخطي بنى فنتريس تحليلاته على أساس اثنين من أهم الاكتشافات، أولا، تخمين فنتريس أن العديد من الكلمات المتكررة في المفردات الخطية ب كانت أسماء لأماكن في جزيرة كريت، والتي أثبتت صحتها في ما بعد. أما اكتشافه الثاني، فقد اعتمد على افتراض أن الكتابة كانت عبارة عن شكل مبكر من اليونانية القديمة. وسمحت له تلك الاستنتاجات فورا بفك شفرة اللغة، وأثبت فنتريس في هذه العملية أن اليونانية القديمة ظهرت لأول مرة في شكل مكتوب قبل عدة قرون مما كان يُعتقد سابقا. وحقق فنتريس إنجازا كبيرا، لكن الشكل الخطي أ ظل إحدى المشكلات الكبيرة في اللغويات حتى يومنا هذا. ليس من الصعب تخيل أن التطورات الحديثة في الترجمة الآلية قد تساعد بعض الشيء، حيث في بضع سنوات فقط أحدثت دراسة اللغويات ثورة في توفر قواعد بيانات ضخمة مشروحة، وتقنيات تمكّن الآلات من التعلم منها. وبالتالي، اتخذت الترجمة الآلية من لغة إلى أخرى شكلا روتينيا، على الرغم من أنها ليست مثالية، لكنها وفرت طريقة جديدة تماما للتفكير في اللغة. وقد قام فريق مكون من إنتر جايمنغ لو، وريجينا بارزيلاي من معهد ماساتشوستس للتكنولوجيا، ويوان تساو من مختبر غوغل للذكاء الاصطناعي في ماونتن فيو، كاليفورنيا، بتطوير نظام للتعلم الآلي قادر على فك شفرة اللغات المندثرة، وقد أثبتوا ذلك من خلال جعله يقوم بفك تشفير المفردات الخطية ب، وهي المرة الأولى التي يتم فيها ذلك بشكل مؤتمت. كان النهج الذي استخدموه مختلفًا تماما عن أساليب الترجمة الآلية القياسية. وتكمن الفكرة الكبيرة وراء الترجمة الآلية في فهم أن الكلمات مرتبطة ببعضها البعض بطرق مماثلة، لذلك تبدأ العملية بتحديد هذه العلاقات في لغة معينة. وهذا يتطلب قواعد بيانات ضخمة من النصوص، ليقوم الجهاز بعد ذلك بالبحث في هذا النص لمعرفة عدد مرات ظهور كل كلمة بجوار كل كلمة أخرى. وهذا النمط من الظهور يعتبر توقيعا فريدا يعرّف الكلمة في مساحة بارومترية متعددة الأبعاد. في الواقع، يمكن اعتبار الكلمة بمثابة قوة موجهة داخل هذا الفضاء، وتعمل هذه القوة الموجهة بمثابة قيد قوي على كيفية ظهور الكلمة في أي ترجمة تصدرها الآلة. هذه المتجهات تطيع بعض القواعد الرياضية البسيطة، ويمكن اعتبار الجملة كمجموعة من المتجهات التي تتبع الواحدة تلو الأخرى لتشكل نوعا من المسارات عبر هذا الفضاء. وتتمثل الفكرة الرئيسية في تمكين الترجمة الآلية من أن الكلمات بلغات مختلفة تشغل نفس النقاط في المساحات البارومترية الخاصة بها، وهذا يسهل من تحديد خارطة اللغة من خلال مطابقتها مع لغة أخرى. وبهذه الطريقة، تصبح عملية ترجمة الجمل عبارة عن عملية عثور على مسارات مماثلة عبر هذه المسافات، لا تحتاج الآلة حتى إلى معرفة معنى الجمل. وتعتمد هذه العملية بشكل أساسي على مجموعات البيانات الكبيرة، ولكن قبل عامين، أظهر فريق من الباحثين الألمان كيف أن اتباع نهج مماثل مع قواعد بيانات أصغر بكثير يمكن أن يساعد في ترجمة لغات أكثر ندرة تفتقر إلى قواعد البيانات الكبيرة للنصوص. وتكمن الحيلة في العثور على طريقة مختلفة لتقييد طريقة الآلة التي لا تعتمد على قاعدة البيانات. وقد ذهب لو وفريقه إلى أبعد من ذلك لبيان كيف يمكن للترجمة الآلية فك رموز اللغات المندثرة. ويرتبط القيد الذي يستخدمونه بالطريقة المعروفة لتطور اللغات مع مرور الوقت. والفكرة هي أن أي لغة يمكن أن تتغير بطرق معينة فقط، على سبيل المثال، تظهر الرموز في اللغات ذات الصلة مع توزيعات مماثلة، والكلمات ذات الصلة لها نفس ترتيب الحروف، وهكذا. وعندما تعيق هذه القواعد النظام الآلي، يصبح فك رموز اللغة أسهل بكثير، شريطة أن تكون اللغة الأصلية معروفة. ووضع لو وفريقه هذه التقنية في لغتين قديمتين، هما الشكل الخطي ب واللغة الأوغاريتية التي تم اكتشافها في عام 1929، هي شكل مبكر من أشكال اللغة العبرية. وبالنظر إلى تلك المعلومات والقيود التي يفرضها التطور اللغوي، فإن الآلة الخاصة بلو وفريقه كانت قادرة على ترجمة اللغتين بدقة. يقول الفريق “لقد تمكنا من ترجمة 67 بالمئة بشكل صحيح من الشكل الخطي ب وفك شفرته”.

مشاركة :