المزيون
29-01-2007, 10:02 PM
لا تزال اللغة العربية بعيدة من لسان الكومبيوتر. وينطبق ذلك على النصوص العربية على الانترنت، وبالقياس على القول الشعري المشهور، غريبة الوجه واللسان و...الارقام. ويرجع السبب الاساس في ذلك القصور إلى عدم اتفاق العرب مع الهيئات المُشرفة على اللغات الالكترونية وبروتوكولاتها، مثل هيئة «أيكان» ICANN الاميركية، على وضع صيغ ثابتة لتحويل احرف الهجاء العربية الى اللغة الرقمية.
فلا يقرأ الكومبيوتر أي شيء، إلا بعد تحويله إلى مجموعات مُنظّمة من الارقام، وتحديداً يجب كتابته بتكرارات من الصفر والواحد، وذلك ما يُسمى اللغة الثنائية Binary ********. وقد ابتكرها الفيلسوف الالماني غوتفريد لايبنيز في القرن السابع عشر. لقد وُضعت اللغة الثنائية بالاصل لتكون طريقة في كتابة الأعداد، بمعنى كتابة الاعداد كلها باستخدام رقمي الصفر والواحد. فمثلاً، يُكتب الواحد 01، والاثنين 10 والثلاثة 11 والاربعة 100 والخمسة 101 والسته 110 والسبعة 111 وهكذا دواليك. ومع توسّع استخدام الكومبيوتر، كُتبت الكلمات على نفس طريقة كتابة الاعداد. ووجد العلماء طريقة لكتابة الاحرف برقمي الصفر والواحد. ووضعوا لذلك قواعد واضحة، ما مكّنهم من كتابة الكلمات والجُمل والنصوص برقمي الصفر والواحد أيضاً. ولأن الكومبيوتر وُلد في الغرب، لم تظهر صعوبة في كتابة اللغات ذات الاصل اللاتيني بالارقام الثنائية. ومع توسّع ثورة المعلوماتية في العالم، كُتبت الكثير من لغاته بتلك اللغة أيضاً. لم تواجه اليابانية مثلاً، على رغم غياب الحروف عنها، صعوبة في التحوّل إلى اللغة الثنائية. والأرجح ان الاسهام الياباني الهائل في صناعة المعلوماتية، لعب دوره في ذلك الامر. والمفارقة ان اللغة العربية تواجه صعوبة هائلة في التحوّل إلى اللغة الثنائية، على رغم ان الصفر اكتشاف عربي أصلاً. ولعل غياب العرب من المساهمة في الثورة العلمية التي رافقت الكومبيوتر والانترنت شكّل السبب الرئيس في هذا الوضع. وفي السنة الفائتة، أسندت هيئة «ايكان» إلى مجموعة بولندية أمر تحويل الاحرف العربية إلى اللغة الثنائية، ما أثار احتجاجاً عربياً واسعاً. وكذلك فان تلك المجموعة لم تتمكن من إنجاز المهمة التي أُسندت اليها.
الترجمة المؤتمتة
إذا كان الكومبيوتر «يقرأ» كل اللغات باللغة الرقمية عينها، فهل يمكنه الترجمة من لغة إلى أُخرى؟ ليست الاجابة عن السؤال بمثل سهولة طرحه، لأن اللغة تتضمن عناصر كثيرة، وليست مجرد رصف للأحرف والكلمات. يُمثّل المعنى (وبالتالي السياق) صعوبة واضحة. ولذا، يرى البعض ان الكومبيوتر يبقى عاجزاً عن انجاز المهمات اللغوية عموماً، الا ان يصبح أكثر ذكاء في التعامل مع اللغة. وبمعنى أخر، فان بعض الصعوبات في تعامل الكومبيوتر مع لغة البشر عموماً، تبقى رهناً بتطوّر الذكاء الاصطناعي Artificial Intelligence. ولم يمنع ذلك صُناع الكومبيوتر واختصاصيوه، من تزويده بالكثير من المقدرات اللغوية، التي تتطور باستمرار، ومنها الترجمة. وهكذا، ظهرت برمجيّات logiciels الترجمة الآليّة Machine Translation (أو المؤتمتةAutomated Translation) وجذبت الجمهور، لكنها لا تزال مليئة بالأخطاء، لأنها تعيش مرحلة «بدائية»، بالمعنى العلمي.
تُذكّر بدايات الترجمة الآليّة بمغامرات الجاسوس السينمائي الشهير جايمس بوند. فخلال الحرب الباردة والتجسّس وغزو الفضاء، شرع باحثون أميركيوّن، وبتمويل جزئيّ من «وكالة الاستخبارات المركزيّة» CIA، العمل على هذا الموضوع للتوصّل إلى ترجمة سريعة لآلاف الملفّات السوفياتيّة التي كانت في حوزتهم. وشيئاً فشيئاً، أصبحت الترجمة الآليّة في متناول الجميع. ولم تعد لتقتصر على لغة بعينها.
برمجيّات مجّانيّة على الانترنت
تتألّف برمجيّات الترجمة الآليّة من محرّك بحث يضمّ قاموساً أو أكثر، إضافة إلى القواعد النحويّة المختصّة بتركيبة الجمل والنصوص. وتسوّق هذه البرمجيّات في فرنسا، على سبيل المثال، عبر شركات مثل «سيستران» Systran و«سوفتيسيمو» Softissimo و«أفانكيست» Avanquest، و«باور ترانسلايتور» Power Translator. وعربياً، يمكن الاشارة الى ما تصنعه شركة «صخر» للمعلوماتية العربية، مثل برنامج «ترجم» الشهير في مجال الترجمة المؤتمتة. وعلى الانترنت أيضاً، تظهر مُحركات بحث إشتُهرت بأقسام الترجمة فيها، مثل «ألتافيستا» Altavista، ومحرّك البحث «غوغل» Google الذي يمتلك نظاماً خاصاً للترجمة.
كما يمكن لأيّ مالك موقع على الشبكة أن يقوم بإدخال أدوات ترجمة آليّة مجّانيّة على موقعه، عبر برمجيّات «بابل فيش» Babel Fish الذي تصنعه «سيستران».
تفاصيل الترجمة المؤتمتة
تمر الترجمة المؤتمتة في مراحل عدة. وتشتمل المرحلة الأولى الخطوات التالية:
- تحليل النصّ المصدر.
- تفحص البرمجيّات النصّ المُعدّ للترجمة، والذي يُطلَق عليه اسم «النصّ المصدر» كما يفعل المترجم عادةً. ثمّ تفكّك تركيبة كلّ جملة وتدرس وظائف الكلمات مفصّلة، للتعرف الى مُكوّنات مثل الفعل والفاعل والمفعول به. ثم تُرسل هذه العناصر الواحد تلو الآخر إلى «محرّك الترجمة».
وتضم المرحلة الثانية، خطوات من نوع:
- تطبيق القواعد اللغوية.
- تطبيق برمجيّات قواعد النحو والصرف الخاصة بلغة المصدر على العناصر التي جرى تحليلها. وتكون تلك القواعد محفوظة في المعطيات البيانيّة الخاصة بالبرمجة. ثمّ يُصنع سجّل حسابي لرصد الترجمة جملة اثر أخرى، مع تحليل دقيق للمؤشّرات الموجودة في الجملة، بما فيها علامات الوقف والأحرف الكبيرة. وإذا صادف الكومبيوتر مثلاً كلمة «Paris» (باريس) مكتوبة بحرف كبير في وسط الجملة، يعرف أنّ المقصود اسم العلم للدلالة على تلك المدينة. أمّا إن وُجِدَت الكلمة في أوّل الجملة، فتلجأ برمجيّات الترجمة إلى تحليل الكلمات التي تتبعها.
ففي جملة «Paris est une belle ville» (باريس مدينة جميلة) يتبع كلمة Paris فعل مفرد ولا تسبقه أداة تعريف ولهذا يستنتج الحاسوب أسرع بأنّ الفعل أتى بعد اسم علم. ويتعقّد الامر حيال جملة مثل il la porte (هو يحملها)، اذ يتوجب على البرمجيّات معرفة أنّ كلمة porte تعني هنا الفعل حَمَلَ ، وليس الاسم porte الذي يعني باباً! كما لا تعطي البرمجيّات الترجمة ذاتها لفعل «porter» (يحمل) في كلّ من الجملتَين التاليتَن: porter une voile و porter un voile ، فيترجمهما في اللغة الانكليزيّة في شكل مختلف: الأولى «to carry a sail» ( يحمل شراعاً) والثانية «to wear a veil» (يرتدي حجاباً).
وعندما لا تظهر أي دلالة على الاسم في الجملة، كما في «les voiles déferlent en vitesse» ، يصعب على الكومبيوتر معرفة ان كان الامر يتعلق بالشراع أو بالحجاب!
وتتضمن المرحلة الثالثة، التي يفترض انها ستحلّ مشاكل المرحلتين السابقتين، ملمحاً مهماً يتمثّل في تدخّل القاموس. فبينما تعمل البرمجيّات على تطبيق القواعد اللغويّة على النص، تبحث في الوقت نفسه في قاموسها بهدف إيجاد المرادفات الممكنة للكلمة. ويغني استخدام القواميس المتخصّصة الترجمة من خلال لعب دور المصفاة الإضافيّ، ما يخفض نسبة الاخطاء. فمثلاً، كلمة board باللغة الانكليزيّة تعني في الوقت نفسه لوحة خشبيّة، واللوح، وأن يصعد الى الطائرة او القطار، مجلس الإدارة أيضاً. إذا كانت برمجيّات الترجمة مزوّدة بقاموس متخصّص في المفردات الماليّة، تترجم الكلمة بمعنى «مجلس الإدارة» من دون تردّد. وفي حال غياب قاموس متخصّص، هناك احتمالات عديدة لحصول الخطأ. في الواقع، يشكّل وجود هذا القاموس المتخصّص الذي يعمل على صقل الترجمة نقطة الاختلاف بين برمجيّات ترجمة وخدمة ترجمة على الشبكة. ففي بعض الحالات تقترح البرمجيّات على المستخدم أن يختار بنفسه بين احتمالات عدّة في ترجمة الكلمة الواحدة. واضافة إلى ذلك، لدى بعض البرمجيّات المتطوّرة القدرة على التعلّم، أو ما يُسمى تقنياً ب «ذاكرة ترجمة».
تتيح تلك الذاكرة تسجيل النصوص المُترجمة، وكذلك مقارنتها والاستعانة بها عند إجراء ترجمات أخرى. كما يمكن أحياناً أن يقوم المستخدم بإضافة بعض الكلمات على القاموس.
وفي المرحلة الرابعة، ينتقل الكومبيوتر الى صنع الصيغة النهائية للترجمة، التي تُسمى «النص الهدف» Target ****. فعندما تنتهي البرمجيّات من مراحل تفكيك الجملة وكلماتها، ثم تحليلها، وترجمتها إلى ما يبدو لها المعنى الصحيح، تشرع في «النقل» لتشكيل الترجمة الكاملة للنصّ المصدر. وهنا تظهر مشاكل جديدة في بناء هذه التركيبة، التي تُظهر أهمية التمكّن من لغتي المصدر والهدف. وهذا ما يخوّل البرمجيّات ترجمة العبارة الفرنسيّة»il pleut des cordes، بما يقابلها بالانكليزيّة it’s raining cats and dogs وليس ب «it’s raining ropes». وينطبق هذا الأمر أيضاً على اللغة العربيّة، إذ يترجم الكومبيوتر العبارتين السابقتين، الفرنسية والانكليزية، بـ «إنّها تمطر بغزارة»، وليس «أنّها تمطر حبالاً» أو «أنّها تمطر كلاباً وهررةً».
وغالباً ما تقترف برمجيّات الترجمة الآليّة أخطاء كثيرة في هذه المرحلة. فتعتمد نوعيّة الترجمة إذاً على سهولة المعاني في النصّ المصدر وعلى غياب الأخطاء الإملائيّة. وتجدر الإشارة إلى أنّ البرمجيّات لا تفهم معنى النص ككلّ بل تطبّق القواعد على كلّ جملة بمفردها من دون رؤية شاملة. ولكنّها لا تترجم حرفيّاً بل تقوم بتحليل الجملة بكاملها.
لماذا لا ينجح الأمر؟
لماذا تستطيع البرمجيّات أن تتعامل مع العبارات السهلة وأن تترجم في شكل جيّد الصيغ المعقّدة أو الاصطلاحيّة؟ وكيف تعرف أنّ الفرنسييّن لديهم «هرّة» في الحنجرة أمّا الانكليز فلديهم ضفدع في عبارة «بُحَّ صوته» التي تقابلها avoir un chat dans la gorge باللغة الفرنسيّة و to have a frog in the throat باللغة الانكليزيّة؟ يعتمد الامر على عدد القواعد اللغويّة التي تضمّها البرمجيّات، وكذلك على نوعيّة هذه القواعد. ويضع اللغويّون هذه القواعد ثمّ تترجم على شكل أعداد رقمية ثنائية. ويهدف هذا الأمر إلى إلغاء الالتباس في الكلمات قدر الإمكان، عبر تقليص الاحتمالات في ترجمة الكلمات، والتي يفترض بالبرمجيّات المُفاضلة بينها.
ويجب الأخذ في الاعتبار تعدّد معاني الكلمة الواحدة، والتمييز بين الاسم والفعل، والغموض في المعنى للكلمة عينها. ولذا تظهر كثير من الترجمات السيئة.
:cc004:
فلا يقرأ الكومبيوتر أي شيء، إلا بعد تحويله إلى مجموعات مُنظّمة من الارقام، وتحديداً يجب كتابته بتكرارات من الصفر والواحد، وذلك ما يُسمى اللغة الثنائية Binary ********. وقد ابتكرها الفيلسوف الالماني غوتفريد لايبنيز في القرن السابع عشر. لقد وُضعت اللغة الثنائية بالاصل لتكون طريقة في كتابة الأعداد، بمعنى كتابة الاعداد كلها باستخدام رقمي الصفر والواحد. فمثلاً، يُكتب الواحد 01، والاثنين 10 والثلاثة 11 والاربعة 100 والخمسة 101 والسته 110 والسبعة 111 وهكذا دواليك. ومع توسّع استخدام الكومبيوتر، كُتبت الكلمات على نفس طريقة كتابة الاعداد. ووجد العلماء طريقة لكتابة الاحرف برقمي الصفر والواحد. ووضعوا لذلك قواعد واضحة، ما مكّنهم من كتابة الكلمات والجُمل والنصوص برقمي الصفر والواحد أيضاً. ولأن الكومبيوتر وُلد في الغرب، لم تظهر صعوبة في كتابة اللغات ذات الاصل اللاتيني بالارقام الثنائية. ومع توسّع ثورة المعلوماتية في العالم، كُتبت الكثير من لغاته بتلك اللغة أيضاً. لم تواجه اليابانية مثلاً، على رغم غياب الحروف عنها، صعوبة في التحوّل إلى اللغة الثنائية. والأرجح ان الاسهام الياباني الهائل في صناعة المعلوماتية، لعب دوره في ذلك الامر. والمفارقة ان اللغة العربية تواجه صعوبة هائلة في التحوّل إلى اللغة الثنائية، على رغم ان الصفر اكتشاف عربي أصلاً. ولعل غياب العرب من المساهمة في الثورة العلمية التي رافقت الكومبيوتر والانترنت شكّل السبب الرئيس في هذا الوضع. وفي السنة الفائتة، أسندت هيئة «ايكان» إلى مجموعة بولندية أمر تحويل الاحرف العربية إلى اللغة الثنائية، ما أثار احتجاجاً عربياً واسعاً. وكذلك فان تلك المجموعة لم تتمكن من إنجاز المهمة التي أُسندت اليها.
الترجمة المؤتمتة
إذا كان الكومبيوتر «يقرأ» كل اللغات باللغة الرقمية عينها، فهل يمكنه الترجمة من لغة إلى أُخرى؟ ليست الاجابة عن السؤال بمثل سهولة طرحه، لأن اللغة تتضمن عناصر كثيرة، وليست مجرد رصف للأحرف والكلمات. يُمثّل المعنى (وبالتالي السياق) صعوبة واضحة. ولذا، يرى البعض ان الكومبيوتر يبقى عاجزاً عن انجاز المهمات اللغوية عموماً، الا ان يصبح أكثر ذكاء في التعامل مع اللغة. وبمعنى أخر، فان بعض الصعوبات في تعامل الكومبيوتر مع لغة البشر عموماً، تبقى رهناً بتطوّر الذكاء الاصطناعي Artificial Intelligence. ولم يمنع ذلك صُناع الكومبيوتر واختصاصيوه، من تزويده بالكثير من المقدرات اللغوية، التي تتطور باستمرار، ومنها الترجمة. وهكذا، ظهرت برمجيّات logiciels الترجمة الآليّة Machine Translation (أو المؤتمتةAutomated Translation) وجذبت الجمهور، لكنها لا تزال مليئة بالأخطاء، لأنها تعيش مرحلة «بدائية»، بالمعنى العلمي.
تُذكّر بدايات الترجمة الآليّة بمغامرات الجاسوس السينمائي الشهير جايمس بوند. فخلال الحرب الباردة والتجسّس وغزو الفضاء، شرع باحثون أميركيوّن، وبتمويل جزئيّ من «وكالة الاستخبارات المركزيّة» CIA، العمل على هذا الموضوع للتوصّل إلى ترجمة سريعة لآلاف الملفّات السوفياتيّة التي كانت في حوزتهم. وشيئاً فشيئاً، أصبحت الترجمة الآليّة في متناول الجميع. ولم تعد لتقتصر على لغة بعينها.
برمجيّات مجّانيّة على الانترنت
تتألّف برمجيّات الترجمة الآليّة من محرّك بحث يضمّ قاموساً أو أكثر، إضافة إلى القواعد النحويّة المختصّة بتركيبة الجمل والنصوص. وتسوّق هذه البرمجيّات في فرنسا، على سبيل المثال، عبر شركات مثل «سيستران» Systran و«سوفتيسيمو» Softissimo و«أفانكيست» Avanquest، و«باور ترانسلايتور» Power Translator. وعربياً، يمكن الاشارة الى ما تصنعه شركة «صخر» للمعلوماتية العربية، مثل برنامج «ترجم» الشهير في مجال الترجمة المؤتمتة. وعلى الانترنت أيضاً، تظهر مُحركات بحث إشتُهرت بأقسام الترجمة فيها، مثل «ألتافيستا» Altavista، ومحرّك البحث «غوغل» Google الذي يمتلك نظاماً خاصاً للترجمة.
كما يمكن لأيّ مالك موقع على الشبكة أن يقوم بإدخال أدوات ترجمة آليّة مجّانيّة على موقعه، عبر برمجيّات «بابل فيش» Babel Fish الذي تصنعه «سيستران».
تفاصيل الترجمة المؤتمتة
تمر الترجمة المؤتمتة في مراحل عدة. وتشتمل المرحلة الأولى الخطوات التالية:
- تحليل النصّ المصدر.
- تفحص البرمجيّات النصّ المُعدّ للترجمة، والذي يُطلَق عليه اسم «النصّ المصدر» كما يفعل المترجم عادةً. ثمّ تفكّك تركيبة كلّ جملة وتدرس وظائف الكلمات مفصّلة، للتعرف الى مُكوّنات مثل الفعل والفاعل والمفعول به. ثم تُرسل هذه العناصر الواحد تلو الآخر إلى «محرّك الترجمة».
وتضم المرحلة الثانية، خطوات من نوع:
- تطبيق القواعد اللغوية.
- تطبيق برمجيّات قواعد النحو والصرف الخاصة بلغة المصدر على العناصر التي جرى تحليلها. وتكون تلك القواعد محفوظة في المعطيات البيانيّة الخاصة بالبرمجة. ثمّ يُصنع سجّل حسابي لرصد الترجمة جملة اثر أخرى، مع تحليل دقيق للمؤشّرات الموجودة في الجملة، بما فيها علامات الوقف والأحرف الكبيرة. وإذا صادف الكومبيوتر مثلاً كلمة «Paris» (باريس) مكتوبة بحرف كبير في وسط الجملة، يعرف أنّ المقصود اسم العلم للدلالة على تلك المدينة. أمّا إن وُجِدَت الكلمة في أوّل الجملة، فتلجأ برمجيّات الترجمة إلى تحليل الكلمات التي تتبعها.
ففي جملة «Paris est une belle ville» (باريس مدينة جميلة) يتبع كلمة Paris فعل مفرد ولا تسبقه أداة تعريف ولهذا يستنتج الحاسوب أسرع بأنّ الفعل أتى بعد اسم علم. ويتعقّد الامر حيال جملة مثل il la porte (هو يحملها)، اذ يتوجب على البرمجيّات معرفة أنّ كلمة porte تعني هنا الفعل حَمَلَ ، وليس الاسم porte الذي يعني باباً! كما لا تعطي البرمجيّات الترجمة ذاتها لفعل «porter» (يحمل) في كلّ من الجملتَين التاليتَن: porter une voile و porter un voile ، فيترجمهما في اللغة الانكليزيّة في شكل مختلف: الأولى «to carry a sail» ( يحمل شراعاً) والثانية «to wear a veil» (يرتدي حجاباً).
وعندما لا تظهر أي دلالة على الاسم في الجملة، كما في «les voiles déferlent en vitesse» ، يصعب على الكومبيوتر معرفة ان كان الامر يتعلق بالشراع أو بالحجاب!
وتتضمن المرحلة الثالثة، التي يفترض انها ستحلّ مشاكل المرحلتين السابقتين، ملمحاً مهماً يتمثّل في تدخّل القاموس. فبينما تعمل البرمجيّات على تطبيق القواعد اللغويّة على النص، تبحث في الوقت نفسه في قاموسها بهدف إيجاد المرادفات الممكنة للكلمة. ويغني استخدام القواميس المتخصّصة الترجمة من خلال لعب دور المصفاة الإضافيّ، ما يخفض نسبة الاخطاء. فمثلاً، كلمة board باللغة الانكليزيّة تعني في الوقت نفسه لوحة خشبيّة، واللوح، وأن يصعد الى الطائرة او القطار، مجلس الإدارة أيضاً. إذا كانت برمجيّات الترجمة مزوّدة بقاموس متخصّص في المفردات الماليّة، تترجم الكلمة بمعنى «مجلس الإدارة» من دون تردّد. وفي حال غياب قاموس متخصّص، هناك احتمالات عديدة لحصول الخطأ. في الواقع، يشكّل وجود هذا القاموس المتخصّص الذي يعمل على صقل الترجمة نقطة الاختلاف بين برمجيّات ترجمة وخدمة ترجمة على الشبكة. ففي بعض الحالات تقترح البرمجيّات على المستخدم أن يختار بنفسه بين احتمالات عدّة في ترجمة الكلمة الواحدة. واضافة إلى ذلك، لدى بعض البرمجيّات المتطوّرة القدرة على التعلّم، أو ما يُسمى تقنياً ب «ذاكرة ترجمة».
تتيح تلك الذاكرة تسجيل النصوص المُترجمة، وكذلك مقارنتها والاستعانة بها عند إجراء ترجمات أخرى. كما يمكن أحياناً أن يقوم المستخدم بإضافة بعض الكلمات على القاموس.
وفي المرحلة الرابعة، ينتقل الكومبيوتر الى صنع الصيغة النهائية للترجمة، التي تُسمى «النص الهدف» Target ****. فعندما تنتهي البرمجيّات من مراحل تفكيك الجملة وكلماتها، ثم تحليلها، وترجمتها إلى ما يبدو لها المعنى الصحيح، تشرع في «النقل» لتشكيل الترجمة الكاملة للنصّ المصدر. وهنا تظهر مشاكل جديدة في بناء هذه التركيبة، التي تُظهر أهمية التمكّن من لغتي المصدر والهدف. وهذا ما يخوّل البرمجيّات ترجمة العبارة الفرنسيّة»il pleut des cordes، بما يقابلها بالانكليزيّة it’s raining cats and dogs وليس ب «it’s raining ropes». وينطبق هذا الأمر أيضاً على اللغة العربيّة، إذ يترجم الكومبيوتر العبارتين السابقتين، الفرنسية والانكليزية، بـ «إنّها تمطر بغزارة»، وليس «أنّها تمطر حبالاً» أو «أنّها تمطر كلاباً وهررةً».
وغالباً ما تقترف برمجيّات الترجمة الآليّة أخطاء كثيرة في هذه المرحلة. فتعتمد نوعيّة الترجمة إذاً على سهولة المعاني في النصّ المصدر وعلى غياب الأخطاء الإملائيّة. وتجدر الإشارة إلى أنّ البرمجيّات لا تفهم معنى النص ككلّ بل تطبّق القواعد على كلّ جملة بمفردها من دون رؤية شاملة. ولكنّها لا تترجم حرفيّاً بل تقوم بتحليل الجملة بكاملها.
لماذا لا ينجح الأمر؟
لماذا تستطيع البرمجيّات أن تتعامل مع العبارات السهلة وأن تترجم في شكل جيّد الصيغ المعقّدة أو الاصطلاحيّة؟ وكيف تعرف أنّ الفرنسييّن لديهم «هرّة» في الحنجرة أمّا الانكليز فلديهم ضفدع في عبارة «بُحَّ صوته» التي تقابلها avoir un chat dans la gorge باللغة الفرنسيّة و to have a frog in the throat باللغة الانكليزيّة؟ يعتمد الامر على عدد القواعد اللغويّة التي تضمّها البرمجيّات، وكذلك على نوعيّة هذه القواعد. ويضع اللغويّون هذه القواعد ثمّ تترجم على شكل أعداد رقمية ثنائية. ويهدف هذا الأمر إلى إلغاء الالتباس في الكلمات قدر الإمكان، عبر تقليص الاحتمالات في ترجمة الكلمات، والتي يفترض بالبرمجيّات المُفاضلة بينها.
ويجب الأخذ في الاعتبار تعدّد معاني الكلمة الواحدة، والتمييز بين الاسم والفعل، والغموض في المعنى للكلمة عينها. ولذا تظهر كثير من الترجمات السيئة.
:cc004: