مترجم Microsoft NMT

مترجم Microsoft NMT
الترجمة الآلية العصبية (NMT) معيار جديد للترجمة الآلية عالية الجودة باستخدام الذكاء الاصطناعي。 يحل محل الترجمة الآلية الإحصائية القديمة (SMT) التكنولوجيا,تعمل التكنولوجيا في 2010-2020 وصلت ذروة الجودة في منتصف السنوات。
من SMT,NMT ليس فقط قادرًا على توفير ترجمة أفضل من وجهة نظر نقاط جودة الترجمة الأصلية,ويبدو أكثر سلاسة、أكثر تشابهًا مع الإنسان。 السبب الرئيسي لهذه الطلاقة هو أن NMT يستخدم السياق الكامل للجملة لترجمة الكلمات。 SMT تنظر فقط في السياق المباشر للكلمات الأولى والأخيرة من كل كلمة。
نموذج NMT هو في قلب واجهة برمجة التطبيقات,غير مرئي للمستخدمين النهائيين。 الفرق الوحيد الواضح هو تحسين جودة الترجمة,خاصة بالنسبة للصينيين、اللغتين اليابانية والعربية。
ما هي الترجمة الآلية؟
نظم الترجمة الآلية هي تطبيقات أو خدمات عبر الإنترنت تستخدم تقنيات التعلم الآلي لترجمة كميات كبيرة من النصوص من أي من لغاتها المدعومة。الخدمة تترجم نص "المصدر" من لغة إلى أخرى。
على الرغم من أن المفهوم وراء تكنولوجيا الترجمة الآلية وواجهته بسيطة نسبيا,ولكن العلم والتكنولوجيا الكامنة وراء ذلك معقد للغاية.,والجمع بين العديد من التقنيات الرائدة.,التعلم العميق بشكل خاص (الذكاء الاصطناعي),البيانات الضخمة,اللغويات,الحوسبة السحابية واجهات برمجة التطبيقات على شبكة الإنترنت。
منذ أوائل القرن الحادي والعشرين,تكنولوجيا الذكاء الاصطناعي الجديدة,أي الشبكة العصبية العميقة (مثل التعلم العميق),تمكين تقنية التعرف على الكلام للوصول إلى مستوى الجودة,وهذا يمكّن فريق Microsoft Translator من الجمع بين التعرف على الكلام مع تقنية ترجمة النص الأساسية,هذا يبدأ تقنية التعرف على الكلام。تقنية ترجمة صوتية جديدة。
التاريخ,تقنية التعلم الآلي الرئيسية المستخدمة في هذه الصناعة هي الترجمة الآلية الإحصائية (SMT)。نظرا لسياق عدة كلمات,يستخدم SMT التحليل الإحصائي المتقدم لتقدير أفضل ترجمة للكلمات。منذ منتصف العقد الـ2000,يتم استخدام SMT من قبل جميع مقدمي خدمات الترجمة الرئيسية، بما في ذلك مايكروسوفت。
أدى ظهور الترجمة الآلية العصبية (NMT) إلى تحول أساسي في تكنولوجيا الترجمة,وهذا يؤدي إلى ترجمة ذات جودة أعلى。تم نشر تقنية الترجمة هذه للمستخدمين والمطورين منذ النصف الثاني من عام 2016 。
SMT وNMT تكنولوجيا الترجمة لديها شيئين مشتركين:
  • كلاهما يتطلب عددا كبيرا من الترجمات قبل الإنسان (ما يصل إلى الملايين من الجمل المترجمة) لتدريب النظام。
  • ولا يعمل أي منهما كقاموس ثنائي اللغة.,بدلاً من ذلك، ترجمة الكلمات استنادًا إلى قائمة الترجمات المحتملة,بدلا من ذلك ، فإنه يترجم وفقا لسياق الكلمات المستخدمة في الجملة。
ما هو مترجم Microsoft؟
كجزء من مجموعة واجهة برمجة التطبيقات,مايكروسوفت مترجم النص API وخدمات مايكروسوفت الكلام هي خدمات الترجمة الآلية مايكروسوفت。
ترجمة نصوص ترجمة مايكروسوفت
منذ عام 2007,يستخدم فريق Microsoft واجهة برمجة تطبيقات Microsoft مترجم النص,منذ عام 2011,وقد تم استخدامه كواجهة برمجة تطبيقات تواجه العملاء。مايكروسوفت مترجم نص API يستخدم على نطاق واسع داخل مايكروسوفت。يتم دمجها في تعريب المنتج,دعم فريق الاتصال عبر الإنترنت (。يمكن أيضا أن يكون من المنتجات المألوفة。
يمكن استخدام Microsoft Translator في تطبيقات الويب أو العميل على أي نظام أساسي للأجهزة ومع أي نظام تشغيل,تنفيذ تعليم ترجمة اللغة والإجراءات الأخرى المتعلقة باللغة,أمثلة على الكشف عن اللغة,تحويل النص إلى كلام أو قاموس。
الاستفادة من تكنولوجيا REST القياسية في الصناعة,يرسل المطورون نصًا مصدريًا (أو صوتًا لترجمة الكلام) إلى الخدمة مع معلمات تشير إلى اللغة المستهدفة,ثم ترسل الخدمة النص المترجم مرة أخرى إلى العميل أو تطبيق ويب للاستخدام。
خدمات Microsoft Translator هي خدمات Azure المستضافة في مراكز بيانات Microsoft,وآمنة من خدمات سحابة مايكروسوفت الأخرى,قابليه,فائدة الموثوقية والتوافر المتواصل。
ترجمة مايكروسوفت ترجمة الصوت
بدأت تقنية ترجمة Microsoft مترجم الصوتية من مترجم سكايب في نهاية عام 2014,فتح واجهة برمجة التطبيقات للعملاء منذ أوائل عام 2016。وقد تم دمجها في ميزات Microsoft Translator في الوقت الفعلي,Skype,بث مؤتمر Skype وتطبيقات Microsoft Translator لنظام Android,iOSΟWindows。
تتوفر الترجمة الصوتية الآن من خلال Microsoft Speech,مايكروسوفت صوت هو خدمة قابلة للتخصيص بالكامل من طرف إلى طرف,للتعرف على الكلام,ترجمة الكلام وتوليف الكلام (تحويل النص إلى كلام)。
كيف تعمل ترجمة النص؟
هناك تقنيتان رئيسيتان لترجمة النص:التكنولوجيا التقليدية,الترجمة الآلية الإحصائية (SMT) وتكنولوجيا الجيل القادم,وهذا هو ، والترجمة الآلية العصبية (NMT)。
الترجمة الآلية الإحصائية
مايكروسوفت المترجم الإحصائية ترجمة آلة (SMT) يبني على أكثر من عقد من البحوث مايكروسوفت اللغة الطبيعية。نظم الترجمة الحديثة ليست قواعد يدوية للترجمة بين اللغات,بدلاً من ذلك، انظر إلى الترجمة على أنها مسألة تعلم تحولات النص بين اللغات من الترجمات البشرية الحالية والاستفادة من أحدث التطورات في إحصاءات التطبيقات والتعلم الآلي。
ما يسمى "مجموعة موازية" بمثابة نصب حجري رشيد الحديثة إلى حد كبير.,توفير كلمات في سياق العديد من أزواج اللغات والمجالات,ترجمة العبارة والتعابير。تساعد تقنيات النمذجة الإحصائية والخوارزميات الفعالة أجهزة الكمبيوتر على حل التشفير (الكشف عن المراسلات بين اللغات المصدرية والمستهدفة في بيانات التدريب) وفك التشفير (العثور على أفضل ترجمة للجمل المدخلة حديثًا)。مايكروسوفت مترجم يجمع بين وظائف الأساليب الإحصائية مع معلومات اللغة,لإنتاج النماذج التي يمكن تعميمها بشكل أفضل وتؤدي إلى فهم أسهل للترجمات。
لأن هذا النهج لا يعتمد على القواميس أو قواعد بناء الجملة,لذلك فهو يوفر أفضل ترجمة للعبارة,يمكنك استخدام السياق حول كلمة معينة بدلاً من محاولة إجراء ترجمة كلمة واحدة。للترجمة من كلمة واحدة,تطوير قاموس ثنائي اللغة。
الترجمة الآلية العصبية
التحسين المستمر للترجمة مهم جدا。لكن,منذ منتصف القرن الحادي والعشرين,كانت تحسينات الأداء في تكنولوجيا SMT مستقرة。استفد من حجم ووظائف أجهزة الكمبيوتر العملاقة الذكاء الاصطناعي من Microsoft، وخاصة مجموعة أدوات Microsoft المعرفية,مايكروسوفت المترجم يقدم الآن ترجمة على أساس الشبكات العصبية (LSTM),وهذا يحسن نوعية الترجمة في العقد الجديد。
تتوفر نماذج الشبكة العصبية هذه بجميع لغات الكلام عبر Microsoft Speech وواجهات برمجة الاتصالات النصية باستخدام معرفات الفئة。
مقارنة بالشركات التقليدية للمشاريع النّازلية,يتم إجراء تحويل الشبكة العصبية بطريقة مختلفة بشكل أساسي。
الرسوم المتحركة التالية تصف الخطوات التي تمر بها الشبكة العصبية من خلال ترجمة الجمل。وبسبب هذا النهج،,الترجمة سوف تجلب الجملة بأكملها في سياقها,بدلا من تكنولوجيا SMT باستخدام بضع كلمات فقط انزلاق النافذة,وسوف تنتج ترجمات أكثر سلاسة ودليل。
على أساس تدريب الشبكة العصبية,يتم ترميز كل كلمة على طول متجه 500 الأبعاد (أ),يمثل هذا المتجه خصائصه الفريدة في زوج لغة معين، مثل الإنجليزية والصينية。على أساس أزواج اللغات للتدريب,الشبكات العصبية سوف تقوم بتخصيص ما يجب أن تكون عليه هذه الأبعاد。يمكنهم ترميز بعض المفاهيم البسيطة.,على سبيل المثال - نوع الجنس (أنثى),الرجال,محايد),التهذيب (لغة s),عشوائيه,مكتوبه,شكل، الخ),نوع الكلمة (الفعل,الناوى، الخ),وأي خصائص أخرى غير واضحة مستمدة من بيانات التدريب。
الخطوات التي تعاني منها ترجمة الشبكة العصبية هي كما يلي:
  • كل كلمة,أو بالأحرى، هو متجه 500 الأبعاد.,من خلال الطبقة الأولى من الخلايا العصبية.,فهو يشفر المتجه 1000 الأبعاد (ب) للكلمة في السياق الذي يمثل كلمات أخرى في جملة。
  • بمجرد ترميز جميع الكلمات في هذه المتجهات ذات الأبعاد الـ 1000،,سيتم تكرار هذه العملية عدة مرات,يمكن لكل طبقة تحسين أفضل تمثيل 1000 الأبعاد للكلمة في سياق جملة كاملة (بدلا من تكنولوجيا SMT) والنظر فقط في نافذة من 3 إلى 5 كلمات)
  • وبعد ذلك,لاحظ أن الطبقة (أي خوارزمية البرامج) ستستخدم مصفوفة الإخراج النهائية,تستخدم طبقة الانتباه هذه مصفوفة الإخراج النهائية هذه وناتج الكلمات المترجمة مسبقًا لتحديد الكلمة التي يجب ترجمتها في الجملة المصدر التالية。كما سيستخدم هذه الحسابات لتجاهل الكلمات غير الضرورية في اللغة المستهدفة。
  • طبقة فك التشفير (الترجمة) تترجم الكلمات المحددة (أو بشكل أكثر تحديداً) الكلمات المحددة في ما يعادلها من اللغة المستهدفة الأنسب,يمثل متجه 1000 الأبعاد للكلمة في سياق جملة كاملة)。ثم تغذية إخراج الطبقة الأخيرة (ج) العودة إلى طبقة التركيز,لحساب الكلمة التالية في الجملة المصدر التي يجب ترجمتها。

في المثال المبين في الحركة،,السياق علم 1000 الأبعاد نموذج "" سيتم ترميز كاسم (منزل) ككلمة أنثى في الفرنسية (لا ميزون)。وهذا سيسمح للترجمة المناسبة من "نعم" بدلا من "le" (المفرد,ذكر) أو "LES" (معقدة) مرة واحدة وصلت إلى فك التشفير (الترجمة) طبقة。
لاحظ أن الخوارزمية سيتم حسابها أيضًا استنادًا إلى الكلمات المترجمة مسبقًا (في هذه الحالة، "the"),يجب أن تكون الكلمة التالية للترجمة هي الموضوع ("البيت") بدلاً من الصفة ("الأزرق") 。ويمكن تحقيق ذلك,لأن النظام يتعلم أن الإنجليزية والفرنسية عكس ترتيب هذه الكلمات في الجمل.。يمكنك أيضا حساب,إذا كانت الصفة "كبيرة" بدلا من اللون,ثم لا ينبغي عكسها ("البيت الكبير">"البيت الكبير")。
ونتيجة لهذا النهج،,في معظم الحالات،,الإخراج النهائي أكثر سلاسة من الترجمة المستندة إلى SMT,أقرب إلى الترجمة البشرية。
كيف تعمل الترجمة الصوتية؟
يمكن لمترجم Microsoft أيضًا ترجمة الكلام。وظائف التكنولوجيا في الوقت الحقيقي في المترجم,تطبيق المترجم,يتعرض في مترجم سكايب,وفي البداية فقط من خلال ميزة مترجم سكايب وفي التطبيق مترجم مايكروسوفت على دائرة الرقابة الداخلية والروبوت。يمكن للمطورين الآن تطوير باستخدام أحدث إصدار من واجهة برمجة التطبيقات القائمة على REST المفتوحة المتاحة على بوابة Azure。
على الرغم من أن للوهلة الأولى بناء تكنولوجيا ترجمة الكلام من التكنولوجيا القائمة قد يبدو وكأنه عملية بسيطة,لكنه يفعل أكثر بكثير من مجرد إدراج "التقليدية" الإنسان آلة محرك التعرف على الكلام في النص الحالي。ترجمة واحدة。
من أجل ترجمة الكلام "المصدر" بشكل صحيح من لغة إلى أخرى,النظام يأخذ أربع خطوات。
  • التعرف على الكلام,تحويل الصوت إلى نص
  • TrueText:تقنية مايكروسوفت,يمكن تطبيع النص لجعله أكثر ملاءمة للترجمة
  • ترجمة عبر محرك ترجمة النص أعلاه,ولكن استخدام نموذج الترجمة وضعت خصيصا للمحادثات المنطوقة واقع الحياة
  • تحويل النص إلى كلام إذا لزم الأمر,لتوليد الصوت المترجمة。

التعرف التلقائي على الكلام (ASR)
إجراء التعرف التلقائي على الكلام (ASR) باستخدام نظام الشبكة العصبية المدربة (NN),النظام يحلل آلاف الساعات من الصوت الصوتي الوارد。يتم تدريب النموذج على أساس التفاعل البشري بدلا ً من الأوامر البشرية والآلية.,يؤدي هذا إلى التعرف على الكلام الأمثل للمحادثات العادية。لتحقيق ذلك،,مقارنة مع ASR التقليدية بين الإنسان والآلة,هناك حاجة إلى مزيد من البيانات وDNNs أكبر。
TrueText
عندما يتواصل البشر مع البشر الآخرين,خطابنا ليس مثالياً كما نعتقد عادة,واضحة أو مرتبة。مع تقنية TrueText,عن طريق القضاء على الاختلافات الكلام (كلمات ملء) (على سبيل المثال "أم","آه"," و","مثل",التأتأة والتكرار。بإضافة فترة,علامات الترقيم المناسبة والأحرف الكبيرة,يمكنك أيضًا تحسين قابلية قراءة النص وترجمته。من أجل الحصول على هذه النتائج،,عملت على تكنولوجيا اللغة لعقود,تم تطويره من المترجم.,يستخدم لإنشاء TrueText。تستخدم الصورة التالية مثالًا واقعيًا لوصف التحولات المختلفة في TrueText لتوحيد هذا النص。

اترك تعليقا