دليل مستخدم الأنترنت

ما هو التعلم الآلي؟ كل ما تحتاج إلى معرفته 2023

يمكّن التعلم الآلي أجهزة الكمبيوتر من معالجة المهام التي لم ينفذها سوى الأشخاص حتى الآن. من قيادة السيارات إلى ترجمة الكلام ، يقود التعلم الآلي إلى انفجار في قدرات الذكاء الاصطناعي – مما يساعد البرامج على فهم العالم الحقيقي الفوضوي وغير المتوقع. ولكن ما هو التعلم الآلي بالضبط وما الذي يجعل الطفرة الحالية في التعلم الآلي ممكنة؟

ما هو التعلم الآلي؟

على مستوى عالٍ جدًا ، فإن التعلم الآلي هو عملية تعليم نظام الكمبيوتر كيفية عمل تنبؤات دقيقة عند تغذية البيانات. يمكن أن تكون هذه التنبؤات هي الإجابة على ما إذا كانت قطعة الفاكهة في الصورة هي موزة أم تفاحة ، حيث تكتشف الأشخاص الذين يعبرون الطريق أمام سيارة ذاتية القيادة ، سواء كان استخدام كلمة كتاب في جملة يتعلق بغلاف ورقي أم تفاحة . حجز الفنادق ، سواء كانت رسالة بريد إلكتروني غير مرغوب فيها ، أو التعرف على الكلام بدقة كافية لإنشاء تسميات توضيحية لمقطع فيديو على YouTube.

يتمثل الاختلاف الرئيسي عن برامج الكمبيوتر التقليدية في أن المطور البشري لم يكتب رمزًا يوجه النظام إلى كيفية التمييز بين الموز والتفاح. بدلاً من ذلك ، تم تعليم نموذج التعلم الآلي كيفية التمييز بشكل موثوق بين الثمار من خلال التدريب على كمية كبيرة من البيانات ، في هذه الحالة على الأرجح عدد ضخم من الصور المصنفة على أنها تحتوي على موزة أو تفاحة. البيانات ، والكثير منها ، هي المفتاح لجعل التعلم الآلي ممكنًا.

ما الفرق بين الذكاء الاصطناعي والتعلم الآلي؟


الذكاء الاصطناعي

ربما حقق التعلم الآلي نجاحًا هائلاً مؤخرًا ، لكنه مجرد طريقة واحدة لتحقيق الذكاء الاصطناعي. في ولادة مجال الذكاء الاصطناعي في الخمسينيات من القرن الماضي ، تم تعريف الذكاء الاصطناعي على أنه أي آلة قادرة على أداء مهمة تتطلب عادةً ذكاءً بشريًا.

ستظهر أنظمة الذكاء الاصطناعي عمومًا على الأقل بعض السمات التالية: التخطيط ، والتعلم ، والاستدلال ، وحل المشكلات ، وتمثيل المعرفة ، والإدراك ، والحركة ، والتلاعب ، وبدرجة أقل ، الذكاء الاجتماعي والإبداع.

إلى جانب التعلم الآلي ، هناك العديد من الأساليب الأخرى المستخدمة لبناء أنظمة الذكاء الاصطناعي ، بما في ذلك الحساب التطوري ، حيث تخضع الخوارزميات لطفرات ومجموعات عشوائية بين الأجيال في محاولة “لتطوير” الحلول المثلى ، والأنظمة الخبيرة ، حيث يتم برمجة أجهزة الكمبيوتر بقواعد تسمح لتقليد سلوك خبير بشري في مجال معين ، على سبيل المثال نظام الطيار الآلي الذي يقود طائرة.

ما هي الأنواع الرئيسية للتعلم الآلي؟

ينقسم التعلم الآلي عمومًا إلى فئتين رئيسيتين: التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف.


ما هو التعلم تحت الإشراف؟

هذا النهج في الأساس يعلم الآلات بالقدوة. أثناء التدريب على التعلم الخاضع للإشراف ، تتعرض الأنظمة لكميات كبيرة من البيانات المصنفة ، على سبيل المثال صور الأرقام المكتوبة بخط اليد والتي تم شرحها للإشارة إلى الرقم الذي تتوافق معه. بالنظر إلى الأمثلة الكافية ، سيتعلم نظام التعلم الخاضع للإشراف التعرف على مجموعات البكسل والأشكال المرتبطة بكل رقم ، ويكون قادرًا في النهاية على التعرف على الأرقام المكتوبة بخط اليد ، وقادرًا على التمييز بشكل موثوق بين الأرقام 9 و 4 أو 6 و 8.

ومع ذلك ، يتطلب تدريب هذه الأنظمة عادةً كميات هائلة من البيانات المصنفة ، حيث تحتاج بعض الأنظمة إلى التعرض لملايين الأمثلة لإتقان مهمة ما.

نتيجة لذلك ، يمكن أن تكون مجموعات البيانات المستخدمة لتدريب هذه الأنظمة شاسعة ، حيث تحتوي مجموعة بيانات الصور المفتوحة من Google على حوالي تسعة ملايين صورة ، ومستودع الفيديو المسمى  YouTube-8M الذي يربط سبعة ملايين مقطع فيديو معنون و ImageNet ، إحدى قواعد البيانات المبكرة من هذا النوع ، بها أكثر من 14 مليون صورة مصنفة. يستمر حجم مجموعات بيانات التدريب في النمو ، حيث أعلنت شركة Facebook أنها جمعت 3.5 مليار صورة متاحة للجمهور على Instagram ، باستخدام علامات التصنيف المرفقة بكل صورة كتسميات. أدى استخدام مليار من هذه الصور لتدريب نظام التعرف على الصور إلى الحصول على مستويات قياسية من الدقة – بلغت 85.4٪ – وفقًا لمعيار ImageNet.

غالبًا ما يتم تنفيذ العملية الشاقة لوضع العلامات على مجموعات البيانات المستخدمة في التدريب باستخدام خدمات العمل الجماعي ، مثل Amazon Mechanical Turk ، التي توفر الوصول إلى مجموعة كبيرة من العمالة منخفضة التكلفة المنتشرة في جميع أنحاء العالم. على سبيل المثال ، تم تجميع ImageNet على مدار عامين بواسطة ما يقرب من 50000 شخص ، تم تجنيدهم بشكل أساسي من خلال Amazon Mechanical Turk. ومع ذلك ، فإن نهج Facebook في استخدام البيانات المتاحة للجمهور لتدريب الأنظمة يمكن أن يوفر طريقة بديلة لأنظمة التدريب باستخدام مجموعات بيانات قوية بمليارات من دون الحاجة إلى وضع الملصقات اليدوية.

ما هو التعلم غير الخاضع للرقابة؟

في المقابل ، يتولى التعلم غير الخاضع للإشراف خوارزميات لتحديد الأنماط في البيانات ، في محاولة لتحديد أوجه التشابه التي تقسم تلك البيانات إلى فئات. من الأمثلة على ذلك ، أن تقوم Airbnb بتجميع المنازل المتاحة للإيجار حسب الحي ، أو تجمع أخبار Google معًا قصصًا حول مواضيع مماثلة كل يوم.

لم يتم تصميم خوارزميات التعلم غير الخاضعة للإشراف لتمييز أنواع معينة من البيانات ، فهي ببساطة تبحث عن البيانات التي يمكن تجميعها حسب أوجه التشابه ، أو عن الحالات الشاذة التي تبرز.

ما هو التعلم شبه الخاضع للإشراف؟

قد تتضاءل أهمية مجموعات ضخمة من البيانات المصنفة لتدريب أنظمة التعلم الآلي بمرور الوقت ، بسبب صعود التعلم شبه الخاضع للإشراف.

كما يوحي الاسم ، يمزج النهج بين التعلم الخاضع للإشراف والتعلم غير الخاضع للإشراف. تعتمد التقنية على استخدام كمية صغيرة من البيانات المصنفة وكمية كبيرة من البيانات غير الموسومة لتدريب الأنظمة. تُستخدم البيانات المصنفة لتدريب نموذج التعلم الآلي جزئيًا ، ومن ثم يتم استخدام هذا النموذج المدرب جزئيًا لتسمية البيانات غير الموسومة ، وهي عملية تسمى التوسيم الزائف. ثم يتم تدريب النموذج على المزيج الناتج من البيانات المسمى والمسمى الزائف.

انظر: ما هو الذكاء الاصطناعي؟ كل ما تحتاج لمعرفته حول الذكاء الاصطناعي

تم تعزيز جدوى التعلم شبه الخاضع للإشراف مؤخرًا من خلال شبكات الخصومة التوليدية ( GANs ) ، وهي أنظمة للتعلم الآلي يمكنها استخدام البيانات المصنفة لإنشاء بيانات جديدة تمامًا ، والتي يمكن استخدامها بدورها للمساعدة في تدريب نموذج التعلم الآلي. إذا أصبح التعلم شبه الخاضع للإشراف بنفس فعالية التعلم الخاضع للإشراف ، فإن الوصول إلى كميات هائلة من قوة الحوسبة قد ينتهي به الأمر إلى أن يكون أكثر أهمية لتدريب أنظمة التعلم الآلي بنجاح من الوصول إلى مجموعات البيانات الكبيرة المصنفة.

ما هو التعلم المعزز؟

تتمثل إحدى طرق فهم التعلم المعزز في التفكير في الطريقة التي قد يتعلم بها شخص ما لعب لعبة كمبيوتر من المدرسة القديمة لأول مرة ، عندما لا يكون على دراية بالقواعد أو كيفية التحكم في اللعبة. على الرغم من أنهم قد يكونون مبتدئين تمامًا ، إلا أنه في النهاية ، من خلال النظر في العلاقة بين الأزرار التي يضغطون عليها ، وما يحدث على الشاشة ودرجاتهم داخل اللعبة ، سيتحسن أداؤهم بشكل أفضل.

مثال على التعلم المعزز هو شبكة Google DeepMind’s Deep Q-network ، التي هزمت البشر في مجموعة واسعة من ألعاب الفيديو القديمة . يتم تغذية النظام بالبكسل من كل لعبة ويحدد المعلومات المختلفة حول حالة اللعبة ، مثل المسافة بين الكائنات على الشاشة. ثم تنظر في كيفية ارتباط حالة اللعبة والإجراءات التي تقوم بها في اللعبة بالنتيجة التي حققتها.

خلال عملية العديد من دورات لعب اللعبة ، يقوم النظام في النهاية ببناء نموذج تؤدي فيه الإجراءات إلى زيادة النتيجة إلى أقصى حد وفي أي ظرف ، على سبيل المثال ، في حالة لعبة الفيديو Breakout ، حيث يجب نقل المجداف إليه من أجل اعترض الكرة.

كيف يعمل التعلم الآلي الخاضع للإشراف؟

يبدأ كل شيء بتدريب نموذج التعلم الآلي ، وهي وظيفة رياضية قادرة على تعديل كيفية عملها بشكل متكرر حتى تتمكن من إجراء تنبؤات دقيقة عند إعطائها بيانات جديدة. قبل بدء التدريب ، عليك أولاً اختيار البيانات التي تريد جمعها وتحديد ميزات البيانات المهمة.

مثال مبسط للغاية عن ميزات البيانات المقدمة في هذا الشرح بواسطة Google ، حيث يتم تدريب نموذج التعلم الآلي للتعرف على الفرق بين البيرة والنبيذ ، بناءً على ميزتين ، لون المشروبات وحجم الكحول (ABV) .

يتم تصنيف كل مشروب على أنه بيرة أو نبيذ ، ثم يتم جمع البيانات ذات الصلة باستخدام مطياف لقياس لونها ومقياس كثافة السوائل لقياس محتواها من الكحول. هناك نقطة مهمة يجب ملاحظتها وهي أن البيانات يجب أن تكون متوازنة ، وفي هذه الحالة يكون لديك عدد متساوٍ تقريبًا من أمثلة البيرة والنبيذ. ثم يتم تقسيم البيانات التي تم جمعها ، إلى نسبة أكبر للتدريب ، على سبيل المثال حوالي 70 ٪ ، ونسبة أقل للتقييم ، على سبيل المثال ، 30 ٪ المتبقية. تسمح بيانات التقييم هذه باختبار النموذج المدرَّب ، لمعرفة مدى جودة أدائه المحتمل على بيانات العالم الحقيقي.

قبل بدء التدريب ، ستكون هناك أيضًا بشكل عام خطوة لإعداد البيانات ، يتم خلالها تنفيذ عمليات مثل إلغاء البيانات المكررة والتطبيع وتصحيح الخطأ. ستكون الخطوة التالية هي اختيار نموذج مناسب للتعلم الآلي من بين مجموعة كبيرة ومتنوعة. لكل منها نقاط قوة ونقاط ضعف اعتمادًا على نوع البيانات ، على سبيل المثال ، بعضها مناسب للتعامل مع الصور ، والبعض الآخر للنص ، والبعض الآخر للبيانات الرقمية البحتة.

تنقسم التنبؤات التي يتم إجراؤها باستخدام التعلم الخاضع للإشراف إلى نوعين رئيسيين ، التصنيف ، حيث يقوم النموذج بتسمية البيانات على أنها فئات محددة مسبقًا ، على سبيل المثال تحديد رسائل البريد الإلكتروني كرسائل غير مرغوب فيها أو ليست بريدًا عشوائيًا ، والانحدار ، حيث يتنبأ النموذج ببعض القيمة المستمرة ، مثل أسعار المنازل .

كيف يعمل تدريب التعلم الآلي الخاضع للإشراف؟

بشكل أساسي ، تتضمن عملية التدريب نموذج التعلم الآلي الذي يقوم تلقائيًا بتعديل كيفية عمله حتى يتمكن من إجراء تنبؤات دقيقة من البيانات ، في مثال Google ، يتم تصنيف مشروب بشكل صحيح على أنه بيرة أو نبيذ عندما يتم إعطاء النموذج لون المشروب و ABV. هناك طريقة جيدة لشرح عملية التدريب وهي النظر في مثال باستخدام نموذج بسيط للتعلم الآلي ، يُعرف باسم الانحدار الخطي مع النسب المتدرج. في المثال التالي ، يتم استخدام النموذج لتقدير عدد الآيس كريم الذي سيتم بيعه بناءً على درجة الحرارة الخارجية .

تخيل أخذ البيانات السابقة التي تُظهر مبيعات الآيس كريم ودرجة الحرارة الخارجية ، ورسم تلك البيانات مقابل بعضها البعض على رسم بياني مبعثر – مما يؤدي أساسًا إلى تبعثر النقاط المنفصلة. للتنبؤ بعدد الآيس كريم الذي سيتم بيعه في المستقبل بناءً على درجة الحرارة الخارجية ، يمكنك رسم خط يمر عبر منتصف كل هذه النقاط ، على غرار الرسم التوضيحي أدناه.

تدريب التعلم الآلي

بمجرد الانتهاء من ذلك ، يمكن التنبؤ بمبيعات الآيس كريم عند أي درجة حرارة من خلال إيجاد النقطة التي يمر عندها الخط عبر درجة حرارة معينة وقراءة المبيعات المقابلة في تلك النقطة. وبإعادته إلى تدريب نموذج التعلم الآلي ، فإن تدريب نموذج الانحدار الخطي في هذه الحالة سيشمل تعديل الموضع الرأسي وانحدار الخط حتى يقع في منتصف جميع النقاط على الرسم البياني المبعثر.

في كل خطوة من خطوات عملية التدريب ، يتم قياس المسافة العمودية لكل نقطة من هذه النقاط من الخط. إذا أدى التغيير في ميل الخط أو موضعه إلى زيادة المسافة إلى هذه النقاط ، فسيتم تغيير ميل الخط أو موضعه في الاتجاه المعاكس ، ويتم أخذ قياس جديد.

بهذه الطريقة ، من خلال العديد من التعديلات الصغيرة على المنحدر وموضع الخط ، سيستمر الخط في التحرك حتى يستقر في النهاية في موضع مناسب لتوزيع كل هذه النقاط. بمجرد اكتمال عملية التدريب هذه ، يمكن استخدام الخط لعمل تنبؤات دقيقة لكيفية تأثير درجة الحرارة على مبيعات الآيس كريم ، ويمكن القول إن نموذج التعلم الآلي قد تم تدريبه.

بينما يختلف التدريب على نماذج التعلم الآلي الأكثر تعقيدًا مثل الشبكات العصبية من عدة جوانب ، إلا أنه مشابه من حيث أنه يمكن أيضًا استخدام نهج النسب المتدرج ، حيث قيمة “الأوزان” ، المتغيرات التي يتم دمجها مع بيانات الإدخال لإنشاء يتم تعديل قيم المخرجات بشكل متكرر حتى تصبح قيم المخرجات التي ينتجها النموذج أقرب ما يمكن إلى ما هو مطلوب.

كيف تقيم نماذج التعلم الآلي؟

بمجرد اكتمال تدريب النموذج ، يتم تقييم النموذج باستخدام البيانات المتبقية التي لم يتم استخدامها أثناء التدريب ، مما يساعد على قياس أدائه في العالم الحقيقي. عند تدريب نموذج التعلم الآلي ، عادةً ما يتم استخدام حوالي 60٪ من مجموعة البيانات للتدريب. يتم استخدام 20٪ أخرى من البيانات للتحقق من صحة التنبؤات التي قدمها النموذج وضبط المعلمات الإضافية التي تعمل على تحسين إخراج النموذج. تم تصميم هذا الضبط الدقيق لتعزيز دقة تنبؤ النموذج عند تقديمه مع بيانات جديدة. 

على سبيل المثال ، قد تكون إحدى تلك المعلمات التي يتم تعديل قيمتها أثناء عملية التحقق هذه مرتبطة بعملية تسمى التنظيم. يضبط التنظيم إخراج النموذج بحيث يتم تقليل الأهمية النسبية لبيانات التدريب في تحديد مخرجات النموذج. يساعد القيام بذلك على تقليل فرط التخصيص ، وهي مشكلة يمكن أن تنشأ عند تدريب نموذج. يحدث التجاوز عندما ينتج النموذج تنبؤات عالية الدقة عند تغذية بيانات التدريب الأصلية الخاصة به ولكنه غير قادر على الاقتراب من هذا المستوى من الدقة عند تقديمه ببيانات جديدة ، مما يحد من استخدامه في العالم الحقيقي. ترجع هذه المشكلة إلى تدريب النموذج على عمل تنبؤات مرتبطة ارتباطًا وثيقًا بالأنماط الموجودة في بيانات التدريب الأصلية ، مما يحد من قدرة النموذج على تعميم تنبؤاته على البيانات الجديدة. مشكلة عكسية هي عدم ملاءمة ،

يتم بعد ذلك استخدام نسبة 20٪ الأخيرة من مجموعة البيانات لاختبار ناتج النموذج المدرَّب والمضبوط ، للتحقق من بقاء تنبؤات النموذج دقيقة عند تقديمها ببيانات جديدة.

لماذا تعتبر معرفة المجال مهمة؟

قرار مهم آخر عند تدريب نموذج التعلم الآلي هو البيانات التي سيتم تدريب النموذج عليها. على سبيل المثال ، إذا كنت تحاول بناء نموذج للتنبؤ بما إذا كانت قطعة من الفاكهة فاسدة ، فستحتاج إلى معلومات أكثر من مجرد المدة التي مرت منذ قطف الفاكهة. ستستفيد أيضًا من معرفة البيانات المتعلقة بالتغيرات في لون تلك الفاكهة أثناء تعفنها ودرجة الحرارة التي تم تخزين الفاكهة بها. معرفة البيانات المهمة لعمل تنبؤات دقيقة أمر بالغ الأهمية. لهذا السبب غالبًا ما يتم استخدام خبراء المجال عند جمع بيانات التدريب ، حيث سيفهم هؤلاء الخبراء نوع البيانات اللازمة لعمل تنبؤات سليمة.

ما هي الشبكات العصبية وكيف يتم تدريبها؟

تعتبر الشبكات العصبية مجموعة مهمة جدًا من الخوارزميات لكل من التعلم الآلي الخاضع للإشراف وغير الخاضع للإشراف. هذه هي أساس الكثير من التعلم الآلي ، وبينما يمكن استخدام النماذج البسيطة مثل الانحدار الخطي المستخدم لعمل تنبؤات بناءً على عدد صغير من ميزات البيانات ، كما هو الحال في مثال Google مع البيرة والنبيذ ، فإن الشبكات العصبية مفيدة عند التعامل مع مجموعات كبيرة من بيانات مع العديد من الميزات.

الشبكات العصبية ، التي يكون هيكلها مستوحى بشكل فضفاض من بنية الدماغ ، هي طبقات مترابطة من الخوارزميات ، تسمى الخلايا العصبية ، والتي تغذي البيانات بعضها البعض ، ويكون ناتج الطبقة السابقة هو مدخلات الطبقة اللاحقة. يمكن اعتبار كل طبقة على أنها تتعرف على الميزات المختلفة للبيانات الإجمالية. على سبيل المثال ، ضع في اعتبارك مثال استخدام التعلم الآلي للتعرف على الأرقام المكتوبة بخط اليد بين 0 و 9. قد تقيس الطبقة الأولى في الشبكة العصبية شدة وحدات البكسل الفردية في الصورة ، ويمكن للطبقة الثانية تحديد الأشكال ، مثل الخطوط والمنحنيات ، والطبقة الأخيرة قد تصنف هذا الرقم المكتوب بخط اليد كرقم بين 0 و 9.

تتعلم الشبكة كيفية التعرف على البيكسلات التي تشكل شكل الأرقام أثناء عملية التدريب ، عن طريق التغيير التدريجي لأهمية البيانات أثناء تدفقها بين طبقات الشبكة. هذا ممكن بسبب كل رابط بين الطبقات التي لها وزن مرتبط ، والتي يمكن زيادتها أو تقليل قيمتها لتغيير أهمية هذا الارتباط. في نهاية كل دورة تدريبية ، سيقوم النظام بفحص ما إذا كان الناتج النهائي للشبكة العصبية يقترب أو يبتعد عما هو مرغوب فيه – على سبيل المثال ، هل تتحسن الشبكة أو تسوء في تحديد رقم مكتوب بخط اليد 6. لسد الفجوة بين بين المخرجات الفعلية والمخرجات المرغوبة ، سيعمل النظام بعد ذلك بشكل عكسي من خلال الشبكة العصبية ، ويغير الأوزان المرتبطة بكل هذه الروابط بين الطبقات ، بالإضافة إلى القيمة المرتبطة التي تسمى التحيز.

ما هي الشبكات العصبية وكيف يتم تدريبها؟
رسم توضيحي لهيكل الشبكة العصبية وكيف يعمل التدريب.الصورة: Nvidia

في النهاية ، ستستقر هذه العملية على قيم هذه الأوزان والانحياز الذي سيسمح للشبكة بأداء مهمة معينة بشكل موثوق ، مثل التعرف على الأرقام المكتوبة بخط اليد ، ويمكن القول إن الشبكة “تعلمت” كيفية تنفيذ مهمة محددة.

ما هو التعلم العميق وما هي الشبكات العصبية العميقة؟

مجموعة فرعية من التعلم الآلي هي التعلم العميق ، حيث يتم توسيع الشبكات العصبية إلى شبكات مترامية الأطراف مع عدد كبير من الطبقات التي تحتوي على العديد من الوحدات التي يتم تدريبها باستخدام كميات هائلة من البيانات. هذه الشبكات العصبية العميقة هي التي غذت القفزة الحالية إلى الأمام في قدرة أجهزة الكمبيوتر على تنفيذ مهام مثل التعرف على الكلام ورؤية الكمبيوتر.

هناك أنواع مختلفة من الشبكات العصبية ، مع نقاط قوة وضعف مختلفة. الشبكات العصبية المتكررة هي نوع من الشبكات العصبية مناسبة بشكل خاص لمعالجة اللغة والتعرف على الكلام ، بينما تستخدم الشبكات العصبية التلافيفية بشكل أكثر شيوعًا في التعرف على الصور. يتطور تصميم الشبكات العصبية أيضًا ، حيث ابتكر الباحثون مؤخرًا تصميمًا أكثر كفاءة لنوع فعال من الشبكات العصبية العميقة يسمى الذاكرة طويلة المدى أو LSTM ، مما يسمح لها بالعمل بسرعة كافية لاستخدامها في الأنظمة عند الطلب مثل Google يترجم.

يتم استخدام تقنية الذكاء الاصطناعي الخاصة بالخوارزميات التطورية لتحسين الشبكات العصبية ، وذلك بفضل عملية تسمى التطور العصبي. تم عرض هذا النهج من قبل مختبرات Uber AI ، التي أصدرت أوراقًا حول استخدام الخوارزميات الجينية لتدريب الشبكات العصبية العميقة على مشاكل التعلم المعززة.

هل يتم تنفيذ التعلم الآلي باستخدام الشبكات العصبية فقط؟

مُطْلَقاً. هناك مجموعة من النماذج الرياضية التي يمكن استخدامها لتدريب النظام على عمل التنبؤات. النموذج البسيط هو الانحدار اللوجستي ، والذي على الرغم من الاسم يُستخدم عادةً لتصنيف البيانات ، على سبيل المثال البريد العشوائي مقابل ليس البريد العشوائي. يعد الانحدار اللوجستي مباشرًا للتنفيذ والتدريب عند تنفيذ التصنيف الثنائي البسيط ، ويمكن توسيعه ليشمل أكثر من فئتين.

نوع نموذج شائع آخر هو Support Vector Machines (SVMs) ، والتي تُستخدم على نطاق واسع لتصنيف البيانات وعمل التنبؤات عبر الانحدار. يمكن أن تفصل SVM البيانات إلى فئات ، حتى إذا كانت البيانات المرسومة مختلطة معًا بطريقة يبدو من الصعب فصلها إلى فئات مميزة. لتحقيق ذلك ، تقوم SVM بإجراء عملية رياضية تسمى خدعة kernel ، والتي تقوم بتعيين نقاط البيانات إلى قيم جديدة ، بحيث يمكن فصلها بشكل كامل إلى فئات.

يعتمد اختيار نموذج التعلم الآلي المراد استخدامه عادةً على العديد من العوامل ، مثل الحجم وعدد الميزات في مجموعة البيانات ، مع وجود إيجابيات وسلبيات لكل نموذج.

لماذا يعتبر التعلم الآلي ناجحًا جدًا؟

في حين أن التعلم الآلي ليس أسلوبًا جديدًا ، فقد ازداد الاهتمام بهذا المجال في السنوات الأخيرة. يتبع هذا الانبعاث سلسلة من الإنجازات ، حيث وضع التعلم العميق أرقامًا قياسية جديدة للدقة في مجالات مثل التعرف على الكلام واللغة ورؤية الكمبيوتر.

ما جعل هذه النجاحات ممكنة هما عاملان أساسيان ؛ الأول هو الكميات الهائلة من الصور والكلام والفيديو والنصوص المتاحة لتدريب أنظمة التعلم الآلي. ولكن الأهم من ذلك هو ظهور كميات هائلة من طاقة المعالجة المتوازية ، بفضل وحدات معالجة الرسومات الحديثة (GPUs) ، والتي يمكن تجميعها معًا لتشكيل مراكز قوة للتعلم الآلي.

اليوم يمكن لأي شخص لديه اتصال بالإنترنت استخدام هذه المجموعات لتدريب نماذج التعلم الآلي ، عبر الخدمات السحابية التي تقدمها شركات مثل Amazon و Google و Microsoft. مع انطلاق استخدام التعلم الآلي ، تعمل الشركات الآن على إنشاء أجهزة متخصصة مصممة لتشغيل نماذج التعلم الآلي وتدريبها. مثال على إحدى هذه الشرائح المخصصة هو وحدة معالجة Tensor (TPU) من Google ، والتي تسرع معدل نماذج التعلم الآلي التي تم إنشاؤها باستخدام مكتبة برامج TensorFlow من Google والتي يمكن أن تستنتج المعلومات من البيانات ، بالإضافة إلى المعدل الذي يمكن أن تكون به هذه النماذج تم تدريبه.

لا تُستخدم هذه الرقائق فقط لتدريب نماذج Google DeepMind و Google Brain ، ولكن أيضًا النماذج التي تدعم الترجمة من Google والتعرف على الصور في صور Google ، بالإضافة إلى الخدمات التي تسمح للجمهور ببناء نماذج التعلم الآلي باستخدام TensorFlow Research Cloud . . تم الكشف عن الجيل الثالث من هذه الرقائق في مؤتمر Google I / O في مايو 2018 ، ومنذ ذلك الحين تم تجميعها في مراكز قوة للتعلم الآلي تسمى pods التي يمكنها تنفيذ أكثر من مائة ألف تريليون عملية فاصلة عائمة في الثانية (100 بيتافلوب) . 

في عام 2020 ، قالت Google إن الجيل الرابع من TPU كان أسرع 2.7 مرة من الجيل السابق من TPU في MLPerf ، وهو معيار يقيس مدى سرعة تنفيذ النظام للاستدلال باستخدام نموذج ML مدرب. سمحت ترقيات TPU المستمرة هذه لشركة Google بتحسين خدماتها المبنية على أعلى نماذج التعلم الآلي ، على سبيل المثال  تقليل الوقت المستغرق في تدريب النماذج المستخدمة في ترجمة Google إلى النصف .  

نظرًا لأن الأجهزة أصبحت متخصصة بشكل متزايد ويتم تحسين أطر برامج التعلم الآلي ، فقد أصبح من الشائع بشكل متزايد تنفيذ مهام ML على الهواتف وأجهزة الكمبيوتر الخاصة بالمستهلكين ، بدلاً من مراكز البيانات السحابية. في صيف عام 2018 ، اتخذت Google خطوة نحو تقديم نفس جودة الترجمة الآلية على الهواتف غير المتصلة بالإنترنت كما هو متاح عبر الإنترنت ، من خلال طرح الترجمة الآلية العصبية المحلية لـ 59 لغة لتطبيق Google Translate لنظامي التشغيل iOS و Android.

ما هو AlphaGo؟

ربما يكون أشهر دليل على فعالية أنظمة التعلم الآلي هو انتصار Google DeepMind AlphaGo AI لعام 2016 على خبير بشري في Go ، وهو إنجاز لم يكن متوقعًا حتى عام 2026. Go هي لعبة صينية قديمة أدت إلى تعقيد أجهزة الكمبيوتر. لعقود. لدى Go حوالي 200 حركة ممكنة في كل دور ، مقارنة بحوالي 20 حركة في الشطرنج. على مدار لعبة Go ، هناك العديد من الحركات الممكنة التي تجعل البحث في كل منها مقدمًا لتحديد أفضل لعبة مكلفًا للغاية من وجهة نظر حسابية. بدلاً من ذلك ، تم تدريب AlphaGo على كيفية لعب اللعبة من خلال اتخاذ الحركات التي يلعبها خبراء بشريون في 30 مليون لعبة Go وإدخالها في الشبكات العصبية ذات التعلم العميق.

يمكن أن يستغرق تدريب شبكات التعلم العميق المطلوبة وقتًا طويلاً للغاية ، مما يتطلب استيعاب كميات هائلة من البيانات وتكرارها حيث يقوم النظام تدريجياً بتحسين نموذجه من أجل تحقيق أفضل النتائج.

ومع ذلك ، قامت Google مؤخرًا بتحسين عملية التدريب باستخدام AlphaGo Zero ، وهو نظام لعب ألعاب “عشوائية تمامًا” ضد نفسه ، ثم تعلم من النتائج. في مؤتمر أنظمة معالجة المعلومات العصبية (NIPS) في عام 2017 ، كشف ديميس هاسابيس ، الرئيس التنفيذي لشركة Google DeepMind ، عن أن AlphaZero ، وهو نسخة معممة من AlphaGo Zero ، قد أتقن أيضًا ألعاب الشطرنج والشوجي.

تواصل DeepMind فتح آفاق جديدة في مجال التعلم الآلي. في يوليو 2018 ، ذكرت شركة DeepMind أن وكلاء الذكاء الاصطناعي لديهم علموا أنفسهم كيف يلعبون لعبة Quake III Arena متعددة اللاعبين ثلاثية الأبعاد التي تصدح لأول مرة عام 1999 ، وهو ما يكفي للتغلب على فرق من اللاعبين البشر . تعلم هؤلاء الوكلاء كيفية لعب اللعبة باستخدام معلومات لا تزيد عن المعلومات المتاحة للاعبين البشريين ، حيث كانت مدخلاتهم الوحيدة هي البكسل على الشاشة أثناء تجربة الإجراءات العشوائية في اللعبة ، وردود الفعل على أدائهم خلال كل لعبة.

في الآونة الأخيرة ، أظهر DeepMind وكيلًا للذكاء الاصطناعي قادرًا على أداء خارق عبر العديد من ألعاب Atari الكلاسيكية ، وهو تحسن مقارنة بالمقاربات السابقة حيث يمكن لكل وكيل ذكاء اصطناعي أن يؤدي أداءً جيدًا فقط في لعبة واحدة. يقول باحثو DeepMind إن هذه القدرات العامة ستكون مهمة إذا كان لأبحاث الذكاء الاصطناعي معالجة مجالات أكثر تعقيدًا في العالم الحقيقي.

جاء التطبيق الأكثر إثارة للإعجاب لأبحاث DeepMind في أواخر عام 2020 ، عندما كشفت عن نظام AlphaFold 2 ، وهو نظام تم الإعلان عن قدراته باعتباره إنجازًا بارزًا في العلوم الطبية .

AlphaFold 2 هي شبكة عصبية قائمة على الانتباه ولديها القدرة على زيادة وتيرة تطوير الأدوية ونمذجة المرض بشكل كبير. يمكن للنظام رسم خريطة للبنية ثلاثية الأبعاد للبروتينات ببساطة عن طريق تحليل كتل بنائها ، والمعروفة باسم الأحماض الأمينية. في مسابقة التقييم النقدي لتوقع بنية البروتين ، تمكن AlphaFold 2 من تحديد البنية ثلاثية الأبعاد للبروتين بدقة تنافس علم البلورات ، وهو المعيار الذهبي لنمذجة البروتينات بشكل مقنع. ومع ذلك ، في حين يستغرق علم البلورات عدة أشهر لإرجاع النتائج ، يمكن لـ AlphaFold 2 تصميم هياكل البروتين بدقة في غضون ساعات.

ما هو التعلم الآلي المستخدمة؟

تُستخدم أنظمة التعلم الآلي في كل مكان حولنا وهي اليوم حجر الزاوية للإنترنت الحديث. تُستخدم أنظمة التعلم الآلي للتوصية بالمنتج الذي قد ترغب في شرائه بعد ذلك على Amazon أو الفيديو الذي قد ترغب في مشاهدته على Netflix.

يستخدم كل بحث في Google أنظمة متعددة للتعلم الآلي ، لفهم اللغة في استعلامك وصولاً إلى تخصيص نتائجك ، لذلك لا يغرق عشاق الصيد الذين يبحثون عن “الجيتار” بالنتائج المتعلقة بالقيثارات. وبالمثل ، تستخدم أنظمة التعرف على الرسائل غير المرغوب فيها والتصيد الاحتيالي في Gmail نماذج مدربة على التعلم الآلي لإبقاء صندوق الوارد الخاص بك خاليًا من الرسائل المارقة. من أوضح مظاهر قوة التعلم الآلي المساعدين الافتراضيين ، مثل Apple’s Siri و Amazon’s Alexa و Google Assistant و Microsoft Cortana.

يعتمد كل منهم بشكل كبير على التعلم الآلي لدعم التعرف على الصوت والقدرة على فهم اللغة الطبيعية ، فضلاً عن الحاجة إلى مجموعة هائلة للاستفادة منها للإجابة على الاستفسارات.

ولكن بعيدًا عن هذه المظاهر الواضحة جدًا للتعلم الآلي ، بدأت الأنظمة في العثور على فائدة في كل صناعة تقريبًا. وتشمل هذه الاستغلال: الرؤية الحاسوبية للسيارات ذاتية القيادة والطائرات بدون طيار وروبوتات التوصيل. التعرف على الكلام واللغة والتوليف لروبوتات المحادثة وروبوتات الخدمة ؛ التعرف على الوجه للمراقبة في دول مثل الصين ؛ مساعدة أخصائيي الأشعة على اكتشاف الأورام في الأشعة السينية ، ومساعدة الباحثين في اكتشاف التسلسلات الجينية المتعلقة بالأمراض وتحديد الجزيئات التي يمكن أن تؤدي إلى عقاقير أكثر فعالية في الرعاية الصحية ؛ السماح بالصيانة التنبؤية للبنية التحتية من خلال تحليل بيانات مستشعر إنترنت الأشياء ؛ دعم رؤية الكمبيوتر التي تجعل سوبر ماركت Amazon Go الذي لا يستخدم الكاشير ممكنًا ، مما يوفر نسخًا وترجمة دقيقة بشكل معقول للكلام في اجتماعات العمل – والقائمة تطول وتطول.

في عام 2020 ، تصدرت GPT-3 (Transformer 3 Generative Generative Transformer 3) من OpenAI عناوين الأخبار لقدرتها على الكتابة كإنسان ، حول أي موضوع تقريبًا يمكن أن تفكر فيه. GPT-3 هي شبكة عصبية مدربة على مليارات المقالات باللغة الإنجليزية المتاحة على شبكة الويب المفتوحة ويمكنها إنشاء مقالات وإجابات استجابةً للمطالبات النصية. بينما كان  من الصعب للوهلة الأولى التمييز بين النص الذي تم إنشاؤه بواسطة GPT-3 والإنسان ، عند الفحص الدقيق ،  لم تصمد عروض النظام دائمًا أمام التدقيق .

يمكن للتعلم العميق أن يمهد الطريق للروبوتات التي يمكنها التعلم مباشرة من البشر ، حيث أنشأ باحثون من Nvidia نظامًا للتعلم العميق مصممًا لتعليم الروبوت كيفية تنفيذ مهمة ما ، وذلك ببساطة من خلال ملاحظة الوظيفة التي يؤديها الإنسان. .

هل أنظمة التعلم الآلي موضوعية؟

كما تتوقع ، سيؤثر اختيار واتساع البيانات المستخدمة لتدريب الأنظمة على المهام التي تناسبها. هناك قلق متزايد بشأن كيفية قيام أنظمة التعلم الآلي بتقنين التحيزات البشرية والتفاوتات المجتمعية التي تنعكس في بيانات التدريب الخاصة بها.

على سبيل المثال ، في عام 2016 ، وجدت راشيل تاتمان ، وهي زميلة أبحاث الخريجين في المؤسسة الوطنية للعلوم في قسم اللغويات بجامعة واشنطن ، أن نظام التعرف على الكلام من Google كان يعمل بشكل أفضل لأصوات الذكور مقارنة بالأصوات الأنثوية عند وضع تسميات توضيحية تلقائية لعينة من مقاطع فيديو YouTube ، ونتيجة لذلك ، عزت ذلك إلى “مجموعات التدريب غير المتوازنة” ذات الغالبية العظمى من المتحدثين الذكور.

ثبت أن أنظمة التعرف على الوجه لديها صعوبة أكبر في تحديد النساء والأشخاص ذوي البشرة الداكنة بشكل صحيح. أدت الأسئلة حول أخلاقيات استخدام مثل هذه الأنظمة المتطفلة والتي يحتمل أن تكون متحيزة للشرطة إلى قيام شركات التكنولوجيا الكبرى بإيقاف مبيعات أنظمة التعرف على الوجه مؤقتًا إلى أجهزة إنفاذ القانون. في عام 2018 ، ألغت أمازون أيضًا أداة توظيف تعتمد على التعلم الآلي حددت المتقدمين الذكور على أنهم مفضلون .

مع انتقال أنظمة التعلم الآلي إلى مجالات جديدة ، مثل المساعدة في التشخيص الطبي ، أصبحت إمكانية انحراف الأنظمة نحو تقديم خدمة أفضل أو علاج أكثر عدلاً لمجموعات معينة من الأشخاص مصدر قلق أكبر. البحث مستمر اليوم  حول طرق تعويض التحيز في أنظمة التعلم الذاتي .

ماذا عن التأثير البيئي للتعلم الآلي؟

كان التأثير البيئي لمزارع الحوسبة العاملة بالطاقة والتبريد المستخدمة لتدريب نماذج التعلم الآلي وتشغيلها  موضوع بحث أعده المنتدى الاقتصادي العالمي في عام 2018 . كان أحد  التقديرات لعام 2019 هو أن الطاقة التي تتطلبها أنظمة التعلم الآلي تتضاعف كل 3.4 شهرًا .

مع نمو حجم النماذج ومجموعات البيانات المستخدمة لتدريبها ، على سبيل المثال ، نموذج التنبؤ اللغوي GPT-3 الذي تم إصداره مؤخرًا عبارة عن شبكة عصبية مترامية الأطراف تضم حوالي 175 مليار معلمة ، وكذلك القلق بشأن البصمة الكربونية لـ ML.

هناك العديد من العوامل التي يجب مراعاتها ، تتطلب نماذج التدريب طاقة أكبر بكثير من تشغيلها بعد التدريب ، ولكن تكلفة تشغيل النماذج المدربة تتزايد أيضًا مع تزايد الطلب على الخدمات التي تعمل بنظام ML. هناك أيضًا حجة مضادة مفادها أن القدرات التنبؤية للتعلم الآلي يمكن أن يكون لها تأثير إيجابي كبير في عدد من المجالات الرئيسية ، من البيئة إلى الرعاية الصحية ، كما يتضح من برنامج AlphaFold 2 من Google DeepMind.

ما هي أفضل دورات التعلم الآلي؟

من الدورات التدريبية الموصى بها على نطاق واسع للمبتدئين لتعليم أنفسهم أساسيات التعلم الآلي هي سلسلة محاضرات جامعة ستانفورد المجانية وكورسيرا بواسطة خبير الذكاء الاصطناعي ومؤسس Google Brain Andrew Ng. أصدر Ng مؤخرًا دورة التخصص في التعلم العميق ، والتي تركز على مجموعة واسعة من موضوعات التعلم الآلي واستخداماته ، بالإضافة إلى هياكل الشبكات العصبية المختلفة.

إذا كنت تفضل التعلم من خلال نهج من أعلى إلى أسفل ، حيث تبدأ بتشغيل نماذج التعلم الآلي المدربة والتعمق في أعمالهم الداخلية لاحقًا ، فمن المستحسن أن يكون التعلم العميق العملي للمبرمجين من fast.ai’s ، ويفضل أن يكون ذلك للمطورين الذين يتمتعون بتجربة Python لمدة عام وفقًا لـ fast.ai. تتمتع كلتا الدورتين بنقاط قوتهما ، حيث تقدم دورة Ng نظرة عامة على الأسس النظرية للتعلم الآلي ، بينما يتمحور عرض fast.ai حول Python ، وهي لغة مستخدمة على نطاق واسع من قبل مهندسي التعلم الآلي وعلماء البيانات.  

هناك دورة أخرى مجانية على الإنترنت ذات تصنيف عالي ، والتي تم الإشادة بها لاتساع نطاق تغطيتها وجودة تدريسها ، وهي مقدمة EdX وجامعة كولومبيا للتعلم الآلي ، على الرغم من أن الطلاب يذكرون أنها تتطلب معرفة قوية بالرياضيات حتى المستوى الجامعي.

كيف أبدأ التعلم الآلي؟

أصبحت التقنيات المصممة للسماح للمطورين بتعليم أنفسهم عن التعلم الآلي شائعة بشكل متزايد ، بدءًا  من DeepLens للكاميرا التي تدعم التعلم العميق من AWS إلى مجموعات AIY التي تعمل بنظام Raspberry Pi من Google .

ما هي الخدمات المتاحة للتعلم الآلي؟

توفر جميع الأنظمة الأساسية السحابية الرئيسية – Amazon Web Services و Microsoft Azure و Google Cloud Platform – إمكانية الوصول إلى الأجهزة اللازمة لتدريب نماذج التعلم الآلي وتشغيلها ، مع السماح لـ Google لمستخدمي Cloud Platform باختبار وحدات معالجة Tensor الخاصة بها – وهي شرائح مخصصة تم تصميمها مُحسَّن للتدريب وتشغيل نماذج التعلم الآلي.

تتضمن هذه البنية التحتية المستندة إلى مجموعة النظراء مخازن البيانات اللازمة للاحتفاظ بكميات هائلة من بيانات التدريب ، والخدمات لإعداد تلك البيانات للتحليل ، وأدوات التصور لعرض النتائج بوضوح.

تعمل الخدمات الأحدث حتى على تبسيط إنشاء نماذج التعلم الآلي المخصصة ، حيث تقدم Google خدمة تعمل على أتمتة إنشاء نماذج AI ، تسمى Cloud AutoML . تعمل خدمة السحب والإفلات هذه على إنشاء نماذج مخصصة للتعرف على الصور وتتطلب من المستخدم ألا يمتلك خبرة في التعلم الآلي ، على غرار Azure Machine Learning Studio من Microsoft. على نفس المنوال ، تمتلك أمازون خدمات AWS الخاصة بها المصممة لتسريع عملية تدريب نماذج التعلم الآلي .

بالنسبة لعلماء البيانات ، فإن Google Cloud’s AI Platform عبارة عن خدمة تعلم آلي مُدارة تتيح للمستخدمين تدريب ونشر وتصدير نماذج التعلم الآلي المخصصة بناءً على إطار عمل TensorFlow ML مفتوح المصدر من Google أو إطار عمل الشبكة العصبية المفتوح Keras ، والتي يمكنها يمكن استخدامها مع  مكتبة بايثون sci-kit learn و XGBoost.

يمكن لمسؤولي قواعد البيانات الذين ليس لديهم خلفية في علم البيانات استخدام BigQueryML من Google ، وهي خدمة تجريبية تسمح للمسؤولين بالاتصال بنماذج التعلم الآلي المدربة باستخدام أوامر SQL ، مما يسمح بإجراء التنبؤات في قاعدة البيانات ، وهو أبسط من تصدير البيانات إلى تعلم آلي منفصل و بيئة التحليلات .

بالنسبة للشركات التي لا ترغب في بناء نماذج التعلم الآلي الخاصة بها ، تقدم المنصات السحابية أيضًا خدمات مدعومة بالذكاء الاصطناعي عند الطلب – مثل الصوت والرؤية والتعرف على اللغة. 

وفي الوقت نفسه ، تحاول شركة IBM ، جنبًا إلى جنب مع عروضها العامة عند الطلب ، بيع خدمات الذكاء الاصطناعي الخاصة بالقطاع والتي تستهدف كل شيء من الرعاية الصحية إلى البيع بالتجزئة ، وتجميع هذه العروض معًا تحت مظلة IBM Watson الخاصة بها.

في أوائل عام 2018 ،  وسعت Google خدماتها القائمة على التعلم الآلي إلى عالم الإعلان ، وأطلقت مجموعة من الأدوات لجعل الإعلانات أكثر فعالية ، سواء الرقمية أو المادية. على الرغم من أن Apple لا تتمتع بنفس السمعة في التعرف على الكلام المتطور ومعالجة اللغة الطبيعية ورؤية الكمبيوتر مثل Google و Amazon ، إلا أنها تستثمر في تحسين خدمات الذكاء الاصطناعي الخاصة بها ، مع الرئيس السابق للتعلم الآلي في Google المسؤول عن استراتيجية الذكاء الاصطناعي عبر Apple ، بما في ذلك تطوير مساعدها Siri وخدمة التعلم الآلي عند الطلب Core ML .

في سبتمبر 2018 ، أطلقت NVIDIA نظامًا أساسيًا مشتركًا للأجهزة والبرامج مصممًا ليتم تثبيته في مراكز البيانات التي يمكنها تسريع معدل تنفيذ نماذج التعلم الآلي المدربة على التعرف على الصوت والفيديو والصورة ، بالإضافة إلى الخدمات الأخرى المتعلقة بـ ML.

تستخدم منصة الاستدلال NVIDIA  TensorRT Hyperscale وحدات معالجة الرسومات NVIDIA Tesla T4 ، والتي توفر ما يصل إلى 40 ضعفًا من أداء وحدات المعالجة المركزية عند استخدام نماذج التعلم الآلي لعمل استنتاجات من البيانات ، ومنصة برامج TensorRT ، المصممة لتحسين أداء الشبكات العصبية المدربة .

ما مكتبات البرامج المتاحة لبدء التعلم الآلي؟

هناك مجموعة متنوعة من أطر البرامج لبدء التدريب وتشغيل نماذج التعلم الآلي ، عادةً للغات البرمجة Python و R و C ++ و Java و MATLAB ، مع Python و R الأكثر استخدامًا في هذا المجال.

تشمل الأمثلة الشهيرة TensorFlow من Google ومكتبة Keras مفتوحة المصدر ومكتبة Python scikit-Learn وإطار عمل التعلم العميق CAFFE ومكتبة التعلم الآلي Torch .

مقالات ذات صلة

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *

زر الذهاب إلى الأعلى