تعلم الآلة
تعلم اله
Machine learning -
تعلم الآلة
وائل حمدان
المقاربات المتبعة في تعلم الآلة
يمثل تعلم الآلة machine learning فرعاً من فروع الذكاء الصنعي artificial intelligence ويهتم بدراسة وتصميم أنظمةٍ يمكنها التعلم من المعطيات، أي أنظمة يمكنها تحسين أو تطوير ذاتها آلياً باستخدام معطيات التجارب.
من أجل حل مسألة معينة بوساطة الحاسوب يتم عادة تصميم خوارزمية للقيام بالمهمة اللازمة للحل؛ بيد أن العديد من المسائل التي تُصادف في الحياة العملية لا تُعرف كيفية تصميم الخوارزميات المطلوبة لحلها. إحدى هذه المسائل على سبيل المثال هي مسألة تحديد البريد الإلكتروني غير المرغوب فيه spam. إن هذه المسألة لها دخل محدد هو مجموعة من رسائل البريد الإلكتروني؛ وخرج محدد هو قيمة «نعم» في حال كان البريد غير مرغوب فيه أو «لا» في الحالة المعاكسة، وهي من المسائل التي يصعب تصميم خوارزمية محددة لحلها.
يجري التعويض عن هذا النقص في المعرفة اللازمة لتصميم الخوارزمية باستخدام معطيات تسمى معطيات التجارب، وذلك بالاستفادة من التطور الكبير في حجوم المعطيات ونوعيتها وظهور قواعد المعطيات الضخمة ومخازن المعطيات مما يوفر معرفة كبيرة يمكن الاستفادة منها، ومن ثم يمكن معالجة مئات آلاف رسائل البريد الإلكتروني التي يُعرف مسبَّقاً أن بعضها غير مرغوب فيه، والمطلوب هو «تعلم» الخصائص التي تميزه.
في الواقع هناك الكثير من الحالات التي يُطلب فيها من الحواسيب أن تقوم بحل المسائل من دون الحاجة إلى برمجتها صراحة، وهذه الحالات هي التي يهتم بدراستها علم تعلم الآلة.
عرّف أرثر صمويل Samuel Arthur في عام 1953 علم تعلم الآلة بأنه «العلم الذي يهدف إلى تمكين الحواسيب من القدرة على التعلم من دون الحاجة إلى برمجتها صراحة».
عرَّف توم ميتشيل Tom Mitchellسنة 1998 مسألة التعلم كما يلي: «نقول إن برنامجاً حاسوبياً يتعلم من معطيات تجربة E خلال مهمة T وبوجود مقياس أداء P؛ إذا تحسن أداؤه في المهمة T مُقيساً وفق المقياسP خلال التجربة E». ويلاحظ أن هذا التعريف يحدد ثلاثة عناصر لمسألة التعلم هي التجربة E والمهمة T والمقياس P.
بالعودة إلى مثال البريد الإلكتروني حيث يراقب برنامج بريد إلكتروني المستخدم وهو يقوم بفرز الرسائل بين رسائل عادية ورسائل غير مرغوب فيها، ومن ثم يقوم بتعلّم كيفية فلترة الرسائل آلياً؛ يتبين أن هذا المثال يتضمن العناصر التالية لمسألة التعلم التي وردت سابقاً:
1- المهمة: فرز الرسائل إلى عادية أو غير مرغوب فيها.
2- التجربة: مراقبة المستخدم وهو يقوم بعملية الفرز.
3- المقياس: عدد الرسائل التي جرى فرزها فرزاً صحيحاً أو نسبتها.
مفهوم التعميم generalization: يمكن من المثال السابق ملاحظة أن الفكرة الأساسية لتعلم الآلة هو التعميم المبني على تجارب سابقة، والتعميم في هذا السياق هو قدرة النظام على إنجاز المهمة إنجازاً صحيحاً عند استخدامه مع معطيات جديدة لم يتم التعامل معها سابقاً.
نظرية التعلم learning theory: تتناول هذه النظرية ثلاثة مفاهيم أساسية في عملية التعلم من معطيات التجارب:
1- السعة capacity
يختص هذا المفهوم بعدد النماذج التي يمكن تخزينها؛ وماهية التوابع والقرارات التي يمكن لنظام التعلم اتخاذها، كما يهتم بوجود الحل الصحيح ضمن مجموعة الحلول التي يمكن أن ينتجها فلا يمكن الحصول على الحل المثالي.
2- تعقيد معطيات التدريب complexity
يحدد عدد نماذج التدريب الضرورية لتدريب نظام التعلم بحيث يمكن ضمان نتائج عامة صحيحة؛ إذ إن مجموعة قليلة من معطيات التدريب يمكن أن تسبب ما يدعى التدريب المفرط over-fitting حيث يعمل النظام على نحو جيد على مجموعة من معطيات التدريب؛ ولكن يكون أداؤه ضعيفاً عند تطبيقه على معطيات الاختبار المستقلة التي لها توزيع معطيات التدريب ذاته.
3- التعقيد الزمني time complexity
يدل على الزمن اللازم لخوارزمية التعلم من أجل الوصول إلى الحل عن طريق الحسابات التي تجري على معطيات التدريب. لما كان معظم خوارزميات التعلم يتصف بتعقيدات زمنية حسابية كبيرة؛ لذا فإن تصميم خوارزمية تعلم فعّالة يعد أحد أهم الأبحاث الحالية ضمن هذا المجال.
يمكن تقسيم خوارزميات التعلم وفقاً لنمط الخرج المطلوب أو وفقاً لنمط الدخل المتوفر خلال عملية التدريب إلى:
1- التعلم الموجَّه supervised learning:
يتم تزويد الخوارزمية بالخرج الصحيح من أجل كل دخل، بحيث يتم فيما بعد وعن طريق التعميم إعطاء أقرب نتيجة لخرج صحيح معروف.
2- التعلم غير الموجَّه unsupervised learning:
ليس ثمة حاجة إلى تحديد الخرج الصحيح وربطه بدخل معين في عينات التدريب، والهدف هنا هو تحديد البنى structures أو اكتشافها في معطيات الدخل من خلال التشابه والاختلاف بينها؛ ومن ثمّ تحديد الترابط بين عينات المعطيات أو تصنيف هذه العينات ضمن فئات.
3- التعلم عن طريق التعزيز reinforcement learning:
يكون المتعلم هو متخذ قرار لتنفيذ مجموعة من الأعمال ضمن بيئة معينة، ويتلقى نتيجتها مكافأة (أو عقوبة) خلال سعيه إلى حل مسألة ما.
الفرق الأساسي بين التعلم عن طريق التعزيز والتعلم الموجَّه هو في الاستجابة للخطأ، ففي حالة التعلم الموجَّه يتم إخبار المتعلّم أو الخوارزمية بالاستجابة الصحيحة، أما في حالة التعلم عن طريق التعزيز فيتم الاكتفاء بإعلام الخوارزمية أن الاستجابة غير صحيحة؛ إضافة إلى درجة البعد عن الاستجابة الصحيحة (مقدار الخطأ).
المقاربات المتبعة في تعلم الآلة
هناك العديد من المقاربات approaches التي تتناول تعلم الآلة، وتندرج ضمن أحد أنواع الخوارزميات السابقة للتعلم؛ أي التعلم الموجّه أو التعلم غير الموجه أو التعلم عن طريق التعزيز، وأشهر هذه المقاربات ما يأتي:
1- الشبكات العصبونية neural networks: تستخدم في التعلم الموجّه وغير الموجّه.
2- تحليل الانحدار الخطي linear regression: يُستخدم في التعلم الموجّه.
3- شجرة القرارات decision tree: تستخدم في التعلم الموجّه.
4- تحليل العناقيد cluster analysis: تستخدم في التعلم غير الموجّه.
1- الشبكات العصبونية:
هي أحد أشكال الشبكات التي ينظر إلى عقدها كخلايا عصبية اصطناعية، وتمثل الخلية العصبية الاصطناعية نموذجاً حسابياً مستوحى من الخلايا العصبية الطبيعية.
تستقبل العصبونات الطبيعية إشارات من الوصلات العصبية المتوضعة على تشعبات الخلايا العصبية وأغشيتها، وعند تلقي إشارة معينة بحيث تكون قوتها أكبر من عتبة معينة يتم تفعيل الخلية العصبية التي تبعث إشارة عصبية ضمن المحور العصبي لتصل إلى وصلات عصبية أخرى تُفعِّل خلايا عصبية أخرى.
عند بناء شبكة عصبونية اصطناعية (الشكل1) يتم نمذجة هذا التعقيد الموجود في الخلايا العصبية الطبيعية، وذلك بمقابلة الوصلات العصبية بدخل الشبكة الذي يتم ضربه بالأوزان بين الروابط، وتقابل الأوزان قوة الإشارة الناتجة، وبعدها يتم إجراء حسابات رياضية بوساطة تابع لتفعيل العصبون، ويأخذ تابع رياضي آخر في الحسبان عتبة معينة لحساب الخرج الناتج من العصبون الصنعي.
الشكل (1) نموذج العصبون. |
إن أوزان الروابط بين العناصر -الخلايا العصبية الصنعية- مؤثر جداً في عملية تحديد الخرج الناتج من دخل معين؛ إذ إن الوزن السالب يسبب كبح الدخل القادم، لذا فإن عملية تحديد الأوزان وتغييرها عملية مهمة جداً، ولكن عندما توجد شبكة عصبية اصطناعية تحوي المئات أو الآلاف من الخلايا العصبية الصنعية تصبح هذه العملية عملية معقدة جداً أو مستحيلة في حال تحديدها يدوياً، ومن هنا ظهرت الحاجة إلى إيجاد خوارزميات تعدِّل قيم الأوزان باستمرار من أجل الحصول على النتيجة المرجوة، وهذا ما يسمى عملية ضبط الأوزان أو التدريب.
العصبون الصنعي (الشكل 2) هو أداة لها عدة مداخل وخرج وحيد، وله وضعان للعمل هما: وضع التدرب ووضع الاستخدام. في وضع التدرب يجري تدريب العصبون على إعطاء خرج معين من أجل نموذج مُدخل معين، وفي وضع الاستخدام يحدد الخرج المناسب في حال ورود نموذج جرى التدرب عليه سابقاً؛ وإلا يتم إجراء عمليات وفق قواعد محددة مسبَّقاً من أجل تحديد الخرج المناسب.
الشكل (2) نموذج بسيط للعصبون الصنعي. |
تتميز الشبكات العصبونية بقدرتها العالية على اشتقاق المعنى من المعطيات المعقدة أو غير الدقيقة، لذا يمكن أن تستخدم لاستخراج النماذج وتحديد الطرائق التي تكون معقدة بالنسبة إلى البشر وبالنسبة إلى الأنظمة التقنية الأخرى.
ويمكن أن تُعدّ الشبكة العصبونية المتدربة ضمن مجال معين خبيراً في تحليل المعطيات ضمن هذا المجال، ويمكن عندها أن تتم الاستفادة منها لإعطاء توقعات أو تقديرات لحالة جديدة.
بعض محاسن الشبكات العصبونية هي:
أ - التعلم التكيفي adaptive learning: هي القدرة على التعلم على كيفية تنفيذ المهام بالاعتماد على عينات من المعطيات يتم إدخالها في البداية بوصفها خبرة بدائية.
ب - التنظيم الذاتي self-organization: يمكن للشبكة العصبونية أن تنشئ أو تولد نمطاً لتنظيم المعطيات التي يتم استقبالها في فترة التعلم أو لتمثيلها.
ج - عمليات في الزمن الحقيقي real- time operation: يمكن أن تنفذ الشبكات العصبونية حسابات وعمليات على التوازي.
د - التسامحية مع الأخطاء fault tolerance: يمكن أن يقود التعطل الجزئي للشبكة إلى تخفيض الأداء من دون أن يؤدي إلى توقف العمل نهائياً.
2- النماذج الخطية للانحدار linear models of regression
يستخدم الانحدار في التعلم الموجّه لتدريب نموذج معين (يكون النموذج تابعاً خطياً في حالة الانحدار الخطي) على مجموعة من العيِّنات وذلك من أجل تحديد معاملات التابع، وبعد ذلك يجري اختبار النموذج على عيِّنات حقيقية.
يُعرّف الانحدار الخطي البسيط بأنه أسلوبٌ إحصائي يستخدم لإيجاد علاقة بين متحولين؛ يسمى المتحول الأول متحول الخرج (وهو مرتبط بمتحول آخر) ومتحول آخر (متحول مستقل أو مُفسِّر) وهو المتسبب في تغير متحول الخرج.
يتضمن تحليل الانحدار وجود عينة تدريب حجمها m مكونة من متحولات دخل ومتحولات خرج ، والهدف هو إيجاد العلاقة (التابع) التي تربط بين الدخل والخرج. إن تحليل الانحدار هو أكثر من عملية ملاءمة منحنى (أي اختيار المنحنى الأكثر ملاءمة لمجموعة نقاط بيانية معطاة)؛ فهو يتضمن ملاءمة تابع باستخدام مكونات حتمية وعشوائية، تسمى المكونات الحتمية الثوابت؛ أما المكونات العشوائية فتدعى الخطأ.
يكون التابع الذي يربط الدخل بالخرج في حالة الانحدار الخطي خطياً بالنسبة إلى المعامل، فعلى سبيل المثال: في الانحدار الخطي البسيط وفي حالة عيّنة مؤلفة من n نقطة بيانية وبوجود متحول؛ ووسيطين ؛ ومعامل خطأ تكون معادلة المستقيم (المعادلة 1):
توجد في حالة الانحدار الخطي المتعدد عدة متغيرات مستقلة، ومثال ذلك إضافة الحد إلى الانحدار الخطي السابق مما يعطي القطع المكافئ التالي (المعادلة 2) :
لكن على الرغم من ذلك يبقى الانحدار خطياً؛ لأن الخطية المقصودة هي الخطية بالنسبة إلى المعاملات وليس بالنسبة إلى المتحول .
3- التعلم بوساطة شجرة القرارات decision tree learning
شجرة القرارات هي نموذج هرمي يطبق مبدأ «فرّق تسد»، تُستخدم في التعلم الموجّه نموذجاً للتنبؤ. يتم تعريف العينة بوساطة الشجرة عن طريق تقسيم هذه العينة تكرارياً ومن أجل كل عقدة، كما تتألف شجرة القرار من عقد قرار داخلية وأوراق.
يمكن النظر إلى كل عقدة قرار داخلية على أنها تابع اختبار له خرج متقطع يتم تنويط تفرعات البيان بوساطته. يجري تطبيق الاختبار في حال دخل معين، وبنتيجة الاختبار (نعم أو لا) يتم الانتقال إلى الفرع الموافق. تبدأ الخوارزمية في الجذر وتتكرر حتى الوصول إلى ورقة، وتكون قيمة الخرج في تلك الحالة القيمةَ الموافقة للورقة.
يوضح الشكل (3) مثالاً عن معطيات تجربة وشجرة القرار الموافقة، تمثل الأشكال البيضوية عقد القرار وتمثل المستطيلات أوراق الشجرة، تقوم عقد القرار بتقسيم معطيات التجربة عند كل منها. في الجذر يتم اختبار أن ، في حالة تحقق الشرط (نعم) فإن قيم ستكون على يمين المستقيم ؛ وإلا فإنها تكون على يساره ويكون الخرج . إذا كانت قيم على يمين فيتم إجراء اختبار آخر وهو أن ، في حال تحقق الشرط يكون الخرج هو المنطقة ؛ وإلا يكون الخرج هو المنطقة .
الشكل (3) معطيات تجربة موافقة لشجرة قرار. |
4- تحليل العناقيد
العنقدة clustering هي عملية وضع المعطيات في تجمعات متشابهة، وهي أحد فروع التنقيب عن المعطيات. تقسّم خوارزمية تجميع المعطيات إلى عدة تجمعات؛ إذ إن التشابه بين النقاط ضمن تجمع معين أكبر من التشابه بين نقطتين ضمن تجمعين مختلفين، وتعدّ فكرة تجميع المعطيات بسيطة في طبيعتها وقريبة جداً إلى طريقة تفكير الإنسان؛ إذ إن التعامل مع كمية كبيرة من المعطيات يسبب الميل إلى تلخيصها ضمن عدد قليل من المجموعات أو الفئات، وذلك من أجل تسهيل عمليه التحليل.
تُستعمل خوارزميات التجميع على نطاق واسع لتنظيم المعطيات وتصنيفها؛ وكذلك لضغطها وبناء نموذج ترتيبها؛ إذ إنه إذا كان بالإمكان إيجاد تجمعات من المعطيات فإنه بالإمكان بناء نموذج للمشكلة على أساسها.
هناك العديد من الخوارزميات المستخدمة في عملية تجميع المعطيات، أشهرها الخوارزمية k-means clustering :
- خوارزمية العنقدة باستخدام K متوسط K-means clustering:
تستخدم هذه الخوارزمية لتجميع المعطيات اعتماداً على خصائصها في K مجموعة، وتتم عملية التجميع من خلال تقليل المسافات بين المعطيات ومركز العنقود (المجموعة) cluster centroid، ويبين الشكل (4) هذه الخوارزمية في حالة مع تحديد مراكز المجموعات:
الشكل (4) تطبيق خوارزمية العنقدة باستخدام K متوسط. |
أمثلة وتطبيقات
إن أحد النجاحات الأساسية لعلم تعلم الآلة هو وجود العديد من التطبيقات العملية المؤثرة، يُذكر منها:
1- تعرف الصوت: هناك العديد من الأنظمة التي تتعرف الصوت والتي تستخدم علم تعلم الآلة بطريقة أو بأخرى من أجل تدريب النظام على تعرفه. تتضمن معظم أنظمة تعرف الصوت التجارية مرحلتين: الأولى هي مرحلة التدريب قبل بيع النظام، وفيها يتم تدريب النظام تدريباً عاماً ومستقلاً عن المستثمر، ويتم في الثانية التدريب من قبل مستثمر النظام بعد شرائه وذلك لتحسين جودة تعرف الصوت، ويوضح الشكل (5) نموذجاً عاماً لتعرف الصوت.
الشكل (5) نموذج تعرف الصوت. |
2- الرؤية الحاسوبية: تتنوع أنظمة الرؤية الحاسوبية من تعرّف الوجوه إلى تعرف خط اليد، والتطبيق الأكثر للرؤية الحاسوبية والذي تم تدريبه باستخدام خوارزميات تعلم الآلة هو خدمة البريد في الولايات المتحدة الأميريكية؛ التي تعتمد على فرز عناوين البريد آلياً بالاعتماد على العنوان المكتوب بخط اليد.
3- التحكم بالإنسالات (الروبوتات): تم استخدام خوارزميات تعلم الآلة بنجاح في الكثير من أنظمة التحكم بالروبوت، على سبيل المثال برهن عدد من الباحثين على جدوى استخدام هذه الخوارزميات في الطيران المستقر للطائرة المروحية- وذلك من خلال منافسة أمريكية لقيادة المركبات آلياً يجري تمويلها من قبل وكالة مشاريع البحوث الدفاعية المتطورة Defense Advanced Research Projects Agency (DARPA)- التي تتطلب قيام الروبوتات بعملية القيادة الآلية لأكثر من 10 أميال في الصحراء، وقد كان الروبوت الرابح هو روبوت يستخدم خوارزميات تعلم الآلة.
قدّم علم تعلم الآلة الكثير حتى الآن؛ من السيارات ذاتية القيادة إلى أنظمة تعرف الصوت والصورة إلى محركات البحث الفعالة، لكن ما تزال هناك العديد من الأسئلة البحثية المفتوحة، منها ما يأتي:
1- هل بالإمكان تصميم أنظمة تستمر بالتعلم إلى اللانهاية؟ إن عملية التدريب على معطيات تجريبية في معظم أنظمة تعلم الآلة تعمل على معطيات محددة ولفترة زمنية محددة أيضاً، ومن ثم يتم الانتقال من التدريب إلى عملية اختبار النظام على معطيات جديدة. على خلاف ذلك فإن التعلم عند الإنسان هو عملية مستمرة تؤدي إلى تعلم الكثير من المهارات والقدرات، إضافة إلى كيفية جعلها تتضافر لتحقيق أكبر قدر ممكن من الاستفادة.
2- هل يمكن لنظريات تعلم الآلة وخوارزمياتها المساعدة على تفسير كيفية التعلم عند الإنسان؟ إن نظريات تعلم الآلة وخوارزمياتها أثبتت جدواها في محاولة فهم الجوانب المختلفة للتعلم عند الإنسان، فعلى سبيل المثال لاحظ الباحثون وجود تشابه بين آليات التعلم بطريقة التعزيز والتعلم عند الحيوانات في حالة وجود المكافأة والعقوبة. من ناحية أخرى ما تزال نظرية التعلم عند الإنسان تتضمن أموراً عديدة مثل التحفيز والخوف والحالات المستعجلة والنسيان، وهذه الأمور غير موجودة حتى الآن في تعلم الآلة.
3- هل يمكن تصميم لغات برمجة تحوي أساسيات تعلم الآلة؟ أي هل يمكن تصميم جيلٍ جديد من لغات برمجة تدعم مباشرة كتابة برامج تستطيع أن تتعلم؟ الحالة المرجوة من هذا الجيل من لغات البرمجة هو أن تستطيع كتابة جزء من البرنامج بلغات البرمجة المعروفة وإدراج أخرى تحت فئة إجرائية «يجب أن يتم تعلمها»؛ مع إمكان تحديد دخل الإجرائية وخرجها واختيار خوارزمية التعلم من بين مجموعة من الخوارزميات المعروفة.
مراجع للاستزادة: - M. Mohri, A. Rostamizadeh, A. Talwalkar, Foundations of Machine Learning, The MIT Press, 2012. - K. P. Murphy, Probabilistic Machine Learning: An Introduction (Adaptive Computation and Machine Learning series), The MIT Press, 2022. - H. Lu, K. N. Plataniotis, A. N. Venetsanopoulos, A Survey of Multilinear Subspace Learning for Tensor Data .Pattern Recognition, 2011. - J. Starmer, The StatQuest Illustrated Guide To Machine Learning, StatQuest Publications, 2022.
|
- التصنيف : كهرباء وحاسوب - النوع : كهرباء وحاسوب - المجلد : المجلد التاسع مشاركة :