تعرف الأشكال
تعرف اشكال
Pattern recogntion -
تعرّف الأشكال
شادي البيطار
يعد تعرّف البيئة المحيطة من أبسط مهام الإنسان، ولكن محاولة تنفيذ هذه المهمة تلقائياً معقدة للغاية. يقدم مجال تعرّف الأشكال (النمطية) pattern recognition حلولاً لعدة مسائل كتعرّف الكلام، وتعرّف الوجوه، وتعرّف النصوص المكتوبة بخط اليد (تعرّف الخطوط)، والتنقيب في المعطيات، وتحليل الصور، والاستشعار من بعد، ونظم المعلومات الجغرافية، والتشخيص الطبي، وغيرها الكثير. يكمن التشابه بين كل هذه التطبيقات في إيجاد الحل، إذ إنه مهما اختلفت الطريقة المتبعة فثمة حاجة إلى استخراج السمات features ومن ثم تحليلها بهدف تعرّفها أو تصنيفها. تقسم عملية تعرّف الأشكال إلى ثلاث مراحل أساسية. المرحلة الأولى هي تحصيل المعطيات data acquisition، وفيها يجري تحويل المعطيات من شكل ما (الكلام والحروف والصور وغيرها) إلى شكل آخر بحيث تتوافق مع نظام المعالجة ليتعامل معها لاحقاً. يجري تحصيل المعطيات عموماً باستخدام الحساسات والمرقمنات digitizer والماسحات الضوئية scanner. الخطوة الثانية هي تحليل المعطيات data analysis، وتظهر عملية التعلم الخاصة بالمعطيات، حيث تجمع المعلومات المرتبطة بالأحداث المختلفة وبصفوف الأشكال classes المتاحة ضمن المعطيات لتستثمر في المرحلة اللاحقة. أما الخطوة الثالثة فهي التصنيف classification، ويهدف إلى البحث في قواعد المعطيات عن الصف الموافق للمعلومات الناتجة من عملية التحليل.
تقسم مجموعة المعطيات في نظام تعرّف الأشكال إلى مجموعتين: مجموعة التدريب training set ومجموعة الاختبار testing set. يتم تعليم النظام بالاستعانة بمجموعة التدريب، في حين يجري اختبار أداء النظام من خلال مجموعة الاختبار. يمكن تصنيف تقنيات تعرّف الأشكال في ستة محاور أساسية، هي: التقنيات الإحصـائية، والتقنيـات البنيوية، ومطابقة النمـوذج، والشـبكات العصبونية، والنموذج الترجيحي، والنمـاذج الهجينة.
تصنف تقنيات تعرّف الأشكال تبعاً للنموذج المعتمد في تحليل المعطيات وتصنيفها. يمكن أن تعتمد التقنيات على نموذج مستقل أو على عدة نماذج في آن واحد، وفيما يلي أهم التقنيات المعتمدة في هذا المجال.
1-التقنيات الإحصائية statistical techniques:
يُوصّف الشكل بدلائل أو سمات يتم اختيارها بحيث يُضمن عدم تقاطع توصيف جميع الأشكال في فضاء السـمات. تحترم هذه التقنيـات الطبيعة الإحصـائية للمعطيات وطريقة تمثيلها في فضاء السمات، حيث تعتمد على تحليل توزع الكثافة الاحتمالية للشكل المراد تعرّفه بين مختلف الصفوف، كما توضع قواعد لاتخاذ القرار. تخضع الأشكال عموماً لعمليات معالجة أولية بهدف استخدامها في تدريب نظام التعرّف لاختيار السمات المناسبة، حيث يستعان بمجموعة أشكال لاختبار أهلية السمات في عملية التعرّف من خلال قياس قيمها التي تحدد درجة مساهمتها في عملية تصنيف المعطيات، وهكذا يقوم النظام بالتعلم والتكيِّف مع الأشكال الجديدة بالنسبة إليه كما هو مبين في الشكل (1). تقدم هذه التقنيات نتائج جيدة في حال وجود تمايز واضح في صفوف الأشكال في فضاء السمات.
الشكل (1) خطوات تعرّف الأشكال. |
يمكن توصيف إجرائية التصنيف بمتحولات رياضية إذا كان التوزع الشرطي للكثافة الاحتمالية محدداً، وإلا فثمة حاجة إلى البحث عن طرائق أخرى لتوصيف هذه الإجرائية. بالمقابل تستخدم مقاربات عدة لاتخاذ القرار فيما يخص عملية التصنيف، مثل قاعدة بايز في اتخاذ القرار Bayes decision rule، أو قاعدة بايز الأمثلية في اتخاذ القرار optimal Bayes decision rule، أو قاعدة التشابه الأعظمي maximum likelihood rule، أو قاعدة نيمان-بيرسون Neyman-Pearson rule.
ولما كان فضاء السمات مقسّماً بالتعريف فلن يتأثر بالضجيج، وهذا ما يجعل هذه التقنيات أكثر موا مة للتعامل مع الأشكال التي تخضع للضجيج.
من أشهر التقنيات الإحصائية تقنية تحليل المركبة الأساسية Principal Component Analysis (PCA)، وتقنية التحليل الخطي المتمايز Linear Discriminant Analysis (LDA). وتهدف الطريقتان كلتاهما إلى خفض أبعاد الفضاء الذي تمثل فيه السمات. في الطريقة الأولى تُحسب الأشعة الذاتية لفضاء أشكال مجموعة التدريب، وتُعتمد الأشعة الذاتية ذات المطالات الأعظمية لكونها مولدة للفضاء، وتُهمل باقي الأشعة، ويتحدد شعاع السمات لكل شكل من خلال إسقاط شعاع المعطيات الخاص به في الفضاء المعرّف بالأشعة الذاتية. وبالتالي تكون أبعاد شعاع السمات المحدد موافقة لعدد الأشعة الذاتية المعتمدة. تقوم عملية التعرّف على فحص التشابه بين مساقط الشكل وأشعة السمات لتحديد الصف الموافق له. أما طريقة التحليل الخطي المتمايز فتختلف عن الطريقة السابقة بأنها لا تتعامل مع فضاء المعطيات كتلة واحدة، وإنما تقوم بتصنيف أشكال التدريب قبل تحليلها بهدف تعريف فضاء متمايز للصفوف الناتجة، تكون فيه المسافات بين الصفوف المختلفة أعظمية، وبين عناصر الصف الواحد أصغرية. وتعدّ هذه الطريقة أكثر كفاءة من سابقتها من حيث الدقة وزمن الحساب، ويبين الشكل (2) مثالاً عن تطبيق هذه التقنية على مجموعة معطيات موزعة على صفين.
الشكل (2) تطبيق تقنية التحليل الخطي المتمايز على مجموعة معطيات موزعة على صفين. |
2- التقنيات البنيوية structural techniques:
مع أن التقنيات الإحصائية جيدة الأداء فإنها لا تراعي حالة المعطيات التي تكون فيها للأشكال مميزات بنيوية محددة، وتختفي عند الاسـتعانة بالطرق الإحصـائية في توصيف السـمات، وبالتالي من المفيد للتعامل مع الأشكال المعقدة اعتماد نظام تعرّف هرمي يعدّ الشكل مؤلفاً من عدة أشكال جزئية وقد تكون مؤلفة من أشكال جزئية أيضاً. توصف البنية الهرمية بمجموعة قواعد تحدد علاقة الشكل كله بأشكاله الجزئية، حيث يزداد تعقيد هذه القواعد بازدياد تعقيد أشكال المعطيات أو في وجود ضجيج أو تشوه في عملية تحصيل المعطيات. يتم الاستعانة بخوارزميات البحث الآلي في المعطيات لإنجاز عملية التعرّف. وتستخدم هذه التقنيات بوجه عام في تحليل الأشكال والحواف في الصور.
3- مطابقة القالب النمطي template matching:
تعد هذه التقنية من أسهل التقنيات المستخدمة في تعرّف الأشكال، إذ تجري مقارنة التشابه بين عينات الشكل المطلوب تعرّفه وعينات النماذج المخزنة في النظام مع مراعاة التعديلات التي يمكن أن تطرأ على الشكل من دوران أو تغيير المقياس. ويتم الاعتماد على تابع الترابط في عملية التعرّف حيث تعتمد كفاءة أدا هذه التقنيات أساساً على نماذج التدريب المخزنة في النظام، ولكن لا يمكن الاستعانة بها في معالجة الأشكال التي من الممكن أن تخضع لتشوهات.
4- التقنيات المعتمدة على الشبكات العصبونية techniques based on neural networks:
الشبكات العصبونية هي هياكل متوازية وواسعة جداً وتكون العصبونات neurons هي الوحدات الأساسية فيها. تتميز الشبكات العصبونية بإمكان تعديل التثقيل الخاص بالعصبونات بشكل عَوْدي recursion، كما تتميز بقدرتها على التعلم، وهذا ما يعطي نتائج فعالة في مجال التصنيف، ويميز هذه التقنيات من باقي تقنيات التعرّف. ثمة أنواع مختلفة من الشبكات العصبونية المستخدمة في مجال التعرّف تبعاً لمتطلبات التطبيق. تعتمد دقة هذه التقنيات اعتماداً أساسياً على حجم المعطيات، كما يمكن تحسين الأداء بزيادة عدد الطبقات المخفية وزيادة عدد العصبونات فيها بهدف تمثيل المسألة تمثيلاً مناسباً، وبالمقابل يفضل ألا يكون عدد العصبونات كبيراً جداً ليمكن تعميم generalization معطيات التدريب.
5- النماذج الترجيحية (العائمة) fuzzy models:
تأتي أهمية النماذج الترجيحية في مجال تعرّف الأشكال من مقدرتها على تعريف نماذج الارتيابات التي لا يمكن تمثيلها بشكل مفهوم باستخدام نظرية الاحتمالات، بحكم أن معظم التصنيفات في الواقع هي ترجيحية بطبيعتها. وتستخدم التقنيات النحوية عندما تتعلق عملية البحث بالشكل القواعدي للغة، في حين يستعان بتقنيات اللغة الدلالية لتوليد المجموعات الترجيحية من المعطيات في مرحلة التدريب، وتتم عملية التعرّف من خلال قياس ترجيحي للتشابه بين التوصيف الترجيحي للشكل مع الأشكال المرجعية.
6- النماذج الهجينة hybrid models:
من الواضح من خلال التطبيقات الحالية لموضوعات تعرّف الأشكال أن اعتماد نموذج واحد في التصنيف لا يعطي الكفاءة المطلوبة؛ لذلك من المفيد الاعتماد على نماذج هجينة من خلال الدمج بين عدة نماذج لتحقيق أفضل أداء. تتعلق المشاكل الخاصة بالتقنيات المعتمدة على نموذج واحد في تعريف السمات، وهذا يتطلب معرفة المعطيات معرفةً مسبّقة وعميقة لتحقق أفضل أداء. فمثلاً يمكن الجمع بين النماذج الإحصائية والبنيوية لحل مشاكل هجينة، حيث يعتمدعلى التقنيات الإحصائية في إيجاد أجزاء الشكل، ومن ثم تقوم التقنيات البنيوية بعملية تعرّف هذه الأجزاء وتعرف الشكل كله بالاعتماد على قواعد معرفة مسبقاً. كما يمكن الاستعانة بعدة توابع تصنيف في آن معاً لتحسين أداء النظام والاقتراب من التصرف الأمثلي حيث يعتمد القرار النهائي في التصنيف على دمج نتائج التوابع وفق قواعد يتدرج تعقيدها من قاعدة بسيطة مبنية على أساس التصويت إلى توابع معقدة تحدد متحولاتها في أثناء عملية التدريب.
تستخدم تقنية تعرّف الوجوه في كثير من مجالات الحياة، وتعتمدها شـركات كبيرة في منتجـاتها مثل مايكروسوفت وسوني وغوغل. ويُعتمد عليها أيضاً في أنظمة الأمان والمراقبة ومكافحة الجريمة.
أول من استعان بالحواسيب في تعرّف الوجوه البشرية في عام 1960 فريق يرأسه بلدسو Bledsoe في مشروع بحثي من تمويل وزارة الدفاع الأمريكية ووكالة الاستخبارات المركزية، وهذا هو السبب في قلة المنشورات حول هذا العمل. وتوصل بلدسو في عام 1966 إلى تصميم نظام نصف آلي لتعرّف الوجوه، بحيث ينتقي المستخدم السمات التي سيعتمدها النظام في التعرّف. من أهم النتائج التي ترتبت على أعمال بلدسو توصيفه لمعظم المشاكل التي ما تزال تعترض عمليات تعرّف الوجوه حتى اليوم، مثل تغيرات الإضاءة ودورة الرأس والتعابير المختلفة للوجه وعوامل الشيخوخة.
جرى أول مرة تطوير نظام مؤتمت لتعرّف الوجوه في عام 1973 من قبل كينيد Kanade، اعتمد فيه خوارزمية لاستخراج ست عشرة سمة مميزة في الوجه يستند إليها في مرحلة التعرّف. واقترحت لاحقاً تقنيات كثيرة لتحسين الأساليب في قياس السمات وتطوير تقنية مطابقة النموذج المتبعة سابقاً في هذا المجال بتعريف نماذج قابلة للتشوه، والاستعانة بمميزات ثابتة في الوجه (الشكل 3)، كما جرت الاستعانة بتقنيات تعتمد على الشبكات العصبونية وعلى حساب الأشعة الذاتية لفضاء المعطيات، وهو النهج الذي ساد في السنوات اللاحقة. من أشهر التقنيات المستخدمة حالياً في هذا المجال خوارزمية تحليل المكون الرئيسي Principal Component Analysis (PCA) وخوارزمية تحليل التمييز الخطي Linear Discriminant Analysis (LDA) اللتان تنتميان إلى محور التقنيات الإحصائية. وفيما يلي أهم الخطوات الرئيسية لخوارزمية PCA التي تشترك في معظمها مع خوارزمية LDA.
الشكل (3) بعض المميزات الثابتة في الوجه والتي تستخدم في الكشف وتعرّف الوجه. |
من المعروف أن الصور تمثل على الحاسوب بمصفوفات ذات أبعاد توافق أبعاد الصورة. وبفرض أن مجموعة التدريب تضم P صورة لشخص محدد، كل منها بأبعاد MxN، تبدأ عملية المعالجة بتحويل هذه الصور إلى أشعة معطيات (concatenation) يرمز لها بـطول كل منها k=MxN، حيث يتم وضع سطور كل مصفوفة بعضها إلى جانب بعض لتشكيل شعاع المعطيات. بعد ذلك تعرف المصفوفة A المشكلة من أشعة المعطيات المتجاورة، وتكون أبعادها بالتاليk x p، ومن ثم تحسب مصفوفة التباين المشترك covariance، التي تحدد درجة الترابط بين أشعة المعطيات، ويرمز إليها بـ CA. تعطى مصفوفة التباين المشترك بالعلاقة: CA=AAT، وتكون أبعادها بالتالي kxk.
تهدف الخوارزمية إلى إيجاد مجموعة أشعة السمات المميزة لهذا الصف حيث وبحيث يكون ، أي محاولة تخفيض فضاء المعطيات من خلال تمثيلها بأشعة تحوي أهم السمات المميزة لهذه المجموعة. ويلزم نظرياً حساب القيم والأشعة الذاتية للمصفوفة CA، أي حل المسألة المعرفة بالعلاقة (1):
|
حيث تمثل مصفوفة الأشعة الذاتية، في حين أن المصفوفة هي مصفوفة قطرية تحوي القيم الذاتية الموافقة للأشعة الذاتية على قطرها.
ونظراً لتعقيد حساب هذه المصفوفة يستعان بنظريات الجبر الخطي وتحليل القيم المفردة (الشاذة) singular value decomposition للمصفوفة CA، أي إيجاد المصفوفات المحققة للمعادلة (2):
|
حيث يكون عندها . ترتب الأشعة الذاتية بحسب القيم الذاتية المتناقصة لكون التشتت يتناقص أسيّاً، بحيث يمكن القول إن 90% من التشتت الكلي محتوى في أول 5% إلى 10% من أبعاد الفضاء. يحافظ بالتالي على الأشعة الذاتية الموافقة للقيم الذاتية العظمى وتحسب مساقط مجموعة التدريب في هذا الفضاء التي تكون مجموعة أشعة السمات المميزة لهذا الصف. يتحدد لاحقاً انتماء عنصر إلى صف ما من خلال قياس المسافة الإقليدية لمساقطه عن مساقط مجموعة التدريب في الفضاء المعتمد لكل صف، ويتحقق المطلوب بخطأ مقبول.
من التطبيقات المهمة جداً في مجال تعرّف الأشكال تعرّف الحروف ضوئياً Optical character Recognition (OCR) الذي أصبح جزءاً لا يتجزأ من الماسحات الضوئية الخاصة بالوثائق، ودرج اسـتخدامه في التطبيقات المصرفية والبريدية.
كذلك يعد تعرّف الكلام آليّا مهماً جداً في التفاعل مع الأنظمة التجارية، كالمجيب الآلي عن الاستفسارات حول الرحلات الجوية، وعن الخدمات الهاتفية والمصرفية. يهتم العاملون في مجال الرؤية الصنعية بموضوع تعرّف الأجسام، وله تطبيقات مهمة في مجال الإنسالات (الروبوتات) ذاتية الحركة والتي تحتاج إلى تعرّف الوسط الذي تعمل فيه وإعادة بنائه بالشكل ثلاثي الأبعاد، لتطبيقات تبدأ من الصناعة إلى الخدمات المنزلية ومهمات الإنقاذ. وإلى جانب تعرّف الوجوه يستعان كذلك في نظم تحديد الهوية الشخصية بتعرّف بصمات الأصابع وقزحية العين، وتعرّف التوقيع الشخصي للتطبيقات الأمنية المهمة في المطارات، وأجهزة الصراف الآلي والفنادق، إضافة إلى حماية الحواسيب الشخصية.
للتعرّف تطبيقات مهمة أيضاً في مجال الاستشعار من بعد وتحليل صور الأقمار الصناعية من أجل رسم الخرائط، والتفتيش الزراعي، والكشف عن المعادن ودراسة التلوث، كما أن العديد من اختبارات التشخيص الطبي تعتمد على أنظمة تعرّف الأشكال من إحصاء خلايا الدم وتعرّف أنسجة الخلايا والكشف عن الأورام في صور الرنين المغنطيسي وفحص العظام والمفاصل في صور الأشعة السينية.
يعد تعرّف الأشكال أحد الجوانب الأساسية في معظم المهام التي يحتاج فيها الإنسان إلى اتخاذ قرار، وهذا يعطي أهمية كبيرة لهذا المحور في مجال الذكاء الصنعي والتعلم الآلي نظراً لتطبيقاته الواسعة. ثمة عدة مقاربات لتنفيذ خوارزميات تعرّف الأشكال، تختلف فيما بينها بطريقة تعاطيها مع المعطيات، في حين تتشابه في الخطوات العريضة. يتأثر أداء نظام تعرّف الأشكال بثلاثة عوامل أساسية، هي: حجم المعطيات، والتقنية المعتمدة إضافة إلى مصمم النظام ومستخدمه. يبقى التحدي الأساسي في مجال تعرّف الأشكال في تطوير أنظمة قادرة على التعامل مع أكبر قدر ممكن من المعطيات ودراسة تكامل خوارزميات التصنيف بهدف الاقتراب من الحل الأمثلي.
مراجع للاستزادة: - C. M. Bishop, Pattern Recognition and Machine Learning (Information Science and Statistics), Springer, 2016. - P. Fieguth, An Introduction to Pattern Recognition and Machine Learning, Springer, 2022. - W. Gibson et al., Pattern Recognition, Audible Studios, 2017. - I. Marqués, Face Recognition Algorithms, 2010. |
- التصنيف : كهرباء وحاسوب - النوع : كهرباء وحاسوب - المجلد : المجلد التاسع مشاركة :