الارتباط
ارتباط
Correlation - Corrélation
هاني عماشة
تطبيق الارتباط في تحليل الإشارات المستمرة
تطبيق الارتباط على تحليل الإشارات المتقطعة
الارتباط correlation قياس إحصائي للعلاقة بين متغيرين variables. ويدل -في الإحصاء- على مدى الارتباط (أو التشابه أو الاعتماد الخطي) بين متغيرين بمقياس تراوح تدريجاته بين القيمتين (-1.0) و (+1.0(
يتطلب العديد من التطبيقات في معالجة الإشارة اكتشاف وجود تشابه بين إشارتين من عدمه. وتُقارن عادةً الإشارة المدروسة بإشارة مرجعية. ففي الرادار والسونار sonar، على سبيل المثال، تُستقبل نسخة متأخرة زمنياً عن الإشارة المرسلة بعد اصطدامها بالهدف وارتدادها عنه. ويُستخدم هذا التأخير الزمني في تحديد بُعد الهدف ومكانه ونوعه. ويعدّ اتخاذ مثل هذا القرار تحدياً كبيراً نتيجة التشوه distortion والضجيج ذي الطبيعة العشوائية random المحمّل على الإشارة المرتدة.
يفيد الارتباط أيضاً في معرفة الحجوم المميزة لنماذج الصور في تطبيقات تعرف النماذج pattern recognition، وضغط الصور image compression، والتحليل المتعدد المَيْز multi-resolution analysis.
إذا كان التتابعان أو الإشارتان أو المتغيران متباينين، يُطلق على الارتباط اسم الارتباط المتبادل (المتقاطع) cross-correlation. أما في التطبيقات التي يُراد فيها حساب الارتباط بين الإشارة ونفسها فيسمى الارتباط في هذه الحالة بالارتباط الذاتي auto-correlation.
يتطلب تطبيق الارتباط على إشارات أو تتابعات أو متغيرات طويلة جداً تقنيات تنفيذ أكثر فاعلية. لذا طُور الارتباط الحلقي (الدائري) circular correlation، والذي يُنفذ على تتابعين أو إشارتين من طول واحد، فإن لم تكونا كذلك فيعمل على تبطين (حشو) أقصرهما بالأصفار zero padding لتصبحا من الطول نفسه.
تطبيق الارتباط في تحليل الإشارات المستمرة
يعطى (تابع) الارتباط المتبادل بين إشارتين مستمرتين بالعلاقة (1).
أما (تابع) الارتباط الذاتي فيُعطى بالعلاقة (2).
يبين الشكل (1) مثالاً على حساب الارتباط؛ وفيه يبيّن الشكل (1-آ) نبضتين متعاقبتين -بفاصل زمني قدره µs10 ء(10ميكرو ثانية) تقريباً- مرتدتين عن هدف صغير يبعد نحو 158 متراً، من أجل نسبة استطاعة إشارة إلى استطاعة ضجيج sigal-to-noise ratio (SNR) نحو 25. أما الشكل (1-ب) فيبين الارتباط المتبادل بين النبضتين، حيث تمثل النقطة A قمة الارتباط، في حين تمثل النقطة B مطال الارتباط عند تأخير زمني قدره صفـر، وتمثل النقطة C القمة اللاحقة.
الشكل (1): مثال على حساب الارتباط. (1-أ) النبضتان المرتدتان مع ضجيج، (1-ب) الارتباط المتبادل بينهما. |
تطبيق الارتباط على تحليل الإشارات المتقطعة
بفرض تتابعي إشارتين متقطعتين discrete، يُعرف تتابع الارتباط correlation sequence بالعلاقة (3).
ويرمز فيها الدليل ℓ إلى التأخير (زمن التأخير بين التتابعين أو الانزياح بينهما). ويُقال إن التتابع y[n]y مزاح عن التتابع المرجع x[n]y بعدد عينات ℓ نحو اليمين أو نحو اليسار. يُعد x[n]y تتابعاً مرجعياً لكون x وردت أولاً في التسمية rxy[l]r ويكون
.
ويمكن كتابة علاقة الارتباط الذاتي للتتابع بالشكل المبين بالعلاقة (4).
وتكون قيمة الارتباط عند الصفر مساوية لطاقة التتابع x[n]x كما هو مبين بالعلاقة (5).
آ- خصائص الارتباط المتبادل والارتباط الذاتي
بفرض تتابعي إشارتين لهما طاقة محدودة. يعبّر الحدان: و عن طاقة كل تتابع. يحقق الارتباط المتبادل الشرط المبين بالعلاقة (6).
كما يحقق الارتباط الذاتي الشرط المبين بالعلاقة (7).
أي إن قيم عينات تتابع الارتباط الذاتي تكون أعظمية في حال الانزياح الصفري.
ب- الشكل الموزون (المنسوب) normalized للارتباط
يُقارن عادة الارتباط المتبادل بالذاتي ويُظهران على مقياس موحد. إذ تُقسم القيم الناتجة على القيمة الذروة (أكبر قيمة للارتباط)، ويُرمز للصيغة الجديدة وارتباطها بالصيغة التقليدية المبينة بالعلاقة (8):
وينجم عن ذلك أن وأن .
جـ- حساب الارتباط لإشارات استطاعة دورية
بفرض تتابعي إشارتيّ استطاعة power يُعطى تابعا الارتباط المتبادل والذاتي في هذه الحالة بالعلاقتين (9) و (10) على الترتيب.
وإذا كان التتابعان و دوريين ودورهما N يُعطى الارتباط المتبادل والذاتي بالعلاقتين (11) و(12) على الترتيب.
ويُلاحظ أن الارتباط في هذه الحالة دوري أيضاً ودوره N. ويُعتمد على خاصية دورية الارتباط الذاتي في تحديد الدور N لإشارة دورية مشوهة نتيجة تشويش عشوائي متراكب مع الإشارة.
يُستخدم الارتباط في مجالات عديدة مثل معالجة الإشارة المتكيّفة adaptive signal processing، وعلى وجه الخصوص في المرشحات المتكيّفة؛ إذ تُستخدم طريقة متوسط المربعات الصغرى least mean squares (LMS) للحصول على تقارب convergence للحل. ويتطلب ضمان تقارب سريع في البداية حجمَ خطوة كبيراً step size، ويمكن بعدها إنقاص حجم الخطوة، وتُسمى الخوارزمية في هذه الحالة بنمط الاسترخاء sleep mode. يسمى التغير في حجم الخطوة مع الزمن بطريقة ارتباط متوسط المربعات الصغرى correlation LMS method.
كما يُستخدم الارتباط في تقدير تتابع من آخر بشكل أمثلي optimal estimator، أو عزل إشارة ما signal separator، أو حذف أجزاء من تتابع X مترابط مع Y (حاذف ارتباط) correlation canceller. وكذلك في المرشحات مثل مرشح كالمان Kalman filtering، وفي تسوية قناة الاتصال channel equalization، وفي التنبؤ الخطي linear predictor، إضافةً إلى حذف الأصداء أو الضجيج، وتطبيقات حذف الفصوص الجانبية side lobes في انتشار الأمواج الناجم عن الهوائيات، وفصل الإشارات العالية التردد عن تلك المنخفضة التردد.
بفرض وجود متغيرين يعبّران عن قياسات في مسألة فيزيائية، أو يخصان قياسات في مواضيع اجتماعية سكانية؛ يدل الارتباط بين هذين المتغيرين على شدة التشابه بينهما. والارتباط بين مجموعتين من الأرقام (أي متغيرين) لا يعني تساويهما. فعلى سبيل المثال؛ بفرض مجموعتي أرقام و يكون ارتباطهما مثالياً ، مع أن كل قيمة في المجموعة y تزيد بنحو عشرين وحدة تقريباً على القيمة الموافقة لها في x .
ويُقال عن متغيرين إن لهما ارتباطاً متبادلاً مثالياً، إذا انعكست زيادة بمقدار واحدة في أحدهما زيادةً (أو نقصاناً) بمقدار ثابت على المتغير الآخر. وتتجلى أهمية الفرق بين تطابق المتغيرات وارتباطها بوضوح في أمثلة الوراثة وتأثير البيئة في نمو الأطفال وأهاليهم. حيث يكون ارتباط (تشابه) طول الأطفال مثلاً مع أهاليهم قوياً، في حين يمكن لجيل الأطفال كله أن يكون أطول من أهاليه نتيجة ظروف صحية أو اجتماعية ما. ويمكن ضرب كل قيم أحد المتغيرين أو قسمة هذه القيم أو الإضافة إليها أو الطرح منها من دون أن يتغير الارتباط.
تُعطى معادلة حساب الارتباط في هذه الحالة (والتي تسمى أحياناً بمعامل ارتباط بيرسون Pearson’s correlation coefficient) بالعلاقة (13).
وفيها يمثل n عدد العناصر في المتغير أو عدد القيم في القياس، أما x فيمثل قيم عناصر المتغير الأول و y قيم عناصر المتغير الثاني.
يمكن أحياناً من أجل مجموعة عناصر المتغيريّن نفسها كتابة معادلة معامل الارتباط بالشكل المبين بالعلاقة (14).
أي إنه بالإمكان حساب معامل الارتباط من التشتت المتلازم covariance مقسوماً على جداء الانحرافين المعياريين standard deviation للمتغيرين. تسمح المعادلة (14) بجعل متغيرات الحساب مقياسية (من دون واحدات)، بفضل القسمة على الانحرافات المعيارية، ومن ثمَّ لا يتأثر الناتج بتغيرات واحدات القياس لكل من x و y. حتى لو لم تكن العلاقة بين المتغيرين خطية أحياناً، بل هي لا خطية اعتيادية، فإنه بالإمكان توقع أحد المتغيرين تماماً من المتغير الآخر.
وفيما يأتي مثال توضيحي على حساب الارتباط. بفرض x= {60, 61, 62, 63, 65} و y={3.1, 3.6, 3.8, 4, 4.1} يمكن الحصول على الجدول (1).
الجدول (1) مثال توضيحي على حساب الارتباط بين مجموعتين من القيم. | ||||||||||||||||||||||||||||||||||||||||||
|
وبتعويض هذه القيم في العلاقة (13) يمكن الحصول على معامل ارتباط قدره ( ρ = +0.9119) .
تدل هذه النتيجة على ارتباط أو تشابه قوي بين مجموعتي الأرقام المعطاة في المثال. وتختلف أهمية مدلول قيمة الارتباط تبعاً لموضوع هذه الأرقام. ففي حالة مسح اجتماعي تدل القيم القريبة من الواحد على أهمية كبيرة للنتائج، أما إذا كانت هذه الأرقام مقتطفات من تجارب كيميائية أو فيزيائية أو حيوية دقيقة فإن مثل هذه القيمة للارتباط ليس لها مدلول مهم.
يعتمد تقييم الشأن الإحصائي في هذه الحالات على حجم عينة الأرقام، فكلما كانت العينة كبيرة كلما كان لمعامل الارتباط شأنٌ وأهمية أكبر. وعندما يكون عدد القياسات أقل من اثني عشر قياساً (أقل من 12 رقماً) يجب على معامل الارتباط أن تبلغ قيمته الواحد (1) ليكون ذا شأن إحصائي.
الجدول (2) مجالات تصنيف قيم الارتباط. |
||||||||||
|
وقد اصطُلح على تقسيم القيم إلى مجالات شبه عامة، والمبينة بالجدول (2).
ويأخذ معامل الارتباط القيم بين (1-) و (1+)، حيث تشير القيم (- 1, + 1) إلى ارتباط مثالي تام. وعندما يكون معامل الارتباط موجباً فإن هذا يدل على تلازم موجب بين المتغيرين، أي إن تزايد قيم أحد المتغيرين يتبعه زيادة في قيم المتغير الآخر. أما المعامل السالب فيدل على أن أي تزايد في قيم أحد المتغيرات يتبعه نقصان في قيم المتغير الآخر. أما عندما تكون قيمة المعامل صفراً فإنها تدل على عدم الارتباط بين المتغيرين على الإطلاق. تجعل مقياسية معامل الارتباط منه مؤشراً أفضل من المخططات والأشكال المختلفة لإظهار مدى الارتباط بين متغيرين.
إن لمربع معامل الارتباط أهمية كبيرة في تحليل الانحدار (الانكفاء) الخطي linear regression. حيث تمثل هذه القيمة الجزء (الكسر أو النسبة) من تبدلات أحد المتغيرات التي يمكن تفسيرها أو عزوها أو ربطها بالمتغير الآخر. فعلى سبيل المثال؛ إذا وجد ارتباطٌ قدره (0.8) بين متغيرين كالطول والوزن فإن استخدام نموذج الانحدار الخطي لتفسير أي متغير منهما بدلالة الآخر سيدل على أنه مسؤول عن 64 % من التبدلات في البيانات، أي إن هذا النموذج يتنبأ ويربط حدوث 64 % من قيم المتغيرين بعضها ببعض. ويتعلق معامل الارتباط مباشرة بخط الانحدار الذي تُعطى معادلته بالخط المستقيم الرابط بين متغيرين وبحيث تتحقق العلاقة (15).
وبفرض، (على سبيل المثال) مجموعة البيانات « تلفزيونات، وأطباء، وطول العمر» تشمل من ضمن بيانات أخرى عدد الأشخاص لكل تلفزيون أو عدد الأشخاص لكل طبيب في أربعين بلداً. وبما أن المتغيريّن المذكورين أعلاه يعكسان مستوى الثراء في كل بلد؛ فمن المعقول افتراض وجود ارتباط موجب بينهما. وبعد إزالة 8 دول يوجد نقص في بعض بياناتها فإن الدول الاثنتين والثلاثين المتبقية تملك معامل ارتباط يبلغ 0.852 بين عدد الأشخاص لكل تلفزيون وعدد الأشخاص لكل طبيب. إن قيمة تدل على أن 72.6 % من التغيرات (التبدلات) في أحد المتغيرين يمكن تفسيره أو نسبه أو عزوه للآخر.
وبما أن خط الانحدار المبني من المربعات الصغرى يمر خلال القيم الوسطية لـ (x, y) فإنه يمكن تحديد خط الانحدار بوساطة المتوسطات والانحرافات المعيارية، وارتباط المتغيرين قيد الدراسة. تهدف معادلة الارتباط الذاتي إلى تقييم الاعتماد التسلسلي للبيانات المتتابعة زمنياً. وبأبسط شكل من أشكال تحليل الارتباط الذاتي فإنه يتم ارتباط كل قياس بالقيمة التي تليه مباشرة في تتابع البيانات، وهذا يدعى بالارتباط ذي التأخير الواحدي Lag-1 correlation، لتمييزه من الارتباط ذي التأخير الثنائي Lag-2 الذي يتم فيه ارتباط كل قيمة بتلك التي تليها بخطوتين، وهكذا دواليك.
مراجع للاستزادة: - R. M. Gray & L. E. Davisson, Statistical Signal Processing, Cambridge University Press, 2004. - S. Haykin, Communications Systems, John Wiley & Sons, 2009. - S. J. Orfanidis, Optimum Signal Processing, Rutgers University Press, 2007. - R. J. Schilling & S. L. Harris, Introduction to Digital Signal Processing Using MATLAB, Cengage, 2011. |
- المجلد : المجلد الأول - رقم الصفحة ضمن المجلد : 495 مشاركة :