التحكم العشوائي
تحكم عشوايي
Random control -
شهاب غيا
التحكم العشوائي stochastic control هو فرع من نظرية التحكم التي تتعامل مع عدم الدقة في قياسات متحولات الحالة، أو مع ضجيج يؤثر في تطور المنظومة أو النظام أو الإجرائية.
يؤثر الضجيج العشوائي random noise في تطور ومراقبة متغيرات الحالة. ويهدف التحكم العشوائي إلى تصميم المسار الزمني للحالات المتغيرة المتحكم بها، والذي يُنتج التحكم المرغوب فيه بالتكلفة الدنيا المعرّفة مع وجود الضجيج. يمكن أن يكون النموذج الرياضي للمنظومة متقطعاً زمنياً ممثلاً بمعادلة فروق، أو تماثلياً ممثلاً بمعادلة تفاضلية.
تعتمد دراسة التحكم العشوائي على معرفة جيدة بنظرية التحكم والإشارات العشوائية والعمليات العشوائية random processes التي تُعرَّف بأنها جمعٌ من المتحولات العشوائيةrandom variables معرّفة في فضاء احتمالي probability space عام.
تختلف صياغة مسائل التحكم العشوائي وأدوات حلها كثيراً عن تلك للمنظومات غير العشوائية، وتعد مسألة التحكم الخطية-التربيعية-الغوصية Linear Quadratic Gaussian (LQG) من أهم مسائل التحكم التي تتعامل مع منظومات خطية غير محددة، وتتأثر بضجيج غوصي أبيض white gaussian noise، والمعلومات عن الحالات غير كاملة، وتتبع تحكّماً يُفترض أن يحقق تابع كلفة تربيعياً quadratic cost function. فضلاً عن ذلك يكون الحل وحيداً، ويحتوي على قانون تحكم ديناميكي خطي بتغذية خلفية (عكسية) يمكن حسابه وتنفيذه بسهولة. وأخيراً فإن التحكم الخطي-التربيعي-الغوصي أساسي أيضاً في التحكم الأمثل للمنظومات اللاخطية غير المحددة.
تتكون منظومة التحكم الخطي-التربيعي-الغوصي من مرشِّح كالمن Kalman filter، وهو مخمِّن خطي linear estimator تربيعي، مع منظّم خطي تربيعي. يضمن مبدأ الفصل بينهما تصميم المنظم والمخمن وحساب كلٍ منهما حساباً مستقلاً. إن تطبيق التحكم الخطي-التربيعي-الغوصي على المنظومات الخطية بمحددات ثابتة مع الزمن معروف جيداً، أما تطبيقه على المنظومات الخطية بمحددات متغيرة مع الزمن فيمكّن من تصميم منظومات تحكم خطية ذات تغذية خلفية للمنظومات غير الخطية والتي يوجد فيها ارتياب رياضي أو ملوثة بالضجيج. يعبّر عن النموذج الرياضي للمنظومة الخطية الديناميكية الملوثة بالضجيج بالمعادلتين (1):
حيث يمثل شعاع متحولات الحالة للمنظومة، و شعاع مدخل التحكم، و شعاع المخارج المقيسة لأجل التغذية الخلفية. ويؤثر كلٌ من الضجيج الأبيض الغوصي المضاف وضجيج القياس الغوصي الأبيض المضاف في المنظومة. يهدف التحكم العشوائي إلى إيجاد الدخل المعتمد على القياسات السابقة بحيث يتم جعل تابع الكلفة والمُعرَّف بالمعادلة (2) أصغرياً:
حيث القيمة المتوقعة expected value. أما فهو الزمن النهائي (الأفق) الذي قد يكون محدوداً أو لانهائياً. إذا كان هذا الأفق يتجه نحو اللانهاية يصبح الحد الأول من تابع التكلفة مهملاً وغير متعلق بالمسألة؛ لأن الهدف هو قياس/تخمين شعاع الحالة والخرج اعتماداً على قياس معطيات لُوّثَت بالضجيج. وما يُعرف بالمرشح الأمثل optimal filtering يشير إلى تخمين شعاع الحالة في الزمن الحقيقي اعتماداً على جميع القياسات السابقة، أما التنبؤ prediction فيُقصد به تخمين قيمة الحالة المستقبلية، وهما مترابطان جداً.
إن المتحكم التربيعي الغوصي Quadratic Gaussian (QG) محدَّد بالمعادلات (3):
تدعى المصفوفة ربحية كالمن Kalman gain في مرشح كالمن الممثلة بالمعادلة (1). يولِّد هذا المرشّح في كل لحظة زمنية تخمينات للحالات باستخدام مداخيل القياسات السابقة. ويُحسب ربح كالمن K من المصفوفات E وC، ومصفوفات الشدة V وW المرافقة لإشارات الضجيج البيضاء و، وأخيراً القيمة المتوقعة لمربع الحالات. هذه المصفوفات الخمس تحدد ربح كالمن من خلال معادلة ريكاتي Riccati التفاضلية المعطاة بالمعادلة (4):
بعد إيجاد الحل P يحسب ربح كالمن من العلاقة (5):
أما مصفوفة التغذية الخلفية L فهي تحدد من المصفوفات E, F, R, B, باستخدام معادلة ريكاتي التفاضلية المعطاة بالمعادلة (6):
وبعد إيجاد الحل S يُحسب ربح التغذية العكسية L من العلاقة (7):
يُلاحظ التشابه بين معادلتي ريكاتي التفاضليتين، إلا أن المعادلة (4) تجري للأمام مع الزمن، على حين تجري المعادلة (6) بعكس الزمن. هذا التشابه يدعى الثنائية. إن معادلة ريكاتي المصفوفية التفاضلية تحل مسألة التخمين التربيعية الخطية Linear Quadratic Expectate (LQE). أما المعادلة (6) فتحل مسألة المنظم التربيعي الخطي Linear Quadratic Regulator (LQR). هاتان المسألتان ثنائيتان، وتحلان معاً مسألة التحكم الغوصي-التربيعي-الخطي LQG. وهكذا تنفصل مسألة LQG إلى المسألتين LQE و LQR حيث يمكن حلهما بشكل منفصل؛ لذلك يمكن وصف مسألة LQG بأنها قابلة للفصل. وعندما لا تعتمد المصفوفات (R, Q, C, B, E)، ومصفوفات الضجيج (W, V) على الزمن عندما ينتهي الى اللانهاية فإن المتحكم LQG يصبح ذا ثوابت غير متغيرة مع الزمن. وفي تلك الحالة يمكن تبديل بكلتا معادلتي ريكاتي التفاضليتين معادلتي ريكاتي الجبريتين.
تُجرى في كل فترة زمنية مراقبات جديدة، حيث تُستخدم الطريقة المثلى لضبط حالات التحكم. وإيجاد الحل الأمثل لمتغيرات حالات التحكم الحالية قد يتضمن الحل المتكرر التراجعي لمعادلة مصفوفات من نوع ريكاتي من الفترة السابقة حتى الحالية.
يمكن إيجاد معادلة ريكاتي للحساب المتكرر التراجعي في حالة الزمن المتقطع مع وجود الارتياب في قيم الثوابت في مصفوفة العبور أو في مصفوفة استجابة التحكم في معادلة الحالات، حتى لو كان التكافؤ المؤكد غير محقق. كما يمكن معالجة حالة الزمن المتقطع لتابع تكلفة غير تربيعي بل ذي اضطرابات مضافة على الرغم من وجود المزيد من التطبيقات. بما أن مسألة تحكم LQG لمنظومات الزمن المتقطع مشابهة لمنظومات الزمن المتواصل؛ لذلك سيركز التوصيف أدناه على المعادلات الرياضية.
تعطى معادلات المنظومة الخطية ذات الزمن المتقطع بالعلاقتين (8):
هنا i يمثل الزمن المتقطع، أما و فيمثلان الضجيج الأبيض الغوصي الذي له مصفوفات تباين مشترك و بالترتيب. وفي هذه الحالة يكون تابع التكلفة من النوع المتقطع أيضاً. فيعطى تابع التكلفة التربيعي المراد جعله أصغرياً لغاية تصغير خطأ القياس بالمعادلة (9):
وتصبح معادلات المتحكم LQG معطاة بالمعادلة (10):
أما معادلة ربح كالمن فتعطى بالمعادلة (11):
حيث إن P تحدد بمعادلة ريكاتي المصفوفية للفروق التي تجري للأمام مع الزمن:
كما تحسب مصفوفة التغذية الخلفية L من العلاقة (13):
حيث تحسب S من معادلة ريكاتي المصفوفية الفرقية التي تجري بعكس الزمن وفق العلاقة (14):
إذا كانت كل المصفوفات السابقة ذات مكونات ثابتة ومحددة فإن متحكم LQG ذا الزمن المتقطع يصبح ذا محددات غير متغيرة مع الزمن. ويمكن عندئذٍ تبديل بمعادلات ريكاتي المصفوفية للفروق معادلات ريكاتي الجبرية الفرقية. وهذه المعادلات تحدد المخمن التربيعي- الخطي ذا المحددات الثابتة، وكذلك المنظم التربيعي-الخطي ذا المحددات الثابتة في الزمن المتقطع.
مراجع للاستزادة: - D.C. Hyland, D.S Bernstein, The optimal projection equations for fixed-order dynamic compensation, IEEE Transaction on Automatic Control, 1984. - Q. Liu, Z. Wang, X. He,Stochastic Control and Filtering over Constrained Communication Networks, Springer International Publishing(2019) - J. L. Stein, Stochastic Optimal Control and the US Financial Crisis, Springer-Science, 2012. - W. D. Mitchell, Tractable risk sensitive control based on approximate expected utility, Economic Modelling, April 1990. - L.G. Van Willigenburg, W.L. De Koning, Optimal reduced-order compensators for time-varying discrete-time systems with deterministic and white parameters, Automatica 1999. |
- التصنيف : تقانات الفضاء والفلك - النوع : تقانات الفضاء والفلك - المجلد : المجلد السادس مشاركة :