10 تیر 1405
در عصر صنعتی اول و دوم، رباتها ابزارهای “سخت” (Hard Automation) بودند. آنها در سلولهای تولیدی که هر چیزی از جمله شدت نور، دمای محیط و موقعیت قطعات ثابت بود، فعالیت میکردند. اما با ورود به
عصر اینترنت اشیا (IoT) و رباتهای خدماتی، محیطهای کاری از کنترلشده به غیرقابل پیشبینی (Unpredictable) تغییر یافتند.
یک ربات کلاسیک که برای حمل یک قطعه ۱۰ کیلوگرمی طراحی شده، اگر ناگهان با قطعهای ۱۵ کیلوگرمی مواجه شود، دچار خطای موقعیت، لرزش یا حتی شکست فیزیکی میشود. رباتیک تطبیقی (Adaptive
Robotics) پاسخ مهندسی به این چالش است. این حوزه به دنبال ساخت سیستمهایی است که بتوانند “خود را با شرایط جدید وفق دهند” بدون اینکه نیاز به برنامهنویسی مجدد توسط انسان داشته باشند.
M(q)q¨+C(q,q˙)q˙+g(q)+f(q˙)+τd=τM(q)\ddot{q} + C(q, \dot{q})\dot{q} + g(q) + f(\dot{q}) + \tau_d = \tau
که در آن:
چالش اصلی: در دنیای واقعی، پارامترهای MM، CC و gg ثابت نیستند. تغییر وزن ابزار، سایش لولاهای مفصل یا تغییرات اصطکاک، باعث میشود مدل ریاضی اولیه ربات با واقعیت فاصله بگیرد. رباتیک تطبیقی بر
اساس این اصل عمل میکند که این پارامترها را به صورت آنلاین (On-line) تخمین بزند.
در این روش، طراح فرض میکند که پارامترها تغییر میکنند، اما سعی نمیکند آنها را یاد بگیرد. در عوض، یک کنترلکننده بسیار “سخت” طراحی میکند که بتواند در برابر یک بازه مشخص از خطا (مثلاً خطای ۱۰ درصدی
در وزن) پایداری خود را حفظ کند. این روش ایمن است اما معمولاً باعث میشود عملکرد ربات “کند” یا “بیش از حد سخت” (Over-conservative) باشد.
در اینجا هدف، یادگیری است. سیستم با مشاهده اختلاف بین “آنچه انتظار دارد اتفاق بیفتد” و “آنچه واقعاً اتفاق میافتد”، پارامترهای مدل خود را اصلاح میکند. این کار از طریق قوانین تطبیق (Adaptation Laws)
انجام میشود که معمولاً بر پایه نظریه پایداری لیاپونوف (Lyapunov Stability Theory) طراحی میگردند تا تضمین کنند که خطای سیستم با گذشت زمان به صفر میل میکند.
در این استراتژی، یک “مدل ایدهآل” (Reference Model) داریم که نشان میدهد ربات در شرایط عالی چگونه باید رفتار کند. کنترلکننده دائماً خروجی ربات واقعی را با خروجی مدل ایدهآل مقایسه میکند. اگر تفاوتی وجود
داشت، پارامترهای کنترلکننده را تغییر میدهد تا رفتار ربات به رفتار مدل ایدهآل نزدیک شود. این روش در رباتهای پرسرعت که دقت موقعیت حیاتی است، کاربرد دارد.
در روش STR، سیستم ابتدا یک مرحله “شناسایی پارامتر” (Parameter Identification) دارد. یعنی در هر لحظه، از دادههای حسگرها استفاده میکند تا بفهمد مثلاً جرم جسم حمل شده چقدر است. سپس، بر اساس این
جرم جدید، پارامترهای کنترلکننده را بازطراحی میکند. این روش برای سیستمهایی که محیط آنها به طور کامل و ناگهانی تغییر میکند (مانند زیردریاییها یا رباتهای فضایی) مناسبتر است.
در حالی که روشهای کلاسیک (مثل MRAC) بر پایه معادلات دیفرانسیل هستند، یادگیری تقویتشده بر پایه “تجربه و پاداش” است است. یک ربات با استفاده از الگوریتمهایی مانند PPO (Proximal Policy
Optimization) یا SAC (Soft Actor-Critic)، میلیونها بار در محیطهای شبیهسازی شده حرکت میکند تا یاد بگیرد چه گشتاوری برای رسیدن به هدف نیاز دارد.
در بسیاری از سیستمهای پیشرفته، از شبکههای عصبی برای تخمین بخشهای ناشناخته دینامیک (مانند اصطکاک پیچیده یا نیروهای باد) استفاده میشود. شبکه عصبی به عنوان یک “تخمینگر هوشمند” عمل میکند که خطای مدل
ریاضی را پوشش میدهد.
در دههی اخیر، رویکرد “Model-Free Adaptive Control” (کنترل تطبیقی بدون مدل) به دلیل قدرت شبکههای عصبی عمیق، انقلابی در رباتیک ایجاد کرده است.
در بخش سوم گفتیم که مدل ریاضی ربات شامل پارامترهای ناشناخته است. در روشهای مدرن، ما از Universal Approximation Theorem استفاده میکنیم. این تئوری بیان میکند که یک شبکه عصبی با
ساختار مناسب، میتواند هر تابع پیوستهای را (هر چقدر هم پیچیده) تقریب بزند.
M(q)q¨+C(q,q˙)q˙+g(q)+f^(q,q˙,θ)=τM(q)\ddot{q} + C(q, \dot{q})\dot{q} + g(q) + \hat{f}(q, \dot{q}, \theta) = \tau
در اینجا، f^(q,q˙,θ)\hat{f}(q, \dot{q}, \theta) یک شبکه عصبی است که با وزنهای θ\theta تعریف میشود. هدف از کنترل تطبیقی در اینجا، دیگر فقط تنظیم یک عدد (مثل جرم)
نیست، بلکه بهروزرسانی وزنهای شبکه عصبی در حین حرکت است تا شبکه بتواند “درک” خود از اصطکاک و گرانش را بهبود ببخشد.
اگر در بخش قبل درباره RL صحبت کردیم، اکنون باید به معماریهای آن در رباتیک بپردازیم. بزرگترین چالش در DRL برای رباتیک، شکاف میان “شبیهسازی” و “واقعیت” (Sim-to-Real Gap) است.
یک مقاله تخصصی بدون بحث درباره پایداری (Stability)، فاقد اعتبار مهندسی است. در رباتیک تطبیقی، ما نمیتوانیم فقط “امیدوار” باشیم که ربات با یادگیری، بهتر شود؛ ما باید ثابت کنیم که ربات منفجر نمیشود!
V(e,θ~)=12eTKe+12θ~TΓ−1θ~V(e, \tilde{\theta}) = \frac{1}{2} e^T K e + \frac{1}{2} \tilde{\theta}^T \Gamma^{-1} \tilde{\theta}
که در آن:
برای اینکه سیستم پایدار باشد، مشتق این تابع نسبت به زمان (V˙\dot{V}) باید منفی معین (Negative Definite) باشد (V˙<0\dot{V} < 0).
مهندسی معکوس: در طراحی کنترلکنندههای تطبیقی، ما ابتدا V˙\dot{V} را محاسبه میکنیم و سپس قانون تطبیق (Adaptation Law) را به گونهای طراحی میکنیم که تضمین کند V˙\dot{V} همیشه
منفی باقی میماند. این کار باعث میشود که حتی اگر ربات با یک شوک یا تغییر وزن ناگهانی مواجه شود، سیستم به جای از کنترل خارج شدن، به سمت نقطه تعادل بازگردد.
یکی از جذابترین و دشوارترین حوزههای رباتیک تطبیقی، رباتهای چهارپا (مانند Spot شرکت Boston Dynamics) یا رباتهای انساننما است.
وقتی پای یک ربات از زمین بلند میشود و دوباره با زمین برخورد میکند، یک ضربه (Impact) ناگهانی وارد سیستم میشود که در مدلهای ریاضی ساده، به عنوان یک “تکینگی” یا اختلال شدید دیده میشود.
رباتهای تطبیقی در این لحظه از دو استراتژی استفاده میکنند:
| ویژگی | کنترل کلاسیک (PID) | کنترل مقاوم (Robust) | کنترل تطبیقی (Adaptive) | یادگیری ماشین (RL/AI) |
|---|---|---|---|---|
| نیاز به مدل ریاضی | کم | متوسط | بالا | بسیار کم (Model-free) |
| توانایی یادگیری | ندارد | ندارد | دارد (پارامترها) | دارد (رفتار و سیاست) |
| تضمین پایداری | آسان | بسیار بالا | دشوار (نیاز به لیاپونوف) | بسیار دشوار (Black-box) |
| هزینه محاسباتی | بسیار پایین | پایین | متوسط | بسیار بالا |
| مناسب برای… | محیطهای ثابت | محیطهای با نویز معلوم | محیطهای با پارامتر متغیر | محیطهای کاملاً ناشناخته |
ما به سمتی میرویم که رباتها تنها “تطبیقپذیر فیزیکی” (Physical Adaptation) نخواهند بود، بلکه “تطبیقپذیر شناختی” (Cognitive Adaptation) خواهند داشت.
در آینده، یک ربات تطبیقی نه تنها وزن یک شیء را درک میکند، بلکه قصد (Intent) انسان را نیز درک خواهد کرد. اگر یک ربات در حال کمک به یک فرد مسن است و فرد دچار لرزش دست میشود، ربات با استفاده
از الگوریتمهای تطبیقی، لرزش را از حرکت اصلی تفکیک کرده و با اعمال یک فیلتر تطبیقی، حرکت نرمی را برای بیمار بازسازی میکند.
با استفاده از فرم «با پیام ذخیره شده موافقید»، میتوانید همین حالا مستقیماً با ما تماس بگیرید.