فصل چهارم
جمعبندی و نتیجه گیری
۴-۱ مقدمه
هدف اصلی سیستم تحمل خطا، بهبود اتکاپذیری سیستم است. لذا در کلیه سیستمها در نظر گرفتن بحث اتکاپذیری ضروری است. در این فصل ابتدا مفاهیم اتکاپذیری به همراه نحوه محاسبه اتکاپذیری شرح داده میشوند که این مطالب برگرفته از منبع [۸۵] میباشند. در نهایت قابلیت اطمینان گرههای Body Node، Master Node و Mobile Node محاسبه و مقایسه می شود. همچنین قابلیت اطمینان برای معماری سه لایهای ارائه شده، مورد ارزیابی وتحلیل قرار میگیرد.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
۴-۲ تعاریف پایه
در بخشهای آتی λ،µ و C که بترتیب نمادهای نرخ خرابی، نرخ تعمیر و پوشش خطا هستند، به دفعات مورد استفاده قرار میگیرند. لذا در ادامه به شرح این موارد پرداخته می شود.
نرخ خرابی یا λ، تعداد خرابیها را در هر واحد زمان پیش بینی می کند. به عنوان مثال اگر خرابیهای یک پردازنده به صورت میانگین هر هزار ساعت یکبار باشد، آنگاه .
یک تخمین خام از نرخ خرابی سیستم می تواند بوسیله جمع نرخ خرابی مؤلفه ها(λiها) به صورت زیر، انجام گیرد. لازم به ذکر است که n تعداد مؤلفه های سیستم است.
رابطه (۴-۱):
شایان ذکر است که در طرف مقابل نرخ خرابی نرخ تعمیر وجود دارد. نرخ تعمیر که توسط µ مشخص می شود به تعداد تعمیرها در واحد زمان اشاره دارد.
پوشش خطا را که با C نشان می دهند، یعنی احتمال اینکه با وجود خطا، فعالیتهای مورد انتظار سیستم انجام شوند؛ بگونهای که سیستم با شکست مواجه نشود. در ادامه چند پوشش خطا معرفی می شود.
پوشش کشف خطا: (وجود خطا | کشف خطا)C=P
پوشش مکان یابی خطا: (وجود خطا | مکان یابی خطا)C=P
پوشش محدودسازی خطا: (وجود خطا | محدودسازی خطا)C=P
پوشش ریکاوری خطا: (وجود خطا | ریکاوری خطا)C=P
۴-۳ اتکاپذیری
اتکاپذیری یعنی مقدار توانایی یک سیستم در فراهم کردن سرویسهایی که قابلیت اطمینان قابل قبول دارند.
اتکاپذیری شامل ویژگیهایی از قبیل قابلیت اطمینان، دسترسپذیری، ایمنی، قابلیت نگهداری و آزمونپذیری، میباشد. از بین این ویژگیها قابلیت اطمینان، دسترسپذیری و ایمنی مهم میباشند. با توجه به کاربرد، یکی یا بیشتر از این ویژگیها برای ارزیابی رفتار سیستم مناسب است. به طور مثال برای یک سیستم ATM[72]، قابلیت دسترسپذیری و برای یک سیستم کنترل نیروگاه اتمی، ایمنی مهم است؛ این در حالیست که برای معماری سه لایهای ارائه شده قابلیت اطمینان حائز اهمیت میباشد.
قابلیت اطمینان[۷۳]: قابلیت اطمینان را با R(t) نمایش می دهند. یعنی احتمال شرطی اینکه سیستم در بازهی زمانی [۰,t] بدون نقص و خطا کار کند به شرط اینکه سیستم در زمان «۰» بصورت صحیح در حال کار بوده باشد. در واقع، قابلیت اطمینان یک معیار برای تحویل پیوستهی سرویس به صورت صحیح میباشد. شایان ذکر است که اگر سیستمی بخواهد بدون هیچگونه وقفهای در حال انجام عملیات باشد، نیاز به قابلیت اطمینان بالا دارد.
دسترسپذیری[۷۴]: در برخی کاربردها تعداد خرابیها و زمان مورد نیاز برای تعمیر خرابیها مهم است. در چنین کاربردهایی دسترسپذیری اهمیت فراوانی دارد. دسترسپذیری را که با A(t) نشان می دهند، یعنی احتمال اینکه در زمان t، سیستم در حال انجام عملیات به صورت صحیح باشد. به بیانی A(T) میانگین دسترسپذیری در بازهی[۰,T]است که بازه فوق می تواند طول عمر سیستم یا زمان اتمام یک کار خاص باشد.
رابطه (۴-۲):
ایمنی[۷۵]: در بحث ایمنی شکستها به دو دستهی شکستهای ایمن و شکستهای غیر ایمن تقسیم میشوند. شکستهای ایمن یعنی با وقوع شکست اتفاق ناگواری رخ ندهد. این در حالیست که در شکست غیر ایمن، اتفاق ناگواری رخ میدهد، برای مثال فاجعه نیروگاه اتمی چرنوبیل[۷۶] نمونه ای از این نوع شکست است. ایمنی را که با S(t) نشان می دهند یعنی احتمال اینکه سیستم یا بصورت صحیح کار کند یا در حالتهای شکست ایمن[۷۷]، سیستم ادامه انجام عملیات خود را قطع کند.
۴-۴ محاسبهی اتکاپذیری با بهره گرفتن از بلوک دیاگرامهای قابلیت اطمینان
به منظور محاسبهی اتکاپذیری میتوان از دو روش بلوک دیاگرامهای قابلیت اطمینان و فرایندهای مارکف استفاده کرد. در ادامه معماری سه لایهای ارائه شده با بهره گرفتن از بلوک دیاگرامهای قابلیت اطمینان مورد ارزیابی قرار میگیرد؛ از اینرو در ادامه به شرح کامل این روش پرداخته می شود. این درحالیست که روش فرایندهای مارکف بصورت مختصر در بخش افزونگی standby شرح داده می شود.
محاسبه قابلیت اطمینان: محاسبه با این روش نیازمند این است که سیستم به دو قسمت سری و موازی تقسیم شود. بعد قابلیت های اطمینان قسمت های فوق که همان Rها هستند، محاسبه شوند. سرانجام، جواب کلی از قابلیت های اطمینان بخشها، تشکیل می شود. برای یک سیستم با n مؤلفه، که Ri(t) قابلیت اطمینان مؤلفهی iام است، قابلیت اطمینان سیستم به صورت زیر محاسبه می شود.
رابطه (۴-۳):
برای یک ساختار سری
برای یک ساختار موازی
برای یک سیستم در حالت سری، باید همه مؤلفه های سیستم در حال اجرا و عملیاتی باشند تا سیستم بتواند بصورت صحیح کار کند از اینرو .
اما برای یک سیستم در حالت موازی، فقط یکی از مؤلفه ها نیاز دارد که عملیاتی باشد. بنابراین عدم قابلیت اطمینان[۷۸] یک سیستم موازی برابر است با احتمال اینکه همه n مؤلفه خراب شوند، یعنی و در نتیجه قابلیت اطمینان از رابطه بدست می آید.
محاسبهی دسترسپذیری: اگر فرض شود که زمانهای خرابی و تعمیر مستقل از یکدیگر هستند، آنگاه میتوان به منظور محاسبهی دسترسپذیری سیستم از بلوک دیاگرامهای قابلیت اطمینان استفاده کرد. این وضعیت زمانی رخ میدهد که سیستم به اندازه کافی منابع افزونه به منظور تعمیر همزمان همه مؤلفه های معیوب دارد.
برای یک سیستم با n مؤلفه که Ai(t) دسترسپذیری مؤلفهی iام است، دسترسپذیری کلی سیستم بصورت زیر است.
رابطه (۴-۴):
برای یک ساختار سری
برای یک ساختار موازی
برای یک سیستم در حالت سری، باید همه مؤلفه های سیستم در حال اجرا و عملیاتی باشند تا سیستم بتواند بصورت صحیح کار کند از اینرو .
اما برای یک سیستم در حالت موازی، فقط یکی از مؤلفه ها نیاز دارد که عملیاتی باشد. در نتیجه دسترسپذیری از رابطه بدست می آید.
۴-۵ افزونگی TMR
روشهای افزونگی غیرفعال از قبیل TMR و NMR بجای کشف خطا، آنها را میپوشانند بگونهای که با وجود خطا، مقادیر صحیحی در خروجی پدیدار می شود.
ارزیابی قابلیت اطمینان: یک سیستم TMR تا زمانی بصورت صحیح کار می کند که حداقل دو ماژول از سه ماژول آن بصورت صحیح کار کنند. با فرض اینکه رأی دهنده بیعیب باشد، قابلیت اطمینان یک سیستم TMR به شرح زیر است.
رابطه (۴-۵): RTMR= R1R2R3 + (۱-R1)R2R3 + R1(1-R2)R3 + R1R2(1-R3)
R1R2R3 یعنی احتمال اینکه هر سه ماژول بیعیب باشند و به صورت صحیح کار کنند.(۱-R1)R2R3 یعنی احتمال اینکه اولین ماژول خراب و دو ماژول دیگر سالم باشند.R1(1-R2)R3 یعنی احتمال اینکه ماژول دوم خراب و ماژولهای اول و سوم سالم باشند. R1R2(1-R3) یعنی احتمال اینکه ماژولهای اول و دوم بیعیب و ماژول سوم خراب باشد. اگر R1=R2=R3=R باشد، آنگاه معادله بالا به معادله RTMR= 3R2 – ۲R3تبدیل می شود. از آنجا که نرخ خرابی مؤلفه ها در ارزیابی قابلیت اطمینان حائز اهمیت است، میتوان Rها را بر اساس λ و t نوشت. یعنی اگر λ نرخ خرابی ثابت و t زمان باشد، آنگاه R(t)=e-λt میباشد. در نتیجه فرمول بالا را میتوان بصورت زیر نوشت.
رابطه (۴-۶): RTMR(t) = 3e-2λt - ۲e-3λt
۴-۶ افزونگی standby
افزونگیهای فعال به منظور دستیابی به تحمل خطا، ابتدا خطاهای رخ داده در سیستم را شناسایی می کنند، سپس عملیات لازم را به منظور ریکاوری سیستم و برگشت سیستم به حالت عملیاتی، انجام می دهند.در سیستمهای standby بین مؤلفه های سیستم وابستگی وجود دارد، از اینرو اینگونه سیستمها با بهره گرفتن از مدلهای مارکف آنالیز میشوند.
محاسبه با بهره گرفتن از فرایندهای مارکف: فرایندهای مارکف برای ارزیابی وابستگی سیستم، مورد استفاده قرار میگیرند. هدف فرایندهای مارکف محاسبهی Pi(t) است، یعنی احتمال اینکه سیتم در زمان t در وضعیت i باشد. اگر در وضعیت ۱، تمامی مؤلفه ها در حال کار و در محیط عملیاتی باشند و با فرض اینکه در زمان t=0، سیستم در وضعیت یک است آنگاه P1(0)=1 . از اینرو سیستم در هر زمانی فقط می تواند در یک حالت باشد یعنی Pi(0), پس