۳- بین خطاهای مدل همبستگی وجود ندارد؛ و
۴- متغیر وابسته دارای توزیع نرمال است.
۳-۹- ۱) ضریب تعیین و ضریب تعیین تصحیح شده
ضریب تعیین مهمترین معیاری است که با آن میتوان رابطه میان متغیر (متغیرهای) مستقل و متغیر وابسته را توضیح داد. مقدار این ضریب مشخص کننده آن است که چند درصد از تغییرات متغیر وابسته توسط متغیر (متغیرهای) مستقل قابل توضیح است. مقدار از رابطه زیر تعیین میشود (آذر و مومنی .۱۳۸۶).
که در آن:
SSE: تغییرات جمله خطا که توسط رگرسیون توضیح داده نمیشود.
SST: کل تغییرات در مقدار متغیر وابسته.
برای برطرف نمودن اریبی که در ضریب تعیین ناشی از حجم نمونه است، میتوان از مقیاس دیگری به نام ضریب تعیین تصحیح شده استفاده نمود. این ضریب همان ضریب تعیین است که در آن مقادیر SSE و SST با درجات آزادیشان تصحیح شدهاند. این ضریب در رگرسیون چند متغیره به صورت زیر محاسبه میشود (آذر و مومنی،۱۳۸۶):
۳-۹-۲ -مفروضات رگرسیون خطی
تنها در صورتی میتوان از رگرسیون خطی استفاده نمود که شرایط زیر برقرار باشند(مومنی و فعال قیوم، ۱۳۹۰):
- یکی از مفروضاتی که در رگرسیون مدنظر قرار میگیرد، عدم وجود خودهمبستگی[۹۰] یا همبستگی پیاپی بین خطاها (تفاوت بین مقادیر واقعی و مقادیر پیشبینی شده توسط معادله رگرسیون) است. در الگوی رگرسیون فرض میشود که خطاها یک متغیر تصادفی هستند و نسبت به یکدیگر هیچ رابطهای نداشته (مستقل از یکدیگرند)، یا به عبارت دیگر:
E (uiuj)i≠j=0
E (ui,ui+h)h≠۰=۰
به عبارت دیگر، کوواریانس بین جملات خطا برابر با صفر خواهد بود.
-
- معادله رگرسیون برازش شده در کل معنادار باشد. برای آزمون معناداری کلی مدل از آماره F در سطح ۹۵% استفاده میشود.
-
- خطاهای معادله دارای توزیع نرمال با میانگین صفر باشند. برای بررسی نرمال بودن خطاهای معادله، مقادیر استاندارد خطاها محاسبه شده، منحنی اجزای خطا در مدل رگرسیون رسم میگردد و سپس با نمودار نرمال مقایسه میشود.
- بین متغیرهای مستقل موجود در الگوی رگرسیون همبستگی وجود نداشته باشد (دارای همخطی[۹۱] نباشند). زیرا در صورتی که شدت رابطه بین متغیرهای مستقل بسیار زیاد باشد، اندازه گیری جداگانه اثرات هر یک از متغیرها بر روی متغیر وابسته دشوار است(مومنی و فعال قیوم، ۱۳۹۰).
۳-۹-۳- آزمون استقلال خطاها
به منظور بررسی استقلال خطاها از یکدیگر از آزمون دوربین-واتسون[۹۲] استفاده میشود. به طور کلی آزمون دوربین واتسون همبستگی سریالی بین باقیمانده(خطا)های رگرسیون را آزمون میکند. مقدار این آماره بین ۰ تا ۴ تغییر میکند. اگر همبستگی بین مانده های متوالی وجود نداشته باشد، مقدار آماره باید نزدیک ۲ شود. اگر مقدارآماره نزدیک به صفر شود، نشان دهنده همبستگی مثبت بین باقیماندهها و اگر نزدیک به ۴ شود، نشان دهنده همبستگی منفی بین باقیمانده های متوالی است. به طورکلی اگر آماره دوربین-واتسون بین ۵/۱ و ۵/۲ قرار گیرد، میتوان فرض عدم وجود همبستگی بین خطاهای مدل را پذیرفت (مومنی، ۱۳۸۶).
۳-۹-۴- آزمون مناسب بودن مدل
برای آزمون مناسب بودن مدل تخمین شده، ابتدا این فرض را مطرح میسازیم که مدل تغییرات Y را به صورت معنی داری توجیه نمیکند. برای آزمون فرض مذبور، از آماره F استفاده میکنیم. اگر در سطح خطای α (در این تحقیق ۵%) مقدار آماره F از مقدار جدول بیشتر باشد، فرض صفر رد می شود و میتوان گفت تغییرات توجیه شده توسط مدل مناسب است و یا اینکه رابطه معناداری بین متغیر وابسته ومتغیر مستقل وجود دارد. همچنین اگر سطح معناداری مدل (sig) کمتر از سطح خطای α (در این تحقیق ۵%) باشد، فرض صفر رد و چنین استنباط می شود که مدل تغییرات F را به صورت معنا داری توجیه می کند (یعنی مدل مناسب است)( مومنی، ۱۳۸۶).
۳-۹-۵- آزمون معنادار بودن ضرایب
به منظور آزمون معنی دار بودن هر یک از ضرایب برآوردی رگرسیون فرض میشود که ضریب رگرسیون برابر صفر است و به عبارتی متغیر مستقل بر متغیر وابسته تاثیری ندارد. یعنی فرضیه صفر به صورت زیر بیان میگردد:
H0: β = ۰
در مقابل آن فرضیه رقیب(نقیض ادعا) بیان میدارد که متغیر مستقل در تغییرات متغیر وابسته مؤثر واقع میشود یعنی:
H1: βi ≠ ۰
برای آزمون این فرضیات از آزمون t استیودنت، در سطح معناداری ۵% استفاده میشود. اگر در سطح اطمینان ۹۵% (خطای ۵%=) قدر مطلق t به دست آمده از آزمون، بزرگتر، از t به دست آمده از جدول با همان درجه آزادی باشد، فرض رد شده و در غیر این صورت تأیید میشود. در این آزمون رد به معنی معنادار بودن ضریب مورد نظر و عدم رد به مفهوم بی معنا بودن ضریب مورد نظر است(مومنی، ۱۳۸۶).
۳-۱۰- بررسی ساختار داده های ترکیبی و انواع مدلهای آن
در این تحقیق، با توجه به نوع داده ها و روشهای تجزیه و تحلیل آماری موجود، از روش داده های ترکیبی و مقطعی برای برآورد پارامترهای الگو و بررسی آزمون فرضیهها استفاده شده است. روش داده های ترکیبی که به روش داده های مقطعی – سری زمانی[۹۳] نیز معروف است، به شکلهای مختلف انجام شده و مدلهای متنوعی دارد که با توجه به شرایط تحقیق از یکی از آنها استفاده می شود.
استفاده از روش داده های مقطعی ممکن است با مشکلات عدم کارایی و ناسازگاری تخمین مدلها همراه باشد. مشکلات مذبور در تخمین مدلها به روش داده های ترکیبی و با بهره گرفتن از روش هایی مانند مدل اثر ثابت[۹۴]، مدل اثر تصادفی[۹۵]، مدل رگرسیون به ظاهر نامرتبط[۹۶] و مدل داده های یکپارچه شده[۹۷]، وجود نخواهد داشت. در بررسی داده های مقطعی و سری زمانی، اگر ضریب اثرات مقطعی و اثر زمانی معنیدار نشود، میتوان تمامی داده ها را با یکدیگر ترکیب کرده و بوسیله رگرسیون حداقل مربعات معمولی[۹۸]
تخمین زد. به این روش، داده های تلفیق شده نیز میگویند. مدلهای اثر ثابت و اثر تصادفی به سبب اهمیت، در این قسمت به اختصار توضیح داده میشوند:
۳-۱۰-۱ مدل اثر ثابت
در مدل اثر ثابت، شیب رگرسیون در هر مقطع ثابت است و جمله ثابت از مقطعی به مقطع دیگر متفاوت است. هر چند اثر زمانی معنیدار نیست، اما اختلاف معنیداری میان مقطعها وجود دارد و ضرایب مقطعها با زمان تغییر نمیکند. یکی از روشهای نشان دادن اثر مقطعی استفاده از متغیرهای مجازی است. شکل کلی این مدل به صورت زیر است:
در این رابطه، نشان دهنده ی برداری از متغیر های مستقل، متغیر مجازی برای نشان دادن اثر مقطعی، برداری از متغیرهای وابسته و جملات خطای معادله است. در مدلهای اثر ثابت که شیب ثابت دارند، فرض می شود که واریانس خطاها در مقطع و همچنین، بین مقاطع همسان است و خود همبستگی بین اجزای خطای آن وجود نداشته باشد. به بیان دیگر، برای هر و رابطه زیر برقرار است (اشرفزاده و مهرگان، ۱۳۸۷).