۳-۷-۳ آزمون هم خطی[۶۳]
کاربرد و تفسیر یک مدل رگرسیون چندگانه به صورت آشکاری به برآورد ضرایب رگرسیون بستگی دارد. در برخی موارد در تحلیل رگرسیون خطی با این پدیده روبرو میشویم که میان متغیر های مستقل، رابطه ای خطی وجود دارد. هم خطی خود بر دو نوع است:
۱-هم خطی کامل(دقیق): این حالت زمانی به وجود میآید که یکی از متغیر های مستقل ترکیب خطی از دیگر متغیر های مستقل باشد که در این حالت ماتریس متغیر های مستقل دارای رتبه ای کمتر از مرتبه آن بوده و معکوس پذیر نیست.
۲- هم خطی تقریبی: در عمل کمتر اتفاق می افتد که میان متغیر های مستقل یم رابطه ی هم خطی کامل وجود داشته باشد و در اکثر موارد، این رابطه ی هم خطی ناقص است که به آن هم خطی تقریبی گفته
می شود.
از جمله مشکلاتی که در هنگام هم خطی بودن به وجود میآید، میتوان به موارد زیر اشاره کرد:
۱- کواریانس مثبت هم خطی باعث میشود که تغییرات جزئی در داده ها ( افزودن و یا حذف یک یا چند مشاهده)، سبب تغییرات قابل ملاحظه در ضرایب برآوردی میشود.
۲- کواریانش مثبت میان متغیرهای مستقل، باعث وجود کواریانس منفی میان ضرایب رگرسیون برآوردی خواهد شد.
۳- وجود پدیده هم خطی باعث میشود که تغییرات جزئی در داده ها (افزودن و یا حذف یک یا چند مشاهد)، سبب تغییرات قابل ملاحظه در ضرایب برآوردی میشود.
با وجود پدیده هم خطی، برآورد جداگانه ای از هر یک از ضرایب رگرسیون به سبب واریانس نمونه قابل ملاحظه، قابل برآورد نیست، اما معمولا تابعی از پارامترها( ضرایب) میتوان یافت که امکان برآورد آن وجود دارد، چنین تابعی را «تابع قابل برآورد» میگویند. همچنین با وجود پدیده ی هم خطی، اگر چه برآورد جداگانه پارامتر ها امکان پذیر نیست ولی میانگین متغیر وابسته یعنی به طور منحصر به فرد قابل تخمین است یا به عبارت دیگر میتوان از رگرسیون برای پیشبینی استفاده کرد. یکی از ساده ترین و رایج ترین شیوه های برخورد با پدیده هم خطی، انجام رگرسیون های متعدد با حذف یک یا چند متغیر مستقل است بدین گونه، واریانس نمونه پارامترها کاهش یابد. یکی از معیارهای که میتوان با بهره گرفتن از آن این مسئله را بررسی نمود، دو شاخص تولرانس و عامل تورم واریانس (VIF)[64] میباشد. عامل تورم واریانس به صورت زیر تعریف میشود:
در این تعریف ضریب تعیین حاصل از رگرسیون زدن روی باقیمانده متغیر های رگرسیونی است. این روش منسوب به مارکوارت(۱۹۷۰)[۶۵] است.VIF از ۵ یا ۱۰ بیشتر باشد، نشان دهنده برآورد ضعیف ضریب رگرسیونی مربوطه است، که علت آن جند هم خطی است. اگر هر دو آماره هم خطی (تولرانس و عامل تورم واریانس) برای متغیرهای مستقل بسیار نزدیک به عدد یک باشند، بیانگر عدم وجود هم خطی و نشان دهنده برآورد خوبی از ضریب رگرسیونی مربوطه است. راه حل هایی که برای رفع مشکل هم خطی توصیه میشود به صورت زیر است:
۱-با افزایش تعداد نمونه ها یا استفاده از نمونه ی جدید، یعنی با حرکت به سمت جامعه آماری با افزایش حجم نمونه، میتوان مشکل هم خطی را تا حدودی برطرف نمود.
۲- با طراحی مدل رگرسیون که حاوی متغیرهای مستقل کمتری باشد، میتوان مشکل هم خطی را تا حدودی برطرف نمود.
۳-۸- معرفی نرم افزار Eviews
نرم افزار Eviewsیک نرم افزار اقتصادسنجی میباشد که توسط بانک جهانی طراحی و ارائه شدهاست. واژه Eviews نیز مخفف Econometric Views است. این نرم افزار در واقع شکل پیشرفته تر و کاملتر نرمافزار Micro TSP بوده که تحت سیستم عامل Windows اجرا میشود و استفاده از آن نیز آسانتر و سریع تر صورت میگیرد. اگرچه ایده طراحی Eviews ابتدا توسط اقتصاددانان شکل گرفته و هدف از آن تهیه ابزاری جهت استفاده در موضوعات اقتصادی بوده است، اما مانعی برای استفاده در تحلیل های مالی، هزینه و پیشبینی فروش وجود ندارد (شیرین بخش و خوانساری، ۱۳۸۴).
۳-۹- انواع داده ها
داده ها و مشاهدات متغیرهای موجود در یک مدل معمولاً در سه نوع مختلف میتواند وجود داشته باشد: داده های سری زمانی، داده های مقطع زمانی و داده های تلفیقی یا پنل.
داده های سری زمانی، مقادیر یک متغیر را در نقاط متوالی در زمان، اندازه گیری می کند. این توالی میتواند سالانه، فصلی، ماهانه، هفتگی یا حتی به صورت پیوسته باشد. داده های سری زمانی به طور کلی موضوع کار «اقتصادسنجی کلان» است که روشهای اقتصادسنجی را در سطح کلان بررسی می کند. در اقتصاد کلان عموما از سری زمانی های سالانه یا فصلی استفاده میشود چرا که جمع آوری اطلاعاتی مانند حسابهای ملی در فواصل کوتاه تر با دشواریهای زیادی همراه است. اما در اقتصادسنجی مالی که داده ها در هر زمان به آسانی قابل گزارش هستند، استفاده از سریهای زمانی ساعتی یا حتی دقیقه ای نیز امری غیرمعمول نیست. معمولاً از اندیس t برای داده های سری زمانی استفاده می کنند.
داده های مقطع زمانی، مقادیر یک متغیر را در زمان معین و روی واحدهای متعدد اندازه گیری میکند. این واحدها میتوانند افراد، خانوارها، واحدهای تولیدی، صنایع، نواحی مختلف و حتی کشورهای مختلف باشند. مثلا میتوان داده های درآمد و مصرف خانوارهای مختلف را در سال معینی جمع آوری کرد. معمولاً از اندیس i برای داده های مقطعی استفاده می کنند.
داده های تلفیقی در واقع بیان کننده داده های مقطعی در طی زمان هستند. بنابرین حجم مشاهدات در داده های تلفیقی نسبتا زیاد است.
در سالهای اخیر، کاربرد داده های تلفیقی در اقتصادسنجی افزایش بسیاری یافته است. معمولاً داده های تلفیقی و داده های مقطعی در اقتصادسنجی خرد به کار میروند که موضوع آن بررسی روشهای اقتصادسنجی در اقتصاد خرد است. یکی از قابلیت های نرم افزار Eviews ترکیب داده های مقطعی و زمانی است و می توان مدل رگرسیون با داده های ترکیبی را اجرا نمود. در تحقیق حاضر روش آماری استفاده شده به منظور تجزیه و تحلیل داده ها، روش رگرسیون چند متغیره با بهره گرفتن از داده های ترکیبی است. لذا نرم افزار استفاده شده نیز نرم افزار Eviews است که قابلیت چنین تجزیه تحلیلی را دارا میباشد.
۳-۱۰-مدل داده های ترکیبی سری زمانی- مقطعی (پنل)
داده های ترکیبی به یک مجموعه از داده هایی گفته میشود که بر اساس آن مشاهدات به وسیله تعداد زیادی از متغیر هایی مقطعی (N)، که اغلب به صورت تصادفی انتخاب میشوند، در طول یک دوره زمانی مشخص(T) مورد بررسی قرار گرفته باشند. در این صورت این N×T داده آماری را داده های ترکیبی یا داده های مقطعی – سری زمانی مینامند. به این دلیل که داده های ترکیبی در برگیرنده هر دو جنبه داده های سری زمانی و داده های مقطعی است، به کارگیری مدل های توضیح دهنده آماری مناسبی که ویژگی های آن متغیر ها را توصیف کند، پیچیده تر از مدل های استفاده شده در داده های مقطعی و سری زمانی است. در سال های اخیر از روش ترکیب داده های مقطعی و سری زمانی در تحقیقات کاربردی زیادی استفاده شدهاست.