دانلود پایان نامه های آماده – عدم وجود خودهمبستگی بین خطاهای مدل – 9 |
ضریب تعیین
ضریب تعیین مهمترین معیاری است که با آن می توان رابطه بین دو متغیر y,x را توضیح داد. ضریب تعیین توانایی وقابلیت معادله (مدل) رگرسیون در پیشبینی تغییرات متغیر وابسته بر اساس متغیر مستقل را نشان میدهد و مقدار آن بین صفر و یک میباشد.
رگرسیون چندگانه
تحلیلهای رگرسیون به مطالعۀ وابستگی یک متغیر (متغیر وابسته) به یک یا چند متغیر دیگر (متغیر توضیحی) میپردازد که با تخمین یا پیشبینی مقدار متوسط یا میانگین مقادیر متغیر نوع اول در حالتی که مقادیر متغیر نوع دوم معلوم یا معین شده باشند (درنمونهگیری تکراری) صورت میپذیرد.
اگر وابستگی متغیری تنها بر روی یک متغیر توضیحی بررسی شود، چنین بررسی به عنوان تحلیل رگرسیون ساده یا دو متغیره معروف است. اما اگر وابستگی یک متغیر بر روی بیش از یک متغیر توضیحی بررسی گردد، تحت عنوان رگرسیون مرکب معرفی میگردد.
یک مدل رگرسیونی خطی ساده را میتوان به شکل زیر بیان نمود:
۱)
که در آن نشاندهنده متغیر توضیحی، نشان دهنده متغیر وابسته و نمایانگر جزء اخلال مربوط به جامعه میباشد. در واقع جزء تصادفی جامعه ( ) نماینده یا جانشینی است برای تمامی متغیرهای حذف شده یا فراموششده که بر متغیر وابسته اثر میگذارند ولی در مدل رگرسیون وجود ندارند (یا به دلایل گوناگون نمیتوانند در مدل گنجانده شوند).
همان طور که گفته شد جزء استوکاستیک[۱۱۳](جزء اخلال) نمایندهای برای تمامی متغیرهائی است که از مدل حذف شده اما مجموعاً بر y اثر میگذارد حال سؤال این است که چرا این متغیرها صریحاً در مدل معرفی نمیشوند؟ به بیان دیگر به دلایل زیر یک مدل رگرسیونی مرکب با تمام متغیرهای ممکن بسط داده نمیشوند.
۱ـ ممکن است تئوری ناقص باشد یعنی از تأثیرگذاری بعضی از متغیرها بر متغیر وابسته بیاطلاع باشیم.
۲ـ ممکن است راجع به بعضی از متغیرها داده های اندکی داشته باشیم.
۳ـ جمع آوری داده در مورد بعضی از متغیرها به نسبت تأثیر آن ها در مدل ممکن است بسیار زیاد باشد.
۴ـ به دلیل ماهیت تصادفی بودن متغیر وابسته، توضیح کامل آن ممکن نیست و جزء اخلال میتواند آن را منعکس کند.
۵ـ ممکن است در اندازهگیری خطا صورت گرفته باشد.
۶ـ با تأسی به قاعدۀ اُکام[۱۱۴](توصیف راجع به پدیدهها حتی الامکان ساده در نظر گرفته شود، و اینکه خلاف آن ثابت نشده است) مطلوب است مدل رگرسیون را تا حد ممکن سادهتر بگیریم
عدم وجود خودهمبستگی بین خطاهای مدل
عدم وجود خودهمبستگی بین جملات خطا یکی از فروض اساسی برای روش ols میباشد. همبستگی خطاها را با یکدیگر را اصطلاحاً خود همبستگی یا همبستگی سریالی میگویند.
قدم اول در شناسایی خودهمبستگی این است که نمودار خطاها ترسیم شود ولی این روش نموداری مشکل است و لذا برخی روش های آماری جهن آزمون خود همبستگی ارائه شده اند. یکی از آزمون های متداول، آزمون دوربین واتسون میباشد که به صورت زیر برای تشخیص خود همبستگی به کار می رود. ( سوری علی،۱۳۹۱ )
آزمون دوربین واتسون
آزمون دوربین واتسون ( durbin-watson) یکی از مشهورترین ازمون ها برای تشخیص خود همبستگی است. البته برای به کار بردن این آزمون نیاز به برقراری شرایطی است که در زیر به آن ها اشاره میکنیم.
محدودیت های آزمون دوربین واتسون:
-
- این آزمون تنها خود همبستگی از درجه اول را نشان میدهد.
-
- برای به کار بردن این آزمون هیچ مشاهده ی گم شده ای نباید وجود داشته باشد.
-
- متغیر با وقفه از نوع وابسته نباید در سمت راست مدل وجود داشته باشد.
- مدل رگرسیونی باید عرض از مبدأ داشته باشد.
نحوه داوری
هرگاه مقدار آماره دوربین واتسون بین ۵/۱ تا ۵/۲ باشد در این صورت بین اجزای خطای مدل رگرسیون همبستگی وجود ندارد در غیر این صورت بین اجزای خطای مدل همبستگی وجود دارد.
پانل دیتا
در داده های پانل دیتا در ابتدا باید روش تخمین مشخص باشد. روش تخمین مشتمل بر دو روش میباشد:
۱ـ استفاده از روش تلفیقی: در این روش مقاطع همگن فرض می شود.
۲- استفاده از روش پانل: در این روش مقاطع غیر همگن فرض می شود. این روش خود شامل دو نوع تخمین میباشد:
-
- روش اثرات ثابت: در این روش تفاوت مقاطع صرفا در ضرایب لحاظ می شود.
- روش اثرات تصادفی: در این روش تفاوت در مقاطع علاوه بر اینکه در ضرایب لحاظ می شود، سایر ویژگی های مقاطع نیز در ضرایب لحاظ میگردد.
با توجه به آنچه گفته شد، در ابتدا لازم است روش برآورد مشخص شود برای اینکار از آزمونF استفاده می شود که فرض صفر آن مبتنی بر همگن بودن مقاطع است و فرض مقابل آن مبنی بر غیر همگن بودن مقاطع میباشد. حال اگر فرض صفر در این آزمون پذیرفته شود از روش تلفیقی برای برآورد مدل استفاده خواهد شد و در غیر این صورت از روش پانل دیتا استفاده می شود. البته برای مشخص شدن نوع روش برآورد در پانل نیز از آزمون هاسمن استفده میگردد، در این آزمون فرض صفر مبنی بر استفاده از روش اثرات تصادفی برای برآورد میباشد و فرض مقابل آن فرض استفاده از روش اثرات ثابت میباشد.
برای آشنایی با مبانی نظری این آزمونها در این بخش به نحوه ی تحلیل در داده های پانل پرداخته می شود.
داده های تابلویی و مزایای استفاده از آن ها
انواع دادههایی که عموماً برای تحلیلهای تجربی به کار برده میشوند، در سه گروه مورد بحث و بررسی قرار می گیرند:
-
- داده های سری زمانی[۱۱۵]
-
- داده های مقطعی[۱۱۶]
- داده های تلفیقی سری زمانی و مقطعی[۱۱۷]
در داده های سری زمانی مقادیر یک یا چند متغیر را طی یک دوره زمانی مشاهده میکنیم (برای مثال GDP طی چند فصل یا چند سال). در داده های مقطعی، مقادیر یک یا چند متغیر برای چند واحد یا مورد نمونه ای در یک زمان یکسان جمعآوری می شود (برای مثال نرخهای جرم و جنایت برای سی استان ایران در در یک سال معین).
داده های تابلویی ترکیبی از داده های مقطعی و سری زمانی میباشد، یعنی اطلاعات مربوط به داده های مقطعی در طول زمان مشاهده می شود. بدینصورت که چنین دادههایی دارای دو بعد میباشند که یک بعد آن مربوط به واحدهای مختلف در هر مقطع زمانی خاص است و بعد دیگر آن مربوط به زمان میباشد. در این تحقیق روشداده های تابلویی به عنوان روش تخمین مدل، انتخاب می شود. در مجموع، دادههای پانلی دارای مزایای فراوانی نسبت به داده های مقطعی یا سری زمانی هستند که برخی از مهمترین آن ها عبارتند از:
-
- داده های مقطعی و سری زمانی صرف، ناهمسانیهای فردی را لحاظ نمیکنند، لذا ممکن است که تخمین تورشداری به دست دهند، در حالی که در روش پانل میتوان با لحاظ کردن متغیرهای مخصوص انفرادی[۱۱۸] این ناهمسانیها را لحاظ کرد.
[جمعه 1401-09-25] [ 10:04:00 ق.ظ ]
|