ضریب تعیین

ضریب تعیین مهمترین معیاری است که با آن می توان رابطه بین دو متغیر y,x را توضیح داد. ضریب تعیین توانایی وقابلیت معادله (مدل) رگرسیون در پیش‌بینی تغییرات متغیر وابسته بر اساس متغیر مستقل را نشان می‌دهد و مقدار آن بین صفر و یک می‌باشد.

رگرسیون چندگانه

تحلیل‌های رگرسیون به مطالعۀ وابستگی یک متغیر (متغیر وابسته) به یک یا چند متغیر دیگر (متغیر توضیحی) می‌پردازد که با تخمین یا پیش‌بینی مقدار متوسط یا میانگین مقادیر متغیر نوع اول در حالتی که مقادیر متغیر نوع دوم معلوم یا معین شده باشند (درنمونه‌گیری تکراری) صورت می‌پذیرد.

اگر وابستگی متغیری تنها بر روی یک متغیر توضیحی بررسی شود، چنین بررسی‌ به عنوان تحلیل رگرسیون ساده یا دو متغیره معروف است. اما اگر وابستگی یک متغیر بر روی بیش از یک متغیر توضیحی بررسی گردد، تحت عنوان رگرسیون مرکب معرفی می‌گردد.

یک مدل رگرسیونی خطی ساده را ‌می‌توان به شکل زیر بیان نمود:

۱)

که در آن نشان­دهنده متغیر توضیحی، نشان دهنده متغیر وابسته و نمایانگر جزء اخلال مربوط به جامعه ‌می‌باشد. در واقع جزء تصادفی جامعه ( ) نماینده یا جانشینی است برای تمامی متغیرهای حذف شده یا فراموش‌شده که بر متغیر وابسته اثر می‌گذارند ولی در مدل رگرسیون وجود ندارند (یا به دلایل گوناگون نمی‌توانند در مدل گنجانده شوند).

همان‌ طور که گفته شد جزء استوکاستیک[۱۱۳](جزء اخلال) نماینده‌ای برای تمامی متغیرهائی است که از مدل حذف شده اما مجموعاً بر y اثر می‌گذارد حال سؤال این است که چرا این متغیرها صریحاً در مدل معرفی نمی‌شوند؟ به بیان دیگر به دلایل زیر یک مدل رگرسیونی مرکب با تمام متغیرهای ممکن بسط داده نمی‌شوند.

۱ـ ممکن است تئوری ناقص باشد یعنی از تأثیرگذاری بعضی از متغیرها بر متغیر وابسته بی‌اطلاع باشیم.

۲ـ ممکن است راجع به بعضی از متغیرها داده های اندکی داشته باشیم.

۳ـ جمع‌ آوری داده ‌در مورد بعضی از متغیرها به نسبت تأثیر آن ها در مدل ممکن است بسیار زیاد باشد.

۴ـ به دلیل ماهیت تصادفی بودن متغیر وابسته، توضیح کامل آن ممکن نیست و جزء اخلال می‌تواند آن را منعکس کند.

۵ـ ممکن است در اندازه‌گیری خطا صورت گرفته باشد.

۶ـ با تأسی به قاعدۀ اُکام[۱۱۴](توصیف راجع به پدیده‌ها حتی الامکان ساده در نظر گرفته شود، و اینکه خلاف آن ثابت نشده است) مطلوب است مدل رگرسیون را تا حد ممکن ساده‌تر بگیریم

عدم وجود خودهمبستگی بین خطاهای مدل

عدم وجود خودهمبستگی بین جملات خطا یکی از فروض اساسی برای روش ols می‌باشد. همبستگی خطاها را با یکدیگر را اصطلاحاً خود همبستگی یا همبستگی سریالی می‌گویند.

قدم اول در شناسایی خودهمبستگی این است که نمودار خطاها ترسیم شود ولی این روش نموداری مشکل است و لذا برخی روش های آماری جهن آزمون خود همبستگی ارائه شده اند. یکی از آزمون های متداول، آزمون دوربین واتسون می‌باشد که به صورت زیر برای تشخیص خود همبستگی به کار می رود. ( سوری علی،۱۳۹۱ )

آزمون دوربین واتسون

آزمون دوربین واتسون ( durbin-watson) یکی از مشهورترین ازمون ها برای تشخیص خود همبستگی است. البته برای به کار بردن این آزمون نیاز به برقراری شرایطی است که در زیر به آن ها اشاره می‌کنیم.

محدودیت های آزمون دوربین واتسون:

    1. این آزمون تنها خود همبستگی از درجه اول را نشان می‌دهد.

    1. برای به کار بردن این آزمون هیچ مشاهده ی گم شده ای نباید وجود داشته باشد.

    1. متغیر با وقفه از نوع وابسته نباید در سمت راست مدل وجود داشته باشد.

  1. مدل رگرسیونی باید عرض از مبدأ داشته باشد.

نحوه داوری

هرگاه مقدار آماره دوربین واتسون بین ۵/۱ تا ۵/۲ باشد در این صورت بین اجزای خطای مدل رگرسیون همبستگی وجود ندارد در غیر این صورت بین اجزای خطای مدل همبستگی وجود دارد.

پانل دیتا

‌در داده های پانل دیتا در ابتدا باید روش تخمین مشخص باشد. روش تخمین مشتمل بر دو روش می‌باشد:

۱ـ استفاده از روش تلفیقی: در این روش مقاطع همگن فرض می شود.

۲- استفاده از روش پانل: در این روش مقاطع غیر همگن فرض می شود. این روش خود شامل دو نوع تخمین می‌باشد:

    • روش اثرات ثابت: در این روش تفاوت مقاطع صرفا در ضرایب لحاظ می شود.

  • روش اثرات تصادفی: در این روش تفاوت در مقاطع علاوه بر اینکه در ضرایب لحاظ می شود، سایر ویژگی های مقاطع نیز در ضرایب لحاظ می‌گردد.

با توجه به آنچه گفته شد، در ابتدا لازم است روش برآورد مشخص شود برای اینکار از آزمونF استفاده می شود که فرض صفر آن مبتنی بر همگن بودن مقاطع است و فرض مقابل آن مبنی بر غیر همگن بودن مقاطع می‌باشد. حال اگر فرض صفر در این آزمون پذیرفته شود از روش تلفیقی برای برآورد مدل استفاده خواهد شد و در غیر این صورت از روش پانل دیتا استفاده می شود. البته برای مشخص شدن نوع روش برآورد در پانل نیز از آزمون هاسمن استفده می‌گردد، در این آزمون فرض صفر مبنی بر استفاده از روش اثرات تصادفی برای برآورد می‌باشد و فرض مقابل آن فرض استفاده از روش اثرات ثابت می‌باشد.

برای آشنایی با مبانی نظری این آزمونها در این بخش به نحوه ی تحلیل در داده های پانل پرداخته می­ شود.

داده ­های تابلویی و مزایای استفاده از آن ها

انواع داده­هایی که عموماً برای تحلیل­های تجربی به کار برده می­شوند، در سه گروه مورد بحث و بررسی قرار می­ گیرند:

    • داده ­های سری زمانی[۱۱۵]

    • داده ­های مقطعی[۱۱۶]

  • داده ­های تلفیقی سری زمانی و مقطعی[۱۱۷]

در داده ­های سری زمانی مقادیر یک یا چند متغیر را طی یک دوره زمانی مشاهده می­کنیم (برای مثال GDP طی چند فصل یا چند سال). در داده ­های مقطعی، مقادیر یک یا چند متغیر برای چند واحد یا مورد نمونه ­ای در یک زمان یکسان جمع­­آوری می­ شود (برای مثال نرخ­های جرم و جنایت برای سی استان ایران در در یک سال معین).

داده ­های تابلویی ترکیبی از داده ­های مقطعی و سری زمانی ‌می‌باشد، یعنی اطلاعات مربوط به داده ­های مقطعی در طول زمان مشاهده می­ شود. بدین­صورت که چنین داده­هایی دارای دو بعد می‌باشند که یک بعد آن مربوط به واحدهای مختلف در هر مقطع زمانی خاص است و بعد دیگر آن مربوط به زمان ‌می‌باشد. در این تحقیق روش­داده ­های تابلویی به عنوان روش تخمین مدل، انتخاب می­ شود. در مجموع، داده­­های پانلی دارای مزایای فراوانی نسبت به داده ­های مقطعی یا سری زمانی هستند که برخی از مهمترین آن ها عبارتند از:

    • داده ­های مقطعی و سری زمانی صرف، ناهمسانی­های فردی را لحاظ نمی­کنند، لذا ممکن است که تخمین تورش­داری به دست دهند، در حالی که در روش پانل ‌می‌توان با لحاظ کردن متغیرهای مخصوص انفرادی[۱۱۸] این ناهمسانی­ها را لحاظ کرد.

موضوعات: بدون موضوع  لینک ثابت