جدول ۴-۳۰ : مقادیر بیشینه آگاهی سوالات و تتای ماکسیمم در مدل دو پارامتری در آزمون ادبیات فارسی ۱۲۸
جدول۴-۳۱: توزیع سوالات آزمون ادبیات فارسی برحسب دامنه ی آگاهی در مدل دو پارامتری ۱۲۹
جدول۴-۳۲: مقادیر برآورد شده ی آگاهی و خطای استاندارد اندازه گیری آزمون ادبیات فارسی در سطوح مختلف توانایی برحسب مدل دو پارامتری ۱۳۰
جدول۴-۳۳: مقادیر برآوردشده ی پارامترهای سوال به همراه آزمون خی دو و سطح معناداری در مدل های یک پارامتری و دو پارامتری در آزمون زیست شناسی ۱۳۲
جدول۴-۳۴: بررسی برازندگی تک تک سوالات با مدل یک پارامتری و دو پارامتری در سطوح آلفای ۰۱/۰ و ۰۵/۰ ۱۳۵
جدول ۴-۳۵: توزیع سوالات آزمون زیست شناسی بر اساس پارامترهای سوال در مدل دو پارامتری ۱۳۶
جدول ۴-۳۶ : مقادیر بیشینه آگاهی سوالات و تتای ماکسیمم در مدل دو پارامتری در آزمون زیست شناسی ۱۴۰
جدول ۴-۳۷ : توزیع سوالات آزمون زیست شناسی برحسب دامنه ی آگاهی در مدل دو پارامتری ۱۴۲
جدول۴-۳۸: مقادیر برآورد شده ی آگاهی و خطای استاندارد اندازه گیری آزمون زیست شناسی در سطوح مختلف توانایی برحسب مدل دو پارامتری ……………………………………………………………………………………………………………………………………………………… ۱۴۲ جدول ۴-۳۹ : توزیع فراوانی وضعیت قبولی آزمودنی­ها به تفکیک جنسیت و درس…… ۱۴۵
جدول ۴-۴۰ : شاخص های توصیفی توزیع نمرات آزمودنی ها ۱۴۶
جدول ۴-۴۱: شاخص های توصیفی شکل توزیع نمرات آزمودنی ها ۱۴۶
جدول۴-۴۲: شاخص های توصیفی توزیع نمرات آزمودنی ها به تفکیک جنسیت ۱۴۸
جدول۴-۴۳: شاخص های توصیفی شکل توزیع نمرات آزمودنی ها به تفکیک جنسیت ۱۴۸
جدول ۴-۴۴: نتایج آزمون t مستقل بین دو گروه آزمودنی های پسر و دختر ۱۴۹
جدول ۵-۱ : میزان توافق دو مدل کلاسیک و IRT در تعیین سوالات مناسب و نامناسب از نظر قدرت تشخیص برای آزمون ادبیات فارسی………………………………………………………………………………………………………………………………………………………………………………۱۶۰
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

جدول ۵-۲ : میزان توافق دو مدل کلاسیک و IRT در تعیین سوالات مناسب و نامناسب از نظر قدرت تشخیص برای آزمون زیست شناسی……………………………………………………………………………………………………………………………………………………………………………..۱۶۱
فهرست نمودار­ها
نمودار۲-۱ : طرح ۱ ۳۲
نمودار۲-۲ : طرح ۲ ۳۳
نمودار۲-۳: طرح ۳ ۳۴
نمودار ۲-۴: سهم واریانس خطای نسبی و مطلق در طرح یک رویه ای متقاطع……………………………………………………….۳۶
نمودار۲-۵: روش های برآورد اعتبار………………………………………………………………………………………………………………….۴۹
نمودار۲-۶: روش های برآورد روایی…………………………………………………………………………………………………………………۶۱
نمودار۳-۱: تقسیم بندی واریانس برای طرح برآورد I(S:G:R)……………………………………………………………………………..49
نمودار۴-۱: نمودار اسکری آزمون ادبیات فارسی ۱۱۹
نمودار۴-۲ : منحنی ویژگی سوال های آزمون ادبیات فارسی در مدل یک پارامتری ۱۲۵
نمودار ۴-۳ : منحنی ویژگی سوال های آزمون ادبیات فارسی در مدل دو پارامتری ۱۲۶
نمودار ۴-۴ : منحنی ویژگی سوال ۴۸ آزمون ادبیات فارسی بر اساس مدل دو پارامتری ۱۲۷
نمودار ۴-۵: منحنی آگاهی سوال ۴۸ آزمون ادبیات فارسی بر اساس مدل دو پارامتری ۱۲۸
نمودار ۴-۶: منحنی آگاهی و خطای استاندارد اندازه گیری آزمون ادبیات فارسی برحسب مدل دو پارامتری ۱۳۱
نمودار۴-۷ : هیستوگرام توزیع توانایی آزمودنی ها در آزمون ادبیات فارسی برحسب مدل دو پارامتری ۱۳۱
نمودار۴-۸ : نمودار اسکری آزمون زیست شناسی ۱۳۲
نمودار۴-۹: منحنی ویژگی سوال های آزمون زیست شناسی در مدل یک پارامتری ۱۳۷
نمودار ۴-۱۰: منحنی ویژگی سوال های آزمون زیست شناسی در مدل دو پارامتری ۱۳۸
نمودار ۴-۱۱: منحنی ویژگی سوال ۲۴ آزمون زیست شناسی بر اساس مدل دو پارامتری ۱۳۹
نمودار ۴-۱۲ : منحنی آگاهی سوال ۲۴ آزمون زیست شناسی بر اساس مدل دو پارامتری ۱۴۰
نمودار ۴-۱۳ : منحنی آگاهی و خطای استاندارد اندازه گیری آزمون زیست شناسی برحسب مدل دو پارامتری ۱۴۳
نمودار۴-۱۴: هیستوگرام توزیع توانایی آزمودنی ها در آزمون زیست شناسی برحسب مدل دو پارامتری ۱۴۳
نمودار۴-۱۵ : منحنی توزیع نمرات آزمودنی ها…………………………………………………………………………………………………۱۴۷
فصل اول
کلیات تحقیق
مقدمه
در طول پنجاه سال اخیر، در جامعه جهانی دیدگاهی نسبت به آموزش و پرورش به وجود آمده است که گزارش اخیر شورای بین المللی آموزش و پرورش برای قرن بیست و یکم (دلورس[۱]، ۱۹۹۶) آن را ” آرمانی ضروری” تلقی می­ کند. این گزارش با قاطعیت ادعا می­ کند که آموزش و پرورش تنها یک سازوکار برای اکتساب دامنه­ محدودی از مهارت های پایه نیست، بلکه عاملی ارزشمند برای توسعه اجتماعی و فردی است. دارایی بی­مانندی است برای تلاش (نوع بشر) به سوی دستیابی به آرمان­های ” صلح، آزادی و عدالت” و یکی از راه­های اصلی در دسترسی برای پرورش الگویی عمیق­تر و هماهنگ­تر از توسعه انسانی می­باشد و از طریق آن، فقر، تبعیض، جهل، استضعاف و جنگ را می­توان کاهش داد (یونسکو[۲]، ۲۰۰۱، ترجمه سعیدی، ۱۳۸۴،ص ۱۸). امروزه جوامع به آموزش و پرورش به عنوان یکی از مهمترین راه­های توسعه و پیشرفت همه جانبه می­نگرند و هزینه­ های کلانی را در آن صرف می­ کنند. جوامع دریافته­اند که برای تحقق اهداف گوناگون، نیازمند نیروی انسانی ماهر و کارآمد هستند که دو دستگاه آموزش و پرورش و آموزش عالی متولی این امر می­باشند. آنچه این دو را به هم پیوند می­دهد، فرایند گزینش دانشجو است که در جوامع مختلف، متفاوت و بر مبنای انگیزه­ های گوناگونی شکل یافته است. اما در این میان سعی همه جوامع بر این است که امکانات آموزش عالی به شایسته­ترین و اصلح­ترین افراد تخصیص یابد.
در ایران دیر زمانی است که نظام پذیرش دانشجو از طریق کنکور صورت می­گیرد که در بین جوانان به معنای” سرنوشت” تعبیر می­ شود و در کشور باعث تولید نوعی بحران شده است. از تحولات سال­های اخیر در زمینه نظام پذیرش دانشجو، مطرح کردن جایگزینی سوابق تحصیلی بجای کنکور است که در سال ۱۳۸۶ با عنوان قانون حذف کنکور به تصویب مجلس شورای اسلامی رسید و می­بایست از سال ۹۰ اجرایی می­شد که با توجه به مشکلات علمی، فنی و اجرایی به سرانجام نرسید. تا اینکه در مرداد ماه ۱۳۹۲ کلیات طرح جدید سنجش و پذیرش دانشجو به تصویب نمایندگان مجلس شورای اسلامی رسید که بر اساس آن، این مصوبه از کنکور سال آینده اجرا می­ شود و تأثیر سوابق تحصیلی (دور دوم دوره متوسطه) از سال ۹۳ به صورت پلکانی از تأثیر ۲۵ درصد شروع می­ شود تا در نهایت به ۸۵ درصد طی ۵ سال برسد.
با توجه به طرح جدید سنجش و پذیرش دانشجو، از امتحانات­نهایی مقطع متوسطه می­توان به عنوان یکی از مهم­ترین و سرنوشت­سازترین ابزار سنجش علمی دانش ­آموزان نام برد. آنچه در این میان مهم جلوه می­ کند، کیفیت این آزمون­ها و استاندارد بودن سوالات آنهاست. از اولین گام­ها در کیفیت مستندسازی فنی ابزار اندازه ­گیری، تعیین روایی[۳] و اعتبار[۴] نمراتی است که از یک ارزیابی به دست می­آیند.
با نگاهی به مجلات علمی کشورمان، می­توان دریافت در بسیاری از مطالعات صورت گرفته، نه تنها در زمینه­ آموزش و پرورش بلکه در رشته­ های گوناگون، با وجود منابع چندگانه­ی خطا باز محققان ضرایب اعتبار کلاسیک را گزارش می­ دهند. این در حالی است که در وضعیت­های اندازه ­گیری پیچیده که منابع چندگانه­ای از خطای اندازه ­گیری وجود دارد، نظریه کلاسیک آزمون[۵](CTT) قادر به برآورد اعتبار نیست. از این رو، تحقیق حاضر در پی آن است که ضمن معرفی نظریه تعمیم­پذیری[۶](GT)، اعتبار امتحانات نهایی سال سوم متوسطه رشته تجربی در دو درس ادبیات­فارسی و زیست­شناسی را با بهره گرفتن از طرح­های اندازه ­گیری این نظریه تعیین نموده و همچنین روایی آن­ها را مورد بررسی قرار دهد.
علاوه بر این، این تحقیق می­ کوشد ویژگی­های روان­سنجی سوالات امتحانات نهایی را بر اساس CTT با توجه به اهمیتی که این مدل در تحلیل سوالات آزمون­های مختلف روانی- تربیتی داشته است، در کنار مدل­های نظریه پرسش- پاسخ[۷](IRT) مورد بررسی قرار دهد.
بیان مسئله
ارزشیابی پیشرفت تحصیلی فرایند منظمی است که با به کارگیری روش­های علمی، عملکرد یادگیرندگان و میزان آموخته­هایشان را می­سنجد و در مورد عملکرد آن­ها با توجه به اهداف آموزشی مورد نظر به قضاوت و داوری می ­پردازد. امتحانات نهایی سال سوم متوسطه نوعی از ارزشیابی پیشرفت تحصیلی هستند که در پایان دوره­ آموزشی اجرا می­شوند.­ از نتایج این امتحانات جهت سنجش آموخته­های دانش ­آموزان، تصمیم ­گیری در مورد رد یا قبول شدن آن­ها و نیز ارزشیابی اثر بخشی برنامه آموزشی و شیوه تدریس مدرس استفاده می­ شود. همچنین با توجه به طرح جدید سنجش و پذیرش دانشجو در کشورمان، این امتحانات پلی برای ورود به دانشگاه محسوب می­شوند. این کارکرد اخیر، بیش از پیش بر حساسیت این امتحانات می­افزاید.
زمانی این امتحانات به عنوان ابزار گزینشی کارا و سودمند تلقی می­شوند و می­توان به نتایج آن­ها اعتماد کرد که کیفیت این آزمون­ها در سطح مطلوبی باشد. به بیانی دیگر، در فرایند طراحی سوالات امتحانی و تصحیح اوراق امتحانی ملاک­های علمی و اصول روان­سنجی رعایت شود. همچنین به دلیل هماهنگ بودن این امتحانات در سطح کشوری، صحت اجرا و امنیت آن نیز تضمین شود. به منظور برنامه ریزی، اتخاذ تصمیم در حدود اختیارات، اجرا، هماهنگی و نظارت بر حسن برگزاری امتحانات ستادی تحت عنوان ستاد امتحانات در سطح استان، شهرستان، منطقه، ناحیه برای انجام وظایف مورد نظر تشکیل می­گردد و افراد زیادی در قبل، حین و بعد از برگزاری این امتحانات درگیر هستند و انجام وظیفه می­ کنند. همان­طور که حسنی و کیامنش (۱۳۸۸) نیز مطرح کرده ­اند، سازوکار امتحانات نهایی تمامی بخش­های آموزش و پرورش از وزارتخانه تا منطقه و مدارس را درگیر می­ کند. روشن است که همه این تشکیلات عریض و طویل که سراسر کشور را در بر می­گیرد، برای بالا بردن ضریب صحت اجرای امتحان است و با صحت نتایج آزمون و طراحی سوال کاملاً تفاوت دارد.
با اینکه برای طراحی سوالات این امتحانات از دبیران مجرب و آشنا با اصول طراحی سوال استفاده می­ شود با این حال در خصوص کیفیت سوالات این امتحانات و دقت عمل مصححان هنوز تردیدهایی وجود دارد و نمی­ توان با اطمینان گفت آیا اصول و قواعد آزمون سازی در مورد این سوالات رعایت می­ شود یا خیر. و آیا این امتحانات به عنوان ابزار گزینشی از روایی و اعتبار لازم برای شناسایی استعدادها برخوردارند یا نه. برای پاسخگویی به این سوالات، از علم روان سنجی و تئوری های آن استفاده می­ شود. تئوری­های روان­سنجی به دو دسته تقسیم می شوند: دسته­ی اول نظریه­ نمونه­برداری تصادفی، که این نظریه خود شامل نظریه کلاسیک آزمون و نظریه­ تعمیم­پذیری و دسته دوم شامل نظریه­ پرسش پاسخ است .
از فعالیت­های عمده و مهم متخصصان تعلیم و تربیت، ساخت و تفسیر آزمون و تحلیل سوالات آن­ها بر پایه تئوری­های جدید و پیشرفته روان­سنجی می­باشد که متأسفانه این مهم برای خیلی از متخصصان این عرصه ناشناخته است. در همین راستا، در این پژوهش ضمن بکارگیری نظریه­ های روان­سنجی، روایی و اعتبار امتحانات­نهایی دروس زیست­شناسی و ادبیات­فارسی سال سوم متوسطه رشته تجربی مورد بررسی قرار می­گیرد. همچنین این پژوهش رسالت خود را معرفی یکی از چندین حیطه ی کاربردی نظریه­ های کلاسیک، تعمیم­پذیری و پرسش - پاسخ برای شناساندن گوشه ­ای از مزایای علمی آنها و نهایتاً ایجاد رغبت برای مطالعه، پژوهش و نیز باز کردن دریچه­ی دیگری بر روی پژوهشگران می­داند.

موضوعات: بدون موضوع  لینک ثابت