چند اصل ساده را می توان از پدیده فوق به دست آورد:
تصاویر با فرکانس های فضایی بالا غالب تر از تصاویر با فرکانس های فضایی بسیار کم هستند.
از دست دادن اطلاعات با فرکانس های فضایی بالا در تصاویر تخریب شده قابل تحمل است زیرا می توان آن را به خوبی توسط تصاویر با کیفیت بالا بازیافت کرد.
بر عکس، اطلاعات نادرست که حاوی فرکانس فضایی بالا مانند کدینگ مولفه های تخریبی در تصاویر تخریب شده است می تواند وزن را به شدت در برابر اثر بخشی از درک درست سه بعدی تحت تاثیر قرار دهد.
۳-۷-۲ ارزیابی کیفیت تصویر تخریب شده
معیارهای متعارف مورد استفاده برای ارزیابی کیفیت تصویر شامل حاصل جمع قدر مطلق اختلاف[۷۴]، متوسط قدر مطلق اختلاف[۷۵] و نسبت پیک سیگنال به نویز و غیره می باشند. این روش های اندازه گیری، اختلاف بین دو تصویر را توسط تفاوت بین مقادیر مربوط به هر پیکسل محاسبه می کنند. با این حال، این روش ها شامل محتویات تصاویری که ممکن است کیفیت را تا حد زیادی تحت تاثیر قرار دهند نمی باشند.
( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )
به منظور در نظر گرفتن قابلیت تاثیر تسلط چشم بر اساس فرکانس فضایی، یک جمله میبایست به تابع اصلی ارزیابی اضافه شود:
λ(۳-۲۱)
که در این رابطه نشان دهنده مقادیر پیکسل از یک ناحیه خاص (به عنوان مثال بلوک ۴ × ۴) در تصویر تخریب شده است. متوسط قدر مطلق اختلاف به کار رفته شده به عنوان ارزیابی کیفیت متعارف می باشد در حالی که یک اصطلاح جدید برای اندازه گیری اثر نا برابری فرکانس فضایی بین تصاویر اصلی و تخریب شده است. ارزیابی نهایی از تصویر تخریبی حاصل جمع وزن شده از دو بخش با ضرب λ برای تنظیم کردن وزن می باشد.
برای محاسبه فرکانس فضایی برای ناحیه خاصی از تصویر با اندازه N×M، ابتدا فرکانس افقی و فرکانس عمودی ، به صورت زیر تعریف میشوند:
(۳-۲۲)
(۳-۲۳)
سپس فرکانس فضایی یک ناحیه را می توان با ریشه مربع از حاصل جمع درجه دوم بصورت زیر محاسبه نمود:
(۳-۲۴)
همانطور که در بخش قبلی مورد بحث قرار گرفت، فرکانس فضایی بالا همیشه غالب است (همیشه بر فرکانس های پایین تسلط دارند). با این حال، رابطه دقیق بین اختلاف فرکانس فضایی و قدرت سلطه چشم بسیار پیچیده و هنوز هم ناشناخته است. به منظور پیدا کردن یک تقریب ساده، نکته مهمی که باید مورد توجه قرار گیرد این است که مناطق تصویر با فرکانس های فضایی بسیار کم بسیار ساده تر از مناطق با فرکانس های فضایی بسیار بالا تبدیل به ناحیه غالب میشوند؛ به عبارت دیگر، تسلط چشم نه تنها از اختلاف قدر مطلق بلکه از اختلاف کنتراست فرکانس فضایی نیز تأثیر میپذیرد.
بنابراین، هنگامی که به صورت واقعی فرکانس فضایی از r به r + Δr افزایش می یابد، فرض بر این است که ® ΔE تفاوت درک شده و به صورت زیر می باشد:
(۳-۲۵)
لذا اثر درک شده از فرکانس فضایی بصورت زیر است:
(۳-۲۶)
که در آن K ثابت نامشخص است و و به ترتیب فرکانس های فضایی برای یک زوج از مناطق مربوطه در تصاویر اصلی و تخریب شده هستند. می توان در نظر گرفت که ناحیه ای از تصویر تخریب شده، تاثیر بسیار کمی روی تصویر با کیفیت بالا در شرایطی که کمتر از است، می گذارد. در غیر این صورت، تاثیر منفی از تصویر تخریب شده بصورت زیر است:
(۳-۲۷)
پس عبارت نهایی به صورت زیر خواهد بود:
(۳-۲۸)
که در این رابطه نشان دهنده مقادیر پیکسلهایی در تصویر اصلی با کیفیت بالا از همان ناحیه متناظر با است. در ادامه مطالب، اندازه ناحیه بلوک ۴×۴ فرض شده است.
به منظور ارزیابی کیفیت تصویر تخریب شده، می توان معادله قبل را داخل معادله اول جایگزین کرد و از آن به عنوان یک معیار به طور مستقیم استفاده نمود. با این حال، باید ابتدا تعیین نمود که مقدار ضریب λ چگونه تعیین شود. این کار می تواند از دو لحاظ در معادله اول سخت باشد، یکی اندازه های مختلف و دیگری مقدار دامنه های متفاوت. برای جلوگیری از این مشکل، یک روش دو مرحله ای در بررسی کیفیت ارائه شده:
مرحله ۱: برای یک بلوک جدید ۴×۴، MAD برای اولین بار محاسبه شده است. اگر نتیجه d بزرگتر از مقدار ثابت باشد (به اندازه کافی بزرگ باشد)، مقدار d به عنوان نتیجه ارزیابی در نظر گرفته شده و سپس به مرحله ۱ برای پردازش بلوک بعدی میرویم، در غیر این صورت به مرحله ۲ میرویم.
مرحله ۲: محاسبه برای بلوک ۴×۴ کنونی و در نظر گرفتن آن به عنوان نتیجه ارزیابی. در ادامه رفتن به مرحله ۱ برای بلوک بعدی.
این روش می تواند برای ارزیابی کیفیت تصویر تخریب شده در زوج تصویر سه بعدی به طور موثر استفاده شود. ناحیه تخریب شده با فرکانس های فضایی بالا تاثیر زیادی در ادراک سه بعدی دارد، در حالی که برای منطقه صاف (هموار در تصویر)، از دست دادن اطلاعات قابل تحمل است زیرا می توان به خوبی توسط دیدگاه با کیفیت بالا آن را بازیافت کرد.
۳-۸ کیفیت درک شده از تصاویر سه بعدی فشردهسازی شده بر اساس تأثیرات کدینگ JPEG متقارن و نامتقارن
۳-۸-۱ کدینگ نامتقارن و کیفیت درک شده تصویر
بر اساس نظریه های دید دو چشمی، فرض بر این است که درک دید دو چشمی از یک زوج تصویر استریو، تحت تاثیر مولفه های با کیفیت بالا می باشد؛ بنابراین از نظر تئوری، زمانی که تصویری از زوج استریو فشرده سازی شده باشد به طوری که کیفیت بالای آن حفظ شده باشد، تصویر دیدگاه دیگر می تواند با شدت بیشتری بدون معرفی مولفه های تخریبی قابل مشاهده در ادراکات دو چشمی کد شود. این مفهوم با عنوان رزولوشن ترکیبی توسط پرکینز (در سال ۱۹۹۲) معرفی شد. کدینگ رزولوشن ترکیبی بر این فرض است که ادراک دید دو چشمی هنگامی که یک دیدگاه از کیفیت بالا و دیدگاه دیگر از کیفیت پایین تری برخوردار است، تحت تاثیر مولفه های تخریبی قرار نمی گیرد. پرکینز (در سال ۱۹۹۲) فیلتر پایین گذر (افزودن تاری) را به عنوان الگوریتم فشرده سازی که منجر به یک تصویر با رزولیشن بالا و یک تصویر با رزولیشن پایین برای هر دیدگاه از یک زوج تصویر استریو می شد را اعمال کرد. می توان نتیجه گیری کرد که کدینگ رزولیشن مخلوط شده به آسانی قابل اجرا می باشد و کاهش نرخ بیت حاصل در مقایسه با سیستمی که هیچ کدینگی در آن اعمال نشده، چشمگیر می باشد. تام و همکارانش (در سال ۱۹۹۸) یک نسبت فشرده سازی مختلف در دیدگاه های چشم چپ و راست را از یک دنباله سه بعدی با بهره گرفتن از MPEG-2 (معرفی کردن مسدود کردن[۷۶]) و فیلتر پایین گذر (معرفی کردن تاری) را اعمال کردند. نتایج نشان داد که کیفیت تصویر ذهنی از یک دنباله استریو به طور متوسط از کیفیت تصاویر دوبعدی چشم چپ و راست هنگامی که کدینگ MPEG-2 مورد استفاده قرار گرفت، بیشتر بود. کیفیت ذهنی یک دنباله تصاویر استریو که بطور نامتقارن از فیلتر پایینگذر عبور کرده اند، تحت سلطه مولفه با کیفیت بالا بود. میگن[۷۷] و همکارانش (در سال ۲۰۰۱) ترکیب دید دو چشمی از تاری نامتقارن و بلوکه شدن نامتقارن را مورد بررسی قرار دادند. در حالت تصاویر نامتقارن تار (دچار اختلال شده)، دید دو چشمی ادراک شده تحت سلطه مولفه های با کیفیت بالا بود. ادراک دید دوچشمی از تصاویر دچار اختلال شده MPEG-2 نامتقارن تقریبا میانگینی از دو مولفه دوبعدی بود. پس می توان نتیجه گرفت که موفقیت در کدینگ نامتقارن بستگی به نوع مولفه های تخریبی کدینگ دارد.
۳-۸-۲ عمق درک شده
استفاده از اطلاعات اختلافی، حس فوتی و فوری از عمق تولید می کند که ارزش افزوده ناشی از تلویزیون های سه بعدی را بیان می کند. آیسلستاین[۷۸] و همکارانش (در سال ۱۹۹۸) به بررسی درک از عمق و طبیعی بودن عمق، هنگام دیدن مواد تصویر سه بعدی پرداختند. به محض این که اختلاف دو چشمی معرفی شد، رتبه بندی از عمق درک شده و طبیعی بودن عمق، توسعه پیدا کرد. تحقیقات وستیمر[۷۹] و مک کی (در سال ۱۹۸۰) نشان دهنده کاهش در آستانه عمق سه بعدی به ویژه با اعمال تاری نامتقارن بزرگتر، میباشد. استلمچ[۸۰] و همکارانش (در سال ۲۰۰۰) به بررسی اثر فیلتر پایین گذر مکانی و زمانی بر روی عمق درک شده برای زوج های استریو متقارن و نامتقارن پرداختند. نتایج نشان می دهد که فیلتر پایین گذر فضایی، هیچ تاثیری بر روی عمق درک شده ندارد. فیلتر پایین گذر زمانی باعث تضعیف کیفیت تصویر می شد اما در احساس و ادراک عمق نسبتا بیتاثیر بود. یک توجیح این است که فیلتر پایین گذر تنها فرکانس های فضایی کم را باقی می گذارد که برای محفوظ داشتن سیگنال اختلاف دید، کافی است. بر اساس مطالعات آنها عمق، ارتباط ضعیفی با کیفیت تصویر و وضوح دارد. این نتایج نشان می دهد که عمق یک بعد از تجربه ادراکی است که تا حد زیادی مستقل از وضوح و کیفیت کلی تصویر است. به نظر می رسد این موضوع در تضاد با نتایج حاصل از بررسی آیسلستاین و همکارانش (در سال ۲۰۰۰) می باشد که در آن کیفیت تصویر درک شده می تواند به عنوان یک تابع از عمق درک شده و فشار چشم تجربه شده، بیان شود. این نتایج با بهره گرفتن از تصاویر غیر فشرده که از لحاظ فاصله پایه دوربین، فاصله همگرایی و فاصله کانونی، متفاوت هستند به دست آمده است. تعدادی محرک شامل اختلاف های بیش از حد می باشند، بنابراین به احتمال زیاد افراد کیفیت آنها را بر مبنای ویژگی های مختلفی از تصویر پیش بینی می کنند که با مطالعات و نتایج استلمچ و همکارانش (در سال ۲۰۰۰) در تضاد است.
۳-۸-۳ وضوح درک شده
وضوح درک شده در تصاویر سه بعدی می تواند بوسیله پارامترهای مختلف تحت تاثیر قرار گیرد، به عنوان مثال، دوربین defocus، کدینگ و یا اختلاف دو چشمی. برتولد (در سال ۱۹۹۷) گزارش داد که تصاویر استریو با درجات مختلف از تاری گوسین نسبت به تصاویر غیر استریو واضح تر درک شده بود. از سوی دیگر تام و همکارانش (در سال ۱۹۹۸) متوجه شدند که نمونه های ارزیابی شده متقارن استریو کد شده بر اساس استاندارد MPEG-2 و تصاویر غیر استریو به همان اندازه تیز یا حتی تصاویر استریو کمتر دارای تیزی می باشند. یک همبستگی بالا بین وضوح تصویر و کیفیت آن در دو مطالعه پیدا شد. استلمچ و همکارانش (در سال ۲۰۰۰) اثر رزولوشن مخلوط شده با وضوح درک شده را مورد مطالعه قرار دادند و به این نتیجه رسیدند که فیلتر پایین گذر فضایی، وضوح قابل قبولی ارائه می دهد. وضوح از تصویر دیدگاه با تفکیک پذیری مکانی بیشتر تأثیر میگرفت. از سوی دیگر، فیلتر پایین گذر زمانی تصاویر بسیار ضعیف با لبه های تار شده بوجود می آورد. میگن و همکارانش (در سال ۲۰۰۱) این یافته ها را در یک آزمایش اندازه گیری میزان تاری در تصاویر استریو پردازش شده بصورت نامتقارن، تایید کردند. هنگامی که تصویر دیدگاه با کیفیت پایین تر شامل مولفه های تخریبی تاری باشند، تصویر دیدگاه با کیفیت بالاتر در سیستم بصری، وزن بیشتری خواهد داشت.
۳-۸-۴ فشار چشم درک شده
در بسیاری از مطالعات تصاویر سه بعدی در برابر تصاویر دوبعدی دارای ارجحیت هستند (آیسلستاین و همکارانش در سال ۱۹۹۸، فریمن و اونس[۸۱] در سال ۲۰۰۰، یانو و یویاما[۸۲] در سال۱۹۹۱). به هر حال مشاهده تصاویر استریو می تواند باعث ایجاد خستگی بیشتر نسبت به دیدن تصاویر دوبعدی معمولی شود؛ زیرا فشار چشم می تواند در نمایشگرهای سه بعدی بسیار آزار دهنده باشد، مهم است که به درک درستی از اهمیت ذهنی و تاثیر آن بر روی کاربر بتوان رسید. آیسلستاین و همکارانش (در سال ۲۰۰۰) به بررسی اثر پارامترهای سه بعدی فیلمبرداری و مدت زمان نمایش، بر روی ارزیابی ذهنی از فشار چشم پرداختند. میانگین نتایج به دست آمده از فشار چشم یک افزایش خطی مشخص با افزایش تفاوت دو چشم را نشان می دهد. هیچ اثر قابل توجهی در مدت زمان نمایش بروی میزان فشار چشم وجود ندارد، اما مدت زمان نمایش داده شده نسبتا کوتاه بود (۱-۱۵ ثانیه). میتسوهاشی[۸۳] (در سال ۱۹۹۶) متوجه شد که ناظران فشار چشم بیشتری را برای دید دو چشمی نسبت به تصویر تلویزیون های معمولی، با بهره گرفتن از اندازه گیری های عینی شناخته شده به عنوان فلیکر[۸۴] فرکانس بحرانی[۸۵] تجربه کردند. فرکانس فلیکر بحرانی بالاترین فرکانسی است که در آن یک شخص خاص هنوز هم می تواند فلیکر را ببیند. این موضوع در فرکانس بالاتر، شخص یک منبع نوری پایدار را می بیند. تماشای تلویزیون سه
[چهارشنبه 1400-09-24] [ 11:26:00 ق.ظ ]
|