ژن­ها دارای اطلاعاتی هستند که این اطلاعات ویژگی­های انسان را می سازد.ژن­ها ازترکیب پایه­ای به نام نوکلئوتید تشکیل شده ­اند. ترکیب پایه از۴­­ساختار تشکیل شده است"ادنینA[3]/گوانینG[4]/سیتوزینC[5]/ تیمینT[6]“در حقیقت برای بیان هر ژن از۴حرفA,T,C,Gاستفاده می­کنیم که اصطلاحا به آن توالی نوکلئوتیدی گفته می­ شود.

(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))

توالی ژن­های مربوط به بیماری­ها در بدن انسان­های نرمال به یک شکل است و بیماری زمانی اتفاق می افتد که در این توالی تغییری ایجاد شود.البته طول توالی نوکلئوتیدی بیماری­های مختلف با یکدیگر متفاوت هستند.به طور مثال طول توالی ژن انسولین۳۳۳کاراکتر است. تا کنون بیشترین طول توالی نوکلئوتیدی شناخته شده مربوط به بیماری دوشن می­باشد. طول این توالی۲٫۳مگا می­باشد.
به عنوان مثال­هایی از بیماری­های ژنتیکی می­توان از زالی، سرطان های پوست، عقب افتادگی­ذهنی، کم خونی داسی شکل، فنیل کتونوری، تالاسمی و نظایر آن نام برد]۲[.
برخی از مواردی که بررسی­های ژنتیکی انجام می­پذیرد به شرح ذیل است:

    • زوجی که قصد تشکیل خانواده دارند و یکی از آن­ها یا یکی از خویشان نزدیک او دچار بیماری ارثی است.
    • فردی که فرزندی با یک نقص مادرزادی حاد دارد.
    • کودکی با یک مشکل جسمی که می‌تواند ژنتیکی باشد.

برای انجام این تست­های ژنتیکی در وهله اول نیاز به داشتن شجره­نامه زوجین در هنگام تشکیل خوانواده، والدین در هنگام تست­های بارداری و بیمار در هنگام بررسی یک بیمار ژنتیکی داریم. پس از دانستن شجره­نامه در هنگام برخورد با بیماری­ها نیاز به ذخیره اطلاعاتی درباره بیمار داریم.
برای ذخیره داده ­های مربوط به بیماری­های ژنتیکی نیاز به پایگاه­داده­­ای داریم که بتواند به خوبی از ذخیره انواع داده ها پشتیبانی کند. برای این داده ها نیاز به مدل­داده­ای داریم که بتواند علاوه بر ذخیره این داده ­ها به بررسی و تجزیه تحلیل این داده ­ها بپردازد. یکی از مسایل مهم برای انتخاب مدل ­داده این است که در مورد داده ­های پزشکی برای هر بیمار ممکن است خصوصیاتی را ذخیره کنیم که برای دیگر بیماران نیازی به آن نداشته باشیم مثلا ممکن است برای یک بیمار نیاز به ذخیره جواب آزمایش خون داشته باشیم اما برای بیمار دیگر نیاز به انجام این تست و ذخیره این آزمایش نداشته باشیم و یا ممکن است در حین بررسی شرایط بیمار به مواردی برخورد کنیم که از ابتدا پیش بینی نشده بود، به این دلیل بهتر است از ابتدا یک طرح کلی برای پایگاه­داده طراحی نشود تا بتوانیم هر خصوصیتی را که نیاز داشتیم یا در حین کار با آن مواجه شدیم برای بیمار اضافه کنیم.با توجه به این موضوع به این نتیجه می رسیم که از پایگاه­داده های SQL نمی­توانیم استفاده کنیم و پایگاه­داده های NOSQL برای این امر مناسب­تر هستند.
مسئله مهم دیگر این است که با توجه به نیاز به ژنتیک اعضای خانواده و نسل­های قبل بیمار باید توانایی افزودن موجودیت­ها(نسل های قبل و بعد)ی جدید را در حین انجام تحقیقات به این پایگاه­داده داشته باشیم. در مورد انتقال بیماری­ها تشخیص مسیر انتقال بیماری اهمیت ویژه­ای دارد زیرا باید مشخص شود که بیماری از پدر یا مادر، در مرحله بعد از کدام یک از اجداد به ارث رسیده و همینطور تشخیص داده شود که این بیماری ممکن است به کدام یک از فرزندان دختر یا پسر به ارث برسد. به این دلیل باید پایگاه­داده­ای طراحی کنیم که قابلیت استخراج روابط بین موجودیت­ها را دارا باشد. البته روابط بین موجودیت­ها در پایگاه­داده ­های رابطه­ای نیز قابل استخراج است اما اولا به دلیل نیاز به نوشتن رویه­های تو­در­تو امر بسیار پیچیده و زمان بر است ثانیا در مدل­داده گراف می­توانیم بر روی یال­ها نیز خصوصیاتی را برای ارتباط موجودیت­ها تعریف کنیم. با توجه به این سه مسئله به این نتیجه می­رسیم پایگاه­داده گرافی بهترین انتخاب برای این نوع بیماری ها است.
در این پایان نامه با بهره گرفتن از مدل­داده گراف پایگاه­داده­ای را طراحی خواهیم کرد که توانایی ذخیره انواع و حجم­های مختلف داده را دارا باشد. پایگاه­دادهطراحی شده باید قابلیت انجام عملیات برروی این داده های ذخیره شده را داشته باشد و بتواند نتایج مورد نظر در بررسی انتقال بیماری­های ژنتیکی را ازآن استخراج کند. نتایجی مانند مسیر انتقال بیماری،امکان انتقال بیماری به نسل بعد یا امکان انتقال بیماری به جنسیت خاصی از نسل بعد، درصد انتقال بیماری و …
در این پایـگاه­داده موجودیت­ها که همان افراد هستند درون گره­ها ذخیره می­شوند، در گره­ها علاوه
بر مشخصات عمومی بیماران تمام اطلاعات مربوط به بیــماری افراد، شرایط و علائم بیماران نیز ذخیره
می­شوند. در سطوح بعدی گراف، نسل­های بالاتر بیماران همراه با اطلاعات مربوط به بیماری مخصوصی
که در حال تحقیق در مورد آن هستند ذخیره خواهد شد. برای نمایش روابط بین افراد در این مدل­داده از
یال­ها استفاده خواهیم کـــرد. به این صورت که اگر بیماری از شخصی به شخص دیگری انتقال یافت از
یال جهت­دار برای نمایش این انتقال استفاده خواهیــم کرد. علاوه بر این­ها می­تـــوانیم بر روی یال­هـــا
توضیحاتی را نیز اضافه نمائیم. توضیحاتی مانند درصد احتمال انتقال یک بیماری خاص از یک فرد به­فرد
دیگر.

۱-۳-اهمیت و ضرورت انجام تحقیق

تا کنون از چند مدل­داده برای ذخیره اطلاعات پزشکی استفاده شده است اما هر یک از این مدل­داده ها دارای معایبی هستند که باعث می­شوند مدل­داده­ی ایده­آلی نباشند. یکی از این مدل­داده ­ها مدل­داده ی رابطه­ای می­باشد.برخی از داده­هایی که باید توسط پایگاه­داده ذخیره و بررسی شود مانند نتایج رادیولوژی بیماران، نوار قلب و…به صورت تصویر هستند بنابراین پایگاه­داده باید قادر به ذخیره داده­هایی از قبیل تصویر باشد اما این مدل­داده قادر به پشتیبانی از برخی از انواع داده نظیر صوت و تصویر نمی ­باشد. همچنین در این نوع پایگاه­داده که برای تعریف داده ­ها باید شمای از پیش تعریف شده داشته باشیم، قادر به افزودن موجودیت­های جدید نمی­باشیم و یافتن روابط بین افراد کار بسیار پیچیده و زمان­بری می باشد.
مدل­داده­ی بعدی که مدل­داده­ی شی رابطه­ای می­باشد با بهره گرفتن از طراحی EAVبه خوبی از عهده مشکل شمای از پیش تعیین شده و تعریف فرمت داده های مختلف بر می ­آید اما همچنان مشکل روابط بین افراد باقیست.
اما با بهره گرفتن از مدل­داده گراف می­توانیم مدل­داده­ای را برای بیماری های ژنتیکی پیاده سازی کنیم که از فرمت­های مختلف داده و حجم داده ها در حوزه­ بیماری های ژنتیکی پشتیبانی کند. این مدل­داده می ­تواند به راحتی موجودیت­های جدید را اضافه کند و در حین کار اگر نیاز به افزودن صفات جدید برای موجودیت­ها داشتیم این کار به راحتی امکان­ پذیر می­باشد. با این مدل­داده روابط بین افراد به دلیل استفاده از یال­ها به راحتی قابل ارزیابی و نتیجه ­گیری می­باشد.

۱-۴-جنبه جدید بودن و نوآوری در تحقیق

در این تحقیق با توجه به فرمت و حجم داده ­های موجود در بررسی انتقال بیماری­های ژنتیکی و اهمیت بررسی روابط بین افراد در این نوع بیماری واین امر مهم که برای هر بیمار ممکن است نیاز به ذخیره داده ­های خاصی داشته باشیم، بنابراین قادر به تعریف شمای از پیش تعیین شده نیستیم، همین طور نیاز به افزودن موجودیت­های جدید در حین انجام کار، پایگاه­داده مناسبی طراحی می­کنیم تا قادر به پشتیبانی از این مسائل باشد.

۱-۵-اهداف مشخص تحقیق

طراحی مدل داده ای جهت پشتیبانی از ذخیره و بررسی فرمت­های مختلف داده ­های تولید شده در مسیر کشف انتقال بیماری­های ژنتیکی.
توانایی افزودن یک موجودیت جدید در هر زمان و هر مرحله مورد نیاز.
-توانایی افزودن یک صفت جدید برای هر موجودیت خاص در هر زمان و هر مرحله مورد نیاز.

۱-۶-مروری بر ساختار پایان نامه

در این پایان نامه مدل داده­ای مناسب برای ذخیره داده ­های مربوط به بیماری های ژنتیکی طراحی خواهیم نمود. در فصل اول پایان نامه به طور کلی در مورد موضوع و اهداف و دلیل این کار صحبت خواهیم نمود. در فصل دوم مفاهیم مورد نیاز برای آشنایی با موضوع مورد بحث مانند انواع پایگاه داده و بیماری ها و ذخیره داده های پزشکی را بیان خواهیم نمود.
در فصل سوم با کارهایی که در گذشته در این خصوص انجام شده است آشنا خواهیم شد و مشکلات و ضعف های این راه ها را بیان خواهیم نمود.در فصل چهارم پرس و جوهای مورد نیاز در مورد بیماری های ژنتیکی را بیان خواهیم نمود و مدل داده ای را طراحی خواهیم نمود تا از این نیاز ها پشتیبانی نماید.

فصل دوممفاهیم

۲-۱-مقدمه

برای ذخیره داده ­ها می توان از پایگاه­داده و مدل­داده ­های مختلفی استفاده نمود.به طور کلیمدل­داده ­ها به دو نوع مدل­داده ­های ساخت یافته و غیر ساخت یافته تقسیم می­شوندو هر یک از این دو نوع دسته بندی­های مختلفی دارند و از داده ­های مختلفی با ویژگی­های مختلف پشتیبانی می­ کنند که در خصوص انتخاب پایگاه­داده باید به درستی تصمیم گرفته شود تا پایگاه­داده به خوبی مدیریت داده ­ها را انجام دهد.
در این بخش با انواع مدل­داده و مفهوم مدیریت داده ­ها آشنا می­شویم. همچنین داد­ه­های پزشکی را بررسی می­نماییم و با توجه به خصوصیات داده ­های پزشکی به نتیجه­ مناسب در خصوص انتخاب پایگاه­داده می­رسیم.

۲-۲-مدل داده چیست؟

مدل کردن داده(data modeling)روشی است برای توصیف داده ­ها و عملیات روی آن­ها در پایگاه داده.به وسیله مدل­داده ما می­توانیم نوع داده ­های ذخیره شده درون پایگاه­داده را مشخص کنیم. یعنی اینکه این پایگاه­داده از چه نوع داده­هایی پشتیبانی می­ کند زیرا تمام پایگاه­داده ­ها از تمام انواع داده ­ها پشتیبانی نمی­کنند به عنوان مثال پایگاه­داده رابطه­ای نمی­تواند داده­هایی مانند صوت و تصویر را درون خود ذخیره و بازیابی کند،علاوه بر این با توجه به مدل­داده حجم داده ­ها­یی که می­توانند درون پایگاه ذخیره شوند نیز مشخص می­ شود]۹[.
مدل­داده مشخص می­ کند که بر روی داده ­های ذخیره شده درون پایگاه­داده چه عملیاتی را می­توانیم انجام دهیم.برای مثال در مدل رابطه‌ای عملیاتی همچون گزینش (selection)،طرح ریزی(projection) و اتصال (join­)تعریف می‌‌گردد.علاوه براینمدل­داده تعیین می­ کند یک پایگاه­داده چگونه داده ­های درون خود را به کاربران و برنامه ­های کاربردی نمایش دهد.
هر مدل­داده باید از ۳ جنبه زیر پشتیبانی کند:
ساختمان­های داده
یکی از عناصر اصلی مدل­داده ساختمان داده است. یعنی مدل­داده باید نحوه نمایش موجودیت­ها را مشخص کند و همچنین عملیاتی که برروی این موجودیت­ها انجام می گردد. یعنی هر مدل­داده باید دارای نماد­هایی برای نمایش انواع موجودیت، انواع صفات خاصه و انواع ارتباط بین موجودیت­ها باشد.جامعیتهر مدل­داده باید راه کارهایی برای تضمین اعتبار داده ­ها در پایگاه­داده داشته باشد. به عبارتی باید بتوان داده های نامعتبر را تشخیص دهد و از ورود این داده ­ها به پایگاه­داده جلوگیری کند. به این قوانین اصطلاحا جامعیت می­گویند.
عملیاتیک مدل­دادهباید بتواند مجموعه عملیاتی را تعریف کند که می تواند روی داده های ذخیره شده در پایگاه­داده انجام شود. این عملیات امکان کار با داده را می­ دهند مانند اضافه،حذف، جستجو، ویرایش و بازیابی داده.
از نظر کلی مدل­داده ها به دو نوع ساخت یافتهوغیرساخت­یافته تقسیم می­شوند.

۲-۲-۱-مدل های داده ساخت یافته

مدل­داده ­های ساخت یافته از دستورات SQLبرای نوشتن پایگاه­داده استفاده می­ کنند و برای استفاده از آن­ها باید فرمت داده­هایی را که قصد ذخیره آن­ها را داریم از قبل تعریف کنیم. مدل­داده ­های ساخت یافته به ۳دسته تقسیم می­شوند که در ادامه با هر یک از آن­ها آشنا می­شویم.

۲-۲-۱-۱-مدل داده رابطه­ای

پایگاه­داده رابطه­ای از دید کاربرانیک مجموعه از جدول­هایی است که به درستی قابل درک می باشند.سه مفهوم اساسی در این مدل به شرح زیر وجود دارد:۱-جدول ۲-ستون­ها ۳-سطرها.این مدل براساس جدول دوبعدی(سطر و ستون)بنا شده است. همین امر امکان بازیابی سریع داده ­ها را فراهم میکند.هر جدول مربوط به یک موجودیت است و هرسطر نشان دهنده یک نمونه از آن موجودیت می­باشد.هر جدول شامل رکوردها(ردیف)و صفات یا فیلدها(ستون)است]۳[.

موضوعات: بدون موضوع  لینک ثابت