چندی پیش در مطلبی با عنوان تکنولوژی وی آر در پنج سال آینده به تکنیک پردازش تصویر Foveated اشاره کردیم که به اعتقاد مایکل ایبراش دانشمند ارشد شرکت آکیولوس، تکنیک مناسبی جهت کاهش حجم پردازش تصویر است و در ضمن بر پایهی مکانیزم طبیعی چشم انسان عمل میکند.
چشم انسان
چشم انسان از دو سیستم بینایی تشکیل شده است، نخست سیستم بینایی فووییا۱ یا گودی مرکزی که بر روی شبکیه یا رتینا۲ در داخلیترین لایهی چشم و در راستای مردمک قرار گرفته است، همچنین محل این گودی در مرکز لکهی زرد یا ماکولا۳ واقع شده که بیشترین حساسیت را به نور دارد و امکان دید مستقیم با وضوح بالا را فراهم میکند. در گودی مرکزی سلولهای مخروطی که امکان دیدن رنگها و جزئیات اشیاء را برای مغز فراهم میکنند دارای بیشترین تراکم هستند. این سیستم جریان اصلی اطلاعات بصری به مغز ما است و وجود آن جهت انجام کارهایی که از حساسیت و دقت بالایی برخوردارند مانند خواندن و یا رانندگی کردن ضروری است زیرا که دیدن جزئیات بصری شرط لازم انجام آنها میباشد.
دوم سیستم بینایی پریفرال۴ یا پیرامونی است که بیشترین سطح را بر روی شبکیه دارا میباشد. این سیستم اطلاعات بصری را با فشردگی بالا و وضوح پایین به مغز منتقل میکند و یا به عبارتی مسئول انتقال اطلاعات غیر اصلی بصری به مغز است. تمامی نقاط غیر مرکزی در میدان بینایی۵ توسط این سیستم مورد پردازش قرار میگیرند. این سیستم خود به سه بخش پیرامونی دور، پیرامونی میانی و پیرامونی نزدیک تقسیم میشود که بخش پیرامونی نزدیک در اطراف سیستم بینایی اول قرار گرفته است. اگر چه اطلاعات حاصل از این سیستم بدون جزئیات بصری است اما قسمت بیشتر رنگ و حرکت در تصویر را این سیستم به مغز منتقل میکند.
سیستم پردازش تصویر Foveated
حال سیستم پردازش تصویر با عنوان فووییتد با تقلید از سیستمهای بینایی چشم انسان سعی در ایجاد کیفیتی در حد آن را دارد. هر چند این موضوع تازهای نیست و از این سیستم در حدود بیست سال است که استفاده میشود اما موضوع مهم الگوریتمهایی هستند که سعی دارند با تقلید از این سیستمهای طبیعی کارایی اجرایی خود را در واقعیت مجازی بهبود بخشند.
در حال حاضر الگوریتمهای موجود کارایی چندانی ندارند و طبق گفتهی تیم تحقیق شرکت انویدیا با ایجاد حسی مانند تونل (اطراف قاب تصویر بسیار محو و هر چه به سمت مرکز نزدیک میشویم تصویر واضحتر میشود) بیشتر موجب مختل شدن تجربهی واقعیت مجازی میگردند.
چهار تکنیک رندر یا پردازش تصویر در حال حاضر برای واقعیت مجازی قابل دسترسی است که عبارتند از:
– نوع استاندارد که در آن تمامی تصویر بهصورت کاملا واضح دیده میشود. در این شیوه حجم پردازش بسیار زیاد است و تشابهی به سیستم بینایی انسان ندارد با این وجود این اصلیترین تکنیک در پردازش و نمایش تصاویر در واقعیت مجازی است.
– Contemporary Foveation که در آن با کاهش تفکیکپذیری در بخش پیرامونی تصویر، از حجم پردازش کاسته میشود اما عدم نرمی در لبهها و جلوهی مصنوعی پلهپله شدن موجب تولید تصویری ناخوشاید میگردد.
– Temporally-Stable Foveation که در آن با محو کردن بخش پیرامونی، از حجم پردازش تصویر کاسته میشود هر چند استفاده از این تکنیک باعث حذف سوسو زدن یا فلیکر۶ که در تکنیک قبلی شاهد آن بودیم میشود ولی این نیز معایب خود را دارد، محوی زیاد در بخش پیرامونی و کاهش تدریجی آن به سمت بخش اصلی یا فوویتتد ایجاد جلوهی مصنوعی با نام tunnel-vision میکند که به آن اشاره شد.
– Contrast-Preserving Foveated Rendering که در آن با اصلاح جلوهی مصنوعی دید تونلی که در تکنیک قبلی شاهد آن بودیم و حفظ کنتراست لبهها و خطوط بیرونی سطوح، کیفیتی نزدیک به سیستم بینایی انسان تولید میگردد در عین حال از حجم پردازش تصویر نیز در بخش پیرامونی کاسته میشود. این تکنیک توسط تیم تحقیق شرکت انویدیا ایجاد شده و در حال توسعه میباشد.
اگر چه تکنیک رندر Foveated به تنهایی نمیتواند مشکل تفکیکپذیری پایین تصاویر را در واقعیت مجازی حل کند، اما با کاهش حجم پردازش و آزاد شدن بخشی از بار پردازندهی گرافیکی، از آن میتوان برای پردازش تصاویر با تفکیکپذیری بالاتر و یا واقعگرایی بیشتر استفاده کرد. در ضمن جهت کاربردی شدن آن بایستی ابزاری جهت ردیابی نگاه و حرکات چشم در هدست واقعیت مجازی جاسازی کرد تا با فرکانس بالا و زمان تاخیر پایین بتواند به درستی حرکات چشم را ردیابی و درنهایت جهت پردازش در اختیار موتور رندر فوویتد قرار دهد.
این ویدئو را در وبسایت یوتیوب مشاهده کنید.
۱ Fovea vision
۲ Retina
۳ Macula
۴ Peripheral vision
۵ Visual field
۶ flicker
منابع: Nvidia, Digital Trends
انتشار: Mabioca