مدل کانتور فعال
مدل کانتور فعال(به انگلیسی: Active contour model)، که مدل مارها (به انگلیسی: snakes) نیز نامیده میشود، یک چارچوب در بینایی رایانه ای است که توسط مایکل کاس، اندرو ویتکین و دمتری ترزوپولوس معرفی شده، و برای ترسیم خطوط خارجی یک شیء، از یک تصویر دو بعدی احتمالاً پر نویز تعریف شدهاست.[۱] مدل مارها در دیدگاه رایانهای محبوب است و این مدل بهطور گسترده در برنامههای کاربردی مانند ردیابی شی، تشخیص شکل، تقسیمبندی، آشکارسازی لبه و تطبیق استریو مورد استفاده قرار میگیرد.
مدل مار یک انرژی کمینه کننده و اسپلاین قابل اصلاح است که تحت تأثیر محدودیتها و نیروهای تصویر است که آن را به سمت کانتورها و نیروهای داخلی متصل میکند که مقاومت در برابر تغییر شکل را دارند. مدل مارها ممکن است به عنوان یک مورد خاص از روش کلی تطبیق یک مدل ناپایدار به یک تصویر با استفاده از به حداقل رساندن انرژی درک شوند.[۱] در دو بعد، مدل شکل فعال، یک نسخه گسسته این رویکرد را نشان میدهد، با استفاده از مدل توزیع نقطه برای محدود کردن محدوده شکل به یک دامنه صریح از یک مجموعه آموزشی یاد میشود.
مارها کل مشکل پیدا کردن خطوط در تصاویر را حل نمیکنند، زیرا این روش نیاز به دانش قبلی شکل کانتورهای طرحی شده دارد. در عوض، آنها به مکانیزمهای دیگر مانند تعامل با یک کاربر، تعامل با برخی از فرایندهای درک تصویری سطح بالاتر یا اطلاعاتی از دادههای تصویر مجاور در زمان یا فضا بستگی دارد.
انگیزه و هدف
[ویرایش]در دیدگاه رایانه، مدلهای کانتور، مرزهای شکل در یک تصویر را توصیف میکنند. مدل مارها بهطور خاص طراحی شدهاند تا مشکلات را حل کنند که در آن شکل تقریبی مرز شناخته شدهاست. با داشتن یک مدل تغییر شکلپذیر، مارها میتوانند به تفاوت و نویز در تطبیق استریو و ردیابی حرکت سازگار شوند. علاوه بر این، این روش میتواند خطوط غیرواقعی در تصویر را با نادیده گرفتن اطلاعات مرزی گم شده پیدا کند.
در مقایسه با تکنیکهای استخراج ویژگی کلاسیک، مدل مارها مزایای متعددی دارند:
- آنها مستقل و سازگارانه برای حداقل حالت جستجو میکنند.
- نیروهای تصویری خارجی به شیوه ای بصری بر روی مار عمل میکنند.
- ترکیب کردن Gaussian smoothing در تابع انرژی تصویر، حساسیت مقیاسی را نشان میدهد.
- آنها میتوانند برای ردیابی اجزای در حال حرکت مورد استفاده قرار گیرند.
اشکالات کلیدی روش سنتی مارهای عبارتند از:
- آنها به حالتهای مینیمم محلی حساس هستند، که با تکنیکهای انجماد شبیهسازی شده میتوانند خنثی شوند.
- ویژگیهای جزئی اغلب در طول کاهش انرژی در سراسر کانتور نادیده گرفته میشوند.
- دقت آنها بستگی به تدبیر همگرا دارد.[۲]
فرمول انرژی
[ویرایش]یک مار قابل ارتجاع ساده با مجموعه ای از نقطه تعریف میشود که ، ترم انرژی درونی انعطافپذیر ، و انرژی بر اساس لبه خارجی نامیده میشود. هدف از اصطلاح انرژی درونی، کنترل تغییرات ساخته شده در مار است و هدف از اصطلاح انرژی خارجی، کنترل اتصالات کانتور بر روی تصویر است. انرژی خارجی معمولاً ترکیبی از نیروهای مربوط به خود تصویر و نیروهای محدود کننده معرفی شده توسط کاربر است.
عملکرد انرژی مارها مجموع انرژی خارجی و انرژی داخلی آن است یا به عبارتی:
انرژی درونی
[ویرایش]انرژی داخلی مار از تداوم کانتور تشکیل شدهاست و صافی کانتور .
میتوان به صورت زیر گسترش داد:
که و وزن تعریف شده توسط کاربر هستند که حساسیت عملکرد انرژی داخلی به مقدار کشش در مار و مقدار انحنای مار را محاسبه میکند و به این ترتیب تعداد محدودیتهای شکل مار را کنترل میکند. در عمل، وزن بزرگ برای مدت زمان تداوم تغییرات در فاصله بین نقاط در کانتور را جبران میکند. وزن بزرگ برای مدت زمان نرم شدگی، نوسانات در کانتور را جبران میکند و خطوط را به عنوان یک صفحه نازک عمل میکند.
انرژی تصویر
[ویرایش]انرژی در تصویر برخی از ویژگیهای تصویر است. این یکی از رایجترین اصلاحات در روشهای مشتق شدهاست. ویژگیها در تصاویر و تصاویر خود را میتوان در بسیاری از روشهای مختلف پردازش شدهاست. برای یک تصویر ، خطوط، لبهها و انتهای موجود در تصویر، فرمول بندی کلی انرژی به دلیل تصویر است:
- ,
جایی که، , , وزن این ویژگیهای برجسته هستند. وزنهای بالاتر نشان میدهد که ویژگی برجسته سهم بیشتری نسبت به نیروی تصویر داشتهاست.
خط عملکردی
[ویرایش]تابع خط است که شدت تصویر است که میتواند به عنوان نشان داده شود
نشانه ای از تعیین خواهد کرد که آیا خط به خطوط تاریک یا خطوط نور جذب خواهد شد. برخی از کاهش صوت یا نویز ممکن است بر روی تصویر استفاده شود، و سپس عملکرد تابع خط به نظر میرسد
لبه کاربردی
[ویرایش]لبه عملکردی بر اساس شیب تصویر است. یک اجرای این است
یک مار که دور از کانتور مورد نظر قرار دارد ممکن است به اشتباه به حداقل محلی نزدیک شود. به منظور اجتناب از این کمینههای محلی، میتوان از ادامه فضای مقیاس استفاده کرد. این با استفاده از یک فیلتر تاری در تصویر به دست میآید و به میزان محاسبه میشود که محاسبات پیشرفت میکند تا تناسب مار را اصلاح کند. عملکرد انرژی با استفاده از مقیاس فضا ادامه دارد
جایی که گاوسی با انحراف معیار است. حداقل این تابع در عبور از صفر قرار دارد که لبهها را بر اساس نظر مارر هیلدرت تعریف میکنند.
خاتمه عملیات
[ویرایش]انحنای سطوح سطح در یک تصویر تقریباً صاف میتواند برای تشخیص گوشهها و انتهای یک تصویر استفاده شود. با استفاده از این روش، تصویری که توسط
با زاویه شیب
- ,
بردارهای واحد در امتداد جهت گرادیان
- ,
و بردارهای واحد عمود بر جهت گرادیان
عملکرد خاتمه انرژی به صورت زیر نشان داده میشود:
انرژی محدود
[ویرایش]بعضی از سیستمها، از جمله پیادهسازی مارها اصلی، برای تعامل کاربر برای هدایت مارها، نه تنها در موقعیت اولیه، بلکه در شرایط انرژی آنها، امکانپذیر است. چنین محدودیتی انرژی میتواند بهطور تعاملی هدایت مار به سمت یا دور از ویژگیهای خاص مورد استفاده قرار گیرد.
بهینهسازی از طریق رسیدن به گرادیان
[ویرایش]با توجه به یک حدس اولیه برای یک مار، عملکرد انرژی مار بهطور تکراری کمینه میشود. به حداقل رساندن گرادیان کاهشی یکی از سادهترین بهینهسازیها میباشد که میتواند برای به حداقل رساندن انرژی مار استفاده شود.[۴] هر تکرار یک گام در شیب منفی نقطه با اندازه گام کنترل شدهاست برای پیدا کردن مینیممهای محلی این به حداقل رساندن شیب نزولی میتواند به عنوان مثال پیادهسازی شود
جایی که نیروی مار است که توسط منفی گرادیان میدان انرژی تعریف میشود.
با فرض وزن و ثابت با توجه به ، این روش تکرار میتواند به سادهتر شدن باشد
تقریب گسسته
[ویرایش]در عمل، تصاویر دارای وضوح محدود هستند و تنها میتوانند بر روی گامهای زمانی محدود قرار گیرند. به این ترتیب تقریبهای گسسته باید برای اجرای عملی مارها ساخته شود. عملکرد انرژی مارها میتواند با استفاده از نقاط گسسته مارها تقریباً محاسبه شود.
به همین ترتیب، نیروهای مار را میتوان تقریبی به عنوان
تقریب گرادیان را میتوان با استفاده از هر روش تقریبی محدود با توجه به s, مانند اختلاف محدود.
بیثباتی عددی به دلیل زمان گسسته
[ویرایش]معرفی زمان گسسته به الگوریتم میتواند به روز رسانیهایی ارائه کند که مارها از حداقلها جذب شدهاست؛ این بیشتر میتواند منجر به نوسانات در اطراف حداقل شود یا منجر به کمینههای مختلف یافت شود.
این را میتوان از طریق تنظیم گام زمانی که اندازه گام هرگز بیشتر از یک پیکسل به علت نیروهای تصویر است، اجتناب کنید. با این حال، در مناطق کم انرژی، انرژیهای داخلی بر روی به روز رسانی تسلط دارند.
بهطور متناوب، نیروهای تصویر میتوانند برای هر مرحله عادی شوند به طوری که تصویر فقط مارها را به صورت یک پیکسل به روز میکند. این را میتوان به عنوان فرموله کرد:
جایی که نزدیک به مقدار اندازه پیکسل است. این مسئله از غلبه بر انرژیهای داخلی که از تنظیم گام زمان جلوگیری میکند.[۵]
بیثباتی عددی به دلیل فضای گسسته
[ویرایش]انرژی در یک تصویر مداوم ممکن است عبور صفر داشته باشد که به عنوان یک پیکسل در تصویر وجود ندارد. در این مورد، یک نقطه در مار بین دو پیکسل که همسایه آن عبور صفر است، نوسان میکند. این نوسان را میتوان با استفاده از درون یابی بین پیکسل به جای نزدیکترین همسایه اجتناب کرد.[۵]
پیادهسازی
[ویرایش]pseudocode زیر روش مار را به صورت کلی اجرا میکند:
function v = snakes (I, v)
% INPUT: N by M image I, a contour v of n control points
% OUTPUT: converged contour v of n control points
E_image = generateImageEnergy (I);
while not converged
F_cont = weight.alpha * contourDerivative(v, 2);
F_curv = weight.beta * contourDerivative(v, 4);
F_image = interp2 (E_image, v(:,2), v(:,1));
F_image_norm = weight.k * F_image ./ norm (F_image);
F_con = inputForces();
F_internal = F_cont + weight.external * F_curv;
F_external = weight.external * (F_image + F_con);
v = updateSnake(v, F_internal, F_external);
checkConvergence ();
end
end
جایی که generateImageEnergy (I) را میتوان به عنوان نوشته کرد
function E_image = generateImageEnergy (I)
[C, Cx, Cy, Cxx, Cxy, Cyy] = generateGradients (I);
E_line = I;
E_edge = -(Cx.^2 + Cy.^2)^0.5;
E_term = (Cyy.*Cx.^2 - 2*Cxy.*Cx.*Cy + Cxx.*Cy.^2)./((1 + Cx.^2 + Cy.^2).^(1.5));
E_image = weight.line * E_line + weight.edge * E_edge + weight.term * E_term;
end
برخی از انواع مارها
[ویرایش]روش پیش فرض مارها دارای محدودیتهای مختلف و موارد گوشه ای است که همگرایی عملکرد ضعیفی دارد. چندین جایگزین وجود دارد که مسائل مربوط به روش پیش فرض را در بر میگیرد، هرچند با مشارکت خودشان. چند نفر در اینجا لیست شدهاند.
مدل مار GVF
[ویرایش]مدل مار مارپیچ گرادیان (GVF)[۶] دو مسئله را با مارها مطرح میکند:
- عملکرد ضعیف همگرا برای مرزهای مقعر
- عملکرد ضعیف همگرا زمانی که مار از مقدار کمتری شروع میشود
در دو بعد، فیلد بردار GVF، کارکرد انرژی را به حداقل میرساند
جایی که یک اصطلاح هموار کنترل شدهاست. این را میتوان با حل معادلات اویل حل کرد
این را میتوان از طریق تکرار به سمت یک مقدار ثابت حل کرد.
این نتیجه نیروی پیش فرض خارجی را جایگزین میکند.
مشکل اصلی با استفاده از GVF نرم کردن ترم است که موجب گرد کردن لبههای کنتور میشود. کاهش ارزش گرد کردن را کاهش میدهد اما مقدار صاف کردن را تضعیف میکند.
مدل بالون
[ویرایش]مدل بالون[۵] این مشکلات را با مدل کنتور پیش فرض فعال شرح میدهد:
- مار به لبههای دور جذب نشدهاست.
- مار در داخل کوچک میشود اگر هیچ نیروی تصویری قابل توجه بر روی آن تأثیری نداشته باشد
- یک مار که بزرگتر از کانیم مینیموم است در نهایت آن را کاهش میدهد، اما یک مار کوچکتر از کانون مینیمم، حداقلها را پیدا نخواهد کرد و در عوض ادامه مییابد.
مدل بالون یک دوره تورم را به نیروهایی که بر روی مار اعمال میکنند معرفی میکند
که بردار واحد معمولی منحنی در و بزرگی نیرو است. باید بزرگی یکسانی به عنوان ضریب نرمالیزه تصویر داشته باشد و در ارزش از کمتر باشد برای مجاز کردن نیروها در لبههای تصویر برای برانگیختن نیروی تورم. سه مسئله از استفاده از مدل بالون به وجود آمدهاست:
- به جای کوچک شدن، مار به مینیمم گسترش مییابد و حداقل حدفاصلهای کوچکتر از آن را پیدا نمیکند.
- نیروی بیرونی باعث میشود که حدفاصل کمی بزرگتر از حداقل باشد.
- نیروی تورم میتواند نیروها را از لبههای ضعیف ببندد، و مسئله را با مارها نادیده میگیرد و ویژگیهای ضعیف را در یک تصویر نادیده میگیرد.
مدل مارهای نفوذی
[ویرایش]مدل مار نفوذی[۷] حساسیت مارها به نویز، کلفت و انسداد را مورد توجه قرار میدهد. این یک اصلاح ویژگیهای مامفورد-شاه و محدودیت کارتونی آن را به کار میگیرد و شامل دانش شکل است. عملکرد تصویر پیش فرض تصویر جایگزین شدهاست با
که E_i براساس یک کارکرد مامفورد-شاه اصلاح شدهاست
که یک مدل صاف و از تصویر با دامنه . مرزها تعریف شدهاند
که عملکرد پایههای B-اسپلین درجه دوم و نقاط کنترل اسپلین هستند. محدودیت کارتونی اصلاح شده به عنوان و تنظیمات معتبر از . تابع بر اساس آموزش از تصاویر باینری از خطوط مختلف است و توسط پارامتر . برای یک توزیع گاوسی از بردارهای نقطه کنترل z با میانگین بردار نقطه کنترل و ماتریس کواریانس سیگما، انرژی درجه دوم که با احتمال گاوسی مطابقت دارد
استحکام این روش به قدرت دادههای آموزشی و نیز تنظیم عملکرد مامورد-شاه تغییر یافته بستگی دارد. مارهای مختلف نیاز به مجموعه دادههای مختلف آموزش و تنظیمات دارند.
خطوط هندسی فعال
[ویرایش]کانتور فعال هندسی، یا کانونی فعال ژئودزیک (GAC)[۸] یا کانونیهای فعال کانونی،[۹] ایدههایی را از تکامل یقین ایدل استفاده میکند. کانتورها بسته به تشخیص اشیاء در تصویر تقسیم و ادغام میشوند. این مدلها عمدتاً از مجموعههای سطح الهام گرفته شدهاست و بهطور گسترده در محاسبات تصویر پزشکی استفاده شدهاست. به عنوان مثال، معادله تکاملی منحنی زاویه گرادیان GAC است[۸]
که یک عمل متوقف است، c یک ضریب لاگرانژ است، منحنی و واحد نرمال داخلی است. این شکل خاص از معادله تکامل منحنی تنها به سرعت در جهت نرمال وابسته است؛ بنابراین، با قرار دادن تابع تنظیم سطح، میتوان آن را به صورت معادل در یک فرم یورلین بازنویسی کرد به آن به شرح زیر است
این اصلاح ساده و در عین حال قدرتمند سطح را قادر میسازد خطوط فعال برای مرتبسازی تغییرات توپولوژی در طی تکامل منحنی نزول شیب. این پیشرفت فوقالعاده ای را در زمینههای مرتبط الهام دادهاست و با استفاده از روشهای عددی برای حل دوباره تعریف سطح، اکنون به عنوان روش تعیین سطح شناخته میشود. وانگ و چان استدلال میکنند که تمام معادلات تکاملی منحنی باید مستقیماً توسط آن حل شود.[۱۰]
تحولات اخیر در کانتورهای فعال در زمینه مدل سازی خواص منطقه ای، ترکیب قالبهای انعطافپذیر و تقسیمبندی کاملاً اتوماتیک و غیره.
مدلهای آماری که ترکیبی از ویژگیهای محلی و جهانی هستند، توسط لانکتون و آلن تاننبام فرموله شدهاند.[۱۱]
ارتباط با کاهش گرافها
[ویرایش]برش گراف یا حداکثر جریان / دقیقه برش یک روش عمومی برای به حداقل رساندن یک شکل خاص انرژی به نام میدان مغناطیسی مارکوف (MRF) است. روش تقسیم گراف نیز به تقسیمبندی تصویر اعمال شدهاست و گاهی اوقات از روش تعیین سطح در زمانی که مدل MRF استفاده میکند یا میتواند توسط MRF تقریب یابد، بهتر عمل میکند.
منابع
[ویرایش]- ↑ ۱٫۰ ۱٫۱ Kass, M.; Witkin, A.; Terzopoulos, D. (1988). "Snakes: Active contour models" (PDF). International Journal of Computer Vision. 1 (4): 321. CiteSeerX 10.1.1.124.5318. doi:10.1007/BF00133570. Archived from the original (PDF) on 12 January 2016. Retrieved 16 February 2019.
- ↑ Snakes: an active model, Ramani Pichumani, http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/RAMANI1/node31.html
- ↑ Dr. George Bebis, University of Nevada, http://www.cse.unr.edu/~bebis/CS791E/Notes/DeformableContours.pdf
- ↑ Image Understanding, Bryan S. Morse, Brigham Young University,1998-2000 http://homepages.inf.ed.ac.uk/rbf/CVonline/LOCAL_COPIES/MORSE/iu.pdf
- ↑ ۵٫۰ ۵٫۱ ۵٫۲ Laurent D. Cohen, On active contour models and balloons, CVGIP: Image Understanding, Volume 53, Issue 2, March 1991, Pages 211-218, ISSN 1049-9660, doi:10.1016/1049-9660(91)90028-N
- ↑ C. Xu and J.L. Prince, "Gradient Vector Flow: A New External Force for Snakes," Proc. IEEE Conf. on Comp. Vis. Patt. Recog. (CVPR), Los Alamitos: Comp. Soc. Press, pp. 66–71, June 1997, http://iacl.ece.jhu.edu/pubs/p087c.pdf
- ↑ Cremers, D.; Schnorr, C.; Weickert, J. (2001). Diffusion-snakes: combining statistical shape knowledge and image information in a variational framework. Proceedings. IEEE Workshop on. Vol. 50. pp. 137–144. CiteSeerX 10.1.1.28.3639. doi:10.1109/VLSM.2001.938892. ISBN 978-0-7695-1278-5.
- ↑ ۸٫۰ ۸٫۱ Geodesic Active Contours, V. Caselles, R. Kimmel, G. Sapiro http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.21.2196
- ↑ Conformal curvature flows: From phase transitions to active vision, Satyanad Kichenassamy, Arun Kumar, Peter Olver, Allen Tannenbaum and Anthony Yezzi http://www.springerlink.com/content/u457157212872201/[پیوند مرده]
- ↑ Wang, Junyan; Chan, Kap Luk (2014-07-08). "Active Contour with a Tangential Component". Journal of Mathematical Imaging and Vision. 51 (2): 229–247. arXiv:1204.6458. doi:10.1007/s10851-014-0519-y. ISSN 0924-9907.
- ↑ Lankton, S. ; Tannenbaum, A. , "Localizing Region-Based Active Contours," Image Processing, IEEE Transactions on, vol.17, no.11, pp.2029,2039, Nov. 2008 doi: 10.1109/TIP.2008.2004611 http://ieeexplore.ieee.org/xpls/abs_all.jsp?arnumber=4636741&tag=1
پیوند به بیرون
[ویرایش]کد نمونه
[ویرایش]- Practical examples of different snakes developed by Prince and Xu
- Basic tool to play with snakes (active contour models) from Tim Cootes, University of Manchester
- Matlab implementation of 2D and 3D snake including GVF and balloon force
- Matlab Snake Demo by Chris Bregler and Malcolm Slaney, Interval Research Corporation.
- A Demonstration Using Java
- Active Contours implementation & test platform GUI by Nikolay S. and Alex Blekhman implementing "Active Contours without Edges"
- Active Contour Segmentation by Shawn Lankton implementing "Active Contours without Edges"
- Geometric Active Contour Code by Jarno Ralli
- Morphological Snakes