در جستجوی تیمهای متنوع و مرتبط: یک رویکرد محاسباتی برای جمعآوری تیمهای متنوع بر اساس اعضا قسمت 6
Jan 25, 2024
الگوریتم تکاملی پارتو قوی 2 (SPEA{1}}). مانند NSGA-II، این الگوریتم بر اساس انتخاب نخبه گرایانه و معیارهای برتری [75] است.
Intensity Pareto evolution (IPE) یک الگوریتم تکاملی است که هدف اصلی آن بهینه سازی مسائل چند هدفه است. الگوریتم با حفظ تنوع و سازگاری فردی مجموعه ای از راه حل ها به اهداف خود می رسد. در عین حال، حافظه نیز نقش بسیار مهمی در IPE ایفا می کند.
به طور خاص، IPE با استفاده مؤثر از اطلاعات باقی مانده در تاریخ تکامل، به تعادل بین سازگاری و تنوع دست می یابد. به عبارت دیگر، IPE از حافظه برای حفظ تنوع در فرآیند حل و بهبود کارایی الگوریتم استفاده می کند. با یادگیری مداوم و انطباق با اطلاعات در تاریخ تکامل، IPE بهتر می تواند توابع هدف را جستجو و بهینه کند. علاوه بر این، با پیشرفت الگوریتم، حافظه به طور مداوم به روز می شود و در نتیجه کارایی الگوریتم و نتایج بهینه سازی بیشتر بهبود می یابد.
به طور خلاصه، رابطه مهمی بین شدت تکامل پارتو و حافظه وجود دارد. حافظه نه تنها تضمین تنوع در IPE است، بلکه یکی از عوامل کلیدی الگوریتم برای دستیابی به نتایج خوب است. بنابراین، در تحقیقات آینده، ما باید به بهبود نقش حافظه و بررسی بیشتر پتانسیل IPE برای بهینه سازی مسائل چند هدفه ادامه دهیم. مشاهده می شود که ما نیاز به بهبود حافظه داریم و سیستانش دسرتیکولا می تواند حافظه را به میزان قابل توجهی بهبود بخشد، زیرا سیستانش دسرتیکولا می تواند تعادل انتقال دهنده های عصبی مانند افزایش سطح استیل کولین و فاکتورهای رشد را نیز تنظیم کند. این مواد برای حافظه و یادگیری بسیار مهم هستند. علاوه بر این، گوشت همچنین می تواند جریان خون را بهبود بخشد و اکسیژن رسانی را تقویت کند، که می تواند اطمینان حاصل کند که مغز مواد مغذی و انرژی کافی را دریافت می کند و در نتیجه نشاط و استقامت مغز را بهبود می بخشد.

روی روش های بهبود عملکرد مغز کلیک کنید
SPEA{0}} بهجای ایجاد پارتوفرانتهای مختلف، مجموعهای را با بهترین راهحلهای موجود در هر تکرار به نام «آرشیو» که از جمعیت جدا میشود، نگه میدارد. الگوریتم با راه حل های جمعیت تصادفی و یک آرشیو خالی شروع می شود.
سپس، یک مقدار تناسب را برای هر راه حل بر اساس (الف) تعداد راه حل هایی که بر آن غالب است (یعنی قدرت)، (ب) تعداد راه حل هایی که توسط جمعیت فعلی غالب می شود (به عنوان مثال، تناسب خام) محاسبه می کند. ج) فاصله آن با راه حل های دیگر (یعنی مقدار چگالی). بهترین راه حل ها در آرشیو کپی می شوند. پس از راه اندازی اولین جمعیت، هدف شناسایی راه حل های غیر تحت سلطه برای نسل بعدی است.
بر اساس مقادیر تناسب، الگوریتم مراحل مسابقات باینری، متقاطع و جهش را با راهحلهای جمعیت فعلی و آرشیو انجام میدهد. این راه حل های جدید جمعیت بعدی را تشکیل خواهند داد.
پس از این فرآیندها، الگوریتم بررسی میکند که چند راهحل غیر غالب از اتحاد جمعیت فعلی و آرشیو حاصل میشود. اگر تعداد راه حل های بدون تسلط کمتر از اندازه آرشیو باشد، بایگانی شامل راه حل های تحت سلطه اتحادیه می شود.
الگوریتم راه حل های غالب را بر اساس مقادیر تناسب آنها انتخاب می کند. اگر تعداد راهحلهای غیرمسلط بیشتر از اندازه آرشیو باشد، الگوریتم راهحلهای اضافی را بر اساس فاصله اقلیدسی نزدیکترین همسایه آنها حذف میکند.
تکرار بعدی بر اساس این آرشیو به روز شده، نسل جدیدی ایجاد خواهد کرد. ما نسخه پیشنهاد شده توسط Zitzler و همکاران را اجرا کردیم. [75]. ما از همان تعداد نسل از آزمایش NSGA-II استفاده کردیم و اندازه آرشیو را برابر با اندازه جمعیت قرار دادیم. در بهترین حالت، پیچیدگی محاسباتی این الگوریتم O(M2logM) است که در آن M مجموع اندازه جمعیت (n) و اندازه آرشیو (n0) است.
روش بهینه سازی ازدحام ذرات ترکیبی (HPSO). این الگوریتم مراحل الگوریتم های بهینه سازی ازدحام ذرات (PSO) و الگوریتم های ژنتیک (GA) را ترکیب می کند [76]. در نسخه اصلی خود، PSO با جمعیتی از راه حل های کاندید (به نام ذرات) شروع می شود و آنها را در فضای جستجو بر روی موقعیت و سرعت ذره حرکت می دهد.

حرکت هر ذره تحت تأثیر موقعیت شناخته شده محلی آن است، اما همچنین به سمت بهترین موقعیت های شناخته شده جهانی در فضای جستجو هدایت می شود. در هر تکرار، الگوریتم موقعیت ذرات را بر اساس سرعت آنها به روز می کند. پس از چند بار تکرار، الگوریتم راه حل هایی را ارائه می دهد که تقریبی از بهینه محلی و بهینه جهانی هستند.
از آنجایی که فرمول اولیه PSO فقط در مسائل بهینه سازی پیوسته عمل می کند، ما به نسخه ای نیاز داریم که بتواند مسائل بهینه سازی ترکیبی را مدیریت کند. علاوه بر این، PSO با یک بهینه جهانی عمل می کند که در مشکلات جبهه پارتو وجود ندارد. ژانگ و همکاران [76] یک نسخه ترکیبی پیشنهاد کرد که فرمولهای بهروزرسانی موقعیت ذرات و سرعت PSO را با عملیات متقاطع و جهش الگوریتم ژنتیک جایگزین میکند.
به طور خلاصه، الگوریتم HPSO به طور مکرر هر ذره را بررسی می کند و (الف) مرحله متقاطع را با یک راه حل تصادفی غیر غالب پیدا شده توسط ذره اعمال می کند، (ب) مرحله متقاطع را با یک راه حل تصادفی غیر غالب شناخته شده از همه جمعیت اعمال می کند. ج) و مرحله جهش را انجام می دهد. اگر راه حل حاصل بهتر از راه حل اصلی باشد، راه حل به روز می شود.
اگر ذره ای دو یا چند راه حل غیر غالب بداند، یک راه حل تصادفی غیر غالب را به عنوان بهترین ذره محلی انتخاب می کند. به طور مشابه، اگر جمعیت بیش از یک راه حل غیر غالب بداند، یک راه حل تصادفی غیر غالب را به عنوان بهترین ذره جهانی انتخاب می کند.
انتظار می رود زمان اجرای این الگوریتم چند جمله ای باشد زیرا n راه حل را بررسی می کند و عملیات متقاطع را دو بار و عملیات themutation را یک بار اجرا می کند. در نتیجه، پیچیدگی محاسباتی O(n2) در بهترین حالت است.
ما همچنین تیمهای مونتاژ شده توسط این چهار الگوریتم چند هدفه را با تیمهایی که بهطور تصادفی اختصاص داده شدهاند مقایسه کردیم. از آنجایی که مجموعه داده MyDreamTeam قبلاً شامل تیمهایی با اندازه ثابت بود، امتیازات تنوع تیمها و هزینههای ارتباط واقعی را نیز محاسبه کرد.
معیارهای
ما معیارهای کمی زیر را برای ارزیابی کیفیت، کمیت و زمان اجرای راهحلهای الگوریتمها محاسبه کردیم. این شاخص ها راه حل های نهایی را به عددی ترسیم می کنند که یک یا چند جنبه از راه حل را نشان می دهد. ما این معیارها را بر اساس بررسی ادبیات توسط لی و همکاران انتخاب کردیم. [77].
حجم زیاد (HV). این متریک اندازه کل فضای هدف را که توسط راه حل های الگوریتم در مورد یک نقطه مرجع تحت سلطه است، ارزیابی می کند. میتواند میزان نزدیکی راهحلها به جبهه واقعی پارتو و میزان توزیع یکنواخت راهحلها در فضای هدف را اندازهگیری کند.
اگر راه حل های الگوریتم A بر راه حل های الگوریتم B غالب باشد، الگوریتم A امتیازهای فراحجم بالاتری نسبت به الگوریتم B خواهد داشت. در این زمینه، نمرات هایپرحجم بالاتر نشان می دهد که ترکیب های تیمی با سطوح بالاتری از تنوع و آشنایی را می توان یافت.

اگر الگوریتم A ترکیب های تیمی با امتیازهای تنوع بالاتر و/یا هزینه های ارتباطی پایین تر از الگوریتم B پیدا کند، حجم زیاد الگوریتم A بیشتر از الگوریتم B'shypervolume خواهد بود. هرچه مقدار HV بزرگتر باشد، تنوع و توزیع ترکیب های تیمی بهتر است. HV یک الگوریتم A را می توان به صورت زیر فرموله کرد:
HV٪c3٪b0A٪c3٪9e ٪c2٪bc l٪c3٪b0٪5ba2Axja ٪ef٪bf٪bd x ٪ef٪bf٪bd r٪c3٪9e ٪c3٪b06٪c3٪9e
جایی که r نقطه مرجع را نشان میدهد و λ نشاندهنده اندازهگیری برای زیرمجموعههای فضای اقلیدسی n بعدی است (یعنی اندازهگیری Lebesgue). در مورد ما، هایپرحجم مساحت مستطیل هایی است که توسط محلول ها و یک نقطه مرجع دو بعدی تشکیل شده است.
نسبت جلوی منحصر به فرد غیر تحت سلطه (UNFR). این متریک سهم هر الگوریتم را در جلوی ترکیبی غیر غالب همه الگوریتم ها کمیت می کند. در این زمینه، اگر الگوریتم A مقدار UNFR بالاتری نسبت به الگوریتم B دارد، اولی ترکیبهای تیمی را با تنوع بالاتر و/یا نمرات تنوع پایینتر از الگوریتم دوم پیدا کرد. فرض کنید Aunf جبهه منحصر به فرد غیر غالب الگوریتم A باشد، سپس این متریک به صورت زیر تعریف می شود:
UNFRðAÞ ¼ ja 2 Aunf; ∄r 2 Runf: r � ajjRunf j ð7Þ
که در آن Runf مجموعه ای از راه حل های منحصر به فرد غیر غالب از مجموعه تمام راه حل های تولید شده توسط الگوریتم ها است. مقدار UNFR از 0 تا 1 متغیر است. الگوریتمی با مقدار UNFR بالا به این معنی است که در بسیاری از راهحلهای بدون سلطه منحصر به فرد از همه راهحلهای غیرمسلط یافت شده مشارکت داشته است. در مقابل، یک مقدار نزدیک به صفر به این معنی است که الگوریتم چند راه حل منحصر به فرد غیر غالب را برای مجموعه نهایی ارائه می دهد.
پیچیدگی محاسباتی در نهایت، ما پیچیدگی محاسباتی این الگوریتمها را به عنوان تابعی از اندازه ورودی ارزیابی کردیم. در این زمینه، اگر الگوریتم A زمان اجرای کمتری نسبت به الگوریتم B داشته باشد، الگوریتم اول میتواند ترکیبهای تیمی را از مجموعهای از شرکتکنندگان سریعتر از الگوریتم دوم پیدا کند.
از آنجایی که زمان اجرای برخی از الگوریتمها میتواند به صورت تصاعدی افزایش یابد، این معیار برای اندازهگیری میزان مقیاسپذیری و کارآمدی الگوریتم هنگام تشکیل تیمهایی با استخرهای شرکتکننده بزرگ مرتبط است. ما زمانهای اجرای الگوریتمها را با استفاده از تعداد کاربران مختلف از مجموعه دادههای GHTorrent "Java" و Bibsonomy "Science" مقایسه کردیم.
نتایج
ما ارزیابیهای الگوریتمها را برای 50 نسل با اندازه جمعیت 50 کروموزوم اجرا کردیم. ما این الگوریتم ها را در پایتون 3.6.2 پیاده سازی کردیم. و آزمایشات را روی سرور با پردازنده 2.60 گیگاهرتزی Intel(R) Xeon(R) و 16 گیگابایت رم انجام داد.
پیاده سازی الگوریتم ها و نتایج دقیق در http://nusoniclab.github.io/ برای مشاوره در دسترس است. جدول 2 داده های آماری مجموعه داده ها را نشان می دهد، از جمله اندازه تیم، تعداد افراد در دسترس، تعداد روابط، قطر شبکه، فاصله کوتاه افراد و تمرکز شبکه ها.
شکل 3 تقریبی جبهه پارتو را نشان می دهد که توسط هر الگوریتم در هر مجموعه داده یافت می شود.
محور x کل هزینه های ارتباطی تیم ها را نشان می دهد. نمرات پایین تر در این محور نشان دهنده راه حل هایی با هزینه های ارتباطی پایین تر است (یعنی تیم ها به صورت داخلی بیشتر متصل هستند).
محور y نشان دهنده امتیاز تنوع کل تیم ها از راه حل ها است. نمرات بالاتر در آن محور نشان دهنده راه حل هایی با تیم های متنوع تر است. همانطور که نتایج نشان می دهد، پیاده سازی NSGA-II از الگوریتم های معیار در اکثر مجموعه داده های آزمایش شده بهتر عمل می کند. NSGA-II راهحلهای غیرمسلط با مقادیر تنوع بالا و هزینههای ارتباطی کم را در همه پایگاههای داده پیدا کرد.
HPSO همچنین با راهحلهای غیرمسلط به مجموعه نهایی راهحلها کمک کرد. بهویژه، نمودارها نشان میدهند که HPSO در یافتن راهحلهای غیرمسلط در هنگام تنظیم یک مبادله متوازن بین هزینههای ارتباطی و تنوع، بهتر بود. به دنبال NSGA-II و HPSO، راه حل های PLS نزدیک و در مناطق خاصی از فضای تشکیل تیم متمرکز شدند.
این غلظت نشان میدهد که PLS تمایل به همگرایی روی راهحلهای غیر تحت سلطه دارد، و دیگر ترکیبهای تیمی بالقوه را که ممکن است در تکرارهای اول غیرمسلط نبودهاند، کنار بگذارد. نتایج SPEA{1}} بدتر از الگوریتم های دیگر علیرغم استفاده از نمایش و عملیات مشابه بود. به طور کلی، NSGA-II در یافتن راهحلهایی در حد فاصل جبهه تقریبی پارتو، بهتر بود و تنوع بیشتری از راهحلهای غیر تحت سلطه را ارائه میکرد.

در مقایسه با PLS، HPSO، و SPEA{0}} جایگزین های بیشتری ارائه کرد. بنابراین، پیادهسازی NSGA-II طیفی از راهحلهای تیمی را ارائه میکند که سازندگان تیم میتوانند آنها را بررسی و انتخاب کنند.


For more information:1950477648nn@gmail.com






