چکیده:
هدف از انتخاب ژنومی استفاده همزمان از دادههای ژنوتیپی به همراه دادههای فنوتیپی است تا بتوان در مدت زمان کوتاه، دامها را ارزیابی نموده و دامهای برتر از نظر ژنتیکی را گزارش نمود. توسعه الگوریتمهای داده کاوی مرتبط با اَبر دادهها در عصر دیجیتال در برآورد ارزشهای اصلاحی نقش قابل توجهی در اصلاحنژاد دام و طیور ایفا میکند. اخیراً روشهای یادگیری ماشین و الگوریتمهای زیرمجموعۀ آن مانند یادگیری عمیق، جنگل تصادفی، ماشین بردار پشتیبان و بوستینگ که جزء روشهای غیرپارامتریک هستند، به مباحث انتخاب ژنومی وارد شدهاند. یکی از مزایای روشهای یادگیری ماشین، پتانسیل و کارآیی بسیار بالای آنها به خصوص برای دادههای با حجم بالا یا به اصلاح اَبر دادهها و برآورد اثرات غیرافزایشی مانند غالبیت و اپیستازی و همچنین بررسی روابط پیچیده بین متغیرها (مانند اثرات متقابل بین نشانگرها) است. ایده اصلی در این الگوریتمها استفاده از دادههای آموزشی (در این جا اطلاعات ژنوتیپی و فنوتیپی حیوانات جمعیت مرجع) است تا الگوریتم براساس اطلاعات ژنوتیپی افراد جمعیت کاندید، ارزشهای اصلاحی ژنومی آنها را پیشبینی نماید. برخی از این روشها به طور موفقیتآمیزی در ارزیابیهای ژنومی مورد استفاده قرار گرفتهاند و نتایج قابل قبولی را با حداقل خطای ممکن ارائه دادهاند. در واقع هدف از این مطالعه بیانِ تعریفی از رویکرد یادگیری ماشین و الگوریتمهای زیرمجموعۀ آن و نیز نقش آنها در پیشبینی معماری ژنتیکی صفات با وراثتپذیری پیچیده است. در نتیجه، احتمالاً استفاده از رویکرد یادگیری ماشین با هدف یافتن کارآمدترین الگوریتم، همزمان با افزایش حجم دادههای فنوتیپی و ژنومی تأثیر قابل توجهی در آینده اصلاحنژاد دام و طیور، به ویژه پیشرفت ژنتیکی دامها به دنبال خواهد داشت.
چکیده انگلیسی:
Genomic selection strives to make use of genotypic and phenotypic data, simultaneously, in order to evaluate animals genetically in a short period of time to opt superior ones. The development of data mining algorithms related to big data analysis in the digital era makes a great contribution to estimating breeding values in livestock and poultry breeding. Recently, machine learning procedures and their sub-algorithms such as Deep Learning (DL), Random Forest (RF), Support Vector Machine (SVM), and boosting, which are categorized as non-parametric animal evaluation methods, have been introduced to the realm of genomic selection. Machine learning algorithms not only provide breeders with much more potential and efficiency but also they are more adapted with big data. These algorithms enable breeders to estimate non-additive effects such as dominance and epistasis, as well as studying of complex relationships between variables (such as marker interactions). The punch line of these algorithms is to use training data (here the genotypic and phenotypic information of the animals in reference population) to predict their genomic breeding values based on the genotypic information of the candidate population. Some of these methods have been used successfully in animal genomic evaluations and they have provided acceptable results with low error. In fact, the purpose of this study is to define machine learning approaches and their sub-algorithms besides their role in predicting the genetic architecture of traits with complex heritability. As a result, it is likely that using machine learning approach to find the most efficient algorithm, along with increasing the volume of phenotypic and genomic data, will have a significant impact on the future of livestock and poultry breeding.
خبرنامه
برای ثبت نام در خبرنامه و دریافت خبرنامه ایمیل خود را وارد نمایید.