بقلم: شريف على محمد
الذكاء الاصطناعي في العلوم الحيوية
تعتمد نماذج الذكاء الاصطناعي على خوارزميات معقدة تستطيع تحليل كم هائل من البيانات كاشفةً عن أنماط في هذه البيانات من الصعب -أو حتى المستحيل- على الأفراد إدراكها. وهناك العديد من تطبيقات الذكاء الاصطناعي في العديد من المجالات -سواء العلمية أو الاجتماعية- مثل: تصميم الألعاب، والتوصيات الخاصة بالمنتجات، والسيارات ذاتية القيادة.
في العلوم الحيوية، يوجد العديد من تطبيقات الذكاء الاصطناعي في مختلف الاتجاهات البحثية مثل: التشخيص والعلاج، واكتشاف الأدوية، والتعديل الجيني، والتنبؤ بالبُنى الهيكلية للخلايا الحية. ولا تقتصر تطبيقات الذكاء الاصطناعي فقط على العلوم الطبية الحيوية؛ بل يُعتبَر الذكاء الاصطناعي طفرةً في مجال الزراعة؛ حيث إنَّ هناك العديد من التطبيقات فيما يتعلق بإدارة الري والمحاصيل، وتطبيقات أخرى لا حصر لها.
تقنية «التعلم الآلي التلقائي» (Automated Machine Learning, AutoML)
تعمل تقنية التعلم الآلي التلقائي على توفير طرق لجعل نماذج الذكاء الاصطناعي متاحة لغير المتخصصين في هذا المجال؛ فقد أدَّى توافر كميات هائلة من البيانات في العلوم الحيوية إلى سهولة تطبيق نماذج الذكاء الاصطناعي لتحليل هذه البيانات، واستكشاف أنماط وظواهر بيولوجية جديدة. وعلى الرغم من أنَّ تقنيات التعلم الآلي أصبحت متاحة للعلماء عن طريق برامج التعلم عبر الإنترنت، أو الأكواد مفتوحة المصدر، أو حتى من خلال الحِزم البرمجية المتاحة، فإنَّ بناء وتدريب نماذج الذكاء الاصطناعي يحتاج إلى خبرة، حيث يؤثر أي قرار يتخذه المطور بشكل كبير على أداء النموذج فيما بعد.
يصعب اختيار أنواع الخوارزميات المناسبة للنموذج وضبط «المعلمات الفائقة» (Hyperparameters) -وهي مجموعة من الخصائص يؤثر ضبطها على أداء النموذج- حتى على المتخصصين في المجال، لذلك هناك سُبل واعدة تهدف إلى استخدام تقنية التعلم الآلي التلقائي لمساعدة الباحثين قليلي الخبرة بمجال التعلم الآلي على تطوير نماذج ذكاء اصطناعي لتحليل البيانات الخاصة بهم بأقل خبرة ممكنة. وتوفر تقنية التعلم الآلي التلقائي البِنيةَ الهيكلية (أنواع الخوارزميات المستخدَمة في النموذج)، وتحدد المعلمات الفائقة اللازمة للنموذج بناءً على البيانات التي يتم إدخالها.
أداة (BioAutoMATED) تساعد باحثي العلوم الحيوية على بناء نماذج ذكاء اصطناعي
قام فريق بحثي تابع لـ«معهد ماساتشوستس للتكنولوجيا» (Massachusetts Institute of Technology, MIT) بنشر ورقة بحثية في دورية (Cell Systems) الشهيرة توضح تطوير «إطار تعلم آلي تلقائي» (Automated Machine Learning Framework) -يُعرَف باسم (BioAutoMATED)- قادر على بناء نماذج ذكاء اصطناعي بإدخال البيانات الخاصة بالسلاسل البيولوجية (مثل: الأحماض النووية، وسلاسل البروتين، وسلاسل الجلايكانات)، حيث يُظهر هذا النظام قدرته على التنبؤ بالمناطق المهمة واستكشاف الأنماط في هذه السلاسل، مما يساعد على توفير رُؤى قيمة للباحثين في العلوم الحيوية.
قام الفريق بتقييم الأداة عن طريق اختبار نماذج ذكاء اصطناعي قائمة على نطاق واسع من البيانات -المرتبطة بالتنظيم الجيني، والتفاعل بين البروتين والدواء، ووصف سلاسل الجلايكان- كما يلي:
1. «التنظيم الجيني» (Gene Regulation)
قام الفريق بدراسة تأثير تسلسل «موقع الارتباط بالريبوسوم» (Ribosome Binding Site, RBS) على كفاءة الترجمة في بكتيريا «الإشريكية القولونية» (E.coli)، حيث يتم استخدام نماذج ذكاء اصطناعي تم بناؤها بواسطة (BioAutoMATED) للتنبؤ بكفاءة الترجمة في بكتيريا الإشريكية القولونية بناءً على مدخلات تسلسل موقع الارتباط بالريبوسوم. أوضح الفريق أنَّ النموذج المبني بواسطة (BioAutoMATED) قادر على التنبؤ بكفاءة عملية الترجمة بشكل جيد، ويستطيع أن يصل إلى كفاءة النماذج المصنوعة يدويًا في أقل من ٣٠ دقيقة من وقت التشغيل؛ حيث تتيح هذه النتائج التنبؤ السريع والدقيق بالتسلسل الخاص بموقع الارتباط بالريبوسوم في الحمض النَّووي، مما يساعد في تطبيقات «علم الأحياء التركيبي» (Synthetic Biology) .
2. «تفاعل الدواء والبروتين» (Drug-Peptide Interaction)
في هذه الحالة، تم اكتشاف العلاقة بين تسلسل الأجسام المضادة و مدى قوة ارتباطها مع الدواء؛ حيث يتم إدخال البيانات الخاصة بتسلسل الجسم المضاد بالتركيز على التسلسلات التي تحتوي على مناطق متغيرة -مثل «مناطق تحديد التكاملية» (Complementarity Determining Regions-H3, CDR-H3) التي تلعب دورًا هامًا في التعرف على المستضد، وتساهم أيضًا بشكل رئيسي في قوة الارتباط- ومدي تأثيرها على الارتباط بدواء مثل «رانيبيزوماب» (Ranibizumab) المستخدَم لعلاج اعتلالات شبكية العين. وقد أظهر النموذج المُعَد بواسطة (BioAutoMATED) نتائج تنبؤية جيدة، إلا أنها لا تضاهي النماذج المُعَدة يدويًا.
3. «وصف سلاسل الجلايكان» (Glycan Annotations)
تم اكتشاف تأثير تسلسلات الجلايكان على تصنيف الكائنات الحية، وأيضًا قابلية الجلايكان لتحفيز الاستجابة المناعية في الإنسان بالاعتماد على قواعد بيانات منشورة سابقًا لسلاسل قصيرة من الجلايكان، وتم استخدام (BioAutoMATED) في تحديد أفضل نموذج قادر على التنبؤ بتسلسل الجلايكان وتأثيره على تحفيز الاستجابة المناعية، وأظهر النموذج أيضًا قدرة على تحديد نطاقات في الشجرة التطورية لها علاقة ببعضها البعض عن طريق تسلسل جزيئات الجلايكان.
بشكل عام، يمكن القول أنَّ (BioAutoMATED) منصة تعتمد على التعلم الآلي التلقائي، ويمكنها بناء نماذج ذكاء اصطناعي لتحليل تتابعات السلاسل البيولوجية -مثل: الحمض النووي، والبروتينات، والجلايكانات- لمساعدة باحثي العلوم الحيوية على بناء نماذج ذكاء اصطناعي بأقل خبرة ممكنة في مجال التعلم الآلي.
المصادر:
1) Valeri, J. A., Soenksen, L. R., Collins, K. M., Ramesh, P., Cai, G., Powers, R., Angenent-Mari, N. M., Camacho, D. M., Wong, F., Lu, T. K., & Collins, J. J. (2023). BioAutoMATED: An end-to-end automated machine learning tool for explanation and design of biological sequences. Cell Systems, 14(6). https://doi.org/10.1016/j.cels.2023.05.007
2) Bhardwaj, A., Kishore, S., & Pandey, D. K. (2022). Artificial Intelligence in Biological Sciences. Life, 12(9), 1430. https://doi.org/10.3390/life12091430
3) Goecks, J., Jalili, V., Heiser, L. M., & Gray, J. W. (2020). How machine learning will transform biomedicine. Cell, 181(1), 92–101. https://doi.org/10.1016/j.cell.2020.03.022
4) AutoML. (n.d.). https://www.automl.org/automl/