أساليب جديدة لفهرسة وتوحيد بيانات التسلسل البيولوجي
“تمثل مبادرات مثل MetaGraph واعتماد المعيار ST.26 جهدًا متضافرًا لتسخير بيانات التسلسل البيولوجي العالمية من خلال أساليب حسابية مبتكرة.”
وفي منشور حديث بعنوان “”Google for DNA” يفهرس 10% من التسلسلات الجينية المعروفة في العالم”، قامت المجلة، علوم، تناولت نتائج واعدة لأداة جديدة تسمى MetaGraph. تم تطوير MetaGraph من قبل مجموعة أكاديمية للمعلوماتية الطبية الحيوية من ETH Zurich، ويقوم بتنظيم وضغط بيانات التسلسل المتاحة للجمهور في تنسيق قابل للبحث.
نمو البيانات البيولوجية
تتزايد بيانات التسلسل البيولوجي المتوفرة في المستودعات العامة بشكل كبير، مما يشكل مورداً لا يقدر بثمن للبحث. ومع ذلك، فإن أدوات المعلوماتية الحيوية التقليدية تكافح من أجل مسح مثل هذه الكميات الهائلة من البيانات بكفاءة. بالإضافة إلى وظائف البحث الأساسية، هناك طلب متزايد على أنظمة الفهرسة المتقدمة التي تدعم الاستعلامات المعقدة، بما في ذلك محاذاة التسلسل، وتجميع التجارب، والاكتشاف. تظل دقة وموثوقية هذه التسلسلات حاسمة، حيث أن أي أخطاء يمكن أن تؤثر بشكل كبير على التحليلات النهائية.
عصر جديد من الفهرسة
لقد برز MetaGraph لتوسيع نطاق فهرسة وتحليل مكتبات التسلسل البيولوجي على نطاق البيتابايس. وفقًا لمجموعة ETH Zurich (فهرسة جميع التسلسلات البيولوجية المعروفة للحياة | bioRxiv)، تشمل النتائج الرئيسية لهذه الأداة ما يلي:
أنا. قابلية التوسع والكفاءة العالية، وتتفوق على أدوات الفهرسة الأخرى من حيث كفاءة المساحة ووقت الاستعلام؛
ثانيا. فعالة من حيث التكلفة وقابلة للنقل بسهولة، وتركيب قواعد البيانات على محرك أقراص ثابت واحد للمستهلك؛
ثالثا. دعم البحث عن التسلسل، والمحاذاة، والتجميع التفاضلي؛ و
رابعا. مجموعات كبيرة من RNA-Seq، والعينات الميكروبية، وتسلسلات البروتين، مما يجعلها متاحة.
حماية براءات الاختراع والتسلسلات البيولوجية
أحد الجوانب التي غالبًا ما يتم التغاضي عنها في إدارة بيانات التسلسل البيولوجي هو نظام حماية براءات الاختراع. يجب أن تتميز أي مادة بيولوجية ضرورية للتنفيذ العملي لطلب براءة الاختراع بتسلسل بيولوجي مدرج في ملف قائمة التسلسل. في الماضي، كان من الممكن تقديم ملفات قائمة التسلسل في تنسيقات مختلفة وبموجب معايير مختلفة، اعتمادًا على اختصاص التقديم. أدى هذا السيناريو إلى تعقيد عملية توحيد البيانات وتكاملها.
معايير الويبو وتطورها
ولمعالجة هذه القضايا، أنشأت المنظمة العالمية للملكية الفكرية (الويبو) لأول مرة المعيار ST.25 لعرض التسلسلات البيولوجية في طلبات براءات الاختراع. ومع ذلك، استخدم معيار الويبو ST.25 تنسيق مستند نصي (.txt)، وكان به العديد من أوجه القصور، والتنسيق غير المتسق، وممارسات معالجة البيانات غير الكافية، وفقدان البيانات عند استيرادها إلى قواعد البيانات العامة. وأدت أوجه القصور هذه إلى تطوير معيار الويبو ST.26.
تم نقل ملفات القائمة التسلسلية إلى معيار الويبو ST.26 باستخدام تنسيق لغة الترميز القابلة للتوسيع (XML) في عام 2022، وهو تغيير تم اعتماده في جميع أنحاء العالم. يمثل هذا التحول خطوة مهمة نحو تنسيق الممارسات الدولية في إدارة بيانات التسلسل البيولوجي لنظام حماية براءات الاختراع.
تم إنشاء معيار الويبو ST.26 لإنشاء صيغة عالمية تسهل تبادل البيانات والبحث عبر ولايات قضائية مختلفة. فهو يمكّن مقدمي طلبات براءات الاختراع من إنشاء قائمة تسلسل واحدة مقبولة لكل من الإجراءات الدولية والوطنية أو الإقليمية ويسمح بتبادل بيانات التسلسل إلكترونيًا ودمجها في قواعد البيانات المحوسبة. تنقسم البيانات المقدمة في قائمة التسلسل إلى قسمين:
- معلومات عامة: التفاصيل الببليوغرافية التي تربط قائمة التسلسل بطلب براءة الاختراع؛ تشتمل على الأولوية الأولى ورقم الطلب ومعلومات مقدم الطلب الرئيسي، على سبيل المثال.
- معلومات التسلسل البيولوجي: عناصر التسلسل التي تشتمل على مؤهلات إلزامية لوصف الجزيء (على سبيل المثال، DNA أو RNA أو الأحماض الأمينية) وموقع الميزة، على سبيل المثال.
برنامج الويبو للتسلسل
وللمساعدة في تنفيذ المعيار ST.26، طورت الويبو برنامج WIPO Sequence. تسمح هذه الأداة البديهية للمتقدمين بإنشاء ملفات قائمة التسلسل وتحريرها والتحقق منها. على الرغم من أن الانتقال إلى المعيار ST.26 طرح تحديات أولية، إلا أنه أدى في نهاية المطاف إلى تعزيز إمكانية الوصول إلى المعلومات البيولوجية وتصنيفها والحفاظ عليها في قوائم التسلسل على مستوى العالم.
يبعد
بشكل عام، تمثل مبادرات مثل MetaGraph واعتماد المعيار ST.26 جهدًا متضافرًا لتسخير بيانات التسلسل البيولوجي العالمية من خلال أساليب حسابية مبتكرة. ولا تسهل هذه التطورات الأبحاث المتقدمة وملاحقة براءات الاختراع فحسب، بل تضمن أيضًا الحفاظ على المعلومات الجينية التي لا تقدر بثمن وإمكانية الوصول إليها.
مصدر الصورة: إيداع الصور
الكاتب : كنتوه
معرف الصورة: 151502036
اكتشاف المزيد من موقع علم
اشترك للحصول على أحدث التدوينات المرسلة إلى بريدك الإلكتروني.