معلومة

كيف يتسلسل العلماء ويجمعون ويشرحون جينومات النبات؟

كيف يتسلسل العلماء ويجمعون ويشرحون جينومات النبات؟


We are searching data for your request:

Forums and discussions:
Manuals and reference books:
Data from registers:
Wait the end of the search in all databases.
Upon completion, a link will appear to access the found materials.

لقد قرأت سابقًا هذا السؤال وهذه الورقة وتعلمت أشياء جيدة حول هذا الموضوع. سؤالي الحالي هو أن العلماء يستخدمون أي من الأدوات والخوارزميات والأدوات اللينة ... لتسلسل وتجميع وتعليق جينومات النبات؟ لكل مشروع جينوم ، هل يطورون أدوات وخوارزميات جديدة أم أن هناك بعض الأدوات المفيدة (تقريبًا) لجميع مشاريع الجينوم؟ هل هناك أي موقع أو كتاب أو ورقة شاملة تحتوي على بروتوكولات تسلسل الجينوم النباتي وبروتوكولات التعليقات التوضيحية؟


دعنا نحاول الإجابة على الأجزاء الثلاثة من سؤالك.

التسلسل الطريقة العامة هي نفسها. التسلسل هو مجرد تسلسل. ولكن بالنسبة لكل تسلسل فردي ، هناك عوامل يجب مراعاتها والبروتوكولات التي يجب اختيارها. أحد الأشياء المهمة هو أنك قد ترغب في قراءات طويلة نسبيًا للتعامل مع التكرارات والحجم الكبير العام لجينومات النبات. للحصول على قراءات طويلة ، تحتاج إلى تسلسلات طويلة من الحمض النووي للإدخال. لذلك قد ترغب في اتباع بروتوكول مناسب للحمض النووي النباتي عالي الوزن الجزيئي. قد يكون ذلك صعبًا ، لأن الحمض النووي للنبات قد يكون من الصعب استخراجه بناءً على النبات والأنسجة التي لديك ، لأنه من السهل جدًا "كسر" جدار الخلية في البداية. بعد ذلك ، يكون التسلسل العام. على الرغم من ذلك ، كما قلت سابقًا ، يمكنك اختيار القراءات الطويلة (PacBio) و / أو التغطية الجيدة. إذا لم يكن ذلك ممكنًا على الإطلاق ، فقد تختار القيام بالتسلسل المستهدف والتقاط الإكسوم بالكامل فقط (أو الجينات التي تهتم بها فقط) لتقليل التكلفة وتعقيد التحليل.

المجسم الآن ربما تكون قد جمعت الكثير من التسلسل والتسلسل الطويل أيضًا. هناك العديد من الأدوات التي يمكنك استخدامها للتجميع وعمومًا يمكنك استخدام نفس الشيء للنباتات التي قد ترغب في استخدامها على سبيل المثال لتجميع الجينوم البشري. أحد الأمثلة التي تعمل بشكل جيد على جينومات النباتات الكبيرة هو MaSuRCA ، والآخر هو Allpaths-LG. هناك بعض المجمعات المصممة للتعامل مع التكرارات الطويلة ، ولكن في كثير من الأحيان تقوم فقط بالتجميع ثم محاولة اكتشاف مناطق التكرار لاحقًا ، على سبيل المثال عن طريق تحسين تجميع قراءة البندقية بقراءات طويلة من تقنية أخرى.

حاشية. ملاحظة هذا واحد بالتأكيد لديه أدوات محددة لجينوم النبات. حسنًا ، جينومات كبيرة. الشيء الرئيسي في التعليق التوضيحي هو العثور على الجينات المحتملة ومقارنتها بقواعد البيانات للتعليق عليها بوظيفة. النباتات تفعل لصق ويمكن أن يكون للنباتات إنترونات طويلة ، حتى منها بما في ذلك التكرارات الطويلة. أحد الأمثلة على برامج التنبؤ الجيني الذي يعمل على النباتات هو Augustus ، ولكن بالنسبة لبعض الكائنات الحية النموذجية ، هناك حتى خطوط أنابيب وأدوات خاصة بالكائن الحي لهذه المهمة. وبالطبع ، في جزء قاعدة البيانات ، ستختار الاعتماد على قاعدة بيانات خاصة بالمصنع (إذا كنت لا تستخدم NCBI-NR على أي حال). يمكن أن تكون هذه أيضًا أنواعًا أو جنسًا محددًا مثل تلك التي تجدها في مشروع TAIR (Arapidopsis).

TLDR: الأمر معقد في الواقع. من ناحية ، هناك حاجة إلى أدوات وقواعد بيانات محددة ، ومن ناحية أخرى قد تسير بشكل جيد مع الأدوات القياسية ، ولكن سيتعين عليك تكييف المعلمات ، والقيام بخطوات إضافية قبل المعالجة أو بعدها وما إلى ذلك.


تسلسل الجينوم النباتي: الماضي ، الحاضر ، المستقبل

يتوفر الآن ما يقرب من 600 مجموعة كاملة من مجموعات الجينوم النباتية في المستودعات العامة.

تنتج تقنيات التسلسل الجديدة مجموعات جينوم ذات جودة متزايدة.

أكبر جينوم نباتي متسلسل يبلغ حجمه 28 جيجا بايت.

يستخدم تسلسل الجينوم بشكل متزايد في التربية والحفظ والتعرف.

المشاريع جارية لاستكمال معرفتنا بالتنوع الجيني للنبات على مستوى الأنواع.

تعتبر النباتات الخضراء (Viridiplantae) مملكة أساسية للحياة ، وهي مسؤولة عن طريق التمثيل الضوئي عن غالبية الإنتاج الأولي العالمي ، وتستخدمها البشرية بشكل مباشر للتغذية والأعلاف الحيوانية والوقود والملابس والأدوية وغيرها من الأغراض. هناك ما يقدر بنحو 391000 نوع من النباتات البرية ، بالإضافة إلى 8000 نوع من الطحالب الخضراء. تتنوع جينوماتها بشكل غير عادي مقارنة بتلك الموجودة في الممالك الأخرى ، ويتراوح حجمها من -10 ميجا بايت إلى أكثر من 100 جيجا بايت. إن معرفة جينومات النبات متخلفة في البداية عن تلك الموجودة في الممالك الأخرى ولكنها زادت بشكل كبير مع تطوير تقنيات جديدة لتحليل المعلومات الحيوية لتسلسل الحمض النووي ، بدلاً من إنتاج البيانات ، أصبحت بشكل متزايد عنق الزجاجة لمزيد من المعرفة. تفكر المقترحات الحديثة الآن في التسلسل والتجميع والتعليق التوضيحي لجينوم جميع أنواع النباتات في العالم ، وفي الوقت نفسه ، أصبح تسلسل التغطية المنخفضة لقياس التنوع عبر المجموعات والمجموعات البرية أمرًا شائعًا للعديد من الأنواع ، لا سيما تلك المستخدمة كمحاصيل.


أهداف المشروع

إن مقياس التسلسل وتراكم البيانات الأخرى في علم الجينوم النباتي يفوق قدرتنا بفعالية على شرح تلك الجينومات. الهدف من هذا المشروع هو تطوير مناهج جديدة وآلية للغاية وقابلة للتطوير وشاملة ودقيقة لتعليقات الجينوم التوضيحي لمعالجة هذه المشكلة. تشمل مخرجات المشروع (1) البرامج التي تنفذ خوارزميات التنبؤ الجديدة ، (2) التصور وبوابات الوصول إلى البيانات ، و (3) تنفيذ بيئة البنية التحتية الإلكترونية للأدوات المطورة للحوسبة الموزعة ، ومشاركة البروتوكولات ، وتسجيل مصدر التحليل. على المدى الطويل ، يسعى المشروع إلى استكشاف المدى الذي يمكن أن تنتقل فيه البيولوجيا الجينومية من علم وصفي إلى حد كبير إلى علم تنبؤي للغاية مدفوع بالقياسات الكمية ، مع الخوارزميات والحسابات كلغة تتكيف مع المجال. اقرأ المزيد عن أهداف المشروع وأساليبه.


2. استخراج الحمض النووي عالي الجودة

الخصائص الجوهرية للجينوم ليست هي الاعتبار الوحيد قبل التسلسل. هناك أيضًا جوانب أخرى تحتاج إلى تخطيط دقيق. يعد استخراج الحمض النووي عالي الجودة أحد الجوانب ذات الأهمية القصوى. نناقش استخراج الحمض النووي ببعض التفاصيل أدناه ، ولكن أيضًا ننهي هذا القسم بقائمة قصيرة من اعتبارات التجميع المسبق الأخرى المهمة التي يجب وضعها في الاعتبار عند بدء مشروع التجميع.

متطلبات جودة الحمض النووي لـ من جديد التسلسل

قلة من الباحثين يدركون حقيقة أنه للحصول على جينوم مرجعي جيد ، يجب على المرء أن يبدأ بمواد عالية الجودة. يجب الإشارة على الفور إلى أن الحمض النووي بجودة PCR والحمض النووي بجودة NGS هما شيئان مختلفان تمامًا 7.

بشكل عام ، نوصي باستخدام تقنيات طويلة القراءة (انظر أيضًا القسم 3 أدناه) عند إجراء تجميع الجينوم. بالنسبة لهذه التقنيات ، من الضروري استخدام أفضل نوعية من الحمض النووي عالي الوزن الجزيئي (HMW) ، والذي يتم الحصول عليه بشكل أساسي من مواد جديدة. سيؤدي عدم وجود مادة بداية جيدة إلى الحد من اختيار تقنية التسلسل وسيؤثر على جودة البيانات التي تم الحصول عليها.

أهم معايير جودة الحمض النووي لـ NGS هي النقاء الكيميائي والسلامة الهيكلية للعينة.

نقاء كيميائي

غالبًا ما تحتوي مستخلصات الحمض النووي على ملوثات مرحلّة تنشأ إما من مادة البداية أو من إجراء استخلاص الحمض النووي نفسه. أمثلة على الملوثات المتعلقة بالعينات هي عديد السكاريد ، البروتيوغليكان ، البروتينات ، المستقلبات الثانوية ، البوليفينول ، الأحماض الدبالية ، الأصباغ ، إلخ. على سبيل المثال ، يمكن أن تحتوي العينات الفطرية والنباتية والبكتيرية على مستويات عالية من السكريات ، والنباتات تشتهر بالبوليفينول والحشرات عادة ما تكون العينات ملوثة بالسكريات والبروتينات والأصباغ وما إلى ذلك. كل هذه الملوثات يمكن أن تضعف فعالية إعداد المكتبة في أي تقنية ، ولكن هذا ينطبق بشكل خاص على مكتبات Illumina Mate Pair والمكتبات الخالية من PCR (كل من PacBio و ONT). بالنسبة لتسلسل تقنية القراءة القصيرة التقليدية حيث يتم تضمين خطوة PCR في إعداد المكتبة ، يتم التغلب على هذه العقبة جزئيًا بواسطة خطوة التضخيم أثناء إنشاء المكتبة. ومع ذلك ، يمكن أن يحدث أنه يمكن تقليل تعقيد المكتبة لعينة ملوثة بسبب انخفاض فعالية التفاعل. من المعروف على نطاق واسع في مجتمع PacBio أن العينات الغنية بالملوثات يمكن أن تفشل أو تقلل من الأداء في عملية التسلسل ، نظرًا لعدم وجود خطوة PCR في إعداد المكتبة وسير عمل التسلسل.

تتمثل طريقة معالجة مشكلة التلوث في استخدام بروتوكول مناسب لاستخراج الحمض النووي مع مراعاة النوع المتوقع من الملوثات الموجودة في العينة (الملوثات الأصلية). يوصى بشدة باستخراج CTAB (cetyl trimethylammonium bromide) لاستخراج الحمض النووي من الفطريات والرخويات والنباتات بتركيز ملح معين يساعد CTAB على استخراج الحمض النووي بشكل مختلف من المحاليل التي تحتوي على مستوى عالٍ من السكريات 8. بالنسبة للأنسجة الغنية بالبروتين ، يوصى بإضافة مركابتو إيثانول بيتا (تعطيل روابط ثاني كبريتيد في جزيئات البروتين) وتحسين علاج بروتين K 9. بالنسبة للنباتات ، من المهم دائمًا استخدام مزيج بيتا مركابتوإيثانول (لمنع البوليفينول من الأكسدة والارتباط بالحمض النووي) و PVPP (بولي فينيل بولي بيروليدون لامتصاص البوليفينول والمركبات العطرية الأخرى) 10. بالنسبة للعينات الحيوانية والبشرية ، يُنصح باستخدام الأنسجة ذات المحتوى المنخفض من الدهون والأنسجة الضامة.

السلامة الهيكلية للحمض النووي

بصرف النظر عن الملوثات الأصلية ، يمكن إدخال الفينول والإيثانول والأملاح أثناء إجراء استخراج الحمض النووي. الإزالة غير الكاملة للفينول ، أو عدم استخدام الفينول الطازج سيضر بالحمض النووي (على سبيل المثال إدخال النكات التي تجعل الحمض النووي أكثر هشاشة) كما يمكن أن يضعف الإنزيمات المستخدمة في إجراءات المصب ، كما يمكن أن يزيل الإيثانول بشكل غير كامل. يمكن أن تؤدي التركيزات العالية من الملح (على سبيل المثال EDTA) إلى تقليل فعالية أي تفاعلات إنزيمية في المراحل النهائية.

المسألة الثانية المهمة هي السلامة الهيكلية للحمض النووي ، وهي مهمة بشكل خاص لتقنيات التسلسل طويل القراءة. يمكن أن يصبح الحمض النووي هشًا بسبب الخدش الذي يتم إدخاله أثناء استخراج الحمض النووي ، أو باستخدام مخزن مؤقت مع درجة حموضة غير مناسبة. لا ينصح بتخزين الحمض النووي لفترات طويلة في الماء وما فوق -20 درجة مئوية لأنه يزيد من خطر تدهور الحمض النووي بسبب التحلل المائي. الحمض النووي ذو الوزن الجزيئي المرتفع هش ، لذلك يُنصح باستخدام التعامل اللطيف (التدوير بأدنى سرعة ، الماصات ذات رؤوس الماصة ذات التجويف العريض ، النقل في مرحلة التجميد الصلب). يُنصح أيضًا بالحفاظ على عدد دورات التجميد والذوبان عند الحد الأدنى ، لأن بلورات الجليد يمكن أن تلحق الضرر ميكانيكيًا بالحمض النووي. للسبب نفسه ، يجب على المرء تجنب بروتوكولات استخراج الحمض النووي التي تتضمن علاج الضرب القاسي بالخرز أثناء تجانس الأنسجة.

يجب أيضًا الإشارة إلى أنه يجب تجنب تلوث عينات الحمض النووي الريبي. يمكن لمعظم محضرات مكتبة NGS DNA استخدام الحمض النووي مزدوج الشريطة بكفاءة. إن وجود تلوث بالحمض النووي الريبي في العينة سيبالغ في تقدير تركيز جزيئات الحمض النووي في المكتبة. هذا ينطبق بشكل خاص على مكتبات PacBio و 10X Chromium.

للتلخيص ، من المفيد دائمًا استثمار الوقت في الحصول على إعداد DNA عالي الجودة - يمكن أن يوفر الكثير من الوقت والمال الذي يمكن إنفاقه على تسلسل استكشاف الأخطاء وإصلاحها ، أو طلب المزيد من البيانات ، أو إذا كان طلب المزيد من البيانات غير ممكن ، فجرّب لتجميع جينوم بتغطية أقل من المتوقع.

اعتبارات أخرى

تجميع الأفراد - بالنسبة لبعض الكائنات الحية ، قد يكون من الصعب استخراج كمية كافية من الحمض النووي ، وفي هذه الحالات قد يكون من المغري تجميع عدة أفراد قبل الاستخراج. لاحظ أن هذا سيزيد من التباين الجيني للاستخراج ، ويمكن أن يؤدي إلى تجميع أكثر تجزؤًا ، تمامًا مثل المستويات العالية من تغاير الزيجوت. بشكل عام ، يجب تجنب التجميع ، ولكن إذا تم ذلك ، فمن المستحسن استخدام الأفراد المرتبطين و / أو الفطريين.

تضخيم الجينوم الكامل (WGA) - في الحالات التي ربما لا يتوفر فيها سوى عدد قليل من الخلايا ، يحتاج الحمض النووي الجيني إلى تضخيمه ليتم ترتيب تسلسله. سيؤدي هذا غالبًا إلى تغطية غير متساوية ، وفي حالة طرق التضخيم التي تعتمد على إزاحة خيوط متعددة ، يمكن إنشاء ما يسمى بالتسلسلات الكيميرية المكونة من تسلسلات مدمجة غير مرتبطة 11. كن على علم بأن هذا يمكن أن يسبب التجميعات الخاطئة. إذا أمكن ، استخدم أداة تجميع مصممة للعمل مع الحمض النووي المضخم ، على سبيل المثال SPAdes 12.

وجود كائنات حية أخرى - دائمًا ما يكون التلوث خطرًا عند التعامل مع الحمض النووي. لتجميع الجينوم ، يمكن إدخال التلوث في المختبر في مرحلة استخراج الحمض النووي ، أو يمكن أن توجد كائنات أخرى في الأنسجة المستخدمة ، على سبيل المثال الملوثات و / أو المتعايشين. يجب توخي الحذر للتأكد من أن الحمض النووي للكائنات الأخرى لا يحدث بتركيزات أعلى من الحمض النووي محل الاهتمام ، حيث أن العديد من القراءات ستكون بعد ذلك من الملوث بدلاً من جينوم الكائن المدروس. نادراً ما تكون الكميات الصغيرة من التلوث مشكلة حيث يمكن تصفية هذه القراءات في خطوة مراقبة الجودة للقراءة أو بعد التجميع ، ما لم تكن الملوثات متشابهة إلى حد كبير مع الكائن المدروس.

الحمض النووي للعضيات - بعض الأنسجة غنية جدًا بالميتوكوندريا أو البلاستيدات الخضراء بحيث يحدث الحمض النووي للعضيات بتركيزات أعلى من الحمض النووي. هذا يمكن أن يؤدي إلى تغطية أقل للجينوم النووي في تسلسلاتك. إذا كان لديك خيار ، فاختر نسيجًا يحتوي على نسبة أعلى من النواة النووية على الحمض النووي للعضيات.


تجميع جينوم

يشبه تجميع الجينوم حل أحجية الصور المقطوعة ، ولكنه صعب للغاية. هناك طريقتان للتجميع ، تستندان إما إلى الرسم البياني لـ De Bruijn (DBG) أو توافق التخطيط المتداخل (OLC). تكتشف طريقة تجميع OLC أولاً التداخلات بين جميع قراءات التسلسل ، حيث يتم إنشاء مخطط سلسلة لتخطيط contigs. ثم يأخذ OLC جميع القراءات التي تشكل كل كونتيج لإنشاء تسلسل إجماعي. من الأفضل تجميع القراءات الطويلة PacBio أو Nanopore بواسطة مجمعات OLC ، مثل Canu (Koren et al. ، 2017) ، و FALCON (Chin et al. ، 2016) ، و miniasm (Li ، 2016). من الجدير بالذكر أنه من خلال الاستفادة من القراءات الطويلة ، يمكن لـ FALCON-Unzip (Chin et al. ، 2016) وضع وتجميع أنماط الفردانية الفردية وستكون مفيدة بشكل خاص للجينومات شديدة التباين. من ناحية أخرى ، لم يتم تصميم OLC للقراءات القصيرة ، حيث قد يكون التداخل بين التسلسلات القصيرة غير صحيح ومن المستحيل حسابيًا حساب التداخلات الزوجية بين مليارات القراءات. DBG هو الأنسب للتعامل مع البيانات الضخمة قصيرة القراءة. DBG يتبع نهجًا غير بديهي لحل مشكلة تجميع الجينوم ، عن طريق تمزيق القراءات القصيرة بالفعل إلى أقصر. ك-مرز. الأساس المنطقي هو أن الروابط بين ك-يمكن إنشاء الممرات بسهولة أكبر ، ويمكن اجتياز الرسم البياني الناتج لـ de Bruijn لاستخلاص contigs. تم تطوير العديد من المجمعات القائمة على DBG ، مثل SOAPdenovo (Luo et al. ، 2012) ، و ALLPATH-LG (MacCallum et al. ، 2009) ، و Velvet (Zerbino and Birney ، 2008) ، و ABySS (Jackman et al. ، 2017) ) ، وبلاتانوس (كاجيتاني وآخرون ، 2014).

الحصول على تغطية عالية بما يكفي لـ PacBio أو Nanopore لجينوم كبير ليس ممكنًا دائمًا ، ولكن يمكن للمرء تقليل التكلفة عن طريق توليد بيانات قراءة قصيرة رخيصة واعتماد نهج التجميع المختلط. يمكن القيام بذلك في MaSuRCA (Zimin et al.، 2017b) ، والذي يوسع أولاً القراءات القصيرة إلى "قراءة فائقة" ، ويستخدم هذه القراءات الفائقة لتحويل القراءات الطويلة إلى "قراءات ضخمة". يمكن بعد ذلك تجميع هذه القراءات المعالجة بواسطة OLC. تم تجميع عدة جينومات نباتية بحجم قاعدة جيجا بهذه الطريقة (Zimin et al.، 2017b، 2017c).


المواد وطرق أمبير

تسلسل الجينوم والتجميع

الحمض النووي الجيني من أنثى حمامة دنماركية (شقيقة كاملة للطائر الذكر تستخدم لتجميع Cliv_1.0 الأصلي Shapiro وآخرون. 2013) من الدم باستخدام بروتوكول "تمليح" معدل (Miller وآخرون. تعديلات 1988 من http://www.protocol-online.org/prot/Protocols/Extraction-of-genomic-DNA-from-whole-blood-3171.html ، تم الدخول إليه في 6 فبراير 2018). تم تجميد الدم فور جمعه وتخزينه عند -80 درجة مئوية ، وتم تعليق الحمض النووي المنقى في 10 ملي مولار من Tris-HCl. مرت العينة بدورتين من ذوبان الجليد قبل استخدامها لإنشاء المكتبات الموضحة أدناه.

تم استخدام الحمض النووي المستخرج لإنتاج مكتبات تسلسل بعيد المدى باستخدام طريقة "Chicago" (Putnam وآخرون. 2016) بواسطة Dovetail Genomics (سانتا كروز ، كاليفورنيا). تم إعداد مكتبتين في شيكاغو وتسلسلهما على منصة Illumina HiSeq إلى تغطية مادية نهائية (أزواج من 1-50 كيلو بايت) تبلغ 390 ضعفًا.

تم تنفيذ السقالات بواسطة Dovetail Genomics باستخدام برنامج التجميع HiRise وتجميع Cliv_1.0 كمدخلات. باختصار ، تمت محاذاة قراءات شيكاغو مع تجميع المدخلات لتحديد المناطق المتكررة وإخفائها ، ثم تم تطبيق نموذج احتمالية لتحديد الصلات الخاطئة وتسجيل الارتباطات المحتملة للسقالات. تم بعد ذلك ترشيح التجميع النهائي للطول والفجوات وفقًا لمواصفات تقديم NCBI.

مكتبة كرر مخصصة

مكتبة مكررة لـ C. ليفيا تم بناؤه من خلال الجمع بين مكتبات من مجموعات جينوم الطيور الموجودة (Zhang وآخرون. 2014a) مع التكرارات المحددة من جديد لتجميع Cliv_2.1. من جديد تم إجراء تحديد مكرر باستخدام RepeatScout (السعر وآخرون. 2005) مع المعلمات الافتراضية (& نسخ gt3) لتوليد متواليات تكرار إجماع. تم تجميع التكرارات التي تم تحديدها مع هوية تسلسل أكبر من 90 ٪ وتداخل بحد أدنى 100 نقطة أساس باستخدام Sequencher (Gene Codes Corporation ، Ann Arbor ، MI). تم تصنيف التكرارات إلى عائلات عنصر قابل للنقل (TE) باستخدام خطوط أدلة متعددة ، بما في ذلك التماثل مع العناصر المعروفة ، ووجود التكرارات المقلوبة الطرفية (TIRs) ، واكتشاف ازدواج الموقع المستهدف (TSDs). تم الحصول على دليل قائم على التنادد باستخدام RepeatMasker (Smit وآخرون. 1996) ، بالإضافة إلى وحدة التماثل الخاصة بأداة التصنيف TE RepClass (Feschotte وآخرون. 2009). تم استخدام RepClass أيضًا لتحديد تواقيع العناصر القابلة للنقل (TIRs ، TSDs). قمنا بعد ذلك بإزالة التكرارات غير التابعة لـ TE (التكرارات البسيطة أو عائلات الجينات) باستخدام نصوص Perl مخصصة (متوفرة على https://github.com/4ureliek/ReannTE).

استخدم تحليل التكرار المخصص الخاص بنا البرنامج النصي ReannTE_FilterLow.pl لتسمية تسلسل الإجماع على أنه تكرار بسيط أو تكرار منخفض التعقيد إذا كان بالإمكان شرح 80 ٪ من طولها على هذا النحو بواسطة RepeatMasker (تم إخفاء المكتبة بخيار -noint). بعد ذلك ، استخدمنا البرنامج النصي ReannTE_Filter-mRNA.pl لمقارنة تسلسلات الإجماع بـ RefSeq (Pruitt وآخرون. 2007) mRNAs (اعتبارًا من 7 مارس 2016) مع TBLASTX (Altschul وآخرون. 1990). تم حذف التسلسلات من المكتبة عندما: (1) كانت القيمة الإلكترونية للنتيجة أقل من 1E-10 (2) لم يتم التعليق على تسلسل الإجماع باعتباره TE و (3) لم يتم التعليق على النتيجة باعتبارها ترانسبوسيز أو بروتين غير مصنف. ثم تم استخدام البرنامج النصي ReannTE_MergeFasta.pl لدمج مكتبتنا مع مكتبة تجمع بين مخرجات RepeatModeler (Smit and Hubley 2008) من 45 نوعًا من الطيور (Kapusta وآخرون. 2017) واستُكمِلت بشروح إضافية لـ TE للطيور (الاتحاد الدولي لتسلسل جينوم الدجاج 2004 Warren وآخرون. 2010 باو وآخرون. 2015). تم فحص المخرجات المدمجة يدويًا لإزالة التكرار ، وتمت إزالة جميع العناصر القابلة للنقل من فئة DNA و RTE واستبدالها بتسلسلات إجماع منسقة يدويًا ، والتي كانت إما حديثة (عناصر DNA) أو تم إنشاؤها مسبقًا (RTEs) (Suh وآخرون. 2016).

كرر المشهد

استخدمنا برنامج RepeatMasker v4.0.7 (Smit وآخرون. 2015) ومكتبتنا المخصصة للتعليق على التكرارات في Cliv_2.1. تم تشغيل RepeatMasker باستخدام محرك البحث NCBI / RMBLAST v2.6.0 + (-e ncbi) ، وخيار (-s) الحساس ، وخيار -a للحصول على ملف المحاذاة ، وبدون مكتبات RepeatMasker الافتراضية. ثم استخدمنا البرنامج النصي parseRM.pl v5.7 (متاح على https://github.com/4ureliek/Parsing-RepeatMasker-Outputs Kapusta وآخرون. 2017) ، في ملفات المحاذاة من RepeatMasker ، مع الخيار -l ومعدل استبدال 0.002068 استبدال لكل موقع لكل مليون سنة (Zhang وآخرون. 2014 ب). يجمع البرنامج النصي النسبة المئوية للتباعد عن الإجماع لكل جزء TE ، بعد التصحيح لمعدل طفرة أعلى في مواقع CpG ومقياس تباعد Kimura 2-Parameter (المنصوص عليه في ملفات المحاذاة من RepeatMasker). النسبة المئوية للاختلاف في الإجماع هي وكيل للعمر (كلما تقدم غزو TE ، تتراكم المزيد من الطفرات في شظايا TE) ، حيث يطبق البرنامج النصي معدل الاستبدال من أجل تقسيم شظايا TE إلى صناديق من 1 My.

ترانسكريبتوميكس

تم استخراج الحمض النووي الريبي من أنسجة البالغين (الدماغ ، الشبكية ، الجلد تحت الجلد ، القناة القوقعية ، الطحال ، الظهارة الشمية) من سلالة هوميروس السباق ، وجنين واحد كامل لكل من هوميروس السباق وأسطوانة الصالون (تقريبًا المرحلة الجنينية 25 هامبرغر وهاملتون 1951) . تم تحضير RNA-seq libararies وتسلسلها باستخدام تسلسل مزدوج النهايات 100-bp على منصة Illumina HiSeq 2000 في معهد أبحاث علم الأمراض الجزيئية ، فيينا (أنسجة البالغين) ، ومعهد الجينوم في جامعة واشنطن ، سانت لويس (الأجنة) . تم أيضًا تنزيل بيانات RNA-seq التي تم إنشاؤها للتعليق التوضيحي Cliv_1.0 من مستودع NCBI العام لـ من جديد إعادة تجميع. أرقام الانضمام لهذه البيانات العامة هي SRR521357 (قلب بهلوان دانمركي) ، SRR521358 (كبد دنماركي) ، SRR521359 (قلب مكشكش شرقي) ، SRR521360 (كبد مكشوف شرقي) ، SRR521361 (قلب سباقات هوميروس) ، و SRR521362 (كبد هوميروس المتسابق).

تمت معالجة كل ملف FASTQ باستخدام FastQC (http://www.bioinformatics.babraham.ac.uk/projects/fastqc/) لتقييم الجودة. عندما أبلغ FastQC عن التمثيل الزائد لتسلسل محول Illumina ، قمنا بقص هذه التسلسلات باستخدام fastx_clipper من FASTX-Toolkit (http://hannonlab.cshl.edu/fastx_toolkit/). استخدمنا FASTX-Toolkit لوظيفتين إضافيتين: تم قطع عمليات تشغيل القواعد منخفضة الجودة في بداية القراءات باستخدام fastx_trimmer عند الضرورة (قطع الجودة -Q 33) ، ثم تم قطع القراءات باستخدام fastq_quality_trimmer (-Q 33). أخيرًا ، تم تجميع كل زوج من ملفات التسلسل باستخدام Trinity (Grabherr وآخرون. 2011) الإصدار r20131110 باستخدام الخيار –jaccard_clip.

شرح الجينوم

المرجع الموجود مسبقًا Gnomon (Souvorov وآخرون. 2010) تم تعيين نماذج الجينات المشتقة لتجميع Cliv_1.0 (GCA_000337935.1) على التجميع المرجعي Cliv_2.1 المحدث باستخدام المحاذاة المباشرة لإدخالات FASTA للنسخ. تم ذلك باستخدام سير عمل المحاذاة لخط أنابيب شرح الجينوم MAKER (Cantarel وآخرون. 2008 Holt and Yandell 2011) ، والتي كانت أول محاذاة البذور باستخدام BLASTN (Altschul وآخرون. 1990) ثم صقل المحاذاة حول مواقع لصق باستخدام Exonerate (سلاتر وبيرني 2005). تمت تصفية النتائج بعد ذلك لإزالة المحاذاة التي لها تطابق إجمالي أقل من 90٪ من النموذج الأصلي (يتم حساب المطابقة على أنها النسبة المئوية للهوية مضروبة في النسبة المئوية للتغطية الشاملة).

للتعليق التوضيحي النهائي ، تم السماح لـ MAKER بالتعرف من جديد النماذج الجينية التي لم تتداخل مع نماذج جنومون المتوافقة. تضمنت مجموعات أدلة البروتين المستخدمة من قبل MAKER بروتينات مشروحة من Pterocles gutturalis (صفراء الحنجرة الرملية تشانغ وآخرون. 2014a) و جالوس جالوس (اتحاد تسلسل جينوم الدجاج الدولي 2004) مع جميع البروتينات من قاعدة بيانات UniProt / Swiss-Prot (Bairoch and Apweiler 2000 UniProt Consortium 2007). تضمنت مجموعات أدلة النسخ الخاصة بـ MAKER تجميعات Trinity mRNA-seq من عدة مجموعات C. ليفيا السلالات والأنسجة (تم وصف طرق تجميع النسخ أعلاه). تم إنتاج تنبؤات الجينات داخل MAKER بواسطة Augustus (Stanke and Waack 2003 Stanke وآخرون. 2008). تم تدريب Augustus باستخدام 1000 من نماذج الجينات Cliv_1.0 Gnomon التي تم تقسيمها باستخدام البرنامج النصي randomSplit.pl إلى مجموعات للتدريب والتقييم. اتبعنا بروتوكول تدريب شبه تلقائي (https://vcru.wisc.edu/simonlab/bioinformatics/programs/augustus/docs/tutorial2015/training.html ، تم الوصول إليه في 9 فبراير 2018). تم تحديد العناصر المتكررة في الجينوم باستخدام مكتبة التكرار المخصصة الموضحة أعلاه.

إنشاء خريطة الربط والتثبيت بالتجميع الحالي

تم إنشاء بيانات التنميط الجيني بالتسلسل (GBS) وتشذيبها وتصفيتها كما هو موضح سابقًا (Domyan وآخرون. 2016). تم تعيين القراءات لتجميع Cliv_2.1 باستخدام Bowtie2 (Langmead and Salzberg 2012). تم استدعاء الأنماط الجينية باستخدام Stacks v1.46 (Catchen وآخرون. 2011) ، مع حد أدنى لعمق القراءة من 10. تم تعيين عتبات التصحيحات التلقائية باستخدام المعلمات –min_hom_sequations 10، –min_het_seqs 0.01، –max_het_seqs 0.15. تباينت تغطية التسلسل ومعدل التنميط الجيني بين الأفراد ، وتم استبعاد الطيور ذات معدلات التنميط الجيني في أدنى 25 ٪ من تجميع الخريطة.

تم إجراء بناء الخريطة الجينية باستخدام R / qtl v1.41-6 (www.rqtl.org Broman وآخرون. 2003). بالنسبة للعلامات الصبغية الجسدية ، تُظهر العلامات تشوه الفصل (مربع كاي ، ص & lt 0.01). تم تجميع السقالات المرتبطة بالجنس وترتيبها بشكل منفصل ، بسبب الاختلافات في نمط الفصل للكروموسوم Z. تم تحديد السقالات المرتبطة بـ Z من خلال تقييم تشابه التسلسل ومحتوى الجين بين سقالات الحمام والكروموسوم Z لجينوم الدجاج المشروح (Ensembl Gallus_gallus-5.0).

تم حساب كسور إعادة التركيب الزوجي في R / qtl لجميع العلامات الجسدية والمرتبطة بـ Z. تم احتساب البيانات المفقودة باستخدام "fill.geno" بالطريقة "no_dbl_XO". تم تحديد علامات مكررة وإزالتها. داخل السقالات الفردية ، تم استخدام وظائف R / qtl "droponemarker" و "calc.errorlod" لتقييم خطأ التنميط الجيني. تمت إزالة العلامات إذا أدى إسقاط العلامة إلى زيادة درجة LOD ، أو إذا أدت إزالة العلامة غير الطرفية إلى انخفاض في الطول & gt10 سم لم تكن مدعومة بالمسافة المادية. تمت إزالة الأنماط الجينية الفردية إذا أظهرت درجات الخطأ في مستوى اللد و gt5 (لينكولن ولاندر 1992). تم تجميع مجموعات الربط من 2960 علامة جسمية و 232 علامة مرتبطة بـ Z باستخدام المعلمات (max.rf 0.1 ، min.lod 6). في الحالة النادرة التي تم فيها تقسيم السقالات الفردية إلى مجموعات ربط متعددة ، تم دمج مجموعات الربط إذا كانت مدعومة ببيانات جزء إعادة التركيب ، تعكس هذه الحالات عادةً فجوات مادية كبيرة بين العلامات على سقالة واحدة. تم طلب السقالات في نفس مجموعة الربط يدويًا بناءً على كسور إعادة التركيب المحسوبة ودرجات LOD.

لمقارنة خريطة الربط بتجميع الجينوم الأصلي (Cliv_1.0) ، تم تحليل كل موضع 90 نقطة أساس يحتوي على علامة وراثية من ملف إخراج Stacks "كتالوج XXX_tags.tsv" والاستعلام عن تجميع Cliv_1.0 باستخدام BLASTN (الإصدار 2. 6.0+) مع المعلمات –max_target_sequations 1 –max_hsps 1. 3،175 من 3،192 موقعًا (99.47٪) من التجميع الجديد كان لها ضربة بلاست بقيمة E & lt 4e-24 وتم الاحتفاظ بها.

مقارنات التجميع

ملفات FASTA من Cliv_2.1 و colLiv2 (Damas وآخرون. 2017) تم إخفاء مجموعات الجينوم باستخدام NCBI WindowMasker (Morgulis وآخرون. 2006) وتم حساب المحاذاة على مستوى الجينوم باستخدام LAST (Kielbasa وآخرون. 2011). من هذه المحاذاة ، تم إنشاء مخطط نقطي على نطاق الجينوم يشير إلى المناطق المخلقة باستخدام SynMap (Lyons and Freeling 2008 Lyons وآخرون. 2008).

تجميع colLiv2 غير معلَّق حاليًا. لذلك ، لمقارنة محتوى الجينات بين التجميعات ، قدرنا عدد جينات Cliv_2.1 المشروحة الغائبة عن colLiv2 بناءً على إحداثيات الجينات. بناءً على طول المحاذاة الأخيرة ، قمنا بحساب النسبة المئوية لكل سقالة Cliv_2.1 محاذاة لـ colLiv2. تم تقسيم السقالات إلى أربع مجموعات بناءً على المحاذاة: سقالات Cliv_2.1 التي لم تتماشى مع colLiv2 و Cliv_2.1 حيث غطت محاذاة LAST إلى colLiv2 أقل من 50٪ من إجمالي طول السقالة ، وسقالات Cliv_2.1 حيث كانت المحاذاة الأخيرة لـ colLiv2 تغطي ما بين 50٪ و 75٪ من إجمالي طول السقالة ، وسقالات Cliv_2.1 حيث غطت المحاذاة الأخيرة لـ colLiv2 75٪ أو أكثر من إجمالي طول السقالة. لكل مجموعة من هذه المجموعات ، تم تحديد عدد السقالات التي تحتوي على الجينات. العديد من هذه السقالات صغيرة ، وبعضها قد يكون مفقودًا جزئيًا أو كليًا من المحاذاة بسبب إخفاء العناصر المتكررة. إذا سقطت إحداثيات الجينات المشروحة من سقالات Cliv_2.1 جزئيًا أو كليًا داخل منطقة محاذية لـ colLiv2 ، فإن هذه الجينات تعتبر "موجودة" في colLiv2. وبالتالي ، فإن عدد الجينات التي تم تمييزها على أنها "غائبة" في colLiv2 قد يكون تقديرًا متحفظًا.

لمقارنة خريطة الربط بـ colLiv2 ، تم تحليل كل موضع 90 نقطة أساس يحتوي على علامة وراثية من ملف إخراج Stacks "كتالوج XXX_tags.tsv" والاستعلام عن تجميع colLiv2 باستخدام BLASTN (v2.6.0 +) مع المعلمات –max_target_seqs 1 - ماكس hsps 1.

توافر البيانات

تم إيداع مشروع بندقية الجينوم بالكامل هذا في DDBJ / ENA / GenBank تحت الانضمام AKCR00000000. الإصدار الموصوف في هذه الورقة هو الإصدار AKCR02000000. يتوفر تجميع Cliv_2.1 ، والتعليق التوضيحي ، والبيانات المرتبطة به على ftp://ftp.ncbi.nlm.nih.gov/genomes/all/GCA/000/337/935/GCA_000337935.2_Cliv_2.1.

يتم إيداع بيانات RNA-seq في قاعدة بيانات SRA بأرقام دخول BioSample SAMN07417936-SAMN07417943 ، وعمليات الدخول المتسلسلة SRR5878849-SRR5878856. تتوفر بيانات التجميع و RNA-seq للجمهور في قواعد بيانات NCBI ضمن BioProject PRJNA167554. يحتوي الملف S1 على جداول S1 – S7. يحتوي الملف S2 والملف S3 على بيانات جزء إعادة التركيب المستخدمة لإنشاء الشكلين 5 أ و 5 ب ، على التوالي.


المواد والأساليب

تجميع الجينوم والتحليلات

تم استخلاص الحمض النووي الجيني من أنسجة الأوراق الصغيرة عبر طريقة CTAB (Saghai-Maroof وآخرون. 1984) ، وتستخدم لبناء ثلاث مكتبات نهائية مقترنة متوافقة مع Illumina (Illumina ، سان دييغو ، كاليفورنيا) بأحجام إدراج تقديرية تبلغ 168 و 291 و 519 زوجًا أساسًا (مادة تكميلية ، الجدول S1 في الملف S1) ، كما هو موضح سابقًا ( هارديجان وآخرون. 2016). تم إنشاء أربع مكتبات زوجية من Nextera Mate مع مسافات داخلية مقدرة تتراوح من 2.7 إلى 8.8 كيلو بايت وفقًا لتعليمات الشركة المصنعة (الجدول S1 في الملف S1). تم تسلسل المكتبات على Illumina HiSeq 2500 لإنشاء قراءات بطول 150 نانومتر. تم تقييم جودة القراءة باستخدام FastQC (الإصدار 0.11.5) (Andrews 2010) والمحولات والقواعد منخفضة الجودة (س & lt 20) باستخدام Cutadapt (v1.11) (Martin 2011) ، مع الاحتفاظ بالقراءات وطول gt81 nt. تمت معالجة قراءات مكتبة زوج Mate باستخدام NextClip (v1.3.1) (Leggett وآخرون. 2014) ، الاحتفاظ بالقراءات المزدوجة & gt36 nt في المجموعات A و B و C (الجدول S1 في الملف S1). تم حساب K-mers (17 ، 23 ، 33 ، 43 ، 63) باستخدام JellyFish2 (v2.2.6) (Marçais and Kingsford 2011) مع ALLPATHS-LG (v52488) (Gnerre وآخرون. 2011) قراءات مصححة من الأخطاء من كافة مكتبات الأجزاء.

مجمعين شائعين قادرين على التعامل مع الجينومات غير المتجانسة ، ALLPATHS-LG (Gnerre وآخرون. 2011) وبلاتانوس (كاجيتاني وآخرون. 2014) ، لتوليد من جديد تجميعات الجينوم. نظرًا لأن ALLPATHS-LG لديها قيود على حجم مكتبة الأجزاء (أقل من ضعف حجم الإدراج) ، فقد تم استخدام القراءات التي تم تنظيفها فقط من المكتبة المقترنة بنهاية 168 نقطة أساس (ترقيم 204292990) وجميع قراءات مكتبة أزواج المتزاوج المعالجة (34.232.248) مع " خيار haploidify "في ALLPATHS-LG (v52488) (Gnerre وآخرون. 2011) ، بينما تم تنظيف القراءات من جميع المكتبات (278،764،758) وتم استخدام جميع قراءات مكتبة أزواج زميله مع الخيارات الافتراضية في Platanus (v1.2.4) (Kajitani وآخرون. 2014). بعد تصفية كلا التجميعين للسقالات و GT1000 bp ، BUSCO (v2.0) (Simão وآخرون. 2015) باستخدام قاعدة بيانات Embryophyta في كلا المجموعتين لتحديد تمثيل أخصائيي تقويم العظام المحفوظين.

لتقليل عدد وحجم الفجوات ، استخدم GapCloser (v1.12r6) من SOAPdenovo (Luo وآخرون. 2012) مع 291 و 519 bp قراءات نهاية مقترنة لمكتبة الشظايا (148،943،536) ، مع أقصى طول للقراءة يبلغ 150 نقطة أساس وتعيين معلمة التداخل إلى 31. لتحديد أي ملوثات في التجميع ، BLASTN (BLAST + v2.2.31) (كاماتشو وآخرون. 2009) للبحث في التجميع الجينومي مغلق الفجوة مقابل قاعدة بيانات المركز الوطني لمعلومات التكنولوجيا الحيوية (NCBI) nr (منسقو موارد NCBI 2016). BUSCO (v2.0) (Simão وآخرون. 2015) بعد ذلك باستخدام قاعدة بيانات Embryophyta في تجميع الجينوم النهائي.

تم استخدام BWA-MEM (الإصدار 0.7.15) (Li and Durbin 2009) لمحاذاة القراءات التي تم تنظيفها من جميع مكتبات الأجزاء إلى التجميع ، ووضع علامة على المحاذاة الثانوية (-M). تم استخدام Picard MarkDuplicates (الإصدار 2.1.1 http://broadinstitute.github.io/picard) لتمييز PCR والتكرارات البصرية. تمت إعادة محاذاة المحاذاة التي تمت معالجتها بواسطة Picard حول InDels باستخدام أدوات GATK RealignerTargetCreator و IndelRealigner (v3.7.0 McKenna وآخرون. 2010) مع الخيارات الافتراضية. تم استخدام أداة HaplotypeCaller لاحقًا لاستدعاء المتغيرات باستخدام معيار_min_confidence_threshold_for_calling و min_base_quality وتغاير الزيجوت وخيارات indel_heterozygosity التي تم ضبطها على 30 و 20 و 0.05 و 0.001 على التوالي (v3.7.0 McKenna وآخرون. 2010). اجتازت المتغيرات التصفية باستخدام أداة GATK VariantFitration إذا كانت قد قرأت عمق بين 50 و 200 ، وعمق جودة و GT7 ، وقيمة BaseQRankSum بين −5 و 5 (v3.7.0 McKenna وآخرون. 2010). تم ترشيح المتغيرات غير المتجانسة بشكل أكبر بحيث تم تضمين المتغيرات فقط مع تردد أليل 30٪ 70٪ في التحليلات.

تجميعات النسخ والتحليلات

تم استخراج الحمض النووي الريبي من البراعم المغلقة ، والسبالة ، والبتلة ، والأوراق الشابة ، والسويقة ، والقدمين ، والجينوستيجيوم ، وأنسجة الأوراق الناضجة (الشكل 1 ، B و C) عبر مجموعة QIAGEN RNeasy Plant Mini Kit ، وفقًا لتعليمات الشركة الصانعة (QIAGEN ، Hilden ، ألمانيا) ، وعولجت باستخدام Turbo DNase لإزالة أي DNA من العينات. تم إنشاء ستة مكتبات KAPA Biosystems (Wilmington ، MA) مع مؤشرات NEBNext (Ipswich ، MA) لكل من الأنسجة وتسلسلها على منصة Illumina HiSeq 2500 ، مما أدى إلى توليد 50 nt قراءات أحادية الطرف (الجدول S2 في الملف S1). تمت معالجة قراءات RNA-seq باستخدام FastQC (v0.11.5 Andrews 2010) و Cutadapt (v1.11 Martin 2011) كما هو موضح أعلاه ، مع الاحتفاظ بالقراءات وطول gt30 nt.

من جديدتم إنشاء نسخ مجمعة لكل مكتبة RNA-seq باستخدام Trinity (v2.3.2 Grabherr وآخرون. 2011) في الوضع الخاص بالشريط ، وتمت إزالة النصوص التي تقل عن 500 نقطة أساس من التجميعات. تمت محاذاة النصوص مع مجموعة الجينوم باستخدام GMAP (v20161107 Wu و Watanabe 2005) مع تغطية 95 ٪ وقطع هوية ، وتم البحث في النصوص غير المحاذية مقابل قاعدة البيانات nr (NCBI Resource Coordinators 2016) باستخدام BLASTN من BLAST + (v2.2.31 Camacho وآخرون. 2009) مع ه-قطع القيمة من 1e −5. تمت أيضًا محاذاة القراءات التي تم تنظيفها لكل مكتبة مع مجموعة الجينوم باستخدام TopHat2 (v2.1.1 Kim وآخرون. 2013) و Bowtie2 (v2.2.9 Langmead and Salzberg 2012) في وضع الذين تقطعت بهم السبل ، مع أقصى طول للإنترون يبلغ 30 كيلو بايت.

شرح الجينوم

أ C. giganteaتم إنشاء مكتبة تكرار مخصصة (CRL) باستخدام RepeatModeler (v1.0.8 http://repeatmasker.org) باستخدام سقالات & gt10 كيلو بايت كمدخل. تم البحث في CRL مقابل مكتبة منسقة من جينات وتسلسلات ترميز البروتين النباتي ، وإزالة التطابقات مع ProtExcluder (الإصدار 1.1 كامبل) وآخرون. 2014) ، ثم تم دمجه مع RepBase (v20150807 Jurka 1998) يتكرر Viridiplantae لإنشاء CRL نهائي. تم إخفاء مجموعة الجينوم بعد ذلك باستخدام RepeatMasker (الإصدار 4.0.6 http://repeatmasker.org) باستخدام CRL مع الخيار –s.

تم إنشاء تجميعات النصوص الموجهة بالجينوم لكل مكتبة RNA-seq باستخدام Trinity (v2.3.2 Grabherr وآخرون. 2011) ونصوص أقصر من 500 نقطة أساس تمت إزالتها من التجميعات. بداية تم إجراء التنبؤ الجيني عن طريق تدريب Augustus (v3.2.2 Stanke وآخرون. 2006) ، باستخدام التلميحات المقدمة من محاذاة مكتبة RNA-seq للأوراق الناضجة وتجميع الجينوم المقنع الناعم. تم الحصول على تنبؤات الجينات بعد ذلك عن طريق تشغيل Augustus (الإصدار 3.2.2) على مجموعة الجينوم المقنعة وصقلها باستخدام PASA2 (الإصدار 2.0.2 Haas وآخرون. 2003) ، باستخدام تجميعات النسخ الموجهة بالجينوم كدليل. لتحديد نماذج الجينات عالية الثقة ، تم البحث في مجموعة العمل الخاصة بنماذج الجينات مقابل PFAM (v29 Finn وآخرون. 2016) باستخدام HMMER (v3.1b2 Mistry وآخرون. 2013). تم حساب وفرة التعبير أيضًا باستخدام Cufflinks2 (v2.21 Trapnell وآخرون. 2010) مع محاذاة RNA-seq الموضحة أعلاه. يتم تعريف نماذج الجينات عالية الثقة على أنها تحتوي على دليل ضرب و / أو دليل تعبير في مكتبة RNA-seq واحدة على الأقل. تم إنشاء التعليق التوضيحي الوظيفي من خلال البحث في نماذج الجينات مقابل نبات الأرابيدوبسيس thaliana بروتين (TAIR10 Lamesch وآخرون. 2012) ، Swiss-Prot (Bairoch and Apweiler 2000) ، و PFAM (v29 Finn وآخرون. 2016) ، وتعيين وظيفة بنفس الترتيب.

تحليلات الجينوميات المقارنة

الجينات المتعامدة والشبيهة في الأنواع الأبوسينية الثلاثة ، جنبًا إلى جنب مع البروتينات المشروحة لـ Amborella trichopoda (مشروع جينوم أمبوريلا 2013) و A. thaliana (لامش وآخرون. 2012 Table S3 في الملف S1) ، باستخدام OrthoFinder (v1.1.4 Emms and Kelly 2015) باستخدام الإعدادات الافتراضية. لتقييم التركيب بين الأنواع في عائلة Apocynaceae ، MCScanX (Wang وآخرون. 2012) تم استخدامه مع ص, C. Roseus، و C. gigantea. تم البحث عن البروتينات المتوقعة للأنواع الثلاثة ضد بعضها البعض باستخدام BLASTP من BLAST + (v2.5.0 Camacho وآخرون. 2009) ، بامتداد ه- تم الإبلاغ عن قطع للقيمة يبلغ 1e −5 وخمس مرات كحد أقصى.

تحديد إنزيمات التخليق الحيوي المفترضة للكاردينوليد

ال C. gigantea تم البحث عن البروتينات ضد نازعات الهيدروجين 3β-hydroxysteroid dehydrogenases المميزة وظيفيا (3βHSD Herl وآخرون. 2007) واختزال البروجسترون 5β (P5βR Bauer وآخرون. 2010) باستخدام BLASTP من BLAST + (v2.5.0 Camacho وآخرون. 2009) مع ه-قطع القيمة من 1e −5. تم الاحتفاظ بالمطابقات مع النسبة المئوية للهوية و gt50٪ وتغطية الاستعلام و gt85٪.المحدد C. gigantea تمت محاذاة البروتينات مع بروتينات 3βHSD و P5βR المميزة باستخدام MUSCLE (Edgar 2004) كما تم تنفيذه في MEGA7 (Kumar وآخرون. 2016). تم إنشاء أشجار الجينات المرتبطة بالجوار باستخدام المعلمات الافتراضية مع الحذف الزوجي و 1000 مكررات تمهيدية في MEGA7 (Kumar وآخرون. 2016). الأجزاء التي تم الحصول عليها مسبقًا لكل نموذج exon للكيلوباس لكل مليون من قيم القراءة المعينة (FPKM) من Cufflinks2 (v2.21 Trapnell وآخرون. 2010) للجينات المحددة تم تحويلها إلى log2 وتجميعها بشكل هرمي في R (الإصدار 3.4.2) باستخدام حزمة "gplots" (https://CRAN.R-project.org/package=gplots) وظيفة "خريطة الحرارة 2".

توافر البيانات

تم إيداع قراءات التسلسل الخام مع NCBI ضمن BioProject PRJNA400797. تم إيداع مجموعة الجينوم والشرح التوضيحي ومصفوفة التعبير في مستودع درياد الرقمي (DOI: 10.5061 / dryad.fk41r) ومورد الجينوم النباتي الطبي (//medicinalplantgenomics.msu.edu/). يتم تضمين الجداول التكميلية في الملف S1.


نتائج

شرح جينومات الذرة باستخدام GOMAP

تم اختبار حاوية GOMAP عن طريق التعليق على مصطلحات GO على جينات ترميز البروتين لأربعة سلالات من الذرة (B73 و Mo17 و W22 و PH207). كان حجم عدد جينات ترميز البروتين متشابهًا بين سلالات الذرة كما هو متوقع (انظر الجدول 1). اختلف إجمالي طول تشفير البروتين المتوقع اختلافًا طفيفًا بين السلالات الفطرية. الطول الإجمالي W22 هو الأطول والأطول في B73v4. أقصر الجينات التي تم شرحها هي أقل من خمسة أحماض أمينية طويلة في جميع السلالات باستثناء B73v3. هذه أخطاء محتملة في التعليقات التوضيحية في قاعدة البيانات ، ولكن تم الإبلاغ عنها كنماذج جينية صالحة. يتشابه متوسط ​​ومتوسط ​​طول الجينات في التعليقات التوضيحية ولكنهما يختلفان في نطاق ضيق ، ويحتوي PH207 على أدنى متوسط ​​ومتوسط ​​طول الجين. ثلاثة سلالات فطرية لها أطول جينات يزيد طولها عن 5000 حمض أميني. تمثل الجينات الأصغر من 50 من الأحماض الأمينية تحديًا للتنبؤ بمصطلحات GO. احتوى Mo17 على أعلى نسبة من الجينات التي يقل طولها عن 50 حمضًا أمينيًا (& gt1300) ، والتي تحتوي بالمناسبة على أقل عدد جيني مشروح. تحتوي جميع السلالات الفطرية الأخرى على أقل من 1 ٪ من الجينات الأقصر من 50 من الأحماض الأمينية (الجدول 2).

أوقات تشغيل خطوات GOMAP لجينومات الذرة المختلفة

تم تحديد أوقات تشغيل GOMAP باستخدام مجموعة PSC Bridges HPC. تعتبر عملية التعليق التوضيحي اليدوي لـ Maize-GAMER معقدة مع أكثر من 40 خطوة مترابطة مطلوبة للتعليق التوضيحي الشامل لجينوم النبات. لجعل عملية التعليقات التوضيحية بديهية ومريحة ، جمعت عملية التعليق التوضيحي GOMAP خطوات الذرة-GAMER في سبع خطوات منفصلة فقط (انظر الجدول 3). تم إعداد الخطوات الأربع الأولى ، seqsim ، و fanngo ، و domain ، و mixmeth-blast ، ليتم تشغيلها بشكل متزامن كعمليات مستقلة. تعتمد الخطوات الثلاث الأخيرة ، mixmeth-preproc ، و mixmeth ، والجمع ، على ناتج الخطوات الأربع الأولى. كان إجمالي الوقت المستغرق لإكمال شرح جينومات الذرة ما بين ثلاثة وثلاثين وستة وثلاثين ساعة. كان لإجمالي طول البروتين المتوقع وعدد الجينات تأثير ضئيل على إجمالي وقت تشغيل GOMAP لجينومات الذرة ، على الرغم من تأثر أوقات تشغيل الخطوات بحمل الكتلة. استغرقت خطوتان متوازيتان ، المجال و mixmeth-blast ، وقتًا أطول من الخطوات الأخرى ، ولكن تم تقصير وقت التشغيل إلى حد كبير مقارنة بالإصدارات غير المتوازية. تعمل خطوة المجال لأكثر من خمسة أيام دون موازاة وتشغيل mixmeth-blast لأكثر من عشرة أيام دون موازاة. والجدير بالذكر أن تشغيل الخطوات من 1 إلى 4 بشكل متزامن يسمح لـ GOMAP بإكمال شرح جينومات الذرة في غضون أربع وعشرين ساعة لكل جينوم تم اختباره.

تقييم ومقارنة مقاييس التحليل لشروح الذرة

تم حساب التغطية وعدد التعليقات التوضيحية والخصوصية (انظر الجدول 4) لمجموعة بيانات GOMAP ومجموعات البيانات المجتمعية. لوحظ تغطية عالية تبلغ حوالي 100٪ لجميع مجموعات بيانات GOMAP. وبالمقارنة ، فإن مجموعات البيانات المجتمعية لـ B73v4 و PH207 لديها تغطية إجمالية تبلغ 77٪ و 45٪ على التوالي. لا تغطي مجموعات البيانات ذات المعيار الذهبي سوى حوالي 3-4٪ من الجينات وتوفر فقط عددًا أقل من الجينات لحساب مقاييس تقييم CAFA (الجدول 4). تم فصل التعليقات التوضيحية حسب كل فئة للحصول على صورة أكثر وضوحًا للتغطية (انظر الشكل 3). تتغير التغطية بشكل كبير عبر الفئات لجميع مجموعات البيانات. تتمتع مجموعات بيانات GOMAP بأعلى تغطية في فئة العملية البيولوجية لجميع السلالات الفطرية (أي ، ( sim ) 100٪) ، ولديها تغطية أقل للفئات الأخرى (CC: 86-92٪ MF: 82-95٪). ومع ذلك ، تتمتع كلتا مجموعتي بيانات المجتمع بأعلى تغطية في فئة الوظائف الجزيئية. حصلت مجموعة بيانات مجتمع PH207 على أقل تغطية بين مجموعات بيانات التعليقات التوضيحية في جميع فئات GO الثلاث ، وغطت مجموعة بيانات مجتمع PH207 حوالي ( sim ) 10٪ فقط من الجينات في فئة المكونات الخلوية. حظيت مجموعة بيانات Gramene بتغطية أعلى من مجتمع PH207 ، ولكنها كانت ذات تغطية أقل من GOMAP في جميع فئات GO. يشير هذا إلى أن GOMAP ينتج مجموعات بيانات ذات تغطية أعلى من كل من طرق Gramene أو PH207-community.

مقاييس التحليل المحسوبة لشروح الذرة من تعليقات المجتمع و GOMAP. العمود الأيسر: مكون خلوي. العمود الأوسط: الوظيفة الجزيئية. العمود الأيمن: العملية البيولوجية. الصف العلوي: النسبة المئوية للجينات مع تعليق توضيحي. الصف الأوسط: عدد التعليقات التوضيحية لكل جين. الصف السفلي: خصوصية التعليقات التوضيحية. يتم الإشارة إلى الخطوط الفطرية على طول المحور السيني. يتم الإشارة إلى تعليقات GOMAP بدائرة خضراء. يتم الإشارة إلى التعليقات التوضيحية للمجتمع بواسطة مثلث برتقالي. يتم عرض التغطية كنسبة مئوية إجمالية ، ولكن يتم تمثيل كل من عدد التعليقات التوضيحية لكل جين والخصوصية كقيم متوسطة عبر جميع التعليقات التوضيحية في مجموعة البيانات. تشير أشرطة الخطأ إلى الخطأ المعياري. فاصل الثقة صغير جدًا لذا يتداخل شريطا الخطأ المرتفع والمنخفض مع بعضهما البعض لمعظم مجموعات البيانات

تمت تسوية عدد التعليقات التوضيحية بقسمة إجمالي عدد التعليقات التوضيحية على عدد الجينات. يسمح هذا التطبيع للمقارنة بين مجموعات البيانات المختلفة لنفس الجينوم والجينومات المختلفة. يختلف عدد التعليقات التوضيحية بين السطور الأصلية ومجموعات البيانات. يحتوي B73v3 على أكبر عدد من التعليقات التوضيحية بين مجموعات بيانات GOMAP ، على الرغم من أن W22 يحتوي على أكبر عدد من جينات ترميز البروتين. حصلت مجموعات بيانات GOMAP على أكبر عدد من التعليقات التوضيحية عبر جميع الأسطر الداخلية ، متبوعة بمجموعات بيانات المجتمع. حصلت مجموعات البيانات ذات المعيار الذهبي على أقل عدد من التعليقات التوضيحية بهامش كبير (انظر الجدول 4). في بعض السلالات الفطرية ، مثل B73v4 و Mo17 ، كان لدى GOMAP تسعة أضعاف عدد التعليقات التوضيحية مقارنة بمجموعة البيانات ذات المعيار الذهبي. تحتوي مجموعات بيانات المجتمع أيضًا على عدد من التعليقات التوضيحية أكبر من مجموعات البيانات القياسية الذهبية ، ولكن حجم الاختلاف كان أقل ( ( sim ) 1-3x). تم فصل عدد التعليقات التوضيحية حسب فئة GO ومقارنتها فيما بينها. سمح ذلك بمقارنة عدد التعليقات التوضيحية بين السطور الداخلية المختلفة ، ومصادر التعليقات التوضيحية ، وفئات GO. شوهد أكبر عدد من التعليقات التوضيحية في مجموعات بيانات GOMAP في فئة BP ( ( sim ) 7 تعليقات توضيحية لكل جين) ، وهو أعلى بكثير من مجموعات بيانات المجتمع في BP (B73v4: ( sim ) 3x PH207 ( sim ) 6x) ومجموعات بيانات GOMAP في فئات GO الأخرى. تحتوي مجموعات بيانات GOMAP على عدد أكبر من التعليقات التوضيحية مقارنة بمجموعات بيانات المجتمع في جميع فئات GO ، لكن حجم الاختلاف ليس مرتفعًا في فئات CC و MF. تعرض مجموعة بيانات مجتمع PH207 أقل عدد من التعليقات التوضيحية عبر جميع فئات GO الثلاثة ، وهذا الرقم منخفض بشكل خاص في فئة CC. بالمقارنة ، يعرض GOMAP أقل عدد من التعليقات التوضيحية في فئة MF. تحتوي مجموعات بيانات Gramene لـ B73v4 على أكبر عدد من التعليقات التوضيحية في MF ولديها أقل عدد في CC.

تشير الخصوصية إلى عدد مصطلحات الأسلاف لتعليقات توضيحية معينة نظرًا لتسلسل GO الهرمي ، ومتوسط ​​جميع التعليقات التوضيحية لمجموعة بيانات معينة. الخصوصية تمثل مقياسًا للمعلومات التي يقدمها مصطلح محدد. هذا المقياس أعلى في مجموعات البيانات المجتمعية ومجموعات البيانات القياسية الذهبية في الفئات الثلاث (انظر الجدول 4) ، مقارنة بالتغطية وعدد التعليقات التوضيحية. تتميز مجموعة بيانات Gramene للطراز B73v4 بخصوصية أعلى من مجموعة البيانات ذات المعيار الذهبي. كانت مجموعات بيانات GOMAP أيضًا ذات خصوصية أقل من مجموعات البيانات ذات المعيار الذهبي. سمح تحليل أكثر تفصيلاً مفصولاً بكل فئة GO بإجراء مقارنات مماثلة للتغطية وعدد التعليقات التوضيحية (انظر الشكل 3). كانت جميع مجموعات البيانات ذات خصوصية أعلى في فئات BP و MF من CC. تتميز مجموعة البيانات Gramene B73v4 بأعلى مستوى من الخصوصية في جميع فئات GO ، ولكنها حققت خصوصية أعلى بشكل ملحوظ في فئة BP. تتميز مجموعة بيانات المجتمع PH207 بخصوصية أعلى من GOMAP فقط في فئة BP ، لكن GOMAP لديها تغطية أعلى قليلاً في كل من فئتي CC و MF.

تقييم ومقارنة مقاييس التقييم لشروح الذرة

تم حساب مقاييس التقييم من خلال مقارنة التعليقات التوضيحية المتوقعة بمجموعات البيانات القياسية الذهبية. تم استخدام ثلاثة مقاييس تقييم تتمحور حول البروتين من CAFA لتقييم التعليقات التوضيحية: الدقة (العلاقات العامة)، اعد الاتصال(RC) و (F_). تقيس الدقة نسبة التعليقات التوضيحية المتوقعة التي تتداخل مع المعيار الذهبي. يقيس الاستدعاء نسبة التعليقات التوضيحية ذات المعيار الذهبي والتي يتم توقعها بشكل صحيح. (F_) هو المتوسط ​​التوافقي لـ العلاقات العامة و RC ويوفر رقمًا واحدًا للمقارنة بين الطرق المختلفة. تم حساب مقاييس التقييم بشكل منفصل لكل فئة GO (انظر الشكل 4). من العوامل المهمة التي يجب ملاحظتها أن العدد الإجمالي للتعليقات التوضيحية ذات المعيار الذهبي غير متوازنة وتميل نحو فئة CC (انظر الجدول 5). يؤثر هذا التوزيع المنحرف للبيانات ذات المعيار الذهبي بشكل مباشر على حساب مقاييس التقييم ، ويشار إلى ذلك من خلال أشرطة الخطأ المعيارية الأوسع التي تظهر في فئتي MF و BP في الشكل 4. تقارن مقاييس التقييم أداء الطرق المستخدمة للتعليق التوضيحي ، وبالتالي يتم استخدام الاصطلاحات التالية لوصف طرق التعليقات التوضيحية لمجموعات بيانات الذرة. يُطلق على طريقة المجتمع المستخدمة لإضافة تعليق توضيحي على B73v4 اسم "Gramene" وتسمى طريقة المجتمع المستخدمة في التعليق على PH207 "مجتمع PH207" في القسم التالي.

كانت جميع الطرق ذات دقة أعلى في فئة CC مقارنة بالفئات الأخرى ، بينما حصلت فئة BP على أقل دقة بشكل عام. حققت طريقة المجتمع PH207 أعلى دقة بين جميع مجموعات البيانات في جميع فئات GO الثلاثة. علاوة على ذلك ، يتمتع مجتمع PH207 بدقة أعلى بكثير من GOMAP في فئات CC و BP. حصل Gramene أيضًا على دقة أعلى لـ B73v4 من GOMAP في جميع الفئات الثلاث ، على الرغم من أن حجم الاختلاف كان أقل. الطريقة التي يستخدمها مجتمع PH207 أكثر دقة مقارنة بالطرق الأخرى. لم تُظهر قيم الاستدعاء اتجاه أداء واضحًا كما هو موضح في Precision. تباين أداء الاستدعاء بين الطرق ، ولم يكن أداء أي طريقة أفضل من الطرق الأخرى في جميع فئات GO. حقق GOMAP استردادًا أفضل في كل من فئتي CC و BP ، لكن Gramene أظهر استرجاعًا أفضل قليلاً (GOMAP = 0.8229433 Gramene = 0.8250246) من GOMAP في فئة MF. كان من الواضح أن كلا من GOMAP و Gramene تفوقوا في الأداء على طريقة PH207-community في جميع الفئات ، وكان الاستدعاء أعلى من 5-10 مرات لـ GOMAP في فئتي CC و BP. GOMAP هي الطريقة الوحيدة التي حققت أداءً أعلى أو مشابهًا للطرق الأخرى في جميع الفئات الثلاث.

مقاييس التقييم المحسوبة لشروح الذرة من المجتمع و GOMAP. العمود الأيسر: المكون الخلوي. العمود الأوسط: الوظيفة الجزيئية. العمود الأيمن: العملية البيولوجية. الصف العلوي: الدقة. الصف الأوسط: أذكر. الصف السفلي: (F_max ). يتم الإشارة إلى الخطوط الفطرية على طول المحور السيني. يتم الإشارة إلى تعليقات GOMAP بدائرة خضراء. يتم الإشارة إلى التعليقات التوضيحية للمجتمع بواسطة مثلث برتقالي. يتم عرض الدقة والاستدعاء كقيمة متوسطة لجميع التعليقات التوضيحية مع أشرطة الخطأ التي تشير إلى خطأ معياري ، ولكن يتم تمثيل (F_max ) كقيمة مطلقة لمجموعة بيانات محددة

(F_) يعطي رقماً واحداً لمقارنة أداء الطرق الثلاث. على غرار Recall ، لم تظهر طريقة واحدة أداءً أعلى في جميع فئات GO الثلاثة. أظهر Gramene أداءً أعلى في فئتي MF و BP ، لكن GOMAP كان أعلى (F_) في فئة CC. الدقة العالية التي حققتها Gramene تفوقت على Gramene قبل GOMAP في كلتا الفئتين ، والاستدعاء الأعلى جعل GOMAP متقدمًا في فئة CC. كان أسلوب المجتمع PH207 أقل (F_) في جميع الفئات الثلاث ، وبشكل خاص أقل بهامش كبير في فئة CC. أظهر أسلوب المجتمع PH07 قابلاً للمقارنة على الرغم من أداء أقل قليلاً من GOMAP فقط في فئة MF. تأثر أداء طريقة PH207-community بالتذكر المنخفض الذي لوحظ في جميع الفئات.

مقارنة مع GOMAP المجتمع والتعليقات التوضيحية المنسقة

تم إجراء مقارنة بين الجينات ومصطلحات GO والشروح بين مجموعة بيانات GOMAP ومجموعة بيانات المجتمع لـ B73v4 و PH207 في كل فئة GO. اقتصرت هذه المقارنة على المصطلحات القياسية الذهبية لتوفير الصلاحية البيولوجية للبيانات التي تم مقارنتها. تشير قيم استدعاء أقل من واحد تمت ملاحظته في جميع مجموعات البيانات عبر جميع فئات GO إلى أنه لا توجد طريقة تمكنت من التنبؤ بجميع التعليقات التوضيحية في مجموعة البيانات ذات المعيار الذهبي (الشكل 4). سمحت المقارنة بتحديد الجينات الفريدة وشروط GO التي تم شرحها فقط بطريقة معينة. النسب المقارنة للمقارنات معروضة في الشكل 5 والأرقام المطلقة معروضة في الجدول 5.

مقارنة GOMAP وتعليقات المجتمع بناءً على ما إذا كان قد تم وضع تعليقات توضيحية على المصطلحات القياسية الذهبية. العمود الأيسر: مكون خلوي. العمود الأوسط: الوظيفة الجزيئية. العمود الأيمن: العملية البيولوجية. الصف العلوي: النسبة المئوية للجينات التي لها تعليق توضيحي واحد على الأقل. الصف الأوسط: نسبة مصطلحات GO الفريدة التي تم استردادها. الصف السفلي: تم استرداد نسبة تعليقات GO الموسعة. تظهر الجينات القياسية الذهبية أو التعليقات التوضيحية التي تم استردادها بواسطة كل من أساليب المجتمع و GOMAP باللون الوردي. يتم عرض العناصر التي تم استردادها بواسطة GOMAP ولكن ليس طريقة المجتمع باللون الأزرق. يتم عرض العناصر التي تم استردادها بواسطة التعليق التوضيحي للمجتمع ولكن ليس GOMAP باللون الأخضر. يتم عرض تلك المشروحة في المعيار الذهبي والتي لم يتم استردادها بأي من الطريقتين في الخزامى

قام GOMAP بتوضيح المزيد من الجينات ذات المعايير الذهبية في كل من B73v4 و PH207 عبر جميع فئات GO الثلاثة مقارنة بأساليب مجتمع Gramene و PH207. تحتوي غالبية الجينات على تعليق توضيحي من كل من GOMAP و Gramene لـ B73v3 ، لكن طرق GOMAP و PH207-community قد شرحت غالبية الجينات في فئتي MF و BP فقط. نظرًا للتغطية الأعلى التي لوحظت في Gramene و GOMAP ، فإن جزء الجينات ذات المعيار الذهبي على حد سواء أعلى في جميع فئات GO مقارنة بنسبة الجينات التي تم شرحها بواسطة GOMAP وطريقة المجتمع PH207. فقط عدد قليل من الجينات ذات المعيار الذهبي من فئتي CC و BP في B73v4 تم شرحها بواسطة Gramene فقط ، ولكن تم توضيح عدد أكبر من الجينات ذات المعيار الذهبي في CC و BP بواسطة GOMAP فقط. لم يتم شرح أي جينات بواسطة طريقة PH207-community التي لم يتم شرحها بواسطة GOMAP ، ولم يتم شرح نسبة أعلى بكثير من جينات PH207 إلا بواسطة GOMAP. لوحظ نفس الاتجاه أيضًا في مصطلحات GO المشروحة بطرق مختلفة. تم شرح غالبية مصطلحات GO بواسطة كلتا الطريقتين لـ B73v4 ، لكن GOMAP يعلق على مصطلحات أكثر للجينات ذات المعيار الذهبي أكثر من Gramene. قام Gramene بتوضيح بعض المصطلحات في BP ومصطلح واحد في MF لم يشرحه GOMAP لأي جينات ذات معايير ذهبية. تعد مصطلحات GO التي تم شرحها بواسطة طريقة المجتمع PH207 مجموعة فرعية من مصطلحات GOMAP GO ، وقد قام GOMAP بتوضيح أكثر من ضعف عدد مصطلحات GO التي تم شرحها بواسطة طريقة مجتمع PH207 إلى الجينات ذات المعيار الذهبي في كل من فئتي CC و BP. لسوء الحظ ، لم يتم شرح نسبة من مصطلحات GO في البيانات القياسية الذهبية بأي طريقة لكل من السلالات الداخلية. يختلف هذا الرقم بين فئات GO ، ولكنه أعلى في CC و BP من MF. بعد ذلك ، تم إجراء المقارنة باستخدام التعليقات التوضيحية ذات المعيار الذهبي (أي أزواج مصطلح Gene-GO المنسقة). يتفوق GOMAP على Gramene في نسبة التعليقات التوضيحية ذات المعيار الذهبي والتي تم توقعها بشكل صحيح في CC و BP ، لكن Gramene يتفوق في الأداء على GOMAP بالنسبة إلى MF. على الرغم من أن عدد التعليقات التوضيحية ذات المعيار الذهبي في MF التي تنبأ بها GOMAP فقط (31) تشبه Gramene (35) ، فإن (F_) الاختلاف مهم. التعليقات التوضيحية لمجتمع PH207 هي مجموعة فرعية من تعليقات GOMAP التوضيحية وعدد كبير من التعليقات التوضيحية موجودة فقط في GOMAP. هذا متوقع استنادًا إلى قيم الاستدعاء الموضحة في الشكل 4. ولا يمكن توقع النسب الأصغر من التعليقات التوضيحية ذات المعيار الذهبي بأي من الطريقتين في CC ( ( sim ) 11٪) و MF ( ( sim ) 8٪ ) ، لكن هذا الرقم يزيد إلى ( ( sim ) 40٪) في فئة BP.


يوديكوتس

eudicots هي أكبر مجموعة من النباتات المزهرة على هذا الكوكب.

كولومبين

(الجينوم متوفر ولكن غير منشور)

كولومبين (أكويليجيا س.) يأتي من مجموعة من eudicots ، Ranunculales ، التي انفصل أسلافها عن أسلاف مجموعات eudicot الرئيسية (مثل الورود والنجوم) منذ زمن طويل (في مكان ما في حي 115-130 مليون سنة مضت). يجب أن تكون مقارنة تسلسل جينوم كولومبين مع جينومات eudicot الأخرى مثيرة جدًا للاهتمام للعديد من مجموعات علماء الأحياء النباتية (علماء الجينوم المقارن وعلماء الأحياء التطورية على وجه الخصوص).

تم تسلسل جينوم كولومبين إلى تغطية 8 أضعاف بواسطة JGI وإصدار ما قبل النشر للجينوم متاح للتنزيل من phytozome (إنشاء الحساب / تسجيل الدخول مطلوب). التجميع الحالي هو فقط على مستوى السقالة (بدون جزيئات زائفة) ويتكون من 302 ميغا قاعدة من التسلسل موزعة على 971 سقالة. تحدد التعليقات التوضيحية للجينات الحالية 25784 جينًا تم تحديدها بواسطة مزيج من تسلسل EST والتماثل مع الجينومات المتسلسلة الأخرى. يمكنك العرض في CoGe باستخدام GenomeView

كما هو الحال مع جميع جينومات كاسيات البذور المتسلسلة ، يحتوي كولومبين على تكرار كامل للجينوم القديم. ومع ذلك ، هل هذا هو حدث paleohexaploidy مشترك بين الورديات والنجوم؟ تكرار جينوم كولومبين الكامل

اللوتس المقدس

"اللوتس المقدس هو يوديكوت أساسي ذو أهمية زراعية وطبية وثقافية ودينية. تم تدجينه في آسيا منذ حوالي 7000 عام ، وزُرع لجذوره وبذوره كمحصول غذائي. ويلاحظ بشكل خاص بطول عمر بذوره البالغ 1300 عام وصد المياه بشكل استثنائي ، والمعروف باسم تأثير اللوتس. وتعود الخاصية الأخيرة إلى النتوءات النانوية المعبأة بشكل وثيق لسطح أوراقها ذاتية التنظيف ، والتي تم تكييفها لتصنيع دهان صناعي ذاتي التنظيف ، لوتسان. جينوم تم تسلسل مجموعة الصين العتيقة من اللوتس المقدس باستخدام تقنيات Illumina و 454 ، على أعماق كل منها تبلغ 101 × و 5.2 ×.يحتوي التجميع النهائي على contig N50 38.8 كيلو بايت في الثانية وسقالة N50 تبلغ 3.4 ميجا بايت في الثانية ، ويغطي 86.5 ٪ من إجمالي حجم الجينوم المقدر بـ 929 ميجا بايت في الثانية. يفتقر الجينوم بشكل ملحوظ إلى ثلاثية باليو التي لوحظت في eudicots الأخرى ، لكنه يكشف عن تكرار خاص بالنسب. يحتوي الجينوم على دليل على التطور البطيء ، مع معدل طفرة نيوكليوتيد أبطأ بنسبة 30٪ مما لوحظ في العنب. تشير مقارنات الجينومات المتسلسلة المتاحة إلى مجموعة جينات دنيا للنباتات الوعائية تبلغ 4223 جينًا. اللافت للنظر أن اللوتس المقدس يحتوي على 16 بروتينًا من عائلة أوكسيديز النحاس متعدد COG2132 مع تعبير خاص بالجذر ، وهي متورطة في تجويع فوسفات المريستم الجذري ، مما يعكس التكيف مع توافر المغذيات المحدود في البيئة المائية. معدل الاستبدال البطيء للنيوكليوتيدات يجعل اللوتس المقدس موردًا أفضل من المعيار الحالي ، العنب ، لإعادة بناء جينوم عموم eudicot ، وبالتالي يجب تسريع التحليل المقارن بين eudicots و monocots.

شمندر سكري

بنجر السكر - صنف من البنجر الشائع (بيتا فولغاريس) -- حساب لى

20 ٪ من إنتاج السكر في جميع أنحاء العالم وهو محصول مفضل في البلدان شديدة البرودة لدعم صناعة قصب السكر المحلية بما في ذلك روسيا ، ومعظم دول الاتحاد الأوروبي ، ومعظم أمريكا. يعتبر بنجر السكر ابتكارًا زراعيًا حديثًا نسبيًا مع التربية الانتقائية للبنجر للحصول على نسبة عالية من السكر بدءًا من عام 1784 ولم يتم اعتماد الإنتاج على نطاق واسع حتى حروب نابليون ، والتي تم خلالها قطع أجزاء كبيرة من أوروبا بشكل أساسي عن التجارة مع منطقة البحر الكاريبي ، حتى ذلك الحين المصدر الرئيسي للسكر في أوروبا من قصب السكر.

ينتمي البنجر إلى Caryophyllales وهو ترتيب من النباتات المزهرة التي تشمل أيضًا الصبار الحقيقي والعديد من النباتات آكلة اللحوم. يُعتقد حاليًا أن عائلة Caryophyllales مرتبطة ارتباطًا وثيقًا بالنجمة أكثر من الوردية ، ولكنها غير مدرجة ضمن أي من المجموعتين.

جينوم البنجر موجود حاليًا في الإصدار 0.9 ويتضمن 590 ميغابايت من بيانات التسلسل المقسمة عبر 82305 سقالة و contigs. يعتمد الجينوم على خط أحادي الصيغة الصبغية يسمى KWS2320. من المتوقع أن يتضمن الإصدار 1.0 تحسينات تم إجراؤها من تصحيح أخطاء المبلمر المتجانس التي أدخلها تسلسل الجيل التالي بالإضافة إلى دمج contigs باستخدام خريطة جينية.

لمزيد من المعلومات ولتنزيل الجينوم ، قم بزيارة موقع الويب الخاص بمجموعة تسلسل جينوم بنجر السكر.

الكويكبات

النجمات هي مجموعة من النباتات داخل eudicots التي تشمل أنواعًا مثل الخضروات الباذنجانية (التبغ والطماطم والبطاطس والفلفل والباذنجان) وعباد الشمس.

طماطم مستأنسة

الطماطم (Solanum lycopersicum) ورقة الجينوم التي نُشرت في مجلة Nature في مايو 2012. لم تكتمل بعد. يتم تجميع نسخة الجينوم التي يتم تحميلها حاليًا في CoGe في جزيئات زائفة [1]. أحدث تجميع هو 2.40 والذي يتضمن 781 ميغا قاعدة من التسلسل الكلي (من حجم الجينوم المقدر بـ

ورقة الجينوم اتحاد جينوم الطماطم (2012) "تسلسل جينوم الطماطم يوفر نظرة ثاقبة لتطور الفاكهة اللحمية." طبيعة سجية دوى: [10.1038 / nature11119]

الطماطم البرية

Solanum pennellii

"Solanum pennellii هو أحد أنواع الطماطم البرية المتوطنة في مناطق الأنديز في أمريكا الجنوبية ، حيث تطورت لتزدهر في الموائل القاحلة. نظرًا لتحملها الشديد للإجهاد وتشكلها غير المعتاد ، فهي مانح مهم للأصول الوراثية للطماطم المزروعة Solanum lycopersicum. خطوط الإدخال (ILs) التي يتم فيها استبدال المناطق الجينومية الكبيرة من S. lycopersicum بالمقاطع المقابلة من S. pennellii يمكن أن تظهر أداء زراعيًا متفوقًا بشكل ملحوظ. هنا نصف تجميع جينوم عالي الجودة لآباء مجموعة IL. جينوم S. pennellii إلى الخريطة الجينية ، نحدد الجينات المرشحة لتحمل الإجهاد ونقدم دليلاً على أن العناصر القابلة للنقل كان لها دور في تطور هذه السمات. الصفات الزراعية الأخرى التي يمكن تحسينها بالبلازما الجرثومية S. pennellii. "

Solanum pimpinellifolium

هذا هو جينوم ما قبل النشر

"Solanum pimpinellifolium هي الطماطم البرية التي ترتبط ارتباطًا وثيقًا بالـ Solanum lycopersicum المستأنسة. وقد تم ترتيبها بواسطة مجموعة من العلماء في مختبر كولد سبرينغ هاربور."

Solanum arcanum

من الأنواع البرية المعمرة المرتبطة بالطماطم natuve إلى شمال بيرو.

Habrochaites Solanum

"Solanum habrochaites هي نوع من أنواع الطماطم البرية التي توجد على المنحدرات الغربية لجبال الأنديز من وسط الإكوادور إلى وسط بيرو. وقد تم استخدامها في العديد من الدراسات الجينية ، مثل تحديد QTLs للسمات ذات الأهمية الزراعية (1) أو التحليل من مجموعة من 99 بالقرب من السلالات المتجانسة (NILs) والخطوط الفطرية المؤتلفة (BCRILs) التي تغطي أكثر من 85 ٪ من جينوم Solanum habrochaites (2). كما تم استخدامها في التحليل البيوكيميائي لتراكم السكروز في الفاكهة (3). " [من Solgenomics.net http://solgenomics.net/organism/938/view]

البطاطس

يمكن القول إن البطاطس هي ثاني أهم المحاصيل غير العشبية المزروعة حول العالم. تم إعاقة كل من التكاثر والتحليل الجينومي للبطاطس بسبب حقيقة أن معظم البطاطس المزروعة عبارة عن رباعي الصبغات حديثًا. تم نشر جينوم البطاطس من قبل اتحاد دولي مع مؤلفين مقابلين من الولايات المتحدة والصين وهولندا في عام 2011. وهو أول جينوم متاح للجمهور من داخل كومة النجم. لتجنب التعقيدات التي أدخلتها رباعي الصيغة الصبغية ، ركز اتحاد الجينوم على مجموعة متنوعة من البطاطس ثنائية الصبغيات واستخدم تقنية أحادية الصبغية المزدوجة لإنشاء "خط فطري فوري". تم استخدام هذا الجينوم المُجمَّع كقاعدة لتحليل المزيد من البيانات المتولدة من خط متباين حيث تم اكتشاف قدر كبير من تباين غياب التواجد. عانت سلالة البطاطس من رباعي الصبغيات الإضافية منذ سداسي الصبغيات القديمة التي تتقاسمها الكويكبات والورد.

تحتوي مجموعة الجينوم الحالية على ما يقدر بنحو 86٪ من إجمالي جينوم البطاطس ، وتم تجميع 74٪ من إجمالي جينوم البطاطس في 12 جزيءًا كاذبًا باستخدام الخرائط الجينية والفيزيائية. تم شرح ما مجموعه 39،031 جينًا لترميز البروتين في التجميع الحالي.

ورقة الجينوم: اتحاد تسلسل جينوم البطاطس (2011). تسلسل الجينوم وتحليل البطاطا محصول الدرنات. طبيعة سجية، 475: 189–195 DOI 10.1038 / nature10158

الباذنجان (Solanum melongena L.)

"على عكس محاصيل الباذنجان الهامة الأخرى مثل الطماطم والبطاطس والفلفل الحار والتبغ ، والتي نشأت جميعها في أمريكا الجنوبية وتزرع في جميع أنحاء العالم ، فإن الباذنجان (Solanum melongena L.) هو أصلي للعالم القديم وفي هذا الصدد فهو من الناحية التطورية لتوسيع معرفتنا بالطبيعة الجينية للنباتات الباذنجان بشكل أكبر ، قمنا بتشريح جينوم الباذنجان وبنينا مسودة مجموعة بيانات الجينوم مع 33873 سقالة تسمى SME_r2.5.1 والتي تغطي 833.1 ميجا بايت ، حوالي 74٪ من جينوم الباذنجان. حوالي 90٪ من مساحة الجين التي تم تغطيتها بواسطة SME_r2.5.1 وتم التنبؤ بـ 85446 جينًا في الجينوم. أظهر التحليل العنقودي للجينات المتوقعة للباذنجان جنبًا إلى جنب مع جينات ثلاث نباتات أخرى بالإضافة إلى Arabidopsis thaliana أنه من أصل 35000 عنقود تم تكوينها ، كان 4018 مكونًا حصريًا من جينات الباذنجان التي ربما تمنح سمات خاصة بالباذنجان. بين الباذنجان والطماطم ، تم استنتاج 16573 زوجًا من الجينات لـ متعامدًا ، ويمكن تعيين 9489 سقالة من الباذنجان على جينوم الطماطم. علاوة على ذلك ، تم تحديد 56 كتلة مخلقة محفوظة بين النوعين. سيسهل التحليل المقارن المفصل لجينوم الباذنجان والطماطم فهمنا للبنية الجينية للنباتات الباذنجانية ، والتي ستسهم في زراعة هذه المحاصيل والاستفادة منها. "- ملخص أبحاث الحمض النووي

الفلفل الأحمر (الفليفلة الحولية)

اتضح أن الفلفل الحار / الفلفل الحلو هو أحد تلك الأنواع التي أراد الكثير من الناس ترتيبها. نشرت إحدى المجموعات البحثية ، المؤلفة في الغالب من علماء كوريين ، مجموعة الجينوم الخاصة بهم في Nature Genetics بينما نشرت مجموعة ثانية تضم العديد من العلماء الصينيين نسختهم من الجينوم في PNAS بعد ذلك بوقت قصير.

جينوم الفلفل كبير لأن الأنواع النباتية ذات الجينومات المنشورة تصل إلى 3.3 جيجا بايت (1.5 ضعف حجم الذرة لأولئك الذين يتتبعون في المنزل). وجد الباحثون الذين نشروا الجينوم أن الكثير من هذا الحجم يأتي من ازدهار واحد من نشاط الارجاع العكسي المتكرر النهائي والذي حدث قبل 300000 عام فقط.

تبغ

"Nicotiana benthamiana هي أنواع نباتية نموذجية مستخدمة على نطاق واسع لدراسة الأسئلة الأساسية في التفاعلات الجزيئية بين النبات والميكروبات وغيرها من مجالات بيولوجيا النبات. وتنبع هذه الشعبية من قابليتها المميزة للتأثر بمسببات الأمراض المتنوعة ، وخاصة قابليتها للفيروس- طرق إسكات الجينات المستحثة وطرق التعبير عن البروتين العابر. هنا ، نُبلغ عن توليد تسلسل جينوم مسودة تغطية 63 ضعفًا لـ N. benthamiana وتوافره على شبكة Sol Genomics لكل من عمليات البحث بلاست وللتنزيل على الخوادم المحلية. الجينوم المقدر حجم N. benthamiana هو 3 جيجا بايت (جيجا بايت). يتكون التجميع الحالي من حوالي 141000 سقالة ، تمتد 2.6 جيجا بايت مع 50 ٪ من تسلسل الجينوم الموجود داخل السقالات و gt89 كيلو بايت. من حوالي 16000 N. benthamiana unigenes المتوفرة في GenBank ، و gt90 تم تمثيل٪ في التجميع. وقد تم توضيح فائدة التسلسل من خلال استرجاع N. benthamiana تقويم العظام s لـ 24 من الجينات المرتبطة بالمناعة من الأنواع الأخرى بما في ذلك Ago2 و Ago7 و Bak1 و Bik1 و Crt1 و Fls2 و Pto و Prf و Rar1 وكينازات البروتين المنشط بالميتوجين. سيكون التسلسل مفيدًا أيضًا لعلم الجينوم المقارن في عائلة Solanaceae كما هو موضح هنا من خلال اكتشاف microsynteny بين N. benthamiana والطماطم في المنطقة التي تشمل جينات Pto و Prf. "

زهرة القرد

زهرة القرد (ميمولوس جوتاتوس) الجينوم لم يكتمل بعد. لا يتم تجميع إصدار الجينوم الذي تم تحميله حاليًا في CoGe في جزيئات زائفة [1] ولكنه يحتوي على نماذج الجينوم. اقرأ المزيد حول جينوم زهرة القرد على النبات (يلزم إنشاء حساب / تسجيل الدخول) أو انظر التجميع الحالي في GenomeView هنا.

يقترح فيتوزوم الاستشهاد بهذه المخطوطة إذا نشرت تحليلات مقياس الجينوم الكامل لجينوم زهرة القرد.

الرماد المشترك

Fraxinus اكسلسيور غير منشورة ولكنها متاحة تحت Ft. لودرديل من مجموعة يقودها ريتشارد باجز في إنجلترا.

جينليسيا أوريا

"Genlisea aurea (Lentibulariaceae) هو نبات آكل اللحوم مع حجم جينوم صغير بشكل غير عادي - 63.6 ميجا بايت - أحد أصغر النباتات المعروفة بين النباتات العليا. تشير البيانات المتعلقة بأحجام الجينوم وتطور نسالة Genlisea إلى أن هذه حالة مشتقة داخل الجنس. وبالتالي ، G. aurea هو كائن حي نموذجي ممتاز لدراسة الآليات التطورية لانكماش الجينوم.هنا نقدم تقريرًا عن التسلسل وتجميع مشروع de novo لجينوم G. aurea. يتكون التجميع من 10687 كونتيج بطول إجمالي يبلغ 43.4 ميجا بايت ويتضمن 17.755 كاملًا و جينات الترميز الجزئي للبروتين.إن مقارنتها بجينوم Mimulus guttatus ، وهو ممثل آخر للكتلة اللاميالية عالية النواة ، تكشف عن اختلافات مذهلة في محتوى الجينات وطول المناطق غير المشفرة. كان تقلص الجينوم عملية معقدة ، والتي تنطوي على فقدان الجينات والحد منها من أطوال الإنترونات والمناطق بين الجينات ، ولكن ليس فقدان الإنترون. يكون فقدان الجينات أكثر شيوعًا للجينات التي تنتمي إلى العائلات متعددة الجينات التي تشير إلى أن يعتبر التكرار الجيني شرطًا أساسيًا مهمًا لتقليل حجم الجينوم ".

توت

"الخلفية: يعد العنب مصدرًا غنيًا بمضادات الأكسدة والمركبات المفيدة الأخرى التي يمكن أن تحمي من الأمراض. ويمكن أن يؤدي تحديد الجينات المشاركة في تخليق المركبات النشطة بيولوجيًا إلى تمكين تكاثر أنواع التوت ذات الفوائد الصحية المحسّنة. النتائج: لتحقيق هذه الغاية ، قمنا بتعليق مشروع جينوم عنبية التجميع باستخدام بيانات RNA-Seq من خمس مراحل من تطور ثمار التوت. التجميع الموجه بالجينوم لمحاذاة قراءة RNA-Seq جنبًا إلى جنب مع الإخراج من مكتشفات الجينات ab initio أنتج حوالي 60.000 نموذج جيني ، كان أكثر من نصفها مشابهًا لبروتينات من الأنواع الأخرى ، عادةً العنب Vitis vinifera. حددت مقارنة النماذج الجينية بقاعدة بيانات PlantCyc لأنزيمات المسار الأيضي الجينات المرشحة المشاركة في تخليق المركبات النشطة بيولوجيًا ، بما في ذلك bixin ، وهو أبوكاروتينويد مع خصائص محتملة لمكافحة الأمراض ، وجلوكوسيدات السيانوجين المتعلقة بالدفاع ، التي تعتبر سامة.كانت الإنزيمات التخليقية السيانوجينية جليكوسيد (CG) عالية التعرض مستخلص من الفاكهة الخضراء ، وتم تنظيم إنزيم إزالة السموم المرشح CG أثناء نضج الفاكهة. كما تم تحديد الجينات المرشحة للإيثيلين والأنثوسيانين و 400 مسار تخليقي حيوي آخر. أظهر التنميط عن تعبير RNA-Seq أن نمو العنبية والنضج والنضج ينطوي على تغييرات ديناميكية في التعبير الجيني ، بما في ذلك التنظيم المنسق صعودًا وهبوطًا لأنزيمات المسار الأيضي ، والجينات المرتبطة بنمو الخلايا ، والمنظمين المفترضة للنسخ. حدد تحليل محاذاة RNA-seq أيضًا الربط البديل المنظم تنمويًا ، واستخدام المروج ، وتشكيل نهاية 3. الاستنتاجات: نقوم بالإبلاغ عن تسلسل الجينوم ونماذج الجينات والتعليقات التوضيحية الوظيفية وبيانات تعبير RNA-Seq التي توفر موردًا جديدًا مهمًا يتيح دراسات عالية الإنتاجية في عنبية. تتوفر بيانات RNA-Seq مجانًا للتصور في متصفح الجينوم المتكامل ، ويتوفر رمز التحليل من مستودع git على http://bitbucket.org/lorainelab/blueberrygenome. "

كرز

"التوت البري الأمريكي (Vaccinium macrocarpon Ait.) هو واحد من ثلاثة فقط من محاصيل الفاكهة المزروعة على نطاق واسع في أمريكا الشمالية - والمحصولان الآخران هما التوت البري (Vaccinium spp.) والعنب المحلي (Vitis spp.). من حيث التصنيف ، التوت البري هي في جوهر Ericales ، وهو ترتيب تفتقر إليه حاليًا بيانات تسلسل الجينوم. بالإضافة إلى ذلك ، ينتج التوت البري مجموعة من المركبات الثانوية البوليفينولية المهمة ، بعضها مفيد لصحة الإنسان. في حين أن تكنولوجيا التسلسل من الجيل التالي تسمح بتطوير تسلسل الجينوم الكامل ، أحد العوائق الرئيسية أمام التجميع الناجح لبيانات تسلسل القراءة القصيرة للكائنات ثنائية الصبغيات المعقدة (والكائنات ذات الصبغيات الأعلى) هو تغاير الزيجوت. يتميز التوت البري بكونه ثنائي الصبغة (2n = 2x = 24) وخصبًا ذاتيًا. قلل من مشكلة تغاير الزيجوت ، قمنا بتسلسل جينوم الجيل الخامس من النمط الوراثي الفطري (F 0.97) المشتق من خمسة أجيال من التكاثر الذاتي التي نشأت من الصنف بن لير. حجم جينوم V تم تقدير macrocarpon بحوالي 470 ميجا بايت. تم تجميع التسلسلات الجينية في 229،745 سقالة تمثل 420 ميجابت في الثانية (N50 = 4237 نقطة أساس) بمتوسط ​​تغطية 20X. كان عدد الجينات المتوقعة 36364 يمثل 17.7٪ من الجينوم المجمع. من بين الجينات المتوقعة ، تم تخصيص 30،090 جينات مرشحة بناءً على التماثل. بلغ إجمالي الجينات المدعومة ببيانات النسخ 13،170 (36 ٪). يسمح تسلسل البندقية لجينوم التوت البري ، مع تغطية تسلسلية متوسطة تبلغ 20X ، بالتجميع الفعال واستدعاء الجينات. تمثل الجينات المرشحة التي تم تحديدها مجموعة مفيدة لمزيد من الدراسة للمسارات البيوكيميائية الهامة والعمليات الخلوية واستخدامها في تطوير الواسمات للتكاثر ودراسة الخصائص البستانية ، مثل مقاومة الأمراض ".

فاكهة الكيوي

"فاكهة الكيوي (الأكتينيديا تشينينسيس) هي محصول فاكهة مهم اقتصاديًا وغذائيًا يحتوي على نسبة عالية بشكل ملحوظ من فيتامين سي. هنا نُبلغ عن مسودة تسلسل الجينوم لفاكهة كيوي متغايرة الزيجوت ، تم تجميعها من

140 ضعفًا من بيانات التسلسل من الجيل التالي. يبلغ إجمالي طول الجينوم المُجمع 616.1 ميجا بايت ويحتوي على 39.040 جينًا. يكشف التحليل الجينومي المقارن أن ثمرة الكيوي خضعت لحدث سداسي الصيغة الصبغية القديم (γ) يتقاسمه eudicots الأساسية وحدثان آخران آخران لتكرار الجينوم الكامل. حدثت كلتا أحداث الازدواجية الأخيرة بعد تباين فاكهة الكيوي عن الطماطم والبطاطس وساهمتا في التفعيل الجديد للجينات المشاركة في تنظيم الخصائص المهمة لفاكهة الكيوي ، مثل فيتامين C ، واستقلاب الفلافونويد والكاروتينويد. نظرًا لكونه أول الأنواع المتسلسلة في Ericales ، فإن تسلسل جينوم فاكهة الكيوي يوفر موردًا قيمًا ليس فقط للاكتشاف البيولوجي وتحسين المحاصيل ولكن أيضًا لتحليل الجينوم التطوري والمقارن ، لا سيما في سلالة النجم. "

قهوة

"القهوة محصول مشروبات ثمين بسبب نكهته المميزة ورائحته والتأثيرات المحفزة للكافيين. لقد أنشأنا مسودة جينوم عالية الجودة لنوع Coffea canephora ، والذي يعرض ترتيبًا وراثيًا للكروموسومات محفوظًا بين كاسيات البذور النجمية. على الرغم من أنه يظهر لا توجد علامة على تضاعف الجينوم الكامل الذي تم تحديده في أنواع الباذنجان مثل الطماطم ، يشتمل الجينوم على العديد من توسعات عائلة الجينات الخاصة بالأنواع ، من بينها N-methyltransferases (NMTs) التي تشارك في إنتاج الكافيين ، والجينات المرتبطة بالدفاع ، والإنزيمات القلوية والفلافونويد تشارك في تخليق مركب ثانوي. تُظهر التحليلات المقارنة للكافيين NMTs أن هذه الجينات توسعت من خلال الازدواج الترادفي المتسلسل بشكل مستقل عن الجينات من الكاكاو والشاي ، مما يشير إلى أن الكافيين في eudicots هو من أصل متعدد النوى. "

Utricularia gibba

أصغر جينوم نبات مزهر تم تسلسله حتى الآن. (بيان دقيق اعتبارًا من خريف 2014)

"لقد قيل إن تطور حجم الجينوم النباتي هو في الأساس أحادي الاتجاه ومتزايد بسبب العمل المتنوع لتكاثر الجينوم الكامل (WGDs) وتكاثر العناصر المتنقلة 1. ومع ذلك ، تم الإبلاغ عن انخفاضات كبيرة في حجم الجينوم في شجرة عائلة كاسيات البذور. هنا نُبلغ عن تسلسل جينوم 82 ميغا بايت لنبات المثانة آكلة اللحوم Utricularia gibba. وعلى الرغم من صغر حجمه ، فإن جينوم U. gibba يستوعب عددًا نموذجيًا من الجينات للنبات ، مع الاختلاف الرئيسي عن جينومات النبات الأخرى الناشئة عن انخفاض حاد في الحمض النووي غير الجيني. بشكل غير متوقع ، حددنا ما لا يقل عن ثلاث جولات من WGD في U. gibba منذ أصل مشترك مع الطماطم (Solanum) والعنب (Vitis). تشير البنية المضغوطة لجينوم U. gibba إلى أن جزءًا صغيرًا من الحمض النووي بين الجينات ، مع القليل من الينقولات العكسية النشطة أو بدونها ، كافٍ لتنظيم ودمج جميع العمليات المطلوبة لتطوير وتكاثر كائن حي معقد ".

عشب الفرس

"Horseweed (Conyza canadensis) ، أحد أفراد عائلة Compositae (Asteraceae) ، كان أول عشب عريض الأوراق يطور مقاومة للجليفوسات. عشب Horseweed ، أحد أكثر الحشائش إشكالية في العالم ، هو مضاعف حقيقي (2n = 2x = 18 ) ، مع أصغر جينوم لأي عشب زراعي معروف (335 ميجا بايت).وبالتالي ، فهو مرشح مناسب لمساعدتنا على فهم الأسس الجينية والجينومية للأعشاب الضارة. لقد أجرينا مشروعًا لتجميع جينوم de novo لعشب الخيل من خلال دمج البيانات من منصات التسلسل المتعددة (454 GS-FLX و Illumina HiSeq 2000 و PacBio RS) باستخدام مكتبات مختلفة بأحجام إدخال مختلفة (حوالي 350 نقطة أساس ، و 600 نقطة أساس ، و 3 كيلوبايت ، و 10 كيلو بايت) من نوع حيوي عشبة حصان يمكن الوصول إليه من ولاية تينيسي ومقاوم للغليفوسات. من 116.3 جيجا بايت (تغطية 350 × تقريبًا) من البيانات ، تم تجميع الجينوم في 13966 سقالة بنسبة 50 ٪ من التجميع = 33.561 نقطة أساس. غطى التجميع 92.3 ٪ من الجينوم ، بما في ذلك جينوم البلاستيدات الخضراء الكامل (حوالي 153 كيلو بايت) وجينوم الميتوكوندريا شبه الكامل (حوالي 450 كيلو بايت في 120 سقالة). يتكون الجينوم النووي من 44592 جينًا مشفرًا للبروتين. تم إجراء إعادة تسلسل الجينوم لسبعة أنواع حيوية إضافية من أعشاب الخيول. تم تجميع بيانات التسلسل هذه واستخدامها لتحليل تباين الجينوم. تكرار التسلسل البسيط وتم مسح تعدد الأشكال أحادي النوكليوتيدات. تم الكشف عن الأنماط الجينية المرتبطة بالأنماط الحيوية المقاومة للغليفوسات أو الحساسة. سيكون مشروع الجينوم مفيدًا لفهم الأعشاب الضارة وتطور مقاومة مبيدات الأعشاب بشكل أفضل وابتكار استراتيجيات إدارة جديدة. سيكون الجينوم مفيدًا أيضًا كجينوم مرجعي آخر في التركيب. على حد علمنا ، تمثل هذه المقالة أول مسودة منشورة لجينوم حشيش زراعي ".

الورد

عنب

تباعد العنب مبكرًا عن المجموعتين الرئيسيتين للأنواع في الوردية (eurosids I و eurosids II) ولم يشهد أي ازدواج كامل في الجينوم منذ هذا الاختلاف مما جعله مجموعة خارجية مهمة لإجراء مقارنات مع الأنواع الوردية الأخرى بالإضافة إلى توفير مورد رائع لـ دراسة سداسي الصيغة الصبغية القديمة التي سبقت إشعاع الأنواع الوردية (وربما إشعاع أنواع eudicot).

يحتوي إصدار جينوم العنب في CoGe

500 ميغا قاعدة من التسلسل و 26346 جينًا مشروحًا تنتشر عبر 19 كروموسومًا.

جايلون ، أو. ، أوري ، ج ، نويل ، ب ، بوليكريتي ، أ ، كليبيت ، سي ، كاساجراندي ، أ ، تشويسن ، إن ، أوبورج ، إس ، فيتولو ، إن ، جوبين ، سي ، Vezzi، A.، Legeai، F.، Hugueney، P.، Dasilva، C.، Horner، D.، Mica، E.، Jublot، D.، Poulain، J.، Bruyère، C.، Billault، A.، Segurens، B.، Gouyvenoux، M.، Ugarte، E.، Cattonaro، F.، Anthouard، V.، Vico، V.، Del Fabbro، C.، Alaux، M.، Di Gaspero، G.، Dumas، V . ، فيليس ، إن ، بيلارد ، إس ، جومان ، آي ، مورولدو ، إم ، سكالابرين ، إس ، كاناجوير ، إيه ، لو كلاينش ، آي ، مالاكريدا ، جي ، دوراند ، إي ، بيسول ، G.، Laucou، V.، Chatelet، P.، Merdinoglu، D.، Delledonne، M.، Pezzotti، M.، Lecharny، A.، Scarpelli، C.، Artiguenave، F.، Pè، M.، Valle، G. ، Morgante ، M. ، Caboche ، M. ، Adam-Blondon ، A. ، Weissenbach ، J. ، Quétier ، F. ، & amp Wincker ، P. (2007). يشير تسلسل جينوم العنب إلى سداسية الصبغيات السداسية في شُعَب كاسيات البذور الرئيسية الطبيعة ، 449 (7161) ، 463-467 DOI: 10.1038 / nature06148

شجرة علكة الورد / أوكالبتوس

أحد أنواع الأشجار العديدة التي يُشار إليها بالاسم الشائع "الأوكالبتوس" ، وهي شجرة صمغ الورد (أوكالبتوس غرانديز) موطنه أستراليا ، ولكنه يعتبر مرشحًا لإنتاج الوقود الحيوي في الولايات المتحدة. شجرة صمغ الورد عبارة عن وردة قاعدية ، مثل العنب ، لذلك بالإضافة إلى قيمة تسلسل الجينوم هذا لأغراض تربية الوقود الحيوي ، يعمل هذا الجينوم كمجموعة خارجية قيمة للورود الأساسية (المدرجة باسم Eurosids 1 و Eurosids 2 في هذا الموقع) .

تم تسلسل جينوم صمغ الورد إلى تغطية 8x من قبل معهد الجينوم المشترك وتم تجميعه في 11 مجموعة ربط / كروموسوم. يتضمن الإصدار الأولي للجينوم 691 ميجابايت من بيانات التسلسل ، و 41204 جينة ترميز بروتينية موجودة في مجموعات الكروموسوم المفترضة. اقرأ المزيد / قم بتنزيل التسلسل من Phytozome (يلزم إنشاء حساب / تسجيل الدخول).

مالبيغياليس

يتناقش الأشخاص المختلفون الذين يستخدمون خطوطًا مختلفة من الأدلة حول ما إذا كانت Malpighiales تنتمي إلى Eurosids I أو Eurosids II. حتى يتم حل ذلك غير مؤكد ، يتم تقديمها كفرع منفصل داخل Rosids.

حور

تنتشر 370 ميجا قاعدة للتسلسل و 41377 جينًا لترميز البروتين على 19 كروموسومًا.

ورقة الجينوم: Tuskan، G.، DiFazio، S.، Jansson، S.، Bohlmann، J.، Grigoriev، I.، Hellsten، U.، Putnam، N.، Ralph، S.، Rombauts، S.، Salamov، A.، شين ، ج. ، ستيرك ، إل. ، أيرتس ، إيه ، بهاليراو ، آر ، بهاليراو ، آر ، بلوديز ، دي ، بويرجان ، دبليو ، برون ، إيه ، برونر ، إيه ، بوسوف ، ف ، كامبل ، إم ، كارلسون ، جيه ، تشالوت ، إم ، تشابمان ، جيه ، تشين ، جي ، كوبر ، دي ، كوتينهو ، بي ، كوتورييه ، جيه ، كوفيرت ، إس ، كرونك ، كيو ، كننغهام ، آر ، ديفيس ، جيه ، ديغريف ، إس ، ديجاردين ، إيه ، دي بامفيليس ، سي ، ديتر ، جي ، ديركس ، بي ، دوبتشاك ، آي ، دوبليسيس ، إس ، إلتنغ ، جي ، Ellis، B.، Gendler، K.، Goodstein، D.، Gribskov، M.، Grimwood، J.، Groover، A.، Gunter، L.، Hamberger، B.، Heinze، B.، Helariutta، Y.، Henrissat، B.، Holligan، D.، Holt، R.، Huang، W.، Islam-Faridi، N.، Jones، S.، Jones-Rhoades، M.، Jorgensen، R.، Joshi، C.، Kangasjarvi ، J. ، Karlsson ، J. ، Kelleher ، C. ، Kirkpatrick ، ​​R. ، Kirst ، M. ، Kohler ، A. ، Kalluri ، U. ، Larimer ، F. ، Leebens-Mack ، J. ، Leple ، J. ، لوكاسشيو ، ب ، لو ، واي ، لوكاس ، إس ، مارتن ، إف ، مونتانيني ، بي ، نابولي ، سي ، نيلسون ، دي ، نيلسون ، سي ، نيمينين ، ك ، نيلسون ، أو. ، بيريدا ، ف ، بيتر ، ج ، فيليب ، ر. ، بيلاطس ، ج ، بولياكوف ، أ ، رازوموفسكايا ، ج ، ريتشاردسون ، ب. رينالدي ، سي ، ريتلاند ، ك ، روز ، ب ، ريابوي ، دي ، شموتز ، جي ، شريدر ، جي ، سيجرمان ، بي ، شين ، إتش ، صديقي ، إيه ، ستيركي ، إف ، Terry، A.، Tsai، C.، Uberbacher، E.، Unneberg، P.، Vahala، J.، Wall، K.، Wessler، S.، Yang، G.، Yin، T.، Douglas، C.، مارا ، إم ، ساندبرج ، جي ، فان دي بير ، واي ، & أمبير روخسار ، دي (2006). جينوم خشب القطن الأسود ، Populus trichocarpa (Torr. & amp Gray) علم ، 313 (5793) ، 1596-1604 DOI: 10.1126 / العلوم .11128691

شجيرة الصفصاف

ساليكس بوربوريا غير منشورة ولكنها متاحة تحت Ft. لودرديل

"هذا إصدار مبكر v1.0 من تسلسل الجينوم لاستنساخ أنثى Salix purpurea 94006. Salix purpurea شجيرة ثنائية الصبغة موطنها أوروبا ومتجنس في أمريكا الشمالية. تم جمع النسخ 94006 من ضفاف أحد الأنهار شمالًا في سيراكيوز ، نيويورك. يتم تطوير Salix purpurea والهجين متعدد الأنواع كمحصول طاقة حيوية يتم تكاثره نسليًا ويتم إدارته في أنظمة coppice قصيرة الدوران والتي يتم حصادها عادةً كل ثلاث سنوات مع إعادة التكاثر القوية بعد كل حصاد. Salix purpurea هو قريب من أنواع الأشجار النموذجية الرئيسية لوزارة الطاقة ، Populus trichocarpa ، في عائلة Salicaceae ".

من Phytozome في JGI (حيث يمكنك أيضًا تنزيل الجينوم بعد إنشاء حساب JGI وتسجيل الدخول).

الكتان (استخدام لينوم) هو محصول قديم من الألياف يُزرع لإنتاج الكتان ويستخدم أيضًا كمحصول بذور زيتية لإنتاج زيت بذر الكتان (يُطلق عليه أيضًا "زيت بذور الكتان"). يحتوي الكتان على حجم جينوم إجمالي صغير (يقدر بـ

350 ميجا بايت) والتجميع الحالي v1.0 تم إنتاجه بالكامل بواسطة تسلسل Illumina. يتكون هذا التجميع المبكر من عدد كبير من السقالات (& 88000 طنًا) ولكن 290 ميغا قاعدة من جينوم الكتان موجود فقط في 664 سقالة ، وهو رقم يسهل التحكم فيه. مشروع جينوم الكتان هو تعاون بين BGI ومجموعة من الباحثين الكنديين. قم بالتنزيل من خلال phytozome (يلزم إنشاء حساب / تسجيل الدخول).

ورقة الجينوم: Wang Z. (2012) "جينوم الكتان (Linum usitatissimum) تم تجميعه من جديد من تسلسل بندقية قصيرة يقرأ." مجلة النبات DOI: 10.1111 / j.1365-313X.2012.05093.x

حبة الخروع

حبة الخروع (الخروع COMMUNIS) هو نبات البذور الزيتية التي هي مصدر زيت الخروع والريسين السام القاتل. يجب عدم الخلط بين حبة الخروع والفول الشائع (فاسولوس، فولغاريس) الموجودة في خط أنابيب التسلسل التابع لمعهد الجينوم المشترك.

يعتمد جينوم حبوب الخروع المنشور على تغطية 4.6x للجينوم باستخدام تسلسل solexa.

يتكون الإصدار الحالي من 31237 نموذجًا جينيًا موزعة على 25800 سقالة.

يقدر الجينوم بأكمله

320 ميغا في الحجم وتحتوي على 10 كروموسومات.

ورق الجينوم Agnes P Chan et al. ، "مشروع تسلسل الجينوم لأنواع البذور الزيتية Ricinus communis ،" Nature Biotechiology ، DOI 10.1038 / nbt 1674

الكسافا

الكسافا (Manihot esculenta) هو أهم محصول لم يسمع به معظم الناس في أمريكا وأوروبا (ربما باستثناء التابيوكا ربما). تم تدجين الكسافا في الأصل في أمريكا الجنوبية ، وهو الآن مصدر غذائي مهم في جنوب شرق آسيا وأفريقيا. يتم توفير مسودة الجينوم الحالية من خلال phytozome (إنشاء حساب / تسجيل الدخول مطلوب) ويتكون من 416 ميجا قاعدة للتسلسل موزعة على 11243 contigs. هذا هو فقط ما يزيد قليلاً عن 50 ٪ من الحجم الإجمالي المقدر لجينوم الكسافا ، لكن الأشخاص المشاركين في التسلسل والتجميع يعتقدون أنه يمثل غالبية الجينوم غير المتكرر. يتضمن الإصدار الحالي أيضًا 47164 جينًا متوقعًا.

ورقة الجينوم: Prochnik S et al (2012) "جينوم الكسافا: التقدم الحالي ، الاتجاهات المستقبلية." DOI: 10.1007 / 12042-011-9088-z & lt - هذه هي الورقة التي يقول فيتوزوم أن تستشهد بها عند استخدام جينوم الكسافا.

شجرة المطاط

بينما تنتج النباتات الأخرى أيضًا المطاط الطبيعي ، فإن الغالبية العظمى مما يتم إنتاجه تجاريًا يأتي من هذا النوع (هيفيا براسيلينسيس). بينما لا تغطي مجموعة الجينوم الحالية سوى نصف حجم الجينوم المقدر لشجرة المطاط (1.1 جيجا بايت مجمعة من جينوم 2.15 جيجا بايت) وهي مجزأة للغاية (N50 =

3000) ، قدم المؤلفون دليلًا على أن تجميعهم يلتقط غالبية مساحة جينوم المطاط.

يحتوي التعليق التوضيحي الحالي للجينوم على ما يقرب من 70000 جينة مفترضة تعتمد على محاذاة البروتين من الأنواع ذات الصلة ، وحزم برامج التنبؤ الجيني RNA-seq ، و de novo. يتكون جينوم شجرة المطاط من 18 كروموسومًا.

الجينوم فابر: Yamin Abdul Rahman، A et al (2013) "مشروع تسلسل الجينوم لشجرة المطاط Hevea brasiliensis." علم الجينوم BMC دوى: 10.1186 / 1471-2164-14-75

في الوقت الحالي ، يبدو أنه المكان الوحيد للاستيلاء على مجموعة الجينوم المطاطي في NCBI.

يوروسيدس 1

قزم بيرش

البتولا القزم ("بيتولا نانا"). أضف المزيد من التفاصيل هنا.

ورقة الجينوم: Wang N et al (2012) "تسلسل جينوم البتولا القزم (Betula nana) وعلامات RAD عبر الأنواع." علم البيئة الجزيئية DOI: 10.1111 / مك .12131

كويركوس روبور (بلوط)

تندرج العديد من الأنواع المختلفة في الاسم الشائع للبلوط. هذه الأنواع خاصة Quercus robur يمكن الإشارة إليها إما باسم "البلوط الإنجليزي" أو "البلوط الفرنسي". بالنظر إلى هذه الخيارات والوصول الدولي للإنترنت ، ربما يكون من الأكثر أمانًا التمسك بالاسم العلمي. هذا هو جينوم ما قبل النشر وما قبل الإصدار ، ولكن تمت إضافة هذا القسم كعنصر نائب لجعل هناك تجميعًا لـ Q. rubor تم إنتاجه بدعم من INRA في فرنسا متاحًا للتنزيل في المستقبل القريب: https: / /w3.pierroton.inra.fr/QuercusPortal/index.php؟p=OAK_GENOME_SEQUENCING

القرع
خيار

تضمن المنشور أيضًا خريطة جينية بطول إجمالي يبلغ 581 سم بناءً على 1،885 علامة. تتوفر موارد من هذا الإصدار من جينوم الخيار في هذا الموقع.

بشكل مستقل ، أصدرت مجموعة من الباحثين في الولايات المتحدة مسودة لتسلسل جينوم الخيار للخط الفطري Gy14. تم تجميع هذا الإصدار من الجينوم من 454 قراءة تسلسلية ويتكون الإصدار الحالي من 203 ميغا قاعدة من التسلسل و 21491 جينة ترميز بروتينية متوقعة تنتشر على 4219 سقالة. هذا الإصدار متاح في Phytozome.

تم إنتاج نسخة ثالثة من جينوم الخيار ، وهو أحد الصنف Borszczagowski line B10 بواسطة مجموعة بحثية بولندية وتم نشره في عام 2011 والبيانات الناتجة متاحة هنا.

ورقة الجينوم: Huang، S.، Li، R.، Zhang، Z.، Li، L.، Gu، X.، Fan، W.، Lucas، W.، Wang، X.، Xie، B.، Ni، P.، Ren، Y.، Zhu، H.، Li، J.، Lin، K.، Jin، W.، Fei، Z.، Li، G.، Staub، J.، Kilian، A.، van der Vossen، E .، Wu، Y.، Guo، J.، He، J.، Jia، Z.، Ren، Y.، Tian، G.، Lu، Y.، Ruan، J.، Qian، W.، Wang، M . ، هوانغ ، كيو ، لي ، ب ، شوان ، زد ، تساو ، ج. ، أسان ،. ، وو ، زد ، زانغ ، ج. ، كاي ، كيو ، باي ، واي ، تشاو ، ب. ، هان ، واي. ، لي ، واي ، لي ، إكس ، وانغ ، إس ، شي ، كيو ، ليو ، إس ، تشو ، دبليو ، كيم ، جي ، شو ، واي ، هيلر-أوزينسكا ، K. ، Miao ، H. ، Cheng ، Z. ، Zhang ، S. ، Wu ، J. ، Yang ، Y. ، Kang ، H. ، Li ، M. ، Liang ، H. ، Ren ، X. ، Shi ، Z.، Wen، M.، Jian، M.، Yang، H.، Zhang، G.، Yang، Z.، Chen، R.، Liu، S.، Li، J.، Ma، L.، Liu، H. ، Zhou ، Y. ، Zhao ، J. ، Fang ، X. ، Li ، G. ، Fang ، L. ، Li ، Y. ، Liu ، D. ، Zheng ، H. ، Zhang ، Y. ، Qin ، N.، Li، Z.، Yang، G.، Yang، S.، Bolund، L.، Kristiansen، K.، Zheng، H.، Li، S.، Zhang، X.، Yang، H.، Wang، J.، Sun، R.، Zhang، B.، Jiang، S.، Wang، J.، Du، Y.، & amp Li، S. (2009). جينوم الخيار Cucumis sativus L. علم الوراثة الطبيعي ، 41(12) ، 1275-1281 DOI: 10.1038 / ng.475

شمام

شمام (كوكوميس ميلو هو قريب من الخيار (يمكنك معرفة ذلك لأنه يشترك في نفس اسم الجنس. أو من خلال تذكر مدى تشابه النباتات إذا كنت قد نشأت في الحديقة). جينوم البطيخ المتسلسل عبارة عن خط أحادي الصبغيات يسمى DHL92 ويقدر أنه يغطي 83 ٪ من إجمالي الجينوم (375 و 450 ميغا قاعدة على التوالي). تم تسلسل الجينوم الأولي بـ 454 قراءة (تغطية 13.5x) على الرغم من استخدام تسلسل Sanger لنهايات BAC للمساعدة في التجميع ، واستخدمت قراءات Illumina لتصحيح الأخطاء في مناطق البوليمر المتجانس (سلسلة من AAAA ، TTTT ، CCCC ، أو GGGG & lt-- 454 لديه مشكلة في معرفة عدد النسخ الكلية الموجودة للنيوكليوتيدات والتي يتم تشغيلها على تسلسلات مثل هذه).

تم تجميع الجينوم في 12 جزيء كاذب بمساعدة خريطة جينية. تحتوي هذه الجزيئات الكاذبة الاثني عشر على 316 ميغا قاعدة من التسلسل (ما يقرب من 70 ٪ من إجمالي حجم جينوم البطيخ المقدر).

Garci-Mas J et al (2012) "جينوم البطيخ (كوكوميس ميلو L.) " PNAS DOI: 10.1073 / pnas.1205415109

تنزيل بيانات التسلسل:

البطيخ

جينوم البطيخ (Citrullus lanatus) هو جينوم آخر جلبه إلينا معهد بكين لعلم الجينوم. تم تسلسل جينوم قاعدة 425 ميجا بايت إلى عمق & gt100x باستخدام تسلسل قراءة قصير من Illumina. تضمنت مجموعة الجينوم الناتجة 353.5 ميغا قاعدة من التسلسل ، تم وضع 330 ميغا منها في 11 جزيءًا كاذبًا تمثل كل كروموسوم بطيخ.

ورقة الجينوم: Guo et al (2012) "مشروع جينوم البطيخ (Citrullus lanatus) وإعادة ترتيب 20 مدخلات متنوعة" علم الوراثة الطبيعي دوى: 10.1038 / نانوغرام. 2470

وودلاند الفراولة

فراولة الغابة (فراغاريا فيسكا) ليست الأنواع التي تنتج معظم الفراولة التي تراها على أرفف محلات البقالة اليوم. وعادة ما تكون تلك من الفراولة في الحديقة. ومع ذلك ، فإن فراولة الحديقة عبارة عن أخطبوط ، مما يجعل تسلسل جينومها صعبًا نسبيًا ، في حين أن فراولة الغابات تمتلك جينوم ثنائي الصبغة أكثر قابلية للإدارة. لمزيد من المعلومات حول قصة كيفية تسلسل الفراولة في الغابة ، تحقق من هذه القصة الرائعة من أحد العلماء وراء ورقة الجينوم.

يتكون جينوم الفراولة المنشور من 7 كروموسومات / جزيئات زائفة.

ورقة الجينوم: فلاديمير شولايف وآخرون ، "جينوم فراولة الغابات (Fragaria vesca) ، Nature Genetics 43: 109-116. DOI: 10.1038 / نانوغرام 740

تفاح

التفاحة (Malus x domestica) تم نشر الجينوم في أواخر أغسطس من عام 2010. ويقدر إجمالي الجينوم بـ 742.3 ميغابايت ، موزعة على 17 كروموسوم. يشتمل الجينوم المنشور على 600 ميجا قاعدة من التسلسل تم تجميعها في 17 جزيءًا زائفًا وعددًا من contigs الأصغر غير المرتبط. يحتوي جينوم التفاح على 57386 جينًا مفترضًا ، وهو عدد كبير يُعزى ، جزئيًا على الأقل ، إلى تكرار كامل للجينوم في سلالة التفاح التي يعود تاريخها إلى 30-65 مليون سنة ماضية. لم يتم تحميل جينوم التفاح بعد في CoGe ، ولا يبدو أنه متاح للتنزيل حتى الآن ، ومع ذلك ، هناك متصفح للجينوم متاح.

ريكاردو فيلاسكو وآخرون ، "جينوم التفاح المستأنسة (Malus [مرات] domestica Borkh.) ،" Nature Genetics ، DOI: 10.1038 / ng.654

الإجاص (بيريوس بريتشنايديري ريد. السيرة الذاتية. Dangshansuli) تم تسلسله بواسطة مجموعة صينية مقرها في جامعة نانجينغ الزراعية. لم يتم نشر ورقة الجينوم في البداية ، ولكن من الممكن طلب نسخة ما قبل النشر من الجينوم من خلال موقع مشروع جينوم الكمثرى. تم إصدار ورقة الجينوم في نوفمبر 2012.

على الرغم من أنني لم ألقي نظرة على مجموعة جينوم الكمثرى بنفسي (معظم الأشياء التي أهتم بها تعتبر تحليلات محفوظة) ، فإن وصف الجينوم واعد للغاية ، حيث يقول الباحثون إنهم استخدموا نهج BAC-by-BAC إلى التسلسل وإنشاء خريطة جينية كثيفة تغطي جميع كروموسومات الكمثرى السبعة عشر. سينتج عن هذين الأسلوبين تجميعات جينوم أكبر وأكثر دقة مما هو ممكن عند استخدام تقنيات تسلسل القراءة القصيرة مثل Illumina و Ion torrent. (الجانب السلبي هو أن تسلسل BAC-by-BAC يستغرق وقتًا أطول ويكلف أكثر ، وهذا هو السبب في أنه لم يعد شائعًا بعد الآن).

Wu et al (2012) "جينوم الكمثرى (Pyrus bretschneideri Rehd.)" أبحاث الجينوم دوى: 10.1101 / غرام .144311.112

القنب

جينوم القنب (القنب) في Genome Biology في أكتوبر 2011. اكتمل تسلسل الجينوم باستخدام خليط 454 وتسلسل Illumina ، مع استخدام أزواج رفيقة لسد الفجوات في المناطق المجمعة. نتيجة لذلك ، في حين تم تجميع 534 ميجا بايت فقط من الجينوم ، امتدادات الجينوم و GT786 ميجا بايت من التسلسل (200 ميجا بايت الإضافية هي NNNNNN التي تمثل تسلسلات متكررة غير مجمعة - الينقولات - ذات الطول المعروف بين المناطق المتسلسلة من الجينوم). بالإضافة إلى الجينوم نفسه ، أنتجت نفس المجموعة البحثية قدرًا كبيرًا من بيانات RNA-seq الخاصة بالأنسجة من أصناف متعددة من القنب.

ورق الجينوم: Harm van Bakel et al "مشروع جينوم ونسخة القنب ساتيفا." بيولوجيا الجينوم DOI: 10.1186 / gb-2011-12-10-r102

القفزات هي عنصر أساسي في إنتاج البيرة. هناك أيضًا النوع الثاني في Cannabaceae الذي تم نشر تسلسل الجينوم الخاص به (بعد القنب أعلاه).

"زهرة القفزة الأنثوية (Humulus lupulus var. lupulus) هي عنصر أساسي يمنح البيرة رائحة مميزة ومرارة وقوة تحمل / استقرار. ومع ذلك ، فإن الأساس الجيني الجزيئي لتحديد علامات الحمض النووي في قفز التكاثر ودراسة تدجينها تم تأسيسه بشكل سيئ. هنا ، نقدم مسودة جينومات لصنفين من القفزات (السيرة الذاتية Saazer [SZ] والسيرة الذاتية Shinshu Wase [SW]) والقفز البري الياباني (H. lupulus var. cordifolius المعروف أيضًا باسم Karahanasou [KR] أدى التسلسل والتجميع الجديد للحمض النووي الجيني من نباتات SW متغايرة الزيجوت إلى إنشاء سقالات بحجم إجمالي يبلغ 2.05 غيغا بايت (Gb) ، وهو ما يعادل 80 ٪ تقريبًا من حجم الجينوم المقدر للقفز (2.57 جيجا بايت). احتوت السقالات على 41228 بروتينًا مفترضًا - ترميز الجينات.تم إنشاء تسلسل الجينوم لـ SZ و KR من خلال محاذاة قراءات تسلسلها القصير مع الجينوم المرجعي SW ثم استبدال النيوكليوتيدات في مواقع SNP. كشف تحليل تسلسل De novo RNA (RNA-Seq) لـ SW التنظيم التطوري للجينات المشاركة في عمليات التمثيل الغذائي المتخصصة التي تؤثر على الطعم والنكهة في البيرة. إن تطبيق أداة المعلوماتية الحيوية الجديدة ، RNA-Seq المقارن للتطور (PCP-Seq) ، والذي يعتمد على قراءة عمق الحمض النووي DNA و RNAs ، مكّن من تحديد الجينات المتعلقة بالتخليق الحيوي للروائح والنكهات التي يتم إثرائها في SW. لا تشير نتائجنا فقط إلى أهمية عملية الانتقاء البشرية التاريخية في تعزيز التوليفات الحيوية للرائحة والمرارة في أصناف القفزات ، ولكنها تعمل أيضًا كمعلومات مهمة لتربية الأصناف ذات الجودة والإنتاجية العالية ".

عناب

عناب (Ziziphus jujuba Mill.) ، أحد أفراد عائلة Rhamnaceae ، هو فاكهة جافة رئيسية وطب عشبي تقليدي لأكثر من مليار شخص. نقدم هنا تسلسلًا عالي الجودة لجينوم العناب المعقد ، وهو أول تسلسل جينوم لـ Rhamnaceae ، باستخدام إستراتيجية متكاملة. يمتد التجميع النهائي على 437.65 ميجا بايت (98.6 ٪ من المقدرة) مع 321.45 ميجا بايت مثبتة على 12 كروموسومًا زائفًا ويحتوي على 32808 جينًا. خضع جينوم العناب إلى اندماج متكرر بين الكروموسومات وازدواجية مقطعية ، ولكن لم يحدث تكرار للجينوم الكامل. تكشف التحليلات الإضافية للجينات الخاصة بالعناب وبيانات النسخ من 15 أنسجة عن الآليات الجزيئية الكامنة وراء بعض الخصائص المحددة للعناب. يمكن أن يعزى محتواه العالي من فيتامين سي إلى مستوى فريد من التعبير عن الجينات المشاركة في كل من التخليق الحيوي والتجديد. توفر دراستنا نظرة ثاقبة في علم الأحياء الخاص بالعناب والموارد الجينومية القيمة لتحسين نباتات Rhamnaceae وغيرها من الأشجار المثمرة.

خوخ

200 contigs أصغر غير في مكانه. إجمالي التسلسل الذي تم إصداره هو 227 ميغا قاعدة ويتضمن 27852 جينًا مشروحًا. تم تسلسل الجينوم إلى تغطية 7.7x باستخدام تسلسل Sanger.

في مارس 2013 نُشرت الورقة التي تصف جينوم الخوخ في Nature Genetics:

مبادرة جينوم الخوخ الدولية 2013 "مشروع جينوم الخوخ عالي الجودة (Prunus persica) يحدد أنماطًا فريدة من نوعها للتنوع الجيني والتدجين وتطور الجينوم" DOI: 10.1038 / ng.2586

البرقوق الصيني / مي

البرقوق الصيني (أو المشمش الياباني ، الأوروبيون في الأساس لم يكونوا مبدعين على الإطلاق في ابتكار أسماء إنجليزية للمنتجات الآسيوية) هو ، مثل الخوخ ، عضو في الجنس برقوق. خاصة برقوق مومي. مثل الخوخ أيضًا ، يحتوي على جينوم صغير يبعث على السخرية (280 ميغا قاعدة) تم تجميعه جيدًا في ثمانية جزيئات كاذبة باستخدام الخرائط الجينية والبصرية. تم تسلسل جينوم البرقوق الصيني إلى تغطية 100x باستخدام تسلسل Illumina.

يتم توفير بيانات الجينوم والشروح من خلال هذا الموقع: http://prunusmumegenome.bjfu.edu.cn/

Qixiang Zhang et al "جينوم Prunus mume." اتصالات الطبيعة 2012 DOI: 10.1038 / ncomms2290

البقوليات

البقوليات (الفصيلة النباتية Fabaceae) الموجودة داخل كليد eurosid II. ربما تشتهر العائلة بحقيقة أن العديد من الأنواع التي تحتويها تشكل علاقات تكافلية مع البكتيريا المثبتة للنيتروجين. يتم حماية البكتيريا وتغذيتها داخل عقيدات خاصة في جذور هذه النباتات وفي المقابل تستفيد النباتات من قدرة البكتيريا على تحويل النيتروجين في غلافنا الجوي إلى أشكال متاحة بيولوجيًا (النيتروجين المتاح بيولوجيًا غالبًا ما يكون عنصرًا غذائيًا محدودًا للأنواع النباتية الأخرى) .

ميديكاغو

ميديكاغو (ميديكاغو truncatula) عبارة عن بقوليات صغيرة تستخدم كنوع نموذجي لتكوين العقيدات وتثبيت النيتروجين - كما هو الحال في اللوتس. أحدث إصدار من جينوم Medicago هو Mt3.0 والذي يتضمن 240 ميجا قاعدة من التسلسل المرتبط بالكروموسومات الثمانية في Medicago ، بالإضافة إلى 16.6 ميجا بايت من التسلسل غير المرتبط. اقرأ المزيد على صفحة الويب الخاصة بشركة Medicago Genome Annotation Group.

ورق الجينوم: Young ND et al (2011) يوفر جينوم Medicago نظرة ثاقبة لتطور التعايش الجذري. طبيعة سجية DOI: 10.1038 / nature10625

الحمص

الحمص (Cicer arietinum) على نطاق واسع في جميع أنحاء العالم على الرغم من أن مراكز الإنتاج والاستهلاك هي الشرق الأوسط والهند. في حين أن الحمص كان المكون الرئيسي لشانا ماسالا اللذيذة التي حافظت على مؤلفك المتواضع خلال العديد من الأمسيات المتأخرة على جهاز الكمبيوتر الخاص به في مدرسة الدراسات العليا ، في معظم المأكولات الغربية ، غالبًا ما تتم مصادفة الحمص المهروس لصنع الحمص. اعتمادًا على متجر البقالة ، يمكن أيضًا تصنيف الحمص المعلب على أنه حبوب الحمص. لكن إلى الجينوم!

يُشتق جينوم الحمص من الانضمام CDC Frontier وهو عضو في كابولي نوع فرعي. بناءً على وفرة الكيلومتر ، يقدر المؤلفون الحجم الإجمالي للجينوم

حجم 740 ميغا. باستخدام مجموعة كبيرة من بيانات Illumina (وتغطية الجينوم بمقدار 100 ضعف بعد تقليم الجودة) ، تمكن المؤلفون من تجميع 545 ميجا قاعدة في contigs. باستخدام الخرائط الجينية وتسلسلات نهاية BAC ، تمكن المؤلفون من وضع 345 ميجا قاعدة على التسلسل على ثمانية جزيئات زائفة.

ورق الجينوم: Varshney RK et al (2013) "مشروع تسلسل الجينوم للحمص (Cicer arietinum) يوفر موردًا لتحسين السمات." التكنولوجيا الحيوية الطبيعة DOI: 10.1038 / nbt.2491

كما تم الآن نشر جينوم ثان للحمص. استهدف هذا المشروع الحمص من النوع المرغوب مما أدى إلى تكوين قاعدة جينوم تبلغ 520 ميجا بايت:

ورق الجينوم: Jain M et al (2013) "مشروع تسلسل جينوم لمحصول حبوب الحمص (Cicer arietinum L.)." مجلة النبات DOI: 10.1111 / tpj.12173

لوتس جابونيكوس

لوتس جابونيكوس هو بقول صغير يستخدم كنموذج لتشكيل العقيدات وتثبيت النيتروجين - كما هو الحال في ميديكاغو. الإصدار الحالي من جينوم Lotus هو الإصدار 2.5 والذي يتضمن 315 ميجا قاعدة من التسلسل المجمع (ما يقدر بنحو 67٪ من الجينوم). في الإصدار 2.5 ، تم تجميع 201 ميجا قاعدة من التسلسل في ستة جزيئات زائفة تتوافق مع الكروموسومات الستة في اللوتس. تم إثبات إحصائيات وروابط إضافية لتنزيل الجينوم بواسطة معهد Kazusa DNA Research Institute.

ورق الجينوم: Sato S et al (2008) هيكل جينوم البقوليات ، لوتس جابونيكوس. بحوث الحمض النووي DOI: 10.1093 / dnares / dsn008

فول الصويا

نُشر جينوم فول الصويا في أوائل عام 2010 واحتوى على 950 ميجا قاعدة من التسلسل بالإضافة إلى 46430 جينة ترميز بروتينية متوقعة موزعة على عشرين كروموسوم. لقد مر أسلاف فول الصويا باثنتين من الازدواجية في الجينوم منذ السداسية الصبغية القديمة كأساس لسلالة eudicot مع الأقدم التي تشير التقديرات إلى حدوثها قبل 59 مليون سنة والأحدث قد حدث منذ 13 مليون سنة.

ورقة الجينوم: Schmutz، J.، Cannon، S.، Schlueter، J.، Ma، J.، Mitros، T.، Nelson، W.، Hyten، D.، Song، Q.، Thelen، J.، Cheng، J. ، Xu، D.، Hellsten، U.، May، G.، Yu، Y.، Sakurai، T.، Umezawa، T.، Bhattacharyya، M.، Sandhu، D.، Valliyodan، B.، Lindquist، E. ، بيتو ، إم ، جرانت ، دي ، شو ، إس ، جودستين ، دي ، باري ، ك ، فوترل جريجس ، إم ، أبيرناثي ، بي ، دو ، جي ، تيان ، زي ، تشو ، L. ، جيل ، N. ، جوشي ، T. ، Libault ، M. ، Sethuraman ، A. ، Zhang ، X. ، Shinozaki ، K. ، Nguyen ، H. ، Wing ، R. ، Cregan ، P. ، Specht ، J.، Grimwood، J.، Rokhsar، D.، Stacey، G.، Shoemaker، R.، & amp Jackson، S. (2010). تسلسل الجينوم لفول الصويا palaeopolyploid الطبيعة ، 463 (7278) ، 178-183 DOI: 10.1038 / nature08670

  • أحد الأقارب البرية لفول الصويا المستأنسة (جليسين سوجا) باستخدام تقنية Illumina ومواءمة القراءات مع القائمة جلايسين ماكس الجمعية العامة. يمكن العثور على الورقة التي تصف جهود إعادة التسلسل هذه هنا.
حمامة البازلاء

بازلاء حمامة (كاجانوس كاجان) في المناطق ذات الأمطار المنخفضة كمصدر مهم للبروتين للمزارعين ومصدر مهم للنيتروجين الثابت في التربة لأي محصول يزرع في العام التالي. يعتبرون محصولًا يتيمًا (نوع ذو أهمية كبيرة لإطعام الناس في جميع أنحاء العالم - المصدر الرئيسي للبروتين لمليار شخص وفقًا لورقة الجينوم - ولكن يزرعه صغار المزارعين في البلدان النامية بشكل أساسي ، مما يعني الأنواع لم يستفد من زيادة الغلة التي يمكن أن تنتجها ممارسات التربية الحديثة).

نُشر جينوم البازلاء الحمامة في Nature Biotechnology في نوفمبر 2011. تم تسلسل الجينوم بشكل أساسي باستخدام قراءات Illumina القصيرة ، على الرغم من أن التجميع كان مدعومًا بعدد من تسلسلات إرسال BAC التي تم إنتاجها باستخدام قراءات طويلة لتسلسل سانجر التقليدي. يحتوي التجميع على 606 ميغا قاعدة من التسلسل ، أي أقل بقليل من ثلاثة أرباع الحجم الإجمالي المقدر للجينوم البالغ 833 ميغا قاعدة ، ويتضمن ما يقدر بـ 48680 جينًا. بينما يتكون جينوم البازلاء من 11 كروموسومًا ، يتكون التجمع الحالي من

ورقة الجينوم: Varshney RK et al (2011) مسودة تسلسل جينوم لطيور الحمام (Cajanus cajan) ، وهو محصول بقولي يتيم للمزارعين فقراء الموارد. التكنولوجيا الحيوية الطبيعة DOI: 10.1038 / nbt.2022

فول عادي

الإصدار الحالي من جينوم الفاصوليا الشائع هو 1.0 وتم تجميعه من

تغطية 20 ضعفًا للجينوم باستخدام 454 قراءة (وعدد أقل من قراءات النهاية المزدوجة). تضمن هذا التجميع 521 ميغا قاعدة من التسلسل المجمع وكما تم تجميعها على مستوى السقالة. من خلال إضافة متواليات نهاية BAC و fosmid بالإضافة إلى خريطة جينية تحتوي على 7015 علامة (هذا كثير!) ، كان الإصدار 1.0 قادرًا على زيادة التجميع من السقالة إلى مستوى الجزيء الزائف. اقرأ المزيد وقم بتنزيل الجينوم في phytozome (يلزم إنشاء حساب / تسجيل الدخول).

تم نشر جينوم الفول الشائع وهو متوفر الآن مجانًا:

مونج بين

الاسم العلمي فيجنا رادياتا

"Mungbean (Vigna radiata) هو محصول بقولي سريع النمو وموسم دافئ يُزرع بشكل أساسي في البلدان النامية في آسيا. هنا نقوم ببناء مسودة تسلسل جينوم من mungbean لتسهيل البحث الجينومي في subgenus Ceratotropis ، والذي يتضمن العديد من العناصر الغذائية الهامة البقوليات في آسيا ، ولإتاحة فهم أفضل لتطور الأنواع البقولية. واستنادًا إلى تجميع de novo لأنواع أخرى من نبات المونج البري ، يبدو أن الاختلاف بين ما تم تدجينه في نهاية المطاف وأنواع فاصوليا المونج البرية التي تم أخذ عينات منها قد سبق تدجينها. علاوة على ذلك ، توفر مجموعة de novo لنوع Vigna رباعي الصبغيات (V. reflexo-pilosa var. glabra) دليلًا جينيًا على حدث متعدد الصبغيات حديثًا. تم إنشاء شجرة الأنواع باستخدام تجميعات de novo RNA-seq المكونة من 22 مُدخلًا من 18 نوعًا من أنواع Vigna ومجموعات البروتين من Glycine max. سيسهل التجميع الحالي لـ V. radiata var. radiata أبحاث الجينوم ويسرع التكاثر الجزيئي للجنس الفرعي Cerat otropis. "

الترمس

"الترمس (Lupinus angustifolius L.) هو أحدث المحاصيل المستأنسة في الزراعة الرئيسية. بذوره غنية بالبروتين والألياف الغذائية ، ولكنها منخفضة في الزيت والنشا. وقد أظهرت الدراسات الطبية والغذائية أن تناول الأطعمة الغنية بالترمس له أهمية كبيرة الفوائد الصحية. أبلغنا عن مسودة التجميع من مجموعة بيانات تسلسل بندقية الجينوم الكاملة لهذه الأنواع البقولية مع تغطية 26.9x للجينوم ، والتي من المتوقع أن تحتوي على 57807 جينًا. قدم تحليل الجينات المشروحة ذات المسارات الأيضية فهمًا جزئيًا لبعض العناصر الرئيسية ميزات الترمس ، مثل ملف تعريف الأحماض الأمينية لبروتينات التخزين في البذور. علاوة على ذلك ، طبقنا تقنية تسلسل RAD المستندة إلى NGS للحصول على 8244 علامة محددة التسلسل لترسيخ التسلسل الجيني. ما مجموعه 4214 سقالة من تسلسل الجينوم تم محاذاة التجميع في الخريطة الجينية. أتاح الجمع بين مجموعة المسودة والخريطة الجينية المحددة بالتسلسل تحديد موقع ودراسة الجينات الوظيفية ذات الأهمية الزراعية. سهّل تحديد علامات SNP المنفصلة المشتركة ، وتسلسل السقالة والتعليق الجيني تحديد جين R المرشح المرتبط بمقاومة مرض الترمس الرئيسي anthracnose. لقد أثبتنا أن الجمع بين تسلسل الجينوم متوسط ​​العمق وخريطة الارتباط الجيني عالية الكثافة من خلال تطبيق تقنية NGS هو نهج فعال من حيث التكلفة لتوليد بيانات تسلسل الجينوم وعدد كبير من العلامات الجزيئية لدراسة الجينوم وعلم الوراثة والوظيفة. جينات الترمس ، وتطبيقها على التربية الجزيئية للنباتات. لا تتطلب هذه الاستراتيجية معرفة مسبقة بالجينوم ، مما يعزز تطبيقها على مجموعة واسعة من الأنواع غير النموذجية ".

الفول السوداني

غير منشور ولكنه متاح للتنزيل.

"الفول السوداني المزروع ، Arachis hypogaea ، هو تباين الصبغيات (2n = 4x = 40) يحتوي على جينومين كاملين ، مُسمى الجينومان A و B. من المحتمل أن يكون ipaensis قد ساهم في جينوم B. قد يكون من المفيد تذكر هاتين الترابطتين باستخدام ذاكري: "A" يأتي قبل "B" و "duranensis" يأتي قبل "ipaensis". " حاليًا ، تم تسلسل السليلين ثنائيي الصيغة الصبغية ويمكن تنزيل تجميعات الجينوم من الرابط أدناه (أيضًا مصدر النص المقتبس أعلاه).

يوروسيدس 2

قطن

أول أنواع القطن (التي يحتمل أن تكون عدة) التي تم تسلسل جينومها هو جوسيبيوم ريموندي. يساهم G. raimonddi في جينوم "D" في أنواع القطن المتآصل الصبغية (جينومات A + D) G. hirsutum التي توفر غالبية إنتاج القطن في جميع أنحاء العالم. تم تسلسل جينوم G. raimonddi بواسطة JGI وهو متاح من phytozome ولكن لم يتم نشره بعد.

يمثل تجميع الجينوم الحالي

750 ميغا قاعدة من التسلسل و 98٪ منها مدمجة في 13 جزيء زائف و 22 سقالة كبيرة غير مرتبة (& gt 50 kb).

تم نشر مجموعة جينوم قطنية ثانية من قبل مجموعة من العلماء الصينيين الذين يعملون مع BGI في أغسطس 2012. وحتى كتابة هذه السطور ، لا يبدو أن مجموعة جينوم BGI متاحة للتنزيل في أي مكان. تحتوي الورقة على هذا الرابط الذي يؤدي إلى صفحة ويب "قريبًا". نأمل أن يكون لديك المزيد من الحظ عند زيارة هذه الصفحة في المستقبل.

إحصائيات إصدار BGI: 775 ميجابايت من إجمالي التسلسل المجمع ، 570 ميجابايت مدمجة في 13 جزيء زائف. 40976 جينًا مشروحًا ، كان معظمها مدعومًا ببيانات RNA-seq.

Wang K et al (2012) "مشروع جينوم قطن ثنائي الصبغة Gossypium raimondii" علم الوراثة الطبيعي دوى: 10.1038 / نغ 2371

شوكولاتة

جينوم الشجرة التي تعطينا الشوكولاتة ثيوبروما، الكاكاو تم التسلسل بشكل مستقل من قبل مجموعتين. أحد مجموعات الجينوم ، من الصنف المسمى Criollo من بليز ، كان في Nature Genetics. تتوفر مجموعة ثانية من سلالة تسمى Matina 1-6 من قاعدة بيانات جينوم Cacao منذ ما قبل نشر تسلسل جينوم Criollo ، ولكن لم يتم نشرها بعد. كلا التجميعين مكتملان إلى مستوى الجزيئات الزائفة.

لم تشهد الشوكولاتة أي ازدواجية كاملة في الجينوم منذ السداسية الصبغية القديمة المشتركة بين جميع الورود المتسلسلة.

ورق الجينوم (إصدار كريولو):

Xavier Argout et al. ، "جينوم Theobroma cacao ،" Nature Genetics 43 (2): 101-108. دوى: 10.1038 / نغ 736

أكويلاريا

"يُستخرج خشب العود من أشجار Aquilaria ، التي خضعت تجارةها لرقابة صارمة مع إدراجها في الملحق الثاني لاتفاقية التجارة الدولية في الأنواع المهددة بالانقراض من الحيوانات والنباتات البرية. ومن المعروف أن العديد من المستقلبات الثانوية من خشب العود لها قيمة طبية البشر ، بما في ذلك المركبات التي ثبت أنها تثير تأثيرات مهدئة وتظهر خصائص مضادة للسرطان. ومع ذلك ، لا يُعرف الكثير عن الجينوم والنسخة ومسارات التخليق الحيوي المسؤولة عن إنتاج مثل هذه المستقلبات الثانوية في خشب العود. في هذه الدراسة ، نقدم مشروع الجينوم والمسار المفترض لـ cucurbitacin E و I ، وهي مركبات ذات قيمة طبية معروفة ، من خشب العود Aquilaria agallocha في المختبر.تستخدم بيانات DNA و RNA لتوضيح العديد من الجينات ووظائف البروتين في مشروع الجينوم.تغيير التعبير عن cucurbitacin E و لقد ثبت أنني متسق مع الاستجابات المعروفة لـ A. agallocha للإجهاد الحيوي ومجموعة من الجينات المتماثلة في Arabidopsis thalia يتم تقديم Na المتعلقة بالتخليق الحيوي للقرعيات والتحقق من صحتها من خلال qRT-PCR. هذه الدراسة هي المحاولة الأولى لتحديد القرعيات E و I من خشب العود في المختبر وأول مشروع جينوم لأي نوع من أنواع Aquilaria. ستساعد نتائج هذه الدراسة في التحقيقات المستقبلية لمسارات الأيض الثانوية في Aquilaria وغيرها من النباتات الطبية غير النموذجية. "

النيم (أزاديراشتا إنديكا) هو أحد أقارب الماهوجني الموجود في الهند والدول المجاورة. للشجرة مجموعة واسعة من الاستخدامات تتراوح من الزهور الصالحة للأكل ، وتوفر الزيت المستخدم في أنواع الصابون المختلفة ، وتعمل كطارد للحشرات. يبلغ حجم جينوم نيم حوالي 370 ميغا قاعدة. يمكن تنزيل بيانات تسلسل نيم هنا.

ورق الجينوم: Krishnan NM et al (2012) "مسودة للجينوم وأربعة نسخ من كاسيات البذور الطبية ومبيدات الآفات Azadirachta indica" BMC Genomics DOI: 10.1186 / 1471-2164-13-464

ثمار الحمضيات (جنس الحمضيات)

تنتمي ثمار الحمضيات من الليمون إلى البرتقال والجريب فروت والبوميلو إلى جنس منفرد. العديد من الفواكه التي نعتقد أنها أنواع منفصلة يمكن أن تتكاثر مع بعضها البعض ، مما يجعل من الصعب تحديد حواجز الأنواع بشكل صحيح.

حلو / برتقال عادي

البرتقال الحلو (سينينسيس الحمضيات) باستخدام مزيج من Sanger (الموضة القديمة ، باهظة الثمن ، ولكن طويلة وسهلة التجميع) و 454 (أرخص بكثير ، وأسرع ، وأقصر إلى حد ما) تكنولوجيا التسلسل. الإصدار الحالي هو الإصدار 0.1 فقط ولا يزال الجينوم مقسمًا إلى 12574 سقالة تغطي 319 ميجا قاعدة مجتمعة من جينوم البرتقال الحلو. على عكس جينوم الكليمنتين الموصوف أدناه ، استخدم مشروع الجينوم البرتقالي الحلو الحمض النووي من فرد ثنائي الصبغة ، مما يجعل تجميع الجينوم أكثر صعوبة إلى حد ما لأن التناقضات بين التسلسلات المتوافقة قد تكون ببساطة نتيجة للاختلاف بين نسختين من الجينوم لهذا الفرد ثنائي الصيغة الصبغية. يتضمن هذا الإصدار من إصدار الجينوم 25376 جينًا مشروطًا لترميز البروتين. يمكنك قراءة المزيد أو تنزيل البيانات هنا (إنشاء حساب / تسجيل الدخول مطلوب).

كليمنتين اليوسفي

(الجينوم غير منشور ولم يتم تجميعه بالكامل)

جينوم أحادي الصبغة البرتقالية كليمنتين (كليمنتينا الحمضيات) من قبل الاتحاد الدولي لجينوم الحمضيات لتغطية 6.5 أضعاف. لم يتم تجميع الجينوم بعد في جزيئات زائفة ولكنه يتكون من 1128 سقالة تحتوي على إجمالي 296 ميغا قاعدة بيانات التسلسل. تم توقع الجينات باستخدام كل من تسلسل ESTs والتماثل مع جينات الأنواع النباتية الأخرى المتسلسلة ، مما أدى إلى إجمالي 25385 جينًا لترميز البروتين. قم بتنزيل بيانات تسلسل clementine والتعليقات التوضيحية من phytozome هنا (يلزم إنشاء حساب / تسجيل الدخول).

بابايا

يقدر حجم جينوم البابايا بـ 372 ميجا قاعدة ، تنتشر عبر تسعة كروموسومات ، وتحتوي على 28629 جينًا. يتم تنظيم إصدار البابايا داخل CoGe في كونتيجات فائقة ، ولكنها تحتوي على عدد من الفجوات.

مينغ آر وآخرون. (2008) مشروع جينوم شجرة البابايا الاستوائية المعدلة وراثيا (Carica papaya Linnaeus) الطبيعة 452 (7190) ، 991-996 DOI: 10.1038 / nature06856

أنواع نباتات الأرابيدوبسيس وحلفائها

توقع أن تنمو هذه الفئة بشكل كبير خلال العام المقبل. تشتمل فئة الجينومات المخطط لها ، قيد التنفيذ ، والخاصة أدناه على 7 أنواع أخرى من نباتات الأرابيدوبسيس وأقاربها.

نبات الأرابيدوبسيس thaliana

جينوم نبات الأرابيدوبسيس هو

120 ميغا قاعدة من التسلسل تنتشر عبر خمسة كروموسومات.

ورقة الجينوم: مبادرة الجينوم أرابيدوبسيس (2000). تحليل تسلسل الجينوم للنبات المزهر Arabidopsis thaliana. الطبيعة ، 408 (6814) ، 796-815 DOI: 10.1038 / 35048692

  • يخطط مشروع 1001 جينوم [2] لتسلسل جينومات 1001 نوع مختلف من نبات الأرابيدوبسيس. حاليا 88 متاحا مع المزيد في التقدم. نُشر تحليل لأول 80 جينومًا في Nature Genetics في سبتمبر 2011 (انظر الورقة هنا).
أرابيدوبسيس ليراتا

أرابيدوبسيس ليراتا هو قريب من نبات الأرابيدوبسيس thaliana. انقسم أسلاف هذين النوعين منذ ما يقدر بعشرة ملايين سنة ، مما جعلهما أقرب إلى حد ما من الذرة والذرة الرفيعة بين الأعشاب. يعتبر A. lyrata غير متوافق مع نفسه ، بينما يتكاثر A. thaliana بشكل أساسي من خلال الإخصاب الذاتي. جينوم lyrata هو أيضًا أكبر بكثير من جينوم thaliana ، حيث يبلغ وزنه 207 ميغا بايت ، وينتشر عبر سبعة كروموسومات (مقارنة بالكروموسومات في thaliana الخمسة و 125 ميغا جينوم).

يتوفر جينوم lyrata داخل CoGe ، أو يمكنك تنزيله من JGI.

ورقة الجينوم: تينا تي هو وآخرون. (2011) "تسلسل الجينوم Arabidopsis lyrata وأساس التغير السريع في حجم الجينوم." علم الوراثة الطبيعي 43: 476-481 DOI: 10.1038 / ng.807

أرابيدوبسيس هالري

غير منشورة ولكنها متاحة تحت Ft. لودرديل.

"Arabidopsis halleri هو نبات معمر ، متعامد ، ملقح بالحشرات ، يوجد عادة على ارتفاع 600 - 2300 متر فوق مستوى سطح البحر في المروج العشبية ، وهوامش الغابات والشقوق الصخرية في جميع أنحاء أوروبا وشرق آسيا. لدى A. halleri قدرة غير عادية على استعمار التربة بمعدن ثقيل عالي المحتوى ، مما جعله نموذجًا لدراسة تحمل المعادن الثقيلة وتراكمها في النباتات بالإضافة إلى فهم تطور النبات وانتواعه استجابة للتغير البيئي ".

من phytozome [1] (حيث يمكنك أيضًا تنزيل مجموعة الجينوم الحالية بعد إنشاء حساب JGI).

ليفنوورثيا ألاباميكا

"(ط) Leavenworthia alabamica (النسب 1 في قبيلة Camelineae) ، وهو نوع من النباتات النموذجية فقدت مؤخرًا عدم التوافق الذاتي في بعض المجموعات السكانية"

سيسيمبريوم إيريو

"'2` Sisymbrium irio (النسب 2 في قبيلة Sisymbrieae) ، وهو تقرير سنوي متوافق ذاتيًا يرتبط ارتباطًا وثيقًا بجنس الكرنب ، ولكنه يفتقر إلى تضاعف الجينوم الكامل المشتق"

اثيونيما أرابيوم

"(3) Aethionema arabicum (قبيلة Aethionemeae) ، وهي مجموعة شقيقة متفرعة ومتكاملة ذاتيًا لبقية الكرنب الصغير"

كاميلينا

"Camelina sativa عبارة عن بذور زيتية ذات سمات زراعية وجودة زيتية مرغوبة لمحصول منصة زيت صناعي قابل للحياة. هنا نقوم بتوليد أول تسلسل جينوم مرجعي عالي الجودة على نطاق كروموسوم لـ C. sativa و 89418 جينة ترميز بروتينية مشروحة حدث تضاعف الجينوم الكامل للنموذج الصليبي أرابيدوبسيس ثاليانا. يمثل C. sativa أول أنواع المحاصيل التي يتم تسلسلها من النسب الأول من الكرنب. هيكل جينوم سداسي الصبغيات المحفوظ جيدًا لـ C. sativa يعكس بشكل مفاجئ تلك الموجودة في البرمائيات ذات الأهمية الاقتصادية أنواع المحاصيل من النسب الثاني وكذلك القمح والقطن.لا تظهر الجينومات الثلاثة لـ C. sativa أي دليل على تحيز التجزئة والتحيز المحدود على مستوى التعبير ، وكلاهما خاصيتان مرتبطتان بشكل شائع بتطور متعدد الصيغ الصبغية. عواقب وخيمة على التربية والتلاعب الجيني لهذا المحصول الزيتي الصناعي ".

براسيكا رابا

جينوم براسيكا رابا نُشر في مجلة Nature Genetics في سبتمبر 2011 من قبل مجموعة من الباحثين بقيادة معهد بكين للجينوم (BGI). في حين أن مجموعة براسيكا رابا المتسلسلة (Chiifu-401-42) هي سلالة من الكرنب الصيني ، فإن اللفت هو في الواقع أصناف أخرى من نفس النوع. براسيكا رابا هي أيضًا واحدة من النوعين الأبوين لـ napus براسيكا أحد الأنواع المتفرعة الصبغية التي تعطينا كلا من اللفت النباتي ومحصول بذور الزيت الكانولا (المعروف أيضًا باسم بذور اللفت ، ولكن بجدية ، من يريد شراء زجاجة تسمى "زيت الاغتصاب"؟). براسيكا رابا هو أول ركن من أركان مثلث U يتم تسلسله. منذ هذا المنشور ، تم نشر تسلسلات جينوم إضافية لـ Brassica oleracea و Brassica napus (وزاوية إضافية من ثلاثي U وأنواع متآصلة الصبغيات تكونت من تهجين بين B. oleracea و B. rapa على التوالي.

بالإضافة إلى سداسي الصيغة الصبغية القديمة المشتركة بين الورد والكويكبات ورباعي الصبغيات الإضافيين الموجودين في سلالة أرابيدوبسيس / براسيكا المشتركة ، شهدت سلالة براسيكا سداسية صبغية قديمة إضافية لتكرار إجمالي 36 ضعفًا (3 * 2 * 2 * 3) نسبي إلى سلف مشترك قبل التثليث للنجوم والورد.

ورقة الجينوم: اتحاد مشروع تسلسل الجينوم براسيكا رابا. (2011) "جينوم الأنواع المحصولية متوسطة الصيغة الصبغية براسيكا رابا." علم الوراثة الطبيعي DOI: 10.1038 / نانوغرام 919

Napus براسيكا

تم تشكيل بذور اللفت الزيتية (Brassica napus L.)

منذ 7500 عام عن طريق التهجين بين B. rapa و B. oleracea ، متبوعًا بمضاعفة الكروموسوم ، وهي عملية تعرف باسم allopolyploidy. إلى جانب عمليات تعدد الصبغيات الأقدم ، منح هذا مضاعفة إجماليّة للجينوم 72 × منذ نشأة كاسيات البذور والمحتوى الجيني العالي. قمنا بفحص جينوم B. napus ونتائج تكراره الأخير. تشارك الجينومات الفرعية An و Cn المكونة في حديث متقاطع بنيوي ووظيفي وجيني ، مع تبادلات متجانسة وفيرة. بدأ فقدان الجينات الأولي وتباعد التعبير. أدى الانتقاء في أنواع البذور الزيتية من B. napus إلى تسريع فقدان جينات الجلوكوزينولات ، مع الحفاظ على توسع جينات التخليق الحيوي للزيت. توفر هذه العمليات نظرة ثاقبة حول تطور متعدد الصبغيات وعلاقته بتدجين المحاصيل وتحسينها. "- ملخص العلوم

براسيكا أوليراسيا

"لقد قدم تعدد الصيغ الصبغية تنوعًا جينيًا كبيرًا للتطور التكيفي للنبات ، ولكن الآليات التي من خلالها يؤسس التطور الجزيئي للجينوم متعدد الصيغ الصبغية البنية الجينية الكامنة وراء تمايز الأنواع غير واضحة. يعتبر براسيكا نموذجًا مثاليًا لزيادة المعرفة بتطور متعدد الصيغ الصبغية. هنا نصف مسودة الجينوم تسلسل Brassica oleracea ، مقارنته مع الأنواع الشقيقة B. rapa للكشف عن العديد من عمليات إعادة ترتيب الكروموسومات وفقدان الجينات غير المتماثل في الكتل الجينية المكررة ، والتضخيم غير المتماثل للعناصر القابلة للنقل ، والاحتفاظ المشترك للجينات التفاضلية لمسارات محددة والتنوع في التعبير الجيني ، بما في ذلك التضفير البديل ، من بين عدد كبير من الجينات المتعامدة والمتعامدة.تقدم هذه الدراسة رؤى ثاقبة في تطور جينوم براسيكا وستدعم البحث في العديد من المحاصيل المهمة في هذا الجنس. "

رافانوس رافانيستروم

الفجل البري. "تتكرر أحداث تعدد الصبغيات بين النباتات المزهرة ، وتساهم الجينات المكررة الناتجة عن مثل هذه الأحداث بشكل كبير في تطور النبات. لقد قمنا بتسلسل جينوم الفجل البري (Raphanus raphanistrum) ، وهو نوع من الفصيلة البرسية التي تعرضت لحدث تضاعف كامل للجينوم قبل الاختلاف عن Brassica rapa: على الرغم من المكاسب الجينية الكبيرة في هذين النوعين مقارنة مع Arabidopsis thaliana و Arabidopsis lyrata ، فإن 70٪ من المجموعات التقويمية تعرضت لخسائر جينية في R. raphanistrum و B. rapa ، مع حدوث معظم الخسائر قبل تباعدهم. تظهر النسخ المكررة المحتجزة تباعدًا كبيرًا في التسلسل والتعبير.بناءً على المقارنة بين مستويات التعبير الزهرية التقويمية لـ A. thaliana و R. ، التكرارات المحتجزة تختلف اختلافًا كبيرًا عن الجينات التي عادت إلى المفرد حالة eton في الوظيفة ، وتكوين التسلسل ، وأنماط التعبير ، والاتصال بالشبكة ، ومعدلات التطور. باستخدام هذه الخصائص ، أنشأنا نموذجًا للتعلم الإحصائي للتنبؤ بما إذا كان سيتم الاحتفاظ بنسخة مكررة بعد الصبغية. بشكل عام ، توفر دراستنا رؤى جديدة في عمليات فقدان التكرارات النباتية والاحتفاظ بها والتباعد الوظيفي وتسلط الضوء على الحاجة إلى مزيد من الفهم للعوامل التي تتحكم في مصير الجينات المكررة ".

"عواقب تضاعف الجينوم الكامل كما كشفتها التحليلات الجينومية المقارنة للفجل البري رافانوس رافانيستروم وثلاثة أنواع أخرى من الكرنب." http://www.ncbi.nlm.nih.gov/pubmed/24876251

الكبسلة الحميراء

الكابسيلا هو "أقرب جنس مميز" إلى نبات الأرابيدوبسيس وفي الحقيقة تبدو النباتات مشابهة إلى حد ما لعين شخص لا يدرس نبات الأرابيدوبسيس لكسب لقمة العيش. أشهر أنواع الكابسيلا (والنوع الوحيد الذي يحتوي على صفحة ويكيبيديا الخاصة به كما أكتب هذا) هو كابسيلا بورصا باستوريس، وهو الاسم الشائع "محفظة شيبرد". ومع ذلك ، فإن C. bursa-pastoris هو رباعي الصيغة الصبغية مع كل التحديات التي تواجه تجميع الجينوم والتحليل الجيني الذي يستلزمه. بدلاً من التشابك مع الوراثة الرباعية الصبغية لجراب الباستوريس ، استهدفت JGI بدلاً من ذلك متسلسلاتها في الأنواع الشقيقة ذات الصلة الوثيقة الكبسلة الحميراء الذي يحتوي على جينوم ثنائي الصيغة الصبغية أفضل تصرفًا.

تم إنشاء التجميع الحالي لـ Capsella rubella من تسلسل 22x مع 454 قراءة ، ويتضمن 134 ميجا قاعدة من التسلسل المجمع ، وتم تجميعه على مستوى السقالات. تم شرح الجينات باستخدام محاذاة بيانات RNA-seq من Capsella والتماثل مع جينات eudicots المتسلسلة الأخرى.

التجميع الحالي لجينوم الكبسلة الحميراء متاح من النبات النباتي (يلزم إنشاء حساب / تسجيل الدخول).

نُشر في Nature Genetics عام 2013:

Thellungiella parvula

لم يسمع معظم الناس عن هذا القريب من نبات الأرابيدوبسيس قبل نشر الجينوم الخاص به في أغسطس 2011. يعتبر Thellungiella ، الذي يطلق عليه الاسم الشائع "حب الرشاد" موضع اهتمام نظرًا لأنه يزيد بشكل كبير من تحمل الضغوط اللاأحيائية (الملح والبرد ، إلخ) بالنسبة إلى أرابيدوبسيس ثاليانا النسبي الذي تمت دراسته بشكل أفضل. أبلغت ورقة الجينوم عن وجود جينوم بحجم 140 ميغا تقريبًا ، تم تجميعه في سبع جزيئات زائفة وأكدت على دور التكرارات الترادفية في دفع تحمل الإجهاد الملحوظ لهذا النوع.

موارد Thellungiella:

ورقة الجينوم: Maheshi Dassanayake et al (2011) "جينوم صليب شديد الحساسية Thellungiella parvula." علم الوراثة الطبيعي DOI: 10.1038 / ng.889.70

Thellungiella / Eutrema Eutrema salsugineum

تم ترتيب نوع ثان من Thellungiella بشكل مستقل من قبل الأكاديمية الصينية للعلوم. تم تسلسل الجينوم بعمق تغطية 134 ضعفًا باستخدام تسلسل Illumina.

ورق الجينوم: Hua-Jun Wu et al (2012) "نظرة ثاقبة على تحمل الملح من جينوم Thellungiella salsuginea." PNAS DOI: 10.1073 / pnas.1209954109

تم نشر نسخة ثانية من الجينوم من نفس النوع (تسلسل باستخدام تقنية Sanger) بواسطة مجموعة من JGI وجامعة أريزونا. حددت هذه الورقة الأنواع إلى جنس مختلف "يوتريما"

ورق الجينوم: Yang R et al (2013) "الجينوم المرجعي للنبات الملحي Eutrema salsugineum" الحدود في علوم النبات DOI: 10.3389 / fpls.2013.00046

زهرة العنكبوت

Tarenaya hassleriana (سابقًا كليوم هاسليريانا) هي مجموعة خارجية للأنواع الأخرى الموجودة ضمن فئة "الأرابيدوبسيس والحلفاء". تم تحديد تسلسل الجينوم من قبل مجموعة تضم إريك شرانز في جامعة فاغينينغين.

أحد أقارب hassleriana ، كليوم فيولاسيا يتم التسلسل بواسطة JGI. في حين أن هذه الأنواع تنتمي إلى نفس الفرع الذي تباعد عن مجموعة الأرابيدوبسيس الأخرى والحلفاء ، إلا أنها تطورت بشكل منفصل تقريبًا طالما كان الاختلاف بين أرابيدوبسيس والبراسيكا ، مما يشير إلى أن الجينوميات المقارنة بين النوعين يجب أن تكون مثيرة للاهتمام.

"الكرنب ، بما في ذلك نبات أرابيدوبسيس ثاليانا والبراسيكا ، لا مثيل له بين النباتات في ثروته من البيانات الجزيئية الجينومية والوظيفية ، وقد خدم لفترة طويلة كنموذج لفهم الجين والجينوم وتطور السمات. ومع ذلك ، فإن معلومات الجينوم من مجموعة خارجية للتطور ضروري لاستنتاج اتجاه التغيير التطوري. لذلك قمنا بتسلسل جينوم زهرة العنكبوت (Tarenaya hassleriana) من عائلة شقيقة Brassicaceae ، Cleomaceae. من خلال التحليل المقارن للسلالتين ، نظهر أن تطور الجينوم بعد تعدد الصبغيات القديم وتؤثر أحداث الازدواج الجيني على السمات المهمة للتكاثر.لقد وجدنا تضاعف جينوم قديم في Tarenaya (Th-α) مستقل عن الازدواجية الخاصة بالكراسي (At-α) والبراسيكا المتداخلة (Br-α). لعرض الإمكانات لتحليل جينوم السلالة الشقيقة ، قمنا بالتحقيق في حالة جينات النمو الزهرية وأظهرنا احتفاظ براسيكا مرتين العديد من الجينات الزهرية MADS (من أجل MINICHROMOSOME MAINTENANCE1 و AGAMOUS و DEFICIENS و SERUM RESPONSE FACTOR) مثل Tarenaya التي من المحتمل أن تساهم في التنوع المورفولوجي في Brassica. أجرينا أيضًا تحليلًا تركيبيًا لعائلات الجينات التي تمنح عدم التوافق الذاتي في الكرنب ووجدنا أن جين مستقبل SERINE RECEPTOR KINASE مشتق من تكرار ترادفي خاص بالنسب. سيسهل جينوم T. hassleriana البحث المستقبلي من أجل توضيح التاريخ التطوري لجينومات الكرنب. "


شكر وتقدير

نعترف بمؤسسة العلوم الوطنية على تمويلها لورشة العمل ، والمشاركين في ورشة العمل على عملهم الجاد ومساهمتهم. H. H. يشكر M. Timmermans (Cold Spring Harbour Laboratory) و M. Scanlon (جامعة كورنيل) على فرصة زمالة أعضاء هيئة التدريس و R. Reams (FAMU) لتوفير الوصول إلى المعدات الإضافية والمساعدة في إعداد ورشة العمل. تم دعم زمالة G.Hacisalihoglu ، ورشة العمل في جامعة فلوريدا A & # x00026M ، وتطوير موقع الإنترنت الجينات الديناميكية من خلال منح من مبادرة جينوم النبات الوطنية التابعة لمؤسسة العلوم الوطنية. تم تطوير منهج Greenomes وموقع الإنترنت بدعم من مقرر NSF ، والمناهج ، وبرنامج تطوير المختبرات.


شاهد الفيديو: علم النبات: تاريخ مشرق - الجزء الاول: ضبابية الاسماء (قد 2022).