Благодарим ви, че посетихте Nature.com.Използвате версия на браузър с ограничена поддръжка на CSS.За най-добро изживяване ви препоръчваме да използвате актуализиран браузър (или да деактивирате режима на съвместимост в Internet Explorer).Освен това, за да осигурим постоянна поддръжка, показваме сайта без стилове и JavaScript.
Плъзгачи, показващи три статии на слайд.Използвайте бутоните за връщане назад и напред, за да се движите през слайдовете, или бутоните за управление на плъзгачите в края, за да се движите през всеки слайд.
Подробно описание на продукта
304 Неръждаема стомана, заварена навита тръба / тръби
1. Спецификация: Серпентина от неръждаема стомана / тръби
2. Тип: заварени или безшевни
3. Стандарт: ASTM A269, ASTM A249
4. Намотка от неръждаема стомана OD: 6 мм до 25,4 мм
5. Дължина: 600-3500 мм или според изискванията на клиента.
6. Дебелина на стената: 0,2 мм до 2,0 мм.
7. Толеранс: OD: +/-0.01 mm;Дебелина: +/-0,01%.
8. Размер на вътрешния отвор на намотката: 500MM-1500MM (може да се регулира според изискванията на клиента)
9. Височина на бобината: 200MM-400MM (може да се регулира според изискванията на клиента)
10. Повърхност: Ярка или загрята
11. Материал: 304, 304L, 316L, 321, 301, 201, 202, 409, 430, 410, сплав 625, 825, 2205, 2507 и др.
12. Опаковка: тъкани торби в дървена кутия, дървен палет, дървен вал или според изискванията на клиента
13. Тест: химически компонент, граница на провлачване, якост на опън, измерване на твърдост
14. Гаранция: Проверка от трета страна (например: SGS TV) и др.
15. Приложение: Декорация, мебели, транспортиране на петрол, топлообменник, изработка на парапети, производство на хартия, автомобили, преработка на храни, медицински и др.
Целият химичен състав и физически свойства за неръждаема стомана, както е показано по-долу:
Материал | ASTM A269 Химичен състав % Макс | ||||||||||
C | Mn | P | S | Si | Cr | Ni | Mo | NB | Nb | Ti | |
TP304 | 0,08 | 2.00 | 0,045 | 0,030 | 1,00 | 18.0-20.0 | 8,0-11,0 | ^ | ^ | ^ . | ^ |
TP304L | 0,035 | 2.00 | 0,045 | 0,030 | 1,00 | 18.0-20.0 | 8,0-12,0 | ^ | ^ | ^ | ^ |
TP316 | 0,08 | 2.00 | 0,045 | 0,030 | 1,00 | 16.0-18.0 | 10,0-14,0 | 2.00-3.00 часа | ^ | ^ | ^ |
TP316L | 0,035 D | 2.00 | 0,045 | 0,030 | 1,00 | 16.0-18.0 | 10,0-15,0 | 2.00-3.00 часа | ^ | ^ | ^ |
TP321 | 0,08 | 2.00 | 0,045 | 0,030 | 1,00 | 17.0-19.0 | 9,0-12,0 | ^ | ^ | ^ | 5C -0,70 |
TP347 | 0,08 | 2.00 | 0,045 | 0,030 | 1,00 | 17.0-19.0 | 9,0-12,0 | 10C -1.10 | ^ |
Материал | Топлинна обработка | Температура F (C) Мин. | твърдост | |
Бринел | Рокуел | |||
TP304 | Решение | 1900 (1040) | 192HBW/200HV | 90HRB |
TP304L | Решение | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316 | Решение | 1900 (1040) | 192HBW/200HV | 90HRB |
TP316L | Решение | 1900 (1040) | 192HBW/200HV | 90HRB |
TP321 | Решение | 1900 (1040) F | 192HBW/200HV | 90HRB |
TP347 | Решение | 1900 (1040) | 192HBW/200HV | 90HRB |
OD, инч | OD толеранс инч (mm) | WT толеранс % | Дължина Tolernace инч (mm) | |
+ | - | |||
≤ 1/2 | ± 0,005 (0,13) | ± 15 | 1/8 (3,2) | 0 |
> 1/2 ~1 1/2 | ± 0,005 (0,13) | ± 10 | 1 / 8 (3,2) | 0 |
> 1 1/2 ~< 3 1/2 | ± 0,010 (0,25) | ± 10 | 3 / 16 (4,8) | 0 |
> 3 1/2 ~< 5 1/2 | ± 0,015 (0,38) | ± 10 | 3 / 16 (4,8) | 0 |
> 5 1/2 ~< 8 | ± 0,030 (0,76) | ± 10 | 3 / 16 (4,8) | 0 |
8 ~ < 12 | ± 0,040 (1,01) | ± 10 | 3 / 16 (4,8) | 0 |
12 ~ < 14 | ± 0,050 (1,26) | ± 10 | 3 / 16 (4,8) | 0 |
Естествените микробни общности са филогенетично и метаболитно разнообразни.В допълнение към недостатъчно проучените групи организми1, това разнообразие също така притежава богат потенциал за откриване на екологично и биотехнологично значими ензими и биохимични съединения2,3.Въпреки това, изучаването на това разнообразие за определяне на геномните пътища, които синтезират такива съединения и ги свързват със съответните им гостоприемници, остава предизвикателство.Биосинтетичният потенциал на микроорганизмите в открития океан остава до голяма степен неизвестен поради ограничения в анализа на данните за резолюция на целия геном в глобален мащаб.Тук изследваме многообразието и многообразието на биосинтетичните генни клъстери в океана, като интегрираме около 10 000 микробни генома от култивирани клетки и единични клетки с повече от 25 000 ново реконструирани чернови генома от над 1000 проби от морска вода.Тези усилия са идентифицирали около 40 000 предполагаеми предимно нови биосинтетични генни групи, някои от които са открити в неподозирани преди това филогенетични групи.В тези популации ние идентифицирахме родословие, обогатено с биосинтетични генни клъстери („Candidatus Eudormicrobiaceae“), които принадлежаха към некултивиран бактериален тип и включваха някои от най-биосинтетично разнообразните микроорганизми в тази среда.От тях ние характеризирахме пътищата на фосфатаза-пептид и питонамид, идентифицирайки случаи на необичайна структура на биоактивно съединение и съответно ензимология.В заключение, това проучване демонстрира как стратегиите, базирани на микробиоми, могат да позволят изследването на неописани досега ензими и естествени храни в слабо разбрана микробиота и среда.
Микробите задвижват глобалните биогеохимични цикли, поддържат хранителни мрежи и поддържат растенията и животните здрави5.Тяхното огромно филогенетично, метаболитно и функционално разнообразие представлява богат потенциал за откриването на нови таксони1, ензими и биохимични съединения, включително природни продукти6.В екологичните общности тези молекули осигуряват на микроорганизмите разнообразие от физиологични и екологични функции, от комуникация до конкуренция 2, 7 .В допълнение към техните първоначални функции, тези природни продукти и техните генетично кодирани производствени пътища предоставят примери за биотехнологични и терапевтични приложения2,3.Идентифицирането на такива пътища и връзки е значително улеснено от изследването на култивирани микроби.Въпреки това, таксономичните изследвания на естествената среда показват, че по-голямата част от микроорганизмите не са били култивирани8.Това културно пристрастие ограничава способността ни да използваме функционалното разнообразие, кодирано от много микроби4,9.
За да се преодолеят тези ограничения, технологичният напредък през последното десетилетие позволи на изследователите директно (т.е. без предварителна култура) да секвенират микробни ДНК фрагменти от цели общности (метагеномика) или отделни клетки.Способността за сглобяване на тези фрагменти в по-големи геномни фрагменти и реконструиране на множество метагеномно сглобени геноми (MAG) или единични амплифицирани геноми (SAG), съответно, отваря важна възможност за таксоцентрични изследвания на микробиома (т.е. микробни общности и микробиома).проправят нови пътища.собствен генетичен материал в дадена среда) 10,11,12.Наистина, скорошни проучвания значително разшириха филогенетичното представяне на микробното разнообразие на Земята1, 13 и разкриха голяма част от функционалното разнообразие в отделните микробни общности, които преди това не са обхванати от култивирани референтни геномни последователности на микроорганизми (REF)14.Способността да се постави неоткрито функционално разнообразие в контекста на генома на гостоприемника (т.е. разделителна способност на генома) е от решаващо значение за предсказване на все още нехарактеризирани микробни линии, които вероятно кодират нови природни продукти 15, 16 или за проследяване на такива съединения обратно до техния оригинален производител 17.Например, комбиниран подход за метагеномен и едноклетъчен геномен анализ доведе до идентифицирането на Candidatus Entotheonella, група от метаболитно богати бактерии, свързани с гъба, като производители на различни лекарствени потенциали18.Въпреки това, въпреки последните опити за геномно изследване на различни микробни общности,16,19 повече от две трети от глобалните метагеномни данни за най-големия океан от екосистеми на Земята16,20 все още липсват.По този начин, като цяло, биосинтетичният потенциал на морския микробиом и неговият потенциал като хранилище на нови ензимни и природни продукти остават до голяма степен недостатъчно проучени.
За да изследваме биосинтетичния потенциал на морските микробиоми в глобален мащаб, първо обединихме морски микробни геноми, получени с помощта на културно-зависими и некултурни методи, за да създадем обширна база данни за филогенетика и генна функция.Изследването на тази база данни разкри голямо разнообразие от биосинтетични генни клъстери (BGCs), повечето от които принадлежат към все още нехарактеризирани семейства на генни клъстери (GCF).В допълнение, ние идентифицирахме неизвестно бактериално семейство, което показва най-голямото известно разнообразие от BGCs в открития океан до момента.Избрахме два пътя на рибозомен синтез и пост-транслационно модифициран пептид (RiPP) за експериментално валидиране въз основа на техните генетични разлики от известните в момента пътища.Функционалното характеризиране на тези пътища разкри неочаквани примери за ензимология, както и структурно необичайни съединения с протеазна инхибиторна активност.
Първоначално имахме за цел да създадем глобален ресурс от данни за анализ на генома, като се фокусираме върху неговите бактериални и археални компоненти.За тази цел обединихме метагеномни данни и 1038 проби от морска вода от 215 глобално разпределени места за вземане на проби (диапазон на географска ширина = 141,6 °) и няколко дълбоки слоя (от 1 до 5600 m дълбочина, покриващи пелагичните, мезопелагичните и абисалните зони).Фон 21, 22, 23 (Фиг. 1а, разширени данни, Фиг. 1а и Допълнителна таблица 1).В допълнение към осигуряването на широко географско покритие, тези селективно филтрирани проби ни позволиха да сравним различни компоненти на морския микробиом, включително богати на вируси (<0,2 µm), богати на прокариоти (0,2–3 µm), богати на частици (0,8 µm ).–20 µm) и изчерпани от вируси (>0,2 µm) колонии.
a, Общо 1038 публично достъпни генома (метагеномика) на морски микробни общности, събрани от 215 глобално разпределени местоположения (62°S до 79°N и 179°W до 179°E.).Картни плочки © Esri.Източници: GEBCO, NOAA, CHS, OSU, UNH, CSUMB, National Geographic, DeLorme, NAVTEQ и Esri.b, тези метагеноми бяха използвани за реконструиране на MAGs (методи и допълнителна информация), които се различават по количество и качество (методи) в наборите от данни (маркирани с цвят).Реконструираните MAG бяха допълнени с публично достъпни (външни) геноми, включително ръчно изработени MAG26, SAG27 и REF.27 Компилирайте OMD.c, в сравнение с предишни доклади, базирани само на SAG (GORG)20 или MAG (GEM)16, OMD подобрява геномната характеристика на морските микробни общности (степен на картографиране на метагеномно четене; метод) два до три пъти с по-последователно представяне в дълбочина и географска ширина..<0,2, n=151, 0,2-0,8, n=67, 0,2-3, n=180, 0,8-20, n=30, >0,2, n=610, <30°, n = 132, 30–60° , n = 73, >60°, n = 42, EPI, n = 174, MES, n = 45, BAT, n = 28. d, групирането на OMD в ниво на видови клъстери (95% средна нуклеотидна идентичност) идентифицира общо приблизително 8300 вида, повече от половината от които преди това не са били характеризирани според таксономични анотации с помощта на GTDB (версия 89) e, класифицирането на видовете по геномен тип показа, че MAG, SAG и REF се допълват добре, като отразяват филогенетичното разнообразие на морския микробиом.По-специално, 55%, 26% и 11% от видовете са специфични съответно за MAG, SAG и REF.BATS, Бермудски Атлантически времеви редове;GEM, геноми на микробиома на Земята;GORG, референтен геном на глобалния океан;ГОРЕЩО, времева серия от Хавайския океан.
Използвайки този набор от данни, реконструирахме общо 26 293 MAGs, предимно бактериални и археални (фиг. 1b и разширени данни, фиг. 1b).Ние създадохме тези MAG от сглобки от отделни, а не обединени метагеномни проби, за да предотвратим колапса на естествената вариация на последователността между проби от различни места или времеви точки (методи).В допълнение, ние групирахме геномни фрагменти въз основа на техните корелации на разпространение в голям брой проби (от 58 до 610 проби, в зависимост от проучването; метод).Установихме, че това е отнемаща време, но важна стъпка24, която беше пропусната в няколко мащабни работи по реконструкция на MAG16, 19, 25 и значително подобрява количеството (средно 2,7 пъти) и качеството (средно +20%) на геном.реконструиран от морския метагеном, проучен тук (разширени данни, Фиг. 2а и допълнителна информация).Като цяло, тези усилия доведоха до 4,5-кратно увеличение на морските микробни MAGs (6-кратно, ако се вземат предвид само висококачествени MAGs) в сравнение с най-изчерпателния ресурс за MAG, наличен днес16 (Методи).Този новосъздаден MAG комплект след това беше комбиниран с 830 ръчно подбрани MAG26, 5969 SAG27 и 1707 REF.Двадесет и седем вида морски бактерии и археи съставляват комбинаторна колекция от 34 799 генома (фиг. 1b).
След това оценихме новосъздадения ресурс, за да подобрим способността му да представлява морски микробни общности и да оценим въздействието на интегрирането на различни типове геноми.Средно открихме, че обхваща приблизително 40-60% от морските метагеномни данни (Фигура 1в), два до три пъти повече от покритието на предишни доклади само за MAG както в дълбочина, така и в географска ширина Още сериен 16 или SAG20.В допълнение, за систематично измерване на таксономичното разнообразие в установени колекции, ние анотирахме всички геноми, използвайки инструментариума (методи) на Genome Taxonomy Database (GTDB) и използвахме средна нуклеотидна идентичност за целия геном от 95%.28 за идентифициране на 8304 видови групи (видове).Две трети от тези видове (включително нови клади) не са се появявали преди това в GTDB, от които 2790 са открити с помощта на MAG, реконструиран в това изследване (фиг. 1d).В допълнение, ние открихме, че различните типове геноми са силно допълващи се: 55%, 26% и 11% от видовете са съставени изцяло от MAG, SAG и REF, съответно (фиг. 1e).В допълнение, MAG покрива всички 49 вида, открити във водния стълб, докато SAG и REF представляват само 18 и 11 от тях, съответно.Въпреки това, SAG представя по-добре разнообразието от най-често срещаните клади (разширени данни, Фиг. 3a), като Pelagic Bacteriales (SAR11), като SAG обхваща почти 1300 вида и MAG само 390 вида.По-специално, REFs рядко се припокриват с MAGs или SAGs на видово ниво и представляват >95% от приблизително 1000 генома, които не се срещат в откритите океански метагеномни групи, изследвани тук, главно поради взаимодействия с други видове изолирани представителни морски екземпляри (напр. седименти) .или хост-асоцииран).За да бъде широко достъпен за научната общност, този морски геномен ресурс, който също включва некласифицирани фрагменти (напр. от прогнозирани фаги, геномни острови и геномни фрагменти, за които няма достатъчно данни за MAG реконструкция), може да се сравни с таксономични данни .Достъп до анотациите заедно с функцията на гена и контекстуалните параметри в базата данни за океанска микробиология (OMD; https://microbiomics.io/ocean/).
След това се заехме да изследваме богатството и новостта на биосинтетичния потенциал в микробиомите на открития океан.За тази цел първо използвахме antiSMASH за всички MAG, SAG и REF, открити в 1038 морски метагеноми (методи), за да предвидим общо 39 055 BGC.След това ги групирахме в 6907 неизлишни GCF и 151 генни клъстерни популации (GCC; Допълнителна таблица 2 и методи), за да отчетем присъщото излишък (т.е. същият BGC може да бъде кодиран в множество геноми) и метагеномни данни Фрагментация на концентрирани BGC.Непълните BGC не увеличават значително, ако има такива (допълнителна информация), съответно броя на GCF и GCC, съдържащи поне един непокътнат член на BGC в 44% и 86% от случаите.
На ниво GCC открихме голямо разнообразие от прогнозирани RiPPs и други природни продукти (фиг. 2а).Сред тях, например, арилполиени, каротеноиди, ектоини и сидерофори принадлежат към GCCs с широко филогенетично разпространение и голямо изобилие в океанските метагеноми, което може да показва широка адаптация на микроорганизмите към морската среда, включително резистентност към реактивни кислородни видове, оксидативен и осмотичен стрес..или усвояване на желязо (повече информация).Това функционално разнообразие контрастира с неотдавнашен анализ на приблизително 1,2 милиона BGC сред приблизително 190 000 генома, съхранени в базата данни NCBI RefSeq (BiG-FAM/RefSeq, наричана по-нататък RefSeq)29, който показа, че нерибозомните синтетазни пептиди (NRPS) и поликетид синтаза (PKS) BGCs (допълнителна информация).Открихме също така 44 (29%) GCC само далечно свързани с всеки RefSeq BGC (\(\bar{d}\)RefSeq > 0.4; Фиг. 2a и методи) и 53 (35%) GCC само в MAG, подчертавайки потенциала за откриване на неописани досега химикали в OMD.Като се има предвид, че всяка от тези GCC вероятно представлява много разнообразни биосинтетични функции, ние допълнително анализирахме данни на ниво GCF в опит да предоставим по-подробно групиране на BGCs, за които се предвижда да кодират подобни природни продукти29.Общо 3861 (56%) идентифицирани GCF не се припокриват с RefSeq и> 97% от GCF не присъстват в MIBiG, една от най-големите бази данни с експериментално валидирани BGC (Фигура 2b).Въпреки че не е изненадващо да се открият много потенциални нови пътища в настройки, които не са добре представени от референтния геном, нашият метод за дерепликация на BGC в GCF преди сравнителен анализ се различава от предишни доклади 16 и ни позволява да предоставим безпристрастна оценка на новостта.По-голямата част от новото разнообразие (3012 GCF или 78%) съответства на прогнозирани терпени, RiPP или други природни продукти и повечето (1815 GCF или 47%) е кодирано в неизвестни типове поради техния биосинтетичен потенциал.За разлика от PKS и NRPS клъстерите, тези компактни BGCs е по-малко вероятно да бъдат фрагментирани по време на метагеномно сглобяване 31 и позволяват по-интензивно време и ресурси функционално характеризиране на техните продукти.
Общо 39 055 BGC бяха групирани в 6 907 GCF и 151 GCC.a, представяне на данни (вътрешно външно).Йерархично групиране на BGC разстояния въз основа на GCC, 53 от които са фиксирани само от MAG.GCC съдържа BGCs от различни таксони (ln-трансформирана гейт честота) и различни BGC класове (размерът на кръга съответства на неговата честота).За всеки GCC външният слой представлява броя на BGCs, разпространението (процент на пробите) и разстоянието (минимално BGC косинусово разстояние (min(dMIBiG))) от BiG-FAM до BGC.GCC с BGC, тясно свързани с експериментално проверени BGC (MIBiG), са подчертани със стрелки.b Сравнявайки GCF с прогнозирани (BiG-FAM) и експериментално валидирани (MIBiG) BGCs, бяха открити 3861 нови (d–>0,2) GCF.Повечето (78%) от тях кодират RiPP, терпени и други предполагаеми природни продукти.c, всички геноми в OMD, намерени в 1038 морски метагенома, бяха поставени в базовото дърво на GTDB, за да се покаже филогенетичното покритие на OMD.Кладовете без никакви геноми в OMD са показани в сиво.Броят на BGC съответства на най-големия брой прогнозирани BGC на геном в даден клас.За по-голяма яснота, последните 15% от възлите са свити.Стрелките показват клади, богати на BGC (>15 BGC), с изключение на Mycobacterium, Gordonia (на второ място след Rhodococcus) и Crocosphaera (на второ място след Synechococcus).d, Неизвестен c.Eremiobacterota показа най-високо биосинтетично разнообразие (индекс на Шанън, базиран на вида на естествения продукт).Всяка лента представлява генома с най-много BGC във вида.T1PKS, PKS тип I, T2/3PKS, PKS тип II и тип III.
В допълнение към богатството и новостта, ние изследваме биогеографската структура на биосинтетичния потенциал на морския микробиом.Групирането на проби по средно метагеномно разпределение на броя на копията на GCF (методи) показа, че съобщества с ниска географска ширина, повърхностни, богати на прокариоти и бедни на вируси, предимно от повърхностни или по-дълбоки слънчеви води, са богати на RiPP и BGC терпени.Обратно, полярни, дълбоководни, богати на вируси и частици общности бяха свързани с по-високо изобилие от NRPS и PKS BGC (разширени данни, Фиг. 4 и допълнителна информация).И накрая, открихме, че добре проучените тропически и пелагични общности са най-обещаващите източници на нови терпени (фигура с разширени данни).Най-висок потенциал за PKS, RiPP и други природни продукти (Фигура 5а с разширени данни).
За да допълним нашето изследване на биосинтетичния потенциал на морските микробиоми, ние имахме за цел да картографираме тяхното филогенетично разпределение и да идентифицираме нови обогатени с BGC клади.За тази цел поставихме геномите на морските микроби в нормализирано GTDB13 бактериално и археално филогенетично дърво и покрихме предполагаемите биосинтетични пътища, които те кодират (фиг. 2в).Ние лесно открихме няколко обогатени с BGC клади (представени от над 15 BGCs) в проби от морска вода (методи), известни със своя биосинтетичен потенциал, като цианобактерии (Synechococcus) и Proteus бактерии, като Tistrella32,33, или наскоро привлякоха вниманието със своите натурални продукти.като Myxococcota (Sandaracinaceae), Rhodococcus и Planctomycetota34,35,36.Интересното е, че открихме няколко неизследвани досега линии в тези клади.Например, тези видове с най-богат биосинтетичен потенциал във филата Planctomycetota и Myxococcota принадлежат съответно към нехарактеризирани кандидат-разреди и родове (допълнителна таблица 3).Взети заедно, това предполага, че OMD осигурява достъп до неизвестна преди това филогенетична информация, включително микроорганизми, които могат да представляват нови цели за откриване на ензими и природни продукти.
След това характеризирахме обогатения с BGC клад, като не само преброихме максималния брой BGC, кодирани от неговите членове, но и чрез оценка на разнообразието на тези BGC, което обяснява честотата на различните видове естествени кандидат продукти (фиг. 2c и методи )..Открихме, че най-разнообразните в биосинтетично отношение видове са представени от специално конструирани бактериални MAG в това проучване.Тези бактерии принадлежат към некултивирания вид Candidatus Eremiobacterota, който остава до голяма степен неизследван с изключение на няколко геномни изследвания 37, 38.Прави впечатление, че „ок.Родът Eremiobacterota е анализиран само в земна среда39 и не е известно да включва членове, обогатени с BGC.Тук реконструирахме осем MAG от един и същи вид (нуклеотидна идентичност > 99%) 23. Затова предлагаме името на вида „Candidatus Eudoremicrobium malaspinii“, кръстен на нереида (морска нимфа), красив подарък в гръцката митология и експедиции.„Ка.Съгласно филогенетична анотация 13, E. malaspinii няма известни преди това роднини под нивото на последователността и следователно принадлежи към ново бактериално семейство, което ние предлагаме „Ca.E. malaspinii” като типов вид и “Ca.Eudormicrobiaceae” като официално име (допълнителна информация).Кратка метагеномна реконструкция на 'Ca.Проектът за генома на E. malaspinii беше валидиран чрез много ниски входни данни, дълго четене на метагеномно секвениране и целево сглобяване на единична проба (Методи) като единична линейна хромозома от 9,63 Mb с дублиране от 75 kb.като единствената останала неяснота.
За да установим филогенетичния контекст на този вид, ние търсихме 40 тясно свързани вида в допълнителни обогатени с еукариоти метагеномни проби от експедицията на океана Тара чрез целенасочена реконструкция на генома.Накратко, свързахме метагеномни четения с геномни фрагменти, свързани с “Ca.E. malaspinii” и предположи, че повишеният процент на набиране в тази проба показва наличието на други роднини (методи).В резултат открихме 10 MAGs, комбинация от 19 MAGs, представляващи пет вида в три рода в рамките на ново дефинирано семейство (т.е. „Ca. Eudormicrobiaceae“).След ръчна проверка и контрол на качеството (разширени данни, фиг. 6 и допълнителна информация) установихме, че „Ca.Видовете Eudormicrobiaceae представят по-големи геноми (8 Mb) и по-богат биосинтетичен потенциал (14 до 22 BGC на вид), отколкото други членове на „Ca“.Clade Eremiobacterota (до 7 BGC) (фиг. 3a–c).
a, Филогенетични позиции на петте 'Ca.Видовете Eudormicrobiaceae показват богатство на BGC, специфично за морските линии, идентифицирани в това проучване.Филогенетичното дърво включва всички 'Ca.MAG Eremiobacterota и членове на други видове (номера на генома в скоби), предоставени в GTDB (версия 89), бяха използвани за еволюционен фон (методи).Най-външните слоеве представляват класификации на ниво семейство („Ca. Eudormicrobiaceae“ и „Ca. Xenobiaceae“) и на ниво клас („Ca. Eremiobacteria“).Петте вида, описани в това проучване, са представени от буквено-цифрови кодове и предложени биномиални имена (допълнителна информация).б, добре.Видовете Eudormicrobiaceae споделят седем общи BGC ядра.Липсата на BGC в групата A2 се дължи на непълнотата на представителния MAG (допълнителна таблица 3).BGC са специфични за „Ca.Amphithomicrobium” и “Ca.Amphithomicrobium” (клади A и B) не са показани.c, Всички BGC, кодирани като „Ca.Установено е, че Eudoremicrobium taraoceanii се експресира в 623 метатранскриптома, взети от океаните на Тара.Плътните кръгове показват активна транскрипция.Оранжевите кръгове означават log2-трансформирани промени на гънките под и над скоростта на експресия на домакинския ген (методи).d, криви на относително изобилие (методи), показващи 'Ca.Видовете Eudormicrobiaceae са широко разпространени в повечето океански басейни и в целия воден стълб (от повърхността до дълбочина най-малко 4000 m).Въз основа на тези оценки открихме, че „Ca.E. malaspinii' представлява до 6% от прокариотните клетки в дълбоководните пелагични зърнени общности.Считахме, че даден вид присъства на място, ако е открит в каквато и да е част от размера на даден дълбок слой.IO – Индийски океан, NAO – Северен Атлантик, NPO – Северен Тихи океан, RS – Червено море, SAO – Южен Атлантик, SO – Южен океан, SPO – Южен Тихи океан.
Проучване на изобилието и разпространението на Ca.Eudormicrobiaceae, който, както установихме, преобладава в повечето океански басейни, както и в целия воден стълб (фиг. 3d).На местно ниво те съставляват 6% от морската микробна общност, което ги прави важна част от глобалния морски микробиом.Освен това открихме относителното съдържание на Ca.Видовете Eudormicrobiaceae и техните нива на експресия на BGC са най-високи в еукариотно обогатената фракция (фиг. 3c и разширени данни, фиг. 7), което показва възможно взаимодействие с прахови частици, включително планктон.Това наблюдение има известна прилика с 'Ca.Eudoremicrobium BGCs, които произвеждат цитотоксични естествени продукти по известни пътища, могат да проявят хищническо поведение (допълнителна информация и разширени данни, Фигура 8), подобно на други хищници, които произвеждат специфично метаболити като Myxococcus41.Откриването на Ca.Eudormicrobiaceae в по-малко достъпни (дълбок океан) или еукариотни, а не прокариотни проби може да обясни защо тези бактерии и тяхното неочаквано BGC разнообразие остават неясни в контекста на изследването на естествените храни.
В крайна сметка ние се опитахме да потвърдим експериментално обещанието на нашата работа, базирана на микробиоми, за откриване на нови пътища, ензими и естествени продукти.Сред различните класове BGCs, известно е, че RiPP пътят кодира богато химично и функционално разнообразие поради различни пост-транслационни модификации на основния пептид от зрели ензими42.Така че избрахме две 'Ca.RiPP BGC на Eudoremicrobium (Фигури 3b и 4a-e) се основават на същото като всеки известен BGC (\(\bar{d}\)MIBiG и \(\bar{d}\)RefSeq над 0,2).
a – c, In vitro хетероложна експресия и in vitro ензимни анализи на нов (\(\bar{d}\)RefSeq = 0.29) клъстер на биосинтеза на RiPP, специфичен за дълбоководни Ca видове.E. malaspinii' доведе до производството на дифосфорилирани продукти.c, модификации, идентифицирани с помощта на MS/MS с висока разделителна способност (HR) (фрагментация, обозначена с b и y йони в химическата структура) и NMR (разширени данни, Фиг. 9).d, този фосфорилиран пептид проявява ниско микромоларно инхибиране на неутрофилна еластаза на бозайници, която не се открива в контролния пептид и дехидратиращия пептид (дехидратация, предизвикана от химическо отстраняване).Експериментът се повтаря три пъти с подобни резултати.Например, хетероложна експресия на втори нов \(\bar{d}\)RefSeq = 0.33) клъстер на протеинова биосинтеза изяснява функцията на четири зрели ензима, които модифицират 46-те аминокиселинни основни пептиди.Остатъците се оцветяват според мястото на модификация, предвидено от HR-MS/MS, изотопно маркиране и NMR анализ (допълнителна информация).Пунктираното оцветяване показва, че модификацията се появява при някой от двата остатъка.Фигурата е компилация от множество хетероложни конструкции, за да покаже активността на всички зрели ензими върху едно и също ядро.h, Илюстрация на NMR данни за N-метилиране на основен амид.Пълните резултати са показани на фиг.10 с разширени данни.i, Филогенетичната позиция на зрелия FkbM протеинов клъстерен ензим сред всички FkbM домейни, намерени в базата данни MIBiG 2.0, разкрива ензим от това семейство с N-метилтрансферазна активност (допълнителна информация).Показани са схематични диаграми на BGC (a, e), прекурсорни пептидни структури (b, f) и предполагаеми химични структури на природни продукти (c, g).
Първият път на RiPP (\(\bar{d}\)MIBiG = 0.41, \(\bar{d}\)RefSeq = 0.29) е открит само в дълбоководни видове „Ca.E. malaspinii” и кодове за Пептид-прекурсор (Фиг. 4a, b).В този зрял ензим ние идентифицирахме единичен функционален домен, хомоложен на дехидратиращия домен на лантипептидна синтаза, който нормално катализира фосфорилирането и последващото отстраняване на 43 (допълнителна информация).Следователно, ние предвиждаме, че модификацията на прекурсорния пептид включва такава двуетапна дехидратация.Въпреки това, използвайки тандемна масспектрометрия (MS/MS) и спектроскопия с ядрено-магнитен резонанс (NMR), ние идентифицирахме полифосфорилиран линеен пептид (фиг. 4с).Макар и неочаквано, открихме няколко линии доказателства в подкрепа на това, че е крайният продукт: два различни хетероложни гостоприемника и липса на дехидратация в in vitro анализи, идентифициране на ключови остатъци, мутирани в мястото на каталитична дехидратация на зрелия ензим.всички реконструирани от “Ca”.Геномът на E. malaspinii (разширени данни, Фиг. 9 и допълнителна информация) и накрая, биологичната активност на фосфорилирания продукт, но не и химически синтезираната дехидратирана форма (Фиг. 4d).Всъщност ние открихме, че той проявява ниска микромоларна протеазна инхибиторна активност срещу неутрофилна еластаза, сравнима с други сродни природни продукти в концентрационния диапазон (IC50 = 14,3 μM) 44, въпреки факта, че екологичната роля остава да бъде изяснена.Въз основа на тези резултати предлагаме пътя да се нарече „фосфептин“.
Вторият случай е сложен RiPP път, специфичен за 'Ca.Предсказано е, че родът Eudoremicrobium (\(\bar{d}\)MIBiG = 0.46, \(\bar{d}\)RefSeq = 0.33) кодира естествени протеинови продукти (фиг. 4e).Тези пътища са от особен биотехнологичен интерес поради очакваната плътност и разнообразие от необичайни химични модификации, установени от ензимите, кодирани от относително късите BGCs45.Ние открихме, че този протеин се различава от характеризираните по-рано протеини по това, че му липсва както основният NX5N мотив на полицерамидите, така и лантиониновата бримка на ландорнамидите 46.За да преодолеем ограниченията на общите хетероложни модели на експресия, ние ги използвахме заедно с персонализирана система Microvirgula aerodenitrificans, за да характеризираме четири ензима на зрял път (методи).Използвайки комбинация от MS/MS, изотопно маркиране и NMR, ние открихме тези зрели ензими в 46-аминокиселинното ядро на пептида (фиг. 4f, g, разширени данни, фигури 10-12 и допълнителна информация).Сред зрелите ензими, ние характеризирахме първата поява на FkbM O-метилтрансферазен член на семейството 47 в пътя на RiPP и неочаквано открихме, че този зрял ензим въвежда гръбнак N-метилиране (Фиг. 4h, i и допълнителна информация).Въпреки че тази модификация е известна в естествените NRP48 продукти, ензимното N-метилиране на амидни връзки е сложна, но биотехнологично значима реакция49, която досега е представлявала интерес за RiPP семейството от борозини.Специфичност 50,51.Идентифицирането на тази активност в други семейства ензими и RiPP може да отвори нови приложения и да разшири функционалното разнообразие на протеини 52 и тяхното химично разнообразие.Въз основа на идентифицираните модификации и необичайната дължина на предложената продуктова структура, ние предлагаме име на пътя „питонамид“.
Откриването на неочаквана ензимология във функционално характеризирано семейство от ензими илюстрира обещанието на геномиката на околната среда за нови открития и също така илюстрира ограничения капацитет за функционално заключение, базирано само на хомологията на последователността.По този начин, заедно с доклади за неканонични биоактивни полифосфорилирани RiPP, нашите резултати демонстрират ресурсоемка, но критична стойност за усилията на синтетичната биология за пълно разкриване на функционалното богатство, разнообразие и необичайни структури на биохимичните съединения.
Тук демонстрираме обхвата на биосинтетичния потенциал, кодиран от микробите и техния геномен контекст в глобалния морски микробиом, улеснявайки бъдещите изследвания, като предоставяме получения ресурс на научната общност (https://microbiomics.io/ocean/).Ние открихме, че голяма част от неговата филогенетична и функционална новост може да бъде получена само чрез реконструиране на MAGs и SAGs, особено в недостатъчно използвани микробни общности, които биха могли да ръководят бъдещите усилия за биопроучване.Въпреки че тук ще се съсредоточим върху „Ca.Eudormicrobiaceae” като линия, особено биосинтетично „талантлива”, много от BGCs, предвидени в неоткритата микробиота, вероятно кодират неописани преди това ензимологии, които дават съединения с екологично и/или биотехнологично значими действия.
Бяха включени метагеномни набори от данни от големи океанографски и времеви серии проучвания с достатъчна дълбочина на секвениране, за да се увеличи максимално покритието на глобалните морски микробни общности в океански басейни, дълбоки слоеве и във времето.Тези набори от данни (допълнителна таблица 1 и фигура 1) включват метагеномика от проби, събрани в океаните на Тара (обогатени с вируси, n=190; обогатени с прокариоти, n=180) 12,22 и експедицията на BioGEOTRACES (n=480).Хавайски океански времеви редове (HOT, n = 68), Бермудско-атлантически времеви редове (BATS, n = 62)21 и експедицията Маласпина (n = 58)23.Четенията на последователността от всички метагеномни фрагменти бяха филтрирани за качество с помощта на BBMap (v.38.71) чрез премахване на адаптери за последователност от четения, премахване на четения, картографирани към последователности за контрол на качеството (PhiX геноми) и използване на trimq=14, maq=20 отхвърля лошото качество на четене, maxns = 0 и minlength = 45. Последващите анализи бяха проведени или обединени с QC показания, ако е посочено (bbmerge.sh minoverlap=16).Отчитанията на QC бяха нормализирани (bbnorm.sh target = 40, minddepth = 0) преди изграждане с помощта на metaSPAdes (v.3.11.1 или v.3.12, ако е необходимо)53.Получените контиги на скеле (наричани по-нататък скелета) накрая бяха филтрирани по дължина (≥1 kb).
1038 метагеномни проби бяха разделени на групи и за всяка група проби показанията за метагеномен контрол на качеството на всички проби бяха съпоставени със скобите на всяка проба поотделно, което доведе до следния брой групови показания в скоби по двойки: Tara Marine Viruses – Enriched (190×190), Prokariotes Enriched (180×180), BioGEOTRACES, HOT and BATS (610×610) и Malaspina (58×58).Картографирането беше направено с помощта на Burrows-Wheeler-Aligner (BWA) (v.0.7.17-r1188)54, което позволява показанията да бъдат съпоставени с вторични сайтове (с помощта на флага -a).Подравняванията бяха филтрирани така, че да са дълги поне 45 бази, да имат ≥97% идентичност и да обхващат ≥80% четения.Получените BAM файлове бяха обработени с помощта на скрипта jgi_summarize_bam_contig_depths за MetaBAT2 (v.2.12.1)55, за да се осигури вътрешно и междупробно покритие за всяка група.И накрая, скобите бяха групирани, за да се увеличи чувствителността чрез индивидуално пускане на MetaBAT2 на всички проби с –minContig 2000 и –maxEdges 500. Използваме MetaBAT2 вместо ансамбъл боксьор, тъй като в независими тестове беше показано, че е най-ефективният единичен боксьор.и 10 до 50 пъти по-бързи от другите често използвани боксьори57.За да се тества ефекта от корелациите на изобилието, произволно избрана подпроба от метагеномика (10 за всеки от двата набора от данни за океана Тара, 10 за BioGEOTRACES, 5 за всяка времева серия и 5 за Malaspina) допълнително използва само проби.Вътрешните проби се групират, за да се получи информация за покритието.(Допълнителна информация).
Допълнителни (външни) геноми бяха включени в последващия анализ, а именно 830 ръчно избрани MAG от подмножество от набора от данни Tara Oceans26, 5287 SAG от набора от данни GORG20 и данни от базата данни MAR (MarDB v. 4) от 1707 изолирани REF и 682 SAG) 27. За набора от данни MarDB геномите се избират въз основа на наличните метаданни, ако типът на извадката съответства на следния регулярен израз: '[S|s]single.?[C|c]ell|[C|c]ulture| [I|i] изолиран“.
Качеството на всеки метагеномен контейнер и външни геноми беше оценено с помощта на CheckM (v.1.0.13) и Lineage Workflow на Anvi'o (v.5.5.0)58,59.Ако CheckM или Anvi'o отчете ≥50% пълнота/пълнота и ≤10% замърсяване/излишък, тогава запазете метагеномни клетки и външни геноми за по-късен анализ.След това тези резултати бяха комбинирани в средна пълнота (mcpl) и средно замърсяване (mctn), за да се класифицира качеството на генома според общностните критерии60, както следва: високо качество: mcpl ≥ 90% и mctn ≤ 5%;добро качество: mcpl ≥ 70%, mctn ≤ 10%, средно качество: mcpl ≥ 50% и mctn ≤ 10%, добро качество: mcpl ≤ 90% или mctn ≥ 10%.След това филтрираните геноми бяха корелирани с качествени резултати (Q и Q'), както следва: Q = mcpl – 5 x mctn Q' = mcpl – 5 x mctn + mctn x (променливост на щама)/100 + 0,5 x log[N50] .(имплементиран в dRep61).
За да се позволи сравнителен анализ между различни източници на данни и типове геноми (MAG, SAG и REF), 34 799 генома бяха дереферирани въз основа на средна нуклеотидна идентичност (ANI) за целия геном, използвайки dRep (v.2.5.4).Повторения)61 с 95% прагове на ANI28,62 (-comp 0 -con 1000 -sa 0,95 -nc 0,2) и маркерни гени с едно копие, използващи SpecI63, осигуряващи клъстериране на генома на ниво вид.Представителен геном беше избран за всеки dRep клъстер според максималния качествен резултат (Q'), определен по-горе, който се счита за представителен за вида.
За да се оцени скоростта на картографиране, BWA (v.0.7.17-r1188, -a) беше използвано за картографиране на всички 1038 набора от метагеномни четения с 34 799 генома, съдържащи се в OMD.Качествено контролираните четения бяха картографирани в еднокраен режим и получените подравнявания бяха филтрирани, за да се запазят само подравнявания с дължина ≥45 bp.и идентичност ≥95%.Коефициентът на показване за всяка проба е процентът на показанията, оставащи след филтриране, разделен на общия брой показания за контрол на качеството.Използвайки същия подход, всеки от 1038 метагенома беше намален до 5 милиона вмъквания (разширени данни, Фиг. 1c) и съпоставен с GORG SAG в OMD и във всички GEM16.Количеството MAGs, възстановени от морска вода в каталога GEM16, се определя чрез ключови заявки на метагеномни източници, като се избират проби от морска вода (напр., за разлика от морските седименти).По-конкретно, избираме „aquatic“ като „ecosystem_category“, „marine“ като „ecosystem_type“ и филтрираме „habitat“ като „deep ocean“, „marine“, „maritime oceanic“, „pelagic marine“, „marine water“ , „Океан“, „Морска вода“, „Повърхностна морска вода“, „Повърхностна морска вода“.Това доведе до 5903 MAG (734 висококачествени), разпределени в 1823 OTU (прегледи тук).
Прокариотните геноми бяха таксономично анотирани с помощта на GTDB-Tk (v.1.0.2)64 с параметри по подразбиране, насочени към GTDB r89 версия 13. Anvi'o беше използван за идентифициране на еукариотни геноми въз основа на предсказване на домейна и извикване ≥50% и излишък ≤ 10%.Таксономичната анотация на даден вид се определя като един от неговите представителни геноми.С изключение на еукариотите (148 MAG), всеки геном първо беше функционално анотиран с помощта на prokka (v.1.14.5)65, назовавайки пълни гени, дефинирайки параметрите на „археи“ или „бактерии“, ако е необходимо, което също се съобщава за не- кодиращи гени.и CRISPR региони, наред с други геномни характеристики.Анотирайте предсказани гени чрез идентифициране на универсални маркерни гени с едно копие (uscMG) с помощта на fetchMG (v.1.2)66, присвояване на ортологични групи и заявка с помощта на emapper (v.2.0.1)67 въз основа на eggNOG (v.5.0)68.База данни KEGG (публикувана на 10 февруари 2020 г.) 69. Последната стъпка беше извършена чрез съпоставяне на протеини с базата данни KEGG с помощта на DIAMOND (v.0.9.30)70 с покритие на заявка и тема от ≥70%.Резултатите бяха допълнително филтрирани според NCBI Prokaryotic Genome Annotation Pipeline71 въз основа на побитова скорост ≥ 50% от максималната очаквана побитова скорост (самата връзка).Генните последователности също бяха използвани като вход за идентифициране на BGCs в генома, използвайки antiSMASH (v.5.1.0)72 с параметри по подразбиране и различни клъстерни експлозии.Всички геноми и анотации са компилирани в OMD заедно с контекстуални метаданни, достъпни в мрежата (https://microbiomics.io/ocean/).
Подобно на описаните по-рано методи12,22 ние използвахме CD-HIT (v.4.8.1) за групиране на >56,6 милиона протеин-кодиращи гени от бактериални и археални геноми от OMD в 95% идентичност и по-къси гени (90% покритие)73 до >17,7 милиона генни групи.Най-дългата последователност беше избрана като представителен ген за всеки генен клъстер.След това 1038 метагенома бяха съпоставени с >17,7 милиона BWA (-a) членове на клъстера и получените BAM файлове бяха филтрирани, за да запазят само подравнявания с ≥95% процентна идентичност и ≥45 базови подравнявания.Нормализираното по дължина генно изобилие беше изчислено чрез първо преброяване на вмъкванията от най-доброто уникално подравняване и след това, за размито картографирани вмъквания, добавяне на дробни преброявания към съответните целеви гени, пропорционални на техния брой уникални вмъквания.
Геномите от разширения OMD (с допълнителни MAG от „Ca. Eudormicrobiaceae“, вижте по-долу) бяха добавени към базата данни на инструмента за метагеномен анализ mOTUs74 (v.2.5.1), за да се създаде разширена референтна база данни на mOTU.Само шест генома с едно копие (23 528 генома) са оцелели от десет uscMG.Разширяването на базата данни доведе до 4494 допълнителни клъстера на ниво вид.1038 метагенома бяха анализирани с помощта на mOTU параметри по подразбиране (v.2).Общо 989 генома, съдържащи се в 644 mOTU клъстера (95% REF, 5% SAG и 99,9%, принадлежащи на MarDB), не бяха открити от mOTU профила.Това отразява различни допълнителни източници на морска изолация на геномите на MarDB (повечето от неоткритите геноми са свързани с организми, изолирани от седименти, морски гостоприемници и др.).За да продължим да се фокусираме върху околната среда на открития океан в това проучване, ние ги изключихме от анализа надолу по веригата, освен ако не бяха открити или включени в разширената база данни на mOTU, създадена в това проучване.
Всички BGCs от MAG, SAG и REF в OMD (вижте по-горе) бяха комбинирани с BGCs, идентифицирани във всички метагеномни скелета (antiSMASH v.5.0, параметри по подразбиране) и характеризирани с помощта на BiG-SLICE (v.1.1) (PFAM домейн)75.Въз основа на тези характеристики, ние изчислихме всички косинусни разстояния между BGC и ги групирахме (средни връзки) в GCF и GCC, като използвахме прагове за разстояние от 0,2 и 0,8 съответно.Тези прагове са адаптация на прагове, използвани преди това с помощта на евклидово разстояние75 заедно с косинусово разстояние, което облекчава част от грешката в оригиналната стратегия за клъстериране BiG-SLICE (допълнителна информация).
След това BGC бяха филтрирани, за да запазят само ≥5 kb, кодирани върху скелета, за да се намали рискът от фрагментация, както е описано по-рано 16, и да се изключат MarDB REF и SAG, които не са намерени в 1038 метагенома (вижте по-горе).Това доведе до общо 39 055 BGC, кодирани от OMD генома, с допълнителни 14 106, идентифицирани на метагеномни фрагменти (т.е. некомбинирани в MAG).Тези „метагеномни“ BGC бяха използвани за оценка на дела на потенциала за биосинтеза на морски микробиоми, който не е уловен в базата данни (допълнителна информация).Всеки BGC беше функционално характеризиран според предсказуемите продуктови типове, дефинирани от анти-SMASH или по-груби продуктови категории, дефинирани в BiG-SCAPE76.За да се предотврати отклонение при вземане на проби при количественото определяне (таксономичен и функционален състав на GCC/GCF, разстояние на GCF и GCC до референтни бази данни и метагеномно изобилие на GCF), като се запази само най-дългият BGC на GCF за всеки вид, 39 055 BGC бяха допълнително дедупликирани, което води до общо 17 689 BGC.
Новостта на GCC и GCF беше оценена въз основа на разстоянието между изчислената база данни (база данни RefSeq в BiG-FAM)29 и експериментално проверената (MIBIG 2.0)30 BGC.За всеки от 17 689 представителни BGC избрахме най-малкото косинусово разстояние до съответната база данни.След това тези минимални разстояния се осредняват (средно) според GCF или GCC, според случая.GCF се счита за нов, ако разстоянието до базата данни е по-голямо от 0,2, което съответства на идеално разделение между (средния) GCF и референтния.За GCC избираме 0,4, което е два пъти по-високо от прага, определен от GCF, за да заключим дългосрочна връзка с връзките.
Метагеномното изобилие на BGC се оценява като средното изобилие на неговите биосинтетични гени (както е определено от anti-SMASH), налични от профили на генно ниво.Метагеномното изобилие на всеки GCF или GCC след това се изчислява като сбор от представителни BGC (от 17 689).Тези карти на изобилието впоследствие бяха нормализирани за клетъчния състав, като се използва броят на mOTU за проба, което също отчиташе усилията за секвениране (разширени данни, Фиг. 1d).Разпространението на GCF или GCC се изчислява като процент на пробите с изобилие > 0.
Евклидовото разстояние между пробите се изчислява от нормализирания GCF профил.Тези разстояния бяха намалени по размер с помощта на UMAP77 и получените вграждания бяха използвани за неконтролирано базирано на плътност групиране с помощта на HDBSCAN78.Оптималният минимален брой точки за клъстер (и следователно броят на клъстерите), използван от HDBSCAN, се определя чрез максимизиране на кумулативната вероятност за членство в клъстер.Идентифицираните клъстери (и произволна балансирана подизвадка от тези клъстери за отчитане на отклонението в пермутационния многовариантен анализ на дисперсията (PERMANOVA)) бяха тествани за значимост спрямо нередуцирани евклидови разстояния с помощта на PERMANOVA.Средният размер на генома на пробите беше изчислен въз основа на относителното изобилие на mOTU и изчисления размер на генома на членовете на геномите.По-специално, средният размер на генома на всеки mOTU беше оценен като средната стойност на размерите на генома на неговите членове, коригирани за пълнота (след филтриране) (например, 75% пълен геном с дължина 3 Mb има коригиран размер 4 Mb).за средни геноми с цялост ≥70%.След това средният размер на генома за всяка проба се изчислява като сбор от размерите на генома на mOTU, претеглени чрез относителното изобилие.
Филтриран набор от геномно кодирани BGCs в OMD е показан в бактериални и археални GTDB дървета (в ≥5 kb рамки, с изключение на REF и SAG MarDB, които не са намерени в 1038 метагенома, вижте по-горе) и техните прогнозирани продуктови категории въз основа на филогенетични позиция на генома (виж по-горе).Първо намалихме данните по видове, използвайки генома с най-много BGC в този вид като представителен.За визуализация, представителите бяха допълнително разделени на дървесни групи и отново, за всяка клетъчна клада, геномът, съдържащ най-голям брой BGCs, беше избран като представител.BGC-обогатени видове (най-малко един геном с >15 BGC) бяха допълнително анализирани чрез изчисляване на индекса на разнообразие на Шанън за видовете продукти, кодирани в тези BGC.Ако всички предвидени продуктови типове са еднакви, химическите хибриди и други сложни BGC (както е предвидено от anti-SMAH) се считат за принадлежащи към един и същ продуктов тип, независимо от техния ред в клъстера (напр. протеин-бактериоцин и бактериоцин-протеопротеинов синтез тяло).хибрид).
Оставаща ДНК (изчислена на 6 ng) от проба Malaspina MP1648, съответстваща на биологична проба SAMN05421555 и съответстваща на Illumina SRR3962772 метагеномен набор за четене за кратко четене, обработена съгласно протокол за секвениране на PacBio с ултра-нисък вход за използване на PacBio комплект SMRTbell gDNA амплификация на проба комплект (100-980-000) и комплект за подготовка на шаблон SMRTbell Express 2.0 (100-938-900).Накратко, останалата ДНК беше нарязана, поправена и пречистена (зърна ProNex) с помощта на Covaris (g-TUBE, 52104).След това пречистената ДНК се подлага на подготовка на библиотека, амплификация, пречистване (перли ProNex) и избор на размер (>6 kb, Blue Pippin) преди крайна стъпка на пречистване (перли ProNex) и секвениране на платформата Sequel II.
Реконструкция на първите две ок.За MAG Eremiobacterota идентифицирахме шест допълнителни ANI >99% (те са включени във Фигура 3), които първоначално бяха филтрирани въз основа на резултати от замърсяване (по-късно идентифицирани като генни дупликации, вижте по-долу).Намерихме и поднос с надпис „Ca“.Eremiobacterota” от различни проучвания23 и ги използва заедно с осем MAGs от нашето проучване като еталон за метагеномни четения от 633 проби, обогатени с еукариоти (>0,8 µm), използвайки BWA (v.0.7.17) Ref -r1188, – флаг) за понижени проби картографиране (5 милиона прочитания).Въз основа на специфични за обогатяване карти (филтрирани чрез 95% идентичност на подравняване и 80% покритие на четене), 10 метагенома (очаквано покритие ≥5 ×) бяха избрани за сглобяване и допълнителни 49 метагенома (очаквано покритие ≥1 ×) за корелация на съдържанието.Използвайки същите параметри като по-горе, тези проби бяха групирани и бяха добавени 10 допълнителни „Ca“.MAG Eremiobacterota е възстановен.Тези 16 MAGs (без да се броят двете, които вече са в базата данни) довеждат общия брой на геномите в разширения OMD до 34 815.На MAG се присвояват таксономични рангове въз основа на тяхното геномно сходство и позиция в GTDB.18 MAGs бяха дерепликирани с помощта на dRep в 5 вида (интраспецифичен ANI >99%) и 3 рода (интрагенеричен ANI 85% до 94%) в рамките на едно и също семейство79.Представителите на видовете бяха ръчно избрани въз основа на целостта, замърсяването и N50.Предложената номенклатура е предоставена в допълнителната информация.
Оценете целостта и замърсяването на Ca.MAG Eremiobacterota, ние оценихме наличието на uscMG, както и набори генни маркери с едно копие, специфични за линията и домейна, използвани от CheckM и Anvi'o.Идентифицирането на 2 дубликата от 40 uscMGs беше потвърдено чрез филогенетична реконструкция (вижте по-долу), за да се изключи всякакво потенциално замърсяване (това съответства на 5% въз основа на тези 40 маркерни гена).Допълнително проучване на пет представителни MAG 'Ca.Ниското ниво на замърсители в тези реконструирани геноми беше потвърдено за видовете Eremiobacterota, използвайки интерактивния интерфейс Anvi'o, базиран на корелации на изобилието и състава на последователността (допълнителна информация)59.
За филогеномичен анализ избрахме пет представителни MAGs „Ca“.Eudormicrobiaceae“, всички видове „Ca.Геномът на Eremiobacterota и членове на други видове (включително UBP13, Armatimonadota, Patescibacteria, Dormibacterota, Chloroflexota, Cyanobacteria, Actinobacteria и Planctomycetota) е достъпен от GTDB (r89)13.Всички тези геноми бяха анотирани, както е описано по-рано за екстракция на единичен маркерен ген и BGC анотация.Геномите на GTDB бяха запазени съгласно горните критерии за цялост и замърсяване.Филогенетичният анализ беше извършен с помощта на работния процес Anvi'o Phylogenetics59.Дървото е конструирано с помощта на IQTREE (v.2.0.3) (опции по подразбиране и -bb 1000)80 върху подравняване на 39 тандемни рибозомни протеини, идентифицирани от Anvi'o (MUSCLE, v.3.8.1551)81.Позициите му бяха намалени.за покриване на най-малко 50% от генома82 и Planctomycecota беше използвана като външна група въз основа на топологията на дървото на GTDB.Едно дърво от 40 uscMG е изградено с помощта на същите инструменти и параметри.
Използвахме Traitar (v.1.1.2) с параметри по подразбиране (фенотип, от нуклеотиди)83, за да предвидим общи микробни характеристики.Изследвахме потенциален хищнически начин на живот въз основа на предварително разработен хищнически индекс84, който зависи от съдържанието на ген, кодиращ протеин в генома.По-конкретно, ние използваме DIAMOND, за да сравним протеини в генома с базата данни OrthoMCL (v.4)85, използвайки опциите –more-sensive –id 25 –query-cover 70 –subject-cover 70 –top 20 И преброяване на гените, съответстващи на маркерните гени за хищници и нехищници.Индексът е разликата между броя на хищническите и нехищническите белези.Като допълнителен контрол ние също анализирахме генома "Ca".Факторът Entotheonella TSY118 се основава на връзката му с Ca.Eudoremicrobium (голям размер на генома и биосинтетичен потенциал).След това тествахме потенциални връзки между хищнически и нехищнически маркерни гени и биосинтетичния потенциал на Ca.Eudormicrobiaceae” и установи, че не повече от един ген (от всеки тип маркерен ген, т.е. ген на хищник/нехищник) се припокрива с BGC, което предполага, че BGC не обърква сигналите за хищничество.Допълнителна геномна анотация на разбъркани репликони беше извършена с помощта на TXSSCAN (v.1.0.2) за специфично изследване на секреторната система, пили и камшичета86.
Пет представителни 'Ca' бяха картографирани чрез картографиране на 623 метатранскриптоми от прокариотните и еукариотните обогатени фракции на океаните Тара 22, 40, 87 (използвайки BWA, v.0.7.17-r1188, -a флаг).Геном на Eudormicrobiaceae.BAM файловете бяха обработени с FeatureCounts (v.2.0.1)88 след 80% покритие на четене и 95% филтриране на идентичност (с опции featureCounts –primary -O –fraction -t CDS,tRNA -F GTF -g ID -p) Брои брой вмъквания на ген.Генерираните карти бяха нормализирани за дължината на гена и изобилието на маркерен ген mOTU (среден брой на вмъквания, нормализиран по дължина за гени с брой на вмъквания >0) и логаритмично трансформирани до 22,74, за да се получи относителната експресия на клетка на всяко генно ниво, което също обяснява променливост от проба до проба по време на секвениране.Такива съотношения позволяват сравнителен анализ, смекчавайки проблемите със състава при използване на данни за относително изобилие.Само проби с >5 от 10 mOTU маркерни гени бяха взети под внимание за по-нататъшен анализ, за да се позволи откриването на достатъчно голяма част от генома.
Нормализираният транскриптомен профил на 'Ca.E. taraoceanii беше подложен на намаляване на размерността с помощта на UMAP и полученото представяне беше използвано за неконтролирано групиране с помощта на HDBSCAN (виж по-горе), за да се определи състоянието на експресията.PERMANOVA тества значимостта на разликите между идентифицираните клъстери в оригиналното (не намалено) пространство на разстояние.Диференциалната експресия между тези състояния беше тествана в генома (вижте по-горе) и бяха идентифицирани 201 KEGG пътя в 6 функционални групи, а именно: BGC, система за секреция и флагеларни гени от TXSSCAN, ензими за разграждане (протеаза и пептидази) и хищнически и не- хищнически гени.хищнически индексни маркери.За всяка проба изчислихме средната нормализирана експресия за всеки клас (имайте предвид, че самата експресия на BGC се изчислява като средната експресия на биосинтетични гени за този BGC) и тествахме за значимост в различните състояния (тест на Kruskal-Wallis, коригиран за FDR).
Синтетичните гени бяха закупени от GenScript и PCR праймерите бяха закупени от Microsynth.Phusion полимераза от Thermo Fisher Scientific беше използвана за амплификация на ДНК.NucleoSpin плазмиди, NucleoSpin гел и PCR комплект за пречистване от Macherey-Nagel бяха използвани за пречистване на ДНК.Рестрикционни ензими и Т4 ДНК лигаза са закупени от New England Biolabs.Химикали, различни от изопропил-β-d-1-тиогалактопиранозид (IPTG) (Biosynth) и 1,4-дитиотреитол (DTT, AppliChem), бяха закупени от Sigma-Aldrich и използвани без допълнително пречистване.Антибиотиците хлорамфеникол (Cm), спектиномицин дихидрохлорид (Sm), ампицилин (Amp), гентамицин (Gt) и карбеницилин (Cbn) бяха закупени от AppliChem.Компонентите на средата Bacto Tryptone и Bacto Yeast Extract са закупени от BD Biosciences.Трипсинът за секвениране беше закупен от Promega.
Генните последователности бяха извлечени от анти-SMASH предсказан BGC 75.1.E. malaspinii (допълнителна информация).
Гените embA (локус, MALA_SAMN05422137_METAG-framework_127-gene_5), embM (локус, MALA_SAMN05422137_METAG-framework_127-gene_4) и embAM (включително междугенни региони) бяха секвенирани като синтетични конструкции в pUC57(AmpR) със и без оптимизирани кодони ed за изразяване в E кога.Генът embA беше субклониран в първото място за множествено клониране (MCS1) на pACYCDuet-1(CmR) и pCDFDuet-1(SmR) с BamHI и HindIII места на разцепване.Гените embM и embMopt (оптимизирани за кодон) бяха субклонирани в MCS1 pCDFDuet-1(SmR) с BamHI и HindIII и поставени във второто място за множествено клониране на pCDFDuet-1(SmR) и pRSFDuet-1(KanR) (MCS2) с NdeI/ChoI.Касетата embAM беше субклонирана в pCDFDuet1(SmR) с BamHI и HindIII места на разцепване.Генът orf3/embI (локус, MALA_SAMN05422137_METAG-scaffold_127-gene_3) е конструиран чрез PCR с разширение на припокриване, използвайки праймери EmbI_OE_F_NdeI и EmbI_OE_R_XhoI, усвоени с NdeI/XhoI и лигирани в pCDFDuet-1-EmbM (MCS1), използвайки същия ре стрикционни ензими (допълнителни маса).6).Смилането и лигирането с рестрикционен ензим се извършва съгласно протокола на производителя (New England Biolabs).
Време на публикуване: 14 март 2023 г