ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 미생물 군집을 프로파일링하는 데 사용되는 공통 유전자
    건강과 과학/과학기술 2022. 7. 3. 09:45

    미생물 군집을 프로파일링하는 데 사용되는 공통 유전자
    날짜:
    2022년 6월 30일
    원천:
    라이스 대학교
    요약:
    컴퓨터 과학자들은 지역 사회의 박테리아 종을 식별하기 위해 긴 게놈 읽기를 사용하는 알고리즘인 Emu를 개발합니다. 이 프로그램은 장이나 농업 및 환경과 같은 미생물군집에서 유익한 박테리아로부터 유해한 분류를 단순화할 수 있습니다.

    미생물 종을 식별할 때 유전자의 일부가 없는 것보다 낫습니다. 그러나 라이스 대학의 컴퓨터 과학자들에게는 미생물군집의 모든 종을 식별하는 프로그램을 추구하는 데 일부가 충분하지 않았습니다.

    그들의 미생물 군집 프로파일링 소프트웨어인 Emu는 연구 중인 유전자의 전체 길이에 걸쳐 있는 긴 DNA 서열을 활용하여 박테리아 종을 효과적으로 식별합니다.

    컴퓨터 과학자 Todd Treangen과 대학원생인 Rice의 George R. Brown School of Engineering의 Kristen Curry가 이끄는 Emu 프로젝트는 미생물군집 연구자들이 유해하거나 도움이 될 수 있는 박테리아 종을 분류하는 데 사용하는 주요 유전자 분석을 용이하게 합니다. 인간과 환경.

    그들의 표적인 16S는 rRNA(ribosomal ribonucleic acid) 유전자의 서브유닛으로, 1977년 Carl Woese에 의해 처음 사용되었습니다. 이 영역은 박테리아와 고세균에서 고도로 보존되어 있으며 별개의 속을 분리하는 데 중요한 가변 영역을 포함합니다. 종.

    "그것은 모든 박테리아와 대부분의 고세균에 존재하기 때문에 일반적으로 미생물군집 분석에 사용됩니다."라고 Treangen 그룹에서 3년차인 Curry가 말했습니다. "그 때문에 표적화하기 쉽게 수년 동안 보존되어 온 영역이 있습니다. DNA 시퀀싱에서 우리는 그 일부가 모든 박테리아에서 동일해야 하므로 무엇을 찾아야 하는지 알 수 있습니다. 박테리아를 구별할 수 있도록 부분을 다르게 하세요."

    독일과 휴스턴 감리교 연구소, 베일러 의과대학 및 텍사스 아동 병원의 공동 연구자와 함께 수행한 Rice 팀의 연구는 Nature Methods 저널에 실렸습니다 .

    Curry는 "몇 년 전만 해도 우리는 나쁜 박테리아나 나쁘다고 생각한 박테리아에 집중하는 경향이 있었고 다른 박테리아에는 관심이 없었습니다."라고 말했습니다. "하지만 지난 20년 동안 우리가 생각하는 다른 박테리아의 일부가 의미가 있다고 생각하는 방향으로 이동했습니다.

    "그것은 우리가 환경에 있는 모든 미세한 유기체인 미생물군집(microbiome)이라고 부르는 것입니다"라고 그녀는 말했습니다. "일반적으로 연구되는 환경에는 물, 토양 및 장관이 포함되며 미생물은 작물, 탄소 격리 및 인간 건강에 영향을 미치는 것으로 나타났습니다."

    "기대 최대화"라는 작업에서 가져온 이름인 Emu는 Oxford Nanopore MiniION 휴대용 시퀀서로 처리된 박테리아의 전체 길이 16S 서열을 분석하고 정교한 오류 수정을 사용하여 9개의 별개의 "초가변 영역"을 기반으로 종을 식별합니다.

    Curry는 "이전 기술에서는 16S 유전자의 일부만 읽을 수 있었습니다. "그것은 대략 1,500개의 염기쌍을 가지고 있으며 짧은 판독 시퀀싱을 사용하면 이 유전자의 최대 25%-30%만 시퀀싱할 수 있습니다. 그러나 종 수준의 정밀도를 얻으려면 전장 유전자가 정말로 필요합니다."

    그러나 최신 기술도 완벽하지 않아 오류가 순서대로 흘러갈 수 있습니다.

    컴퓨터 과학 조교수인 Treangen은 "최근 몇 년 동안 오류율이 감소했지만 개별 DNA 서열 내에서 여전히 최대 10%의 오류가 있을 수 있는 반면 종은 소수의 16S 유전자 차이로 구분될 수 있습니다"라고 말했습니다. 전염병 추적을 전문으로 합니다. "실제 차이와 시퀀싱 오류를 구별하는 것은 이 연구 프로젝트의 주요 계산 문제를 나타냅니다.

    "한 가지 문제는 많은 오류가 무작위가 아니라는 것입니다. 즉, 특정 위치에서 반복적으로 발생할 수 있으며 순서 오류 대신 진정한 차이처럼 보이기 시작합니다."라고 그는 말했습니다.

    "또 다른 문제는 주어진 샘플에 수천 종의 박테리아가 있을 수 있다는 것입니다. 이는 시퀀싱 오류율보다 훨씬 낮은 풍부도로 존재할 수 있는 복잡한 미생물 혼합물을 생성합니다."라고 Treangen은 말했습니다. "이는 신호와 오류를 구별하기 위해 임시 컷오프에 단순히 의존할 수 없다는 것을 의미합니다."

    대신 Emu는 먼저 템플릿과 비교한 다음 서로 비교하여 미생물 군집을 프로파일링할 때 오류 수정을 반복적으로 개선하면서 다수의 긴 시퀀스를 비교하여 신호와 오류를 구별하는 방법을 배웁니다. 수행된 실험에서 동일한 데이터 세트를 분석할 때 다른 접근 방식과 비교하여 Emu에서 거짓 긍정이 크게 감소했습니다.

    "장기 판독은 미생물군유전체 연구를 위한 파괴적인 기술을 나타냅니다."라고 Treangen이 말했습니다. "Emu의 목표는 마스킹 없이 전체 길이 16S 유전자에 포함된 모든 정보를 활용하여 더 정확한 속 또는 종 수준 호출을 달성할 수 있는지 확인하는 것이었습니다. 그리고 그것이 바로 우리가 Emu로 달성한 것입니다. 다학제간 협력적 노력 덕분입니다."

Designed by Tistory.