医学论文范文栏目供给最新医学论文范文格局、医学论文范文硕士论文范文。概况征询QQ:869156324(颁发);357500023(论文教导)

非典冠状病毒基因组中微卫星序列宿主特同性比拟阐发

日期:2020年02月27日 编辑:ad201107111759308692 作者:龙8 论文网 点击次数:1002
论文价钱:150元 论文编号:lw202002162226537753 论笔墨数:33655 所属栏目:医学论文范文
论文地域:中国 论文语种:中文 论文用处:硕士毕业论文 Master Thesis

本文是一篇医学论文范文,本文操纵公然数据库中SARSr-CoV的165条基因组序列数据,按照其传染宿主的差别分为传染蝙蝠、果子狸、人类的三组SARSr-CoV,操纵现有处置软件和多种编程说话矫捷编写所需剧本,,中微卫星停止数目统计,范例统计和微卫星在差别地域上的散布特点以切磋微卫星在SARSr-CoV基因组中的散布形式和三组传染差别宿主的SARSr-CoV之间微卫星的差别。成果显现,传染差别宿主的SARSr-CoV的基因组碱基序列类似度很高(>80%),且165条序列GC含量几近完全不异,但其微卫星的数目,范例和在基因组上的散布形式都具备差同性。由此提醒微卫星能够作为物种微退化阐发中的有效手腕.


第 1 章  绪论


1.1 生物信息学简介

1.1.1 生物信息学的汗青变更及其寄义

生物信息学(Bioinformatics)第一次被提出是在 1970 年,在那时,生物信息学所包罗的学习标的目标与此刻完全差别,Paulien  Hogeweg 和 Ben  Hesper 缔造这个词时是用来代表学习生物体系中的信息(旌旗灯号)进程的学科[1]。生物学和生物信息学成长到明天,以计较机为主要学习东西对性命停止的数据计较阐发成了性命学习范畴各标的目标中首要的构成局部。20 世纪 80 年月后,跟着对大批基因学习的深切,呈现了基因组学,学习者们试图对全基因组停止测序、阐发和作图,基因组学被以为是最具备意思,最有但愿揭开性命奥妙的手腕,以此为契机,到1990 年,以美国为首睁开了 20 世纪最巨大的科研勾当之一,人类基因组打算被正式开幕。且在差别物种中的测序任务也在快马加鞭地停止中,天下上第一个细胞的基因组全序列在 1995 年被胜利测序,一年后,酵母的全基因组也完全展此刻人们的眼中。随后,在 1998 年,人们对多细胞生物测序也颁布颁发得胜,线虫基因组也被揭示。在一年后更庞杂的形式生物,果蝇的基因组被宣布胜利测序。到1999 年年末,对人类的基因组呈现战果,人体第 22 对染色在昔时被测序胜利。2000 年 6 月,人类基因组打算已周全完工,人类的遗传物资已毫无保留地完全展此刻学习者的视野中。在此期间,对基因组大批测序的高潮中,生物信息学相干学习职员,为了更好地存储,检索名贵的测序数据,搭建了很多生物数据数据库,比方闻名的的 NCBI、SWISS-PROT 和 EMB 数据库均于此期间被成立。

此时还呈现了一批典范的比拟算法,1988 年,Pearson 和 Lipman 配合发了然 FASTA 疾速比拟算法比拟算法。两年后,1990 年,BLAST  (Basic  Local Alignment Search Tool)问世,现现在,FASTA 和 BLAST 的最新版本任然是是比拟生物学天天都在操纵的东西之一。 

时至本日,获得数据已不再是困难,测序时候和测序本钱已低到凡人能够轻松承担。每一个人若是须要,都能够在一天内获得本身的全基因数据。海量的数据不时地累计在数据库中,但数据的海量不代表信息的海量,在如斯复杂的数据眼前,人们从中发掘到的信息却只是沧海一粟。由今生物信息方式显得尤其首要,由后人测得的海量数据中,提炼出有效数据,精辟为通俗学问和纪律,是生物信息学的主要方针,为揭开生物体奥妙供给一个能够的途径。

...........................


1.2 经常操纵生物信息数据库

生物信息学学习最根基的根本是各种生物数据库,不各种生物数据库大批生物数据的大批堆集,生物信息学是没法停止学习的。基因组打算的完成堆集了超大批的生物信息。当今天下中,测序的速率与本钱都已产生天翻地覆的变更,
一个领着均匀人为的通俗人能够花上本身一个礼拜的人为在一天以内拿到本身的基因组全序列数据。环球的生物学习者都在停止大批的测序任务,愈来愈多的物种都已被测序胜利,巨量的数据天天都被增添,堆集到数据库中,面临这些聚积如山的数据,在学习者对其停止学习之前,起首须要的是找到在本身学习中将要操纵到的数据。在这类学习须要的鞭策下,天下各地起头搭建生物信息数据库,便利环球的学习者便利地搜刮,办理和下载本身所须要的生物信息。另外生物信息数据的增添不但是核酸序列的增添,还包含卵白质序列,卵白质三维布局瞻望,呼应的文献数据的增添等等,这鞭策了特地的分类数据库的疾速成长,当今生物数据库主要包含基因组数据库、卵白质数据库、卵白布局数据库等。

1.2.1 差别学习标的目标代表性数据库

停止 2013 年,Nucleic Acids Research 杂志统计了全天下 1512 个主要的份子生物学数据库[8]。上面简略罗列了一些差别学习标的目标具备代表性的数据库(表1.1)。各种目标性,针对性差别的生物数据库,能够为相干专业职员供给其专业相干的数据。大批分类精确的数据库各司其职,差别学习标的目标的学习者都可在相干数据库中找到本身所需的数据,数据库的专业性更能够高效进步学习者办理维护数据的品质与成果。 

表1.1 差别学习标的目标代表性数据库罗列

........................


第 2 章 SARSr-CoV 基因组中微卫星阐发


2.1 媒介

微卫星序列是基因组中遍及存在的一种以 2-6 碱基为反复单位反复屡次的简略反复序列,数目丰硕,散布遍及,具备高度多态性[54]。大批学习标明,作为基因组一个首要的组分,微卫星在基因组中的非编码区,编码区,基因间区,都有大批散布,且影响着卵白的功效、生物遗传和基因调控,是基因组学习范畴的一个热门[55-56]。微卫星序列在真核生物和原核生物基因组中遍及存在,并被遍及学习[57],但今朝还不 SARSr-CoV 基因组中微卫星序列相干报道。

2002 年到 2003 年,从亚洲起头,一向舒展并迸发到环球的可骇风行病,非典范性肺炎  (Severe  acute  respiratory  syndrome,  SARS)致使全天下规模内 37个国度 8098 例传染,此中  774 例灭亡[48] ,灭亡率为 9.6%[49],到了 2004 年,SARS 便敏捷鸣金收兵,已不任何有关 SARS 病发的报道[50]。

在同年 5 月,学习者从广州的市场中售卖的植物体内也收罗到了SARS 冠状病毒的病毒样本,但被传染的植物未呈现临床病症。尔后,在 2005年,从中国蝙蝠体内收罗到了数种与 SARS 冠状病毒类似性极高的新型冠状病毒,并取名为 SARS-like 冠状病毒[58-59]。蝙蝠虽照顾 SARS-like 冠状病毒,但未表现出任何相干病症,猜测出蝙蝠为 SARS-like 冠状病毒的自然宿主,体系产生阐发显现,蝙蝠照顾的 SARS-like 即为终究致使非典的首恶,并以果子狸作为中心植物宿主终究传布到人[60],致使疾病且在人群中传布。

本学习以 SARSr-CoV 基因组为学习工具,操纵生物信息学方式,对基因组中的微卫星序列停止综合阐发。试图从微卫星的角度,赐与 SARSr-CoV 跨宿主退化的缘由一点参考与提醒。

.........................


2.2 资料与方式

2.2.1 基因组序列数据

从 NCBI 的 Genbank 数据库中查问并尽能够多公开载具备完全序列正文的165 条 SARSr-CoV 基因组全序列,并根据其传染宿主的差别分为三组,传染蝙蝠、人类和果子狸的 SARSr-CoV 序列。因各 SARSr-CoV 基因组中 5’端与 3’端序列测序长度有着很大的差同性,为了在阐发进程中将差别序列的基因地域对齐,一切 SARSr-CoV 基因组序列的 5’端与 3’端序列均被移除。简洁起见,操纵 B1-B37、C1-C24 与 H1-H104 来表现传染差别宿主的 SARSr-CoV 基因组序列,此中 B1-B37 为传染蝙蝠的 37 条 SARSr-CoV 基因组序列;C1-C24 为传染果 子 狸 的 24 条 SARSr-CoV 基 因 组 序 列 ; H1-H104 为 感 染 人 类 的 104 条SARSr-CoV 基因组序列  (表 2.1)。  原始全基因组序列长度为 28735~30309  nt,最长序列为 B24,最短序列为 B27。去除 5’端和 3’端后用于本文的序列片断长度为 28155~29690 nt,最长序列为 B24,最短序列为 B34。 

表 2.1 165 条 SARSr-CoV 基因组序列根基信息

..........................


第 3 章 SARSr-CoV 中微卫星序列宿主差同性散布阐发 ................................. 27

3.1 媒介 ............................... 27

3.2 资料与方式 .............................27


第 3 章 SARSr-CoV 中微卫星序列宿主差同性散布阐发


3.1 媒介

在上一章中,比拟阐发了传染蝙蝠、果子狸和人类的 SARSr-CoV,成果显现三组病毒虽碱基构成高度类似(>80%),但其微卫星散布在全部基因组上不管是数目仍是范例都存在差别。第二章的统计阐发中发明了传染差别宿主SARSr-CoV 微卫星的差别,但只能获得基因组上微卫星的均匀情形,现实上,微卫星在基因组的差别地域有着差别的渐变率[16],且在基因组差别地域的微卫星具有差别的功效[20],致使微卫星的散布是与基因组地域相干的,第二章的学习并不显现出地域间微卫星散布的差别。在本章中,经由过程对基因组朋分成很多小地域,并对各地域内

该论文为免费论文,请扫描二维码增添客服职员采办全文。