英语论文艺术论文会计审计论文土建类论文农业科学论文代写论文专区公文范文代发论文代写作业论文检索代写论文价格论文格式留学生论文高中教学论文哲学论文政治论文经济学论文理工科学论文护理学论文管理科学论文教育学论文其他资料计算机科学论文医药学论文法律论文日本语论文文学媒体论文文化历史学论文社会学论文代写体育论文

英语翻译论文英美文学论文英语语言学论文英语其它商务英语论文英美文化论文

学科教育论文信息技术论文德育管理论文素质教育论文图书馆学论文教育心理学论文小学语文高效课堂论文小学语文电教论文小学英语电教论文小学数学电教论文中学英语电教论文中学音乐电教论文小学电教教育论文小学科学电教论文中学数学电教论文初中数学电教论文生物自然教学论文历史教学论文地理教学论文教育理论论文教育管理论文基础教育论文中等教育论文高等教育论文职业教育论文英语教学论文语文教学论文政治教育论文数学教学论文物理教学论文化学教学论文体育教学论文美术论文音乐论文中学化学电教论文

药学论文医学论文题目医学论文投稿医学论文格式医学其他泌尿科论文眼科论文外科论文医学硕士论文呼吸消化论文医院管理论文临床医学论文中医学论文医患关系论文

建筑工程论文土木工程论文城市规划论文建筑论文

工商管理论文管理基本理论论文成本管理论文档案管理论文企业研究论文管理理论论文企业文化论文项目管理论文MPA论文经济管理论文风险管理论文行政管理论文图书馆管理论文公共管理论文工程管理论文旅游管理论文市场营销论文人力资源管理论文秘书文书论文物流供应链管理论文信息管理论文电子商务论文战略管理论文代写mba论文

财政税收论文技术经济学论文农业经济论文债务市场论文投资决策论文融资决策论文宏观经济论文经济相关论文货币银行论文保险论文金融证券论文国际贸易论文中国经济论文经济学理论论文行业经济论文国际经济论文发展战略论文国民经济核算论文

财务分析论文MPACC论文财务控制论文会计研究论文财务管理体制论文成本会计论文审计论文电算化会计论文CPA行业论文管理会计论文会计理论论文会计毕业论文

国际法论文法学史论文公司法论文合同法论文经济法论文知识产权法论文司法制度论文法学理论论文国际商法论文宪法论文行政法论文刑法论文民法论文诉讼法论文

软件工程论文计算机网络论文计算机应用论文计算机安全论文计算机专业论文计算机论文范文

汉语言学论文古代文学论文现当代文学论文新闻传播学论文

中国古代史论文中国近代史论文传统文化论文文化战略论文宗教文化论文

农村研究论文人口问题论文伦理道德论文心理学论文社会其他民俗学论文

民主制度论文毛泽东思想论文政治学论文国际关系论文科学发展观论文马克思主义论文资本主义论文社会主义论文政治哲学论文邓小平理论论文

逻辑学论文中国哲学论文西方哲学论文国学论文美学哲学论文

音乐舞蹈论文环境艺术设计论文园林艺术论文网页设计论文室内设计论文戏剧论文动漫设计论文平面设计论文美学论文艺术理论论文电影电视论文美术绘画论文传播学论文

图论算法在生物网络数据上的计算机应用研究

时间:2019-01-19 20:36来源:硕士论文作者:lgg 点击:
本文是一篇计算机论文,计算机的应用在中国越来越普遍,改革开放以后,中国计算机用户的数量不断攀升,应用水平不断提高,特别是互联网、通信、多媒体等领域的应用取得了不错的成绩。
本文是一篇计算机论文,计算机的应用在中国越来越普遍,改革开放以后,中国计算机用户的数量不断攀升,应用水平不断提高,特别是互联网、通信、多媒体等领域的应用取得了不错的成绩。(以上内容来自百度百科)今天为大家推荐一篇计算机论文,供大家参考。
 
第 1 章 绪 论
 
1.1 研究背景
随着基因组学和高通量技术的不断提高与成本的持续降低,研究人员得以接触到海量的基因(转录组学)、蛋白(蛋白质组学)以及由他们之间相互关系构成的多种复杂生物网络(关系组学)数据[1]。对生物系统运行、机体应激反应抑或疾病的发生发展机理研究,也由专注于少数分子转变为多层次、全系统地研究分子间的相互作用。这是大数据时代为研究生物机理带来的机遇,与此同时,如何从大数据中挖掘隐藏的知识也成为了后基因组时代的挑战与主要任务之一[2]。系统生物学是一个试图整合异构信息以理解生物体运行方式的学科[3]。其研究对象主要为不同分子间的相互作用关系。这些分子网络包括:蛋白质相互作用网络[4]蛋白质通过彼此间的相互作用构成蛋白质相互作用网络并参与多个生命过程。蛋白质相互作用网络是数据最多同时也是被研究最广的一种生物网络。多个数据库都提供蛋白质相互作用网络的下载,例如 DIP[5],STRING[6],BioGRID[7]等。仅以 STRING 数据库为例,其目前已收录了2031 个物种的 960 万个蛋白间的 13.8 亿个相互作用关系。识别蛋白质相互作用的方法同样种类繁多,其中酵母双杂交是最常见的研究方法[4]。  基因调控网络[8]基因调控网络对于各种相关基因的表达量的调控起着至关重要的作用。所谓基因表达量的调控主要是指转录因子对编码蛋白质的 mRNA 的产生过程中的调节与控制。转录因子是一种能绑定在 DNA 上的蛋白质。大多数转录因子可以绑定在 DNA 上的多个位置从而调控多种基因,这也导致了调控网络十分的复杂,以人类调控网络为例,其中有大约 1400 个转录因子调控着 20000 多个人类基因的表达[9]。研究基因调控网络的主要技术手段包括染色体免疫共沉淀晶片(CHIP-chip)[10]、染色体免疫共沉淀测序(CHIP-seq)[11]等等。
.........
 
1.2 研究意义
研究图论算法在生物网络中的应用具有双重意义。从生物数据分析的角度来说,首先,图论算法提供了一种新的分析手段。在高通量、大数据的背景下,利用传统的生物实验逐一分析每个基因在生物运行机制中扮演的角色将耗费大量的人力和财力。而图论中有很多已经被研究多年的经典问题,例如最大团问题、最小生成树问题、最短路径问题、最大流问题、最小割问题、最小覆盖集问题等等,都可以被借鉴过来,起到过滤冗余、排除干扰的目的。因为通常只有一少部分分子在研究人员所关心的生物过程中起到作用,利用图论算法将这些相关分子找出来,再有针对性地进行生物实验。第二,图论算法提供了另一种分析生物网络数据的角度。有研究表明分子网络中存在异常保守的分子集团(模块),这些模块在生物经历了长时间的进化后依然能被检测到[16]。而在预测必需蛋白(Essential Protein)的研究中,发现在分子网络中具有较高点度(degree)的蛋白更有可能是生命体存活所必需的蛋白[17]。这些特征都是从宏观的拓扑结构角度来分析生物网络,而非传统地针对某一个分子进行研究所能发现的。从图论算法的角度来说,大量的生物网络数据与相关问题为图论算法提供了新的应用领域。作为一条历史悠久、研究积淀深厚的学科分支,图论曾被成功应用于诸多领域,例如计算机科学、语言学、化学、物理学、社会科学等等。每当在新的研究领域尝试应用图论算法时,尽管数学模型可能相同,也要根据所研究的对象的特点对模型进行相应的变形。只是生搬硬套其他领域成功的图论应用,而不深究所研究对象的本质特点,是不能开发出模拟对象行为的图论模型。举一个图论算法在万维网中的应用例子,每一个接入网络的页面都是一个网络节点,网页中可以链接到其他网页的超链接构成了网络中的边。谷歌公司的创始人拉里佩奇基于万维网的拓扑结构,开发了佩奇排名算法(PageRank)[18]。该算法模拟了用户随机跳转到一个页面以及按照超链接顺序浏览网页的行为,这是对万维网特点有所考虑的设计。该算法的出色表现使得谷歌公司以此作为谷歌搜索的网页排名算法。另一个成功案例是图论算法在社交网络中的应用[19]。
........
 
第 2 章 基于生物网络机理研究中图论及相关背景知识介绍
 
本章作为过渡章节,以必需蛋白预测问题和活跃信号通路识别问题为例,介绍基于生物网络的单分子机理和多分子协同机理研究中的图论及其他相关的背景知识。旨在令读者对后续章节所涉及到的概念、特征、算法有所了解,而非全面的综述。
 
2.1 必需蛋白预测相关研究
根据 Jeong 等人提出的中心致死法则,对必需蛋白预测起最直接作用的就是基于图论算法的生物网络中心度量。这些中心度量包括点度中心性(degreecentrality)[17]、中介度中心性(betweenesscentrality)[27]、接近中心性(closenesscentrality)[28]、子网中心性(subgraphcentrality)[29]、特征向量中心性(eigenvectorcentrality)[50]以及信息中心性(informationcentrality)[51]。这些依赖于网络拓扑结构的特征当生物网络的可信度不足时会严重降低预测的准确率,因此对必需蛋白的预测中还常常使用一些其他的与网络无关的属性,例如最常见的基因表达信息等等。下面介绍本文算法以及所比较的两个算法(NC 算法和 PeC 算法)中所涉及到的其中几种或基于网络结构或独立于网络的特征。
........
 
2.2 活跃信号通路相关研究
与有主流理论指导的必需蛋白预测问题不同,活跃信号通路研究中涉及到的算法种类更多也更复杂,例如在第一章研究动态中提到的优化算法、统计算法等等。图论的方法同样在基于生物网络的活跃信号通路研究中扮演重要的角色。下面就对本文提出的算法中涉及到的图论模型以及所比较的其他算法进行简单的介绍。
 
2.2.1 动态规划算法
动态规划算法常用于计算机科学、数学、生物信息学等学科中。它将原始的复杂问题分割成若干个更简单的子问题,每一次解决其中的一个子问题并将结果保存,当该子问题再次出现时,可以直接读取之前计算过的结果而不用再次计算,这样节省了大量计算资源。本文提出的识别活跃信号通路方法中应用了动态规划的思想,主要有两点原因:1,动态规划算法会保留之前的计算结果,在信号通路识别中可以利用这点回溯路径。2,动态规划在之前得到的最优结果基础上每一次只向下进行一步,这个特性使得动态规划算法能够得到唯一解,也即是全局最优解。这两个特性是目前大多数活跃信号通路算法所做不到的。
.........
 
第 3 章 基于边排序的必需蛋白预测算法.............21
3.1 IEW 算法流程 ............ 21
3.2 数据来源.......... 22
3.3 基于不同特征的分子关系评估.... 25
3.4 必需连接与必需蛋白的预测........ 27
3.5 预测结果的验证与分析...... 29
3.6 小结........ 39
第 4 章 基于知识的信号通路识别与假设生成模型.......41
4.1 IMPRES 算法介绍 ...... 41
4.2 算法评估与比较........ 50
4.3 IMPRES 算法在人类肺癌数据集上的案例研究 ........ 56
4.4 小结........ 59
第 5 章 活跃信号通路可视化在线平台.......61
5.1 用户需求.......... 61
5.2 系统设计.......... 62
5.3 技术细节.......... 68
5.4 小结........ 70
 
第 5 章 活跃信号通路可视化在线平台
 
算法的发布是算法开发中的一个重要环节。将开发的算法供用户使用,大致有两种途径:一是做成工具包,让用户下载安装,本地调用;二是做成网站,用户可以在线应用算法。因为用户本地的操作系统不统一,环境变量更是千差万别,以工具包的形式发布算法通常对用户的计算机能力有一定要求。而在线工具将计算的压力留给服务器端,用户只需要在本地使用浏览器就可以运行算法。由于图的本质特点,图论算法的结果往往可以由点和之间的连线直观地进行可视化。本章为 IMPRes 算法开发了一个活跃信号通路可视化在线平台,该平台主要具有两方面意义:对生物医学研究人员来说,无需任何编程语言背景,只需要提供算法所需要的数据,就可以构建用户数据条件下的活跃信号通路,并以动态可交互的多种网络布局展示给用户。其中的节点以及节点间的连接关系会根据不同的属性而着色或变形,方便研究人员分析信号通路并提出假设、进行验证。另一方面,对于其他开发信号通路预测算法的研究人员,该可视化在线平台也为他们提供了一个获得 IMPRes 算法结果的接口,方便他们进行算法的比较。前文提到的一些算法也大都提供在线服务,例如 ResponseNet 和 SteinerNet 算法。本章首先说明了该平台的用户需求,之后对整个系统的设计进行比较详细的介绍,然后介绍了开发该平台用到的一些技术细节,最后是本章小结。
.........
 
结论
 
生物过程的机理研究长期以来都是系统生物学所关心的热点问题也是难点问题。由于生物体内大量分子间的作用关系可以抽象成多种生物网络,图论模型对于解决这一问题拥有得天独厚的优势。本文分别对于独立分子功能预测及多分子协同作用机制开发了基于图论的算法。通过算法设计阶段的研究及算法验证、应用的结果,本文得到以下一些结论:
第一,根据前人的研究,本文认为必需蛋白的重要性源自其与其他蛋白的作用关系,并据此设计了通过排序蛋白质相互作用关系以预测必需蛋白的算法 IEW,而非通过直接量化蛋白本身。实验结果证明 IEW 值排名高的蛋白连接更倾向于由必需蛋白组成,并且 IEW 算法的预测必需蛋白的能力要高于该领域主流算法。
第二,本文在必需蛋白预测模型中考虑了多种生物特征,其中有些特征是第一次被应用于该问题,例如蛋白质结构域连接强度和系统发生谱相似性。通过观察这些特征的值在不同连接种类间的分布,发现这些新特征对于区分必需连接与其它类型的连接有不同程度的贡献。
第三,IEW 算法通过余弦相似性模型整合多种蛋白特征,以此量化蛋白连接的重要程度。之后进行的大量鲁棒性实验证明了整合模型在面对不同程度的网络干扰时,表现出比单一特征依赖的方法更高的稳定性。即当某一特征失效时,整合模型依然能够给出比较准确的预测。
第四,在活跃信号通路识别研究中,本文利用 KEGG 数据库中的代谢通路知识构建背景网络参与计算,而非只是利用 KEGG 作为金标准验证结果。通过在酵母数据集和人类肺癌数据集上应用 IMPRes 算法并对结果进行分析,本文发现 KEGG 代谢通路使算法结果更具有生物学合理性及可解释性,证明了 KEGG 作为算法一部分的价值。
..........
参考文献(略)
(责任编辑:gufeng)
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
论文代写请联系:

论文代写电话:
论文代写电话:
email:@qq.com
论文代写qq:

\
论文代写 价格合理
QQ在线客服
中华论文网
咨询QQ
2628487918
15221741752