千果论文网
论文范文
千果论文网免费提供各类论文范文,专注 毕业论文、职称论文!7年服务经验,质量保证!
当前位置:千果论文网 >> 论文下载 >> 毕业论文范文 >>浏览文章
分析交互高维数据交互作用的统计策略及其在肺癌全基因组关联中的运用论文

摘要:全基因组关联探讨(genome-wide association study, GWAS)以2005年起初露锋芒,至今方兴未艾,成果斐然。然而,目前GWAS所识别的具有主效应的位点仅能解释一小部分遗传变异。复杂疾病由外在环境暴露因素、内在遗传因素相互影响所致。基因组学探讨中忽略基因—环境、基因—基因交互意义是导致遗传性缺失(missing heritabipty)的重要理由之一。GWAS涉及的变量数高达数十万。传统交互意义分析办法受算法复杂程度、软件计算速度等限制,无法在全基因组水平检测交互意义。2007年从来,涌现出一大批针对高维基因组学数据基因—基因交互意义分析的办法。不同办法各有利弊,且缺乏专门快速检测高阶交互意义的办法。本论文首先,对多种交互意义分析办法进行体系评价;其次,改善办法,提出新的高阶交互意义分析办法;再次,探索高维数据中高阶交互意义降维分析对策;最后,运用探讨所得对策在实际GWAS资料中进行交互意义挖掘。全文结构如下:第Ⅰ部分交互意义分析办法的体系性评价。基于文献综述,体系评价了性能出色、算法典型的10种办法(7种软件),包括:BOOST、BiForce、iLOCi、SIXPAC_D、 SIXPAC_R、 SIXPAC_lod、 SNPRuler、 AntEpiSeeker_pruned、AntEpiSeeker_raw、TEAM。模拟试验一、模拟试验二分别考察各办法检出1对、多对交互意义的性能。BOOST、BiForce两法检测交互意义时一类错误可控,把握度尚可;BOOST与BiForce性能完全相同,提示“先初筛、再检验”是合理的降维分析模式。位点2分类编码的SIXPAC_lod仅在检测多对交互意义时,一类错误膨胀至15%左右,但把握度总是高于BOOST、BiForce。提示样本量较低时,位点可采取2分类编码进行初筛,后续再检验。BOOST、BiForce位点编码模式较SIXPAC_lod更灵活,由此倡议实际运用时,视条件灵活运用这两个软件。AntEpiSeeker_raw、TEAM检测无任何效应位点时,一类错误可控;只要位点有主效应或者交互意义,两法均具有较高的把握度,适合过滤噪音位点。模拟试验三显示BOOST、BiForce计算速度快,可在短时间内完成检测工作。第Ⅱ部分基于熵的交互意义分析办法改善。基于信息论(information theory),提出迭代熵交互意义(iterative entropy epistasis, IEE)法,用于检测高阶交互意义,且适应位点不同的连锁不平衡(pnkage disequipbrium, LD)结构。以办法学(模拟试验四)、实际运用(模拟试验五)角度,无论检测一阶、高阶交互意义,IEE法一类错误制约能力与对数线性模型相近,但把握度优于后者。此外,IEE法计算速度快于对数线性模型。模拟试验六显示,若进一步降低IEE法迭代收敛精度,可再次提升计算速度。检测一阶、二阶从上交互意义时,IEE法分别在原始迭代次数25%、50%条件下,可维持原始一类错误、把握度水平;分别提升3倍、1倍计算速度。第Ⅲ部分高阶交互意义降维分析对策探讨。提出“KSA初筛→IEE再筛→logistic检验, KIL”交互意义降维分析对策。模拟试验七探讨显示:不同条件下,KSA法统计量总是不低于IEE法统计量,且计算速度最快,符合快速初筛原则;IEE法速度快于logistic回归,适合高维数据筛选。模拟试验八显示,与单纯运用logistic回归相比,使用KIL对策降维分析,可从制约一类错误,且能够基本维持把握度(平均达到logistic回归效能的92%从上)、减轻计算负担(仅为原始计算量的30%-40%)。第Ⅳ部分肺癌全基因组关联探讨数据挖掘。运用探讨所得对策,在中国人群肺癌GWAS实际资料中全基因组水平检测交互意义。(1)基因—基因交互意义分析。采取三阶段病例—对照探讨设计。第一阶段为GWAS筛选期,第二、三阶段为独立的验证期。总样本量为13,392(6,377例病例、7,015例对照),涉及591,370个位点。GWAS筛选阶段,采取KIL对策获得4对潜在交互意义位点。交互意义位点rs2562796-rs16832404在后续验证中成功。GWAS筛选阶段,其交互意义OR=2.58,95%CI=2.24-2.97, P=1.37×10-39;第一阶段验证,交互意义OR=1.17,95%CI=0.99-1.38, P=6.37×10-2;第二阶段验证,交互意义OR=1.21,95%CI=1.0

千果论文网专注 毕业论文与职称论文以及论文 表业务,如有需要请联系客服人员!