当前位置: 首页 > news >正文

怎样开网站免费网站大全下载

怎样开网站,免费网站大全下载,棋牌app软件开发,wordpress 外国主题1.论文链接#xff1a;Graphical Models and Multivariate Analysis of Microarray Data 摘要#xff1a; 基因表达数据的通常分析忽略了基因表达值之间的相关性。从生物学上讲#xff0c;这种假设是不合理的。本章介绍的方法允许通过稀疏高斯图形模型来描述基因之间的相关…1.论文链接Graphical Models and Multivariate Analysis of Microarray Data 摘要 基因表达数据的通常分析忽略了基因表达值之间的相关性。从生物学上讲这种假设是不合理的。本章介绍的方法允许通过稀疏高斯图形模型来描述基因之间的相关性稀疏逆协方差矩阵及其相关图形表示用于捕获基因网络的概念。现有的方法及其在识别这种逆协方差矩阵中的零模式所引起的问题中的局限性。本章提供了一个确定零点模式的可行解决方案。本章的另外两个重要贡献是一种非常高维的建模方法和一种假设检验的无分布方法。这些测试解决了对疾病表达和疾病联系的评估这是本章介绍的一个新概念。给出了一个处理真实的数据的例子。 关键词基因网络微阵列高斯图模型逆协方差矩阵稀疏矩阵 基因表达数据的通常分析忽略了基因表达值之间的相关性。从生物学上讲这种假设是不合理的。本章介绍的方法允许通过稀疏高斯图形模型来描述基因之间的相关性稀疏逆协方差矩阵及其相关图形表示用于捕获基因网络的概念。现有的方法及其在识别这种逆协方差矩阵中的零模式所引起的问题中的局限性。本章提供了一个确定零点模式的可行解决方案。本章的另外两个重要贡献是非常高维建模的方法和假设检验的无分布方法。这些测试解决了对疾病表达和疾病联系的评估这是本章介绍的一个新概念。给出了一个处理真实的数据的例子。 3.1介绍 一个典型的基因表达数据集由一组受试者的大量基因的测量值组成这些受试者已经接受了预先指定的艾德治疗或具有已知的基因型。这些数据被排列成一个n × p矩阵其中n样本大小通常为数十到数百的数量级p为数万或更多的数量级。一个简单而常见的治疗结构是每个个体要么接受治疗治疗要么不接受治疗对照。对这些数据的通常分析[21]试图鉴定不同表达的基因即治疗组的平均表达显著高于或低于对照组的平均表达的基因。通常的分析不试图对基因之间的相关结构进行建模因此有效地假设基因表达测量是不相关的。从生物学上讲这种假设是不合理的因为基因是通过通路或网络连接起来的。 在这一章中我们提出了一个模型基因表达数据明确允许基因之间的相关性。然而在试图为基因表达数据集的相关性或协方差矩阵建模时我们遇到了几个需要克服的问题。首先由于样本大小n相对于变量基因的数量p较小样本协方差矩阵是奇异的不是满秩或可逆的即变量比样本多。这引起了关于估计协方差矩阵或等价地其逆矩阵的能力和估计的质量的问题因为通常的理论假设样本比变量多得多。其次协方差矩阵或相关矩阵中的条目或参数的数量是天文数字数亿的数量级是很常见的。显然我们必须以某种方式减少这些参数的数量以便取得进展。 可以在这种情况下使用的一类有吸引力的模型是高斯图形模型[1422]它由逆协方差矩阵中的零模式定义。将这些模型应用于基因组数据已经变得流行参见例如[205]和其中的参考文献。乍一看考虑逆协方差矩阵似乎不太寻常但如下所示它是一个有趣的对象因为它编码了每个基因和其余基因之间的所有回归关系。此外逆协方差矩阵中的零指定基因之间的条件独立约束[1422]。高斯图形模型有效地解决了上述问题只要它们是稀疏的即它们具有大量的等于零的逆协方差矩阵的0对角元素。这些模型也可以方便地用图形表示当应用于基因表达数据时提供了一个基因网络的表示作为分析的背景包括基因表达可以发生。生物网络的稀疏性的论证可以在[15]中找到。 这项工作与现有的基因表达数据图形模型的工作不同因为它不仅试图识别基因网络而且还分析了网络背景下的治疗效果。其他新的元素是一个非常高维的建模算法和一个假设检验的无分布方法。下面的讨论是[12]的稍微简化的艾德版本但是增加了对基因之间所有关系的信噪比的计算以及从多变量角度识别感兴趣基因的替代分析策略。在这个框架中不被不同地表达或不同地连接的基因见下文仍然可能看起来很有趣。 本章的结构如下。第3.2节给出了数据指定的均值和协方差模型艾德。在3.3节中我们讨论了模型中均值和协方差逆参数的极大似然估计的计算包括确定协方差逆矩阵中的零点模式。假设检验在第3.4节中介绍我们考虑对治疗组和对照组之间无差异的假设进行总体检验以及对组分差异的检验。我们还考虑对多个测试进行调整。在3.5节中给出了一个例子来说明本章提出的思想我们在3.6节中进行了讨论。 3.2模型 例如从这个图中我们可以看到变量/顶点5的邻居是2和3变量5对其余变量的回归只有变量2和3的非零回归系数。更详细的信息可以在[14]和[22]中找到。关于分布假设对于图3.1我们有一个多维多元正态分布因此每个节点/顶点都有一个单变量高斯分布。 3.3模型拟合 3.3.1零模式已知时的最大似然估计 3.3.2确定逆协方差矩阵中的零点模式 显然在给定数据矩阵X的情况下识别逆协方差矩阵中的零模式是一个重要的基本问题其解决方案有效地确定了基因表达值之间的相互关系。请注意确定零的模式等价于确定非零的模式的问题我们通过确定下面的非零模式来解决这个问题。 给定回归系数和逆协方差矩阵元素之间的关系式3.4以下直观吸引人的方法表明了自己 3.4假设检验 3.4.1按排列的随机分布 由于我们已经估计了逆协方差矩阵并且可能在零模式中存在误差而不是假设多元正态性因此我们将使用排列来获得参数估计值的零分布及其各种函数。在[7]之后我们使用下面的策略。 3.4.2多元检验统计量 3.4.3检验统计量的划分 3.4.4测试策略 在前面的小节中我们介绍了一些检验统计量和用于显著性检验的相关零分布的计算。我们现在提出两种不同的策略用于将上述信息组织到数据集的分析中。 在计算零分布时需要选择排列的数量m以便至少有几个排列的统计值大于所选的分位数。 注意上面描述的零分布是无分布的因为它们只依赖于一阶和二阶矩而不依赖于高斯假设。与其他方法如t检验不同不需要为每个单独的测试估计或正则化除数。因此我们不依赖于模型假设来提供方差和检验的正则化估计。与通常的基于模型的方法相比测试结果会有一些差异特别是在小样本量的情况下这并不奇怪。 3.5例子 为了说明上面提出的一些想法我们使用[23]中的数据。这些数据包括使用AYENU133A芯片获得的29个基因表达测量样本。这里的“治疗组”由来自患有乳腺癌的女性的14个明显正常的乳腺上皮细胞样品组成并且对照组由来自正在进行乳房缩小手术的没有乳腺癌的女性的15个明显正常的乳腺上皮细胞样品组成。该研究试图确定乳腺癌患者正常上皮细胞的异常这可能会改善癌症风险评估。在[23]之后我们删除了两组之间变异很小的基因这导致研究中剩余14681个基因。 由于样本量小为了确定逆协方差矩阵中的零模式我们将每个基因的邻居搜索限制为最多两个基因对应于每个回归系数大约15个观测值。请注意这并不意味着一个基因的最大连接数是2如下所示。显然我们不能指望可靠地对这个数据集建立一个全面的网络结构但我们可以希望估计它的一些强连接子分量。应用第3.3.2小节中描述的零模式检测策略我们得到了一个具有24313个非零元素的稀疏逆协方差矩阵。该模型的图相对简单具有3395个大小为1的团即明显独立的基因和9632个大小为2的集团。这意味着模型的图是一个简单的树状结构。回归关系3.5的信噪比的中位数约为1.5。 我们可以像在[12]中那样产生不同表达和不同连接的基因列表。然而为了说明一些不同的东西我们将使用整体测试3.14的组件来识别网络中有趣的基因和有趣的地方。这对应于使用第3.4.4小节中提到的第二种测试策略。 为了测试我们使用m40 000个排列来生成空分布。显著性水平是由先验保守地确定的假设多达一半的基因可以被不同地表达多达一半的基因可以被不同地连接所以我们可能期望做大约2p检验。换句话说为了确定T的显著成分我们做p检验然后确定所选基因的差异表达和连接我们最多做一个额外的p检验。假阳性的预期数量设定为14.681给出用于多重检验的p值为5 × 10的-4次方。 两组平均基因表达相同的假设的总体检验得到的T统计值为5771.52p值严格小于2.5 × 10的-5次方。因此有强有力的证据表明这两个群体之间的表达差异。图3.2给出了该检验的零分布图。垂直线位于T 2744.16处这是对应于p值0.05的分位数。 图3.3说明了T统计量的显著分量的检验。在图3.3中T的分量和为多重检验调整的显著性水平已经被转换使得上临界水平和下临界水平分别为1和-1。实际上-1处的下边缘比图中显示的要粗糙得多。然而大量的基因在x轴相对较小的空间中绘制掩盖了这一事实。 共有167个成分被艾德为重要成分。与其中一些基因相关的有趣功能是免疫反应、细胞内信号传导、细胞形态发生、细胞周期调节和蛋白质水解。该列表还包含已知与乳腺癌或乳腺癌易感性相关的基因。T的最大组分对应于基因BTG2其在[23]中被置于转录因子和调节因子的类别中。我们提取了这个基因的邻居如图3.4所示。该关系的估计信噪比为4.74。对这些基因的粗略功能分析[910]揭示了描述性词语如“细胞凋亡抑制”、“B细胞存活途径”和已知在肿瘤中缺失的蛋白质产物。这说明了图3.4中的基因和关系。在生物学上是有趣的值得进一步研究。 进一步测试在167个具有显著T成分的基因中47个是差异表达的136个是差异连接的。有41个基因既有差异表达又有连接有趣的是有25个既没有显著差异表达也没有连接这表明有可能发现既没有差异表达也没有差异连接的感兴趣的基因。 我们还建立了一个规模为3的本地网络即从一个特定的艾德基因到任何其他相连基因的最多三条边。图3.5给出了其中具有最多边的局部网络。RPS11基因回归的估计信噪比为21.2表明存在非常强的关系。有趣的是注意到与KEGG途径“核糖体”相关的基因的过度表达例如以RP开头的名称。显然我们有肥沃的土壤来更详细地检查167个基因及其关系已知的途径以及与乳腺癌的发展和检测有关的功能。这些列表还可能包含尚未记录的新功能和途径。 图3.5中的基因似乎都没有差异表达。通常我们可能期望通过涉及基因及其邻居的差异表达模式来解释差异连接。在这里情况似乎并非如此例如我们可以假设转录后调节的可能性。在任何情况下为了进一步探索这一点我们在图3.6中绘制了基因RPS 11与其紧邻基因的表达模式。在图中黑线标识了每个基因的观察对比值。箱形图与对比值的零分布相关并为每个基因绘制了四分位数间距和临界分位数。在须线极值之间的值不被认为是不同的表达。将RPS 11的对比度的预期值作为其相邻对比度的加权和绘制为灰点。估计的回归系数除了RPS 11的值它是估计的残差方差也显示在图上。 基于该图灰点的位置似乎主要是由于基因RPL 38和ACAT 1的对比度值。与RPS 11对比值的差异令人感兴趣需要进一步研究。我们也可以为另一个不同连接的基因MATR3绘制类似的图。 3.6讨论和结论 在本章中我们提出了一个微阵列数据模型它特别允许基因之间的相关性。我们展示了如何估计模型中的平均参数以及逆协方差矩阵中的参数包括其零模式。这涉及确定每个基因和其余基因之间的回归关系这是一个在通常的基因表达分析中不进行的计算要求很高的步骤。我们还介绍了涉及基因及其近邻的差异连接的概念。给定参数估计值我们通过使用排列构造了假设的无分布检验。这些测试对于微分表达式的分析也很有用。我们得出了一个整体的假设检验以及对单个组件的测试并对多个测试进行了调整。会上展示了如何以图形方式表示模型以及如何在模型图网络的范围内进行数据分析。在这个例子中我们展示了一种分析数据的替代方法它超越了产生不同表达基因的列表并尊重基因可以属于生物途径的想法。 如果我们考虑逆协方差矩阵中的每个非零条目可能是确定两个基因之间关系的生物学原因的实验的基础的可能性那么很明显在微阵列数据集中存在压倒性的信息量的潜力并且这些信息通常被忽视。图形是总结此信息的一种方便方法但还需要做更多工作才能操作和显示这些非常大的稀疏图形。 现在我们来讨论一些新的想法和上述工作的扩展。有趣的是考虑数据转换的可能性试图使数据看起来更多元正态因为这可能会改善基因之间的线性预测关系例如参见[17]。图形查询如两个基因之间的最短路径局部连接枚举基因的集团并确定基因的连接组件很容易做到也可以提供有用的信息。 任何一个基因和它的邻居之间的回归关系都可以通过交叉验证、模型检验和检验设定值和残差进行进一步的统计分析。检查线性假设也很有趣。在生物学水平上我们可以在文献中搜索已知的关系这可能有助于解释回归结果。然而我们应该对发现新关系的可能性保持开放因为现有的知识是不完整的。 在本章中我们假设治疗组和对照组具有相同的逆协方差矩阵;然而也可以建立和检验允许治疗组和对照组具有不同逆协方差矩阵的模型。这样的模型将允许治疗激活不同的生物途径或以不同方式激活相同途径的可能性。为了可行这将要求每个组都有相当多的观察结果。 我们在本章中使用了无向图模型;然而给定变量的顺序我们也可以使用有向图模型贝叶斯网络BN来建模协方差矩阵。在这种情况下逆协方差矩阵的稀疏Cholesky因子成为感兴趣的对象因为它编码每个变量与其前任或父变量之间的回归关系。在这种情况下也可以进行类似于上面的分析。 本章中的结果是使用R包sparse. inv.cov和mvama生成的。这些软件包沿着有一些简单的教程可以从以下网址免费获得http://www.bioinformatics.csiro.au. 总之微阵列数据集中的信息比通常的分析提取物多得多。在本章中我们提出了一些提取这些附加信息的策略并展示了图形模型在表示这些信息和指导分析方面的有用性。 参考文献 略
http://www.hkea.cn/news/14464455/

相关文章:

  • 常州网站建设优化h5营销
  • 做h5那个网站好深圳大型商城网站建设
  • 做窗帘网站图片怎么自己建一个网站
  • 北京网站建设迈程网络深圳网页制作服务
  • dz论坛可以做招聘网站哪里有免费做网站
  • 企业网站建设规划书的内容新开传奇网站发布站
  • asp网站配色wordpress 用户登录ip
  • 大型门户网站建设哪家好泰安网站推广
  • 东莞整站优化推广公司找火速宁夏网站制作哪家好
  • 网站备案幕布照如何做永久免费网站怎么创建
  • 建网站的方法企业营销战略
  • 网站审核文件绍兴做网站鼎成
  • 测速网站开发福建微网站建设价格
  • 产品图案设计网站wordpress首页怎么控制
  • 哪个网站比较好定制软件安卓
  • 成都神速建站wordpress在线支付表单
  • 网站建设策略书游戏网站建设项目规划
  • 网站弹出广告gif出处做详情页生成代码的网站
  • 手机网站制作移动高端网站建设聊城九洲建设有限公司网站
  • 资源丰富免费的网站推荐排名繁昌网站建设
  • 网站提交网址畅销的网站建设
  • 担路网如何快速做网站青岛网站建设方案维护
  • 合肥有什么好的网站建设公司好单纯python能完成网站开发吗
  • 孵化器网站建设方案西安网站推广都是怎么做的
  • 郑州网站推广公司信息台州网站建设方案推广
  • 做一个信息发布网站要多少钱我有广告位怎么找客户
  • 加盟的网站建设欧洲站vat激活
  • 建设银行深圳分行网站石家庄最新情况
  • 网站服务器租用的软文营销的技巧
  • 网站搜索工具交通信用网站建设