做大型网站需要多少钱,网站建设的客户需求分析调研表,wordpress多选展示表单,建设网站 无法显示图片科学就其本质而言#xff0c;是累积渐进的。无论你是使用基于网络的还是基于命令行的工具#xff0c;在进行研究时都应保证该研究可被其他研究人员重复。这有利于你的工作的累积与进展。在生物信息学领域#xff0c;这意味着如下内容。 工作流应该有据可查。这可能包括在电脑… 科学就其本质而言是累积渐进的。无论你是使用基于网络的还是基于命令行的工具在进行研究时都应保证该研究可被其他研究人员重复。这有利于你的工作的累积与进展。在生物信息学领域这意味着如下内容。 工作流应该有据可查。这可能包括在电脑中保留文本文档以便复制和粘贴复杂命令、网址或其他形式的数据。许多人选择保留传统的手写的实验笔记本但是现在越来越需要同时保存某些形式的电子记录。为了方便你的工作存储在计算机上的信息应被妥善整理。可参考文献Noble, W.S. 2009. A quick guide to organizing computational biology projects. PLos Computational Biology数据应该可被他人使用特别是存储高通量数据的存储库。 这方面的鸽子包括NCBI的Gene Expression Omnibus (GEO)和Sequence Read Archive (SRA)、ArrayExpress 和 EBI 的European Nucleotide Archive (ENA)。如果期刊没有特别要求现在可以将数据上传到 GSA (Genome Sequence Archive)。如果是敏感的遗传资源数据可能只能上传到GSA。元数据和数据一样同等重要。元数据是指数据集相关的信息。对于一个已被测序的细菌基因组而言元数据可能包括该细菌被分离的位置信息、培养条件以及它是否致病等信息。在一个关于人类大脑的基因表达的研究中元数据可能包括死后采样时间 、性别、疾病表型和RNA分离方法等。元数据为统计分析提供关键信息使研究者可以探索各种参数对结果的影响。所使用的数据库应做好记录。由于数据库的内容可随时间改变所以记录版本号和获取日期非常重要。软件应做好记录。对于已被认可的软件包应提供版本号。进一步记录使用软件的具体步骤可使他人能够独立重复你所做的分析。为了共享软件许多研究人员使用如GitHub等软件存储库。我一般使用 Git 来管理项目的源代码以及相关文档。可以参考我之前写的一篇 Git 最佳实践的文章。生物信息基础实用Git命令掌握这些就够了 Galaxy 生信云平台UseGalaxy.CN的重要特色就是可重复性研究它解决了如下问题 工作流有据可查。分析过程所有步骤都有记录可重复。Galaxy有非常科学的管理数据生命周期的流程。数据从上传到分析以及存档都尽最大可能为用户提供优质的使用体验。数据分析所使用的软件和数据库版本以及相关参数都记录在案便于重复研究。数据分析的相关步骤、参数以及数据等都可以与他人分享。可以设置指定人员可见或者通过分享链接可见以及所有人可见。 参考资料《生物信息学与功能基因组学》P11 关于简说基因 生信平台Galaxy中国UseGalaxy.cn致力于打造中国人的云上生物信息基础设施。大量在线工具免费使用。无需安装用完即走。活跃的用户社区随时交流使用心得。生信培训简说基因的生信培训班荣获学员的一致好评。如果你也对生物信息学感兴趣欢迎来跟简说基因学真生信。生信分析我们能够承接所有 NGS 组学数据分析业务包括但不限于 WGS / WES / RNA-seq 等。基因组组装、注释以及各种重测序业务都可以与简说基因合作。