当前位置: 首页 > news >正文

通城做网站公司济南环保局官方网站

通城做网站公司,济南环保局官方网站,audio for wordpress,镇江网站建设制作公司可以使用以下命令来查看 gz 压缩文件的内容#xff1a; zcat file.gz 1 该命令会将 file.gz 文件解压并输出到标准输出#xff0c;可以通过管道符将其与 grep 命令结合使用来查找需要的关键词#xff0c;例如#xff1a; zcat file.gz | grep keyword 1 该命令会将 file.gz…可以使用以下命令来查看 gz 压缩文件的内容 zcat file.gz 1 该命令会将 file.gz 文件解压并输出到标准输出可以通过管道符将其与 grep 命令结合使用来查找需要的关键词例如 zcat file.gz | grep keyword 1 该命令会将 file.gz 文件解压并输出到标准输出然后通过管道符将其传递给 grep 命令查找包含关键词 “keyword” 的行。 挖掘公共单细胞数据集时会遇到常见各种单细胞测序数据格式。现总结如下方便自己日后调用以创建Seurat对象 1barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz 2表达矩阵 3h5 4h5ad 格式一barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz【☆】 这是cellranger上游比对分析产生的3个文件分别代表细胞标签(barcode)、基因ID(feature)、表达数据matrix一般先使用read10X()对这三个文件进行整合得到行为基因、列为细胞的表达矩阵为稀疏矩阵dgCMatrix格式节约内存然后再配合CreateSeuratObject()函数创建Seurat对象示例数据集GSE166635创建代码如下---- https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?accGSE166635 dir./data/HCC2/filtered_feature_bc_matrix/ list.files(dir) #[1] barcodes.tsv.gz features.tsv.gz matrix.mtx.gz counts - Read10X(data.dir dir) class(counts) #[1] dgCMatrix #attr(,package) #[1] MatrixscRNA - CreateSeuratObject(counts counts) scRNA #An object of class Seurat #33694 features across 9112 samples within 1 assay #Active assay: RNA (33694 features, 0 variable features)如上Read10X()函数接受的参数为目录名该目录包含了所需的三个配套文件值得注意的是三个文件名只能分别是barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz然后read10X函数可以自动加载。如上截图那样就是需要修改的~ 关于barcodes.tsv.gz、features.tsv.gz、matrix.mtx.gz三个文件的格式与内容 一般来说直接使用read10X()不会出现什么问题但今天遇到GSE148192数据集时出现了报错~~ dir ./GSE148192_RAW/GSM4462451/ list.files(dir) #[1] barcodes.tsv.gz features.tsv.gz matrix.mtx.gz counts Read10X(dir) #Error in dimnamesGets(x, value) : # invalid dimnames given for “dgTMatrix” object所以这个GSE ID提供的数据格式可能是有点问题接下来就通过对比GSE166635的GSM5076750(可以正常读入)与GSE148192的GSM4462451(读入失败)探索下这三个文件的格式 1barcodes.tsv.gz GSM5076750的格式如下看出就简单的一列为细胞的barcode标签信息   GSM4462451的格式如下看出区别在于多了行名以及三列细胞注释信息   2features.tsv.gz GSM5076750的格式如下可以看出均为基因的注释信息前两列为基因ID   GSM4462451的格式如下看出区别在于同样多了行名以及额外两列信息   3matrix.mtx.gz GSM5076750的格式如下(前三行为注释信息其中第三行为total number genes、cells、counts)结合上述细胞标签与基因名信息知道了前两列分别为基因和细胞的索引第三列为表达信息。 利用这种方式实现了高效的储存数据(值得借鉴学习)。以第四行为例表示barcodes.tsv.gz文件里第一个细胞的features.tsv.gz第33665个基因的counts数为22。 GSM4462451的格式如下看出区别有两点第一列为细胞索引、第二列为基因索引并且第3列是非整型数据。   经过一番探索将GSM4462451的barcodes.tsv.gz、features.tsv.gz行名删除matrix.mtx.gz的第一列与第二列调换第三列改为整型后read10X()便可以顺利都成功。我认为GSM4462451这几个文件应该是作者自己制作的吐槽一下~~。不过了解了一番这三个文件的格式也是有所收获。 格式二直接提供表达矩阵 这种是最方便的直接创建Seurat即可示例数据GSE144320 scRNA - CreateSeuratObject(counts counts) scRNA格式三h5格式文件 使用Read10X_h5()函数读入表达矩阵在创建Seurat对象示例数据GSE138433 image.png sce - Read10X_h5(filename GSM4107899_LH16.3814_raw_gene_bc_matrices_h5.h5) sce - CreateSeuratObject(counts sce)格式四h5ad格式 需要安装使用SeuratDisk包的两个函数先将后h5ad格式转换为h5seurat格式再使用LoadH5Seurat()函数读取Seurat对象。示例数据集GSE153643 #remotes::install_github(mojaveazure/seurat-disk) library(SeuratDisk) Convert(GSE153643_RAW/GSM4648565_liver_raw_counts.h5ad, h5seurat,overwrite TRUE,assay RNA) scRNA - LoadH5Seurat(GSE153643_RAW/GSM4648565_liver_raw_counts.h5seurat) #注意一下我之前载入时表达矩阵被转置了需要处理一下~以上是我目前了解到的针对不同数据来源创建Seurat对象的几种方式。如遇新的方法会继续补充~~ ©著作权归作者所有,转载或内容合作请联系作者 作者小贝学生信 链接https://www.jianshu.com/p/5b26d7bc37b7 来源简书 著作权归作者所有。商业转载请联系作者获得授权非商业转载请注明出处。
http://www.hkea.cn/news/14498837/

相关文章:

  • 保障房建设网站首页个人网站建站源码
  • 建站的好公司成都网站模板购买
  • jsp网站怎么做云南餐饮网站建设
  • 网站运营专员岗位要求商城网站源码dede
  • 1m带宽做网站怎么样拼多多刷销量网站开发
  • 做网站上传的程序在哪里下载网站开发 php模板
  • 铁路建设监理协会网站网站一屏的尺寸
  • 西樵建网站app制作开发的流程
  • 电影网站app怎么做好听的广告公司名字
  • 建筑工程图纸符号大全图解新网站该如何做网站优化呢
  • thinkphp购物网站开发视频如何做国际网站首页
  • 南昌做网站比较好的公司有哪些只用ip做网站 不备案
  • 网站规划管理系统南京江北新区房价
  • 做平面还有什么素材网站国外做电商网站有哪些方面
  • 天津自贸区建设局网站如何建设一个视频网站
  • 贵州专业网站建设公司哪家好优化网站浏览量怎么看
  • 手机怎么自己做网站天津招聘网人才招聘官网
  • 配音阁在线制作网站网站班级文化建设
  • 建站如何注重内容建设营销公关名词解释
  • 嘉兴建设网站无锡公司建立网站
  • 网站建设一般需要什么软件哪些公司做网站改造
  • 直播网站开发要多久成都网站制作电话
  • 想攻击一个网站怎么做湖南常德地图
  • 怎么样增加网站权重网推地推
  • 阿里云里做网站能上百度首页么app开发哪家好公司
  • 专门做门的网站域名一个注册要多久
  • 建设网站要准备什么17模板网站
  • 做二维码报名网站建站如何挣钱
  • 沈阳seo网站关键词优化优化平台建设公司
  • 哪里有做网站系统的直通车推广怎么收费