Placeholder image

MapMan/通路图

contact: czheluo@gmail.com

MapMan4:适用于多组学数据分析的精细化蛋白质分类和注释框架


通路图 MapMan 可视化分析
July 2024
Placeholder image

Analysis of the expression levels of repetitive elements

contact: czheluo@gmail.com

大多数RNA-seq数据分析软件包的设计并不能处理将短测序读长正确分配给基因组高度重复区域所涉及的复杂性。这些区域通常被转座元件 (TE) 占据,这些元件占真核生物基因组的 20% 到 80%。它们可以贡献转录组学和基因组序列读取的很大一部分,但在大多数分析中通常被忽略。TEtranscripts用于在差异表达分析中包括基因和TE相关的模糊映射reads。在合成数据和qPCR/NanoString验证的已发表数据集中,我们的方法显示出比其他已发表的表达分析方法更高的TE转录本的回收率。


repetitive elements RNAseq
July 2024
Placeholder image

BTM分析

contact: czheluo@gmail.com

许多疫苗通过抗体诱导保护性免疫。系统生物学方法已被用于确定可用于预测人类疫苗诱导免疫的特征,但是否存在可用于预测对任何疫苗的抗体反应的“通用特征”尚不清楚。在这里,我们在已发表的黄热病病毒和流感病毒疫苗研究的更广泛背景下,对健康成年人对多糖和脑膜炎球菌结合疫苗的免疫反应进行了系统分析。为了实现这一目标,我们对公开可用的人类血液转录组和特定生物学背景下的系统规模数据库进行了大规模网络整合,并推导出了一组血液中的转录模块。这些模块揭示了对不同类别疫苗的抗体反应的不同转录特征,这为原发性病毒、蛋白质召回和抗多糖反应提供了关键见解。我们的研究结果阐明了在人类中协调疫苗免疫的早期转录程序,并展示了整合网络建模的力量。


BTM分析 免疫
July 2024
Placeholder image

GO/KEGG网络图

contact: czheluo@gmail.com

Enrichment Map 是一款用于功能富集可视化的 Cytoscape 应用程序。必须使用任何可用方法在富集映射之外生成富集结果。基因集,如通路和基因本体术语,被组织成一个网络(即“富集图”)。通过这种方式,相互重叠的基因集聚集在一起,使解释更容易。Enrichment Map 还允许在同一映射中比较两个不同的富集结果。


GO KEGG 网络图
July 2024
Placeholder image

KEGG 通路可视化

contact: czheluo@gmail.com

Pathview 为路径生成原生 KEGG 视图(PNG 格式)和 Graphviz 视图(PDF 格式)。KEGG视图保留了有关通路,空间和时间信息,组织/细胞类型,输入,输出和连接的所有元数据。这对于人类阅读和解释通路生物学很重要。Graphviz 视图可以更好地控制节点和边缘属性,更好地查看路径拓扑,更好地理解路径分析统计信息。目前仅实施了 KEGG 途径。希望将来能够支持来自 Reactome、NCI 和其他数据库的路径。请注意,自 2011 年 5 月以来,KEGG 需要订阅才能进行 FTP 访问。但是,Pathview 通过 html 访问下载单个路径图和数据文件,这些访问是免费提供的(用于学术和非商业用途)。


KEGG 通路图
July 2024
Placeholder image

siRNA分析(24nt-siRNA)

contact: czheluo@gmail.com

小 RNA 测序允许对产生调节性小 RNA 的基因进行全基因组发现、分类和定量。已经描述了许多工具,用于从小 RNA-seq 数据中注释和定量 microRNA 位点 (MIRNA)。然而,在许多生物体和组织类型中,MIRNA基因仅占所有产生RNA的小基因的一小部分。ShortStack 是一个独立的应用程序,可分析参考对齐的小 RNA-seq 数据,并对推断的小 RNA 基因进行全面的从头注释和定量。ShortStack 的输出报告了与小 RNA 基因注释直接相关的多个参数,包括 RNA 大小分布、重复性、链性、发夹关联、MIRNA 注释和相位。在这项研究中,ShortStack 被证明可以对来自四种植物(拟南芥、番茄、水稻和玉米)和三种动物(果蝇、小鼠和人类)的各种小 RNA 基因进行准确的注释和有用的描述。ShortStack 使用适度的计算资源有效地处理非常大的小型 RNA-seq 数据集,其性能与之前描述的工具相比具有优势。ShortStack 对 MIRNA 位点的注释在植物和动物中都具有高度特异性。ShortStack 在 GNU 通用公共许可证下免费提供。


siRNA分析 miRNA
July 2024
Placeholder image

Time-ordered Gene Coexpression Network (TO-GCN)

contact: czheluo@gmail.com

基于三维(基因表达、条件和时间)数据的时间顺序基因共表达网络(TO-GCN)构建流程


基因表达 TO-GCN
July 2024
Placeholder image

三个差异组比较分析方法

contact: czheluo@gmail.com

volcano3D 软件包提供了一种用于分析三类高维数据的工具。它使探索三个组之间差异表达的基因成为可能。其主要目的是用于在三维火山图或三向极坐标图中可视化差异表达的基因。可以使用 plotly 将这些绘图转换为交互式可视化。3 向极坐标图和 3d 火山图可应用于已测量多个属性并在三个类别中比较其相对水平的任何数据。


数据可视化 差异比较分析
July 2024
Placeholder image

不同形状热图

contact: czheluo@gmail.com

热图以不同的shape来展示不同类型的数值的结果


不同形状热图 点热图
July 2024
Placeholder image

不同物种同源gene的差异分析

contact: czheluo@gmail.com

SCBN该软件包为不同物种之间的RNA-seq数据提供了一种统计归一化方法和差异表达分析。它考虑了物种间不同的基因长度和未定位的基因,从假设检验的角度提出了问题,并寻求一个最优比例因子,使经验型误差和名义I型误差之间的偏差最小化。


同源gene的差异分析 差异分析
July 2024
Placeholder image

内含子保持力分析

contact: czheluo@gmail.com

iREAD(内含子保留分析和检测器),这是一种从高通量 RNA-seq 数据中检测全基因组 IR 事件的工具。iREAD 的命令行界面是用 Python 实现的。iREAD 将表示转录组的 BAM 文件和包含基因组内含子坐标的文本文件作为输入。然后,它 1) 计算与内含子区域重叠的所有读取,2) 通过分析读取的特征(如深度和分布模式)来检测 IR 事件,以及 3) 将保留的内含子列表输出到制表符分隔的文本文件中。与 IRFinder 的输出相比,iREAD 在检测 IR 方面提供了显着的附加值,在所有测试的数据集上都具有更高的 AUC。两种方法在不同方案中都显示出低假阳性率和高假阴性率,表明一起使用通常是有益的。


内含子 保持力分析
July 2024
Placeholder image

分析外显子差异表达

contact: czheluo@gmail.com

DEXSeq该软件包的重点是使用具有不同实验设计的样品之间的RNA-seq外显子计数来寻找不同的外显子使用。它提供的功能允许用户基于一个模型进行必要的统计检验,该模型使用负二项分布来估计生物重复和广义线性模型之间的方差以进行测试。该软件包还提供用于可视化和探索结果的功能。


外显子差异表达 外显子
July 2024
Placeholder image

基因组共线性分析

contact: czheluo@gmail.com

MCScan 是一种算法,能够扫描多个基因组或亚基因组,以识别假定的同源染色体区域,并使用基因作为锚点对齐这些区域。MCScanX 工具包实施了经过调整的 MCScan 算法,用于检测同向和共线性,该算法通过整合 14 个实用程序来扩展原始软件,用于结果可视化和其他下游分析。MCScanX在几种测序植物基因组和基因家族中的应用作为示例进行了展示。MCScanX可用于有效分析染色体结构变化,并揭示可能有助于谱系和分类群适应的基因家族扩展的历史。各种基因复制模式的综合视图可以补充特定家族中的传统基因树分析。MCScanX的源代码和文档可在 http://chibba.pgml.uga.edu/mcscan2/ 免费获取。


基因组 共线性
July 2024
Placeholder image

复杂Venn

contact: czheluo@gmail.com

nVenn: 用于渲染广义 n 维维恩图的所有区域,同时保持每个区域的面积与所包含的元素数量大致成正比。此外,欧拉图中缺失的区域会导致表示简化。该算法生成一个 n 维维恩图,并在每个区域中插入给定区域的圆圈。然后,通过动态的自校正模拟重新排列图表,其中每个设置的边界都会收缩,直到它接触到内部的圆圈。维恩图和欧拉图广泛用于实验和数据集之间关系的可视化。但是,使用现有工具表示三个以上的数据集,同时保持每个区域的比例仍然不可行。


VENN 数据可视化
July 2024
Placeholder image

多性状WGCNA分析

contact: czheluo@gmail.com

基因共表达网络代表了具有共同生物学功能的基因模块,并已被广泛用于对基因表达数据中的生物学途径进行建模。可以使用加权基因共表达网络分析(WGCNA)构建和鉴定与特定性状相关的共表达网络,这对于研究疾病中的转录特征特别有用。WGCNA网络通常使用疾病和野生型样本构建,因此可以识别与疾病相关的分子通路。然而,在疾病背景下跨时空条件下研究这种共表达网络将是有利的,但目前还没有用于此类分析的综合软件实现。


WGCNA 多性状
July 2024
Placeholder image

多组WGCNA展示

contact: czheluo@gmail.com

关联网络越来越多地用于生物信息学应用。例如,加权基因共表达网络分析是一种系统生物学方法,用于描述微阵列样本中基因之间的相关性模式。加权相关网络分析(WGCNA)可用于查找高度相关基因的簇(模块),使用模块特征基因或模块内中心基因总结此类簇,用于将模块彼此关联以及与外部样本性状关联(使用特征基因网络方法),以及用于计算模块隶属度。相关性网络促进了基于网络的基因筛选方法,可用于识别候选生物标志物或治疗靶点。


多组WGCNA WGCNA
July 2024
Placeholder image

整合差异表达(DE)分析和基因集富集(GSE)分析

contact: czheluo@gmail.com

iDEA,该方法通过整合统计建模为 scRNAseq 研究提供强大的 DE 和 GSE 分析。我们的方法建立在分层贝叶斯模型的基础上,用于DE和GSE分析的联合建模。它仅使用汇总统计作为输入,允许通过补充和配对各种现有的 DE 方法进行有效的数据建模。它依赖于高效的期望最大化算法,该算法具有内部马尔可夫链蒙特卡洛步长,可实现可扩展推理。通过集成 DE 和 GSE 分析,iDEA 可以提高 DE 分析的能力和一致性,以及与常见现有方法相比,GSE 分析的准确性。


差异表达 基因集富集 GSE
July 2024
Placeholder image

简单及复杂圈图可视化

contact: czheluo@gmail.com

Circos 是一个用于可视化数据和信息的软件包。它以圆形布局可视化数据——这使得 Circos 成为探索对象或位置之间关系的理想选择。圆形布局具有优势还有其他原因,尤其是它具有吸引力。R中Circos 是一个先驱工具,广泛用于在 Perl 中实现的循环布局表示。它极大地增强了科学结果的可视化(特别是在基因组学领域)。因此,具有圆形布局的地块通常被命名为“circos plot”。这里 circlize 包旨在在 R 中实现 Circos。在 R 中实现的一个重要优点是 R 是一个理想的环境,可在数据分析和数据可视化之间提供无缝连接。circlize 不是为 Circos 生成配置文件的前端包装器,而是使用 R 优雅的统计和图形引擎完全以 R 风格编码。我们的目标是保持 Circos 的灵活性和可配置性,但也使该包更易于使用,并对其进行增强以支持更多类型的图形。


圈图 数据可视化
July 2024
Placeholder image

细胞富集分析

contact: czheluo@gmail.com

WebCSEA(Web-based Cell-type Specific Enrichment Analysis of Genes)在系统的组织-细胞类型表达特征集合中提供了一个基因集查询。对于每个查询,我们将生成细胞类型特异性富集分析 (CSEA) 原始 p 值、基于排列的方法组合 p 值、查询的基因列表和组织-细胞类型签名之间共享的基因、交互式显示 1,355 种人类组织-细胞类型 (TC) 的细胞类型特异性的热图、人体器官系统和排名靠前的组织和一般细胞类型的细胞类型特异性摘要。用户还可以过滤、优先处理和比较来自一个或多个组织的细胞类型的 CSEA 结果。用户可以进一步下载CSEA的所有结果并将其可视化。总体而言,WebCSEA提供了主要人类TCs的综合图谱,并使用基于排列的方法来克服TCs之间不同长度的特征基因以及查询基因的长度引起的偏差。


细胞富集分析 单细胞
July 2024
Placeholder image

表格热图

contact: czheluo@gmail.com

{funkyheatmap} 允许为基准数据帧生成类似热图的可视化。时髦的热图可以通过提供列和行的注释进行微调,这允许分配多个调色板或几何图形或将行和列按类别分组在一起。


热图 表格热图
July 2024
Placeholder image

转座元件分析

contact: czheluo@gmail.com

RepeatMasker 是一个程序,用于筛选 DNA 序列中的穿插重复序列和低复杂性 DNA 序列。该程序的输出是对查询序列中存在的重复项的详细注释,以及查询序列的修改版本,其中所有带注释的重复都被屏蔽了(默认:由 Ns 替换)。目前,超过56%的人类基因组序列被该程序识别和屏蔽。RepeatMasker 中的序列比较由几个流行的搜索引擎之一执行,包括 nhmmer、cross_match、ABBlast/WUBlast、RMBlast 和 Decypher。RepeatMasker 使用精选的重复库,目前支持 Dfam(源自 Repbase 序列的配置文件 HMM 库)和 Repbase,这是遗传信息研究所的一项服务。


转座子 元件分析
July 2024
Placeholder image

转录因子结合域富集分析

contact: czheluo@gmail.com

RcisTarget 可识别基因列表中过度表达的转录因子结合基序 (TFBS)。在第一步中,RcisTarget 选择在基因集中基因的转录起始位点 (TSS) 环境中明显过度表达的 DNA 基序。这是通过使用一个数据库来实现的,该数据库包含每个基序的全基因组跨物种排名。然后注释到 TF 的基序和具有高归一化富集分数 (NES) 的基序将被保留。最后,对于每个基序和基因集,RcisTarget预测候选靶基因(即基因集中排名在前沿之上的基因)。


转录因子 结合域 富集分析
July 2024
Placeholder image

选择性多聚腺苷酸化 (APA)

contact: czheluo@gmail.com

选择性多聚腺苷酸化 (APA) 影响大多数哺乳动物基因。由于无法使用传统的RNA-seq可靠地分析APA的全基因组研究,APA的全基因组研究受到了阻碍。我们描述了“APA量化”(QAPA),这是一种从常规RNA-seq数据推断APA的方法。QAPA 比其他方法更快、更灵敏。QAPA的应用揭示了神经发生过程中离散的、时间协调的APA程序,并且由选择性剪接调控的基因与受APA调控的基因之间几乎没有重叠。对这些数据进行建模可以发现 APA 序列代码。因此,QAPA能够使用常规RNA-seq发现和表征受监管的APA程序。


选择性多聚腺苷酸化 APA
July 2024