前言
多细胞生物是由不同类型的细胞组成开放社会,这个社会中的单个细胞间必须协调它们的行为,为此,细胞建立通讯联络是必需的。细胞通讯是指一个细胞发出的信息通过介质传递到另一个细胞产生相应的反应,通过化学信号分子进行细胞间通讯是动物和植物最普遍采用的通讯方式。配体-受体复合物介导的细胞-细胞通讯对协调发育、分化和炎症等多种生物学过程具有至关重要的作用。
复杂的细胞外反应始于配体与其同源受体的结合和特定细胞信号通路的激活,定位这些配体-受体相互作用是理解细胞行为和对邻近细胞反应的基础。随着单细胞RNA测序的日益流行,RNA测序数据量的指数增长,使得测量多种细胞类型中配体和受体的表达,并系统地解码细胞间通信网络,最终解释组织在稳态中的功能及其在疾病中的变化成为可能。
CellPhoneDB 简介
为了研究不同细胞类型间的细胞通讯网络如何使生理过程得以进行的,英国 Sanger 研究所的 Teichmann 实验室和
Vento-Tormo 实验室联合开发了
CellPhoneDB[1],一个配体、受体及其相互作用的数据库,用于细胞通讯网络的系统分析。该数据库利用了来自
UniProt、Ensembl、PDB、IUPHAR等数据库的信息,共存储了978种蛋白质:501种为分泌蛋白,585种为膜蛋白。这些蛋白质参与1396种相互作用,其中,有474种相互作用涉及分泌蛋白,490种相互作用仅涉及膜蛋白(图1)。
与其他数据库相比,CellPhoneDB的一个主要优点是它考虑了配体和受体的结构组成,准确地描述了异聚复合物。这一点对于许多细胞因子等蛋白质家族来说尤其重要,因为配体-受体相互作用通常涉及多个亚单位,其中受体共享结构亚单位,配体的亲和力由受体亚单位的特定组合决定。在储存在CellPhoneDB中的所有蛋白质中,466种是异聚体。
图1 CellPhoneDB 数据库概述
CellPhoneDB 进行细胞通讯分析原理
CellPhoneDB 集成了一种计算方法,用于从 scRNA-seq
数据中识别与生物学相关的配体-受体相互作用。CellPhoneDB的输入scRNA-seq数据中应包含有counts定量数据和细胞类型注释信息,具有相同细胞类型注释的细胞以细胞状态聚合在一起(图a)。
CellPhoneDB
根据一种细胞类型中受体的表达和另一种细胞类型中配体的表达,预测两种细胞状态之间丰富的配体-受体相互作用。首先,对于细胞群中的每个基因,计算表达该基因的细胞百分比和基因表达平均值。只有表达受体和配体基因的细胞占比超过指定的阈值时(默认为10%),该配体-受体对才会被纳入分析。对于聚合体而言,则选择表达平均值较小的亚基的表达值代表该受体的表达用于后续的统计分析(图b)。
然后在数据集中的所有细胞类型之间执行成对比较。首先,随机排列所有细胞的细胞类型标记,形成新的细胞群(默认随机排列1000次),计算随机排列后细胞群中配体的平均表达水平和与其相互作用的细胞类型中受体的平均表达水平的平均值。通过这种方式,在两种细胞类型之间的每对配对比较中为每个配体-受体对生成一个零分布(图c)。
生成零分布之后,按照原细胞分群计算两种细胞类型间配体-受体对的实际平均值,根据计算平均值等于或高于实际平均值的比例推测该受体-配体对在这两种细胞类型中可能的显著性P值(图d)。
之后,根据两种细胞类型中富集到的显著的配体-受体对的数量,对细胞类型之间高度特异的相互作用进行排序,以便手动筛选出生物学相关的相互作用关系。这样,通过特异性的蛋白复合物,预测了细胞群之间可能的分子相互作用,产生了细胞群间潜在的通讯网络,这些网络可以通过直观的表格和图表进行可视化(图e)。
细胞通讯分析应用
CellPhoneDB 分析细胞通讯网络可以推广到任何包含潜在相互作用细胞群单细胞转录组数据中,并且已在多个单细胞图谱中得以应用。例如:
欧易细胞通讯分析结果展示
图片说明:所示左图为点图,展示了ligand-receptor对在不同细胞类型中的表达强度和特异性;所示右图为热图,展示了不同细胞类型中相关作用的数量。
左图中,行表示具有细胞间通讯关系的ligand-receptor对,列表示发生细胞通讯的细胞类型,圆圈大小表示显著性水平,圆圈越大表示越显著,圆圈颜色越红表示细胞间通讯关系越强;右图中,行和列都表示为细胞,每格表示细胞间的相关作用的数量,颜色越红表示细胞间的相互作用数目越多,即细胞间通讯关系越强。
图片说明:所示为细胞通讯网络图,显示不同的细胞类型之间检测到配体-受体相互作用的数量。
图中分别标记了正向(从信号细胞到目标细胞)和反向信号,同时测量了每个细胞类型内的自分泌信号。网络图的节点按照细胞类型进行颜色编号,边缘按信号和目标细胞之间的相互作用的数量进行标记和缩放。
图片说明:所示为细胞通讯circos图,显示了每种相互作用的方向。其中最外圈表示每个相互作用的配体-受体基因对的详细信息,基因表达由低到高由颜色由黄到红表示;第二圈表示细胞类型,不同的细胞类型用不同的颜色表示;最内圈表示配体-受体基因对的作用关系,实线表示信号强度显著,虚线表示不显著。用户可以选择要在circos图中显示的细胞类型、基因类别和相互作用的数量。
总结
细胞通讯分析以细胞亚群的基因表达量数据为研究对象,获取细胞中的配体及受体信息,获得细胞间的信号通讯网络,在阐明生物学过程中细胞间通讯的复杂性、多样性和动态性方面有重要意义。
参考文献
[1] Efremova, M., Vento-Tormo, M., Teichmann, S.A. et al.
CellPhoneDB: inferring cell–cell communication from combined expression
of multi-subunit ligand–receptor complexes. Nat Protoc (2020).
[2] Braga, F. A. V. et al. A cellular census of human lungs
identifies novel cell states in health and in asthma.Nat. Med. 25,
1153–1163 (2019).[3] Stewart, B. J. et al. Spatiotemporal immune
zonation of the human kidney. Science 365, 1461–1466 (2019).[4] Popescu,
D.-M. et al. Decoding the development of the blood and immune systems
during human fetal liver haematopoiesis. Nature 574, 365–371 (2019).[5]
Davidson, S. et al. Single-cell RNA sequencing reveals a dynamic stromal
niche within the evolving tumour microenvironment. Preprint at bioRxiv:
https://doi.org/10.1101/467225 (2018).
猜你想看
END
本文系欧易生物原创