灵敏度和重现性优于Smart-seq2
Smart-SEQ2协议(Picelliet al。 2013)和Takara Bio的SMART-Seq技术被科学界广泛使用,在单细胞水平上生成转录组的深入特性。为了比较新的SMART-Seq Single Cell Kit (SSsc)和Smart-seq2协议的性能,我们根据每种化学协议处理来自淋巴母细胞系GM12878的单个细胞(图2)。
我们观察到两种化学物质的读入分布是不同的。Smart-seq2化学中映射到线粒体基因组的reads数量要高得多(图2,面板a),导致用于基因鉴定的reads数量更少。我们也观察到的基因数量增加15%的细胞处理SSsc Smart-seq2相比(图2中,面板B)。SSsc的高灵敏度的方法是与更大的跨细胞,再现性的更高的斯皮尔曼相关SSsc-processed细胞内(图2中,与Smart-seq2相比,Smart-seq2的辍学率更低(图2,面板D)。
图2。SMART-Seq Single Cell Kit优于Smart-seq2协议。 来自淋巴母细胞系GM12878的单个细胞被SSsc(18个细胞)或Smart-seq2协议(20个细胞;Picelliet al。 2014),使用19个PCR周期。如上述方法所述,生成RNA-seq库并分析序列(在将所有样本归一化到175万个配对端读取后)。面板。 两种化学试剂的读值分布不同,使用Smart-seq2增加了线粒体读值,使用SSsc增加了外显子读值。面板B. .Boxplots,该盒子表示每种方法的框号(I.,第25和第75个四分位数);晶须距离中值1.5 x IQR,代表数据的极值。对用SSSC处理的细胞(中位数= 9,980)而检测更多基因与智能SEQ2(中位数= 8,732)。面板C。 箱线图的斯皮尔曼相关结果为每个方法绘制所有细胞之间,与相同的位差面板b这些情节显示细胞之间存在较高的相关性处理SSsc(值= 0.82),这表明再现性大于Smart-seq2方法(值= 0.69)。面板D。 通过用TPM> 1检测到的基因的较低差速度,还证明了SSSC的较高再现性。
与SSv4相比,SSv4对单个细胞具有更高的敏感性和重现性
SSv4试剂盒是目前最敏感的单细胞RNA-seq方法,许多人认为它是基于板基的全长scRNA-seq的金标准(Hodge)et al。 2019;Ibrayevaet al。 2019;和其他参考资料 ).通过多个实验,我们能够证明新的SSSC套件具有比SSV4套件更优越的敏感性和再现性的数据。
在第一个实验中,我们使用了2 pg的高质量对照RNA来比较两个试剂盒(表1)。我们观察到SSsc试剂盒的cDNA产量显著更高。当观察三个技术重复时,SSsc试剂盒平均总共生成了13.1 ng的cDNA,而SSv4试剂盒生成了6.7 ng,增加了两倍。经过测序和数据分析,我们发现SSsc试剂盒比SSv4多鉴定了约15%的基因。此外,SSsc具有良好的重现性,这可以从Pearson和Spearman相关性的增加中得到证明(图3)。这些散点图表明,SSsc能够检测到额外的低水平表达的基因。
比较SMART-Seq v4试剂盒和SMART-Seq Single Cell kit的测序指标
RNA源
2 pg UHR总RNA
互补脱氧核糖核酸合成方法
SSv4
SSsc
复制
一个
B
C
一个
B
C
互补脱氧核糖核酸收益率(ng)
7.8
6.9
5.5
14.8
14.9
9.6
TPM基因数>1
7,412
7522年
7487年
8774年
8,614
8406年
具有TPM基因>的基因数为0.1
8660年
8,868
9240年
10319年
10276年
10285年
平均培生/枪兵
0.95/0.59
0.97/0.63
已映射读的比例(%):
基因组
92.7
92.5
92.5
80.1.
80.9
80.6
外显子
79.3
78.7
76.6
63.4
64.1
62
内含子
10.5
10.9
12.5
13.0
12.8
14.0
基因间区
2.9
3.0
3.4
3.7
4.0
4.6
核糖体rna
0.8
0.7
0.6
6.1
6.0
4.3
线粒体
3.5
3.6
3.9
9.3
8.4
10.2
表1。使用SMART-Seq单细胞试剂盒增加灵敏度。 使用SMART-Seq v4试剂盒(SSv4)或SMART-Seq Single Cell kit (SSsc)从2 pg的通用人类参考(UHR)总RNA中生成复制cDNA文库;所有文库均经19个PCR循环处理。如上述方法所述,生成RNA-seq库并分析序列(将所有样本归一化到160万个配对端读后)。SSsc比SSv4多鉴定了约15%的基因。
图3。增加了SMART-Seq单细胞试剂盒的重现性。 用散点图分析由2 pg的UHR总RNA(表I)构建的文库,以显示技术重复之间的重现性(如图所示为所有基因的TPM值和一个日志10 + 1)。SSv4 (面板A. )产生了高重复性的定量,但SSsc (面板B. )如皮尔逊和斯皮尔曼相关性增加所示,产生了优异的再现性。此外,SSsc更适合检测低表达基因。
在第二个实验中,使用FACS分类细胞进一步评估SSsc试剂盒的性能。用SSv4和SSsc处理来自淋巴母细胞系GM22601(图4)的单个细胞或来自健康供体的PBMC群体(图5)。如第一次使用UHR总RNA的实验所示,SSsc试剂盒的cDNA产量显著提高(图4,面板A;未显示PBMC的数据)。我们继续观察SSsc试剂盒在两种细胞类型产生的测序数据中的改进性能。首先,我们观察到两种试剂盒之间的读取分布是可比较的(图4,面板B和图5,面板A)。其次,我们发现我们可以用SSsc试剂盒鉴定更多的基因:GM22601细胞系增加约50%(图4,图C)和PBMC群体增加约60%(图5,图B)。SSsc试剂盒灵敏度的显著提高在广泛的测序深度范围内都是正确的(图5,面板B)。对于GM22601系相对同质的细胞群体,SSsc试剂盒在分析的12个细胞中所有基因的表达水平方面更具可重复性,如更高的Spearman相关性(图4,面板D)所示,这与使用UHR总RNA获得的数据一致(表1)。
图4。提高了低RNA含量的单细胞的性能。 12个淋巴母细胞系GM22601单细胞经SSv4或SSsc处理,PCR循环19次。如上述方法所述,生成RNA-seq库并分析序列(在将所有样本归一化到125万个配对端读取后)。对于本图中的所有箱线图,框表示四分位区间(IQR),即第25和75个四分位;晶须从中位值中的1.5 x IQR,表示数据的极端情况。面板。 SSsc生成的cDNA产量(中位数= 28.8 ng)显著高于SSv4生成的cDNA产量(中位数= 6.6 ng)。面板B。 两种化学物质的阅读分布相当相似。面板C。 SSsc处理的细胞中检测到的基因比SSv4处理的细胞多50%(中位数为9980)。面板D。 相关箱线图显示,使用SSsc处理的所有细胞之间具有更高的组内Spearman相关性,表明SSsc方法(中位数=0.68)相对于SSv4(中位数=0.51)具有更高的再现性。
图5。改进了初级样本的性能。 来自健康供体的pbmc用SSv4或SSsc试剂盒处理(每个试剂盒约50个单个细胞)。RNA-seq文库按照上述方法生成。面板。 两个化学物质之间的读分布相似。面板B。 在用SSSC处理的细胞中检测到约60%的基因,无论用于分析的读数数量如何。
SSsc优于NEBEXT单小区协议
和SSsc一样,NEBNext Single Cell/Low Input Kit (NEBNext)是一种从单个细胞生成RNA-seq库的方法。这两种技术都是基于poly-A靶向引物的RT、切换模板生成cDNA文库和PCR扩增获得高文库。SSsc和NEBNext都旨在从简单、用户友好的工作流程中生成公正和统一的库。
NEBNext作为一种从单细胞中提供高质量测序数据的方法被推广,从而导致低丰度转录本的不匹配检测。此外,它还被宣传为一种鲁棒性强、灵敏度高的方法。
为了在SSsc和NEBNext之间测试这些性能参数,我们根据制造商的说明使用每个试剂盒进行了单细胞分析。
图6。SMART Seq单电池套件的性能优于NEBNext协议。 根据制造商的指示,使用SSSC或NEBNEXT单个小区/低输入RNA库预备套件来从T细胞中从T细胞中制备图书馆。面板。 在这些箱形图中,盒子表示四分位区间(IQR),即第25和75个四分位;晶须距离中值1.5 x IQR,代表数据的极值。以TPM >0.1标记的SSsc基因数量(中位数为3,591)比NEBNext(中位数为2,665)高(~40%)。面板B。 两个化学物质之间的读分布不同,读取映射到SSSC的外显子区域。面板C。 为NEBNext协议生成库所需的高周期数意味着NEB(红色)的阴性对照与单细胞库(浅蓝色)群集强烈,而SSsc(紫色)的阴性对照与单细胞库(深蓝色)截然不同。
虽然NEBNext的cDNA产量较高,但这并没有转化为更多的已鉴定基因。即使cDNA产量较低,SSsc也鉴定出了40%以上的基因,从而可以更深入地了解样本。读取分布表明SSsc具有较高的外显子映射读取百分比和较低的内含子读取百分比。正如在SSsc数据集中一致看到的那样,SSsc的rRNA图谱的百分比确实略高,但这是由于SSsc的敏感性增加,从而允许优化从单个细胞捕获信息。值得注意的是,尽管rRNA略高,但SSsc的已鉴定基因数量仍要多得多。在图6面板C中,我们继续比较两种方法的灵敏度。对于SSsc,单细胞结果(深蓝色)与阴性对照(紫色)之间存在明显差异,这代表了固有的实验噪声,提供了所见数据确实来自样本的信心。然而,对于NEB方案,由阴性对照(红色)确定的背景噪声与实际单细胞样本(浅蓝色)重叠。这种聚类降低了NEB结果的可信度,因为实验噪声无法与单细胞测序结果区分开来。