scRNA-TCR

T细胞和TCR的基本认识

T细胞

T细胞（T lymphocytes）是淋巴细胞的一种，在适应性免疫应答中扮演着至关重要的角色。它们起源于骨髓，在胸腺（Thymus，这也是T细胞名称中"T"的来源）中发育成熟。

主要亚群：

辅助性T细胞 (Helper T cells)：通常表达CD4分子。它们是免疫应答的“指挥官”，通过分泌细胞因子激活和调控B细胞、巨噬细胞、细胞毒性T细胞等其他免疫细胞的功能。
细胞毒性T细胞 (Cytotoxic T cells, CTLs)：通常表达CD8分子。它们是免疫系统的“杀手”，能够特异性识别并直接杀死被病毒感染的细胞、肿瘤细胞或外来移植细胞。
调节性T细胞 (Regulatory T cells,Treg)：主要功能是抑制或下调免疫应答，维持免疫耐受，防止自身免疫病的发生。

TCR介绍

T淋巴细胞（T cells）是负责适应性免疫应答的主要细胞，其抗原识别功能主要依赖于T细胞受体（T cell receptor, TCR）

组成：
TCR是由两条不同的肽链构成的异二聚体，主要是α链和β链。TCR由基因组DNA上几个不同区域转录翻译而来，每条链都包含一个可变区（V region）和一个恒定区（C region）。这个可变区是TCR识别特异性抗原的关键，它能与主要组织相容性复合体（MHC）分子呈递的抗原肽结合。其中的V区，D区，J区会发生重排产生不同的受体链，也就是产生多样性的T细细胞受体，以应对不同的抗原类型，因此分析TCR多样性主要就是分析V(D)J区片段的序列特征。

多样性的产生：
免疫系统需要应对无数种潜在的抗原，因此TCR必须具有极高的多样性。这种多样性主要通过编码TCR链的基因（TRAV, TRAJ, TRBV, TRBD, TRBJ等基因片段）在T细胞发育过程中的V(D)J基因重排（somatic recombination）实现。这个过程是随机的，理论上可以产生天文数字般数量的不同TCR，从而形成一个巨大的TCR库（TCR repertoire），使得T细胞能够识别各种不同的抗原。

单细胞TCR分析

单细胞TCR分析 (Single-cell TCR analysis)，顾名思义，就是将在单个T细胞水平上对其T细胞受体（TCR）序列进行分析的技术。
这项技术通常会结合单细胞RNA测序 (scRNA-seq) 来实现。这意味着不仅能够从同一个T细胞中获取其独特的TCR序列信息（即α链和β链的序列，这决定了它的抗原特异性），还能同时了解到这个细胞的基因表达谱（即哪些基因在这个细胞中是活跃的，活跃程度如何）。

传统TCR和单细胞TCR

如果将T细胞比喻为士兵，那么TCR就是雷达。每个T细胞的TCR都几乎是独一无二的，就像我们每个人的指纹一样。这种独特性使得TCR能够精确地识别特定的“敌人”信号（我们称之为抗原）。当TCR成功“锁定”敌人后，T细胞就会被激活，然后开始执行清除任务。

精准匹配“雷达”型号与“士兵”类型和状态：

传统的TCR测序（群体TCR测序）只能告诉我们军队里有哪些型号的“雷达”（TCR序列），以及每种型号的数量有多少。但我们不知道拥有特定型号雷达的“士兵”具体是哪种兵种（比如是辅助T细胞还是细胞毒性T细胞？），也不知道这个士兵是处于“战斗状态”、“休整状态”还是“筋疲力尽状态”。
单细胞TCR分析则能完美解决这个问题。它可以告诉我们，这个携带特定TCR的T细胞，它具体表达了哪些基因。通过基因表达谱，我们就能推断出这个T细胞的功能状态（例如，它是效应T细胞、记忆T细胞还是耗竭T细胞）、它分泌了哪些细胞因子、它表达了哪些重要的功能蛋白等等。这就实现了TCR的克隆型（clonotype）与其表型（phenotype）和功能状态的直接关联。

深入理解免疫应答的复杂性：
- 在疾病（如癌症、感染性疾病、自身免疫病）发生或接受治疗（如免疫治疗）的过程中，T细胞的反应是高度动态和异质性的。单细胞TCR分析能够帮助我们追踪特定的T细胞克隆（即拥有相同TCR的T细胞群体）是如何扩增、分化以及改变其功能状态的。
- 例如，在肿瘤免疫治疗中，我们可以用它来找出那些能够有效识别并攻击肿瘤细胞的T细胞克隆，并了解它们为什么有效，或者为什么有些T细胞克隆会失效。
发现新的治疗靶点和工具：
- 通过识别在疾病中发挥关键作用（无论是好的还是坏的）的T细胞克隆及其TCR，可以开发新的免疫治疗策略，比如设计TCR-T细胞疗法（一种将特定TCR基因导入患者T细胞的癌症疗法）。

实验流程

目前主流的单细胞TCR分析技术，很多都是基于微液滴技术 (droplet-based microfluidics)，比如广受欢迎的10x Genomics Chromium系统。它可以做到：

“单间”分配——单个细胞的分离与包裹：
- 首先，将T细胞悬液、特殊的酶（用于后续反应）以及带有细胞条形码 (cell barcode) 和UMI (Unique Molecular Identifier，独特分子标识符) 的凝胶珠 (gel beads) 一起通过一个微流控芯片。
- 在这个芯片里，成千上万个微小的油滴会被生成，每个油滴就像一个小小的“反应室”或“单间”，理想情况下，每个油滴里只包裹一个T细胞和一个凝胶珠。这个凝胶珠是关键，它上面携带着独特的“身份证”——细胞条形码。来自同一个油滴（也就是同一个细胞）的所有分子，都会被标记上这个相同的细胞条形码。
“开闸放水”——细胞裂解与RNA捕获：
- 在油滴中，细胞被裂解，释放出细胞内的所有RNA分子，包括编码TCR链的mRNA和细胞内其他所有基因的mRNA。
- 凝胶珠会溶解，释放出它携带的引物。这些引物通常含有寡核苷酸dT (oligo-dT) 片段，可以特异性地捕获带有poly(A)尾的mRNA（绝大多数mRNA都有这个尾巴）。同时，这些引物上还连着之前提到的细胞条形码和UMI。
“复制并打上标记”——反转录与条形码整合：
- 在油滴内，捕获到的RNA被反转录成更稳定的互补DNA (cDNA)。在这个过程中，每个新合成的cDNA分子的一端就会带上这个油滴（也就是这个细胞）特有的细胞条形码，以及一个UMI。UMI的作用是用来区分哪些cDNA分子是真正来源于不同的RNA分子，哪些仅仅是PCR扩增的产物，这样可以更精确地定量基因表达。
“兵分两路”——TCR序列特异性扩增与全转录组扩增：
- 油滴被打破后，所有细胞的cDNA（现在都带着各自来源细胞的条形码）被收集起来。
- 接下来，通常会有针对性的步骤：
  - TCR序列扩增：使用专门针对TCR基因（特别是α链和β链）保守区域设计的引物，对TCR的cDNA进行PCR扩增。这样就能富集到我们感兴趣的TCR序列片段，特别是包含可变区的部分。
  - 全转录组扩增：与此同时（或者从同一份cDNA样本中分出一部分），对所有的cDNA（代表了细胞内所有表达的基因）进行扩增，为后续的基因表达谱分析做准备。
“解读天书”——高通量测序：
- 扩增后的TCR cDNA片段和全转录组cDNA片段分别（或混合后通过生物信息学方法区分）构建成测序文库，然后进行高通量测序（Next-Generation Sequencing, NGS）。
“对号入座”——生物信息学分析：
- 这是最关键的一步！测序产生海量的数据。生物信息学软件会首先根据细胞条形码将所有的测序读长（reads）分配回它们各自来源的单个细胞。
- 对于分配到某个特定细胞的TCR相关读长，软件会将它们拼接起来，重构出该细胞完整的TCR α链和β链的序列，从而确定这个细胞的TCR克隆型。
- 对于分配到同一个细胞的其他读长（来自全转录组），软件会将它们比对到参考基因组上，从而计算出该细胞中每个基因的表达量。
- 最终，因为TCR序列信息和基因表达信息共享了来自同一个细胞的同一个细胞条形码，就能确切地知道：拥有这种特定TCR序列的T细胞，它同时表达了哪些基因，表达量是多少。

这里展示一个TCR在癌症免疫治疗中研究实例