FusionMap中怎么检测融合基因

FusionMap中怎么检测融合基因，很多新手对此不是很清楚，为了帮助大家解决这个难题，下面小编将为大家详细讲解，有这方面需求的人可以来学习下，希望你能有所收获。

10年积累的网站设计、网站建设经验，可以快速应对客户对网站的新想法和需求。提供各种问题对应的解决方案。让选择我们的客户得到更好、更有力的网络服务。我虽然不认识你，你也不认识我。但先网站制作后付款的网站建设流程，更有乐亭免费网站建设让你可以放心的选择与我们合作。

通过两种方式来检测融合基因：

对于没有比对上基因组的序列，即unmapped reads, 通过识别Fusion junction-spanning reads 来识别融合基因；这部分reads覆盖到了融合基因的连接点，在连接点两侧的序列分别比对到构成融合的多个基因上
对于比对上基因组的reads, 通过识别 Inter-transcript read pairs来识别融合基因，这部分reads虽然没有直接覆盖连接点，但是其R1端和R2端分别比对到不同的基因

示意图如下

FusionMap中怎么检测融合基因

在fusionmap中，假定融合基因由2个基因组成，对于没能比对上基因组的Fusion Junction-spanning reads, 又分为两类：设定一个比对长度的阈值，如果这条reads在两个基因中比对上的长度都大于阈值，就属于seed reads; 如果在任意一个基因中比对上的长度小于阈值，就属于rescued reads,示意图如下

FusionMap中怎么检测融合基因

Fusionmap会输出如下所示的表格

FusionMap中怎么检测融合基因

关键的几列信息解释如下

FusionID : 识别到的融合基因的ID，前缀都为FUS,第一个数字为融合基因的起始位置，第二个数字为融合基因的终止位置，这里的位置实际上都是累积位置，把所有的染色体按照字母顺序首位相连构成一条参照的染色体，这样每个基因在这条染色体上都有一个位置，所以这里的位置都是累积位置，可以发现，终止位置的数字总是比起始位置大；括号里的内容是形成融合基因的两个基因的链的方向
Strand : 形成融合基因的两个基因的链的方向，包括++， —， +-, -+ 四种组合
Position1: 检测到的融合基因的起始位置
Chromosome1 : gene1 所在的染色体
Chromsome2: gene2 所在的染色体
Position2: 检测到的融合基因的终止位置
knowGene1 : gene1 的symbol
KnowTranscriptStrand: gene1的转录本的方向，有多个转录本，就有多个方向
KnowGene2: gene2 的symbol
KnowTranscripitStrand : gene2的转录本的方向，有多个转录本，就有多个方向
FusionGene: 融合基因的名字，gene1->gene2

除此之外，还包含以下几种比较难理解的信息

1. 支持该融合基因的reads数目

包含以下3种

accepted_hits.UniqueCuttingPositionCount
accepted_hits.SeedCount
accepted_hits.RescuedCount

SeedCount和RescuedCount代表的就是上文中提到了seed reads和rescued reads的个数，二者相加就是Fusion Junciton-spanning reads数目，除此之外，还有Inter-transcript reads，这两种reads的总数就是所有支持该融合基因的reads数目，reads数肯定是越多越好，但是由于建库过程中存在PCR重复，所以为了提供更加可信的reads数信息，需要去冗余，保证PCR reads不重复计算，去冗余之后，就得到了UniqueCuttingPositionCount。示意图如下

FusionMap中怎么检测融合基因

黑色的线条是真实存在的融合基因形成的转录本，灰色的fragment是随机打断该转录本生成的序列，红色为融合基因对应的breakpoint,图中一共4条reads, 但是中间的2条reads 位置相同，可能是PCR 重复，所以实际上只能说有3条reads 支持该融合基因；fusinomap 在统计reads 数目的时候，实际上只看在第二个基因中的终止位置是否相同来判断，对于例子中的融合基因，最终的UniqueCuttingPositionCount的值就是3，这个数值越大，该融合基因越可靠。

2. 密码子类型

融合转录本也会进行翻译，相比原本两个基因的密码子，融合转录本的密码子会存在移码现象，对于结果中frameshift这一列的信息，示意图如下

FusionMap中怎么检测融合基因

以上就是4种常见的融合转录本密码子类型，在FrameshiftClass这一列信息中，将这4种常见类型定义为In-Frame, 其他类型定义为Frame-Shift。

3. 连接点两侧的碱基

通常认为是两个基因的exon区域连接形成了融合转录本，而exon起始和终止的碱基序列相对保守，根据这一特征，fusionmap定义了SplicePattern, 即连接点两侧序列的模式，GA-TC这样的剪切模式是最常见的，类型为CanonicalPatter[Major]，接下来比较常见的是GC-AG 和 AT-AC, 类型为CanonicalPatter[Minor]，对于其他的剪切模式，一般不常见，类型为NonCanonicalPatter；如果一个融合基因的breakpoint 处的剪切模式越常见，则检测到的该融合基因为真实存在的融合基因的可能信越大。

看完上述内容是否对您有帮助呢？如果还想对相关知识有进一步的了解或阅读更多相关文章，请关注创新互联行业资讯频道，感谢您对创新互联的支持。

分享标题：FusionMap中怎么检测融合基因
文章起源：http://jkwzsj.com/article/iggjjs.html

FusionMap中怎么检测融合基因

1. 支持该融合基因的reads数目

2. 密码子类型

3. 连接点两侧的碱基

其他资讯