转录组数据分析思路

Fredreck 2020-07-19

转录组紧紧围绕基因表达量和功能分析两部分,结合生物学问题来进行数据分析。

  • 高表达基因已经研究比较透彻,应该更多关注中低表达基因。

  • 层次聚类的妙用:
    -- 全部基因——>(差异分析)——>根据趋势挑选部分特异性基因——>功能分析;
    -- 功能大类聚类——>根据趋势挑选部分特异性功能——>功能小类聚类;
    -- 通路表达量的计算:该通路全部基因表达量之和除以该通路基因数;

  • 趋势分析(cmeans聚类)阐释不了太多生物学问题,比较适合筛选特异性基因,如标志物筛选。

  • 功能富集分析不应过多关注显著P值,功能通路作为一个整体,不应排除差异非显著的基因作用。

  • 根据功能来推测生物学过程,需要经验,如胞外信号呈递通路发生变化,可能受外界刺激。

  • 网络构建不要过多关注高表达或差异基因,更多关注hub基因,验证也是如此。

  • 网络分析和功能分析是分开的两条路,网络更多是标志物筛选,不解释生物学问题;功能作为整体研究来描述生物问题。

来源讲座:胡松年,转录组数据分析思路