Hi-C 数据的全流程真的是门手艺活,从质控、比对、去重到后面的 TAD 和 Loop 结构识别,每一步都不能出错。

这套流程讲得还挺系统的,尤其适合刚接触 Hi-C 的朋友入门。流程里提到的PSYCHICHiC_tools都挺实用,前者能帮你根据 Hi-C 矩阵预测潜在增强子,后者则是一组小而美的工具集,数据比较高效。

蛮推荐你看下相关的 Matlab 源码,像是schmid 滤波函数,Hi-C 信号的时候蛮顺手的。而且还有不少 Loop 管理和优化的小技巧,比如在Enhancing Loop Management那篇里就提到了一些暂停、进度显示的操作,适合想搞清楚流程控制细节的你。

哦对了,如果你数据量不小,别忘了配合数据库用,比如文中也顺带提到了MySQLOracleLOOP语法,写自动化脚本的时候挺方便的。

,如果你正好在啃 Hi-C 数据,尤其是结构域(TAD)和环(Loop)识别这一块,这篇流程文章可以当作一本速查手册。