加载管理器的核心是把从源系统抽出来的数据,快速地、批量地、还挺高效地丢到一个临时的中转站,做点简单清洗,再塞进数据仓库结构里。这玩意儿说起来不复杂,但做起来真挺有门道的,是涉及到大批量 ETL 的时候。如果你之前用过像 Oracle、SQL Server 那类工具,那这个加载逻辑你肯定不陌生。加载速度快不快,转格式麻不麻烦,其实就看你怎么配。嗯,推荐你顺手看看下面几个链接,ETL 工具选型、数据抽取技巧,还有 Probe 的应用,都讲得比较清楚。