列优先的数据建模,挺适合做性能调优训练的练手素材。你听说过“循环慢”、“一定要矢量化”这种说法,但真到了实战,循环和矢量化其实是个平衡的事,看场景来选。列循环放在外层,内存访问更连贯,效率不低;变量多的循环放里层,也挺合理的。别怕循环,怕的是不懂为什么慢。feature jit offfeature accel off都可以帮你验证具体效果,想清楚再动手优化,省力多了。