人类皮肤颜色的 SNP 统计数据挺有意思的,尤其是对搞前端可视化的你来说。数据结构清晰,字段命名也规整,拿来喂进可视化库完全没压力。用来练习Echarts
或D3.js
都挺合适,尤其是要搞那种基因分布图、族群差异图之类的。
统计工具方面,Excel、SAS、SPSS 这些都能搞,尤其是 Excel 的表格格式化,前期预比较顺手。而且数据量不是大,日常测试也够用。
如果你还不熟 SNP(单核苷酸多态性)是啥,简单说就是基因里一个碱基的位置不一样,比如 A 换成了 T,结果就是肤色深浅的差异。用来做热图、对比图,图表效果直观。
建议你配合一些统计工具用,像是SPSS做前期,Excel改一下格式,丢给前端做交互展示,流程比较顺。下面这几个工具链接可以看看,资料挺齐:
如果你是做前端可视化的,可以重点关注字段格式和结构,一般 CSV 转 JSON 搞定后就能直接上图表。