matlab 里要带括号、逗号一堆符号的树状结构,用Newick 格式验证器真是挺省事的。它用 Python 写的,支持 2.7 和 3,能读文本文件检查格式对不对,哪里错了还能标出来,挺贴心。你只要把 Newick 格式的树丢进去,它就能告诉你哪不合规。
树的结构有点像函数嵌套:括号表示子树、逗号隔兄弟节点、冒号后面是长度。用来做系统发育树合适,生信里常见那种。哦,它还用到了Bio.Phylo
来画树,用re
正则,整体代码结构也还清晰。
如果你之前用过 Matlab 这类结构但觉得写起来别扭,不妨试试这个 Python 的方式。响应也快,语法还好读。对新手也挺友好,规则写得蛮清楚。你甚至可以当它是一个Newick 语法检查器
来用,反正就是把那些麻烦事儿交给它。
嗯,还有个小建议,正则这块如果你不是熟,可以顺便看看这些:正则表达式指南、Python 正则表达式在数据分类中的应用这些都挺实用。
如果你最近在搞系统发育、数据挖掘或者想做个格式校验器,这个项目还挺值得收藏的。