UNITE数据库做完序列比对之后用FastTree建树。
参数-nt才能识别为核酸,否则识别为蛋白。
且即使加了-nt,简并碱基还是识别不出来。
注意这里的X在序列中为N。
我把上面这些warning去掉之后,导入iTOL说不是正确的树格式。
Couldn't initialize the tree. Make sure the encoding is plain text ASCII, and that the tree is in Newick, Nexus or phyloXML format
又试着在R里面用read.tree读,报错左右括号的个数不同。
numbers of left and right parentheses in Newick string not equal
这也太奇怪了...
我先检查了数中的各种符号,发现错误原因为树文件中物种注释之间的分号(;)。
点号(.) 竖线(|)下划线(_)是允许的。
去掉分号后在R中就不报错了。
但是树直接为NULL了。
又对着文件仔细看了很久,突然意识到nwk格式的树最后有一个分号,要把这个再手动填上。
分号表示树的结束,因此树中间如果有分号只会读取到这里,就会报错左右括号数量不相同了~
折腾这么久的原因是忘了UNITE数据库注释信息本身带有分号;且全部替换后忘了最后还要再加上一个分号。