<html><head><meta http-equiv="Content-Type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; line-break: after-white-space;" class="">Fusions are generated by the evidence alignments. Either transcript assemblies wee falsely fused or proteins are bridging neighboring paralogs. For transcript data you can try building the assembly with Trinity and the jaccard_index option which will reduce the occurrence of transcript assembly fusion. Also set correct_est_fusion=1 in the options files.<div class=""><br class=""></div><div class="">For protein evidence driven fusions, you can try DeFusion which is a post process you run on the MAKER output that will search and attempt top correct for paralog driven fusions.<br class=""><div><br class=""></div><div>—Carson</div><div><br class=""></div><div><br class=""><blockquote type="cite" class=""><div class="">On Apr 12, 2018, at 11:12 AM, <a href="mailto:nellerk@yorku.ca" class="">nellerk@yorku.ca</a> wrote:</div><br class="Apple-interchange-newline"><div class=""><div class=""><font face="Tahoma" size="2" class=""><div style="font-family: Tahoma; font-size: 13px;" class="">Hello,</div><div style="font-family: Tahoma; font-size: 13px;" class=""><br class=""></div><div style="font-family: Tahoma; font-size: 13px;" class="">I am using Maker to annotate a novel, non-model plant genome. </div><div style="font-family: Tahoma; font-size: 13px;" class=""><br class=""></div><div style="font-family: Tahoma; font-size: 13px;" class="">Following the published protocol, I have run one evidence-only round (est2genome, prot2genome = 1) followed by two iterative rounds, re-training Snap and Augustus each time. </div><div style="font-family: Tahoma; font-size: 13px;" class=""><br class=""></div><div style="font-family: Tahoma; font-size: 13px;" class="">I have a curious result in that the gene predictors do not seem to be finding many genes, but instead creating gene fusions. As such, my evidence-only round resulted in 29,773 genes (mean length=5071 bp), and my final round yielded 29,845 genes (mean length=6530 bp). If I am interpreting this correctly, the predictors found only 72 new genes but greatly increased the mean length of all genes. I have inspected the results visually in a genome viewer and it seems that the predictors often create fusions with nearby pseudogenes. I attempted to reduce this by changing pred_flank from 200 (default) to 100, but it didn't seem to make a difference (at least for the genes I was looking at). </div><div style="font-family: Tahoma; font-size: 13px;" class=""><br class=""></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class="">So although my final Maker round looks good (~30,000 genes, 95% of genes have AED < 0.5), I have greater confidence in the models created by the evidence-only round. </span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class=""><br class=""></span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class="">I have two questions:</span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class="">1) In this case, would it be acceptable to use evidence-only gene models (from Round 1), rather than those from Round 3 (which incorporated trained gene predictors)? I ask because I haven't seen reports of Maker being used in this way.</span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class="">2) Do you have any suggestions to improve my ab initio training or prediction? Please note, I have already repeat-masked the genome with a species-specific repeat library.</span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class=""><br class=""></span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class="">Thank you for any assistance!</span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class=""><br class=""></span></font></div><div style="" class=""><font face="Tahoma" class=""><span style="font-size: 13px;" class="">Kira</span></font></div></font></div>
_______________________________________________<br class="">maker-devel mailing list<br class=""><a href="mailto:maker-devel@box290.bluehost.com" class="">maker-devel@box290.bluehost.com</a><br class="">http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org<br class=""></div></blockquote></div><br class=""></div></body></html>