<div dir="ltr"><div>I did it that way and AUGUSTUS is predicting a more reasonable number of genes, about 12500 in Maker, but about 19000 in the model assessment step.<br>In comparison, SNAP gives 16000 and GeneMark 19000.</div><div><br></div><div>I haven't found any reference about but, would it be a good idea to train Augustus over the masked genome instead?</div><div>Thanks,<br></div><br><div><br></div></div><div class="gmail_extra"><br><div class="gmail_quote">On 12 September 2017 at 02:50, Carson Holt <span dir="ltr"><<a href="mailto:carsonhh@gmail.com" target="_blank">carsonhh@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="word-wrap:break-word"><div>BUSCO may be generating too few models. BUSCO also identifies classes of conserved short genes that may not represent enough training diversity for your organism. Try running MAKER in protein2genome or est2genome mode, and then train with those results.</div><span class="HOEnZb"><font color="#888888"><div><br></div><div>—Carson</div></font></span><div><div class="h5"><div><br></div><br><div><blockquote type="cite"><div>On Sep 10, 2017, at 7:03 PM, Xabier Vázquez-Campos <<a href="mailto:xvazquezc@gmail.com" target="_blank">xvazquezc@gmail.com</a>> wrote:</div><br class="m_-3469951447114833417Apple-interchange-newline"><div><div dir="ltr"><div><div><div><div><div><div>Hi,<br></div>I have been annotating a fungal genome as usual, using Busco-trained Augustus (in addition to GeneMark and SNAP), but for some reason, Augustus is predicting a mere 207 genes compared to 15-20k from the other two.<br></div>I've never had this problem. The genome has an unusual repeat content close to 50%, not sure if that might suppose a problem.<br></div>Has anybody come up with any similar issue?<br></div>I also asked to Busco developers if they have any idea <a href="https://gitlab.com/ezlab/busco/issues/49" target="_blank">https://gitlab.com/ezlab/<wbr>busco/issues/49</a><br></div>Cheers,<br></div>Xabi<br clear="all"><div><div><div><div><div><div><div><br>-- <br><div class="m_-3469951447114833417gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div>Xabier Vázquez-Campos, <i>PhD</i><br><i>Research Associate</i><br>NSW Systems Biology Initiative<br>School of Biotechnology and Biomolecular Sciences<br>
The University of New South Wales<br>Sydney NSW 2052 AUSTRALIA<br></div></div></div></div></div></div></div></div></div></div></div>
</div></div></div></div></div></div></div></div>
</div></blockquote></div><br></div></div></div></blockquote></div><br><br clear="all"><br>-- <br><div class="gmail_signature" data-smartmail="gmail_signature"><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div><div dir="ltr"><div>Xabier Vázquez-Campos, <i>PhD</i><br><i>Research Associate</i><br>NSW Systems Biology Initiative<br>School of Biotechnology and Biomolecular Sciences<br>
The University of New South Wales<br>Sydney NSW 2052 AUSTRALIA<br></div></div></div></div></div></div></div></div></div></div></div>
</div>