<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=us-ascii">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Hi Lucy, 
<div class=""><br class="">
</div>
<div class="">What were your settings for the second training run? Did you leave protein2genome=1? </div>
<div class=""><br class="">
</div>
<div class="">~Daniel</div>
<div class=""><br class="">
<div>
<blockquote type="cite" class="">
<div class="">On Mar 6, 2017, at 9:40 AM, <a href="mailto:lucys-world@mailbox.org" class="">
lucys-world@mailbox.org</a> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div class="">
<div class="io-ox-signature">
<p class="">Dear maker-devel group,<br class="">
</p>
<p class=""><br class="">
</p>
<p class="">I have some issues with my maker ab initio gene prediction (for a new mammal genome) when creating an HMM via SNAP.<br class="">
</p>
<p class="">after two maker runs I wanted to create a new HMM for the third maker run, but the command
<br class="">
</p>
<p class=""><br class="">
</p>
<p style="padding-left: 30px;" class=""><em class="">fathom genome.ann genoma.dna -gene-stats</em><br class="">
</p>
<p style="" class=""><br class="">
</p>
<p style="" class="">resulted in 0 genes.<br class="">
</p>
<p style="" class=""><br class="">
</p>
<p style="" class="">What have I done so far:<br class="">
</p>
<ul class="">
<li class="">for the first training run I only used BUSCO and Swiss-Port data bank as references (Since no EST are available for my species). Additionally I set protein2genome =1<br class="">
</li></ul>
<p class=""><br class="">
</p>
<ul class="">
<li class="">I was able to create an HMM based on all merged *.gff But these were not many:<br class="">
<ul class="">
<li class="">out of 27.032 Scafolds (Sequences) only 280 were used for the HMM; here the gene-stats:<br class="">
</li><li class="">280 sequences<br class="">
0.458676 avg GC fraction (min=0.338014 max=0.708052)<br class="">
7445 genes (plus=3192 minus=4253)<br class="">
1621 (0.217730) single-exon<br class="">
5824 (0.782270) multi-exon<br class="">
168.412018 mean exon (min=1 max=5224)<br class="">
1464.349243 mean intron (min=30 max=41197)<br class="">
</li></ul>
</li></ul>
<p class=""><br class="">
</p>
<ul class="">
<li class="">For the second maker run I then used this HMM and again the BUSCO+SwissPort.fasta reference file.<br class="">
<ul class="">
<li class="">the gene-stats for the output of the second maker run are:<br class="">
</li><li class="">282 sequences<br class="">
0.473125 avg GC fraction (min=0.338014 max=0.725131)<br class="">
0 genes (plus=0 minus=0)<br class="">
0 (-nan) single-exon<br class="">
0 (-nan) multi-exon<br class="">
-nan mean exon (min=2147483647 max=0)<br class="">
-nan mean intron (min=2147483647 max=0)<br class="">
</li></ul>
</li></ul>
<p class=""><br class="">
</p>
<p class="">Would you recommend to rerun everything, e.g. with an additional Augustus gene prediction (species=human), or EST from related species? (If so how close related?)<br class="">
</p>
<p class=""><br class="">
</p>
<p class="">Thank you for your time and help<br class="">
</p>
<p class="">kind regards<br class="">
</p>
<p class="">Lucy<br class="">
</p>
</div>
</div>
_______________________________________________<br class="">
maker-devel mailing list<br class="">
<a href="mailto:maker-devel@box290.bluehost.com" class="">maker-devel@box290.bluehost.com</a><br class="">
http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org<br class="">
</div>
</blockquote>
</div>
<br class="">
</div>
</body>
</html>