<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Hi Mike-
<div class=""><br class="">
</div>
<div class="">Thanks for getting back to me. I was using the grep -cP '\tgene\t’ syntax to count the numbers and it seems to be giving me the same numbers I got before when I was counting either the transcripts or the genes in the fasta output files from our
 original run. I will have to look at the files a bit more to see if I can find some examples of genes that fit what you are suggesting.</div>
<div class=""><br class="">
</div>
<div class="">Best,</div>
<div class=""><br class="">
</div>
<div class="">Chris</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
<div>
<blockquote type="cite" class="">
<div class="">On Oct 2, 2017, at 9:30 AM, Michael Campbell <<a href="mailto:michael.s.campbell1@gmail.com" class="">michael.s.campbell1@gmail.com</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Hi Chris,
<div class=""><br class="">
</div>
<div class="">This is interesting. -d in quality_filter.pl should only filter out genes based on AED. Is there a chance that you counted transcripts instead of genes? If there is a transcript with an AED of 1 then quality filter should remove it but leave the
 gene and the transcripts with AEDs less than 1. I can have a look at it if you send me one of the genes (in GFF3 format)  that was filtered out by quality_filter.pl even though it had an AED less than 1. </div>
<div class=""><br class="">
</div>
<div class="">Thanks,</div>
<div class="">Mike</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class="">
<blockquote type="cite" class="">
<div class="">On Sep 29, 2017, at 1:20 PM, Willett, Christopher S <<a href="mailto:willett4@email.unc.edu" class="">willett4@email.unc.edu</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
Hello-
<div class=""><br class="">
</div>
<div class="">We are getting to the final stages (hopefully) of a reannotation of a new assembly of a copepod genome using MAKER and we had some questions about which set of genes to use.  Our latest runs were using Pfam domains to define default vs standard
 set using the quality_filter.pl script and I had a question about stringency of the filters for this script. It appears that the default is more stringent than the output that we get from MAKER without using this script (all with AED max set to 1). Are there
 additional filters in this script beyond AED that would cause this? </div>
<div class=""><br class="">
</div>
<div class="">Here is what we are seeing if more details would be helpful. With a run with or without the keep_pred turned our final MAKER run gives ~21500 predicted genes with or 15200 without the keep predictions turned on. What I was wondering about was
 why this 15200 is higher than the default set  (which gives ~14500 genes) after we filter the gff using the -d setting in quality_filter.pl. For completeness the standard set (-s setting) is retaining ~14800 genes and if I filter the 15200 gff file with the
 default parameters that yields ~14100 genes. So I was curious what else was going on in the filter script beyond AED that would trim out genes?  </div>
<div class=""><br class="">
</div>
<div class="">The genes sets look pretty good overall and seem like reasonable numbers so we were debating which set to use as our final set. I am also trying a few other analyses in InterProScan to see if that identifies additional genes beyond Pfam for retention
 but that seems a bit independent from the question above.</div>
<div class=""><br class="">
</div>
<div class="">Thanks for your help,</div>
<div class=""><br class="">
</div>
<div class="">Best,</div>
<div class=""><br class="">
</div>
<div class="">Chris Willett</div>
<div class=""><br class="">
</div>
<div class="">  </div>
<br class="">
<br class="">
<div class="">
<div style="letter-spacing: normal; orphans: auto; text-align: start; text-indent: 0px; text-transform: none; white-space: normal; widows: auto; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div style="font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div style="font-family: Helvetica; font-style: normal; font-variant: normal; font-weight: normal; letter-spacing: normal; line-height: normal; orphans: 2; text-align: -webkit-auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-spacing: 0px; -webkit-text-stroke-width: 0px; word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
<div class="">
<div style="font-size: 12px; margin: 0px;" class="">~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~</div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">Research Associate Professor</font></div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">Department of Biology</font></div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">CB#3280 Coker Hall</font></div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">University of North Carolina, Chapel Hill</font></div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">Chapel Hill, NC, 27599-3280 </font></div>
<div style="font-size: 12px; margin: 0px; min-height: 14px;" class=""><br class="">
</div>
<div style="font-size: 12px; margin: 0px; min-height: 14px;" class="">Office: <span style="text-align: -webkit-auto;" class="">2252 Genome Science Building</span></div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">phone:<span class="Apple-tab-span" style="white-space: pre;">
</span>919-843-8663</font></div>
<div style="font-size: 12px; margin: 0px;" class=""><font face="Helvetica" size="3" class="">fax:<span class="Apple-tab-span" style="white-space: pre;">
</span>919-962-1625</font></div>
<div style="font-size: 12px; margin: 0px;" class=""><br class="">
</div>
<p style="font-size: 12px; margin: 0px;" class=""></p>
<div style="font-size: 12px; margin: 0px;" class=""><a href="http://labs.bio.unc.edu/Willett/" class="">http://labs.bio.unc.edu/Willett/</a></div>
</div>
</div>
</div>
</div>
</div>
<br class="">
</div>
_______________________________________________<br class="">
maker-devel mailing list<br class="">
<a href="mailto:maker-devel@box290.bluehost.com" class="">maker-devel@box290.bluehost.com</a><br class="">
<a href="http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org" class="">http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org</a><br class="">
</div>
</blockquote>
</div>
<br class="">
</div>
</div>
</blockquote>
</div>
<br class="">
</div>
</body>
</html>