<html>
<head>
<meta http-equiv="Content-Type" content="text/html; charset=Windows-1252">
</head>
<body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif;">
<div>
<div>Thank you for the prompt reply, Carson! Yes, my gff3 was modeled as gene models, not match/match_part, so reformatting it may do the trick.</div>
<div><br>
</div>
<div>Monica</div>
<div>
<div>
<div><br>
</div>
</div>
</div>
</div>
<div><br>
</div>
<span id="OLK_SRC_BODY_SECTION">
<div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt">
<span style="font-weight:bold">From: </span>Carson Holt <<a href="mailto:carsonhh@gmail.com">carsonhh@gmail.com</a>><br>
<span style="font-weight:bold">Date: </span>Friday, November 7, 2014 at 10:26 AM<br>
<span style="font-weight:bold">To: </span>Monica Poelchau <<a href="mailto:monica.poelchau@ars.usda.gov">monica.poelchau@ars.usda.gov</a>><br>
<span style="font-weight:bold">Cc: </span>"<a href="mailto:maker-devel@yandell-lab.org">maker-devel@yandell-lab.org</a>" <<a href="mailto:maker-devel@yandell-lab.org">maker-devel@yandell-lab.org</a>><br>
<span style="font-weight:bold">Subject: </span>Re: [maker-devel] calculating AED values between two datasets<br>
</div>
<div><br>
</div>
<blockquote id="MAC_OUTLOOK_ATTRIBUTION_BLOCKQUOTE" style="BORDER-LEFT: #b5c4df 5 solid; PADDING:0 0 0 5; MARGIN:0 0 0 5;">
<div>
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class="">
If you got every value as 1 with the est_gff, then your GFF3 didn’t load.  The est_gff option is expecting match/match_part format alignment format, and you may not have had it correctly structures.
<div class=""><br class="">
</div>
<div class="">For using fasta files instead, you may also need to set single_exon=1 and single_length=1, otherwise many of those alignments will be ignored for AED scoring purposes.  You should also look out the output in a viewer like apollo to visualize the
 comparison to see if the reason you get 1 is because the aligner can’t recover the original transcript alignment.
<div class=""><br class="">
</div>
<div class="">—Carson</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
</div>
<div class=""><br class="">
<div>
<blockquote type="cite" class="">
<div class="">On Nov 7, 2014, at 6:17 AM, Poelchau, Monica <<a href="mailto:monica.poelchau@ars.usda.gov" class="">monica.poelchau@ars.usda.gov</a>> wrote:</div>
<br class="Apple-interchange-newline">
<div class="">
<div style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; font-size: 14px; font-family: Calibri, sans-serif;" class="">
<div class="">
<div class="">
<div class="">
<div class="">Hi everyone,</div>
<div class=""><br class="">
</div>
<div class="">I would like to generate a list of Maker AED values comparing two datasets: a set of computationally predicted genes, and manually curated genes from the Web Apollo program. The idea is to quantify the amount of nucleotide-level change that occurred
 during the manual curation process. </div>
<div class=""><br class="">
</div>
<div class="">I have tried to run Maker in several ways to generate the AED values. Both gene sets are in (as far as I can tell) valid gff3 format. First, I included the manually curated (Web Apollo) gff3 in the 'model_gff' field of maker_opts.exe, and the
 gff3 of the computational predictions in the 'est_gff' field, with all of the other prediction and evidence alignment settings turned off. All resulting AEDs from this analysis were 1, even though many of the annotations had 100% overlap. Next, instead of
 using the computational predictions in gff3 format, I used the fasta file of the cDNA sequence from the computational predictions in the 'est' field. Here, the results made more sense, but there was a small but significant percentage of the AED values that
 were 1 that actually should have been less than 1. </div>
<div class=""><br class="">
</div>
<div class="">I have tried the 2 analyses above using both the gff3 output straight from Web Apollo, and after running the gff3 through maker once as the only entry in the model-gff field, as explained in the MAKER2 paper (<a href="http://www.biomedcentral.com/1471-2105/12/491" class="">http://www.biomedcentral.com/1471-2105/12/491</a>).
 This does not to appear to make a difference.  </div>
<div class=""><br class="">
</div>
<div class="">Do you have any ideas where I might start to debug this?</div>
<div class=""><br class="">
</div>
<div class="">Thanks for your help!</div>
<div class=""><br class="">
</div>
<div class="">Monica</div>
</div>
<div class="">
<div class="">
<div class=""><br class="">
</div>
</div>
</div>
</div>
</div>
<br class="">
<br class="">
<br class="">
<br class="">
This electronic message contains information generated by the USDA solely for the intended recipients. Any unauthorized interception of this message or the use or disclosure of the information it contains may violate the law and subject the violator to civil
 or criminal penalties. If you believe you have received this message in error, please notify the sender and delete the email immediately.
</div>
_______________________________________________<br class="">
maker-devel mailing list<br class="">
<a href="mailto:maker-devel@box290.bluehost.com" class="">maker-devel@box290.bluehost.com</a><br class="">
<a href="http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org">http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org</a><br class="">
</div>
</blockquote>
</div>
<br class="">
</div>
</div>
</div>
</div>
</blockquote>
</span>
</body>
</html>