<html><head></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space; color: rgb(0, 0, 0); font-size: 14px; font-family: Calibri, sans-serif; "><div>The input GFF3 file you have the link to only contains one gene?  Is that correct.  If so then you should only get one gene in the output.  The resulting GTF should only have the genes (ignoring all the evidence).</div><div>To convert for eval use these command lines (note the flags such as -g for gff3_merge so you are only looking at genes and the fast must be included in the file, so no -n flag)</div><div><br></div><div>gff3_merge -d maker_datastore_index.log -g -o some_file.gff</div><div>add_utr_start_stop_gff some_file.gff > some_file2.gff</div><div>maker2eval some_file2.gff</div><div><br></div><div>Note that all version of MAKER after 2.09 no longer have add_utr_start_stop_gff, the UTR is now always there explicitly, so you go strait from gff3_merge and then use maker2eval_gtf</div><div><br></div><div>However with that explanation, I have to wonder if EVAL is appropriate for you.  EVAL requires a reference annotation set (that is assumed to be 100% perfect) for comparison, and you get a perfect score whenever you call the genes exactly identical to the reference set (which in itself has obvious bias, but we won't get into that).  Given that you have no reference set it will not give you anything other than statistics for the distribution of introns and exon sizes.</div><div><br></div><div>Alternate means for quality given no reference genome are AED (computed for each gene as part of the MAKER run), this is basically a variation of EVAL like statistics run against evidence clusters rather than a reference genome, or you can just use % domain content.</div><div><br></div><div>See these links for examples of the statistics --></div><div><a href="http://www.biomedcentral.com/1471-2105/12/491">http://www.biomedcentral.com/1471-2105/12/491</a></div><div><a href="http://www.biomedcentral.com/1471-2105/10/67">http://www.biomedcentral.com/1471-2105/10/67</a></div><div><br></div><div>Also a figure is attached with an example of quality analysis using combined AED, domain content, and comparative orthologs.</div><div><br></div><div>--Carson</div><div><br></div><div><br></div><div><img src="cid:B563F1FF-1E85-42E3-B79D-F7F6449F1AE9" type="image/png"></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><div><br></div><span id="OLK_SRC_BODY_SECTION"><div style="font-family:Calibri; font-size:11pt; text-align:left; color:black; BORDER-BOTTOM: medium none; BORDER-LEFT: medium none; PADDING-BOTTOM: 0in; PADDING-LEFT: 0in; PADDING-RIGHT: 0in; BORDER-TOP: #b5c4df 1pt solid; BORDER-RIGHT: medium none; PADDING-TOP: 3pt"><span style="font-weight:bold">From: </span> James Eckert <<a href="mailto:jteckert@gmail.com">jteckert@gmail.com</a>><br><span style="font-weight:bold">Date: </span> Sunday, 14 April, 2013 5:07 PM<br><span style="font-weight:bold">To: </span> <<a href="mailto:maker-devel@yandell-lab.org">maker-devel@yandell-lab.org</a>><br><span style="font-weight:bold">Subject: </span> [maker-devel] Annotation quality and converting gff3 to gtf<br></div><div><br></div><div dir="ltr"><div><div><div><div><div><div><div><div>Hello,<br><br></div>I'm currently trying to figure out ways to evaluate the quality of annotations that MAKER produces. I'm working on a novel species, so there isn't a reference genome to compare the annotation quality to.<br><br></div>After doing a bit of searching on the web, I came across the EVAL tool, which I thought may be useful for checking the output quality. EVAL takes in gtf files, not gff3, however MAKER seems to have addressed this problem through its accessory scripts.<br><br></div>I first used the script "gff3_merge" to have my whole annotation under one gff3 file. Next I used "add_utr_start_stop_gff". This would explicitly add the UTRs, which would be needed for converting the gff3 file to gtf. The problem arose when trying to run "gff3_to_eval_gtf". I was expecting MAKER to process the whole gff3 file, but it seems to have only processed 2 nodes. The same thing happens when running the "gff3_2_gtf" script.<br><br></div>Here is the command I'm running, along with the output:<br>gff3_to_eval_gtf assem_kmer_57_utr.gff3 <br>NODE_20666_length_66353_cov_18.405483    maker    CDS    8801    8984    .    -    0    gene_id "1"; transcript_id "2";<br>
NODE_20666_length_66353_cov_18.405483    maker    CDS    8113    8717    .    -    2    gene_id "1"; transcript_id "2";<br><br></div>My question is whether the "gff3_to_eval_gtf" and  "gff3_2_gtf" scripts have a bug in them, or whether I'm just doing the process wrong? Perhaps if the conversion doesn't work, there exists an alternative to EVAL that works with native MAKER annotations?<br><br></div>Attached is my whole genome gff3 file, along with the file I ran "gff3_to_eval_gtf" on.<br><div class="gmail_drive_chip" style="width:396px;height:18px;max-height:18px;background-color:#f5f5f5;padding:5px;color:#222;font-family:arial;font-style:normal;font-weight:bold;font-size:13px;border:1px solid #ddd"><a href="https://docs.google.com/file/d/0Byl5QhezwxYOUFFBMVpldFJOb28/edit?usp=drive_web" target="_blank" style="display:inline-block;overflow:hidden;text-overflow:ellipsis;white-space:nowrap;text-decoration:none;padding:1px 0px;border:medium none;width:100%"><img style="vertical-align: bottom; border: none;" src="https://ssl.gstatic.com/docs/doclist/images/icon_10_generic_list.png"> <span dir="ltr" style="color:#15c;text-decoration:none;vertical-align:bottom">assem_kmer-57_exp-44_covcutoff-auto_contigs.all.gff3</span></a></div><br><div class="gmail_drive_chip" style="width:396px;height:18px;max-height:18px;background-color:#f5f5f5;padding:5px;color:#222;font-family:arial;font-style:normal;font-weight:bold;font-size:13px;border:1px solid #ddd"><a href="https://docs.google.com/file/d/0Byl5QhezwxYOYjBOWlVWMEJpTjQ/edit?usp=drive_web" target="_blank" style="display:inline-block;overflow:hidden;text-overflow:ellipsis;white-space:nowrap;text-decoration:none;padding:1px 0px;border:medium none;width:100%"><img style="vertical-align: bottom; border: none;" src="https://ssl.gstatic.com/docs/doclist/images/icon_10_generic_list.png"> <span dir="ltr" style="color:#15c;text-decoration:none;vertical-align:bottom">assem_kmer_57_utr.gff3</span></a></div><br></div>Thank you in advance for your help,<br><br></div>James<br><div><div><br></div></div></div>
_______________________________________________
maker-devel mailing list
<a href="mailto:maker-devel@box290.bluehost.com">maker-devel@box290.bluehost.com</a>
<a href="http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org">http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org</a>
</span></body></html>