<div><BR>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>Hi Carson and Daniel,<?xml:namespace prefix = "o" ns = "urn:schemas-microsoft-com:office:office" /><o:p></o:p></FONT></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><o:p><FONT size=3> </FONT></o:p></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>Thank you very much for your quick responses! <o:p></o:p></FONT></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><o:p><FONT size=3> </FONT></o:p></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>By multiple tries, I have known the reason why only a few genes were annotated by maker. This is due to turn on of the “correct_est_fusion” option. I got about 8000 transcripts from PASA assembly. Because the gene density of my fungus is very high, many of the assembled transcripts merged adjacent genes even if the trinity and PASA were used with relevant parameter. Maker may not use the merged transcripts as evidence, it the “correct_est_fusion” option is turn on. However, even though the “correct_est_fusion” option is used, I also found many genes produced by maker have merged more than one gene.<o:p></o:p></FONT></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><o:p><FONT size=3> </FONT></o:p></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>I’m now using the ORFs (trainingSetCandidates.cds) extracted from the transcripts by PASA as the EST evidence supplied to maker. I found most of the extracted ORF can accurate match the gene model predicted by augustus and genemark. This can better resolve the “merged gene” issues for fungi with high gene density.<o:p></o:p></FONT></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><o:p><FONT size=3> </FONT></o:p></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>For the 'non-overlapping' file, if only using genemark, its predictions can be found in the 'non-overlapping' file. Is previously issue due to the gene mode generated by augustus is better that genemark, so only augustus gene was putted into the 'non-overlapping' file? Will the genes predicted only by one program not found in the 'non-overlapping' file? how to get these genes?</FONT></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><o:p><FONT size=3> </FONT></o:p></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>Thank you<o:p></o:p></FONT></SPAN></P>
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: 'Times New Roman','serif'"><FONT size=3>Huiquan<o:p></o:p></FONT></SPAN></P><BR><QUARK_EDITOR_SIGN><BR><B>发件人: </B>Carson Holt <carsonhh@gmail.com><BR><B>发送时间: </B>2013-04-16 24:01<BR><B>收件人: </B>刘慧泉 <liuhuiquan@nwsuaf.edu.cn>;maker-devel@yandell-lab.org<BR><B>主 题: </B>Re:Re: [maker-devel] *maker.proteins and*non_overlapping_ab_initio.proteins files<BR><BR>
<DIV style="FONT-SIZE: 14px; FONT-FAMILY: Calibri, sans-serif"><SPAN class=Apple-style-span style="FONT-SIZE: medium; FONT-FAMILY: " ? serif; Roman?, New Times><SPAN style="mso-spacerun: yes"> </SPAN>1. by view the gff file produced by maker2, I have found most of the predicted gene loci have est matches. but why only 254 gene annotations got by maker2 ?</SPAN></DIV>
<DIV style="FONT-SIZE: 14px; FONT-FAMILY: Calibri, sans-serif"><BR></DIV>
<BLOCKQUOTE style="BORDER-TOP: medium none; BORDER-RIGHT: medium none; BORDER-BOTTOM: medium none; PADDING-BOTTOM: 0px; PADDING-TOP: 0px; PADDING-LEFT: 0px; MARGIN: 0px 0px 0px 40px; BORDER-LEFT: medium none; PADDING-RIGHT: 0px">
<BLOCKQUOTE style="BORDER-TOP: medium none; BORDER-RIGHT: medium none; BORDER-BOTTOM: medium none; PADDING-BOTTOM: 0px; PADDING-TOP: 0px; PADDING-LEFT: 0px; MARGIN: 0px 0px 0px 40px; BORDER-LEFT: medium none; PADDING-RIGHT: 0px">
<DIV style="FONT-SIZE: 14px; FONT-FAMILY: Calibri, sans-serif">I'd really have to see the results to tell you why.</DIV></BLOCKQUOTE></BLOCKQUOTE><SPAN id=OLK_SRC_BODY_SECTION>
<DIV>
<P class=MsoNormal style="FONT-SIZE: 14px; FONT-FAMILY: Calibri, sans-serif; MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: " ? serif; Roman?, New Times><FONT size=3><!--  --><O:P><BR><!--  --></O:P></FONT></SPAN></P>
<P class=MsoNormal style="FONT-SIZE: 14px; FONT-FAMILY: Calibri, sans-serif; MARGIN: 0cm 0cm 0pt; TEXT-INDENT: 5.25pt"><SPAN lang=EN-US style="FONT-FAMILY: " ? serif; Roman?, New Times><FONT size=3>2. in the “non-overlapping ab initio”file, I found sequences are all from augustus_masked prediction. Does the non-overlapping file only include the best gene modes from predicted by both augustus and genemark? <SPAN style="mso-spacerun: yes"> </SPAN>Does it include genemark- or augustus-specific genes ?<O:P></O:P></FONT></SPAN></P>
<P class=MsoNormal style="FONT-SIZE: 14px; FONT-FAMILY: Calibri, sans-serif; MARGIN: 0cm 0cm 0pt"><SPAN lang=EN-US style="FONT-FAMILY: " ? serif; Roman?, New Times><O:P><FONT size=3> </FONT></O:P></SPAN></P>
<BLOCKQUOTE style="BORDER-TOP: medium none; BORDER-RIGHT: medium none; BORDER-BOTTOM: medium none; PADDING-BOTTOM: 0px; PADDING-TOP: 0px; PADDING-LEFT: 0px; MARGIN: 0px 0px 0px 40px; BORDER-LEFT: medium none; PADDING-RIGHT: 0px">
<BLOCKQUOTE style="BORDER-TOP: medium none; BORDER-RIGHT: medium none; BORDER-BOTTOM: medium none; PADDING-BOTTOM: 0px; PADDING-TOP: 0px; PADDING-LEFT: 0px; MARGIN: 0px 0px 0px 40px; BORDER-LEFT: medium none; PADDING-RIGHT: 0px">
<P class=MsoNormal style="MARGIN: 0cm 0cm 0pt"><FONT class=Apple-style-span face="Times New Roman,serif">The 'non-overlapping' file should have the one with best consensus if there are 3 or more predictors, and the longest one otherwise.  It should be able to have augustus and genemark genes.  Try it with only genemark and let me know if the file is empty.</FONT></P></BLOCKQUOTE></BLOCKQUOTE></DIV></SPAN>
<DIV><BR></DIV>
<DIV>Thanks,</DIV>
<DIV>Carson</DIV>
<DIV><BR></DIV>
<DIV><BR></DIV></div>