Hi Carson,<div><br></div><div>Thanks for the quick reply.  I have already trained SNAP and Augustus based on the de novo assembly from the same RNA-seq data used to generate the cufflinks annotations.  Those SNAP and Augustus predictions were part of my initial annotation, along with the de novo assembled transcripts, previous reference annotations, and related species protein alignments.  I had broken this up because of run time issues, and thought it might speed things along.  I will switch gears to add in the SNAP and Augustus ab initio predictions.</div>
<div><br></div><div>As you might infer, I have a great deal of formats this transcript data could come in (ie outputs from cufflinks for each sample, cuffmerge, tophat, trinity, or raw).  Do you have any suggestions for what might be a good balance between speed and completeness?  I also can not for life of me get Maker install on our cluster, but I do have Augustus and SNAP installed there.  I have a massive amount of RNA-seq data I'm trying to incorporate, so I'm confident plenty of alternative splicing could be found, but I'm hitting time issues due to the scale (ie four day wall limit on the cluster and only having an 8-core in house).</div>
<div><br></div><div>I've tried other programs to do this, but obviously cufflinks gives you way too much, and I'm finding EVM, while fast, is too happy to shorten gene models based on partial transcript evidence, which requires way more manual correction than we are capable of doing.<br>
<br></div><div>I'll start with just letting Maker run SNAP and Augustus, and let you know how it goes.</div><div><br></div><div>Walter</div><div><br></div><div><br><div class="gmail_quote">On 4 June 2012 11:02, Carson Holt <span dir="ltr"><<a href="mailto:carsonhh@gmail.com" target="_blank">carsonhh@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div style="font-size:14px;font-family:Calibri,sans-serif;word-wrap:break-word"><div>Using GFF3 pass-through options alone won't allow for the alternate splice prediction to work.  You have to also allow gene predictors like SNAP and Augustus to run.  MAKER uses mutually exclusive EST data to produce separate hint files in some cases that can produce alternate splice forms from the ab initio predictors.  The EST evidence must be very long in general or they will not produce alternate forms.  These alternate splice model can then compete against your existing gene models based on scoring statistics MAKER produces and potentially replace them.  This may not be what you want though.  The alternate splice prediction works better De Novo than for re-annotation.</div>
<div><br></div><div>The alternate splicing option still needs more work, but I would appreciate any feedback.</div><div><br></div><div>Thanks,</div><div>Carson</div><div><br></div><div><br></div><div><br></div><div><br></div>
<span><div style="border-right:medium none;padding-right:0in;padding-left:0in;padding-top:3pt;text-align:left;font-size:11pt;border-bottom:medium none;font-family:Calibri;border-top:#b5c4df 1pt solid;padding-bottom:0in;border-left:medium none">
<span style="font-weight:bold">From: </span> Walter Eckalbar <<a href="mailto:weckalba@asu.edu" target="_blank">weckalba@asu.edu</a>><br><span style="font-weight:bold">Date: </span> Monday, 4 June, 2012 1:41 PM<br><span style="font-weight:bold">To: </span> <<a href="mailto:maker-devel@yandell-lab.org" target="_blank">maker-devel@yandell-lab.org</a>><br>
<span style="font-weight:bold">Subject: </span> [maker-devel] question regarding alternate splicing annotation<br></div><div><br></div>Hi Maker developers,<div><br></div><div>I am trying to expand on some current annotations that are already quite good, but only predict protein coding sequence and one isoform per gene, to add UTRs and alternative splice forms from cufflinks data.  To do this I put the current annotations in both the model_gff andusing the gff_field, plus the cufflinks gff3 for the ests (as I noticed was suggested in a previous email).  I've left everything else as default, except changing alt_splice=1. I am watching the progress of the *.gff.ann files, but I'm not noticing alternate splicing being added, while UTRs are being picked up (exons being added, etc.).  This is a vertebrate genome, so run times are fairly long and I just wanted to double check if I wasn't missing something.  Will maker go back through a second step to annotate alternative splicing?  Or should I be trying something a little different.</div>
<div><br></div><div>Thanks,</div><div><br></div><div>Walter</div>
_______________________________________________
maker-devel mailing list
<a href="mailto:maker-devel@box290.bluehost.com" target="_blank">maker-devel@box290.bluehost.com</a>
<a href="http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org" target="_blank">http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org</a>
</span></div>
</blockquote></div><br></div>