<html><head><meta http-equiv="Content-Type" content="text/html charset=utf-8"><meta http-equiv="content-type" content="text/html; charset=utf-8"></head><body style="word-wrap: break-word; -webkit-nbsp-mode: space; -webkit-line-break: after-white-space;" class=""><div class="">Hi Brian,</div><div class=""><br class=""></div><div class="">Multi-exon ESTs are stranded by their splice sites which can only work on one strand. Single exon ESTs on the other hand are stranded by their open reading frame. The standard chemistry used in most sequencing does not allow for strand specific sequence. There are technologies that do, but unless you used one of those, re-stranding single exon ESTs based on ORF is the best way to figure out where single exon alignments should go (not a completely reliable method but it works most of the time).  I believe trinity tries to determine strand the same way (but it is unreliable there too). For example since your alignment is not an exact match to the genomic sequence (single bp deletion in the alignment) the best open reading frame in the transcript is not the same as the best open reading frame in the genomic sequence (so one of them likely contains an error).  MAKER since it is annotating the genome logically re-strands it to the genome and trinity (being unaware of the genome strands it to the transcript).  Because single exon alignments are very unreliable, they are ignored in MAKER by default.  They will not be used as hints for gene predictors and can only be used to support a gene if there is also protein evidence or a single exon ab initio prediction at the same location to support it (even then this will only happen if you set single_exon=1 in the control files).</div><div class=""><br class=""></div><div class="">—Carson</div><div class=""><br class=""></div><div class=""><br class=""></div><div class=""><br class="">On Mar 20, 2015, at 7:17 AM, Mack, Brian <<a href="mailto:Brian.Mack@ARS.USDA.GOV" class="">Brian.Mack@ARS.USDA.GOV</a>> wrote:<br class=""><br class=""></div><blockquote type="cite" class="">

<meta http-equiv="Content-Type" content="text/html; charset=us-ascii" class="">
<meta name="Generator" content="Microsoft Word 12 (filtered medium)" class="">
<style class=""><!--
/* Font Definitions */
@font-face
        {font-family:"Cambria Math";
        panose-1:2 4 5 3 5 4 6 3 2 4;}
@font-face
        {font-family:Calibri;
        panose-1:2 15 5 2 2 2 4 3 2 4;}
/* Style Definitions */
p.MsoNormal, li.MsoNormal, div.MsoNormal
        {margin:0in;
        margin-bottom:.0001pt;
        font-size:11.0pt;
        font-family:"Calibri","sans-serif";}
a:link, span.MsoHyperlink
        {mso-style-priority:99;
        color:blue;
        text-decoration:underline;}
a:visited, span.MsoHyperlinkFollowed
        {mso-style-priority:99;
        color:purple;
        text-decoration:underline;}
pre
        {mso-style-priority:99;
        mso-style-link:"HTML Preformatted Char";
        margin:0in;
        margin-bottom:.0001pt;
        font-size:10.0pt;
        font-family:"Courier New";}
span.EmailStyle17
        {mso-style-type:personal-compose;
        font-family:"Calibri","sans-serif";
        color:windowtext;}
span.HTMLPreformattedChar
        {mso-style-name:"HTML Preformatted Char";
        mso-style-priority:99;
        mso-style-link:"HTML Preformatted";
        font-family:"Courier New";}
.MsoChpDefault
        {mso-style-type:export-only;}
@page WordSection1
        {size:8.5in 11.0in;
        margin:1.0in 1.0in 1.0in 1.0in;}
div.WordSection1
        {page:WordSection1;}
--></style><!--[if gte mso 9]><xml>
<o:shapedefaults v:ext="edit" spidmax="1026" />
</xml><![endif]--><!--[if gte mso 9]><xml>
<o:shapelayout v:ext="edit">
<o:idmap v:ext="edit" data="1" />
</o:shapelayout></xml><![endif]-->


<div class="WordSection1">
<pre class="">Hi, I’ve noticed a what seems to be a flipping of the strand of some of my transcripts from est2genome. I assembled my directional rna-seq reads using Trinity. I’ve copied an example below. The blastn within maker shows the transcript aligning on the positive strand as does blastn against my genome in sequencserver. But the est2genome shows the strand to be negative. I’ve noticed this for quite a few transcripts while examining it in WebApollo. Any ideas what might be causing this? <o:p class=""></o:p></pre>
<pre class=""><o:p class=""> </o:p></pre>
<pre class="">Thanks,<o:p class=""></o:p></pre>
<pre class="">Brian<o:p class=""></o:p></pre>
<pre class=""><o:p class=""> </o:p></pre>
<pre class=""><b class="">Query= comp17103_c1_seq3 len=612 path=[8488307:0-177 8492039:178-496<o:p class=""></o:p></b></pre>
<pre class="">><a href="http://10.114.143.20:4567/get_sequence/?id=contig_69&db=/home/brian/blastdb/af70_20130423_id-modified.assembly.txt" target="_blank" class="">contig_69 </a><a name="contig_69" class=""></a> <o:p class=""></o:p></pre>
<pre class="">Length=108040<o:p class=""></o:p></pre>
<pre class=""><o:p class=""> </o:p></pre>
<pre class=""> Score =  1043 bits (1156),  Expect = 0.0<o:p class=""></o:p></pre>
<pre class=""> Identities = 589/592 (99%), Gaps = 3/592 (1%)<o:p class=""></o:p></pre>
<pre class=""> Strand=Plus/Plus<o:p class=""></o:p></pre>
<pre class=""><o:p class=""> </o:p></pre>
<pre class="">Query  24      TCTTTATTCTTTTATTTCCACTTGAGCAATTATTTCCGGGTCAACCTATTCGGTCGTTCT  83<o:p class=""></o:p></pre>
<pre class="">               ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||<o:p class=""></o:p></pre>
<pre class="">Sbjct  105546  TCTTTATTCTTTTATTTCCACTTGAGCAATTATTTCCGGGTCAACCTATTCGGTCGTTCT  105605<o:p class=""></o:p></pre>
<pre class=""><o:p class=""> </o:p></pre>
<pre class="">Query  84      CTCCGTTGAGCC-TTCCCTCCCCAAGTAATATTGGAAAGTCGTTCTCTCGCTCATAATTT  142<o:p class=""></o:p></pre>
<pre class="">               |||||||||||| |||||||||||||||||||||||||||||||||||||||||||||||<o:p class=""></o:p></pre>
<pre class="">Sbjct  105606  CTCCGTTGAGCCCTTCCCTCCCCAAGTAATATTGGAAAGTCGTTCTCTCGCTCATAATTT  105665<o:p class=""></o:p></pre>
<pre class=""><o:p class=""> </o:p></pre>
<p class="MsoNormal"><o:p class=""> </o:p></p>
<p class="MsoNormal"><o:p class=""> </o:p></p>
<p class="MsoNormal">69           blastn    expressed_sequence_match         105546  106137  559        +             .               ID=69:hit:182380:3.2.0.0;Name=comp17103_c1_seq3<o:p class=""></o:p></p>
<p class="MsoNormal">69           blastn    match_part         105546  106137  559        +             .               ID=69:hsp:377369:3.2.0.0;Parent=69:hit:182380:3.2.0.0;Target=comp17103_c1_seq3 24 612 +;Gap=M70 D1 M85 D1 M75 D1 M359<o:p class=""></o:p></p>
<p class="MsoNormal">69           est2genome       expressed_sequence_match         105546  106137  2909      -              .               ID=69:hit:182644:3.2.0.0;Name=comp17103_c1_seq3<o:p class=""></o:p></p>
<p class="MsoNormal">69           est2genome       match_part         105546  106137  2909      -              .               ID=69:hsp:377775:3.2.0.0;Parent=69:hit:182644:3.2.0.0;Target=comp17103_c1_seq3 24 612 -;Gap=M70 D1 M85 D1 M75 D1 M359<o:p class=""></o:p></p>
</div>


</blockquote><blockquote type="cite" class=""><span class="">_______________________________________________</span><br class=""><span class="">maker-devel mailing list</span><br class=""><span class=""><a href="mailto:maker-devel@box290.bluehost.com" class="">maker-devel@box290.bluehost.com</a></span><br class=""><span class=""><a href="http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org" class="">http://box290.bluehost.com/mailman/listinfo/maker-devel_yandell-lab.org</a></span><br class=""></blockquote></body></html>