<div>Greetings,</div><div><br></div><div>I am using CEGMA to train SNAP for use with maker.  However, I had a problem with the cegma2zff script that comes with maker.  This script converts the gff file from CEGMA into a zff file for SNAP.  </div>
<div><br></div><div>The problem is that it was producing a zff file with every multi-exon gene as being "invalid" from SNAPs point of view.  My fix was to modify cegma2zff to ignore any feature with the tag "Exon" - as these are always duplicated by cegma as another feature (one of First, Internal, Terminal, Single).</div>
<div><br></div><div>Just wanted to post this here in case this fix is useful to anyone else.</div><div><br></div><div>Cheers,</div><div><br></div><div>-- David Powell</div><div><br></div><div><div>diff --git a/cegma2zff b/cegma2zff</div>
<div>index c795da8..a3bbb77 100755</div><div>--- a/cegma2zff</div><div>+++ b/cegma2zff</div><div>@@ -39,6 +39,8 @@ while(my $line = <IN>){</div><div>     my @F = split("\t", $line);</div><div>     ($F[3], $F[4]) = ($F[4], $F[3]) if($F[6] eq '-');</div>
<div> </div><div>+    next if $F[2] =~ /Exon/;</div><div>+</div><div>     $F[2] =~ s/First/Einit/;</div><div>     $F[2] =~ s/Terminal/Eterm/;</div><div>     $F[2] =~ s/Internal/Exon/;</div></div><div><br></div>