<div dir="ltr">Hi Stefan,<div><br></div><div>MAKER does write the repeatmasker output to the final gff3 file. However, to save space and prevent redundancy in the case of nested or overlapping repeats the repeat regions are collapsed and named after the longest repeat contributing to the repeat region. This means that the portion of the genome being masked is easy to calculate, but the length of the masked regions reported in the MAKER output will non always represent the length of individual repetitive elements. </div>
<div><br></div><div>To get the true length distribution you could run repeat masker on the genome outside of MAKER or look for the repeatmasker output in the void directories in the datastore for each scaffold.</div><div>
<br></div><div>Also make sure that you are using the most recent version of MAKER. There was one recent bug fix that affected the repeatmaksker output that was written to the gff3 file that resulted, in some cases, in an underestimation of the portion of the genome that was masked prior to annotation. </div>
<div><br></div><div>I've copied this to the MAKER dev list just in case anyone else has additional insights.</div><div><br></div><div>Mike</div><div class="gmail_extra"><br><div class="gmail_quote"><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">
<br>
<br>
Dear Mark Yandell,<br>
<br>
 I wanted to ask if it's possible to extract a file with all repeats found<br>
from the maker output?<br>
<br>
I would like to see how much of the genome is repeats and check their<br>
lengths distribution.<br>
<br>
All the best,<br>
Stefan Prost<br>
<br><br>
<br>
</blockquote></div><br><br clear="all"><div><br></div>
</div></div>