<div dir="ltr">Hi,<div>the file te_proteins.fasta is distributed with MAKER and is suggested as a way to find more divergent transposable elements by searching in protein level instead of at nucleotide level. I've been unable to find any information about it's creation, and whether or not it has been kept current. There is a file with mobile elements derived proteins distributed with RepBase, called RepeatPeps.lib, which seem to contain the same amount of sequences (about 9.4 Mbp in both), but half the number (10500 vs 25000). </div><div><br></div><div>Does anyone know how these two files compare? Could I use RepeatPeps.lib instead, or combine them (with some clustering maybe?)?</div><div><br></div><div>Thank you.</div><div><br></div><div>Sincerely,</div><div>Ole Kristian Tørresen</div></div>