Pay0013995 (gene) Melon (Payzawat) v1

Overview
NamePay0013995
Typegene
OrganismCucumis melo L. var. inodorus cv. Payzawat (Melon (Payzawat) v1)
DescriptionRetrotransposon protein
Locationchr12: 16190274 .. 16214435 (+)
RNA-Seq ExpressionPay0013995
SyntenyPay0013995
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: exonCDSpolypeptide
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGACAAGTTCATCGAGACTACCTAAACATACTTGGACTAAAGAGGAAGAGGCAAGCCTCGTGGAGTTGGTCAATGCTGGTGGGTGGAGGTCTGACAATGGAACCTTTCACCCCGGGTACTTAAATCAGCTGGCGAGAATGATGGCCTTCAAGATCCCAGGTTGTAATATCCATGCTTCAACCATCGATAGCCGAATCAAATTGTTGAAGAGAATGTTCCATGCACTTGCGGAGATGCGTGGCCCAAATTGTAGTGGTTTTGGGTGGAATGATGAAAAAAAATGCATCGTCGCTGAGAAAGAAGTCTTTGACGATTGAGTAAAGGTGCATTAGTAGTCATTTGAACACTTGTACTATTATTTCAATACATGGACTAATAATTTATTATTGCACTTATACAGAGTCATCCGGCAGCGAAAGGCCTCCTTAATAAGTCGTTTGTCCACTATGACGAACTGTCTTACGTGTTTGGCAAAGATCGTGCAACAGGAGGCCGGGCTGAGATTTTTGCAGACATTGGGTCAAACGATCCTGCTGGGTATGACGCATTTGTTGCTGACGCTGCGCCAGATACGAACTTCTCCCCAATGTACAGTCCGAGATTGAACATGTCACCTGATGATTTGATGGAAACCAGAACCGCTAGGGTCAGTGAACGTAGGAATGTTTCAAGTGGGTCTAGGCGGAAACATACAGGACATGCCACAGATAGTGGGGACATAGTTTGTACTGCCATCGTGTACGGAAATGAACAACTTCATCGCATTGCTGAATGGCCTATCCTACAACGTCAAGACGCAACCCAAACATGTCAAGAGATTGTTCGACAGTTGGAGGCCATCCCCGAGCTCACATTGATGGATAGGTGTCGCTTAATGCGTATACTTATGCGTAACGTCGATGACATGAAAACTTTCCTTGAAGTTTCCGACAATATGAAGTACCCGTACTGCAACATCATTCTTCAAGAAAACCGATGACTAGTTTGTTTGTTTGTTGTATTTGTATTAATTAAACTTTTCTTACTTGGACTATATGTTCTTCTTCTAACTTGTTATGTCTTATTATATAACGAACTTGAAATTCTGTTGAAGTTAATTAGTTTGTATTTTCATTTCGCTTTCAAAAGTAATGGTATCAATTGTTGTATTATCCTATTAATGTAGTGTTTTCGTTGAAGTTTTTTTTACAATATTTATAAGTTGCGTATACGTCGAAATAATTTGGTTTAAATGCGCTAATCAATTTACGAATTTACGAATTAATTTTGCACGACATAACATAAGAAAAAAAATTGATTAATGGATCAATATAAAATTATTTTATAAAAACGATATTGTTATCACAGGTACGTAAATTTTTTTTTGAAGAACCTATTATAGCATAATATGTTTAGTTTTCTATTTACAAATTGAATATTGATTTCGTGAATAAAAAAAATTAATTATATATTTTATTCTTTATATAAACATTCCTTTTTTAAAAAAAATAACATAAATTTAATTAACGTAATCTTTGCCCAAAACAAGTTTTATAATAATACTACACTCATAACTCTTCCTCCAAACACATTTTATAATAATACTATAATAATATTTTCCCTCAAACACATATATACTTAATAATACTACAATAATGAATTTCTTCCCCAAAAACATATTATTATAACACTACATTAATTAGTTGTTAAATTAAATATCTTATATTTAATTTAATTCAAATATGAATCATATTTATATATAAATTTCTCTCATGACATATAGTTTTAATGCGTATCATATACGCATTAAATTTTAATCTATAGTTTTAATATAAATCTAATTCACATTAAATTAATATTTGAACTCATGCAAATATTTTATTCTCTCTCATAAATTAATTTCGAATCATATCAAAATTAAATTGATATAATAAAGTTTATTTCAAAAATATATTATAATATATCACCATACATTATATTAATTCCCAAAGTAAATTTGAAGATTTCATATTACAATTAATATATATTAACCTCATTACCCTCTACAAACTAGGAAGGGGATCTAATGGACCAACAGATCAAAAGCGCGCTTTCCGGAGCCGCAACTGATATGAGGAGTTATCTCGCCTCTTATATCATCCACCACATAGTTATCAATATATAATCGTGGAACTCTAAGAGACATGTGCCCACTATTAATTTAAAAGAGTCTCGTAGTTGCACTCCTTTACTATAGATATATTTATGTGCACACGGGTATAGAGTAATAACAGTAAGTTAGTCTTTCACAAGTGTCTGTAATGCCAATTGGGTTAAATTATCGTTTTACCCTTCGGTTACTTCTAGTCTTTAAATATCAGTGCTCCTCTAATGAACAACCTGTTTATGGTCCAACCAATAAATAAAAACTCCTCTCGTGCCATGGAGAGGGCCGGAAGGGCCCTTTGTTCAAGTCCCGAAGACACCATTTAAGGGAACACTCATCTACTTACTCTAACATCGGGAATGAGTGAATTTCATATATGTGTTTTATGTTTCCAGCTTCTCGCTCGACCTTGTCCCTAAAATGATAAGCATATTGAGTTGGCAAATGAGTCACCCTCACCTATAAAAGTCAAAGGACAATCCTTCGCGAATAAAAGTTCATAATATACTGGGGCCTTAAGACTAACTTACCTAGATCATCCTAATGAAATAAAAACTTAACTAGTTAACTGAGTTACATCTAGTGGTTTCTATTTTGTTGTTCGGTCTTATGCAAACTCATTGCATAGGATACCCTTACTCAAATACAAAGTGAGTTGTATCCATAGTTTTACTAGAATAAGGTATCCAGCCTTATCCTTATACTATAGACCATTTAAGCTGATCTTGAATATTGATCCCCGTATGTCTCTATATACTTTTCAAGACTCATCAAACAACTTAGTATGTTAGTTTATTATATTTATGTTATTAAGACAAAACTAATAATTAATAACATTTTTTTGAAATAATTATAAAAATAACACTTCGTATAGAGTCAACGAATTACATTACTATCTACGAGTTTTAGGACATAAAAGCCAACAATAACACTTCATATAGAGTCAAAGGCTACTAATGGCTATATTATTTTTAATGTAGCAGGTAGAGTTACTGCTTGGAAGTTTAAGAAATGCACTATTCTAGCCTAGTCAACAATTGAGTCAAAGATGATATCACAAGAAATAATTAGTGCAAAAGCAAGCTGACTTCAAAGCTTGCTAACATAGTTTCCTTTATAAGAAAAATTGGTATCAACCAAATTGATCTATTGGAATATTACTGCAACATTTCAAAAGTTCATTATCATTATTACATTGATAAGAGACGGAAAATATGCCGTAAACACAATACCATTAGAGAGTTTCTCACTATTGGTGCAATTAGAGTGAATAATATACAAACTAATAAAAACTTGGCAGATCCTTTAACAAAAGGACTAGTCAGAAAGAAGGTTTTCAAAACCTAAAAAATGGGACTCGTGTTTATAAAAAGATGAATCACCTATGAAGAAAACCCAACATGTAGACTGGAGATCCCAAGAAACAGATCCAAAGGGTAATAACTGATCACAAGTGATATGAAGTGAGTCATACTAAACAATATAAAGATTCATCTTTATGATCGAATATTAGCATGATATCCTGAAGTGTATAAAAGGTTGGACTTAGCTCTTATTTTGAAGGGTACCCAATGTTTTAGAGCAGGTGGGAAGATAAATAAATGTGGATTTGATGACTTTTCCATGCTCACTTGCTACATCCATCTGATCGGATAGACGAGGCTTAATGGATGAGTAATAACATTATGTTTATTAACCAAATACTTATTTTTTCAATATTTAATTAAAATGGTTTTTTTATTTAAAAATCCAACAATTTTATTTTTTATTTAAACAAATCAATTTTATTTTAATTACTAATTTTATTTTATTTAAAACGTTAAACTGTTTTCTTATTTATTGCTTAAAAAAACTTTTACAAATGAACACTATAAAAGGTCTCTTGTTCTTCTTCGTTTGACACATAATAATAATCTACTTATAATAATAATCGTGTCATTCAACGAGAGTTCATGCGGTTGGGTGAGACAATTTCCCACCATTTCAACATGGTCTTGTTGGTTATTCGACTTCATGACGAGTTTTTGAAAAAACCACAACCAGTGCCTAATGATTGCACAGATCAAAGATGGAGGTGGTTTGAGGTACACATTTATCTCGAACTACGTACTTCCAACACAACGACGTTAGTTCTTCTAAAAAATTTTGAGTTATGCGTTGTAGAATTGCCTAGGTGCATTAGATGGAACGTACATAAAAGTGAACGTTCCAGCAAGTGATCGGGCTAGGTATAGAACACGCAAGGGGGAGGTGGCCACAAATGTACTTGGTGTGTGTGACACGAAAGGAGATTTCATTTACGTACTTGCCGGTTGGGAAGGATCAGCTGCAGACTCACGTATCCTCCGTGATGCCCTTTCAAGACCTAATGGGTTGAAGGTGCCCAAGGGTAAGTAACAACGGCATTGTACCTATGAATGCAATTTTGCAAGTAACAGCTGCGACATTTTAATCGTGCATTGTGGTCACAGGGTATTACTACCTGGTTGATGTCGGGTACCCAAATGCGGAGGGTTTCCTGGCACCATACAGAGGCCAACGCTATCACTTGCAAGATCGTGTACCAAATCTAAACAATCTTGGTTCAAAATTGTATACCAAGAACTTTTATATTCGATACACGATCTTGTACCAATATCATTTGGATTTGGTCCACGATCCCATACCAAGATCTAAACAATCATGTACCAAGATCTAAACGATTTTTGTTCAAAGATCATGTACCAAAATCTTTTATATTCAGTACACAAGGTACCAAGATCTTTTATATTTGATACACGATCTTGTCTCTGAAGGGATAAGAGCCCTATACAGCGGAATATGTAACATAGACCGTAACTCAAATTAATGTAGGAACCTAAAAATACTAGTACATTAGCAAAAATTAATTTACTTATGGCTAAGGATGCTGTATTAAAAAGAAATATAGAGAGAAGGAAGAACACTTATGTCGTTGATGACTCTGAATCTACTAAAACTCCAAATTGAGGCACCACAACTTGGAAACCTTCCTATTATCTAAGAATGGATTTTTGGTTTGTGGGATTTTTTTTTATAGAATACAGTACGTAGAAAGAAAATCCAGAATTATTCTATCAATTCTTTGCATACCAATATCTGGCTTCTTCGAGGGAAATTGAGAGAAAAATTGGGAACATAGGAAAATCATCCACGTTCCCAATTAATTTAATAACTTATTATTAAATTAATATTATTATTAAAAAATTAATTAATTTCTTCAATTAATTAATTGCTAAATTAAATATCTTATATTTAATTTAATCCAAATTTGATTTAATCCAAATTTGAATCATATTCAAATATAAATTTCTCTCATACATAGTTTTAATGTGTATCATATACATATTAAATTTTAACCTATAGTTTTAATATGAATCTAATTCACATTAAATTAATATTTGAACTCATTCAAATATTTTATCTCTCATATAATAATTTTGAATTATATCCAAAATTAAATTTATATAATAAAGTGTAATTAAAATATAAATTTTGTATTATAATGTATCACCATACATTATATTAATTTCCAAAGTAAATTTGAACATTTCAAATTACAACCAATATAAATAAATATCATTACCCTTTACGAGTTAGGAAGGGGACCTAATGAACCTACAAATCAAAAGCTACAACAATATGAGATTAATTGGCTAAACTCATTAACCAAATTAATCAATATTCATTAACCGTGTGTACAATCCAATAAAGACTAGTAGCCGAACTCTTCTCACTATAGATATATTTATGTATCCATGGATATAGAACAATACTAGTAAGTTAGTCCTTTATATGTGTTCGTAACACCAGCTGGGTTAAATTACCGTTTTACCCCTAGGTTACTTCTAATCCTTAAATACCAGTGCTCCTTTAATGAACAACCTATTTAGGTCCAACCACTAAATAGAAACCCCTTTTGTGCCAAGGAGAGGATAGAGCTATTTGTTCAAGTTCCGAAGACACCATTTAAGGGAACATTTATCTACTTACCTTAAAGTTTGAAAGGAGTGAATTCCATCTTGTATGGTTAGTTCCCAGCTCCACACTAGATCTTGTCCCTAAAATGATGAGCATATTGAATTGACAATCTACCCATTCTCACCCATACAAATCAAAGGACAATCCCTCATGAACAAGAGTTCATAATACATTCAGGATTAAGACTAAGTAACCAAAGTCTTTCTAATGAAATAGAAACCTAATTAGTTAATGAAGTTATATATAGTGGTTACTATTTCGTTGTCCGATCTTATGAAAACTCATTACATAAGATACCCTTACTCGCATATCACCTACACGAACGTATTGAATCATTGTGTTTGTCTTAAATACAAAGTGAGTCATATCCATAGAGGTACCCAACCTTATCACTATACTATAGACTCTTTAAGTTGTATCTCAAACATTGATCCCTGTATGTCTCTACATACTGTTCAAGACTCATCAAACAACTTAGGATGTAAGTTTATTAAGACAAAACTAATAATATAATCAATAACACTTATTGAAATTATAATAATAACACTTTATTAATAATGGTTAATGGATTATATTTAATATCTACGAGTTTAGGACATAAAACTCAACAAACTCTCACTCGAACTAAAACTCTAATCTAATCTCTATGAGATGTACATAATAAAGTAATCCTCAAACATTGAAAATCGTAAAATGTACAAGTATATTACATAAAACGTATATATACAATACAATAAACTAAGGCATCCTTGTACCCATTACACATCGCTCACTTGCCCTAAATTACCTAGTGTACATATCTCGTAGACGTAGACTTTCTAGATGACCCTCGAACGCTTTAGCCGTGAGAGTCTTTATAAACGGATCAGCAATGTTGTGCTCCAAAGCAATCTTGGTGACAATCACATCCCCTTATTACACAATCTCCTATATCAGATGATACTTCCTCTTTATGTGTTTCCCTCGTTTGTGGCTGTGAGGTTCTTTAGAATTGGCTACTGTCCCACTGTTATCACAATATAAAGTGATGGGTTGTTCATGTTTGAAACAACTTCCAAATCGTGCAGGAACTTCCTGAGTTGAACTGCTTCTTTTGCTGATTCACAAGCAGCGACGTACTGAGCCTCCATAATAGAGTCTGCAATGCATCCTTGCTTGATGCTACACCATATAACAGCTCCCACATTCAACGTGAACACTGATCCCAACGTGGATTTCCTAGAATCGTTATCGGTTTGAAAATTAGAGTTAGTGTATTTTGTAAGGATAAAATCCTTAGATCCATACACAAGCATGTAGTCTATCGTTCTCCTATGATAATTGAAACTAATTTTAACCGTCGTCCAGTGGTTTAACCCTGGGTTGCACTGATACCAATTGACTATTCCCACTGCATAACCACTAGAAGAAATCTGGCCTTTAATATCGATTTAAAACCGACATTAAAGGGCTTTAATGTCACTTGACAATCGACATCTTTGCGAGCGTTATTAAAGGCCTTTAATGTCGGTTATAAACCGACATCTTTGATGGTGTTATTGAAGACCTTTAATGTCGATTGTTCTTTAATGTCGGTGTAGAACTGTCTTTAATGTTGTTTATGCACCGACATTAAAGATATCTTTAATGTTGTTTTTCCACACTTCCATATAGTACTACAATAAATACAATCATCCAACAACTATATATAATCACATATTTGAATAAACACACCAACAACTGTAAGTGAAAACTCAAAATTTAAAGATAATATATAAGATCGTGATTAATTACCAATGTATATGCAACAGAAAGTTCCTCCACTTACTAAAGTATACGTACAAACTATCTAACAAACAACAATTAGTACGGGGACCGCCTGTCCTTCCAAAAACTATAGGACTACCTGTCCCTACAAAAACTTCCTCTTGCCTACCAAGAAATAAATTGCAAAGAATGAAGAACAGGAAACTTATGATCGTGGACGACTCTGGATCTACAAACCACCAAATTTAGAGACACTACCACTTGGAAACCTTTCGATTCTCTAGGTTATTTGGTTTGTGGGAACCAAAATTGGAGAATGGAATTTTCAAGAGAGCAAGAGAGAGTTTTCTTCTTAAAAGAATTACAGTACGCAACCCAAAACACTTCTATTTCGTTACATAAATATTTTCCTCTTCTTTAGACGAAAGAAGTGGGAAGTTGAGAGAATTGATGAGGAACCAACTTCATTAACAACCCTTGTTGATTCATCAGTAGCTTCATTTAATACTAATTTGCTTCGTGGTTTATGATCTATCGAGTGGTTTTCTTCCAAGAAAGTAGCATTTTTCGATACAAACATTCATTTTTCTTGTGGATCGAAGAATAAACCACCTCTCATTTCTTTAGGGTAACCAACAAATTTGCATAATCTTGAACGAGGTTTCAACTTCTTGGAGTTTGTCACTAACACGTGTGTTGGACAATCCCAGATTCTGAAGTGACTTAAACTAGGTTTACATCCTTTATATAACTCAAAAGGTGTTTCAAAATCATTCTTCGAGGGAACATTGTTCAAGATATGAACTACAGTCTCTATTGCATACCCCTAAAACGAGCTAGGCAATTGAGCATAACTCATCATTCAACGAACCATGTCTAACAAGGTTCTATTTCTCCTTTCTGATACACCATTTTTTTGAGTTGTATGAGGTGCTGAGAGATGAGATTGAATTCCATGTTCTATCATATATAGTCCTGGAATCTCAAATCCACGTACTCTGCACCTCAATCAGATTGAAGTATTTTAATATTTTTACTTAATAGATTTTCAACATCAGCCTTATACTCCTTGAAATTTTCAAGAGCTTAAGATTTATACTCCATTAAATATAAATAACCATAACTTGAATAATCATCTATAAAAGGGATGAAGTATTCAAAATCTCCTCTAGCTTTTACATTTATTGGACCATAGAGGCCTAAATGTATAAGTTCTAGGGACTCTTTGGCTCTATAACCTTTTCCTGTAAAAGGTCTTTTAGTCATTTTTCCTTCAAGCCAAGGTTCACAAGAAGGTATTGAATCATCTTCTAACTCATTTAGAAGTCCATTCTTTACCAATCTCCCAATCTAATCGAGATTAATGTGACCTAATCTTAAATGTCAAAGATAAGTATTGTTATTTGGACAAATTATTTGCCTTTTATTTTTAGTGTTAGAAGTTTTAAACATCTCACGATTTAAAATTGCTTTCGCTTCATTAGGTCTTAATGCATACAAGTTGTTTTCAAGCTTAGCCGTACAGATATATACACCGTTCTTAGAAATGAACGCTTCATTCATAGAGAAATTAATTGAGTACATATGTTCAATAAGATAAAATACAGAGAATAAGTTTCTCTTAACTTTAGGAAATATGTACAAGTTTTCCAAAAACATGAATCTATTTCTAAAAAACAACTTGGTCGCTCCCACTGCTCGAGCTGAAATGATGTCTTTCGTTCCGAATTTGAGCCTCATCTCATCGAAATCGAGCTGCTTGAAGGAACCGGTTTCCTGTAAAGAAGAGCAAACATGGTTAGTGTCTTCTGATCAAGTATCCAGATATTTTTTTCATTTTCCATTAAACATGTTTCTAAGACAAGTAAGTCATATTGACCTTCCTTTTCCTTCTTCTTGGCAAGGTACTCTGGGTGGTTTCTTTTCCAATGTCCATCCACATTACAGTGGAAACATTTCCCCTTGATGACTACCTTAGCCTTCCCTTTACCCTCAGCAGCAGCAGTAGAACCTTTCCCCTTCCCTCCTTTCTTCTTCTGAATTTTCTTAGATCTAAAAGATGAATGCGCAAACTTGGTTCTAAAGGATGAACCCTTCTGAAACCTCCTGGAATGGGCAACATTTGTCTCTCATTCTCTCTATCCTTTAAGAGACTGAAAAGTTTGCAACTCATTTAGGAGGGTGTAGTCATGTTGTACTCTATCTTGTTTATTTTCGCATTGCTGCAAAACTGAAGAAAACTCTTTGAAAGAGATTTCAAGATAAAGGACACTTGACTCTTCTCATCAAAGATCACTTCATTCATTTATGCTACGTTGAAGTGGCATGTCAAGGACATGTTCTCTAACAGATTGGCTCTCATTCATATGTGCATTATAAACATATTTAATAGTCTCTTGTTTGATCTGAATGGACGGTTATCCAAGCATCACTCAAAGGGAGTCCATGATCTGACGTGCAGCAACCATGATCTCATGTTTCTTGATCAGTATGTCTGACATACTAGCCAATATGTAAATGCAGGCCTTGTCATTGGCCTTTGTCCAGCGGTCATATGCATCCCTAACACTCTATGATGCATTTTGAGTAGGGAAAGGAGGACATTCCTCCATTAAGACGAAGCGTAGATCAACGATAACTAAAATCATATTCAGTTTGGATTTCCACGTCGCAAATTTTTATCGGTTAATTGTTCTTTTTTTATGCAGTGCGATAATTGAGAAACACATATTGAAATAACAAACAATTGACCGTATTAGTTATCTTTGCTTAACCCATTACACAAAATAATCCAGTCAACTCAACAAAAACAAACAATCAAAGAATCCTAATCAAACAAATGATTTATTTTTTGTAACAATACTTCAAAAGTTTAGAGCAACAATCACCGAAGGGTGATCAACTACTCCTCTCCTGAATTGAGACAATCTCAGCTAATTACTAATACCAGAATAACTCTTATTTCTATAGTTCTTAGCTGCTGTTGTTCAGTCAAGGATTCATTAACTAACTTAATTCATCCCATAAGTGTGACTGTATCATTTTCAGATCCCAGAGGTACGCTTTAATAGGCTACCCTTAAGAAAGACAACTGTTGAAGATTAACCTAAGAAATCCTATCCATTTTTCAGAGTTTACGTTGTTCCGACTTAAATGATCAGGCCCTCCGAAGGACTTCGCTCTAGGATGACACACAGATAAATCATTGAAATCTCACAGTACAACCTAATGGAGGAGACCGTAGAATACGTTGACACGCATCCTTCTCCCACTTACTATGAACATTTTCCATTTAGATCACCTTGTTATTGATCCATACAAACACTTTCCGAAAGGGAGGCCGCACCTAGGGCGATACGAAGCTGAGTATGGATCTCATATGTGAACTCTTAGAGATGTGAGAGCTAAAAATTGATAAATCACATATACCATTTTTCTCCCACTAAAATGTTCTATTAATTAGGGTTTGCTGTATTTAGTTAAATTCCAACTAAATGAATCGAACTAAGCCTATTTTTATTATAACTCTTATAATAAAACTTTACTCTAAAGTTTCTAGGTGTATTAAACCATCTAATTTACCTAGTGACATCTTATGCTAATAGAAATAAGGTTGATTCAACGTCAGTTCTGAGTTAGTTCCTAGGTAGGAGGTGTTTCATAAACTGTCAACTTAAGTACCCCTAGCCTTAAACAAAACTTTATCGGTGGAGTTCCCTTATTACCTTAGATCCTATTTGTCCTACTTAGTTTCATTAAACTAAAATAAGAGTTAATTCTAATCCTATTAGAATTAATGTGATCTTAGGTCTATTTAATTTTAAACAATTTAAAATTAAATCAAATTAATTCGAAGATCCTATGTTTGCATGCAACTCTTTATTATAGGTCGACAGTTTCTAATTATCAAATTTTATAACTATTATAAAATTAGTTAATTAGCCCTATAAACATGCATACTATGGTTTAATTAATTAAAATCAAATTATAATTAAATAAAACCATGTTACATGCAAAACATTAATATAACAATTATATTAAACTATGGATGTAATATGCTTAATACAAATTAATTTTCATCTTAATTAATATAACACTTATATTAAAAAAAATCATGAAAATCAATCAAACATACATAAGACATTAATTTAAATATAAAAAATTATTTTTAACTAAGTAATGTCCTGCATCATATTTATCATATATTTAAAATATTAACATACTTTAAATAACTCATGAATTTTATAACCATGCATTAATACCATACATTATAACAATTATAATATATAAAATGCATGAACATGTTTAACCTAAGGTGAGATTTATCTAAATGACATCCACAAAGAATTTAAATAACAATTAAACTAGTAAAATTGGTCCCTAGGATAAATAAAGCAAAAATTACACTAATTAAGCTTTAAAGTATCCTCAAACAGCTTTTAAAGCTTCAAAACCAATCCCAAAACTTCAAAAACCTTCGAACCGGGCCTGAAAACCTTGAACCTATCCAAAAATAGAAGAACCAGCCCAAAATCAAGCTGAATCTGTGCCAAACCATGCGGTAGATGAAGAATCAAAGTCAAACCGCATGCTAGAAGATGAAGAATCAGAGTTAAACCCTGAACCAAGCCAACCGCAAGCTAACCCGTTCGAAGCCGAGCTAAGCCATCTCTAAGCCGCTAGCCACACCGTGTACGAATCGTCAGCAGTCCTTTGGAGCTTGCTAACATCACGTTAGCCCTTCTTCAACCTCCAACGGCTGAAGTTTTTTTTCTCGTTTCAATTTTCGTATAGAGCCGAAAAACTCACCGTTGGAGGCCTTCTGGTTGTTCGTTTTGGGCGAATTTGGTGTCAAAATTCTCAGAAAAAGACCCTGAATCCAAATTCTGACTCTAAATTACATGATTTACAGTAAAAAATGCCCAAAAACGTAGAGACCTTTACAATTAATCATATAAAAAATTATAAATCTATGGCCAAATTACAATAAACATTCAATTGCAAAAAATCCACATTCATAATGCAAAGATTCCACCTAACCAATGCAAATTTTTAAAATTTCCAATTAAAATTGAGATGACTCTAATACCAATCGAAGGGATAAGAGCCCTACATAGCTGAATAAATAACAGAGACCATAACTCAAATTAATTTAAGAACCTAAAAATACTAGTACATTGGCAAAAATTAATTTACTTATGACTAAGCATTCTTTATTAAAATAAAATACAGAGAGGAAGAAGAGCACTTACGTTGTTGACGACTCTAAATCTACTAAAACTTCAAATTGGGGTATCACCACTTAGAAACCTTCGTATTCTTTTAGAATAGATTTTTGGTTTATGGGAACCAAAAATTGAAAGAGAATTTTGTTTGAAAGAATTTTTTAGAGAATACAGTATGCAGAAGAAAATCTAGAACCATTCTGTCAATTCTTTACATACTAATATCTCCCACTTCTTCAGACAAAAGAAGAGAGAAGTTGAGAGAAAATTTGGTTTTAATTAATATTAATAGAAATGATTAATTAATTTTTTTAATTAATTAATTGCTAACTTAACCATCTTATATTTAATTTAATCAAAATTTGAATCATATTCAAATATAAATTTCTCCCATAACCTATAGTTTTAATGTGTATCATATACATATTAAATTTTAACCTATAATTTTAATATGAATCTAATTCACATTAAATTAATATTTGAACTCATTCAAATATTTTATCTCTCATATAATAATTTTGAATAATATCCAAAATTAAATTTATATAGTAAAGTTTAATTAAAATATAAACTTTGTTTTATAATGTATCACCATACATTATATTAAATCCCAATGTAAATTTGAACATTTCAAATTACAACCAATATAAATAAATTTCATCATCCTTTACGATCTAAAAAGGGGACCTAATGGACCTATAGATCAGAAACTATAACGATATGAGATTAATAGACTAAACTCATTAATCACTACGTCCAAAAGATTTGGAAAACAGAAAACTCGTGAAAGGAAGGGTAAGTCGAGAATTACTCTCTCTTTAAGACATTTTTAGAGCTCTGCTTGGAATAAAAGTAGTTTTGAGAGTGTTGTTGCGATGTCCTTAGGATAAAATAGCCTAAATGTCATTGTGTGTTTATACAAGACACACGGGTATATATGGTCAAGTAATTGTAATAAAACAACGGGAAGGCCAAGTATCGTCCTCAAGCATCAAAATTTTGTTTTAACTTAGTTATTTTAGAATTGAATTAATTTTATCTAAGCAATGGTAGTTGAGGTTGGATTTATTTCAATTGATGATAGATGATGAATAAAGAAAATAAAAGTTAAAAATAAGGATACAAGAAATGAGATATTTTAGGGTGATGAATCCATTACTTATTTCATTAATTAATAAGTTAACTTTTGTGGAATTTAGTACTAACATAATGCTTAAGGTTAGAAACTTTGATACAAATTATTTTCTTTCAAAAACAAATTTTTTTTCTCAACCAATGTTTAATAAACTTCTTGAATCAATTAAGAATGCCAAAGAACAATAAGTCAAAATCATCATGATTCAACTTTTTTACTATTTTTACTACTATTTGCTGAATTATGCTAATAGCAATTCAATGTTATAGTTCCAATTAACACGTATACAAATGCTTTCAATTGAACCATATAACAATTTAGTTGAATGGCCCTGGCCTGTTTAATATTAATTAATCATAACAATATTGAGAATTATAGAATTCAACGATTTCAATGAAAGCATTAAAAAATCAATTCAAAATCATACATAAGTAATTTCATAACACCCTACAACTACAGAAATTAGCCACTGATTTTTCAAAATATGTATTCTTATATGAATTATCAAGCAAAGCAGGGAAGAGAATAGAAGAAATTGACGAAGAAAAACTCTCAAAAACTTCATCATCGTTGGCCAACCTCCAAGATCGTCTTGACTTTCACCTTGAAAACTCGACCGACCTCCAAAATAAATCCTTTAACTCTGAACACTATTAATAGCACAAAGGGAATAAAATATAAAGGGAGGAGAATTTCCCAAGGTTTGGAATAGGATGAGACAGATTGCAAATGAGTTTGAAGCTCAATTTATAGATGTTGTACAAGGGGTAGCGTCTCGACACTATAGGAAGCGTTGCAGTGTTGATAAGATTCTTCACTTAACACACCAAGTCGTTTGCGGCACACACTTAGTGTTGTCTGCCGCTTACATTGTTGTATTCTTGAGATGCCACCAACAGCACACTTAGGGACAACACGCCGTTCACGAAATATTGGGTGACGTCGTAATGCCATAGTGCATAGTGCAGCATCATAAATGATAAATTAATCATAATTTACTGAGAAACACTGATAAACATATTAAATCTAATAAAATTAACTCTAAATAAGAAGTAAAAATAAGTACATTTAAAGAGCTTATCATCTGTCTAGATTCAAGATGCATCGAAACCAATTGGAACACTAACACTCCTCTTTTTATTAAGTTCAAGGAACAAACTAAATGAAATGAGAAAAGTGAAAAATGAAGGAAGACCATCTTTTCATTGTATCAAATGAACAAGAAGAAGGAACCTTTTATAGTGCTTCATTTATAAAACGTTTTCAAAGAAATAAACAAGAAAACGGCTTAAAGTTTTAAATGAACAAGAAGTTTTAGTAATTAAAATAAAGTTCATTTGTTTTAATAAAAAAATAAAATCACTGGAATTTCAAATAAGAAAAAATCATTTTAATTTAATGTTAAAAAATTAATATTTGGTTATTAAAAATAATATTTTTTTAATCCTCACTTCACTTCGTACGTTCCGTCACGGCGATGCGTGAAGAACTCATCAAAGGTACATATTTATTTATCTACCAAAATCGATTTTCTGATAATCTAAAGGCTTTTAACAACTTATCGTTTATTTTATGATTAATCCAAAAACTTCATTAATTGTACTGTAATTAACTTATCAAATTCATAATCCAGGCTCTATCAAAATTATTGCAAAACATATGGAACAGACATGAATCCATTTCTAATTAATCCTAAAATGTCTTTAATTTCTTTAATTGGAATGTAATTAATCCAACAACTTCATTAATTATACTGTAATTAATTTATCAAATTCATAATTGGGTGGTAACCACCCAAACATCAAATTATTAAACACGATTTAATTAGTAATTTTGATGCATTTTTCTTATTTTTCAATTTAATCTTTTTTTTTTTTTTTTTTTTTTGATATTTGGAGAAATTCTGTCATTCGTCTATGTTGCAATTAGAGTTTTTATTGGAATACTATTTAAAGTCTTCCCTTTTTAAGTTGTTCAGAAATTAGTTTCATGATAAATCAAATTTAGTATTGATGTTTCTTTCGAGTCTAACCCAGGAGAGCTTCTTAAATATTGCAATTCCCGTATTGACTAGCATGTCAAGAAAATTCAAGTTGGATTGATCATCATATCTTGTGTTTATTCGAATCTTGGGAACAAGAAAATCCTTTATCTCTCTCAAACATATATATTGAATATCTTAAGCAATCTGTTCAACCCAATTGCATTTAATTATCTATAATCGAAGTTAAGTACATAATTGCTGAGAAAGGTGGTTGCCTCATTAGGTTAATATTGGATGAAACAAAATAACTCTTCAGATAGGTATGATGTTATTCCAAAGATGGGGTTTTTGTTTATTGTGGGTTTTTTTTCCACCTACCCCCCCAGATACTATAACCATGAAATAACACTAAGTCCTATCAACATTTCAAAGAACCCAATACAACACAATCATATAAAACATATCGATATTCGACGATACTTGGCCTGATTGAAAACAACAAGTTTCTTTGGAACACATCGATGCCAAGAAGGAAGTTGCTAATAATTTCACAAAAGCATTGGATGTTGTTCAATTTCAGCCTCTAAGAGTTGCTTTGGGCTTATACTCTCTTGATGCATAACAATTAGGGTAATTAGAATGAATAACAATTTTTAGAATAATTATTAACTATGTAGCGATATTTTTAAAAAATTGCAAATATAGCAAAAATCTATCAGTGATAGGCTTATATCGTTGATAGACTTCCGTATGAGTTATCAGTGATAGAACCAACATTTGCTCCATGGTCTATCAGTGATAGAAACCTCCTATTAATGATAGATTTTGACAAATTTTGCTATATTTACAATTTTTTTAAAATGTTGCTATATACTTGATTATTTTGAATATAATTGCTACATTTACAATTATCCCTAAATAAAATTTATTAGAAGAAGTTAATTTAAGTCCAAACCAAAAAGTTGTATCCAGGTAAGTCAAGTTCAATCTCATTTGAGGCTTTCCAAAACTCTACGAATAGAGGTCACCTTCATTTGATTCATTCGGGTGAAATTAGAGAATTCAAATTGAGCATCTCTTTTTCATTAAATTGATTATCTCTTCCCGAAATTGATCTTCTCTTCACCATCTTCAAAGTTGAAGATTTTGATTTGAGAACAAGCTTGTCAACTCTCAAGTCAAAGTCAATGTCTTAGACAAATCATTAGAAGATTATACATTAAAGACTATAATAATGCTACAAATTTATAAAATCTAAGTTTATTTCAACCAATTAAATTTTCTTTGCTATTTTACCAAACTTTTGTAGCTAATTCAACAAGTAAACCATAACTGATCAAATACAGAGTTAGAAACATATCAATTCCACAAGATGAAAGAGACTTCTTCCTTTTTAAATAAGTAGTTGCGTACGGAATATAATTTTCTTCGGTTAACTTTGAAGAATTAATGAATCCAACTCTTATTTGTTTGGATTCAAAAATCAACAGCATAACAATTGTATTATTTAAAATCAGATTGATGATTAAAATAATAATTTATTTATTGAGGAAAAATTTTGGGAATTGAAAAAAAAATTGAGAAAATATTTTTACAAATATAACAATATATTTACGTAAATCTATTAATTTATGTCAATTCTGATATTTTGGTTTAATATTTAAAATAAAGTAATTTTTAATTCAGTTTGCTATATTTAAAAACAACCATTAGAAATTTTAATTATTAATAATAATTTGTGAAGTATTGAGTTGCATGTATTGATTTTACGTCCACAGTACACAATTTAAGCTTGAGTTTTACTTTTTTGAGCCATTTTTAAGTCAATCCAATGAGGAAGGTGAGATCCATCGTTGGATAATATACAATAATGCATCCTCAAATTGAACCCTTAAATAATTTGTACAAATATTAAAAAGAAAAAATTGGAACACACCAAAACTTTTAATCTAGAAAATATACTTTCCAAATTTTAATAACATCCATTTGGTTAACGTTGAACCTAACTTGCGAAATCGTAGAAAATTGTGGTTCGAATATCACTTAATTAATTTGAAAAATTAAGCTTTTGACCGAATTGGATAGAATTAAATTTTTTGGTGAATTTTCCCTCAAAAAGATTTTTTTTGAATAAAATTTTAAAATTAAATCAATAAATTATTAATAAATATGTAAGAATTGTTTTTCTTATATTTCGTGTGTTGGTAATGAAAAAAAAATCAAATTTAAAAAATAAAATAAATTAAAATATTTATAAAATACAAAATATATTATTTTAATCTATCAATGATAGACCTTAGATAGGATAATTTATTAAAATGTAGTAGTTTTTAAAACTTATTATGAAAATAATGTTGTTCTCAAACTTATTATAAAAATACTGCTATTCTTTATTTATTTTATTTTTTTAATCCTTTCCAGTAGGGCGAGTTAAAACTCGCCCCAGGTCAAATTTTTTAAAAAAAAAAAAAAGAAAAAAATGAAAAGGTGGAGAGGGTTGGGTGAGTCGACTCGCCCTCTTTACATCTTTTTTCTCTTTTCTTCTCTTTAAGAATACTTTAAATTTAAATATTTTATTTTCCCTAATCAATTATAAAATTTTTATTTAATATATTTCTATAAAATTTATTTAAAATATTTTTTTTTAAATATATAATATTATATAGTATATTTAATAATTCTTTTTAAACTTGATTTTAACTATTTTAGAATCATTATTAATATTAATATGGTTGAGAGAAAAAATAAGGTCACAAAGTAAAAATAATTTCAAATTTGATCTAGCCTACTGGGATTAATATTAAAAAAATGTCGTCGTTTTAAATAAGAATTATTTTAACTAATTTAATCTTTCTCTCACATTTTAATTAATTTCTATTTTTTAAATTTAATACTAATTTATTTTTCTTCCTCTAACAAAAAAAAAAAAACTCACATTCTCTCACATTTTAACTAATTTATTTTTTTCTCTCTTTTTTTTTTTTTTTTCTCTTTTTTTAGTTTATATATATATAAACTAAATAAATATGATGGTATGTGGTTTGTCACTATAATTCGTCATCGCTTTCATTTGACAAGTGTTCATCCACATTGTTGGTGAAGTCGTCAATGACATGAAGCGCAATTGGTATTTTCACCATTGTAGGATCAACGTCAACTCTGCATATAGTGTCATCCTCAATTTGTTCATCCACACGATGTCCAAAAACGAATTTCAATACATTAAGTTGTTTGTTCTCAATATCTTCCACTTCTGGCACTTTCCATATACGTTTATTTTGGATGACTTGAATAATTTTTCAGTTGGTACCATTTTTTGGTCTTTGAGATAAAACACTTGATGTGCCTAGGTTATGAGAATGACTGGTTTCTTAGGGAACAAAAAAATGAGACGTGTTAATTACTTTGTACCCTAATCCCACACGTGCCCTTTGGCTTTTGGTGTTGTCGGTGTTATACCACCGACACTTAAATTGCCAAACATTTCTTTCCATCGAATATTGAACAAGCAATACTTTATCCAGAACATGGTAGAAGTTATTGTCACCACTTTCACTTGCATCGCTTTCACTAAAGACCATTACTCCACTATTTTAAGTAGTATGTCGGGAATCAAGTAACAGTATGGAATCTTACACCACCCACGATGCATCCATCGTAACAACAAACATCAAATGATTGTCCCATTACAAGGGAGAAGAAATCGTGGAGAGTAGATTTTCCAAAAACTCAACGCAATTTCTATAACCTAAAATAAAATGGGACAATTGATTAATACATGTTAACGTCTTTAATAATACGTTTAGTGCATATATGGTCACACGAAAGTCTCCTTAATCGTGCTCAAAACCAATTCAGGGAAATCCCTTGTCGGATAATCTTTTTTATTCAATCCCGAAACATTTTTGAGCGTCAAATATATTGGGCCCCCTCAATGTTTCTTGAATGAAAGAATTTAAATGAGTTTAATTTGTGTAACAACATTTATAACAAAATACTCAACAACTATACCTAAAAAATACGAAGCTAAGAAATGCTTACTTGCGATACTTCGATATTTTGTTTACATTGTTGAGGATGTACCAATGGAAGAGACATTTCTCTTCCTGTGTTAAAGTACGAAGACTTGACGCACCTAAGGCTCGTACTTTCTGCTTAAAAATTTCAAATTCACCAATCACCTTGTCCTCTAGAATAGTATCATCGTTTCGTTCCGCTTTTTTATGATTTGAGTTTCTATAACCCATTAGTTAACGCGAATAAAAGAATGCCTCGATTCATTTCATCAATACACTTCCTGCAATGGACACCTCGCAAACGTATTTTTGGTTTTTCGAACATACTTTTAAAGTGGTGGGGTTTGACTTTGTTTTCATGGGGAAATACATCCAAGTGTAAGAAACCGGATCAGTAACCTTGATTTCATATAATTAGTGAACGACTAGTTGTACCATGACACTAAAGAAGGTAGGTGAAAATATACATTGATTTTTCTACCAGGAGATCTAGGACCAAGTATGAGCAGTGACATAAAGAAATTTTTCTCATGCATTTCCATGGTGGCAACCCTGGGTAAAGAAGTAAAACACAAAATACGTCCACAAACCGTGTATGAGGGTCTAATATGAAAATCAAATAGTTTAAACCTTATCGCTGAAGTCAACCCCAAAACGCGCCATTCCGTGTGAATCAGGAAAGCAAATCAGGAAAATATTCATATACAAATAGTGTTTCATCCTCCCCGCATCAGTTTGCGAATGTTCTCCCAACACATCATCTGATTTTAATAATTTTAATCTCTATGTCCCATTCATATCAAGCAAACCCTTTCCCTACCGATAACAGAACAAAATGCGTGTAACTCTTGGTTAGACCAAAGGAACAGTGGTAGAATTACCTTTATACGAATTTTTTTTTTCCTCTGTTGTGATTAACCTTGTACTGAGTCTTGCCACATGCAGGGCAATGTTGCAAATCAGTAAACTTTTTTCAGTACAATACATAGTCGTATTTGCACGCGTGAATAGTCTCGTTTCCCAAGCCTAAGTCACAAAATTTTCGTTTGGCTTCATAAAAAGAACTAGGCATAGTAGTATTACACATTGGAAACGATGCTCTTAAGAGTTCTAACAACATGTCGAATGAATTATTACTCCAACCATTTAGAACCTTCACATGCATCAACTTAACCAAAAAAATCGAGAAAAATTCAAAACAATCGAGGTACAACTCATTACGTGTTTCATTCAATAAGTCCTGAAATATGTTTGTTGTATCTTTATCTATATCTACCCTAATGCTTCTCGGCATTTCATCCTCCAAACGACCTTCCTCTGTTTCTTCTTCCTGTTCAATCGAGACTTGTAAATCATTTAGCATACCAAACATATCATCTTCTTCATCAAATTGTCTACTATTAATTTCTTCATCAAAATGGTTACTACTAGTTCCTTCATCAAAAAGATTTCTACTAGTTCATTAATCAAAAAGGTTACTACTAGTTTCTTCATGAAAGTTTTTTGTACTTTTAAAGCTAATTGACTTTCTATGATACACTCATTCTGTGTAGTAGAGGATATTCCAATAATCAGTAGATGTCGTTCCACGCCTTCTAGTGAGTTCCAATTTGAGTTTATACATCTCTTGCATGAACACCTTATTCGTCCGTAGACATCAACGTGAAACTTGCCAACTTCTAAAAACTGGATCACTCCCTCTCTATACTCAAGAGAAAATTTATTCTTAAGTTTCATCTAATCCTAGTCCATCATTTAAGTCCCTAAAACATAAACAAGTTTGATTAGAAACATATCTCTCACTCTCTTATATCCATAACTTACTCCCCTTTAATACAATCCCTCCCAAAATTTTCCCAACTAAAACTAACCTTCAAAACTACAGTAGGCTACCCATAACTAACAGGATGCCACACAACCTCATTTAACCACAAAACAAATTTCAATCCTTCCGCATCTTATCCACCCCCTTCCCACAACGCTAAACCCTTAACTAACCCTACTTCCTTTTTCAAAAACATTCCAGAATAAAAAACAAAAGTCAAACAAAAAAGCTACCATAACTTATAGGATAAAACATCCCAATCAAACCAAAATATTTTCAAACTACTAAAAAATTAAAACAACTAGAAATTCCACTAAATACTACCGTAACTGCATGATAGCCAAAATGAATCTTAACACAGAATTTTTAAAACAATAATAGCCCCCTCACCCCCCCCCAAATTTTCAACCCTAACCCCACCAAATTTTTCAATTCAAAACCTCCCCTCCTTTAAAATTTCAAATTCAAAACCCCCTCAAAATTTTCATCCTCAACCCCTCTTCTCCCATCTATTTTTTCAACCCACGCATTCAAATTTTTAATTCTCGAATCAATTTCTCAAATACCCCCCCTCCCTCCCCCTTCAATTTTAACCCACATTCCAAAAAATTGAAACCTCAAAAAAACACAAATCTATTCCCTAAACAAAACCTTAAAACTATAATTTTTTTCTATTAAAAATCCCTAAAAAACTAATTCAAAAACAAAGCCTAACTAAACTAATTTTTAAACTAAACCAAACCTAAAAACTAACATTTTAAGGGTTTAAGGGTTTTAAAAACTTACCGTTCAAAATAAGAGATGAAGTGGTGGCAAGATGGGGGAAGAGGCCACAAGCGGCAGGCTTCACAAACCGAACCGAAAAGGAACAGACGGTTAGAGGCAATGGTCCCCCTCTTTCTCCTCTCTTTGTTTCGTCGAACGATCTCCCTTTCTCCTCTTTCGTTTCGTTTCTGTGTTACACAAAACTGCAACATCTTTTCTATATGGAAACTCCCGATGCAACACGAAACCGTCGGGAGATCCCCACTGTTCCTTACGCCAATAGTGACCCATTGAGAATGGCTAGAAACATTTCCAACGAATCACTAATGGAATCGGAAATAGTTAAAACCATTTGCCGTCGAGAATCGCAATCTAACATAATTAATGTTTGACAATTTCCGACGACCAATAAATGGCATCGGGAATGGTTTTAATCATTCCCGATGCATGACGAATATCATCAGGAACATGGGTGTCCATTTCTAACATTGTGCATGGACCATCGGGAGAAGTTATATATTTTAATTAATTGTTAACTATTCCCGATGCCCTGCACACAGACGTCAAAAATAGGTTCTTGTTTTCTCACGACCCTTTCACGGGGTTGGAAAAAGGTAATAATAAAATAATGTGCTCGCCTTTGCCCGACGTGTGAAAAATGGCAGCGAGGAAAGGTATCTGTCTCGAGTCATTTCTTTCGACGCCATTTTGTGCGTCGAAAAAACGTCGATTTCTTGTAATGGGGGGACAACACATACATGTTAAATCTTCGGACAAACATTCAAAGTCCTCTAGAAGACACAAGCATTCACAATCGAAAGTCAAATTCGACAAACATTATCTGTCAGATGGTTGCCACTGTTCACAGGTAACAAGAACTGGCTGACATCAAACTCATGGTTCAACGTTGCTTGAGGTTTGTACTGGAAACATTTCTATTTTGATTTTATCTCACTTAAACAATCATTAAACGCTCTTGAACGATCATTTATTTAGTTTAAATGATCATTTGGATCGTCTAAACGATAGTTTAATTTGTTTAGTAACGATCATTTATATCAACAAAACAATCGTTTATTTTTTATATGAAGAATACTTCAAAAACCTTGAATGATTGTGTAATTTTGTTCAAATAAAACGTTTTTAATTCTTCATTTTTATTTTCCATTTCAAGATCAAACAATGATGAACCAACTATCTAGAAAGGTGGCTCACGCTGATAATGACCGTGATGGACAGGGTGATGTGAATGGAGATACCTATCGGGACTTTGATGAATGTCATGGTGAGGATGATAATCAGATCCTCTGTAATGAACATTTGATCACTGATGAACCATAA

mRNA sequence

ATGACAAGTTCATCGAGACTACCTAAACATACTTGGACTAAAGAGGAAGAGGCAAGCCTCGTGGAGTTGGTCAATGCTGGTGGGTGGAGGTCTGACAATGGAACCTTTCACCCCGGGTACTTAAATCAGCTGGCGAGAATGATGGCCTTCAAGATCCCAGGTTGTAATATCCATGCTTCAACCATCGATAGCCGAATCAAATTGTTGAAGAGAATGTTCCATGCACTTGCGGAGATGCGTGGCCCAAATTGTAGTGGTTTTGGGTGGAATGATGAAAAAAAATGCATCGTCGCTGAGAAAGAAAGTCATCCGGCAGCGAAAGGCCTCCTTAATAAGTCGTTTGTCCACTATGACGAACTGTCTTACGTGTTTGGCAAAGATCGTGCAACAGGAGGCCGGGCTGAGATTTTTGCAGACATTGGGTCAAACGATCCTGCTGGGTATGACGCATTTGTTGCTGACGCTGCGCCAGATACGAACTTCTCCCCAATGTACAGTCCGAGATTGAACATGTCACCTGATGATTTGATGGAAACCAGAACCGCTAGGGTCAGTGAACGTAGGAATGTTTCAAGTGGGTCTAGGCGGAAACATACAGGACATGCCACAGATAGTGGGGACATAGTTTGTACTGCCATCGTGTACGGAAATGAACAACTTCATCGCATTGCTGAATGGCCTATCCTACAACGTCAAGACGCAACCCAAACATGTCAAGAGATTTTTTTGAAAAAACCACAACCAGTGCCTAATGATTGCACAGATCAAAGATGGAGGTGGTTTGAGAATTGCCTAGGTGCATTAGATGGAACGTACATAAAAGTGAACGTTCCAGCAAGTGATCGGGCTAGGTATAGAACACGCAAGGGGGAGGTGGCCACAAATGTACTTGGTGTGTGTGACACGAAAGGAGATTTCATTTACGTACTTGCCGGTTGGGAAGGATCAGCTGCAGACTCACGTATCCTCCGTGATGCCCTTTCAAGACCTAATGGGTTGAAGGTGCCCAAGGGGTATTACTACCTGGTTGATGTCGGGTACCCAAATGCGGAGGGTTTCCTGGCACCATACAGAGGCCAACGCTATCACTTGCAAGATCGTGTACCAAATCTAAACAATCTTGATCAAACAATGATGAACCAACTATCTAGAAAGGTGGCTCACGCTGATAATGACCGTGATGGACAGGGTGATGTGAATGGAGATACCTATCGGGACTTTGATGAATGTCATGGTGAGGATGATAATCAGATCCTCTGTAATGAACATTTGATCACTGATGAACCATAA

Coding sequence (CDS)

ATGACAAGTTCATCGAGACTACCTAAACATACTTGGACTAAAGAGGAAGAGGCAAGCCTCGTGGAGTTGGTCAATGCTGGTGGGTGGAGGTCTGACAATGGAACCTTTCACCCCGGGTACTTAAATCAGCTGGCGAGAATGATGGCCTTCAAGATCCCAGGTTGTAATATCCATGCTTCAACCATCGATAGCCGAATCAAATTGTTGAAGAGAATGTTCCATGCACTTGCGGAGATGCGTGGCCCAAATTGTAGTGGTTTTGGGTGGAATGATGAAAAAAAATGCATCGTCGCTGAGAAAGAAAGTCATCCGGCAGCGAAAGGCCTCCTTAATAAGTCGTTTGTCCACTATGACGAACTGTCTTACGTGTTTGGCAAAGATCGTGCAACAGGAGGCCGGGCTGAGATTTTTGCAGACATTGGGTCAAACGATCCTGCTGGGTATGACGCATTTGTTGCTGACGCTGCGCCAGATACGAACTTCTCCCCAATGTACAGTCCGAGATTGAACATGTCACCTGATGATTTGATGGAAACCAGAACCGCTAGGGTCAGTGAACGTAGGAATGTTTCAAGTGGGTCTAGGCGGAAACATACAGGACATGCCACAGATAGTGGGGACATAGTTTGTACTGCCATCGTGTACGGAAATGAACAACTTCATCGCATTGCTGAATGGCCTATCCTACAACGTCAAGACGCAACCCAAACATGTCAAGAGATTTTTTTGAAAAAACCACAACCAGTGCCTAATGATTGCACAGATCAAAGATGGAGGTGGTTTGAGAATTGCCTAGGTGCATTAGATGGAACGTACATAAAAGTGAACGTTCCAGCAAGTGATCGGGCTAGGTATAGAACACGCAAGGGGGAGGTGGCCACAAATGTACTTGGTGTGTGTGACACGAAAGGAGATTTCATTTACGTACTTGCCGGTTGGGAAGGATCAGCTGCAGACTCACGTATCCTCCGTGATGCCCTTTCAAGACCTAATGGGTTGAAGGTGCCCAAGGGGTATTACTACCTGGTTGATGTCGGGTACCCAAATGCGGAGGGTTTCCTGGCACCATACAGAGGCCAACGCTATCACTTGCAAGATCGTGTACCAAATCTAAACAATCTTGATCAAACAATGATGAACCAACTATCTAGAAAGGTGGCTCACGCTGATAATGACCGTGATGGACAGGGTGATGTGAATGGAGATACCTATCGGGACTTTGATGAATGTCATGGTGAGGATGATAATCAGATCCTCTGTAATGAACATTTGATCACTGATGAACCATAA

Protein sequence

MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHASTIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQEIFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGVCDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRGQRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQILCNEHLITDEP
Homology
BLAST of Pay0013995 vs. ExPASy TrEMBL
Match: A0A1S3C8Z4 (uncharacterized protein LOC103498331 OS=Cucumis melo OX=3656 GN=LOC103498331 PE=3 SV=1)

HSP 1 Score: 893.6 bits (2308), Expect = 3.1e-256
Identity = 428/430 (99.53%), Postives = 428/430 (99.53%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120
           TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL
Sbjct: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120

Query: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180
           SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR
Sbjct: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180

Query: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240
           TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE
Sbjct: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240

Query: 241 I-FLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGV 300
           I  LKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGV
Sbjct: 241 IELLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGV 300

Query: 301 CDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRG 360
           CDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRG
Sbjct: 301 CDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRG 360

Query: 361 QRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQIL 420
           QRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQIL
Sbjct: 361 QRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQIL 420

Query: 421 CNEHLITDEP 430
           CNEHLITDEP
Sbjct: 421 CNEHLITDEP 430

BLAST of Pay0013995 vs. ExPASy TrEMBL
Match: A0A5A7UKY6 (Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold302G001640 PE=4 SV=1)

HSP 1 Score: 505.0 bits (1299), Expect = 3.1e-139
Identity = 249/285 (87.37%), Postives = 258/285 (90.53%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120
           TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL
Sbjct: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120

Query: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180
           SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR
Sbjct: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180

Query: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240
           TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE
Sbjct: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240

Query: 241 IFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARY 286
           I +++ + +P      R R     +  +D     + VP  D  +Y
Sbjct: 241 I-VRQLEAIPELTLMDRCRLMRILMRNVDDMKAFLEVP--DNMKY 282

BLAST of Pay0013995 vs. ExPASy TrEMBL
Match: A0A5A7U252 (Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold264G00280 PE=4 SV=1)

HSP 1 Score: 458.4 bits (1178), Expect = 3.3e-125
Identity = 229/268 (85.45%), Postives = 237/268 (88.43%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEASLVELVNA GWRSDNGTF PGYLNQLARMMAFKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEASLVELVNASGWRSDNGTFRPGYLNQLARMMAFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE-----SHPAAKGLLNKSFV 120
           TIDSRIKL+KRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE     SHPAAK LLNKSFV
Sbjct: 61  TIDSRIKLMKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKEVFDDWSHPAAKSLLNKSFV 120

Query: 121 HYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDD 180
           HYDELSYV GKDRATGGR E FADIGSNDPAGYDAF ADAAPDTNFSPMYSP LNMSPDD
Sbjct: 121 HYDELSYVVGKDRATGGRTESFADIGSNDPAGYDAFAADAAPDTNFSPMYSPGLNMSPDD 180

Query: 181 LMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDAT 240
           LMETRT+RVSERRNVSSGS+RK TGHATDSGDIV  AI YGNEQLHRIAEWPILQRQDAT
Sbjct: 181 LMETRTSRVSERRNVSSGSKRKRTGHATDSGDIVRIAIEYGNEQLHRIAEWPILQRQDAT 240

Query: 241 QTCQEIFLKKPQPVPNDCTDQRWRWFEN 264
           QT QEI +++ + +P      R R   N
Sbjct: 241 QTRQEI-VRQLEAIPELTLMDRCRLMRN 267

BLAST of Pay0013995 vs. ExPASy TrEMBL
Match: A0A5A7SWD8 (Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold515G00010 PE=3 SV=1)

HSP 1 Score: 457.2 bits (1175), Expect = 7.5e-125
Identity = 232/290 (80.00%), Postives = 245/290 (84.48%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEA LVELVNAGGWRSDNGTF PGYLNQLARMMAFKIPGCNIHAS
Sbjct: 347 MTSSSRLPKHTWTKEEEAGLVELVNAGGWRSDNGTFRPGYLNQLARMMAFKIPGCNIHAS 406

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE-----SHPAAKGLLNKSFV 120
           TIDSRIKL+KRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE     SHPAAKGLLNKSFV
Sbjct: 407 TIDSRIKLMKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKEVFDDWSHPAAKGLLNKSFV 466

Query: 121 HYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDD 180
           HYDELSYVFGKDRATGGRAE FADIGSN+P GYDAF ADA PDT+FSPMYS  LNMSPDD
Sbjct: 467 HYDELSYVFGKDRATGGRAESFADIGSNNPPGYDAFAADAVPDTDFSPMYSLGLNMSPDD 526

Query: 181 LMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDAT 240
           LMETRTARVSERRNVSSGS+RK  GHATDSGDIV TAI YGNEQLHRIAEWPILQRQDAT
Sbjct: 527 LMETRTARVSERRNVSSGSKRKRPGHATDSGDIVRTAIEYGNEQLHRIAEWPILQRQDAT 586

Query: 241 QTCQEIFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARY 286
           QT QEI +++ + +P      R R     +  +D     + VP  D  +Y
Sbjct: 587 QTRQEI-VQQLEAIPELTLMDRCRLMRILMRNVDDMKAFLEVP--DNMKY 633

BLAST of Pay0013995 vs. ExPASy TrEMBL
Match: A0A5A7VF53 (Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold37G00250 PE=4 SV=1)

HSP 1 Score: 455.7 bits (1171), Expect = 2.2e-124
Identity = 230/290 (79.31%), Postives = 243/290 (83.79%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEA LVELVNAGGWRSDNGTF PGYLNQLARMM FKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEAGLVELVNAGGWRSDNGTFRPGYLNQLARMMTFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE-----SHPAAKGLLNKSFV 120
           TIDSRIKL+KRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE     SHPAAKGLLNKSFV
Sbjct: 61  TIDSRIKLMKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKEVFDDWSHPAAKGLLNKSFV 120

Query: 121 HYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDD 180
           HYDELSYVFGKDRATGGRAE FADIGSNDP GYDAF ADA PDT+F PMYSP LNMSPDD
Sbjct: 121 HYDELSYVFGKDRATGGRAESFADIGSNDPPGYDAFAADAVPDTDFPPMYSPGLNMSPDD 180

Query: 181 LMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDAT 240
           LMETRTARVSERRNVSS S+RK  GHATDSGDIV TAI YGNEQLHRIAEWPILQRQDAT
Sbjct: 181 LMETRTARVSERRNVSSESKRKRPGHATDSGDIVRTAIEYGNEQLHRIAEWPILQRQDAT 240

Query: 241 QTCQEIFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARY 286
           QT Q+I +++ + +P      R R     +  +D     + VP  D  +Y
Sbjct: 241 QTRQDI-VRQLEAIPELTLMDRCRLMRILMRNVDDMKAFLEVP--DNMKY 287

BLAST of Pay0013995 vs. NCBI nr
Match: XP_008459131.1 (PREDICTED: uncharacterized protein LOC103498331 [Cucumis melo])

HSP 1 Score: 893.6 bits (2308), Expect = 6.4e-256
Identity = 428/430 (99.53%), Postives = 428/430 (99.53%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120
           TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL
Sbjct: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120

Query: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180
           SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR
Sbjct: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180

Query: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240
           TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE
Sbjct: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240

Query: 241 I-FLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGV 300
           I  LKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGV
Sbjct: 241 IELLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGV 300

Query: 301 CDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRG 360
           CDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRG
Sbjct: 301 CDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRG 360

Query: 361 QRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQIL 420
           QRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQIL
Sbjct: 361 QRYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDNQIL 420

Query: 421 CNEHLITDEP 430
           CNEHLITDEP
Sbjct: 421 CNEHLITDEP 430

BLAST of Pay0013995 vs. NCBI nr
Match: KAA0054345.1 (retrotransposon protein [Cucumis melo var. makuwa] >TYK12382.1 retrotransposon protein [Cucumis melo var. makuwa])

HSP 1 Score: 505.0 bits (1299), Expect = 6.4e-139
Identity = 249/285 (87.37%), Postives = 258/285 (90.53%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120
           TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL
Sbjct: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKESHPAAKGLLNKSFVHYDEL 120

Query: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180
           SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR
Sbjct: 121 SYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDDLMETR 180

Query: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240
           TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE
Sbjct: 181 TARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDATQTCQE 240

Query: 241 IFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARY 286
           I +++ + +P      R R     +  +D     + VP  D  +Y
Sbjct: 241 I-VRQLEAIPELTLMDRCRLMRILMRNVDDMKAFLEVP--DNMKY 282

BLAST of Pay0013995 vs. NCBI nr
Match: KAA0048317.1 (retrotransposon protein [Cucumis melo var. makuwa])

HSP 1 Score: 458.4 bits (1178), Expect = 6.9e-125
Identity = 229/268 (85.45%), Postives = 237/268 (88.43%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEASLVELVNA GWRSDNGTF PGYLNQLARMMAFKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEASLVELVNASGWRSDNGTFRPGYLNQLARMMAFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE-----SHPAAKGLLNKSFV 120
           TIDSRIKL+KRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE     SHPAAK LLNKSFV
Sbjct: 61  TIDSRIKLMKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKEVFDDWSHPAAKSLLNKSFV 120

Query: 121 HYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDD 180
           HYDELSYV GKDRATGGR E FADIGSNDPAGYDAF ADAAPDTNFSPMYSP LNMSPDD
Sbjct: 121 HYDELSYVVGKDRATGGRTESFADIGSNDPAGYDAFAADAAPDTNFSPMYSPGLNMSPDD 180

Query: 181 LMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDAT 240
           LMETRT+RVSERRNVSSGS+RK TGHATDSGDIV  AI YGNEQLHRIAEWPILQRQDAT
Sbjct: 181 LMETRTSRVSERRNVSSGSKRKRTGHATDSGDIVRIAIEYGNEQLHRIAEWPILQRQDAT 240

Query: 241 QTCQEIFLKKPQPVPNDCTDQRWRWFEN 264
           QT QEI +++ + +P      R R   N
Sbjct: 241 QTRQEI-VRQLEAIPELTLMDRCRLMRN 267

BLAST of Pay0013995 vs. NCBI nr
Match: KAA0034843.1 (retrotransposon protein [Cucumis melo var. makuwa])

HSP 1 Score: 457.2 bits (1175), Expect = 1.5e-124
Identity = 232/290 (80.00%), Postives = 245/290 (84.48%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEA LVELVNAGGWRSDNGTF PGYLNQLARMMAFKIPGCNIHAS
Sbjct: 347 MTSSSRLPKHTWTKEEEAGLVELVNAGGWRSDNGTFRPGYLNQLARMMAFKIPGCNIHAS 406

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE-----SHPAAKGLLNKSFV 120
           TIDSRIKL+KRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE     SHPAAKGLLNKSFV
Sbjct: 407 TIDSRIKLMKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKEVFDDWSHPAAKGLLNKSFV 466

Query: 121 HYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDD 180
           HYDELSYVFGKDRATGGRAE FADIGSN+P GYDAF ADA PDT+FSPMYS  LNMSPDD
Sbjct: 467 HYDELSYVFGKDRATGGRAESFADIGSNNPPGYDAFAADAVPDTDFSPMYSLGLNMSPDD 526

Query: 181 LMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDAT 240
           LMETRTARVSERRNVSSGS+RK  GHATDSGDIV TAI YGNEQLHRIAEWPILQRQDAT
Sbjct: 527 LMETRTARVSERRNVSSGSKRKRPGHATDSGDIVRTAIEYGNEQLHRIAEWPILQRQDAT 586

Query: 241 QTCQEIFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARY 286
           QT QEI +++ + +P      R R     +  +D     + VP  D  +Y
Sbjct: 587 QTRQEI-VQQLEAIPELTLMDRCRLMRILMRNVDDMKAFLEVP--DNMKY 633

BLAST of Pay0013995 vs. NCBI nr
Match: KAA0065737.1 (retrotransposon protein [Cucumis melo var. makuwa])

HSP 1 Score: 455.7 bits (1171), Expect = 4.5e-124
Identity = 230/290 (79.31%), Postives = 243/290 (83.79%), Query Frame = 0

Query: 1   MTSSSRLPKHTWTKEEEASLVELVNAGGWRSDNGTFHPGYLNQLARMMAFKIPGCNIHAS 60
           MTSSSRLPKHTWTKEEEA LVELVNAGGWRSDNGTF PGYLNQLARMM FKIPGCNIHAS
Sbjct: 1   MTSSSRLPKHTWTKEEEAGLVELVNAGGWRSDNGTFRPGYLNQLARMMTFKIPGCNIHAS 60

Query: 61  TIDSRIKLLKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE-----SHPAAKGLLNKSFV 120
           TIDSRIKL+KRMFHALAEMRGPNCSGFGWNDEKKCIVAEKE     SHPAAKGLLNKSFV
Sbjct: 61  TIDSRIKLMKRMFHALAEMRGPNCSGFGWNDEKKCIVAEKEVFDDWSHPAAKGLLNKSFV 120

Query: 121 HYDELSYVFGKDRATGGRAEIFADIGSNDPAGYDAFVADAAPDTNFSPMYSPRLNMSPDD 180
           HYDELSYVFGKDRATGGRAE FADIGSNDP GYDAF ADA PDT+F PMYSP LNMSPDD
Sbjct: 121 HYDELSYVFGKDRATGGRAESFADIGSNDPPGYDAFAADAVPDTDFPPMYSPGLNMSPDD 180

Query: 181 LMETRTARVSERRNVSSGSRRKHTGHATDSGDIVCTAIVYGNEQLHRIAEWPILQRQDAT 240
           LMETRTARVSERRNVSS S+RK  GHATDSGDIV TAI YGNEQLHRIAEWPILQRQDAT
Sbjct: 181 LMETRTARVSERRNVSSESKRKRPGHATDSGDIVRTAIEYGNEQLHRIAEWPILQRQDAT 240

Query: 241 QTCQEIFLKKPQPVPNDCTDQRWRWFENCLGALDGTYIKVNVPASDRARY 286
           QT Q+I +++ + +P      R R     +  +D     + VP  D  +Y
Sbjct: 241 QTRQDI-VRQLEAIPELTLMDRCRLMRILMRNVDDMKAFLEVP--DNMKY 287

BLAST of Pay0013995 vs. TAIR 10
Match: AT5G41980.1 (CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (InterPro:IPR006912); BEST Arabidopsis thaliana protein match is: unknown protein (TAIR:AT1G43722.1); Has 1807 Blast hits to 1807 proteins in 277 species: Archae - 0; Bacteria - 0; Metazoa - 736; Fungi - 347; Plants - 385; Viruses - 0; Other Eukaryotes - 339 (source: NCBI BLink). )

HSP 1 Score: 101.7 bits (252), Expect = 1.5e-21
Identity = 49/134 (36.57%), Postives = 77/134 (57.46%), Query Frame = 0

Query: 260 WFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGVCDTKGDFIYVLAGWEGSAAD 319
           +F++C+G +D  +I V V   ++  +R   G +  NVL        F YVLAGWEGSA+D
Sbjct: 139 YFKDCVGVVDSFHIPVMVGVDEQGPFRNGNGLLTQNVLAASSFDLRFNYVLAGWEGSASD 198

Query: 320 SRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRGQRYHLQDRVPNLNNLDQTMM 379
            ++L  AL+R N L+VP+G YY+VD  YPN  GF+APY G   + ++    + N    ++
Sbjct: 199 QQVLNAALTRRNKLQVPQGKYYIVDNKYPNLPGFIAPYHGVSTNSREEAKEMFNERHKLL 258

Query: 380 NQLSRKVAHADNDR 394
           ++   +   A  +R
Sbjct: 259 HRAIHRTFGALKER 272

BLAST of Pay0013995 vs. TAIR 10
Match: AT1G43722.1 (unknown protein; BEST Arabidopsis thaliana protein match is: unknown protein (TAIR:AT5G28730.1); Has 924 Blast hits to 912 proteins in 109 species: Archae - 0; Bacteria - 0; Metazoa - 222; Fungi - 31; Plants - 661; Viruses - 0; Other Eukaryotes - 10 (source: NCBI BLink). )

HSP 1 Score: 88.2 bits (217), Expect = 1.8e-17
Identity = 50/137 (36.50%), Postives = 73/137 (53.28%), Query Frame = 0

Query: 235 TQTCQEIFLKKPQPVPNDCTDQR-WRWFENCLGALDGTYIKVNVPASDRARYRTRKGEVA 294
           T T QE++ + P+ +     DQR W +F   +GA+DGT++ V V    +  Y  R    +
Sbjct: 150 TPTRQELY-RIPERLQ---VDQRYWPYFSGFVGAMDGTHVCVKVKPDLQGMYWNRHDNAS 209

Query: 295 TNVLGVCDTKGDFIYVLAGWEGSAADSRILRDALSRPNGLKVPKG-YYYLVDVGYPNAEG 354
            N++ +CD K  F Y+  G  GS  D+ +L+ A    +   +P    YYLVD GYPN +G
Sbjct: 210 LNIMAICDLKMLFTYIWNGAPGSCYDTAVLQIAQQSDSEFPLPPSEKYYLVDSGYPNKQG 269

Query: 355 FLAPYRGQ-----RYHL 365
            LAPYR       RYH+
Sbjct: 270 LLAPYRSSRNRVVRYHM 282

BLAST of Pay0013995 vs. TAIR 10
Match: AT5G28950.1 (unknown protein; BEST Arabidopsis thaliana protein match is: unknown protein (TAIR:AT5G41980.1); Has 448 Blast hits to 446 proteins in 74 species: Archae - 0; Bacteria - 0; Metazoa - 31; Fungi - 21; Plants - 396; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink). )

HSP 1 Score: 82.0 bits (201), Expect = 1.3e-15
Identity = 36/79 (45.57%), Postives = 55/79 (69.62%), Query Frame = 0

Query: 260 WFENCLGALDGTYIKVNVPASDRARYRTRKGEVATNVLGVCDTKGDFIYVLAGWEGSAAD 319
           +F++C+GA+D T+I   V       +R RKG+++ N+L  C+   +F+YVL+GWEGSA D
Sbjct: 21  YFKDCVGAIDDTHIFAMVSQKKMPSFRNRKGDISQNMLAACNFDVEFMYVLSGWEGSAHD 80

Query: 320 SRILRDALSR-PNGLKVPK 338
           S++L DAL+R  N L VP+
Sbjct: 81  SKVLNDALTRNSNRLPVPE 99

BLAST of Pay0013995 vs. TAIR 10
Match: AT5G35695.1 (CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (InterPro:IPR006912); BEST Arabidopsis thaliana protein match is: unknown protein (TAIR:AT5G41980.1); Has 30201 Blast hits to 17322 proteins in 780 species: Archae - 12; Bacteria - 1396; Metazoa - 17338; Fungi - 3422; Plants - 5037; Viruses - 0; Other Eukaryotes - 2996 (source: NCBI BLink). )

HSP 1 Score: 72.8 bits (177), Expect = 7.6e-13
Identity = 35/61 (57.38%), Postives = 42/61 (68.85%), Query Frame = 0

Query: 306 FIYVLAGWEGSAADSRILRDALSRPNGLKVPKGYYYLVDVGYPNAEGFLAPYRGQRYHLQ 365
           FIYVL+GWEGSA DSR+L DAL +          +YLVD G+ N   FLAP+RG RYHLQ
Sbjct: 25  FIYVLSGWEGSAHDSRVLSDALRK----------FYLVDCGFANRLNFLAPFRGVRYHLQ 75

Query: 366 D 367
           +
Sbjct: 85  E 75

BLAST of Pay0013995 vs. TAIR 10
Match: AT5G28730.1 (unknown protein; BEST Arabidopsis thaliana protein match is: unknown protein (TAIR:AT1G43722.1); Has 496 Blast hits to 496 proteins in 68 species: Archae - 0; Bacteria - 0; Metazoa - 3; Fungi - 23; Plants - 470; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink). )

HSP 1 Score: 63.5 bits (153), Expect = 4.6e-10
Identity = 55/176 (31.25%), Postives = 74/176 (42.05%), Query Frame = 0

Query: 258 WRWFENCLGALDGTYIKVNVP--------ASDRARYRTR--------KGEVATNVLGVCD 317
           WR F + L A++   ++   P         S+R +  TR         G  + NVL +CD
Sbjct: 88  WRKFHDVLKAMERLAVEYIRPRKVEELRAISNRLQDDTRYWPFLMDLLGIASFNVLAICD 147

Query: 318 TKGDFIYVLAGWEGSAADSRILRDALSRPNGLKV-PKGYYYLVDVGYPNAEGFLAPYRGQ 377
               F Y   G  GS  D+R+L  A+S      V P   YYLVD GY N  G+LAPYR +
Sbjct: 148 LDMLFTYCFVGMAGSTHDARVLSAAISDDPLFHVPPDSKYYLVDSGYANKRGYLAPYRRE 207

Query: 378 RYHLQDRVPNLNNLDQTMMNQLSRKVAHADNDRDGQGDVNGDTYRDFDECHGEDDN 417
               QD + N N L   +    + K    D D D     N       D    +D+N
Sbjct: 208 HREAQDIISN-NFLTVNLFETHNIK----DYDFDNVDSENNVVQAPHDATDEQDNN 258

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
A0A1S3C8Z43.1e-25699.53uncharacterized protein LOC103498331 OS=Cucumis melo OX=3656 GN=LOC103498331 PE=... [more]
A0A5A7UKY63.1e-13987.37Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold... [more]
A0A5A7U2523.3e-12585.45Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold... [more]
A0A5A7SWD87.5e-12580.00Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold... [more]
A0A5A7VF532.2e-12479.31Retrotransposon protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold... [more]
Match NameE-valueIdentityDescription
XP_008459131.16.4e-25699.53PREDICTED: uncharacterized protein LOC103498331 [Cucumis melo][more]
KAA0054345.16.4e-13987.37retrotransposon protein [Cucumis melo var. makuwa] >TYK12382.1 retrotransposon p... [more]
KAA0048317.16.9e-12585.45retrotransposon protein [Cucumis melo var. makuwa][more]
KAA0034843.11.5e-12480.00retrotransposon protein [Cucumis melo var. makuwa][more]
KAA0065737.14.5e-12479.31retrotransposon protein [Cucumis melo var. makuwa][more]
Match NameE-valueIdentityDescription
AT5G41980.11.5e-2136.57CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (Int... [more]
AT1G43722.11.8e-1736.50unknown protein; BEST Arabidopsis thaliana protein match is: unknown protein (TA... [more]
AT5G28950.11.3e-1545.57unknown protein; BEST Arabidopsis thaliana protein match is: unknown protein (TA... [more]
AT5G35695.17.6e-1357.38CONTAINS InterPro DOMAIN/s: Putative harbinger transposase-derived nuclease (Int... [more]
AT5G28730.14.6e-1031.25unknown protein; BEST Arabidopsis thaliana protein match is: unknown protein (TA... [more]
InterPro
Analysis Name: InterPro Annotations of Melon (Payzawat) v1
Date Performed: 2021-10-25
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR024752Myb/SANT-like domainPFAMPF12776Myb_DNA-bind_3coord: 11..101
e-value: 1.0E-5
score: 26.4
IPR027806Harbinger transposase-derived nuclease domainPFAMPF13359DDE_Tnp_4coord: 268..389
e-value: 1.0E-12
score: 48.0
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 181..203
NoneNo IPR availablePANTHERPTHR46250MYB/SANT-LIKE DNA-BINDING DOMAIN PROTEIN-RELATEDcoord: 4..191

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Pay0013995.1Pay0013995.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
molecular_function GO:0046872 metal ion binding