Spg026064 (gene) Sponge gourd (cylindrica) v1

Overview
NameSpg026064
Typegene
OrganismLuffa cylindrica (Sponge gourd (cylindrica) v1)
DescriptionLINE-1 retrotransposable element ORF2 protein
Locationscaffold7: 572538 .. 590593 (-)
RNA-Seq ExpressionSpg026064
SyntenySpg026064
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideCDSthree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGTATTTTGTTGAAGATACGTGCGAGAAGCAGTTGATTTCTTTGTTCATCTCCTTTTTACAGTGGTTTGAAAATGTTCTAGTTGAGGTACTACAAAATCCTGTTTCTTCTTTCTTTCATAAAAAAAGTAAGGAAGAATTTGGAGTCATTAGATTGATTAAGTTCTTTTCAAACAATGAATGGTTCTTTGAATGTGTTGTATGGCCTTCCACGGGTGGGAGAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGCTGGTATGTATTTTGGGAAATGATTAGGGATTTTATCCACAAAATTCACCCTTCTGAAAATCAGCCAATTCAGCCATTGTTGAGTAATTTGAAGGGTCATTTGGTTCCAGATAAAACTTCAAAAGGTCATGTTTCTTCTAATTCTTATGCTGAAGTTGTTAAGAGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTCAGTTAGAAATGTTCGGTTTGTTAATAAGGAAGCTTAGGTTCGAAAGAACTGGGATGTGCTGAAAATAGAATTGGAAAGCTCACTTGTTGTTTCTAGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTTAAATCTTCAGTCTTGGCCAATCCTTTTATGGATGATAAAGCTTTGATTCTGGTGGCTGATTGTAGTTTGGACCCTTATGTGAATGGTAAGTGGAAGCAATTTGGGAACCTCCATTTGAAATTGGAATTTTGGTCCTCTGAGGTTCATTCACAGCCAAAATTTATAAAAAGTTATGGAGGTTGGATTGCAATAAAAGAACCTTTGGATTTGTGGCGCCGGGACTCCTTTGAAGCTATTGGAAAGAACCTTGGTGGGTTGGTTAGTATTTCTTCCAAAACACTCAATTTATTGGACTGTTCGGAAACTTTGATTGAAGTAGAATTTTTTTTTTTTGTGGATTTATCCCTGTTGATATTAATGTTAAGATTGGTAATAAGTGTGAACTCTCTTTAAGATTTGGGGATATTAATGCACTAGATGATAGAAATTTGAATTTTGATTCAAGCAAAAGGTTATCTGTTGATGACTTTTCAAATACCCTAGACGTAATTAGGGTCAGGCAAGCTTTATTGGATGCTGATTTGATTCTTGGCAATGAAGGGGAAAGGATGAATGAATTGCCTTCATGTTCTCGGTCTCACGAAAAAATTAATGAGGTGTTGGATTCTCCAAAGTGATGTAGCCGATTATTGGCTTTGGGGTTGTTTGTTAGTTTTAGGCTTTCAAGCCATGTGTCAAGCATGTGATCATTTAGTTAGTTATTATGTTAGCATTAGCTGCCCTTTTGTAAAGCCTATTTAAAGGCTGACTGCCTTCAAGTTTAAGGCATAATATACATTTTGATTTGATTCCTACCTAGAGCTACATCAGTTTGGTATCAGAGCGCACGAATTTTGGGCGCTTCCATCATGACGACCAAGAAAATCTCGACCAACGTGAGTGGAGATTCATCTTTGGTTGAAAAAAGAGACGGAAACTACCCCCGTCCTCTCACCACAAGAATCAACTACACGCTTGCTGTCAGTTGAAAACGACGTGCGTGAGATCAAGAAGATCTTAGAGATGATTTGGGAGAAAATTGGCAGCAAAACCGAACAGTTGACTACAAACACAGCAGCGCAGACAAGTTGGGGAAAAGATCAACAAAACCGCCAAGGGGAAAGCAGCAAGGCAAAATATCAGCAAGAAAACAAGGCAAAATATCAGCAAGAAAGGCAAATTTTTTATCAAAGAACAGTCCAAGAATGGGATGTAGCTCCAAAAAGATATCAAGATTTCAATGATAATCCTTTATATAAAAGGCATCAAGAATGGACAGATTCCTCAAGTGAAGATGATGATGAACCAGTGGATTTTCAAATGGAAAGACAAAGAGGTCAAAGATTTCCCTATCAACAACAAGAAAACAATTTCAAGATGAAAATTGATATCCCAACTTATAATGGTAAGATGGAAATTGAGGCTTTCTTGGAATGGGTAAGACATGTAGAAAACTTTTTTAGTTACATGAACACACCGGAAACCAAAAAAGTAAAGTTGGTGTCCCTCAAATTAAAAGGAGGGGCTCAAGCTTGGTGGGATCAACTTGAATTAAACCGGCAAAGATTTGGGAAGAGGCCAATCCGTAGGTGGGAAAGAATGAAAAAGATGATGAAAGAAAGGTTTCTTCCGGCCAATTTCGAACAAATCTTGTATAACCAATACCAAAATTGTCACCAAGGCACGCGCACGGTAATGGAATACACTGAAGAATTCCATAGATTAGGGGCCAGAACAAATCTTGGTGAAAATCAACAATATTTGGTGGCAAGATACAAAGGAGGGCTACGAACAGACATCCAAGAACGCATAACCTTGCAACCAATAGCCTATTTAAATGAAGCTATTGCAGCGGCTGCCACAGTGGAGGAGCAAATTGCTAACAGGTATAAGAGACAATATTCAAGAAGAAGTGTAGGAGAACAGAGCAATACATTCTCAAGAAATAATGCAACTGAAAAAAGTTCTTCACAAAATACTATTACAGCATCAAAGGGAAAACAAGTAGATATGGGTACAACCAAAGATCCTTTACCAAAGAAGAGTGCAAATACCTATTCTAGACCAACCTTGGGAAAGTGCTTCCGTTGCAATCAAACAGGGCATCTATCCAATGAATGCCCCCAAAGAAAAACCCTTGCCATTGCTGATAATGCAGAATATCAAGAAGAAAGTGACTATTCGGACAATGAAGAGCAAATTGACTTCCTTGAACCAGATGAAGGAGAACCATTGTCCTTGGTGATTCAAAGGCTTCTTTTGGCCCCAAAGACAGACCCAACATACCAAAGACATGCATTATTCAAGACCCGTTGCACAATTAATGGAAAATCTACACTGTTATTATTGATAGTGGAAGTACAGAAAATGTGGTGGCTAGAAAACTAGTTTCAACCTTAAATCTACCATTAAATCCACATCCAGCTCCTTACAACATTAGTCCTACTTTCAATGTTGCTGACATCTTTCCTTACAACCCTCCTGATGAGTTTGTTTTAGCTACATAACTCAAGGTCGAGTTCTTTTATGGGGTGGGGAAAGTTGATGTAGCCGATTATTGGCTTTGGGGTTGTTTGTTAGTTTTAGGCTTTCAAGCCATGTGTCAGGCATGTGATCATTTAGTTAGTTATTCTGTTAGCATTAGCTGCCCCTTTGTAAAGCCTATTTAAAGGCTGGCTGCCTTCAAGTTTAAGGCATAATATACATTTTGATTTGATTCCTACCTACGGCTACATCACAAAGGGTGCTTTGCTGCATGATGAGGGCATTAATAATGTTGGTTGTATGGGTTTTAATGATAGCAATCAAGAGATGGATCCTATTCTCTCTCCTTTTAAAGTTATTAATAATTATAATTGCACCAGCCCTAAGGAATTCCAGCCGCCATTGTCTGTTGATTATTCTCCCAAAAGTATTAATGTTAGCATTGGAAAAGTGTGTAACCAGCAGACAGCTCCCAAAAGTATTAATGATAGCATTGAAAAAGTGTGCAATCAGCAAGCAGCTTCAAAGACTTACGCTGGCTGTAATGATCCTCCTCCCAAGATGATTAATGATACTAGTTGTAATTTGATTAACGATTTACAGCAGATTCCAAGAGAGAGAGGCCAATTTAATTGAGGCGTTGGGTTCTCCAAAAGGTGCTTCATTGCATGAAGAGTGTATTAATTACATTGGAGGTAAAGGTATTAAGGATAGCATTAATGAGTCGGTTTTTGTTCTCTCTCCATCCAAAGATGATAATGTGTTTAATGTGTTTAATGTGTTCAGCCCTCAGGAAGTCCGACAGTCCAAGTTTTTGGAATCTCCTTCTAAGGATTTTAATGTCGTTAATTGCAATTCAAATAATGGAAAAAATGCAAGTTGCAGTGGTTAAAAATGGGTGATGACTAAGAGAGTAGTAAAAAAGCTCTCTTCCAGCCCCCCGAATGCTCTCTCCTCTCTTCCCCTCCCTTTCAGCCTTCATCCGTCGAAGCAGTGGTAGTTTTTTACAATGCTTTTTCCATGGAAGTCAGTAGTTGTTGCATCCAAAACAGGTATTTTTGTATTTGGAAGGAAGGAAATACATATTTTGTTGAAGATACGTGCAAGAAACAGTTGATTTCTTTGTCCATCTCCTTTTTACAGTGGTTTGAAAATGTTCTAGATGAGGTATTACAAAATCCTGTTTCTTCTTTCTTTCATCAAAAAAGTAAGGAAGACTTTGGAGTCATTAGATTGAGTAAGTTCTTTTCAAACAATGAATGGTTCTTTGAATGTGCAGTATGGCCTTCCACGGGTGGGAGAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGATGGTATGTATTTTGGGAAATGATTAGGGATTTTATCCACAAAATTCACCCTTCTGCAAATCAGCAAATTACGCCATTGTTGAGTAATTTGACAAGTCATTCGGTTCCAGATAAATTTCCAAAGGTCATGTTTCTCCTAATTCTTATGCTGAAGTTGTTAGGTGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTTAGTTAGAAATGATAAGTTTGTTAATAAGGAAGTTTACTGGGTTCAAAAGAACTGGGATATGCTGAAAATAGATTTGGAAAGCTCTCTTGTTGTTTCTAGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTCAAATCTTCAGTCTTGATCAATCCTTTTATGGATGATAAAGCTTTGATTCAAGTGGCTGATTGTAGTTTGGATCCTTCTGTGAATGGTAAGTGGAAACTATTCGGGAACCTTCATTTGAAATTGGAATTTTGGTCCTCTGATTTTCATTCCCAGCCAAAATTTATAAAAAGTTATGGAGGATGGATTGCAATAAAAAATTTACCTTTGGATTTGTGGCACCGGGACTCCTTTGAAGCTATTGGAAAAAACCTTGGTGGGTTGGTTAGTATTTCTTCCAAGACTCTCAATTTATTGGATTGTTCGGAAGCTTTTATTGAAGTAGAAATTTTTTTTTGTGGATTTATCCCTGCTGATATTCATGTTAAGATTGGCAATAAATGTGAATTTTCTTTAAGATTTGGGGATATTAAGGCACTAGATGATAGAAATTTGAACTTTGTTTCAAGTAGAAGGTTATCTGTTGATGACTTTTCAAATTCCTATGTTATTAGGATCAGGCAAGCTGTTTTGGATGATGATTTGATTCTGGGCAATGAAGAAGAAAGGATGAATGAATTGCCTTCTTGTTCTCGGTCTCAGGGAAAAATTAATGAGGTGTTGGGTTCTCCAAAGGGTGCTTTGTTGCATGAAGAGGGCATTAATAACATTGGTTGTATGGGCTTTAATGATAGCACTCAAGAAATGGATCCTATTCTCTCTCCTTTTAATGTTATTAATGATAATATTTCCACCAGCCCTAAGGAAGTCCAGCAGCCACTGCCTATTGATTATTCTCCTAAAAATATTAATGCTAGCATTGGAAAAGTGGGTAATCAGCCAGCAGCTTCCGTAAGTATTATTAATAGCATTGAAAATGATTATTCTCCTACAAATATTAATGCTAGTATTGGAAAAGTGGGTAATCAACCAGCAGCTTCTGTAAGTATTATTAATAGCATTGAAAATGAGTATATCCAGCAGACAGCTTTAAAGGGGTTCGATTAGTGAAGCAGTTTAATGCCAACGTTTCAGAAATTAGTGAAGCATTAACTGAAGGAGAATTGCATGAGTCCCAGAATTTATTATTCACGCCTATTCATGATCCACCTTTGGTTTTGAAGACTTGTAATGAAGATGGTTTGGAAGATAAGGAACAGATTGTTTCTAAGGCTCTAAAGAAACAATATGAATCTTTTCCTCTTTATTATTCTCATAGGAAAAATGAAAAGACAGCAATTTTGGATTCAATTCCTATTAATTCCAATTATAACCCCGACGTGATTGAAGAATCTTGTTCTCAATTTTTGCTGCCTGCTTTGAATCAGACTAAGTGTTGTCAAACTGATCTTAAGGAATTTTCAAATTCCACAGCCTCCAATCAATTCATTCTCTCAAATATTCAATCTCACCCTTCTTTATCAAAGGGAGTTTTTCTTCCTTCATCCAAAGGTGAAAATAAAGTTGATCTCTAATATTTATCTCCAATTGATTCGGATGATGATTCAGTGGTGAGTATTAGTGCCGAGGCTAAAAATCAGTTTTTGAATGATGAAAACAATGAATTATTGGAGGAAGACTCTTTTGCATTGGCTTTAAATCGGATTTTCCAGAACAATGAAGCTGTTTCTGGAGTTCAGATGAATGTTTGTGAGGATTCGGCAACACCTTTAGTTTGTCCCAAGCAAATTTCCTCTCTTTTAGGCGATTGTGACATTCAATTGAAGGAGATTCAGTCTTTTTTACCCTCTGTTACTAACAACATTCAGTAAGTTAAGTTGGGGCATGTTTTTTTTTTTTAAAAAAAAATCCATGAAGATTTTTCTTGAAAAATAGAGGCTTAGGAGCCCGATCTTAGAGAGTGGCTTTGAAGAAATTCTTGCAGCAACATTGCCCTGATATGGTGTTAATTTAGGAGACTAAGGTGCCATTTAATTCTAGTCATTGGGAGGAAGTTAATGGGGAGTTGGTTATCTCAAAGGACACCTCGGTGCATGAAGAAAGAATTAATTGTGATGGCTGTAATGATCCTCCACCCAAGATAATCAATGATGATAGTTGTAAGGTGATTAATGAATTTCAGCAGATTTCTAGTGAGAAAGATCAAGTTAATGAGGCGTTGGGGTTTCCAAAAGATGCTTCATTGCATGATAAGAGTTTTAATCATGTTGGTTGTAAAGGTTTGGATAACAGCTTTAATGAGCCGGTTTTTACTCTCTCTTCATCCAAAGATAACAATAAGTGTATTTATTACAGCCCTCATAAAGTCCAGCTGTCTTAGGTTGTTGGAATCTCCTACTAAGAATGTTAATGTCGTTAATTGCATATTAAAGGATGTTGTTCAGCAGGTAGCATTAAAGACATATTCTCGAAAAAGTCTCTTTCGTTGGCTGTTAAGTACAACTTTAATGTTGATTATTTGGAGGCTGAATATAGTGGAAGATTCACTCTTACTTAATTACTGAAGCTTCAGGATCTTCAAATATCAGTGCTGGAAATGGGTTGTTCAGCTTCAGCTTGTTCAGAAGTTCATTCTAATGCAGCAGAAGTTCATTCTAATGCAGCAGGATTACTTTGTGCTATTACTCGATTTGCTCTTCTTGGTCTTTCGGCTAAAATTTCCAGCACAAGTTTTGTAGAAAGTTTGGTTCGCCATGCCTTAGAAGATTCTCGTCCAACGTCTGTTTTAATAAACTCGTTATCAGTGGTTAGATCCTTGGAGGCTATCTACTGGATGATCTTTTGTATACTCCGGCCAAATTGCCCTTGGATATTCTGTTTCAGCAACTATGGAGGCAGTGGATGGCAGGTTGGAGAGTTTAAGTAGGTTGCTCAAGCTTCTGGATGTTTCTTCAGTTACTACATTTGGAAAGTCACAGCCACCTCTTGGAAACACCGTCTGAAGCTCGTCTCAAAACTATGTTATGGAGCCCGTTGTCCAAGATTTATTCAGCATTCTCAATTCAGAATATTTGCCTTTTTTGGGATGCTTTCATTTCTCCATCCTAAGTCTTCATGGTTCTTTTTTGGGTTGTTTTTGTGTTGCCTTTAAAGTCATGTGTTGATCTTTTATTGGCTGTTCTTATCATTATCTTGTTGTTCAATGCTGTTTTTTCATTTCCTTTATTTTTGTATCATTGTATTTTGAGCATTAGTCTCTTTTCATTTCTTCAATAAAAAGATTGTTTCCTTTTCAAAAAAAATAAAAAAAAATTGCAATTCAAATAATGATGTCCAGCAGGTAGCATTAAAGACATATTCTCGGAAAAAAAAAATCTTCTTTTTCATTGGTTGCTGTTAGAGTTATTATATTAGTATAATAAGTGTAATTGTATAGAGTTGTCCTTTATTGTCTTTTTTACATTCTCCTACTTAGGGTTAACCTTGTACACTTGTATATATATATATCTTTATGTGAATGGAATAGATATTTTTGGATTCTCTCAAACCTTAGAGTTTACATGGTATCAGAGCGTTAGGGCAATTAGGGTTTTGTCTCATTGGAGATTTGTTAACGGTTAGGGTTTTGTCTTGTTGGAGATTTGTGAACGGTTAGGGTTTTGGTTTGGAACACCTTTTGAGAGTTTTGGGTTGCCCAAAACGTTTGCTGCTTGAAACCGCCGCCGCCACCACCAGATTCCGCCGCCGCCGCTGCCTGAAACTGCCGCCGCCGCCGCCGCCGCCGTTTTGGTCTGTCACCGGAGGATTTTTTTGTCACCGCCCAGCTCAAAACGTAGCCCACTCGCCGATCTATTGATCCTCAAAATCCGAAGCCGAAAATCCCAGCGCGTGGCCCTCACGCGCCGCCACTAGCTTCTGCGACAGCCTCACGCGCCGACGCGTGTGAGCGCGTGCGCCGCCGTTTTTCTGCTCCTTTTTAGTGGGTCGGCTCGTTTTGGTCTTCTCCTTCCAGTCGTGTGTTGCTTTGGGCCATATCGGGTTTGTTTGGTTATATTTGAAAGCCATAGTTTGTTTGGAGGTTTAGGGTTTGTGTGATTCAGATTTCAGCTCTATTTTTTGGTCTGTTTTTGTTGAGGTTATGGCTGAAAAGAAGGCTTTAGTGCTGTCCGAGATGATTCCAATGGTATCCAAGATCACAGAACATAAGTTGAATGGTTCTAATTTTTATGCTTGGCGGTCGAATATTCACCATTATATTCGTAGTCTTGATATGGATGACCACCTGACTTTAGAATCCCCGCCAAACGATGATACTAAGAAGAGTTGGCTACGGGACGAGTCTCGACTTATTCTACAAATCAAGAATTCTATTGAAAGTGACATCATTGGGCTCGATAATCACTGTAATTCTGTCAAGGAGCTCTTGGAATATTTAGATTTTCTTTACTCTGGGAAAGGAAACATCAGTCGGATATTTGATGTATGTAGAACCCTCTTTCAACCTGATCAAGGCGAGAAGTCTTTGTTGAATTATTTTATGGAATGCAAAAGAGCATATGCAGAATTTAATGAAGTGTTGCCCATGAGTACTGATATCAAGGTTCAGAATGTCCAACGCGAACAACTGTTTATCATGAGTTTTCTAGTTGGTCTTGCTTCAAAATATGACACAGCTAAAGATCAAGTTCTCTCGAGTTCAGACATCTCATCATTGGAAGATGCCTACACTCGGATACTACGTACAGAGCGGTCGCCAGTGATAGTGTCATCTGAATCTAACAGTGCTTTAGTTGGACAGACCACTGAATATAGAGGCAATCGAGGGGTAGCATCGAACATGTCCAGAGGAAATTCTACTGCTCCAAAAGCAAATTCAGGAGATATTGTTTGCCGCTATTGTCATAAGCCAGGGCATATAAAACGTGATTGTCGGAGATTGCTTTATAGAAACCAGAGGTTTCCATCTGCACATGTTGCCTCTACTCCTGATAATTCTGACAAGTCTGTTTCGATCTCAGCTGAGGAGTTTGCTAAATTCCGACTGTATCAAGAGTCACTGACGGCTTCATCCTCCACTCCTGTTACTGCCATTGCTGACACAGGTAACACATCTACATGTCTTCTTTCCTCCTCTGCGAAATGGGTCATAGACTCTGGCGCTTCCGATCACATGACAGGTAATCCCCGTTTATTCTCTACCATTGATCCATCTACATCTTCCCCTAGTGTCACTATAGCTGATGGAACCACCTCTCCAGTCTTAGGAATCGGCAATGTTCGACTTACCAACTCACTTTCGTTGTCTTCCGTTTTGAGTTTACCACAGTTTTCCTTTAACTTGATTTCTGTTAGTAAACTCACTCGTGACCTTAATTGTTGTGTCTCATTTTTTCCTGGTTATTGCTTATTTCAGGATCTTACGACGAAGAGGACTATTGGTAAAGGGCGTGAATCTAGAGGTCTCTACATCTTTGAACCAGAAATATCAACAGCCGTTGCATGTTCTAAAGTGTCATCTCCATTTGAAGATCATTGTCGTTTGGGTCATCCTTCTATTTCCGTATTGAAGAATCTTCGTCCTCAGTTTCATTCTTTGTCTTCTTTAGCTTGTGAGTCATGTCAGTTTGCTAAGTTCCATCGTGTGAGTCTGTATCCCCGTGCAACTAAACGAGCTAATGCTCCATTTGAATTAGTTCATTCTGATGTTTGGGGTTCGTGTCCTATTGAGTCAAAGATAGGGTTTAGATATTTTGTTACCTTTGTCGATGATTTTTCTCGTGTAACTTGGTTATATTTAATGAAAAATCGCTCTGAGCTGCTTTCTCATTTTCGTAACTTCCATGCTGAAATCCGAACTCAATTTAACGGTTCTCTTAAAGTTCTACGGAGTGATAATGCTAAAGAATACTTCTCTCATGCTCTTAATTCTTATTTAGATGAACATGGCATCCTCCATCAATCCTCATGTGTTGATACTCCATCTCAAAATGGGGTTGCAGAAAGAAAGAATCGTCATCTCCTCGAAACAGCCAGAGCCTTAATGTTCCAGATGCATGTTCCAAAGTATTTTTGGGCCGATGCTGTATCCACAGCTTGTTTCTTAATAAATCGCATGCCCTCCTCAGTTCTGAAGGGTGAGATACCTTATCGTATTTTATGTCCCACACAACCTTCATTCTCTCTTCCTCCCAAAATCTTTGGTTGTATTTGCTTTGTTCGGGATGTTCGTCCTCATCTCACCAAACTTGATCCCAAGTCCTTAAAATGTATCTTCCTTGGTTATTCTCGTGTTCAAAAAGGGTATCGATGTTATTGTCCTAGTCTCGATCGTTATTTTGTCTCTCCTGATGTCACCTTCTTTGAGGATTCTTCTTTCTTTTCCTCACCTTCCAATCAGTCTAAGGGGGAGCGTAATGAGGAGGATGATGATTTTCTTGTCTATACCATTCTCTCCTCTTGTGAGCCTTCTACTGATTCACCTCCATCTTTGCCTGTTTCTACTCGTCCACCTATTACTCAGGTTTATTCTCGACGACCACCCCCTTCAGTTACATGCCCTGAACCAGAGGCTTCTTCGTCATTGGATCCAGGAACGAGCGATGACCTTCCCATTGCTCTTCGTAAAGGTAAAGGTCAATGCACTTATCCTATTTCCAATTTTGTTTCATATAATCATTTGTCATCTTCTTCCTGTTCTTTTATTGCATCCTTGCAATCGGTATCTGTTCCAAAGACTGTTCATGAAGCTTTGTCTCATCCTGGTTGGCGTGCTGCAATGGTTGAGGAGATGAATGCCTTAGATGACAATTGTACTTGGGATTTAGTTTCTCTTCCTGCAGGAAAGAAGCCTATTGGTTGTAAGTGGGTATTTGCGGTCAAGGTCAATCCAGATGGATCTGTGGCTCGCTTGAAAGCTCGCCTTGTTGCTAAGGGTTATGCACAAACCTATGGAGTTGACTATTCTGATACCTTTTCTCCCGTTGCTAAATTGGCTTCTGTTCGGCTGTTCATTTCGTTGGCATCCATTCATCATTGGCCCCTGCATCAGCTTGATATTAAAAATGCCTTTCTTCATGGTGATCTTGAAGAAGAGGTGTATATGGAGCAACCACCAGGGTTTGTTGCTCAGGGGGAGAATGGAAAGGTATGTCATCTTCTTAAATCCTTGTATGGATTAAAACAGAGTCCCCGAGCTTGGTTTGGAAAATTCAGTCAGGTGATTGTAAATTTTGGAATGAGGAAAAGTAAATCAGATCATTCTGTTTTTTATAAGCGATCTGCAAATGGTGTTATCTTGTTGGTTGTGTATGTTGATGAAATTGTTATTACTGGCGATGACACATCAGGTATCCAAGCACTCAAAACCTTTCTCCATAGTCAATTCCATACAAAAGATTTAGGAGCGTTGAAATACTTTCTGGGAATTGAGGTAGTAAGGAGCAAGAAGGGAATCCTGTTATCACAGCGAAAATATGTAATTGACTTGTTGACTGAAACAGGGAAGTTAGGGGTTAAACCATGTAGTACCCCAATGATGCCGAACTTACAGCTTACGAAAGAGGGAGAGTTACTTAAAGATCCTGAAAGGTATAGAAGGTTAGTAGGAAAACTCAATTATCTTACGGTGACTCGGCCTGACATAGCTTATTCAGTGAGTATTGTGAGCCAGTTTATGTCTTCTCCTACAGTTGATCATTGGGCTGCATTGGAACACATTTTGTGTTATTTGAAGGCAGCTCTTGGACGTGGTTTATTATATAAGGATTATGGACACATGAACATTGAATGCTTCTCAGATGCGGATTGGGCAGGATCTAGAGAAGATAGAAGATCAACTACAGGATACTGTGTATTTGTGGGTGGTAATTTGGTTTCTTGGAAAAGTAAGAAACAAAATGTGGTGTCACGTTCAAGTGTTGAATCAGAATATAGAGCAATGGCACAGTCTGTATGTGAATTAGTCTGGATACGTCAACTTCTTGTTGAATTGGGATTTGATATCACAACACCGACAAAATTGTGGTGTGATAATCAGGCCGCTCTTCATATTGCATCTAATCCTGTATTTCATGAACGGACTAAACACATTGAGGTTGACTGTCACTTTGTACGTGAAAAGATACAAGAAGGTTTGGTGTCAACAGGATATGTGAAGACTGGAGAGCAATTAGGAGATATCTTCACAAAGGCACTAAATGGAGCTCGAATAGATTATCTCTCTAACAAGTTGGGCATGACGAATATATATGCTCCAACTTGAGGGGGAGTGTTAGAGTTATTATATTAGTATAATAAGTGTAATTGTATAGAGTTGTCCTTTATTGTCTTTTTTACATTCTCCTACTTAGGGTTAACCTTGTACACTTGTATATATATATATCTTTATGTGAATGGAATAGATATTTTTGGATTCTCTCAAACCTTAGAGTTTACAGTTGCTAAGTCAAATATTAATGCTGATCATTTGGAGTCAGCATGTACTCATTTAATTGCTGCAACAAAGGCTTCGAGATCTTCAAATGTCAATTCTGGAAATGGTTTGTTTCAGGGTAAGGAATTTAAGGAATCTTCTGTTCAAAATCCAAGGGGGAGTGAGGTTTTCGTAAGAGATATTGGTAGATCCTCCAACCATAGTATTCATTCACCGGTGGATTCAGATGATGAGTCTACGGTTAGTGTAAGCAGTGAGGATTCTGATCAGTTGGTAGATAAAGAGGATTGTGTGGAATTATTTTCAGAAGATCAAATTGGTGAGTCTTTGCAATCTATCTTTTCTGAGAATGTTGATGGTTTAGGCTCTCAAGATTCAATTATTCACGAATCTTTATTATCACCTTCTCAAATTCCTAACCAACTCTCTTCGTTAGTTGATATTTCTGGATTTCAATTGTGCAAAATTTCTCCTCAGTCTTCCAAAGCGGTTGTTTGATCCTTCCTTACTCAATTATGAAGATTGTTAAGTGGAATACCAGGGGTCTCGGTGATAAGTCTAAAAGGGTGGCTTTGAAGAAATTCCTTCAGAACATTTGCCCTGATTTAGTCTTAATTCAGGAGACTAAACAAGCTGCAATTGATTTGAGATTCATTAAATCCTTATGGAGTTCCAAGGAAATCCGCTCGACTTTTGTGGAAGCCTATGGAAGATCTAGAGGTCTTCTTATTATGTGGGATGAAAGTAAATTGTCAGTGCCGGAATTTTTAAAGGGTGACTATTCTCTATCAGTCAAATGCCTCACTCTTTGTAAAAAAGTTTGTTGGGTATCAAATGTGTATGGTCCAAATGACTACAAAGAAAGGAGATTCCTTTGGTCTGAATTATGCACTTTTTCTTATTATTGCACGGATCCTTGGTGTATTGGTGGCGACTTCAATATTACTTGATGGGTTCATGAAAGATTTCCCGTGGGAAGACAAACAAAAGGGATGCACAAATTTAATAAATTTATTGAAGACTCGGGTCTTATGGAAATTCCCCTATCAAATGGTAAGACCACGTTTGGTTCGTGATTTTAAAATTGTTTTCGAAAATAAAGAATTTAACAGAAAACGAAAATAAATTTCTTATTTCCATTATATCTGAAAACAAGTTTGGTTTCAATTTAAAAACTTTAAATTCGAATTCAAAATTTTAAAACTGTGTTTGGTTATGAATTTGAAAATGCAAGAAAAGATTAATATGTGTTTGCAAAAATTCATTTTTTTTTAAGAAAAGTTTAATTTAATATAATTATTGGTGTACTTGATTTGATTTTTATTCATTTTTAGAGAGAGATTAGAAATCAATGCTGTTGGAGATGATTCTTCAAACAAAAATTGTTGAAATTGAAATTATAAGGAAAAAAAAGATATAAAAGATAGTTGCATTGTAGGAAGCTTTTGATTTGTAAAGTGGAGAAGTATATAAAAATAGATAGGATCATGTAAAAAATAAAAATAACAACCAAAGCATCACTATCAATCATACACAATATCTACACAACAGTAATTTTGTATTTTTTTTTCTTTAGAGTTGGAGAGAATTTGGATATCAAAAATAGAAAATGTTGTTGGTAGATGATTAACATTGTTTGATGAAAAGAGTGACGTATCATGTGTTTCTATAGTTGTATCTCGTGTTTCCATTATTTTGAAAACAAAATTGGAAAACAATGAAAACATCATTTTATCGTTTTTGAAAACAGGCCCTTTTTTGAGTTGTTTTCGAAAATTGTTTTTGAAAATAGGTATACCAAACACGTTTTCATTGTTTTCCTTGTATTTTTTATTTTCAAAAACATAAAAACGAAAACGGATCATGAACCAAACGGGGCCTAAATTTACATGGTCTAGGAATGGAAACTCTTATTCTCATTCACTTTTTGGTGTCAAAAGAATGGGATGATTTATTTGATAACTCCAGAGTATCGAGGAAGGCATGCATATTCTCTGACCATTTTCCTCTTTTATTAGAGGCGGGTTCTTTTATGTGGGGTCCATCTCCTTTCAGGTTTTACAACAGCTGGCTTTCTCATCTCTAGGATGGGCTGGTTTTGTTATTAGTTCTAAATTCAAAAATTTAAAAGCAGCTATCAAGAAGTGGTTTGCAGATTTTAAAGCTTGCAGAAAAAGTAAAGAGAAAAGTTTGCTTTCTGAACTTGAATTCTTTGATGCCAAGGCTGAAAGTTCTCTTTTATCTGACACTGAGATTGATATTTGGCTGGCTATCAAAGGGGAGATTATGGGATTATATATGTCGGATGAAAGAAATTTAATTCAGAAGAGTAAGCTTAATTGGCTAAAGCTTGGAGATGAAAACACTAGTTTTTTCCATTGATTTTTGGCAGCCAAGAAGAGGAAGAATTTGATTACTGATTTGATTTCCAGCAATGGGGTTTCTTTAGTTTCCTTCAGGGAAATTGAACAAGAAATTCTGGATTTTTTTTCTTCTTCATATCAGAAAATTCCAGGTCATCGGTTTCTACCTTCTAATTTATCTTGGGATACTATTTCTGCTGGTCAAAACATAGCCCTTTCGGCTCCTTTTTCTGTTGAAGAAATTAGGGCGACTTTGCAGTCTTTGGGTCGAAATAAGGCCCAGGGTCCAGATGGTTTTACTTCGGAATTCTTATTAAAGTGTTGGCTTATGTTGAAATCAGATTTTATGCGGCTTTTCGAGGAGTTTTTTCATAATGGTCGCCTCAATGCATGTATAAAGGAGAATTTTATCTGCTTAATTCAAAAGAAGGAAGCTACTGTTCGTATAAAAGACTTTAGGCCTATAAGTCTTACCATTTCAGTTTATAAAGTTATTGCAAAAGTTCTTGCTGAAAGAATGAGAAAAGTAATGCCCAATATTATTTCCCAATCTCAAAGTGCTTTTATTAGTGGCAGGCAGATTCTTGATTCAGTTCTCATTGCCAATAAAGTTGTGGAGGAATATCGAGCTAAGAAAAAAAAGGGGTGGATTGGGATTTCCTTGAGCATGTTCTCAAGTTTAAAGGTTTTTGTGGCAAATGGATTGAATGGATAAATGGATGTGTTAGGGATCCAAAATTTTCCATTTTCATTAATGGTCGGCCAAGCGGGAGAATTTGTGCTTCTAGAGGACTTAGGCAAGGAGATCCTCTTTCTCCTTTTCTATTTCTTTTAGTTAGTGAAGTGATGAATGCTTTTATCAACATCATCCATGAGAAGGGTGTTTATGAGGGTTTCATTGTTGGCAAGGATATGGTTCATATTTCCATTCTTCAATTTGCAGATGATACTCTCCTATTTTGTAAGTATGATGACGCTATGCTTGATCCTCTCATTTCCACCATTGGTCTTTTTGAATGGTGTTCTGGGTAGAAAGTTAGTTGGGAAAAATCAGCTTTGTATGGTATTAATATTGATAATGATAAGATTATGGCTACTTCTTCCCGTTTGAATTGCAAGGTGGAATCTCTTCCATTTTTCTATCTTGGTCTTCCATTAGGTGGTTATCCGAAAAAGATCTCATTTTGGCAGCCAGTGATGATAAAATTCAGAAAAAGCTTGATAGATGGAGGCGTTTTAATTTATCTAGAGGCGGGAGATTGACTTTGTGCAATTCAGTTTTATCAAGTATTCCGTTATATTATATGTCTTCTTTTCTCATGCCTCCTAAAGTTGTTTCAAAAGTGGAACGGTTAATAAAGTCGTTTTTATGGGAAGGAAGTAATGGATCCAAGTTAAATCACTTGGCTCGTTGGGAGCAAGTTTCAAAACCTCTCTTGAGTGGAGGTTTCGGTGTTGGAGGCTTGAAAAATAGAAATTTGGCTCTTCTTGCTAAATGGGGTTGGAGATATATGAGAGAGCCTGATTCGTTATGGTGTAAAGTTGTTAAAAGTATTCATGGGCAGAATTGTTATAATTGGCACACTTCTGGTAAGGTCGGCCTGAGTCTTCGAAGTCCTTGGATTAATATTTCTAAGGTATGGAAGCAATTTGAGAATCTAGCTTCTTTCAAACTTGGTAATGGTTCTAGAATAGCCTTTTGGCTTGACTCTTGGGTTGTAGATCTTCCTTTTTGTTTAAAATATCCTAGTTTGTTTCGGATAGCTTCTCTTCCAAACGCCTCCGTTAAAGACCATTGGGATGGGGAGACTCTTTTATGGAATATTTCCTTTTGTTGGCTCTTAAAAGAGGAAGAAATTTCTGATTTTCAGCAGTTGATGGCATGTTTCAATGGTGCCATAGTATCTGAGTTTTCAGATTCACGCATTTGGTCCCTCGAGAATTCGGGATTGTATTCGGTGAAGTCTCTTTTTAACTATTGGCTGCCTATTCATCTATACACAAAGAAGTGTTTAAAGCTCTTTGGAAGACTAAATGCCCTAAGAGAATTAATATTCTTTGTTGGGTTATGATCTTTGGGACTTTAAATTGTTCAGAAGTTCTTCAAAGGAAGCTCCCTTCTCATGTTTTATCTCCTTCTATCTGCCCTTTATGCTTGAATGAATCTTTGCAACATTTGTTCTTCGATTGCATTTATTCTTATCAGTGTTGGGGGAAGTTATTGTCTATTTTCAAGCTTCAATGGGTATTGGATCAGTCATTCAAAGGAAATGTGCAGCAGCTTTTAATTGGTCCATCAGTTAAGTCGGTTTCTAATTTGCTGTGGTCTAATGGTGTCAAAGCCGTCTTTTTAGAAATTTGGTTTGAAAGGAATCAGAGAATTTTCCATGATATTTCTCTTCCTTGGTTGGGTCGTTTCAATTCTGCACGGCTCAAAGCTTCGTCTTGGTGTTCTTTGTCCAAGCTTTTCCCAGGATTCTCCATTCAAGATATTTGCCTCAATTGGGAAGCTTTCATTTTTCCGTCTTAGTGTTGTTGTTTGCTTACTTTTATGATGGTTTTTTTTTTTATCTAATTCGTTCTTATTGTATCTTTATACCATTGTACTTT

mRNA sequence

ATGTATTTTGTTGAAGATACGTGCGAGAAGCAGTTGATTTCTTTGTTCATCTCCTTTTTACAGTGGTTTGAAAATGTTCTAGTTGAGGTACTACAAAATCCTGTTTCTTCTTTCTTTCATAAAAAAAGTAAGGAAGAATTTGGAGTCATTAGATTGATTAAGTTCTTTTCAAACAATGAATGGTTCTTTGAATGTGTTGTATGGCCTTCCACGGGTGGGAGAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGCTGGTATGTATTTTGGGAAATGATTAGGGATTTTATCCACAAAATTCACCCTTCTGAAAATCAGCCAATTCAGCCATTGTTGAGTAATTTGAAGGGTCATTTGGTTCCAGATAAAACTTCAAAAGGTCATGTTTCTTCTAATTCTTATGCTGAAGTTGTTAAGAGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTCAGTTAGAAATGTTCGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTTAAATCTTCAGTCTTGGCCAATCCTTTTATGGATGATAAAGCTTTGATTCTGGTGGCTGATTGTAGTTTGGACCCTTATGTGAATGGTAAGTGGAAGCAATTTGGGAACCTCCATTTGAAATTGGAATTTTGGTCCTCTGAGGTTCATTCACAGCCAAAATTTATAAAAAGTTATGGAGGTTGGATTGCAATAAAAGAACCTTTGGATTTGTGGCGCCGGGACTCCTTTGAAGCTATTGGAAAGAACCTTGGTGGGTTGATTGGTAATAAGTGTGAACTCTCTTTAAGATTTGGGGATATTAATGCACTAGATGATAGAAATTTGAATTTTGATTCAAGCAAAAGGTTATCTGTTGATGACTTTTCAAATACCCTAGACGTAATTAGGGTCAGGCAAGCTTTATTGGATGCTGATTTGATTCTTGGCAATGAAGGGGAAAGGATGAATGAATTGCCTTCATGTTCTCGCCTATTTAAAGGCTGGCTGCCTTCAAGTTTAAGGCATAATATACATTTTGATTTGATTCCTACCTACGGCTACATCACAAAGGGTGCTTTGCTGCATGATGAGGGCATTAATAATGTTGGTTGTATGGGTTTTAATGATAGCAATCAAGAGATGGATCCTATTCTCTCTCCTTTTAAAGTTATTAATAATTATAATTGCACCAGCCCTAAGGAATTCCAGCCGCCATTGTCTGTTGATTATTCTCCCAAAAGTATTAATGTTAGCATTGGAAAAGTGTGTAACCAGCAGACAGCTCCCAAAAGTATTAATGATAGCATTGAAAAAGTGTGCAATCAGCAAGCAGCTTCAAAGACTTACGCTGGCTGTAATGATCCTCCTCCCAAGATGATTAATGATACTAGTTTATGGCCTTCCACGGGTGGGAGAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGATGGTGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTTAGTTAGAAATGATAAGTTTGTTAATAAGGAAGTTTACTGGGTTCAAAAGAACTGGGATATGCTGAAAATAGATTTGGAAAGCTCTCTTGTTGTTTCTAGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTCAAATCTTCAGTCTTGATCAATCCTTTTATGGATGATAAAGCTTTGATTCAAGTGGCTGATTGTAGTTTGGATCCTTCTGTGAATGGTAAGTGGAAACTATTCGGGAACCTTCATTTGAAATTGGAATTTTGGTCCTCTGATTTTCATTCCCAGCCAAAATTTATAAAAAGTTATGGAGGATGGATTGCAATAAAAAATTTACCTTTGGATTTGTGGCACCGGGACTCCTTTGAAGCTATTGGAAAAAACCTTGGTGGGTTGGTTAGTATTTCTTCCAAGACTCTCAATTTATTGGATTGTTCGGAAGCTTTTATTGAAGTAGAAATTTTTTTTTGTGGATTTATCCCTGCTGATATTCATGTTAAGATTGGCAATAAATGTGAATTTTCTTTAAGATTTGGGGATATTAAGGCACTAGATGATAGAAATTTGAACTTTGTTTCAAGTAGAAGGTTATCTGTTGATGACTTTTCAAATTCCTATGTTATTAGGATCAGGCAAGCTGTTTTGGATGATGATTTGATTCTGGGCAATGAAGAAGAAAGGATGAATGAATTGCCTTCTTGTTCTCGGTCTCAGGGAAAAATTAATGAGGTGTTGGGTTCTCCAAAGGGTGCTTTGTTGCATGAAGAGGGCATTAATAACATTGGTTGTATGGGCTTTAATGATAGCACTCAAGAAATGGATCCTATTCTCTCTCCTTTTAATGTTATTAATGATAATATTTCCACCAGCCCTAAGGAAGTCCAGCAGCCACTGCCTATTGATTATTCTCCTAAAAATATTAATGCTAGCATTGGAAAAGTGGGTAATCAGCCAGCAGCTTCCGTAAGTATTATTAATAGCATTGAAAATGATTATTCTCCTACAAATATTAATGCTAGTATTGGAAAAGTGGCAGACAGCTTTAAAGGGGTTCGATTAGTGAAGCAGTTTAATGCCAACGTTTCAGAAATTAGTGAAGCATTAACTGAAGGAGAATTGCATGAGTCCCAGAATTTATTATTCACGCCTATTCATGATCCACCTTTGGTTTTGAAGACTTGTAATGAAGATGGTTTGGAAGATAAGGAACAGATTGTTTCTAAGGCTCTAAAGAAACAATATGAATCTTTTCCTCTTTATTATTCTCATAGGAAAAATGAAAAGACAGCAATTTTGGATTCAATTCCTATTAATTCCAATTATAACCCCGACGTGATTGAAGAATCTTGTTCTCAATTTTTGCTGCCTGCTTTGAATCAGACTAAGTGTTGTCAAACTGATCTTAAGGAATTTTCAAATTCCACAGCCTCCAATCAATTCATTCTCTCAAATATTCAATCTCACCCTTCTTTATCAAAGGGAGTTTTTCTTCCTTCATCCAAAGTGGTGAGTATTAGTGCCGAGGCTAAAAATCAGTTTTTGAATGATGAAAACAATGAATTATTGGAGGAAGACTCTTTTGCATTGGCTTTAAATCGGATTTTCCAGAACAATGAAGCTGTTTCTGGAGTTCAGATGAATGTTTGTGAGGATTCGGCAACACCTTTAGTTTGTCCCAAGCAAATTTCCTCTCTTTTAGGCGATTGTGACATTCAATTGAAGGAGATTCAGTCTTTTTTACCCTCTGTTACTAACAACATTCATCATTGGGAGGAAGTTAATGGGGAGTTGGTTATCTCAAAGGACACCTCGGTGCATGAAGAAAGAATTAATTGTGATGGCTGTAATGATCCTCCACCCAAGATAATCAATGATGATAGTTGTAAGGTGATTAATGAATTTCAGCAGATTTCTAGTGAGAAAGATCAAGTTAATGAGGCGTTGGGGTTTCCAAAAGATGCTTCATTGCATGATAAGAGTTTTAATCATGTTGGTTGTAAAGGTTTGGATAACAGCTTTAATGAGCCGGATGTTGTTCAGCAGGATCTTCAAATATCAGTGCTGGAAATGGGTTGTTCAGCTTCAGCTTGTTCAGAAGTTCATTCTAATGCAGCAGAAGTTCATTCTAATGCAGCAGGATTACTTTGTGCTATTACTCGATTTGCTCTTCTTGGTCTTTCGGCTAAAATTTCCAGCACAAGTTTTGTAGAAAGTTTGGTTCGCCATGCCTTAGAAGATTCTCGTCCAACGTCTGTTTTAATAAACTCGTTATCAGTGGTTAGATCCTTGGAGGCTATCTACTGGATGATCTTTTGTATACTCCGGCCAAATTGCCCTTGGATATTCTGTTTCAGCAACTATGGAGGCAGTGGATGGCAGTCAGCATGTACTCATTTAATTGCTGCAACAAAGGCTTCGAGATCTTCAAATGTCAATTCTGGAAATGGTTTGTTTCAGGGTAAGGAATTTAAGGAATCTTCTGTTCAAAATCCAAGGGGGAGTGAGGTTTTCGTAAGAGATATTGGTAGATCCTCCAACCATAGTATTCATTCACCGGTGGATTCAGATGATGAGTCTACGGTTAGTGTAAGCAGTGAGGATTCTGATCAGTTGGTAGATAAAGAGGATTGTGTGGAATTATTTTCAGAAGATCAAATTGTCTTCCAAAGCGGTTGTTTGATCCTTCCTTACTCAATTATGAAGATTGTTAAGTGGAATACCAGGGGTCTCGGTGATAAGTCTAAAAGGGTGGCTTTGAAGAAATTCCTTCAGAACATTTGCCCTGATTTAGTCTTAATTCAGGAGACTAAACAAGCTGCAATTGATTTGAGATTCATTAAATCCTTATGGAGTTCCAAGGAAATCCGCTCGACTTTTGTGGAAGCCTATGGAAGATCTAGAGGCGGGTTCTTTTATGTGGGGTCCATCTCCTTTCAGGTTTTACAACAGCTGGCTTTCTCATCTCTAGGATGGGCTGGTTTTGTTATTAGTTCTAAATTCAAAAATTTAAAAGCAGCTATCAAGAAGTGGTTTGCAGATTTTAAAGCTTGCAGAAAAAGTAAAGAGAAAAGTTTGCTTTCTGAACTTGAATTCTTTGATGCCAAGGCTGAAAGTTCTCTTTTATCTGACACTGAGATTGATATTTGGCTGGCTATCAAAGGGGAGATTATGGGATTATATATGTCGGATGAAAGAAATTTAATTCAGAAGAGTCATCGGTTTCTACCTTCTAATTTATCTTGGGATACTATTTCTGCTGGTCAAAACATAGCCCTTTCGGCTCCTTTTTCTGTTGAAGAAATTAGGGCGACTTTGCAGTGGTTATCCGAAAAAGATCTCATTTTGGCAGCCAGTGATGATAAAATTCAGAAAAAGCTTGATAGATGGAGGCGTTTTAATTTATCTAGAGGCGGGAGATTGACTTTGTGCAATTCAGTTTTATCAAGTATTCCGTTATATTATATGTCTTCTTTTCTCATGCCTCCTAAAGTTGTTTCAAAAGTGGAACGGTTAATAAAGTCGTTTTTATGGGAAGGAAGTAATGGATCCAAGTTAAATCACTTGGCTCGTTGGGAGCAAGTTTCAAAACCTCTCTTGAGTGGAGGTTTCGGTGTTGGAGGCTTGAAAAATAGAAATTTGGCTCTTCTTGCTAAATGGGGTTGGAGATATATGAGAGAGCCTGATTCGTTATGGTGTAAAGTTGTTAAAAGTATTCATGGGCAGAATTGTTATAATTGGCACACTTCTGGTAAGGTCGGCCTGAGTCTTCGAAGTCCTTGGATTAATATTTCTAAGGTATGGAAGCAATTTGAGAATCTAGCTTCTTTCAAACTTGGTAATGGTTCTAGAATAGCCTTTTGGCTTGACTCTTGGGTTGTAGATCTTCCTTTTTGTTTAAAATATCCTAGTTTGTTTCGGATAGCTTCTCTTCCAAACGCCTCCGTTAAAGACCATTGGGATGGGGAGACTCTTTTATGGAATATTTCCTTTTGTTGGCTCTTAAAAGAGGAAGAAATTTCTGATTTTCAGCAGTTGATGGCATGTTTCAATGGTGCCATAGTATCTGAGTTTTCAGATTCACGCATTTGGTCCCTCGAGAATTCGGGATTGTATTCGGTGAAGTCTCTTTTTAACTATTGGCTGCCTATTCATCTATACACAAAGAAGTGTTTAAAGCTCTTTGGAAGACTAAATGCCCTAAGAGAATTAATATTCTTTTGTTGGGGGAAGTTATTGTCTATTTTCAAGCTTCAATGGGTATTGGATCAGTCATTCAAAGGAAATGTGCAGCAGCTTTTAATTGGTCCATCAGTTAAGTCGGTTTCTAATTTGCTGTGGTCTAATGGTGTCAAAGCCGTCTTTTTAGAAATTTGGTTTGAAAGGAATCAGAGAATTTTCCATGATATTTCTCTTCCTTGGTTGGGTCGTTTCAATTCTGCACGGCTCAAAGCTTCGTCTTGGTGTTCTTTGTCCAAGCTTTTCCCAGGATTCTCCATTCAAGATATTTGCCTCAATTGGGAAGCTTTCATTTTTCCGTCTTAG

Coding sequence (CDS)

ATGTATTTTGTTGAAGATACGTGCGAGAAGCAGTTGATTTCTTTGTTCATCTCCTTTTTACAGTGGTTTGAAAATGTTCTAGTTGAGGTACTACAAAATCCTGTTTCTTCTTTCTTTCATAAAAAAAGTAAGGAAGAATTTGGAGTCATTAGATTGATTAAGTTCTTTTCAAACAATGAATGGTTCTTTGAATGTGTTGTATGGCCTTCCACGGGTGGGAGAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGCTGGTATGTATTTTGGGAAATGATTAGGGATTTTATCCACAAAATTCACCCTTCTGAAAATCAGCCAATTCAGCCATTGTTGAGTAATTTGAAGGGTCATTTGGTTCCAGATAAAACTTCAAAAGGTCATGTTTCTTCTAATTCTTATGCTGAAGTTGTTAAGAGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTCAGTTAGAAATGTTCGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTTAAATCTTCAGTCTTGGCCAATCCTTTTATGGATGATAAAGCTTTGATTCTGGTGGCTGATTGTAGTTTGGACCCTTATGTGAATGGTAAGTGGAAGCAATTTGGGAACCTCCATTTGAAATTGGAATTTTGGTCCTCTGAGGTTCATTCACAGCCAAAATTTATAAAAAGTTATGGAGGTTGGATTGCAATAAAAGAACCTTTGGATTTGTGGCGCCGGGACTCCTTTGAAGCTATTGGAAAGAACCTTGGTGGGTTGATTGGTAATAAGTGTGAACTCTCTTTAAGATTTGGGGATATTAATGCACTAGATGATAGAAATTTGAATTTTGATTCAAGCAAAAGGTTATCTGTTGATGACTTTTCAAATACCCTAGACGTAATTAGGGTCAGGCAAGCTTTATTGGATGCTGATTTGATTCTTGGCAATGAAGGGGAAAGGATGAATGAATTGCCTTCATGTTCTCGCCTATTTAAAGGCTGGCTGCCTTCAAGTTTAAGGCATAATATACATTTTGATTTGATTCCTACCTACGGCTACATCACAAAGGGTGCTTTGCTGCATGATGAGGGCATTAATAATGTTGGTTGTATGGGTTTTAATGATAGCAATCAAGAGATGGATCCTATTCTCTCTCCTTTTAAAGTTATTAATAATTATAATTGCACCAGCCCTAAGGAATTCCAGCCGCCATTGTCTGTTGATTATTCTCCCAAAAGTATTAATGTTAGCATTGGAAAAGTGTGTAACCAGCAGACAGCTCCCAAAAGTATTAATGATAGCATTGAAAAAGTGTGCAATCAGCAAGCAGCTTCAAAGACTTACGCTGGCTGTAATGATCCTCCTCCCAAGATGATTAATGATACTAGTTTATGGCCTTCCACGGGTGGGAGAAGGTTTATTCAAGTTCCAGCGGGTTTGAATAAGAAAGGATGGTGTGGTGTTTTGATGAAGAAATCATTCTCCTTGGAAAATTTAGTTAGAAATGATAAGTTTGTTAATAAGGAAGTTTACTGGGTTCAAAAGAACTGGGATATGCTGAAAATAGATTTGGAAAGCTCTCTTGTTGTTTCTAGATTGATGGCCCATTATTCTTGGAAGGAGGTTAAGCTTGTCCTTGAGGATTTCTTCAAATCTTCAGTCTTGATCAATCCTTTTATGGATGATAAAGCTTTGATTCAAGTGGCTGATTGTAGTTTGGATCCTTCTGTGAATGGTAAGTGGAAACTATTCGGGAACCTTCATTTGAAATTGGAATTTTGGTCCTCTGATTTTCATTCCCAGCCAAAATTTATAAAAAGTTATGGAGGATGGATTGCAATAAAAAATTTACCTTTGGATTTGTGGCACCGGGACTCCTTTGAAGCTATTGGAAAAAACCTTGGTGGGTTGGTTAGTATTTCTTCCAAGACTCTCAATTTATTGGATTGTTCGGAAGCTTTTATTGAAGTAGAAATTTTTTTTTGTGGATTTATCCCTGCTGATATTCATGTTAAGATTGGCAATAAATGTGAATTTTCTTTAAGATTTGGGGATATTAAGGCACTAGATGATAGAAATTTGAACTTTGTTTCAAGTAGAAGGTTATCTGTTGATGACTTTTCAAATTCCTATGTTATTAGGATCAGGCAAGCTGTTTTGGATGATGATTTGATTCTGGGCAATGAAGAAGAAAGGATGAATGAATTGCCTTCTTGTTCTCGGTCTCAGGGAAAAATTAATGAGGTGTTGGGTTCTCCAAAGGGTGCTTTGTTGCATGAAGAGGGCATTAATAACATTGGTTGTATGGGCTTTAATGATAGCACTCAAGAAATGGATCCTATTCTCTCTCCTTTTAATGTTATTAATGATAATATTTCCACCAGCCCTAAGGAAGTCCAGCAGCCACTGCCTATTGATTATTCTCCTAAAAATATTAATGCTAGCATTGGAAAAGTGGGTAATCAGCCAGCAGCTTCCGTAAGTATTATTAATAGCATTGAAAATGATTATTCTCCTACAAATATTAATGCTAGTATTGGAAAAGTGGCAGACAGCTTTAAAGGGGTTCGATTAGTGAAGCAGTTTAATGCCAACGTTTCAGAAATTAGTGAAGCATTAACTGAAGGAGAATTGCATGAGTCCCAGAATTTATTATTCACGCCTATTCATGATCCACCTTTGGTTTTGAAGACTTGTAATGAAGATGGTTTGGAAGATAAGGAACAGATTGTTTCTAAGGCTCTAAAGAAACAATATGAATCTTTTCCTCTTTATTATTCTCATAGGAAAAATGAAAAGACAGCAATTTTGGATTCAATTCCTATTAATTCCAATTATAACCCCGACGTGATTGAAGAATCTTGTTCTCAATTTTTGCTGCCTGCTTTGAATCAGACTAAGTGTTGTCAAACTGATCTTAAGGAATTTTCAAATTCCACAGCCTCCAATCAATTCATTCTCTCAAATATTCAATCTCACCCTTCTTTATCAAAGGGAGTTTTTCTTCCTTCATCCAAAGTGGTGAGTATTAGTGCCGAGGCTAAAAATCAGTTTTTGAATGATGAAAACAATGAATTATTGGAGGAAGACTCTTTTGCATTGGCTTTAAATCGGATTTTCCAGAACAATGAAGCTGTTTCTGGAGTTCAGATGAATGTTTGTGAGGATTCGGCAACACCTTTAGTTTGTCCCAAGCAAATTTCCTCTCTTTTAGGCGATTGTGACATTCAATTGAAGGAGATTCAGTCTTTTTTACCCTCTGTTACTAACAACATTCATCATTGGGAGGAAGTTAATGGGGAGTTGGTTATCTCAAAGGACACCTCGGTGCATGAAGAAAGAATTAATTGTGATGGCTGTAATGATCCTCCACCCAAGATAATCAATGATGATAGTTGTAAGGTGATTAATGAATTTCAGCAGATTTCTAGTGAGAAAGATCAAGTTAATGAGGCGTTGGGGTTTCCAAAAGATGCTTCATTGCATGATAAGAGTTTTAATCATGTTGGTTGTAAAGGTTTGGATAACAGCTTTAATGAGCCGGATGTTGTTCAGCAGGATCTTCAAATATCAGTGCTGGAAATGGGTTGTTCAGCTTCAGCTTGTTCAGAAGTTCATTCTAATGCAGCAGAAGTTCATTCTAATGCAGCAGGATTACTTTGTGCTATTACTCGATTTGCTCTTCTTGGTCTTTCGGCTAAAATTTCCAGCACAAGTTTTGTAGAAAGTTTGGTTCGCCATGCCTTAGAAGATTCTCGTCCAACGTCTGTTTTAATAAACTCGTTATCAGTGGTTAGATCCTTGGAGGCTATCTACTGGATGATCTTTTGTATACTCCGGCCAAATTGCCCTTGGATATTCTGTTTCAGCAACTATGGAGGCAGTGGATGGCAGTCAGCATGTACTCATTTAATTGCTGCAACAAAGGCTTCGAGATCTTCAAATGTCAATTCTGGAAATGGTTTGTTTCAGGGTAAGGAATTTAAGGAATCTTCTGTTCAAAATCCAAGGGGGAGTGAGGTTTTCGTAAGAGATATTGGTAGATCCTCCAACCATAGTATTCATTCACCGGTGGATTCAGATGATGAGTCTACGGTTAGTGTAAGCAGTGAGGATTCTGATCAGTTGGTAGATAAAGAGGATTGTGTGGAATTATTTTCAGAAGATCAAATTGTCTTCCAAAGCGGTTGTTTGATCCTTCCTTACTCAATTATGAAGATTGTTAAGTGGAATACCAGGGGTCTCGGTGATAAGTCTAAAAGGGTGGCTTTGAAGAAATTCCTTCAGAACATTTGCCCTGATTTAGTCTTAATTCAGGAGACTAAACAAGCTGCAATTGATTTGAGATTCATTAAATCCTTATGGAGTTCCAAGGAAATCCGCTCGACTTTTGTGGAAGCCTATGGAAGATCTAGAGGCGGGTTCTTTTATGTGGGGTCCATCTCCTTTCAGGTTTTACAACAGCTGGCTTTCTCATCTCTAGGATGGGCTGGTTTTGTTATTAGTTCTAAATTCAAAAATTTAAAAGCAGCTATCAAGAAGTGGTTTGCAGATTTTAAAGCTTGCAGAAAAAGTAAAGAGAAAAGTTTGCTTTCTGAACTTGAATTCTTTGATGCCAAGGCTGAAAGTTCTCTTTTATCTGACACTGAGATTGATATTTGGCTGGCTATCAAAGGGGAGATTATGGGATTATATATGTCGGATGAAAGAAATTTAATTCAGAAGAGTCATCGGTTTCTACCTTCTAATTTATCTTGGGATACTATTTCTGCTGGTCAAAACATAGCCCTTTCGGCTCCTTTTTCTGTTGAAGAAATTAGGGCGACTTTGCAGTGGTTATCCGAAAAAGATCTCATTTTGGCAGCCAGTGATGATAAAATTCAGAAAAAGCTTGATAGATGGAGGCGTTTTAATTTATCTAGAGGCGGGAGATTGACTTTGTGCAATTCAGTTTTATCAAGTATTCCGTTATATTATATGTCTTCTTTTCTCATGCCTCCTAAAGTTGTTTCAAAAGTGGAACGGTTAATAAAGTCGTTTTTATGGGAAGGAAGTAATGGATCCAAGTTAAATCACTTGGCTCGTTGGGAGCAAGTTTCAAAACCTCTCTTGAGTGGAGGTTTCGGTGTTGGAGGCTTGAAAAATAGAAATTTGGCTCTTCTTGCTAAATGGGGTTGGAGATATATGAGAGAGCCTGATTCGTTATGGTGTAAAGTTGTTAAAAGTATTCATGGGCAGAATTGTTATAATTGGCACACTTCTGGTAAGGTCGGCCTGAGTCTTCGAAGTCCTTGGATTAATATTTCTAAGGTATGGAAGCAATTTGAGAATCTAGCTTCTTTCAAACTTGGTAATGGTTCTAGAATAGCCTTTTGGCTTGACTCTTGGGTTGTAGATCTTCCTTTTTGTTTAAAATATCCTAGTTTGTTTCGGATAGCTTCTCTTCCAAACGCCTCCGTTAAAGACCATTGGGATGGGGAGACTCTTTTATGGAATATTTCCTTTTGTTGGCTCTTAAAAGAGGAAGAAATTTCTGATTTTCAGCAGTTGATGGCATGTTTCAATGGTGCCATAGTATCTGAGTTTTCAGATTCACGCATTTGGTCCCTCGAGAATTCGGGATTGTATTCGGTGAAGTCTCTTTTTAACTATTGGCTGCCTATTCATCTATACACAAAGAAGTGTTTAAAGCTCTTTGGAAGACTAAATGCCCTAAGAGAATTAATATTCTTTTGTTGGGGGAAGTTATTGTCTATTTTCAAGCTTCAATGGGTATTGGATCAGTCATTCAAAGGAAATGTGCAGCAGCTTTTAATTGGTCCATCAGTTAAGTCGGTTTCTAATTTGCTGTGGTCTAATGGTGTCAAAGCCGTCTTTTTAGAAATTTGGTTTGAAAGGAATCAGAGAATTTTCCATGATATTTCTCTTCCTTGGTTGGGTCGTTTCAATTCTGCACGGCTCAAAGCTTCGTCTTGGTGTTCTTTGTCCAAGCTTTTCCCAGGATTCTCCATTCAAGATATTTGCCTCAATTGGGAAGCTTTCATTTTTCCGTCTTAG

Protein sequence

MYFVEDTCEKQLISLFISFLQWFENVLVEVLQNPVSSFFHKKSKEEFGVIRLIKFFSNNEWFFECVVWPSTGGRRFIQVPAGLNKKGWYVFWEMIRDFIHKIHPSENQPIQPLLSNLKGHLVPDKTSKGHVSSNSYAEVVKSGVLMKKSFSLENSVRNVRLMAHYSWKEVKLVLEDFFKSSVLANPFMDDKALILVADCSLDPYVNGKWKQFGNLHLKLEFWSSEVHSQPKFIKSYGGWIAIKEPLDLWRRDSFEAIGKNLGGLIGNKCELSLRFGDINALDDRNLNFDSSKRLSVDDFSNTLDVIRVRQALLDADLILGNEGERMNELPSCSRLFKGWLPSSLRHNIHFDLIPTYGYITKGALLHDEGINNVGCMGFNDSNQEMDPILSPFKVINNYNCTSPKEFQPPLSVDYSPKSINVSIGKVCNQQTAPKSINDSIEKVCNQQAASKTYAGCNDPPPKMINDTSLWPSTGGRRFIQVPAGLNKKGWCGVLMKKSFSLENLVRNDKFVNKEVYWVQKNWDMLKIDLESSLVVSRLMAHYSWKEVKLVLEDFFKSSVLINPFMDDKALIQVADCSLDPSVNGKWKLFGNLHLKLEFWSSDFHSQPKFIKSYGGWIAIKNLPLDLWHRDSFEAIGKNLGGLVSISSKTLNLLDCSEAFIEVEIFFCGFIPADIHVKIGNKCEFSLRFGDIKALDDRNLNFVSSRRLSVDDFSNSYVIRIRQAVLDDDLILGNEEERMNELPSCSRSQGKINEVLGSPKGALLHEEGINNIGCMGFNDSTQEMDPILSPFNVINDNISTSPKEVQQPLPIDYSPKNINASIGKVGNQPAASVSIINSIENDYSPTNINASIGKVADSFKGVRLVKQFNANVSEISEALTEGELHESQNLLFTPIHDPPLVLKTCNEDGLEDKEQIVSKALKKQYESFPLYYSHRKNEKTAILDSIPINSNYNPDVIEESCSQFLLPALNQTKCCQTDLKEFSNSTASNQFILSNIQSHPSLSKGVFLPSSKVVSISAEAKNQFLNDENNELLEEDSFALALNRIFQNNEAVSGVQMNVCEDSATPLVCPKQISSLLGDCDIQLKEIQSFLPSVTNNIHHWEEVNGELVISKDTSVHEERINCDGCNDPPPKIINDDSCKVINEFQQISSEKDQVNEALGFPKDASLHDKSFNHVGCKGLDNSFNEPDVVQQDLQISVLEMGCSASACSEVHSNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVRSLEAIYWMIFCILRPNCPWIFCFSNYGGSGWQSACTHLIAATKASRSSNVNSGNGLFQGKEFKESSVQNPRGSEVFVRDIGRSSNHSIHSPVDSDDESTVSVSSEDSDQLVDKEDCVELFSEDQIVFQSGCLILPYSIMKIVKWNTRGLGDKSKRVALKKFLQNICPDLVLIQETKQAAIDLRFIKSLWSSKEIRSTFVEAYGRSRGGFFYVGSISFQVLQQLAFSSLGWAGFVISSKFKNLKAAIKKWFADFKACRKSKEKSLLSELEFFDAKAESSLLSDTEIDIWLAIKGEIMGLYMSDERNLIQKSHRFLPSNLSWDTISAGQNIALSAPFSVEEIRATLQWLSEKDLILAASDDKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVSEFSDSRIWSLENSGLYSVKSLFNYWLPIHLYTKKCLKLFGRLNALRELIFFCWGKLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNWEAFIFPS
Homology
BLAST of Spg026064 vs. NCBI nr
Match: KAA0035739.1 (hypothetical protein E6C27_scaffold403G00100 [Cucumis melo var. makuwa])

HSP 1 Score: 270.0 bits (689), Expect = 1.6e-67
Identity = 144/387 (37.21%), Postives = 202/387 (52.20%), Query Frame = 0

Query: 1682 IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLW 1741
            +++F  EG   SK+N L  W +VS P   GG G+GG+K  N ALLAKWGWRY +E  +LW
Sbjct: 1    MRNFFREGHADSKINQLVNWNKVSSPPKDGGLGLGGIKIHNTALLAKWGWRYSKEESALW 60

Query: 1742 CKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW 1801
             +V++SIHG+  ++W T GK G SLRSPW+NI++ W+  ++LASF LGNG RI F +D W
Sbjct: 61   RQVIRSIHGKEAFDWFTKGKSGNSLRSPWVNIARFWRLVDSLASFNLGNGLRIGFRIDPW 120

Query: 1802 VVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNG 1861
            V + P   ++  LFRIA  P  S           W ++F   L++EEI++FQ L+   + 
Sbjct: 121  VGNTPIKEQFSRLFRIALWPRCSFL------FFSWPLAFRRSLEDEEITEFQSLLFLLST 180

Query: 1862 AIVSEFSDSRIWSLENSGLYSVKSLFNY----------------------------WL-- 1921
              V    D R WS+E+ G +S KSL  +                            W+  
Sbjct: 181  EKVVNSDDFRSWSIESHGRFSDKSLSTHLKTASPMDKRLFSAILQSGSPRRINILIWIMV 240

Query: 1922 --------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL 1981
                          PI++    C         L  +  +C      W ++ S+F L W  
Sbjct: 241  FRFVISSEILQKKSPINVSPSICPLCLKASKNLPHIFLYCPVSSFGWERIFSLFNLVWNF 300

Query: 1982 DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSAR 2019
            D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A 
Sbjct: 301  DSSLSASVIQLLSGSNLPKTPRIIWEILSKALLIEIWIERNQRIFHDKARQRAEIMHAAD 360

BLAST of Spg026064 vs. NCBI nr
Match: TYK21876.1 (hypothetical protein E5676_scaffold494G00090 [Cucumis melo var. makuwa])

HSP 1 Score: 259.2 bits (661), Expect = 2.9e-64
Identity = 140/389 (35.99%), Postives = 199/389 (51.16%), Query Frame = 0

Query: 1682 IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLW 1741
            +++F  EG   SK+N L  W +VS     GG G+GG+K  N ALLAKWGWRY +E  +LW
Sbjct: 1    MRNFFREGHADSKINQLVNWNKVSSLPKDGGLGLGGIKIHNTALLAKWGWRYSKEESALW 60

Query: 1742 CKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW 1801
             +V++SIHG+  ++W T GK G SLRS W+NI++ W+  ++LASF LGNG RI F +D W
Sbjct: 61   RQVIRSIHGKEAFDWFTKGKSGNSLRSHWVNIARFWRLVDSLASFNLGNGLRIGFRIDPW 120

Query: 1802 VVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNG 1861
            V + P   ++  LF IA  P              W ++F   L++EEI++FQ L+   + 
Sbjct: 121  VGNTPIKEQFSRLFSIALWPRCYFL------FFSWPLAFRRSLEDEEITEFQSLLFLLST 180

Query: 1862 AIVSEFSDSRIWSLENSGLYSVKSLFNY----------------------------WL-- 1921
              V    D R WS+E+ G +S KSL  +                            W+  
Sbjct: 181  EKVVNSDDFRSWSIESHGRFSDKSLSTHLKTASPMDKRLFSAILQSGSPRRINILIWIMV 240

Query: 1922 --------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL 1981
                          PI++    C         L  +  +C      W ++ S+F L W  
Sbjct: 241  FRFVNSSEILQKKSPINVSPSICPLCLKASKNLPHIFLYCPVSSFGWERIFSLFNLVWNF 300

Query: 1982 DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSAR 2021
            D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A 
Sbjct: 301  DSSLSASVIQLLSGSNLPKTPRIIWEILSKALLIEIWIERNQRIFHDKARQRAEIMHAAD 360

BLAST of Spg026064 vs. NCBI nr
Match: CAN75028.1 (hypothetical protein VITISV_026823 [Vitis vinifera])

HSP 1 Score: 245.7 bits (626), Expect = 3.3e-60
Identity = 147/443 (33.18%), Postives = 209/443 (47.18%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            ++I  +LD W++  LS GGR+TL  S LS +P Y++S F MP  V +K+ERL + FLW G
Sbjct: 1400 ERISSRLDGWQKAYLSXGGRITLIQSCLSHLPSYFLSLFKMPASVAAKIERLQRDFLWSG 1459

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
                K +HL RW+ V KP   GG G+G +  RNLALL KW WRY RE  +LW +V+ SI+
Sbjct: 1460 VGEGKRDHLVRWDIVCKPKTIGGLGLGNISWRNLALLGKWLWRYPREGSALWHQVILSIY 1519

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCL 1809
            G +   W  +  V  S R PW  I++V+++F  +  + +GNG RI FW D W  D P  +
Sbjct: 1520 GSHSNGWDANTLVRWSHRCPWKAIAQVFQEFSLITRYVVGNGDRIRFWEDLWRGDQPLGI 1579

Query: 1810 KYPSLFRIASLPNASVKD-HWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EF 1869
            +YP LFR+    N S+          LWN++F   L + EI D + LM   +   +S   
Sbjct: 1580 QYPRLFRVVVDKNISISSVLGPSRPFLWNLNFRRNLSDSEIEDLEGLMRSLDDLYLSPSI 1639

Query: 1870 SDSRIWSLENSGLYSVKSLF-----------NY------------------WLPIH---- 1929
             D+R+W L +SGL+SVKS F           N+                  WL  H    
Sbjct: 1640 PDARLWPLSSSGLFSVKSFFLALSQSSGSSQNFPSKFVWNSQVPFKVKSFVWLVAHKKVN 1699

Query: 1930 -------------LYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVLDQSF 1989
                         L    C+       +   L   C      W +L  + K+ WV  +S 
Sbjct: 1700 TNDMLQVRRPYKALSPNICILCMKHGESTDHLFLHCSLMIGLWYRLFQLAKMDWVPPRSI 1759

Query: 1990 KGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKAS 2019
               +     G        +LW     A+   +W+ERN +IF D +      ++S    AS
Sbjct: 1760 YDMMSIKFKGFGNSKRGIVLWQAASIALIRVVWWERNAKIFEDKARNSEVLWDSIVFLAS 1819

BLAST of Spg026064 vs. NCBI nr
Match: RVX11253.1 (putative ribonuclease H protein [Vitis vinifera])

HSP 1 Score: 245.7 bits (626), Expect = 3.3e-60
Identity = 141/397 (35.52%), Postives = 209/397 (52.64%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ + FLW G
Sbjct: 227  ERISRRLDGWKKVYLSLGGRITLIQSCLSHIPSYFLSLFKIPVSIASKIEKMQRDFLWSG 286

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
                K +HL RWE +S+P   GG G G    RN+ALL KW WR++RE   LW KV+ SI+
Sbjct: 287  VGEGKKDHLIRWEVISRPKEMGGLGFGKTSMRNIALLGKWLWRFLRERSGLWHKVIASIY 346

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCL 1809
            G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C 
Sbjct: 347  GTHPNGWDANMVVRWSHRCPWKAIAQVFQEFSPFVRLVVGNGERIRFWEDLWWGNQTLCS 406

Query: 1810 KYPSLFRIASLPNASVKDHWDGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EF 1869
            +Y  L+R+ S+ N +V +       L WN +F   L + +I   Q+LM+  N  ++S   
Sbjct: 407  QYADLYRVISVKNLTVSNVLGNSLPLSWNFNFRCNLTDSKIDLLQRLMSSLNFVLLSPSS 466

Query: 1870 SDSRIWSLENSGLYSVKSLFNYWL-----PIHLYTKKCL---KLFGRLNALRELIFFCWG 1929
            SDSR WSL +SG +SVKS F Y L     P+     K L   K+  ++ AL  L+    G
Sbjct: 467  SDSRAWSLSSSGSFSVKSFF-YALSKVSNPLMFLPTKFLWSSKVPSKVKALAWLV--AHG 526

Query: 1930 KLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDI 1989
            K++ +  + WV  +S +  +     G         LW      +   +W ERN RIF D 
Sbjct: 527  KVVHLVGVIWVPPRSLQDMLVISFKGLGNSLRGKTLWQIACLTLIWMVWQERNNRIFEDK 586

Query: 1990 SLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW 2017
                   ++  R  +S W S ++ F G  +  + LNW
Sbjct: 587  GRTEEMVWDLIRFYSSLWASCTEAFRGVPLSILQLNW 620

BLAST of Spg026064 vs. NCBI nr
Match: CAN82685.1 (hypothetical protein VITISV_000485 [Vitis vinifera])

HSP 1 Score: 245.4 bits (625), Expect = 4.3e-60
Identity = 140/396 (35.35%), Postives = 206/396 (52.02%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ ++FLW G
Sbjct: 717  ERISRRLDGWKKTYLSLGGRITLIQSCLSHIPSYFISLFKIPASIASKIEKMQRNFLWSG 776

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
            +   K +HL RWE VS+P   GG G G +  RN+ALL KW WR+ RE   LW KV+ SI+
Sbjct: 777  AGEEKKDHLVRWEVVSRPKELGGLGFGKISLRNIALLGKWLWRFPRERSGLWHKVIVSIY 836

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCL 1809
            G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C 
Sbjct: 837  GTHPNGWDANMVVRWSHRCPWKAIAQVFQEFSPFVRLVVGNGERIRFWEDLWWGNQSLCS 896

Query: 1810 KYPSLFRIASLPNASVKDHWDGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EF 1869
            ++  L+R+  + N +V +       L WN++F   L + EI   Q+LM+  +    S   
Sbjct: 897  QFADLYRVIFVKNLTVSNVLGNSFPLAWNLNFRRNLTDSEIDFLQRLMSSLSSVHFSPSL 956

Query: 1870 SDSRIWSLENSGLYSVKSLF----NYWLPIHLYTKKCL---KLFGRLNALRELIFFCWGK 1929
            +DSR WSL +SGL+SVKS F        PI     K L   K+  ++ AL  ++    GK
Sbjct: 957  ADSRAWSLSSSGLFSVKSFFLALSKVSNPILFLPAKFLWSSKVPSKVKALAWIV--AHGK 1016

Query: 1930 LLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDIS 1989
            L  +  L WV  +SF+  +     G         LW      +   +W ERN RIF D  
Sbjct: 1017 LFKLAGLDWVPPRSFEDMLVIAFKGLGNSLRGKTLWQVACLTLVWXVWQERNNRIFEDKG 1076

Query: 1990 LPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW 2017
                  ++     ++ W S S  F G  +  + LNW
Sbjct: 1077 RSEETLWDLILFYSTLWASCSAAFRGVPLNVLQLNW 1110

BLAST of Spg026064 vs. ExPASy Swiss-Prot
Match: P0C2F6 (Putative ribonuclease H protein At1g65750 OS=Arabidopsis thaliana OX=3702 GN=At1g65750 PE=3 SV=1)

HSP 1 Score: 119.0 bits (297), Expect = 6.2e-25
Identity = 67/212 (31.60%), Postives = 109/212 (51.42%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            +++  ++  WR   LS  GRLTL  +VLSS+P++ MS+ L+P  +++++++L ++FLW  
Sbjct: 18   ERVSSRMSGWREKTLSFAGRLTLTKAVLSSMPVHSMSTILLPQSILNRLDQLSRTFLWGS 77

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
            +   K  HL +W +V  P   GG GV   K+ N AL++K GWR ++E +SLW  V++   
Sbjct: 78   TAEKKKQHLVKWSKVCSPKKEGGLGVRAAKSMNRALISKVGWRLLQEKNSLWTLVLQK-- 137

Query: 1750 GQNCYNWHTSGKVGLSLRSPWI----NISKVWKQ----FENLASFKL----GNGSRIAFW 1809
                  +H    VG    S W+    + S  W+       ++ S  +    G+G +I FW
Sbjct: 138  -----KYH----VGEIRDSRWLIPKGSWSSTWRSIAIGLRDVVSHGVGWIPGDGQQIRFW 197

Query: 1810 LDSWVVDLPFCLKYPSLFRIASLPNASVKDHW 1830
             D WV   P  L+  +  R         KD W
Sbjct: 198  TDRWVSGKPL-LELDNGERPTDCDTVVAKDLW 217

BLAST of Spg026064 vs. ExPASy TrEMBL
Match: A0A5A7T2Y0 (zf-RVT domain-containing protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold403G00100 PE=4 SV=1)

HSP 1 Score: 270.0 bits (689), Expect = 8.0e-68
Identity = 144/387 (37.21%), Postives = 202/387 (52.20%), Query Frame = 0

Query: 1682 IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLW 1741
            +++F  EG   SK+N L  W +VS P   GG G+GG+K  N ALLAKWGWRY +E  +LW
Sbjct: 1    MRNFFREGHADSKINQLVNWNKVSSPPKDGGLGLGGIKIHNTALLAKWGWRYSKEESALW 60

Query: 1742 CKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW 1801
             +V++SIHG+  ++W T GK G SLRSPW+NI++ W+  ++LASF LGNG RI F +D W
Sbjct: 61   RQVIRSIHGKEAFDWFTKGKSGNSLRSPWVNIARFWRLVDSLASFNLGNGLRIGFRIDPW 120

Query: 1802 VVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNG 1861
            V + P   ++  LFRIA  P  S           W ++F   L++EEI++FQ L+   + 
Sbjct: 121  VGNTPIKEQFSRLFRIALWPRCSFL------FFSWPLAFRRSLEDEEITEFQSLLFLLST 180

Query: 1862 AIVSEFSDSRIWSLENSGLYSVKSLFNY----------------------------WL-- 1921
              V    D R WS+E+ G +S KSL  +                            W+  
Sbjct: 181  EKVVNSDDFRSWSIESHGRFSDKSLSTHLKTASPMDKRLFSAILQSGSPRRINILIWIMV 240

Query: 1922 --------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL 1981
                          PI++    C         L  +  +C      W ++ S+F L W  
Sbjct: 241  FRFVISSEILQKKSPINVSPSICPLCLKASKNLPHIFLYCPVSSFGWERIFSLFNLVWNF 300

Query: 1982 DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSAR 2019
            D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A 
Sbjct: 301  DSSLSASVIQLLSGSNLPKTPRIIWEILSKALLIEIWIERNQRIFHDKARQRAEIMHAAD 360

BLAST of Spg026064 vs. ExPASy TrEMBL
Match: A0A5D3DE60 (zf-RVT domain-containing protein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold494G00090 PE=4 SV=1)

HSP 1 Score: 259.2 bits (661), Expect = 1.4e-64
Identity = 140/389 (35.99%), Postives = 199/389 (51.16%), Query Frame = 0

Query: 1682 IKSFLWEGSNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLW 1741
            +++F  EG   SK+N L  W +VS     GG G+GG+K  N ALLAKWGWRY +E  +LW
Sbjct: 1    MRNFFREGHADSKINQLVNWNKVSSLPKDGGLGLGGIKIHNTALLAKWGWRYSKEESALW 60

Query: 1742 CKVVKSIHGQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW 1801
             +V++SIHG+  ++W T GK G SLRS W+NI++ W+  ++LASF LGNG RI F +D W
Sbjct: 61   RQVIRSIHGKEAFDWFTKGKSGNSLRSHWVNIARFWRLVDSLASFNLGNGLRIGFRIDPW 120

Query: 1802 VVDLPFCLKYPSLFRIASLPNASVKDHWDGETLLWNISFCWLLKEEEISDFQQLMACFNG 1861
            V + P   ++  LF IA  P              W ++F   L++EEI++FQ L+   + 
Sbjct: 121  VGNTPIKEQFSRLFSIALWPRCYFL------FFSWPLAFRRSLEDEEITEFQSLLFLLST 180

Query: 1862 AIVSEFSDSRIWSLENSGLYSVKSLFNY----------------------------WL-- 1921
              V    D R WS+E+ G +S KSL  +                            W+  
Sbjct: 181  EKVVNSDDFRSWSIESHGRFSDKSLSTHLKTASPMDKRLFSAILQSGSPRRINILIWIMV 240

Query: 1922 --------------PIHLYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVL 1981
                          PI++    C         L  +  +C      W ++ S+F L W  
Sbjct: 241  FRFVNSSEILQKKSPINVSPSICPLCLKASKNLPHIFLYCPVSSFGWERIFSLFNLVWNF 300

Query: 1982 DQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSAR 2021
            D S   +V QLL G ++     ++W    KA+ +EIW ERNQRIFHD +       ++A 
Sbjct: 301  DSSLSASVIQLLSGSNLPKTPRIIWEILSKALLIEIWIERNQRIFHDKARQRAEIMHAAD 360

BLAST of Spg026064 vs. ExPASy TrEMBL
Match: A5BUT3 (Reverse transcriptase domain-containing protein OS=Vitis vinifera OX=29760 GN=VITISV_026823 PE=4 SV=1)

HSP 1 Score: 245.7 bits (626), Expect = 1.6e-60
Identity = 147/443 (33.18%), Postives = 209/443 (47.18%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            ++I  +LD W++  LS GGR+TL  S LS +P Y++S F MP  V +K+ERL + FLW G
Sbjct: 1400 ERISSRLDGWQKAYLSXGGRITLIQSCLSHLPSYFLSLFKMPASVAAKIERLQRDFLWSG 1459

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
                K +HL RW+ V KP   GG G+G +  RNLALL KW WRY RE  +LW +V+ SI+
Sbjct: 1460 VGEGKRDHLVRWDIVCKPKTIGGLGLGNISWRNLALLGKWLWRYPREGSALWHQVILSIY 1519

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCL 1809
            G +   W  +  V  S R PW  I++V+++F  +  + +GNG RI FW D W  D P  +
Sbjct: 1520 GSHSNGWDANTLVRWSHRCPWKAIAQVFQEFSLITRYVVGNGDRIRFWEDLWRGDQPLGI 1579

Query: 1810 KYPSLFRIASLPNASVKD-HWDGETLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EF 1869
            +YP LFR+    N S+          LWN++F   L + EI D + LM   +   +S   
Sbjct: 1580 QYPRLFRVVVDKNISISSVLGPSRPFLWNLNFRRNLSDSEIEDLEGLMRSLDDLYLSPSI 1639

Query: 1870 SDSRIWSLENSGLYSVKSLF-----------NY------------------WLPIH---- 1929
             D+R+W L +SGL+SVKS F           N+                  WL  H    
Sbjct: 1640 PDARLWPLSSSGLFSVKSFFLALSQSSGSSQNFPSKFVWNSQVPFKVKSFVWLVAHKKVN 1699

Query: 1930 -------------LYTKKCLKLFGRLNALRELIFFC------WGKLLSIFKLQWVLDQSF 1989
                         L    C+       +   L   C      W +L  + K+ WV  +S 
Sbjct: 1700 TNDMLQVRRPYKALSPNICILCMKHGESTDHLFLHCSLMIGLWYRLFQLAKMDWVPPRSI 1759

Query: 1990 KGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDISLPWLGRFNSARLKAS 2019
               +     G        +LW     A+   +W+ERN +IF D +      ++S    AS
Sbjct: 1760 YDMMSIKFKGFGNSKRGIVLWQAASIALIRVVWWERNAKIFEDKARNSEVLWDSIVFLAS 1819

BLAST of Spg026064 vs. ExPASy TrEMBL
Match: A0A438JQM5 (Putative ribonuclease H protein OS=Vitis vinifera OX=29760 GN=VvCHDp000001_490 PE=4 SV=1)

HSP 1 Score: 245.7 bits (626), Expect = 1.6e-60
Identity = 141/397 (35.52%), Postives = 209/397 (52.64%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ + FLW G
Sbjct: 227  ERISRRLDGWKKVYLSLGGRITLIQSCLSHIPSYFLSLFKIPVSIASKIEKMQRDFLWSG 286

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
                K +HL RWE +S+P   GG G G    RN+ALL KW WR++RE   LW KV+ SI+
Sbjct: 287  VGEGKKDHLIRWEVISRPKEMGGLGFGKTSMRNIALLGKWLWRFLRERSGLWHKVIASIY 346

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCL 1809
            G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C 
Sbjct: 347  GTHPNGWDANMVVRWSHRCPWKAIAQVFQEFSPFVRLVVGNGERIRFWEDLWWGNQTLCS 406

Query: 1810 KYPSLFRIASLPNASVKDHWDGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EF 1869
            +Y  L+R+ S+ N +V +       L WN +F   L + +I   Q+LM+  N  ++S   
Sbjct: 407  QYADLYRVISVKNLTVSNVLGNSLPLSWNFNFRCNLTDSKIDLLQRLMSSLNFVLLSPSS 466

Query: 1870 SDSRIWSLENSGLYSVKSLFNYWL-----PIHLYTKKCL---KLFGRLNALRELIFFCWG 1929
            SDSR WSL +SG +SVKS F Y L     P+     K L   K+  ++ AL  L+    G
Sbjct: 467  SDSRAWSLSSSGSFSVKSFF-YALSKVSNPLMFLPTKFLWSSKVPSKVKALAWLV--AHG 526

Query: 1930 KLLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDI 1989
            K++ +  + WV  +S +  +     G         LW      +   +W ERN RIF D 
Sbjct: 527  KVVHLVGVIWVPPRSLQDMLVISFKGLGNSLRGKTLWQIACLTLIWMVWQERNNRIFEDK 586

Query: 1990 SLPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW 2017
                   ++  R  +S W S ++ F G  +  + LNW
Sbjct: 587  GRTEEMVWDLIRFYSSLWASCTEAFRGVPLSILQLNW 620

BLAST of Spg026064 vs. ExPASy TrEMBL
Match: A5AY60 (Reverse transcriptase domain-containing protein OS=Vitis vinifera OX=29760 GN=VITISV_000485 PE=4 SV=1)

HSP 1 Score: 245.4 bits (625), Expect = 2.1e-60
Identity = 140/396 (35.35%), Postives = 206/396 (52.02%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            ++I ++LD W++  LS GGR+TL  S LS IP Y++S F +P  + SK+E++ ++FLW G
Sbjct: 717  ERISRRLDGWKKTYLSLGGRITLIQSCLSHIPSYFISLFKIPASIASKIEKMQRNFLWSG 776

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
            +   K +HL RWE VS+P   GG G G +  RN+ALL KW WR+ RE   LW KV+ SI+
Sbjct: 777  AGEEKKDHLVRWEVVSRPKELGGLGFGKISLRNIALLGKWLWRFPRERSGLWHKVIVSIY 836

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSWVVDLPFCL 1809
            G +   W  +  V  S R PW  I++V+++F       +GNG RI FW D W  +   C 
Sbjct: 837  GTHPNGWDANMVVRWSHRCPWKAIAQVFQEFSPFVRLVVGNGERIRFWEDLWWGNQSLCS 896

Query: 1810 KYPSLFRIASLPNASVKDHWDGE-TLLWNISFCWLLKEEEISDFQQLMACFNGAIVS-EF 1869
            ++  L+R+  + N +V +       L WN++F   L + EI   Q+LM+  +    S   
Sbjct: 897  QFADLYRVIFVKNLTVSNVLGNSFPLAWNLNFRRNLTDSEIDFLQRLMSSLSSVHFSPSL 956

Query: 1870 SDSRIWSLENSGLYSVKSLF----NYWLPIHLYTKKCL---KLFGRLNALRELIFFCWGK 1929
            +DSR WSL +SGL+SVKS F        PI     K L   K+  ++ AL  ++    GK
Sbjct: 957  ADSRAWSLSSSGLFSVKSFFLALSKVSNPILFLPAKFLWSSKVPSKVKALAWIV--AHGK 1016

Query: 1930 LLSIFKLQWVLDQSFKGNVQQLLIGPSVKSVSNLLWSNGVKAVFLEIWFERNQRIFHDIS 1989
            L  +  L WV  +SF+  +     G         LW      +   +W ERN RIF D  
Sbjct: 1017 LFKLAGLDWVPPRSFEDMLVIAFKGLGNSLRGKTLWQVACLTLVWXVWQERNNRIFEDKG 1076

Query: 1990 LPWLGRFNSARLKASSWCSLSKLFPGFSIQDICLNW 2017
                  ++     ++ W S S  F G  +  + LNW
Sbjct: 1077 RSEETLWDLILFYSTLWASCSAAFRGVPLNVLQLNW 1110

BLAST of Spg026064 vs. TAIR 10
Match: AT3G24255.1 (RNA-directed DNA polymerase (reverse transcriptase)-related family protein )

HSP 1 Score: 72.4 bits (176), Expect = 4.7e-12
Identity = 44/172 (25.58%), Postives = 67/172 (38.95%), Query Frame = 0

Query: 1630 DKIQKKLDRWRRFNLSRGGRLTLCNSVLSSIPLYYMSSFLMPPKVVSKVERLIKSFLWEG 1689
            +KI+ ++ +W   +LS  GRL L +SV+ S+  ++MS+F +P   + +++ +  SFLW G
Sbjct: 47   EKIRVRIGKWTARHLSFAGRLQLISSVIHSLTNFWMSAFRLPSACIKEIDSICSSFLWSG 106

Query: 1690 SNGSKLNHLARWEQVSKPLLSGGFGVGGLKNRNLALLAKWGWRYMREPDSLWCKVVKSIH 1749
               +       W  V  P   GG G+  LK  N                           
Sbjct: 107  PELNTKKAKVAWSDVCTPKDEGGLGIRSLKEANKGSF----------------------- 166

Query: 1750 GQNCYNWHTSGKVGLSLRSPWINISKVWKQFENLASFKLGNGSRIAFWLDSW 1802
                  W  SG   L     W  I K            + NGS  +FW D+W
Sbjct: 167  ------WSISGNTTLG-SWMWKKILKHRALASGFVKHDIHNGSNTSFWFDNW 188

BLAST of Spg026064 vs. TAIR 10
Match: AT1G30470.1 (SIT4 phosphatase-associated family protein )

HSP 1 Score: 65.5 bits (158), Expect = 5.7e-10
Identity = 35/62 (56.45%), Postives = 45/62 (72.58%), Query Frame = 0

Query: 1212 SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVR 1271
            S + EVH+NAA +LC + R+A  GL+ K+SS S    L++H LEDSRP SVL+NSLSV  
Sbjct: 204  SESPEVHANAAEILCTVARYAPPGLATKLSSPSCTGRLLKHTLEDSRPKSVLVNSLSVCI 263

Query: 1272 SL 1274
            SL
Sbjct: 264  SL 265

BLAST of Spg026064 vs. TAIR 10
Match: AT1G30470.3 (SIT4 phosphatase-associated family protein )

HSP 1 Score: 65.5 bits (158), Expect = 5.7e-10
Identity = 35/62 (56.45%), Postives = 45/62 (72.58%), Query Frame = 0

Query: 1212 SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVR 1271
            S + EVH+NAA +LC + R+A  GL+ K+SS S    L++H LEDSRP SVL+NSLSV  
Sbjct: 157  SESPEVHANAAEILCTVARYAPPGLATKLSSPSCTGRLLKHTLEDSRPKSVLVNSLSVCI 216

Query: 1272 SL 1274
            SL
Sbjct: 217  SL 218

BLAST of Spg026064 vs. TAIR 10
Match: AT1G30470.2 (SIT4 phosphatase-associated family protein )

HSP 1 Score: 65.5 bits (158), Expect = 5.7e-10
Identity = 35/62 (56.45%), Postives = 45/62 (72.58%), Query Frame = 0

Query: 1212 SNAAEVHSNAAGLLCAITRFALLGLSAKISSTSFVESLVRHALEDSRPTSVLINSLSVVR 1271
            S + EVH+NAA +LC + R+A  GL+ K+SS S    L++H LEDSRP SVL+NSLSV  
Sbjct: 200  SESPEVHANAAEILCTVARYAPPGLATKLSSPSCTGRLLKHTLEDSRPKSVLVNSLSVCI 259

Query: 1272 SL 1274
            SL
Sbjct: 260  SL 261

BLAST of Spg026064 vs. TAIR 10
Match: AT2G28360.1 (SIT4 phosphatase-associated family protein )

HSP 1 Score: 52.0 bits (123), Expect = 6.6e-06
Identity = 38/90 (42.22%), Postives = 50/90 (55.56%), Query Frame = 0

Query: 1184 NEPDVVQQDLQISVLEMGCSASACSEVHSNAAEVHSNAAGLLCAITRFALLGLSAKISST 1243
            N PDV++      +LEM           S+  EV +NAA  LCAITR A   L+ K+SS 
Sbjct: 180  NFPDVMRYLADSDLLEMIVDKLN----PSSPPEVQANAAETLCAITRNAPSALATKLSSP 239

Query: 1244 SFVESLVRHALEDSRPTSVLINSLSVVRSL 1274
             FV  +  HA+EDS   S L++SL+V  SL
Sbjct: 240  GFVSRIFGHAIEDSHSKSGLVHSLTVCISL 265

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
KAA0035739.11.6e-6737.21hypothetical protein E6C27_scaffold403G00100 [Cucumis melo var. makuwa][more]
TYK21876.12.9e-6435.99hypothetical protein E5676_scaffold494G00090 [Cucumis melo var. makuwa][more]
CAN75028.13.3e-6033.18hypothetical protein VITISV_026823 [Vitis vinifera][more]
RVX11253.13.3e-6035.52putative ribonuclease H protein [Vitis vinifera][more]
CAN82685.14.3e-6035.35hypothetical protein VITISV_000485 [Vitis vinifera][more]
Match NameE-valueIdentityDescription
P0C2F66.2e-2531.60Putative ribonuclease H protein At1g65750 OS=Arabidopsis thaliana OX=3702 GN=At1... [more]
Match NameE-valueIdentityDescription
A0A5A7T2Y08.0e-6837.21zf-RVT domain-containing protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27... [more]
A0A5D3DE601.4e-6435.99zf-RVT domain-containing protein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676... [more]
A5BUT31.6e-6033.18Reverse transcriptase domain-containing protein OS=Vitis vinifera OX=29760 GN=VI... [more]
A0A438JQM51.6e-6035.52Putative ribonuclease H protein OS=Vitis vinifera OX=29760 GN=VvCHDp000001_490 P... [more]
A5AY602.1e-6035.35Reverse transcriptase domain-containing protein OS=Vitis vinifera OX=29760 GN=VI... [more]
Match NameE-valueIdentityDescription
AT3G24255.14.7e-1225.58RNA-directed DNA polymerase (reverse transcriptase)-related family protein [more]
AT1G30470.15.7e-1056.45SIT4 phosphatase-associated family protein [more]
AT1G30470.35.7e-1056.45SIT4 phosphatase-associated family protein [more]
AT1G30470.25.7e-1056.45SIT4 phosphatase-associated family protein [more]
AT2G28360.16.6e-0642.22SIT4 phosphatase-associated family protein [more]
InterPro
Analysis Name: InterPro Annotations of Sponge gourd (cylindrica) v1
Date Performed: 2022-08-01
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
NoneNo IPR availableCOILSCoilCoilcoord: 1014..1034
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1355..1378
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1355..1377
NoneNo IPR availablePANTHERPTHR33116:SF33OS01G0885550 PROTEINcoord: 1630..1890
NoneNo IPR availablePANTHERPTHR33116REVERSE TRANSCRIPTASE ZINC-BINDING DOMAIN-CONTAINING PROTEIN-RELATED-RELATEDcoord: 1630..1890
IPR036691Endonuclease/exonuclease/phosphatase superfamilyGENE3D3.60.10.10Endonuclease/exonuclease/phosphatasecoord: 1408..1513
e-value: 1.3E-6
score: 30.3
IPR036691Endonuclease/exonuclease/phosphatase superfamilySUPERFAMILY56219DNase I-likecoord: 1405..1478
IPR025558Domain of unknown function DUF4283PFAMPF14111DUF4283coord: 588..652
e-value: 2.2E-9
score: 37.0

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Spg026064.1Spg026064.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
cellular_component GO:0110165 cellular anatomical entity