Tan0022641 (gene) Snake gourd v1

Overview
NameTan0022641
Typegene
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionRetrotransposon gag protein
LocationLG08: 13108330 .. 13131991 (-)
RNA-Seq ExpressionTan0022641
SyntenyTan0022641
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideCDSexon
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGAGTATGGTCGCGACAAAAGAAGAAAACCAAGGTCTAACTTCTAGTACCCCTCGATATTCAGTCTTCCAAAGACTAAACGTCTCAACTTCGAAGAAAGATCGACCTTTAACATCTATTTTCGATCGCTTAAAAGTAACAAGCAATCGACATGAAAGAAAGATGAAATCCTTAAAGGTAGAACTGTTCGATGAAGTAATCAATGACCAAAAGATTCATAGTCTTGTTCCTTCACGTATGAAAAGGAAGTTCTTTGTTCTCATAAACACAAAGAGCTCCTTGAAAGTGAAGAAAAATCTCATTCTCTTAACAAATCCTACAAATTAAGGACATGATCAAAATCATGATGATGACAACAACATCTAAGATGTACAAAAAGCTCCTTATCGCAAGAGCCTAAACTGCATGGTGCTCCTGGCTGCATTAGCTTAAAAGGTGAACGTAAAAAAAAAAATCTGAACTACATTATGACTTGTTCTTTTCCATTCAGAGGGTACATAGGCAGCTTAGAGGAAAATAAAACTCTAAGTTCAATCAAAATAATAAATAGAAAAAAAAAAGTTTAGCCAAAAGTAATAAATCAAAAAAATTCAAGTTGTGATGAGAGATTGGTATTTTACTTTAGCATGAGTCAATGCAAGTAATTTAGCTAAGTCCATATGACATCTTGGAAGTACACCATGATTCTGCAAAGGAGGGGAAAAAGTCAATATAAGGTGCCAATAAAGAAAGTAACAAAAGTCAATACGTGATCACACAAAGTAACTGCGAAGGGGAGTCGTCCATGGCCAAAGCCAAGAGCTTGGTCACCTTCAGTGATGAAACCAAAGTAACTGTAAGGGTGAGCCACCCATAGTCGAAGCTAGGAGCTTGGTCACCTTCAATGTCGAAGTCAAAAGTAACAACGAAGGTGAGTCGTCCATAGCCGAAGTCAGGAGCTTGGTCACCTTCAATGCCGAAGTCAGAAGTAACCGCGAAGGTGAGTCGTCCATAGCCGAACCCAGAAGCTTGGTCACCTTCATTGTCAAAGTCAAAGTAACCGTGAAGCTGAGCCGTTCATAGCCAAAGCCAGGAGCTTTGGTCACCACCAATGTCGAAGTCCAAAGTAACTGCAAAGGTGAGTCGTCCATAGTCGAAGCCAGGAGCTTGGTCACCTTCAATGTCGAAGTCAAAAGTAACCGTGAAAGTGAGTCGTCCATAATCGAAACTAGAAGCTTGGTCACCTTCAATGTTGAAGTCAAAGTAACCGCGAAGGTGAGTTGTCCATAGCCGAGGACAGGAGCTTGGTCGACAGGAGCTTGGTCACCTTCAATGTCGAAGTCGAAATAACCACGAACGTGAGTCGTCCATAACCGAAGCCAGGAGCTTGGTCACCTTCAATGCTAAAGTCCAAGTAACCGTGAATGTGAGTCGTCCATAGCCTAAGCCAGGAGCTTGGTCACCTCCAATGTCGAGGTTGAAGAAGATATCTTAGCTGCAAGTGAGAAATAAAGAAAGCAGAGGGGCAAATATATTTTTAGAAATTACTTATTTGTTTACCTTCTTGTGGTTGAGACTTTTCTCTATGCTATGATGGAGATGTTAGTGAGTCTTGCAAATTGCAAGTTCTTAAAAAATAGAAGAAAAAAAAAGAAAAAATTGCAAACAAAAAAGTAAAAAAAAATATATTTACCTCTTGAAAGGTGTAGTTTGTTTCCTCCTCGAGTGGAAATATTATAAACCTTGTAAGTCTCAAGTTCTAAACAAAAAAAGGAAAAGAAGTATGAAAAATATATAAAGAGAAAAAGAGAAAAAAACAGAAAATCAAAGTTTGGGACTTGCCTCACTTCTTAGTATGAATATTAACCAAACTTGTCTCCACTTCTAAACTCCTTTATTTATAGTTGAGGAAAAGATAAAGATCTAATTCCAAAATCCAAACTGAAATTGGATAAGATTTCATCCCAACAAAATTTGGCATAGTTTATCTCAAATTAAAAATTGACTGCCAAGTCATATTAAAATTCTATTTCAAATTCAAAGCTGAAGTTTGGTAGAAATTTTATCTCAAACATAAAATTTTGGTCATCATCCAAATTCTACCTCAAATAAAAAATAGATAAAATTAATTCTATCGAATCAAAACTATGGTAGAATTTTAATTTTATCTCACAAATCTAAATTTGGGCATAATCTAAATTTTATCCTAAATACAAACGAGATCAAATTTCAAATTTTATTCCAAGTTTAGATAAAAAAAATTGGGTAAAGTTCAAATCTTATTCCAATTTTAATAAAAATTTAGATAAAATTTTAATTTTGCCTCGGTTGAATTTTGAATAAGGAGAGCATAAATTCTACTAAAATTTAAATCAAAGTCTGTTGTCAAAGAAGAAAATCAAAATGATGATCAAAATTCATATTTTGATTTGTTGGCATGAGAGTGTGTCAAATAAAAAAAAATCTAAATTATGAGTCAAATTCATAGTTTGATTATTGACACACATTAATTGGAGTCCAAATTAGGAGCAAACATCCTAAATTTTGATTCCAAATTATCTTTTTCTAGATTCACTCACACATACTTGCATAAATCTTGTAAATGGGCATTTGTTGGAATAGAAATATTGGGCAATCAGAAGTCGTCATGTCATTGCTTAAAATTAATGGGAAAGTTATTTATTTAATTATGGATTAATTAAAATTATGAATATCTATCAATTGAATTAAGTAAATTTCATATTATGAAATTGGAACCAATTATTGACAAAGGCCAAATGTGCACCCAAATCTAACAAAGTATTAGCCCAAAGGGCTAGGTCCATGTCAATTGGACTAGTTTGAATGGGTCACACCCAGAGACAGTTATAGGCCCAGTCTAATGATCAGACCCAAACCCACTTATGAGCTCTTTAAATAGAGAGTTCTCCTTCATTTGAAGGGGTCAAAAGTTGGAAACTCCAAAGAGAAAATCCATTTCTATAACAAAGGCTAGAAGACTTTCTACAGTTCTAGAGATCAAACACTATCTGAACGAAGAACTCTACCTCAAAGATCAAGAATCACTATAAGGAAAAACTTTTTTCGTGTTGGGATTAATCATTCCCGACGCAAGCTTGCGTCGGCATAACAGTCGGTATATCCCAGTCGGCAGTAGCTTCTCCCGACGCAAATGAGTGCATCAGGATAAATATGGTCTATCTCAATGCAATTTGTGTTGAAAAATTGTCGAAGTTTCTGACGCAACAAAAAGCGTTGGGATATATATAACCTATCTGACGCATGTTGTGTCGGTATAGCTTAATAAAAATTCTTAATTTACAATTTCATTTTTCAGTTTTTTACCTATTCTGGCGCACATTTGCGTTAGGACTTAGGACTTAGGAGAACCCTTTTTTTTTTTTTGGCAATAATTTTTTTTCATTTCAATAGAAAAATACCATGTTTTAGTTAATATATTGAAACATAATATTGTTCCTACAAAAATATCATCCAAATGAAGTTAGAACTAATTACAAAAAATTAAAAAAAAAAAACAAAATAAATACACTTTTTCATATCCAAGTGTTCATACACCATGAGTTTAGCCCAATGCACTTGTTCACCACTCATGAATCTATCCACGTGGTATAAATGAGCAAAATTGCCATAGGAAGAAAAACATAACTCGAAACTTTGTTAAAGAATCTATCCTATTCCCCAAACTACAAAGTGTGTAATGATCTTAAATTTTTGGAGAAACCTATCTAGGGTCATTAATCAAGACACGTTGTTCGCGCCGAAATTTCGGCAGCATAACAATACTACTAGGACTATCTAAAAATTTTTAGGGACTTGTTTGCAGTAATTAAACATTCCTTAAACAACACAATCCTCCTAACCTCCCACTAAACATCAAATATGCATGGGCTAGGACGATCAGAAATGCACAATACATGCTCAACTACGTAATTCTAGAATTTAAACAGGAGTCACAAGTTCAGATAATAAGACTTAAAACATGATGAGTTATAAATAGTAAAGGAAGACTATTTATCCCAACGTATATGAAGGCAATTCAAGAAGTTAAAATCTTGACTACAAATTCAACACTATGCAATAGCTAGCATATAATCTAATCATGTATTCAGTTATTACACACCCTTAAACTACATTTTCGAAAGAAGTATAAGTTTGGCACAAAAAAGGACAAACTGAGGAGAAGGCAACGGTTTCGTTGGTGTTCTTAAAGTTGTTGCTCAGACGTAATTGAACACAAAAGATCACCACGAACAACCTTCTCCCTTACAAAATGATTGTGAACTCGATATGCTTTGTTCTAGCATAAAAATGGATACCGAGCTAAGGCAAGCGCAAAAACATTACACCTTAACTAAAATATTAACTAAGTGCATATTCAATTATTAAAATTAACCTTGACAAGATCTCCAAATATATCTATATCTATAATATATAATATATTAAAAAGTTACCATCTTTAAAAAATATTTTTAGATTATTTTACCCCTTTTTCAATTTTATATTTATGAAGTATGCAACCCATAATAAATTACTAATCATTATTAATTTTTTGATACTAAAAAATAGTAAATTATATAGTAATTTAACTCGTAAAGTGACATTGAAAAGTTAGAATAGGAAAATTTTCATCTTTATTTATGTAATTACTAACTTTTAACAATTTTACTTTAATTAAAAAGATTACCAAGATTTTTGAAATTTCAAAAGTTTTACTATTTCAATCAATCATAGGTTGAATTTAAATAATAAAACCTATAATTTATATTTATATTTAAATTAATTTTTGTAAAACATTTTTAACAAATGAAAGAAGATGAGATGTAACGCCCCAAGCCCAACATCCTCTGTGACTTGGCCACGTCACCATACCACCCATACCATTCTTGAGCCGCTTGCAAGAGTGAAGACTTCCCCACAAACTAACACGGGTCGTTTTAGCATGCTTTGTCCTCACTCACATGAGTCCTAGGAAGATTCTCAGGAGGTCACCTAACATAAGATTGCTCCAAGACAAGCACGCTTAACTGTGGAGTTCCTATGATTGAGCCACTGAAAAGAAAGGTGCACCTTGTTGGTATAGGTAGTAGCTATCAATTCTTTTAAGTCATTCTCAACTATATTTTTCATATCCTCATGGTCACTCTCATGTACCTATTTTCCTCAGGTACCATACTTTATATCCTCAGGATTCCTCTCATTCAGATGACTCAGTTCATTCATGTACCCCTCTTCCTCGGGCGTCACAGCAGACGAGAGAGACGCGTAATGAGGGATGAATTTGAACAATGCACGTCCAGGATACGAATCAGTGAGATTGAAATTTAGGGAAATCCCTCCGATCGTCTTTAATTACAAAATTGTCATTGAATTTTATTTATTTAATAAAATTGTTCTTAGATGTAGTTTTGCATTTTTTTTTTTGTTTTTTTTTTAATTTTCTCAAAATTCACCAACTTAGCATTAAAATTTACAAAATTTTCCAAACATATATTTATATTTAATATAATAAAAATAATAATAAAATTTGTATCAGCCATTCAATACGATTAAACATAAAAATTTCAAACGATGCAGTTCCATTTGAATACATGATTAATTAACCATACTTTTTTTAATTAATTTAATTGACCAAACTTACTTGCTCGGTTTAATTTGGTCTATTTAGTTTGATTCATAATATTGTAATTTTTTTATTAAAAAAAATCAACATTTATCACTAAACTTACCAAATTGCAATATCACTTTTACTCAAACTTTTAGTTTTCACTTTTACTCAAATAATTAGACACTCAATCCTATAGATTTTGATTTTAAAAAAATTCCTAACAATTTTGTACCATACATAATACCTTATTCCAATGATTATTGGAAAGAAATCTTACCAAAGAATAAAAATTGCAACATCTTAAATTTTACAGTTAAGACTACAATATTTTTTAAAGTTGAAGGTTGAAATTGTAATACATGCCAAAGTTTAGGTGGAATTTAACAAAATTAAAAGTATAGGATAAGAATTGATACAACGTAGCATATTTTGAGAAGATTTCATTACCCCTTTTTAAAATGGCCAATAAAAAAAATAAAAATATACTAGATCTTTTTTTAAAAAATACCCTAATAAAAAAGATTTAAAATTAACTAGTATCAAAAATTCTACTTTGCCCATCATACTTTTTTTTAACAGCCTATCATACTTAATATGGTTCAATAAAGAAAATACAAAACAAAAATTTGCATAAATCTTATAAATTAAAAGCAAGACTTTAACTTTGAAATCTGTATTACTGTTGTGAAAAATAGGATGGAAACCGGCTATAGTTTTATCAATATTTAAATACTAATATAATATATTTATAATAATAATAAGAAGAAGAAGAAGAAATTGAAATTTAATATGAATATGTATATAATATTATGTATTATTTGGAAATAGAATATAATATAATATATGAGATAGTGGAGAATTATGGAAATTAAATAAGAAATAAAAGAAAGAAAGTGGAGGGAAGAAAAGAGAATTGGTTTATTCTCACCAATGTACATTCTACATAAACCACCATAAGCTACTATTTATAGGCAAAGTGGCAAGAATGATGTGGAACAATTAGACACCAAGTTATGGTATTTGTTGGACACATGGGAGACACCATGGCTATGGGAATTTTGCCACTTGACATGGGTAATATAATGACATGTGGATGGACATTTATACTACACATATTTACAATACTCCCCCTTAAATGCCCATTTATATAATATATGCCTCGTTAAAACCTTACTAAGGAAGGAAAAAGAGTACATATTTTATATAATACATCTACTCCCCCTCATGAAGATATCAGTTGAGATCTCTGAGTCGTCGCATCCCAATACTTTGAACCAATTTCTCAAATGTTGTAGTTGGTAATGCCTTTGTAAATATGTCCGCAAGTTATCTCTCGAACAAATCTGTTGTACTGAGATGCCACCATTTTCTTAAAGGTCATGAGTGTAGAAAAGCTTTGGAGAGATATGGTTCGTTCTATCTCCTTTAATATATCCTCCTTTGACTTGAGCTATACACGTTGTGTTGTTTTCGTATAATATTGTTGGAAGGGGTTTACTCGAAGACAAGCCACATGTCTCACGAATGTGTTGTGTCATTGATCTTAGCCATACACATTCTCGACTTGCCTCGTGAATTGCGAGGATTTCAGCATGATTCGAAGAAATGGTCGTGATGGTTGTTTCACTGATCGCCATGATATAGCAGTTCCTCCATATGTAAATAGATAACCTGTCTGATATCTAGATTTGTGTGGATCAGATAGATAACCAGAATCTGCATAACCAACTAGATCAAAATTGGATTGGTTAGAATAAAATAAACCCATATCAATCGTCCCTCGAAGATATCATAGTACATCCTTAACTCCGTTCCAATGTCTTTTTGTAGGATATGAACTATATCTAGCTAATAAATTTACTGAAAATGCAATATATGATCTTGTGTTATTAGCCAGATACATAAGTGCACCAATTGCACTAAGATATGGTACTTCAGGACCAAGTAGTTCTTCATTGTCATCTCGAGGTCGAAATATATCTTTCTTTACATTCAGTGAACGAACCTCCATTGGAATGTTCAATGGATGTGCTTTATCCATATAGAATCTTTTTAAAATTTTATCTGTATAAGTTGATTGATGAACAAATATCCCATCTGCTAAATGTTCAATTTGCAAACCAAGGCAAAATTTTGTTTTTCCAAGATCTTTCATCTCGAATTTTTTTTTAAGATATTCTATTGCCTTGGATAACTTTTCAGGAGTTCCAATTATATTTAAGTCATCAACAGATACAATTATAATAACAAATCCTGACTGAGATTTCTTTATAAAAACACACGGACATATTTGATTATTTTGATATCCTTCTTTCAACAGATATTCACTCAGGCGATTATACCACATTCGTCCTGGTTGTTTTAATCCATATAATGATCTCTGTAACTTTATTGAATACAATTCCCGAGAACTTGATTCATATGTTTCTGGTATTTTAAATTCTTCTGGGATTTTCATATAAATCCTTCTGGGATGAGAGGACGTGTTTGGACCTCGGCCCAGACCGAGGTCGACCAGGGTAGAGCCCTCCCATTTGGGCTCTACCCTCGCCCAGTATCTCGAGAACGGAGACTGGACTTGGATCAAAGCCTAAGCCCGTGGTCGAATTGGAATTAGGAACCCTTTGATCATGTGAACCCCTAATTCTCAAATACTAAAACTCCCAAATCGATTCAATTTCAATCCCAAGGGAAGGGTTAGGTAAGAATTACCTTGTTGATCATAGACCAAGAGGTAAGGAATTGATTTCTCACTCAAGGGTTGAACACTCGATAAGCAAATTGATCAGACTTACTTGAATGTTCAGGCATGCTACCCTAAAACAAGAATTGCAAAGTGGTGAGGCTCGTGGCTCTCAAATGTAGATCACTACCATTTCATTTAAAACTAAAACTATCCTCTGTACAACCTAATGGCCAAGCTTTAAATAGCTTCCCAAATCCTAAATGCCAAATCAATAATCATAACAAATGACAAAAATACCCCTACTTAAAATGTCATAAAAATGATAAAATTGAAAAAATAATAAAATTACATAAAAAATTAGAAAATGACAATTTGATGCTCTGGTGGTTCATATCATCCTCTTCTTCTTTTGAAAGATTCGTCCTCGAATCTAACTTGTCATCTTGGAGAGCAAATTTGTAGTCATGAGATGTCAATGATCTATCTCTTTTTGGATTCCTCTTAAACTTTCGACCAAGGATGAGTTCATCAGTAAGCTTTAGTAACATCTCTGTTTTGTACTTCGCATGTGGAAAATATTGCTCCTTCACTAGTGCATTAAGTTCCTGTGAAAATTCAAAATTAGCAGTACTAAATACACTAAGATTAGGTGTACCTAAGAGCTAACAAGTTCTCTTGTGTACAAGCTCCAAAATGAATCGTTTTGAGGAGATAATTTTATCCTCACAAACTCCCAAAATTGGACTCACTCCTTTGACCTCTTCTTCATTTTCACTACTTTGTATACTGCTTCCAATTTCTTCTTTCACATTCTCTTCTTCTAAGGTCTCTACCTCCTCATTCTATTTTTCTAATTTTGACTGAGTAATGTATATCTCTTTTATTCTCGGTGGCTCTTCTTTCTTCATCTTCAGAAATATTTATATTTAAATCTTCTTCTTGTGCTTTTAGATGATGTACTTGTTCTTCTTCTTGGGTGGGTCGATCGTGTTCTTCTTGGCAGGTTTTTCCTCTCGAGGCTTGGTAAAACAAACTCCATTCTTGGATGAGTTCTCTAGCATACTTTCTTATCGAATGACGTAGTTCAATCAATTCTTCCTGTATAGCCTCTTTAAGTGTTGCATCTTTACTTCGATTTTCAACACGTCTCTTTTGTTGGTACATGGCTGCAAAATAAAAACAAGTAAAAGAAAAGTGGACCTCACAATCACTCTCTCACATATTTCACTCAGACAAACGAATGGTCACTCGTGTTTACCCTCGAAGATATAACACTCCCTCACAAAAATGAACTCTCTCAAAATAGAAAATAGGTCGCCAAGGCTCCGTTTGATAACATTCTTGTTTCCAGTTTCCAGTTTCCTGTTTCTTGTTCCTTGTTTCTTGTTTCTCATTTTTTAAGAATAAGAAACAAGAATATGTTTGATAACTATTTTTGTTTCTTGTTTCTTTGAAAACAAGAAATAGAAACATAAACTTGTTTGATAACCATTTCTTGTTTCTTGTTTCTTGTATATATAAATATACAATTAATTATAACAAATTTATATTATCAAATACCAAGTCTCGATACAAAATTAATTAATAATAAAAGTAAATAAATAAAATTGTTTTATCCTTCAAATGTTGTTCAAATTTGAGTTGTAATCTTATCTCTTACTCGAGTCATTCGTTTTAAATGATGTGGACTCAGATCAAACTCAATTATATTGTTAAATGTTGTGGTTGTAAAATATTAAAATGAGGCTAAAGACTTGTTTTAGTGAACAAAATTTATTTATTGCAAATTTACAAAAATATATAAATATAAAGATCGCAAAATTAAAATTCAAAATTCAAATAATACATATATAAAATTTCAAATTTTCAATTAAAATAATAGAAATATACAAATGTAAAATTAAGAAATAAAATAAAAATAAATAAATTTATACAATAATAATATTATTTATAAAAACTAAAACTATATATATTGCAAAAATTCGAAATACATAAAAAAATAAATAAATAAAACAATCATTTGTACACACTTTGGGTCGAACTCAAGACTGGAAAGGGAAAATGATAGTGGGTGGTGGAATTTTTATCAACAAGCTGGAAAGTTATTTTAGAAAAGGTGGGAACATTTAAAATTAAAAAGAAACAGAACAGAAAGAAACTACTTTATGTAGTTTCTAAAATTTAGTCTAAATTTTAGAAACGTTTCTCTAATTTTGAGAACAAAAAACGGGATAGATTATCAAACAAGTCTGTTTCTTAAAAAATGAGAAACAGAAACAAGAAACAGGAAACGGGAACGTTATCAAACGGGCCCCAAGATTTTGCACTATCACAAACTTAAGGAGCAAGCCTTGACCACAAAAGCAAGATTGATGTGAAGTATTGGATCTCAAGCAAAGAAACAAGTAGAACAAACAAAAATAAGAAAACTAAGAACCAAGAACCTAATGTTCAAGATCCAAAAAACTAGGGAGAAAAACAAAAATAAGATATTTAGAATTAAGAATCTAATATTCAAAATTCAAGGAATTATGTAAGAAAAACAAAGAAAGGCAAACAACTAAACAATTTTTTTAAGTACTGTAACTACTTGCAAGTGTTTGAAATTAAGATAAGCGCTGCAAACAAGCAAGAGTTTATGCACAAATTCACAAAATAACCCGAATTAACAAAAATAACTTCTTTGATCAAAATATCAAAAACTATAAGGATTATGGTTTATGATAGGGGTAGATTGATAAATTTGATAAAAATAGTTAGGGCTCTTAAAACTAAGTGAAATTTAATACACTCAAAGCTAAAAGTATCAAAATCACGTGAACAAAAATTGGGTTTAAAATAAAGAAGTTTAGATAACAAAAAGCTAAGAAAGAAAAGTTGCTGCATAAAAGAAATTGGGCTTCTGTACAACCAAATTTGTTTGGTTGGTTCAGTACCTTTCGGTCTAGTTCTTTGAGCGCAAATTTTTGAGTTTCTTTGTGAAACGCAAAAGAATGAGTGTATAAAAGTTGGATGCAAAATAAGATCGTTTGGTCTCTGTAAAAATTATTCAAATCAGATAGATAAGATTTTCCAGATTTGAACAGTATGAACACAAACGAATTTTCTTCTATTTTCCTTCGACCTTTTCCAGAATCAATATTTTTTTTTCAAACTTAAGTCGATTTGATTTACTTTAGGTACTGGAATAAATCAATTTAGAGTCCTGAGCACTAAACTAAAAATAGGTCAAATCAACAAAATTCTGTAGATGTGCAACAGAAAAATTTTCAAAGAACAAATTTCTAAGAACATAGGTATGCTTTTGGAATCTACTCTCTGAATTTTGAATAAAAAGGGCTTATGGTTAAAGTTTTGTCCAAATATGATCAAATAAAATATAATTGTTTCAAAAGGTTATGCAAGAATAAGACATAAACAATTGTTTGTTCAGAAAGATAAAACACATGAATCAAATTGCAAGTATTTTTTTTTTAATAAAAGAGACAAAAAATTTGGAAACAAAAATTCAAAATATAGATAAGAAAAAAAAATAAAAGAATGATAGATCCGATCTAGAGCCAAAGCTCTGATACCAAATGATATGAAAACCCTAGCGAATTGGAATTAGGAACCCTTTGATTATGTGAACCCCTAATTCTCAAATACTAAAACCCTCAAATCAATTCAATTTCAATCCCAAGAGAATAGTTAGATGAGGATTACCTTGTTCATCAAAAACCAAGAGGTAAGGAACTGATTACTCACTCAAGGGTTGAACACTCTACAAGCAAATTGATCAGATTTACTTGAATGTTCAGGCATGCTACCCTAGAACAAAAATTGCAAAGTGACGAGGCTCATGGCTCTCAATGTAGATCACTACTAATTCATTCAAAACTAAAACTATCCTCTGTACAACATGATGACCAAGCTTTAAATAGCTTCCCAAATCCTAAATGCCAAATCAATAATCATAACAAATGACAAAAATACCCCTACTTAAAATGTCATAAAAATGATAAAATTAGAAAAATAATATAATTACATAAAAAATTAGAAAATGACAATTTGATGCTCTGGTGGTTCATATCATTATGTGATTACTGTTTAAGCCCTTGGACTTGTAAGCAAGAGCGATATAATGATTAGAGGTGATCATCGGTCGATCGGGGTCGATTTTCAACCCCCAACCAACCTCGAACTAATCAAATTCAGTTGGTTTGATCAACCTCTTTTTTCTTACTGTCTTAAACCAACCAAAATCGATCAACCGACCGGTCGGTTTGATTGGTTTATATTTTTTAATTATTTTTTATTTCATTATTATATATAATATATAATATAAATATATAAAATTTTTACAGTTTTGTTTTTTTTATTATTATATTTTTAGAAAAATTCAGTCAATTTTGTCGACCCTGATCGACTCCTACAAAAATAGATCGACCGACTTCGGTTCGATCAGTTTTGGTCGATCGAGTCAGTTTTTGGTCTTTTTTGCTCACCCCTAATAATGATGGTGGATTTGTTGGTATGTTGTTCAATTCTTGTTGATCTGTTATATAGCTTAAGTAACTTTTAAAGTCGTAGAACATATAATTTGGGGATGTTATGTATGCTAAAGTTTGTCATTTTGAAGGACATTTCTGACACATGGTGGGAATTGATAGATTGTAATGTTTGAACACAATGCATGATGAAATCTGGTTGTTTGTTTGGTTGATGAAATCTGTCTTCTTCAAGAGATCAAATTGTTGGAACACAATGCATGAAATTCAAGATAATTTTCTTTAAAGAAAACGTTACAAACATGACTAGCAAAATGTGTCTAGAACTAATTAATTTGGCATTCTCACAACGTCAAGAAAACAAAAAATTTGACGAACAAAAAATGTCAAGTTCTAACAAGAACGATAAGTAATAAGTGTTAAGAATTTACAGACATGACGCTTTAGAAATGTCAATAAGTTTAATGTTCTTCACTAGAGGTATCCATTTAACTCGTGGGGTCGGGGCCTCGCAAGGACCTGCCCTGAACAGGGCGGGGAATGGGGAAGTGAGCGGGGAGAGATTTCTCTCCATTTGCTAATCGGGGTTGGGGTCCCTGGCACTGCCCCGTATCCTTGCCCCGTTTGCTTTTTAACTTATTTATATATTATTTATATATTATATTAATTTACTTAATTTTTATTTTATATATATATACACACACATACACACTTAGGGGTTGTTTGGTGTAAGGTTTTATGGATGAGAATGGGTAAGGATTTTAAATCTCCTTGTTTGGAACAAGGTTTGTGAGTATGGGCATAGGTATCACCTATTCTCATGCATCACTTTTTTCCCCATGATAGATGAGTTTTCTATACCTTTCAAGAATGATGGGTTTTCTTTATACTCATCCATCTCTCTCTTCTTTATTAATATCTCTCTCTTCTTTATTACATAAAAATCTGATAACATTCCCATATAGAACCAAACACAGTCATATTATTCTCAGACATTTTATTCCCAGGCATCTATTACCCATGGGCATCCAATAAAACCTTAAACCAAAGGACCCCTTAAGTGTTAACCTTAAATCTCCCTCACTCCTTAGCCTACTCACCTGCCTTAAAGTGTTCTCAGTTTTCACTCCTCCTTCTAGTCGCATGTTGCCTTCATCAAGTCCTTCTCGTTCCCTCCAGCGTCGTTCCCCGCACGACCTGCAACGTTGTCGTCCTTCTCATTCCCTCCAGCGTCGATCGTTCCTCTACTCCGGCGTCGTTCTCCCTCCACTACAACGTCATTTGCCACACGACCTGCAACGCTGTCGACCGAGTCCCTCCGGCATCAATCGTTCCCCCCACTCCGGCGTCGATTATTCTCGTCGCACGTTCATTCCTTCTTCTCACCGTCCTTCTTCCAGATCTGATGATTTCAGTTTAGGTACATGTTTGTTTCATTTCTTCTCTGTAATTTTGCTCAAAATAATATGAATTTGGCTTATTTTAATGTTGTTTTAGATCTGATAATGTAGATTTAGCTTATTTTTAATGATGTTTAGATTTAAAAAAAAGTGTAGATTTAGCCTATTTTTAATGTTGTTTTGATAAAATAGGGTAGAATTTAGCCTATTTTTAATGTATTTTTAATGTTGTTTTAGATAAAGTAATGTAGATTGGCCTATTTTTACTGTTATTGTAGTTAATAAGCTAGATTTAACTTATTTTTAATGTTATTTTAAATTTTGTATGAGATAAAATAATGTAGATTTAGCCTATTTAGAACAAGAATCTATGTTTAATTTATTAATTTTAATATGAAATTTGAATGATATAATGTGCTCAATAAAATTAGTATATTAATTTAAATATGAATTTTGAATGATATAGTGTTTATTGTATAAGTGCTAAATAAAGTAGTATATTAATTATATAATTTATTTATTATTGTAGGTTAAAATGACTTTATCAACTAATAATGAGTCACGACAAGTTAATTCAACTCCAACTCCAACTTCTAACAACTTGAGCGAACCAACACCGATAATCTCTACTGATAGTACACCTATTACCTTAGATAGTGATGCCAACGATGATGATGAAGGGAAACATAAGTTAACATTAGTAGTGTGGAATCATTACAAAAAACAAAAAATAAATGATACCATGAGGCTATTTGTAATTATTGTGGGAAAAAGTTAGGAGGAGAATGAAAAATGGGACAAGGCATTACACGGTCATTTCAAAATATGTCCTTTGAGGAAACAAAGAGACATTAGGCAATCGTGTTTGAGACCAAACAAAACCAATAATGGAAAGGTAGGCTAAATTCATACTCTTTTGATTATGAAGCTTCTAGAAGAGACCTTAGTTGTGCGATAATTTTACATGAGTACCGTATTCAGAAAGTGGAAGCAATTTAGGATCTTGAACATTCTAATTTGATCGATTTTGCAAAATAAAATGCATGCTCAAAGCTGGAAAAATAGAGGGATAGAAAACTCAACGTTGAACATCAAATTGTCTTCACCCGGTGGATTATTTTCAACACGAACACTTCATAGACCACCTCTAGAGTCTTCCCTACTATCCTCAGGCCTTGGAGCGGATTGTGGGATTCTAGGTTGAGAGAATTTGGGAGAAAAGAGCTCAAAGGTCACAAACCAAGAATTGAGAGAATTTCTGCAAAATTCTATCAAATTACCTCAAATCACCATTAAATAAAGTTTCATCAAGCTTCATTAGAGTAACAACTCGATAGTGATGAGGATTAATTGAGATGGAGGTGGCCAATTTTGGCCAATTTTGAGCTGAATCATCATGGGCAAGTTGGCAACTTGGATTTCATGGAAAATCCTTGAAAATCCCTTTTTTTTCTTTTTAATTTTAATTAAAAAATCAATAATAAATTGATTTTAAATTAAAATTAATTAATTAAATAATTAATTAATTTAATTTAATATTAAATATTAAATTAAATAAATTTCCCAATCCCGATCGATTTTTCGAACATAAATCCTTATTCATGCTATAAATCGATCCAATATTTAAATCATATTTAATTATATCCATCTTCTTTTAATCATAGTTTAATTCATAATTCAGCTATGACTCGTTAAATATATCACACATAATTAACGATTTCTCCAAAACCTAAATTTGAACAATTCAAATTCTTGTCTCTCAAAATGTTACAAGGCTTAATCCGAGCTAGTAAGGAGGACCTAATGGACCTACAGATCATGAGCTCCAACGATACGAGATTAATCGGCCAAACTCTTTAGCCTAGCTAATCAACATTCGTTATCCACTGGGACACTCCACTAAAGCCCAGTGGTTGCACTCTGGTCACTGTAGATATATTTCTGTCCACTTGATATAACCATAATTAGTAAGTCGATCCTTCACCAGGTCGTTCGTAATTACAGCTGGGTCAAAATTACTGTTTTACCCCTGTAATTACTTCTTGTTCCTTAAGTCCCACAGATCCTTTAATGAACAATTGGTTTGTGGTCCAACCAGCCAATCGAATCCCTTTCGGGCCAATGAGAGAGGTGGACCCTTTATTCAAGACCCGGAGTCAGCATTTAAGGGAACAACCTCTCTATTAATCCTTAAAGCGGGTAGGAGTGAATTCCATCTTGTAGAACTATGTTCCCAGCTATCTACCCGGTCTTATCCCTGAAATGGAAGGCTTATTGAGTCGGCAATCTCGAGCCACTCTCACCCATGCAAATCTAAGGATAATCCAAATAAACAGGAGTTCATAGCATGCTCAGGATTAAGATCGAGTTACCTAGGTTATCGTATGAATATAGTCAGTTAAGACAGTAAATGGAGTTATAAAGTTTAAGTGACTATTTCGCGGTCCAGTCTTATGCAAACTCATTGCATAGGACGCCCCCACTCACATGTCTCCACATGAACGATCCAGGATCACATCGTTTGTACTTTACAAAGTGGGTCGCGTCCATAGTGTCCCCAGGATAAGGTATTCAACCCTATCCTTATACTATAAACCGTTCTGGCTATAACCTGAACTTGATCCACTTTTATGTCACACATAAAGTTCAAGTATTGATCCTATAGCCAAGGGTTCTTTATTGGATTAAGGTTACACAATACACAATTCATTTTATTCAATAACATCTTTACTGAATAAATCTCAATAACATCTTTATTGCAAAATAGAATATACATTCAGTTTACAAAACCACGAGTTTTAGGACATAAAACCCAATAAACTCCCACTTGGACTAAAACGCCAGTGGGGTCAAACATGTTGAGCAAGAAAAACTGCCCTACTGTACAACCCGTAGACCTAGACTTTCTAGGTGACCCTCAAACACTTTAGTCGTGAAGGGGCTTTGTAAACGGATCAACAATGTTGTTCTCCGAAGCGATCTGCATGACGATCACGTCTCCTCGTTGCACAATCTCTCTGATGAGATGATATTTGCGCTCTATGTGCTTTCCGCGCTTATGGCTTCTGGGTTCTTTAGAATTTTCCACTACACCACTGTTATCACAATAAAGGATGATAGACAAATTCATATTTGGAACAACTTTCAAATCAGTCAAGAACTTCCTAAGTCATACTGCCTCCTTCGTTGTTTCGCAAGTTGCGACATACTCAACCTCCATGGTGGAGTCAACAATACAACCTTGCTTTATACTCCTCCATACTAAAGCTCCTCCGTTAAGAGTGAACACTGATCCTGATGTTGATTTCCTCGAATCTACATCAGTCTGAAAATCAGAGTCAGTGTATCCTGCAAGGATCAAATCCTTTGTGCCATACACAAGCATATAGTCCCTTGTTCTCCTAAGATACTTGAGGATTTTTCTTAACGGCAGTCTAGTGATCATATCCTGGATTGGACTGATACCTGCTGACTATTCTCACTGCATAGCATATGTCGGGTCGAGTACATAGCATGGTATACATCAGACTACCGAGAGCTGATGCATAGGGAATGTGTCTCATATCCTCAACTTCTTGAGGTGTCTTAAGACACTGTTCCTTAGACAAATGAATTCCATGCCTGAAAGGTAATGATCCCTTCTTGGAATTTTGCATCTTATATCTAACCAACATCTTGTCAATATAAGATGTTTGAGACAGTGCTAGTGTTTTGTTCTTGCGATTCCGAACAATTTGGATTCCAAGAACAAACTGAGCCTCTCCCAAATCTTTCATTTGGAATTGGGTCGCTAGCCATTGCTTAACGCCAGTCAGGAATCCTGCATCATTCCCAATGAGCAGGATATCGTCTACATATAAGACTAAGAAGGCTACAGTGGTATTGACTATCTTCTTGTAAACACAAGGCTCGTCAATATTTTGTTTAAAGCCATAAGATTTGATTGCAGTATCAAATCTTATATTCCAGGATCTAGAAGCTTGCTTCAATCCATAAATGAACCGTTTAAGCTTACAAACTTTTTGTTCTTGACCCTGAACTATGAACCCCTCTGGTTGATCCATATAGATACTCTCTTCAAGTTTGTCATCCAGAAAGAGTGTCTTGACATCCATTTGTCAAATTTCATAGTCATAAAACGTGCCAAATTTCTAATGGACTTAAACATGGCAACAGGGGAGAAGGTTTCTTCATAGTTCACCTCTTCCCTTTGGGTATAACTCTTTCCCATAAGTCGAGCCTTAAAGGTTTGCACCTTACCGGCTCGATCACATTTACTCTTGTAGATCCACTTGCAACCGATAGGTCTTTCACCATCTAGTTAATCTGCAAGTTCCCAGACTAAATTGAAGTACATTGAGGTCCATGACTTTAATCCAATGGTCCCTATCTATATGATTCATTGCATGTTTATAGGTCAATCGATCCCCAACGCCATCATCAGGTATGACGACCTAGGTTTCAGTCAAACCCATGTAACAGTCAGGTTGTCTAACATCTCTCCCACTACGTCGAGGCATTCTCAACTCTTGAGAAGGACTAGCTTGATCAACATTTTTTGTTGATTTATCTGTAGCTTCCCTGAAAATTTCGCTCAAGACAATCCTGCTACGAGGTTGATGATCTCTCATGTGGTCTTCCTCTAAGAACGTGGTGTTTGTCGACACAAGCACCTTGTTCTCTTGAGGATCATAAAATAGATAACCTTTCGTTTCCCTGGAGTATCCTACGAATAGACATAATTTTAAACGATGTTCCAGTTTCTTTGGACTGGACACCAGCACATGTGTCGGACATCCCCAAATTTTGAAGTGACATAAACTACCTTTACGCCATTTCCATAACTCATAGGGTGTTTCAGAAACACTCTTAGAGGGAACCATGTTCAAAATATATACAACAACTTCTACTGCATATCCTCAAAACAAACTAGGTAGCTGAGCATAACTCATCATAGATCAAACCATGTCTAACAGGGTTCTATTTCTCCTCTCATATACACCATTCTGCTGAGGTATACCAGGCGCTGAGAGTTGGGATACGATTCCATGTTCTATTATATAGTTTTGGAATATCAAATTCATATACTCTCCACCTCGATCTGATCGAAATATTTTAATCGTTTTACCTAATATGTTCTCAACCTCTGCCTTATACTCTTTGAACTTTTCAAGGATTTCAGACTTATGATGCATTAGGTAAAGATAATCATACCTCGAATAATCATCAATGAAACTGATGAAATATTCATACCCTCCTCGTGCCTTGACATTCATAGGACCACAGAGATCCGAATGCACGAGTTCCAAGGGTTCTTTGGCTCTATAACCTTTTTCATAAAAAAAAAAGGTATTTTAGTCATTTTCCTTCAAGACAGGACTCACATGGTGGTAAAGAGTTGTCCTCTAATTGACTCGGGATACTACTCTTGACCAATCTCCCAATCCTATTGAGATTAATGTGGCCTATAAAGAGAATGAAACTCCCGCAGCAAAAACGACTTTGAATCGTCGTGGTGTTCGTTGTGAATAACGTTTCTTAAAATTAAACCTATCTCATAGATTTTAGGCTAAAAATGCATAAAATGAAGGAAAAACAGTAAGAAAGAAGTACGTACTTGTTAAAGAACGTTTCTTCAAGATTTCCTTCTCTGATCATGAACTCTTCGTGCCCTCGATCTCTACAATCACGAACTCTCGAACCGAACGGATTGGACACTTCCAAAACGATCTTCTCAGTTGTTCTCGGTCGGTAGAGGGAGAGTGGTGGAACTCCCTTTGGTATGGGGTAGAGAGAATTTGAGAGATTAAGAGAATTTGAGAGAAAGCCTTTTGGTGAGATTCCAAAAAATGGCACATTTGTATAATTGGGTTATGAAAATCATATTTGCATAACACATATAATAAGATATCTCATACCTTATTATACAAATGCACATTTGTATAATTGTGGATTTTAAATTGAATCACATTCAATTTAATTTCTCTCAATCCAATTTCTCCAAATTAGCACTAATTAATCAATTAGGCTAACCTATAGTTTATCATGAATCTCATTCACATTAAACTATATATTATGTCAATCATATCTCATTTAAATGACATAAATACCCTTTTAATGAATTTGAGCACTTCAAATCCACACCAAACTGTAAACTCTCAATTTATCCAGTTTGAGCGAACCGAGGGACCTAATGGACCTACAGATGGCGAGCTCCAATGATCCGAGATTAACCTGTCAAACTATTTGACCCGGTTATTCAACATTCATTAGTTACGGTAACACTCCACTAAAGCCCGTAGTTGCACTTTCATCACTGTAGGACAAGTTGTGTCCATTGATATAACCAATGCCCATGAGTCGACCCTTCACAAGTTATTCGTAGATACTGTTGGGTCAAATTACCATTTTACCCCTGTGACTACCTCTTGCTCCTTAAGTTCTACTGCTCCTCTAATGAACAACAACGTTGCATGGTCCAACCATAAAACAACATCCCTCTCGGGCCAGTGAGAGGGTGGGTGCCCGTTGTCCAAGCCCTGGAGACAACACTTAAGGGAACAACCCCTCTAGTTTTCCTGAGTCGGGAACGAGTGAATTCAATCTCACGTAGTAAAGTTCCCAGCTCCCCACGTGGTATTGTCCCTGAGAAGATAGGCATATTAAGTGAGTAACTGTGACCACCCTCACCCGTATTTAGTCAAAGGGATGCACCCTACTGCATGCGAGTCCGTAACACGCTCAGGATTAAGGTCGAGTCACTATTGGTCATCTACGAAATTATTAGTCTATATCATCATTAACGATGTTACATCAGTAGGTCTAATAATTCACGGTTCGGTCTTGTACAATCTCATTGCACAGGATGCCCCACTCGCATGTCAACCACATGAACGAGTTGGATCACCTCGTTTGTATCTAATACAAAGCGGTCGCATCCACACACGTATCGAGATTAGGTCTCCAACCCTATCCGTATATTGTAGACCGTTCGGGTCATAAACTCGAACGTGATCCTCTCTGTGTGTCCACTACACATCGTTCAAGTTCTAGTTCTCTCATAATTCAATGACCCTAGAGCTTAGTTTATTGGATAAAGTTTGTAAATATGCGAGACACAAAGTGATGAAAAAATAACTCTTATTTATTTCAATAAGTAATGTTATAAACATATACGAGATTAGGACATACATCCCAACAGCCTAGTCTCAAGTGCCAAAGATAGGTACTAAGAGAAAGCTTTTTCCTTTTATTTTGAGTATCAGCTGTTTTAAACATCTCGGTGTTCAAAATAGCTTTTACCTCTGTTGGTCGTTACACATATAAGTTGTTTTCAAGTTTAGCAGAACATATTTGTACACCTCTTTTGCAAATGAACACTTCATTATGATCAAAAGATACTTTATACATATGTTCAAGCAAACAAGAGATAGATACAAGATTTCTTTTGATTCCAGGAACCAAAAGTACATTTTCTAATAAAATAAATCTATCTCTTAATAACAACTTCACTGCTCCCACTGCTTTGGCCGAGACAACCTCTCTTGTTCCAACCCTGAGAGTTATCTGTCCATCAACAAGTTGCTGCCAGGAACTAGTTTCCTGAAAAGAAGAACAAACATGGTTAGTGGCTCCTGAATCTAATATCAAGGCGGAATCATCATGTTCCACTAAACATGTTTCAACAACAAGTAAATCACATTTACCTAGTTTTTCCTTCTCAACTTTCTTTTCTGTAAGGTACTTTGGGCAGTTTCTCTTCCAGTGCCCATCTGCACCACAATGGAAATATTTTCCTGTGGCTTTAGCCTTGCGTATGGGAGCTTGTTCCTTCCCTTTGTCATTTTTCTTCTTCTGAATATCATTATTCTTGGAAAAAGAAGGACCAGACTTGGTCCCTGAGAACGATCCTCTTAGGAACTTCTTTGAAGTGACAACATTTGTCTCCTTCTCTTTTCCCTTTGATTTCATCAGGGATTCAAAAGTTTGAAGCTCATTGAGGAGAGTAGTCAGGTTATATTCTATTTTATTCATCACCGCATTGGTGCGGAATTGCAGGAAACTCTTCGGAAGAGATTTCATAATAAAGCTAACATGACTCTTTTCATCTATGACAACCCTGTTTAATTCTGCTACGTTGAAGTGGACCATCATGTTAAGGACTGATGGAGATTTGATCTCCTTGAGCAGTGGAAACGTGTTTGGGATCGTAATTCGCTTGATTGTTTTAGTTTAAACAAAAACCAATACATTGACAAAAACATACAGAATAAACATGCTCTTTAATCTAATTAAACATGGAGGTTTACATGCAAACATGTTTAAATTAATTTAACAATTAAACTAATAATTAGATAAAGGGATTACCTTTGTAGACTCGCAGCAACTCCTTGCTCCAAGCAAATTCCAGTAACTCGGCAACACAACAACTCCTCTGTTTTTCACCAACAGGAACACTACCACTTGGAAAACCCTCTATGTCTCTGAGTGCTTAGATCTTCCTTGGTGGGAAGGATCCAACAATTGGAAGAATTGAGAATTAGAGAGTGAGAGAGAGAATTCTTGCTAAGAGAACTATTCACAAAATCACAGATCGAACTTTTTTTTCATTAACTCACCCCCTTCTCCCTATTAATCTATCAATAGGGAGAAGGAGAGGGATAGTGGGAACGTGTCTAGATGACACGTTCCCTCATTTTATTATTAAAATAATAAAATAATAATAAAATCATATTTAATTATTAATTTAAATCATATTTAAATAAAACAAATTAAATATCATATATTTAATTTGGATTAAATCACATTTAATCAATATATCCCTCTGTACATCCAGTGCACATTAAATTTTAACCTATAGTTTTCAAATATGAATCACATTCACATTTGAATTTAATATTTGAACTCTTTCAAATATTTAATTCTCTCATATAATTTAATATGAATCATATTCACATTAAATTTATAATATAAAGTTCCAAAACTATATATTATATCATATCCATATACATTAAATATATTCCCAAATGAATTTGAACATTACAAATTCAAATGATCTAAAAACCCTTTACGAGCTAGAAGGTGGACCTAATTGACCTACAGATCAGAAACTCCAACGATACGAGATTACTCTTGTTAATCTCATTAACCTCCCAATCAACATTCGTTAATCTGCGGAACACTCCACTAAAGTCCCGGTGCCGCACTCTTCTCACCGCTGCGAGATATATTTACGTGTCCACGGATATTGACCAATAACAACAAGTCAATCCTTCATTTAATGTTCGTAACACCGGTGGGTCAAATTACCGTTTTACCCACAGGTTACATCTTGTGCCTTAAGTACCAGTGCTCCTCTAATGAACAATTTGTTTGTGGTCCTACCAACAAACAGAGTCCCTCTCGGGCCAATGAGAGGGTCGGGCCCTTTGTTCAAGTCCCGGAGACACCACTTAAGGGAACATTCCTCTACTTACCCTAG

mRNA sequence

ATGAGTATGGTCGCGACAAAAGAAGAAAACCAAGGTCTAACTTCTAGTACCCCTCGATATTCAGTCTTCCAAAGACTAAACGTCTCAACTTCGAAGAAAGATCGACCTTTAACATCTATTTTCGATCGCTTAAAAGTAACAAGCAATCGACATGAAAGAAAGATGAAATCCTTAAAGGTAGAACTGTTCGATGAAGTAATCAATGACCAAAAGATTCATAGTCTTGTTCCTTCACGTATGAAAAGGAAGTTCTTTGTTCTCATAAACACAAAGAGCTCCTTGAAATTCAATCAATTCTTCCTGTATAGCCTCTTTAAGTGTTGCATCTTTACTTCGATTTTCAACACGTCTCTTTTGTTGGTACATGGCTGCAAAATAAAAACAAGAGGACCTAATGGACCTACAGATCATGAGCTCCAACGATACGAGATTAATCGGCCAAACTCTTTATACCAGTGCTCCTCTAATGAACAATTTGTTTGTGGTCCTACCAACAAACAGAGTCCCTCTCGGGCCAATGAGAGGGTCGGGCCCTTTGTTCAAGTCCCGGAGACACCACTTAAGGGAACATTCCTCTACTTACCCTAG

Coding sequence (CDS)

ATGAGTATGGTCGCGACAAAAGAAGAAAACCAAGGTCTAACTTCTAGTACCCCTCGATATTCAGTCTTCCAAAGACTAAACGTCTCAACTTCGAAGAAAGATCGACCTTTAACATCTATTTTCGATCGCTTAAAAGTAACAAGCAATCGACATGAAAGAAAGATGAAATCCTTAAAGGTAGAACTGTTCGATGAAGTAATCAATGACCAAAAGATTCATAGTCTTGTTCCTTCACGTATGAAAAGGAAGTTCTTTGTTCTCATAAACACAAAGAGCTCCTTGAAATTCAATCAATTCTTCCTGTATAGCCTCTTTAAGTGTTGCATCTTTACTTCGATTTTCAACACGTCTCTTTTGTTGGTACATGGCTGCAAAATAAAAACAAGAGGACCTAATGGACCTACAGATCATGAGCTCCAACGATACGAGATTAATCGGCCAAACTCTTTATACCAGTGCTCCTCTAATGAACAATTTGTTTGTGGTCCTACCAACAAACAGAGTCCCTCTCGGGCCAATGAGAGGGTCGGGCCCTTTGTTCAAGTCCCGGAGACACCACTTAAGGGAACATTCCTCTACTTACCCTAG

Protein sequence

MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKVELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFNTSLLLVHGCKIKTRGPNGPTDHELQRYEINRPNSLYQCSSNEQFVCGPTNKQSPSRANERVGPFVQVPETPLKGTFLYLP
Homology
BLAST of Tan0022641 vs. NCBI nr
Match: KAA0042866.1 (retrotransposon gag protein [Cucumis melo var. makuwa])

HSP 1 Score: 102.8 bits (255), Expect = 3.4e-18
Identity = 57/94 (60.64%), Postives = 70/94 (74.47%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKKDRP TS FDRLK+T++R +R+MKSLK 
Sbjct: 151 LSMATKEEENQCPTSTYARTSAFKRLSISTSKKDRPSTSSFDRLKMTNDRQQREMKSLKA 210

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSL 95
           + F E   D KIHS VPSRMKRK  V INT+ SL
Sbjct: 211 KPFHEENGDDKIHSRVPSRMKRKLSVDINTEDSL 244

BLAST of Tan0022641 vs. NCBI nr
Match: KAA0041771.1 (retrotransposon gag protein [Cucumis melo var. makuwa])

HSP 1 Score: 102.4 bits (254), Expect = 4.4e-18
Identity = 61/115 (53.04%), Postives = 79/115 (68.70%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   KEENQ  TS+  R S F+RL++STSKK RPLTS FDRLK+T+++ +R+MK+LK 
Sbjct: 398 LSMATKKEENQCPTSTYARTSAFKRLSISTSKKHRPLTSAFDRLKMTNDQQQREMKTLKA 457

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFN 116
           + F E  +D KIHS V SRMKRKF V INT+ SL     F+       IFT++ N
Sbjct: 458 KPFHEENDDDKIHSRVSSRMKRKFSVDINTEDSLTVKPRFI-------IFTNLIN 505

BLAST of Tan0022641 vs. NCBI nr
Match: TYK02797.1 (retrotransposon gag protein [Cucumis melo var. makuwa])

HSP 1 Score: 102.1 bits (253), Expect = 5.7e-18
Identity = 62/115 (53.91%), Postives = 77/115 (66.96%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKKDRP TS FDRLK+T++R +R+MKSLK 
Sbjct: 151 LSMATKEEENQCPTSTYARTSAFKRLSISTSKKDRPSTSSFDRLKMTNDRQQREMKSLKA 210

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFN 116
           + F E   D KIHS VPSRMKRK  V INT+ SL     F+       IFT+  N
Sbjct: 211 KPFHEENGDDKIHSRVPSRMKRKLSVDINTEDSLTVKPRFI-------IFTNPIN 258

BLAST of Tan0022641 vs. NCBI nr
Match: TYK30263.1 (gag protease polyprotein [Cucumis melo var. makuwa])

HSP 1 Score: 102.1 bits (253), Expect = 5.7e-18
Identity = 62/115 (53.91%), Postives = 78/115 (67.83%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKKDRP TS FDR K+T+N+ +R++KSLK 
Sbjct: 91  LSMATKEEENQCPTSTYTRTSAFKRLSISTSKKDRPSTSAFDRPKMTNNQQQREIKSLKA 150

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFN 116
           +LF E   D KIHS VPSRMKRK  V INT+SSL     F+       IFT+  N
Sbjct: 151 KLFHEENGDDKIHSRVPSRMKRKLSVDINTESSLIVKPRFI-------IFTNPIN 198

BLAST of Tan0022641 vs. NCBI nr
Match: TYK18884.1 (gag protease polyprotein [Cucumis melo var. makuwa])

HSP 1 Score: 100.5 bits (249), Expect = 1.7e-17
Identity = 55/94 (58.51%), Postives = 70/94 (74.47%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKK RP TS FDRLK+T+++ +R+MKSLK 
Sbjct: 92  LSMATKEEENQCPTSTYARTSAFKRLSISTSKKHRPSTSTFDRLKMTNDQQQREMKSLKA 151

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSL 95
           + F E  +D KIHS VPSRMKRK  + INTK SL
Sbjct: 152 KPFHEENDDDKIHSRVPSRMKRKLSIDINTKGSL 185

BLAST of Tan0022641 vs. ExPASy TrEMBL
Match: A0A5A7TLK0 (Retrotransposon gag protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold44G003800 PE=4 SV=1)

HSP 1 Score: 102.8 bits (255), Expect = 1.6e-18
Identity = 57/94 (60.64%), Postives = 70/94 (74.47%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKKDRP TS FDRLK+T++R +R+MKSLK 
Sbjct: 151 LSMATKEEENQCPTSTYARTSAFKRLSISTSKKDRPSTSSFDRLKMTNDRQQREMKSLKA 210

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSL 95
           + F E   D KIHS VPSRMKRK  V INT+ SL
Sbjct: 211 KPFHEENGDDKIHSRVPSRMKRKLSVDINTEDSL 244

BLAST of Tan0022641 vs. ExPASy TrEMBL
Match: A0A5A7TJH2 (Retrotransposon gag protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold67G001260 PE=4 SV=1)

HSP 1 Score: 102.4 bits (254), Expect = 2.1e-18
Identity = 61/115 (53.04%), Postives = 79/115 (68.70%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   KEENQ  TS+  R S F+RL++STSKK RPLTS FDRLK+T+++ +R+MK+LK 
Sbjct: 398 LSMATKKEENQCPTSTYARTSAFKRLSISTSKKHRPLTSAFDRLKMTNDQQQREMKTLKA 457

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFN 116
           + F E  +D KIHS V SRMKRKF V INT+ SL     F+       IFT++ N
Sbjct: 458 KPFHEENDDDKIHSRVSSRMKRKFSVDINTEDSLTVKPRFI-------IFTNLIN 505

BLAST of Tan0022641 vs. ExPASy TrEMBL
Match: A0A5D3BTJ7 (Retrotransposon gag protein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold8715G00010 PE=4 SV=1)

HSP 1 Score: 102.1 bits (253), Expect = 2.8e-18
Identity = 62/115 (53.91%), Postives = 77/115 (66.96%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKKDRP TS FDRLK+T++R +R+MKSLK 
Sbjct: 151 LSMATKEEENQCPTSTYARTSAFKRLSISTSKKDRPSTSSFDRLKMTNDRQQREMKSLKA 210

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFN 116
           + F E   D KIHS VPSRMKRK  V INT+ SL     F+       IFT+  N
Sbjct: 211 KPFHEENGDDKIHSRVPSRMKRKLSVDINTEDSLTVKPRFI-------IFTNPIN 258

BLAST of Tan0022641 vs. ExPASy TrEMBL
Match: A0A5D3E2D7 (Gag protease polyprotein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold344G00160 PE=4 SV=1)

HSP 1 Score: 102.1 bits (253), Expect = 2.8e-18
Identity = 62/115 (53.91%), Postives = 78/115 (67.83%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKKDRP TS FDR K+T+N+ +R++KSLK 
Sbjct: 91  LSMATKEEENQCPTSTYTRTSAFKRLSISTSKKDRPSTSAFDRPKMTNNQQQREIKSLKA 150

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSLKFNQFFLYSLFKCCIFTSIFN 116
           +LF E   D KIHS VPSRMKRK  V INT+SSL     F+       IFT+  N
Sbjct: 151 KLFHEENGDDKIHSRVPSRMKRKLSVDINTESSLIVKPRFI-------IFTNPIN 198

BLAST of Tan0022641 vs. ExPASy TrEMBL
Match: A0A5D3D5Q0 (Gag protease polyprotein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold204G00920 PE=4 SV=1)

HSP 1 Score: 100.5 bits (249), Expect = 8.1e-18
Identity = 55/94 (58.51%), Postives = 70/94 (74.47%), Query Frame = 0

Query: 1   MSMVATKEENQGLTSSTPRYSVFQRLNVSTSKKDRPLTSIFDRLKVTSNRHERKMKSLKV 60
           +SM   +EENQ  TS+  R S F+RL++STSKK RP TS FDRLK+T+++ +R+MKSLK 
Sbjct: 92  LSMATKEEENQCPTSTYARTSAFKRLSISTSKKHRPSTSTFDRLKMTNDQQQREMKSLKA 151

Query: 61  ELFDEVINDQKIHSLVPSRMKRKFFVLINTKSSL 95
           + F E  +D KIHS VPSRMKRK  + INTK SL
Sbjct: 152 KPFHEENDDDKIHSRVPSRMKRKLSIDINTKGSL 185

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
KAA0042866.13.4e-1860.64retrotransposon gag protein [Cucumis melo var. makuwa][more]
KAA0041771.14.4e-1853.04retrotransposon gag protein [Cucumis melo var. makuwa][more]
TYK02797.15.7e-1853.91retrotransposon gag protein [Cucumis melo var. makuwa][more]
TYK30263.15.7e-1853.91gag protease polyprotein [Cucumis melo var. makuwa][more]
TYK18884.11.7e-1758.51gag protease polyprotein [Cucumis melo var. makuwa][more]
Match NameE-valueIdentityDescription
A0A5A7TLK01.6e-1860.64Retrotransposon gag protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaf... [more]
A0A5A7TJH22.1e-1853.04Retrotransposon gag protein OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaf... [more]
A0A5D3BTJ72.8e-1853.91Retrotransposon gag protein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaf... [more]
A0A5D3E2D72.8e-1853.91Gag protease polyprotein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffol... [more]
A0A5D3D5Q08.1e-1858.51Gag protease polyprotein OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffol... [more]
Match NameE-valueIdentityDescription
InterPro
Analysis Name: InterPro Annotations of Snake gourd (anguina) v1
Date Performed: 2021-10-25
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
NoneNo IPR availableCOILSCoilCoilcoord: 41..61

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Tan0022641.1Tan0022641.1mRNA