Lsi05G005470 (gene) Bottle gourd (USVL1VR-Ls) v1

Overview
NameLsi05G005470
Typegene
OrganismLagenaria siceraria (Bottle gourd (USVL1VR-Ls) v1)
DescriptionDNA mismatch repair protein MSH5
Locationchr05: 6793328 .. 6816932 (-)
RNA-Seq ExpressionLsi05G005470
SyntenyLsi05G005470
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideexonCDSthree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGAATGGTAAATAGTCCCGATGACAAAGCGGGCGGTGACGATGTGAACGGCATAAGTATAGAATGTCCCCCTTCCCATGGGATGGGATGGAATTTCCTAGGATTAATTAAGAAATGTGGGTGGTTTTAAGAAAAAATTGGTAAAAAAGAGTGGTTTTAAAATTAAATAGGAAAATAGGGTAGTTTTTTTTGTCTTTTAGTGAAAACACTTTTTGAAAGTTGGAATGGGACCTACATCATGAAGGAAATGGCAATTATTTTGATTTTTTTTTTTTTACAAATTAATTTACTTTATTTTTGTTTAAGGAAATATAATATTGTTATAAATATTTGAATTAGATATGGATGTCCATAGATTTTATATCCTTAGATATTATTTCCAATATCTTTCCCTTTATCTCCTCCTTGTATTTAGTTTTTCCATATCTTGTAAACTCTATAAATAGTGGTCATTGGGACCTTTGAGAAACACAATTGAATAGAGAATACATTCAGTCTCTACTTTCTCTTCTCTCTACTTTGTTCTTTATTCTCTTGTTTTATAACACGTTATCAGCACGAGACTCTACCACTTTAAAGATTGGTTTTGGATTTGATTCATTGGAATACCAAGAACGCTAAAGGCTACATATTATCGAGGTATTTAAAACTAATAAGGTGAGTACTTTGTTTTAATATCATATATGTGATTGATGTGTTTGCAAATTGATTGCTATGGTACATTTAGCATTAGTTTTATATTTGATTAAATTGTATTGGATTTGCGATTTGACTAACACATGAAATATTTGCAACCGAATTTAGTTTGAAGTTAATTAAGAAAAAATCTTTTGATATCAAATTGTGTTATTACGAATGACATTCATTGTTAAAATTTTGGGTTCATGCATATCAACCTAACATGCATATTTATAAGTATATATTGTCAACTTGAAGTTTATTTGAAGTATATGCATATATTGGTGTTGAGTAAGTAAAAGAGTTTTGGCTGGCCAACTTTCCAAAGCACTTCAAAATCTAGGGTTTTTAGAAACCTATTTTTTCGAATGTCTAAAATAGATTGAAAGATATAATATCTTGAATTTAAATCGTTGTAATTCAAATTGTCTTCAATTTCTTAAAGCTAACAAATATGTTTAGTCAATTTTGCTATTTAACTTTACTTATGTATTTGATATATGTTTTACATTGTTCAACTAATTCTAAGTATTGATATTCATGTGGTTGTTGTAACCATGTGGATGTCTATTAGTGGTGTGATGATCCACTAAACCTTGTTGAATCAAATCTTGAGGTTTAGTCAATTTGAAGATTTAGAATTCTAATTATGATAATTTAAATTGTCCTCAATCTCTTATGACTATATTATGCATGTTTATGTTAGCAATCATGCATCTTATTTTTAAGTTTTATCTTTGAAAAATTTGATTAAGATATTTTCCTAATTAGTTTATATTTCTATATCTTTAAATATAATTATTATATATGTGAAAAATTAAATTAAGATATTTGTTTTCTTAATTGGATTATATATTTGTTGTTAAGATTTGAATTTCTTTTAAATAAAGATATGATTATCTCCTATTAATATTACCTTTTATTTGTTAAGATTGTCTTTTGATAAATATTATATTTATTTTGAAAGATTTAAGATATTAAAGATTATTTCTTAAAGTGGATTTGTTTTAATAAGATAAATAATTCGCTTAGATTCATTAATCTATTAAAAGATTAATGAATTAAAAATAAAAATTGACTCTGTCTAAGGATTATTCTGGCTAGGCTGAGGTATTTAAGCTGGGAACACCTCTACATGAGAACTAACCTGGGAGTTGAATTAGTCAAATTTTATTTTTCATGCTAATATTGAAATTTATTTGATTGTTGAATATTAAAATTATTCTCATGTAGATTTTGTAAACTTTAAAATTTTATATATAGTGATTATATATATTTGAAAGAATTCTCTCATGACTGAAGTTTAAAAGTTATAATAGTTAATTACTCTTCCTAATTTTGATTTAATACACCTGAAGTTGCATAAATCAATTAGTGCTTATTGTTTTTACGTTGCACCTGTAGTTGCACATATTTTAAATTAATAAGCATATATTACTTTCATACATCAAACATGCTATGCTCTTGCATTAGCAATTTGAAAAAGAAAGTTTGAAATATTGTGATGAATATTTATCTAATATATTTTGAGGTTAAAACATTTGGCCATATGCTCTATTACCAAATAATTTAATATCATTCCCTGAAGTGAATGTTGCAATATTTAATAATTGAGGTCGGAATAATATTAGTAAAGGAAGAAGTAATTATTCTATTAAAACCACACATATTTATATAAGAATTTCATATTTCAAATGTGATGCAAAAGAGACAATGATCTTGTACCTGTCGTAAGAGTTTTTTTTTTTGAAAAATTAAAATCCTTAATAATGAAAAGGAAGACGATGTGTGGTATAGCAAATTTTGAGATTTTATTTGAATCTCTTGAAGAGATCATAACTTATCATTTTAACCCCTAAATATGATGATATTTGGATGTTACAAGTTTTTAGAATCTTCTAAAGAGATTATTATTATTTTTGACCTATTTGTATATGAGATATTTGGTTTTCTTTTGAATCTCCTGAAGAAAAAAGAATAATTAATAATATTTATGTTTTGCATATAGTACATCTATGCATATGATACTTAGAAGTAGACAATACATTTTCCAAAATTCAAATGCTTGAAGCAAAAAAAAAATCAAATTAATATATATTAAGTCATGTAGACTTGATTAAATATTTTGGAAAAGAAAATATTATTTTGCTCATATGAGCAAAATTTACGATTGATATACCACATTCTCTTGTAAATCAAAGAGAAGTTTAGTAAATTTGGAAGGTATATATTGTAATAAATATCATCTAGAGAAATTGATAATCTATTGTCTCCTACGGGAAATGCATATAGAAAAGTTGTATGTTTTTCCTTCTAAACTGTATTACACATATTCGTGTAATTGAAATATATGCAACAATGAACCCGAAGTTCATTGATCCAAATATATTTTTATTTGACATGATGAGTCATTTTGGGTCAATAGTGAAAATAATTATTGAAAATCTACATTCACATCCACGGAAGAACTAGAAAATTCTTCCATCTAATAAATTGTCCTATGTGGATTTGTTCTCAAGAGATTAATTATCAAACTCTTACTAGTTAAAATTGAAACTCAACCTTTCAAGAGAACCATTTAAATATTTTATGGTTTTGTTAGCGCATCCAGTTGATGGTCACATATATGTTTATTATCTTCAAAACCTTACATCTGCAAGGTTCGTTGCTCAAATAATTAAGTGTACAATTTCATGATTTTGAAATTAAACATTTTGTTTTGATAATGCTAGTGAGTTTGCATCCCAACATTTGATAATTGATTGGGAAACTTCTATCTGTATGAGATCACATTGTTATGTATGCTCTAAACCAATAGCTTATGAGCTCATGGCCAGAAGCCAAATATATTTCATGTGTGCAAATGTGCAGTAAATGATTAAATTGTTCCACAACAACAATTATGATGATGGATCAATTAAAATGAGTCCTCAAAAGAGGTTATGAATTTATGTTGCAATTGATTTCACATCAATCTTTGGATCCCTGATAGGTGATAATATATTTACTACACAATTTACTAGTTGTCATTAATGAGACAAATTTTCCAACATTAGGGGGAGGAATTAAGAAGTTGGAAAAATAAATTGAATGAAATGTATAAGTATTGTCTCATTTCGATCATCATACAGATCAATTTGAACTAGAAGTTCAAAAGCTAATTCATTTGCAAAATATTGCAAATCAAATGCTAGATGCAATTATAGAACAACATTTACTGTTGCAAGAAAGTGACCAAGTTATATGAAATGGTTGTAAATGCACCATCTAATATTAATATCCCAATGCAACAAGTTGTCAATACTAATGAGTCTTTAACACGCCTGAAGCATGATAGACATATGGGTTCCAAAGATAAAGATACTCGAAAAAAGGCGTCAATGATCAAAATGACTCAGTTAAGAATATGGATATTCCAGAAGAAATCCTGAATATGAGTACTCATAAGAATCTTGAAGTAAAAGAGGATAACAAAGAGATCTCGATAAAATATGTCATGACAAGAAAAAGATGGAATATACTTAAATAAGTTGACAACATTTTTGCATACAATGTTGCTCACGATATTATTTATGAAAATGAGTATACTCATATATACATTGAAAAATGTCGCGACATAGAAAAGATTGACTTATGTGGAAAGAAACAATCCAATAGAAATAAACTTATTTTTCAAATCGTGAGAACTAGTAGTTCAAACATTAGAGAATGTCAAACATGTGGGATACAAGTGAATATTTGTAAGAAAGACAAATAGAATGTGGTCACATTATACAATGCGAGACAAGTTCCACAATAATTCTCGCAAATAAATGATATTGATTATAATGAGACATAATCTTTTATGTTGGATACAATACCATGAGATATCTAATTTATTTGGTTGTGTATGAAAAACTTAACATACATCTCGTGGATGTAGTAATTATACATTTATATGAATCTCTTAATAATTATATCCCTTAAGGATTAAAGAAATCACAACCTGAGATTTACTATATATTATTTGAGCATGAACTCCTGAAGAGATTTCAAAGGCAAATAGAGTTTCTTAAGAAATAAATTGAGATGATAAGTTTTGCCTCAGCTTGCAATAGCAGATGGAATTGCATCAATTTATACATATAAGATCTTATATGAACTAGTTTCATCATTGAACATTCCTACCATGGTTCATTCAGGTGTGAAAAAGTTATAACATCTAATATCAGAAAGATAATGAAGAACTTTAGGTCCCGAAGAACCATAATTTTGATAAATAAGTGCACTTATATCTTTGCTAGTTTATACGCTACCTGTCGTAGCATAATTATAATATTTCTTCAAAGAAATATATTAGAATAGAGTTAAACGTATGTTATGTTTTTATTTGAGAATTAGTTTACATGGATTTATTTTATTCTCATAAATATAATTGTGATATATTTTATTGGGAAGATGCATGTTACTTATCTAACCCATAAGAACTAGATCTTAAACAGGTTACTTAGTACAGAGAGAAGAATTCTTATATTATGACAACTTATGAAGCAGATCATAATAACTACCTTAAATCATGTTATAATCTTGATGATGTACGAAGCAAGCTAATAGTAATCCTTATATGAAGATGATAAAGCATAAAGTACCGACATCACTACTCAACGAATTTATTCAAAAGACAACTTGGGAGACTTATTGACGAAGGTGTTTTCTGCAAAAACATTTAAGGAGTTAACACATACAACTGTATGTGACAACCAAGAGTATCAAGTGATGTTTTCATGAGGGGGAGTAAATGTGCTGCACTCTTTTTCCCTTGACTATGGTTTTGTCCCACTGGGTTTTCCTAGCAAGGTTTTTAATGAGGCAGTTACTAAAGTATACGAATAATGTACTCTTTTTCCTTCACTAAATTTTTATCCCATTGGGTTTTTCCTAGTAAGGTTTTAATGAAGCATATATTCTATACACTATGGACATCTAAGAGGGAGTGTTATAAATATTTGAATTAGATATAGATGTCCATAGATTTTATATCCTTAGATATTATTTCCAATATCTTTCCCTTTATCTTCTCCTTGTATTTAGCTTTTCCATATCTTGTAAACTCTATAAATAGTGGTCATTGGGACCTTTGAGAAACACAATTGAATAGAGAATACATTCAGTCTCTACTTTCTCTTCTCTTTATTCTCTTGTTTTATAAAAAATATCACTTTTTTTTTTATAATTGTTATTTTATTATATCATGTAATTTTCTTTCATTTTTTTAGCAAGATTAAATCTAATTAAAAAATATTACATATTTAATCATTTTATTTGTAAAATAATAAACTATTAAATATAAATTAAGATAATACCATTATTTTTTTTAATCTTACATCATATTGTAGTTTTATTTTAAACAATATGATAGCAAAATCAAGGGAAAAAAATCTAAACATATAGCACTTCTTTAAAATGTTTGCAAATATGGCAAATGTTGACAAGTCAACTTTTAAATTTTTTTAAAACTTTTAAATTTGTCCTTGTTCGTATGTTAGGGAGCACATGTTTCCATCTTCTTCTTCCTTTTTTTTCCTTTTTTCCTTTTTCTGGTTGTTGCAGTCTTCGATTTCATTATACTCGCTCATATTACAGCATTCCCTGTTTCTTCTCTTCATCTTCAACTTTTCCGACTTGAACCATGAAATTTCAAGCTAACTTTTAATTAATTTTTTTAAAATTACAAGTTTCCCCTTCTTCTTCTTCCTCCTCATTCACACAAAATATTAGAATTGTCAAAACTCAAAAGATCAACAACATATATTGATTGAGATTAATTTTAAATTTATCCTTCATTATGAACATATAATCATTATAGATTATTTATAATCAATTAATTATTTATTATGATTAATTTTTATTACTTCATTCATTATTAATATATCATATTTCTAAAAAAAATTAGTATTCTTTATTAACATATCATATTTTTATTTGTTTGTTTCACTTTTTATATAATCTATTATTTATTAAAATATATTTTCTTATATTATTTAATTAATATTAAAATTACTAGTGTTGAACTTAATTAATTATAAAAATGATTAAATAATAATATTATAATTAATATGATGTTCATTAAATACATTAATTGGTTAATTTCAATTATAAATTACTTAATTTTTAAAAATTTATAATTAAGATTATTATTGATTCTTAATTAATTATTTTTTATCAATGTATTGAATGATGTCTATTGTTTAATTAATTAATCTATTACAATTATATAAGATTGTCAGGCTTAATTTTATAAATCCTTAAACCAAACGGCCCCTAACAGTTATGTCATGTAAATGACTAAAATTGAGCATTATTGAAATCTCAGGGACAAAAGTGTTAGATTTTAAAACATAGAAACCAAATAGAAATTAAATCCAAATCTAATAAACCAAAAGGTATTTTTTCGAAAAATATAACTATCCACTAATTTTACTTAGAAGGATTAGTAATATATTAGAAAAAATTAGAACTTTTGATATTTCCACGTAGCAAGGTTTTAGAATTTTACTTATCTATGTAATAAATTTATTTTACTATATCATATTGTAGTTTTCTTTTTAAATATTACCTAGTTCACAAATTTAGTAAAATAAAACAACAATATGATGTAAAAAAAAAGTAGTGGTATTATCTTTATCCATAGATAATAGTTTATTATTTTACAAATAAAATGATTAAATATATAATATTTTTTTAATTAAATTCAATAAGATAATAATTATAAAAAAATGGTATTATGTTTCCTTAAAAAGTTAAAAAAAATGAATTTGTTAAAAAAAATCACAATAATTATCATTTCATTCATTATGTGGGTCCCATTCCAGCTTTCAATAAAGTTTTCACTAAAAGACAAAAAAAACTACCCTATTTTCCTAAATAATTTTAAAATTATCCGTTTTCACCAATTTTTTCTTAAAACTACCCTTATTTTCTAATTGACCCGATTTCCTATGGTAGGAAATCGGAGTGGGAGTGGGAGAAATTTTTTTTCGAAAGCTAAATGGGGACAAAAATGGGAAATAATATAACATTAAATTCCTCGTCTCCGTCCCCGCCCCGTTAGACTTTTTTTTCTTATATTTATTATAATAATTTAATGGTATGTTATTTATTTTTATTATATAAATATTATAATTAATTTATAAGATTTATTGTTTAATGGTGAAAATAATGAATATATTTGAATTAGTGTAAAAAAAAGATATGTTTGAAGGGAAATTTTTACGGATAGAAAAAATGTCAAACTATTTACATAAAATAGCAAAAGAAAACACTGATAGACATTGATAGACTTCTATCAGTATCTATCAGTGATAGACTACTATCATTTCTATCACTGATAGACTCTGATAGACTTCTATTAGTGTCTATCACAACTATCTAAAAATTTGCTATTTTGTGTAAATAATTTTCCTAATTTTTCTATTTTTAAAAACTCCCCATGTTTGAATCCTAATGAATTTAGATTATATATATGAATAATTCGATAGATAATTATTTCCTTGAACTTGAATTTTTTGAATAATTTCTCTTTAAATTCTAATAATCCATGTGAAATTAATCATATAAAAGGTAACCATTTAATTAAAGTTTTTCATAATAGTGATTTATGGTAATTGGTTTTTTTTTTTAAAAAAAAAAACCAAACGAGAAAAAATTTTCCGCGGGGATTCCCGCCTCCATCCCATGGGGAATTTAGCGGGAATGGGGAAGCCATCTCCGGCCCCACCCCCTCCCCGTGGACATCTCTACATAAGCAGCGACAATACCCAACGACAACAATCACGACTAGCGACGGTGGCGTTTAGAGACCATTGACAGATGTTGACGAAAGGCGGCGAGCTTGCAGCTACTGGTTCCAACGGGTTGTATCAATCGATGAAATCTAAGAGAGAGAGTGAGAGAGATGTCATATGACTTACCCACAATGGTCAGCGGTCGTCGACGGGCAGTAACTAACGGTGCAACTGGCTTGTAGGTTGGAGCTGATGCGTCTCAAGCGAAAAATGAAAAGATGGGGTTTGCACGAAGGAGAAGATGGGGGGGGGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGGGGGAGGGAGGGAGGGGGGGGCGGGGGCGTGCCGCGCTAATAGGCTAGATAACTTAAGCTTTTTTTTCAAAGTCACATAAACAACATATATATATATATCCTCACTCTTAATCTAAATTTGACTTTGATTTTTTTCTTCTCCTTCTTAGATTCAAATCTTTCAATAACTTTCTCAAATTAAACAAACCAATCATCTTCTCCAAATTAATTAAATTTGGGCTCCATACTCCAAAATTTGAGAAAAATAAAATCCAACGATTTTTTCTCAACAATTCTATCTAACCCAACTTACTTCAATATACTTACTTAAGGTGAAACCTTAAATTTTAAACTTTATAGAAATTAATCTCATTTGAAAATGCACGACGCTACATTGAAGATCTACATAGAAAAAGAGAATGCATTCATGCTAAAGAAATAAAAATAGAAAATCTAAATTATGAACTCGAATAAATTAATTACAGTGAAATCAAAGATATATATTCATTGCACTTTACTACTATTCTAAAAGATTCCATATTTTATTATATTTGCGGATGAAACTGTAATTTGTGCTTTACGATCTAAATTCGCTTGAGAATTAAGGACTCTTGGAACTTTGAGGTGAATAACTAGATCCTTCGCAAGCTCACTTCAACTTCAAGTTCCATTTAAAATTCTTTTGCTCCTAATTCATACGACCCGACCCGACCCGGTTTAATAGGAGGTATAAATTCAATTTCGCGGGCTCGCTATCTTAGAATGGGCTTTTGAGTTTTCGCGCTCTATTCGGGACAAATGGAGGAAGTGGATGAAACGGAAGCGGTGCCTCAGGTTGATCACTTTCATTCTCCTCTTCTCTCTGCATTATATCTTTTTCACAATATTCTTTTCAATCCAATGCATGGATGTTCTTCTGTATTGTGATTAGATGAAACGAGAAAAGTTAAGAATTCGATTTTAATCTTCTCTGCATTTCTCCGTCTTAATTCCTCTCTGGTTGGTGAGAAATGGATGAAAAGAAAAGCAAAGGATACTGTGATTGGTTTGTAGTGTAACTGGATGAGAACAGAAAAAATAAGCGTGAATTTAAATCATTTGAAGGATCTTGGACTGGACTACTGATTCTGCCTTGTTGAATTTACTTTGGATTTGATCTCTCCAATGTATGTTAATAATTCGGTTTGGATGCTGAGAAAATTGAAGAGCAAAGAGAAGCATGGATCAGTTGGTCTTTTTCGAAATCAGATTTATTAATTTCGTTGTTAAGAATTTGGAAACAAAGTCAATGCTGAATGGAAAAAGGACGGAAGAGAAGCACAGCGAATCACTTGGCATTTATCTTCTAAATTAGGAAAAGCTATGGAATAGAGATGATAAGGAGACAGCTTTCTTCATAATCTCTGTTTACAGTGAATTAATGTCATTTGATTTAATTAATGGATAACTTAACTAATCAAAATTATTCTTTAATTCAAATGTTTTAAATTACAAACTAGCTTCATATTTGCTGACAGTTTTAAATCAAGAAATGTTCTTCACTGGTTTAGTAGTTCACCACTTTCTCACTCTGTTTCCCTTTTTATTCCCCTGGCTTGTACGACAGATATACATGGCTTGTGTCAAACATGGACAGAGGTGAGGATATCTCTACCATACTATACATTTCTTCTGGGTTCCTACCATTTGATTGAACATCTGTCAGTATCAAGAGAAAACTTTATGCGAGAAATTTACACTTATTTGAAGTATAGTAGCATGCCAGTAGGTGATTGGACTTTTTTTTTTTTTCTTTTTGAGCGAAAGGTGATTGACTTTTATCTGTATGTTAGATGCATACTGATACTATCTGTTGCTGAATAAATATCTAAAATGGTTTTCTATCATATTTACAGGAAAGTAATGGTCCAATGGACATCTTCTTAGGCATTGACAAAAGGAAAAAAAAGAAAAAGAAAAGCTAAAATATATTTTTTTCATAATATTTATGTCACTAAGTTCTAAGACACAAAAGGTTTAGTTGATGTATAAGGTTATCTTGGCAAAAGGAGGATGTAAATATTCATTAAATATTGCTGAATTGTAAGACATGCATGGCTTAGTAAGTTTTCTTCTCAGAGTGGGAGTTTCATACTATGATTCTAGCATCCGCCAGCTTCATGTGCTGGAAGTTTGGGAAGATGGCAGCATGGAATATCCTCTCATTGATCTAGGTATGAGTTCAAGCTGCTTTGTAAGGATGTAAGCTTTCTGATATGGTTTAATTCAATTAGGTAAGTTGCCTGATTATAGCTGGAGAACTTTAATGATATTGTCATTCCCACGGTTCAGATATCTTTTCTCTAAATTTCTTTGACCGCAGTTATCAAATTCTAATAGCTTTGTGCATCATGTTTGCCCCTTCTTTTCCTTTCTTCTTGATTCAGTGAAGTATCAAGCTAAGCCCCTAATGATATATACTAGCACTAAAAGTGAGGAGTCTTTCTTGGCTGCTTTGCAACGGAGTGGTATGCTAATTTTTGCTGATTTTAATTATGGAATATAATACTTTGGTCTTTGTTTAACTTTTAAGCAATGCAGACGTGATGTCTGAGGCTCCTACAGTGAAGCTTGTGAAGAGTTCGATTTTCAGCTACGAACAGGCCTGGCACAGGTATCAAGCACAAAACTATTGTTTGATTATCAGTAACTATGGAAAATATTTGAATGGTGCAATCTTCATTCTTCAGGATGAGAAAAAACTTCTATTTATAAACAGGCTAGTTTGATCCCTGCCCCTTAACCCTCTTACTGAAGTAGTTCCTTTATTGGTTTACCCTCAATTTCTTGCTGCACAGACTGGTATACCTACGAGTAACAGGAATGGATGATGGATTAAACGTCAAGGAGAGAATTTGTTATGTAAGTTGATAACTGATATATATTTTTCAGACTTCTTTTGCTTCTCTTATATTTATCGCTACTGTTGATATAGAAGTTCAGTTATATATTGTAAAGAAGAGCTAGAGCCTACAGAGCCGGTGATGCTATCCTAGTTTGCAAACTGGTTCAATATGTGCTTCTGTGAACATATTGACTTGGTTAATTGGTTATTGAATGAACAAGAAAACATAAAATAATATGATGCTATTAGATTATTTTATTATGGATGACCACAGAATTTATTAAAATAGATTATAGATACACCATCAAAGTTTGCTCATTCTTTAGAGCTACCTTTTCCATATACTTGTCTTTTTTATGTGTATGGACTGTATCGATGTTTATCTGTTTAATATTTATTTTCTTTTGTTGTTTGAATCATTAGCTAACATCATTTGCAATGAGAAATTTTGTATTCTGTTAATATTTACTTCCTTTTAAAATTTTGCTTTGTAGTTCCACTGCAGTATCAGTTTAACTTTTTAATCTGGAATTGAACAATTATTTTGGTGGGGGTGGGGGTGGGGGTGTTTCCTCTGACCGAAAATTCTAGTTGAGTTCTATGATGGACGTGGGAAGTGACGTTCAAATTCGTGCTAGTGGAGGTCTTCTCGCCATACTGGAAAATGAAAGGATTGTGGACACGCTTGAACAAAAGGAACTTGGAACTTCATCAATAACGATTGATTCTGTCATTGAAATTTCACTGTATGCTTTTATTTGTTATCTTATTAGCCAAGTTACTTGCACTTAAAATTTGAACATATGAGAGAAGTTTATGTTAATCCCTCCTTTACTTCTGATAAAACAGAAACAACTTTCTAAAACTCGATGCAACAGCTTTGGAAGCATTGCAAATATTTCAAACTGACAAACATCCCAGCCATATGGGCATCGGAAGAGCAAAAGAAGGGTGATTTGAAAACTTACTCATCAGTGTTGCTCTGAAGGAAACTAAACCAATATTTCTTGTTGCAGGTTCTCTGTATTTGGCATGATGAATAAGGTTTGTATGTATTGGTTTATTTTATAATTTGAAGCACATATACATGAGTTATTGATACAATCTCCTCATTCCAGTGTGTGACACCAATGGGTAGACGCCTCTTGAGGTATACATTTTCTGCTAGGAACTTACTGACAGCCTTTCTCCATATATCTCTAATTTTCCAAAAACTTGGATATTGGCTGTTTTTATTTAGAAACTGGTTCCTGAGGCCATTACTGGATCTTGAAAATTTGAATAAGCGACTTAATGCTGTATCCTTCCATTGTTTGACAATATAGAAGTGAGCTTACATTTAAATGTATAAACAATATGTGTTATGTCAGTAATATTCTGAAAGAAAAAAAAGAGAGAGAAGAATGTGCCTTTGTTCTTTAACAATTAACACAATAAAGATATCATTCTTTATTTCTTCCGATGAATTGATGCATTCATTACGCGAAACTCTAAGGATTGTCAAGGACATTCCCCATATACTCAAGGTAGAAGGGTGTCTTCTATTTTTCATAATTTGTATAATATTTGCTCATCAAAGACATCACCCACGAACATGGACAGTTAGTTTCCACTTGTAATTGGCTTAATATGTTTATTTTTCAAATTTTCTTACATGGAAGAAATTCAATTCCCCAAGCTCAACATATTCTTCTGGTGATTGGACCGCATTCTTGAAGGTATGTTGACCTCCTTTTCCAAATGCTATGACTTTTTGACATTGTTGCGCATCTAATTAGTAACCATTATTAGATGATATGATGTTAAATTTGCCTTCAATCATCAGCTTAAGCTTTTGGATCAATCAGTGATTTAAGATGGTATCAGAGTAGGTGGTCTACGCAGGTCTTGTGTTCAAACCCTTGCAATGGTATTTCCTCCCCAATTAATATTGATTTTCACTTGTTGGGTCTTCTTCATATTTCAAGCCCACAAGTGAGGGGAGTATTAGATGATATGATATTAAATTTGTCTTCACCCATCAGCTTAAGCTTTTCGGTCAATCGGTGATTTAAGAACCATCCACGTTAAGAAGTACCCCAAATGTTGGCCAAAGAGCCATGCCCAAGCTATGAGAGACTTGTTGCATCATTTTGTTCGGATGATTTCTCAACTTTTGCTCACAATTGGTTCCTTGCGACTTGTGTGTCACACTTAAAGACGGTTGATAATCGAATAAGTTGCCGTCTTTTAATGTTAATTCATCAAATGATCTTTTATATCATCATGAATATGTTTTTTAGTGCACCATCATTATAGTCCACTCAAATAGTGATCATGTGAGGTTGGGAAAATCATTTTCCCTTGGCAACATTGTATTAAAGTTCCTTCCATCTCATCAACTACATTTCCAGTTATCATGTGATTTTATACTAATGAGAAGAAAATTCATGGGGAGTTGGCAGCCAACTCTCTCTCTCTCTCTCTCTCTCCATTTTTATTATTATTTTACTTTTTTCCATCTGTACCTCTACATATTGTGAGACATATTTTCGTTAACAATAAATTCTTTAACTTTTATTTTGATCTTTCTTTTCTTTTCTTCTCTACTGCAGAGTATTTGCTCTCTTCTGCACGTGAATAAGATATTTGAAGTTGGCATGTCAGAGAATCTTAGGGAAAACATGAAGTACTTGAATTTGGACATTGTTGAGAAGGTACTCAATAATAGCTTTTTTGACTCACTTTCTGTTTGATCAAAATACCATTTTAATGAGTCTTTGTCTTTGTTTATTGCAGGCCAATACGTGCATTACAACAGAGTTGGCTTATGTTTATGAACTGGTCCTTGTTTCTTACTTCCCTGGTATTCTATTTATATTTCTGTTTAATCTGCTGATGTTGCAATAATGGAGAAAGAAATCATGGGTTTCTTGTTATAATTTGGGTGATGGAACTAGTAAGGGTCACTTTCTCTTCATTGTGCCCTTTAAATGTTTATTACTATGATTGGATTTTCTATAGGCCCATTGGATTGTCCTTTAAGCACTTCTGCAGTGGACCTCATAAAATATTGTGCCTTTCATCTTGAAGGTTATGGGCGTCCTGGATGTTAGTAGAAGCAAAGAGAAGTCATATGAGACAATTGTGAAGGAAGGTTTTTGTGAAGAGGTAAGAGATAGTTAACCAGTTGAAGTCCTCTTCTTACCAAAGTATTACTATATTCTTAGAGCGTATTTTTCCTGTCTGACAAGATACTGATTATCCTCTTCCTGTCATCTTTCCAAGGTTAGTTTATTAAAATGTTGGTATATCATGGATAAAGTTAATTCGTTATCTTTAAGAATAATAATGAACAATTTAAATCTGACTTGGTATTGAACTTTTATTTCTGGTTTACATTGGAAACTACATATTTTTCTTTTGGATGGCTAATAGTTGGATGAGCTGAGGGAAATCTACGAGGAACTGCCTGAATTTTTGGAGGAGGTGCATTATGCATATTTTAAACTTCAAAAAGTAGACGTTCAGTAAGATGTATGAATGAGTTTATCTATTAATTTCGCCACTCCCAACAGGTTTCATCAATGGAACTTGCTCAATTCCCTCAGTTGTGTAAAGACAAGATTGCCCCTTGTATAGTCTATATACATCAAATAGGTAGGCATTCTTTCCAGAGCATTCCCCTGAAAGGGTTTCTTTTAACTATCCATACTTTGTAGGCATTTCTGGTGGGTACTTGGGACTGAGTATATGAAATGGCCTGTTAATGTGATTTTATGCAATGATTTTCAATGTCTTGTCACCCCATATAATGCACCTTGTAAGAGACTAGGACATGATCATTACCATTCTTTAATGCGGAGAAAAAGGAAAACCCAAAAAGAAAAAGAAAAGAAAAGAAAAGCTACTTGTTTTTATGCATGGTCAGTGTTATGCATATCTTGTGTGTTATTGTGTTTTCATTTTCCAGCAATGGGAGCCAGGATTTTTATCTCTCTCTCCCCCTGCCCAACCCCTTCCACCCTCCAGGATATTTATTATGCATATTTGAAGAGAAACTTGACGAAAGCACATTAGAGATCCTACGAGACTTTGAATTTGCTGTAAGTTGTTTAATCTTTGTTATAATTGATACTTCTTACATTATTCGAGTTCCTAAAAGTTTTACAAATGTAGTTCTCTGATATGGATGGAGATATAAAGAGATTCTTTTACCATAGTCCAAAAACACGAGAATTGGATAATCTGCTTGGAGACATTTATCACAAAATCTTAGGTACTACAAGTTAGTACCTATTGCTCTGTATTTTCCTTATTTTCTTGCAGTAGATTATTAAAGAATTTTCTGTTGGCGTATATTTCAGCAGAACTGAATAAGACTTTGATGATTAGCTCCAAATTCCAATTTATTTAAAAAAATTAGCACTTAACAGATGGAAATTAAAAAAGAGAAAAAGCCTTCAATCTTCAATTGTCACGTCCATTAACTTACACTTCAAATATTTGACCTTGCGTATATTGATTTCTAGAAGATATGGAGAGGGCAATTATTAGAGACTTGGTGTCACACATACTTGTTTTCTCTCTGCATCTGCTTAAGGCTGTAGATTTTGCGGCTGAACTTGATTGGTGAGAATAAGTTTTTCTTTTTCATTTATGCTCTGTTGTCTATACATGTTACTCCTTTCTCGGAGGACTCTGAATGTAGCTGGCACTCTCATTGTGCATTTGAACATATATCAATCATCTTGATGGTTTTGTACAGCTTTTTATCACTAGCACTGATTGCACGTCAGAACAACTATGTAAGGCCAGATTTAACTGCAGATAGCATGCTTGATATTAAGAATGGAAGGTTGGAACCTTTGAATGTGCAAGTCATGTTGAATATTCACTCAAAACCCTGATAAGCGAGTACTTAGATTAGTAGTACATTTGTTGTAGGCATGTTTTGCAGGAAATGGCAGTAGATACATTTATTCCCAATGACACGAAGATTTTTTATGATGGTAAATTGACGGTGCATTGCATATCTGTATTCAACTTCAATCTAGAAATGCGCATCTGTTTCTAATAATTTGTAGTTCATGTCTTTTCAGAAAGAGTTAATATCATTACTGGCCCAAATTATTCTGGTAAAAGTATCTACATAAAACAGGTAAATAAATGTTCAGCTTTTCTTTCTAGAATGGGGTGCTATCTTCCTCTCTCCCCACGTTATTGCATATTTGGTAAATTCATTACATATCTTTGGTATGTGTTCATTCATTGGATCAAATTGCCATCATTCATCTGTTAAAACTATGCCTTTTAAGTCACATTATGGTAGTGATGCCGCTGAGCAAGCTAACTTCCAAAGATTAGCAAATCCTAATGATGTTGTAGATGAACTCCTTAGAGACGATACTTTAGAAGAGGTTATACTCAACTGTGGAGAGCTCAGCAATGGATTAAAGACTGGCAGACCAGGGATTGAGATAGCTGAGTTATGTAGAGGGGTGATTCAGCTTTGCATTGCCTAGTATGTAAATTATAAATTAGCTCAACATTCTATGGTCCTTGTAGAAGGAATGGTTGGAAACGTGGCTTATCATCTGTTCTTGCGAAATTTATGTTCTATGTTTCATGAGTCACAAACTCATCTTGCTTGACGAACTTGAGCATAGTTCAACGGGTTAAGATATATACTCTCGATCAAGAGGTTAAATGTTTGAATCTCCCACAAACATGTTAAACTTTAAAAAAAAAAAAAAAGAAGAAAAAACTTCATCTTGCTTGTGGGTCTATTATTGAAGGTATACCACCGACAGTGAACTCATTGTGACACCTTATTCGACTGCATGAAGCAACCTAGTTGAGTAGGTCAGAGCACTCATTAAATGGCATGGGTATGCGATGATCCTTGGAACTGTTCCACATTGCAATCCAAGAGTTTCCATCTTTTCACTTTGAGAATAAAGAGAAACTTCTGGTACGCATCATGTAGCCACAAAGGGCAGTAGAACGGTAAATTGAGGCTACGGGCAGACCAGAAATTTTCTTGGAAGGAATACAGTTTTACCTGCTAACTTTTTATGCACAAAATATTTTAATTCTGAAAATTTAGACGAGCAAATAAGAGAAAACTGCAAAGTCTTAAATACTTCACGTATAGTTTCTGACTTACAAAAAGCTAAGAGGGGGCTCTCTTTTTTTCTTTGTTCCGCTTCTGCGTGAGGTGAGCAAATAAATGGCTAAGAAGTAATAGTTAGGGTTTGGGCAAAGCCTTTGCCCCCTTTTATGTACATTAATGAGTTGAAAGGAATAACAAGTCTGCATAGTTATAATTCCAGTTCTCCCTCTCCTTCCAGGTTGCTCTTATTGTATTCTTGTCTCATATAGGAAGCTTTGTTCCGGCAGATGCTGCAACCGTAGGTTTGACAGATAGGTCCGCCTTCCATGTGATAATATCTTCCCTCGTTCTAGTGTTGAATTTTAATCATTGCTTATCAATGATTGCTAAATGGGCTTTCGCAGAATATTTTGTGCTATGGGAAGCAAGCATATGACTGCAGAACAATCAACTTTTATGCTTGACTTACTTCAAGTGGGGATGATGCTGAGGTACATTCGATAAATAGTTCCTAACTGTATACATAACCAGAAAAGCAGCAGAGGTTGCAATATATTTGTAGAATAAATCTTGATTGTTGCGTAGCTAATGTCTACTGTGGAAACTTAGATTCGAGGGCCCGATCAATGACATGACCTTAACAGTTGAATCTGCCTCTTCTCTATCATTGATTTTTGTTTTATTAACAAAATACACTAATCCTTCTATTTTAAATACTATAATTGTTAAAAATTCAGGCAGGCAACGTGTCAATCTTTGTGCTTGATTGATGAATTTGGTAAAGGTACCCTTACAGAAGGTTAGGCTCACCAATTTACACTCATTTGAATGTACTTTTTATATCCTGCGTATGATTTATGTTTGGCAGTTGAAATGCGTAGGATGTTAGTAAACTCACTGTTTCGTCTGTACATTTAAGATGGCATTGGTCTTCTTGGTGGAACGATCACCTGCTTTGCAAGTTCTAATGACTCTCCAAAGGTTTGACTTACTCTCCTTAATAGCATATTGTTTTTATTGCTTGGTTAAAGTTTCAATTCTTTTGAAGCATCAACAGCTCTTCTTGTTCTATATTGACGAAACAATGGAACTATTTTCAAATTCTCTGCTTTACGAACTACTTTATTCAATTTTTATTTCTTAAGCCTGAGTTCATCATCTCAATTCAGTTTTCATTGTGACTCTTATTTTTATTTCACTAGTCAAATTTGTTTAATATAAGGTCCTATTCTGATCTCGTGAGTTTCATATTTATTCTATTTTAGTACCTTTTAGTTAACAGTTATATGAATTTAGTGTAGTTGAATTTAACTTTGAGAAAAAAGATTCAGTTTGTACCTCAAAGTTTTGGAGTTGTATCACTTAAATCCTAGCTAATTATTGTATAAATTAAAGGGTTGTTTTCAAATATAGAAAAATGAGTCAAACTATTTACAAATATAGAAAATTTTTACTATCTATCAGAGATAGACTGCAATAGACTGCAATAGAATTCTATTGCAGTCTATCGCTGATAGACAGTGAAATTTTTCTATATTTGTAAATAGTTTGATAGTTTTTCTGTTTATAGTAATTTCCCTAAATTAAAACCTCAACTTTCATAATTGAATCAATTTAGACCTTTTATTAGAATTCCATTTTAAAAACACTAATGCATAACATTTACATGTGTTTAAGATTTCTTTAAAAGTAGGGCTAACGTAATATATATTAGAGAGAAATGCTACAATCAAATAGATAGTGTTGAGAAAATAAAAAAATATTGCGGAAGCAATAATCAAAATATTAATTTTTGGTAAGCAAAAAGAAGAAATAGAAAATAAGAGAGTGAAATCTAATAGACGAATAAACTTTTTATTGACCTAGAAAAAATAGGTGAATGCAAACTTTTCATGGAAGTTCACCCTTATGTAGGTACAAGAATGAACCAAATTTAATACTACTAACTTATAAATTAGAAACAATATTAAAAGTATAAACTAACCAAAACTAAAAGAAAACTTAAAATGACAAAAAAATGGAAGGTAAAATCTAACTTTTAAACAGAAACGTCAAACATTAAATTGAAAATTTTAAGGGCAATTACATATATATGACTATTTAACACAAAATAATAGTAAATCTAGCACAATTGAAAACTATTTGCTAATATAGCATGATTGTAACTTCAATTAGAACCTATCACTAATTGAGGTTTGTCACAAGACCTATCAATAACAAAGGTCTATCACTGATTGACCCATCTGATAGACCTATCAATGATTAAGGTCTATCGGTGATAGGTGTCTATTATTGATGGTTTTCATGCTCATTTGCAATTATGTTTGTTACTAGTATATCATATCAATAGAATATAAATATGGTACATAACTAAGAATTATATTAGTTTACCTCATTTACTTTTAGGCGACTTCTTACATGTTCATTATCTATCTTCCATTATTTGTGTTCATTTGTTATCAAATGTATTACTAATATACCACATCAATAGAATTAAAAATAGTAAATTAGTGATATTTGAAATTGCTTTTTTCCCATCATTGTTTGAAAATTACCATATTTGCAAATTATTTATTTGCGCGTCATAGTGCAAATGTGGCAACCAATTTTGTACCCATTACCATTATCCAAAATGTGAAAAAGAAAAACTCATAACTCAATTGGTAGAAGTGGTTTCTCATACAGTCATACTTATTCAAGAAAAAGTTGTGGTCATTTATTTATTTTTCTTTGTATTCTTATTTTTTGCTACTTTGATAGGATTTTGGGAGAAAAATAATTTTGTTTTAAGTGATTTTAAATCTATTTTAAGTGAAGAAAAGTGAAAATGGTTCTAAATCACTAACAAAAAGTCTAAATTGATTCGCTTATAGAAGTTTTGCATTTAAAATAAAACAATTATTAGTTTGGAGTTTTAATTGATACAATTTTATTTTTATCCTTTAGTTTTTTCAGGCATTTAAAAGAAATCTAAGGTAATATCATTCCCAGAATTGCCCATGTAATGGCCAGATAATATTTATGCTAAATGTGATATGAAAACTCAACTGTAGGGATCAACATGGATTTGTATGCAAAGTTCGGAGTTAAAAGGAAAATATTTAGTGTTGGAACCAAAATGAAGCAACTGTAAGAGCAAAAGGCCAACAAAAATAAAAAAATAATTTTATGAAGCTGCTTCTGGATAATGAAAGGCCTTCACCATTTTGTTTCAAAATTACGTAGGGTTAGATTATAGGGAGTCCTTAAAATGAATGCTCATGTTTCCAGGTGCTGGTGTGCACTCATCTAACTGAGCTAATTAATGAGAGTTTACTGCCAATGGTAATTCATTTGAGTTCTTCCATTCTAAAACATTGTGACATGAAATTTCTAATTCCCTTTTCACTTATTTTAGTGCGAAAGGATCAAGTTCTACAACATGAGTGTGATACGAGCTGACAATGATTGCACTGAAAATGAAGATATTGTATTTCTTTATCGGTAAGAAATGTCATCTTTTGTTAGGTTGCTCATAATCCCAGCTTCTCCTTTGGTAGCATTATTTTTTCGTTGCTTTTGATTATCTATTTTTCTATTTGTTTCTTTAAATTTGAAATTGAAAAAGAAGATAGACGTTTCACCATTTATTCTATTGTATTTATGTTTACCAGAAAAGAAGCATGAAACTTTGCTTTAACTCAAACTTGCACAGACTAGAAATGAGACGATTTCAAGCACATATTCTTAATAACCTGAAAATAAGATCAATTTTTCTTTATTTGTTGGTTTTCATAGAGTTTTTGGGCGGGCAGAATCTCCCTAGACCGCGTGCTGATAGTTAAATATCTAATAACATATTCAATATGTTTTGCTAATTAACTGCTCTAAAGTACAGTTGACTTCTATGCATTATCTCTGGATGTTGTCTTATGGGCCATATTCTCAATTTCAACCCTTCTTTAGCCTTAAGACATAGGACTTAATACACTCGAATTTCTCATGTTTGACGGTATTCTGGTCTTCGCACATTGCAGTTTGGTCCCAGGACATGCACTTCCTAGCTATGGTAAGTAGATGATATAAAATCTAAGTACATAGTTACATCTTTATGTAAATATACTCGGCACTTGCGCTGACCAGCCGTAGGGGCCTTCCGGCCCCCAAAGGCACGTGTCGTTGGCTAAGCCCTCGTGACGGATGAGTCGCGGGGGCCGCCTTGTAACGTAATTCCCACTGAGCGGCCATATACAAACATAAATACACATCATTCGTAATCTGTCTTCACCAACGTAGGTAACCTGCATTCATACATACACTTCCGTAAATAATTTCAGAACTGTAAATTTACATTCTGCAGGTCTGCATTGTGCATTGCTTGCTGGTATGTCTCAAACTAAGGACTCAAGGACAGATGAGTTTTAGGGATAAAGCTTAGTTCGCTTTAGAATTTTCCAGAGTCAAAAAAGCTCTAGGATCGTTGATTGTACCATAATTACCTTGCTCCCATTAGTGCTGCAACCTAATCCTATTTCTTGTATAGGCGTTCCTGATGAGGTTATTAAGAGAGCAGCCTTTGTTTTGGATGCTATGGAGAATCATAAGCATGTTGAGCGGCTGCACAATGAGAATTTATCCGCTCAAGATAAGCTATACCAGGTGTTTTATGACTTGAAATTTTCCTTGGGTTGTGGTTATTTGTGTAGTTTGCACTATTAATGAAGCCTTGCAAGCTACTTTGAACTATACACAGGATGCCGTCGACAAGTTGCTAAGACTTGATGTTAACAAGTGTGATCTTAGCCGTTTCTTTCAGGACATATTTAGTTCTTAATCGAACGTTTAAGGTAATCCTGTTTTGCTCTCTACCCACATACACACACATATCTTAGTTAAATTACAACTTTAAATCCTAAACTACTTATATTTCATTATTATATTTCTTTAGTTTTGAAGTTTGGAAAGTTTCAATTAGGTTGTAGAACTATTATTACTGTTATTTAAATATTGACATAGCAACATGTTATGACTTAGGTTGATGCGACTAGACTGATTGGATAAATAGGACAAACGTGCATGGAAGATTTTAAATCAATATTTGTAATTTGTTAACACTTGTTTTAACGTTGGTCTTCTTGCATGCATCACATATGCCAAATGGTCGTTTTTCAATCAATGTTTCATGTTCATGTTTAAGTGATTGAGTTATATATTAGAATTTATTAGAATCAAAATTAATGAAGGTTTACTTAAAATTGATTTTTTTTAATTGAAGGACCAAATTGATACAACTATTTTTTTTTATTGAATTAATTGATACAACTATTAAAATGTGACGGACTAAATTTGTAATTTAACTATTATTTTTATTTCTGAACAGTTTGCAATTGCAGCCTTGGTTGGCAGAAGATATCTGCCCCCCTAGTGGAGGTAATACAGACAGACAAGGGGCATTTGTTTGACTCAAGATCATTTTTCATGCATCTTTATCATTCAAAAAGAAGAAAAAGGAAAAAAAAAGTTCAATATATAAAATTTTAATGGATAAACTAAATGGAGTTAAAACTATAATAGCAAAACAAGGCAAAATGACATGACGTTTGGAATCTATTGATAATTATCCAATTGAATTAGAATTTTAATCGAGGCTTGGCAGCTTCTTTTTTCAATACAACAATGGCTAGGAATCGAACATTTGACTTTAAATGAG

mRNA sequence

ATGAATGACGTGATGTCTGAGGCTCCTACAGTGAAGCTTGTGAAGAGTTCGATTTTCAGCTACGAACAGGCCTGGCACAGGTTCTCTGTATTTGGCATGATGAATAAGAAATTCAATTCCCCAAGCTCAACATATTCTTCTGGTGATTGGACCGCATTCTTGAAGGTTATGGGCGTCCTGGATGTTAGTAGAAGCAAAGAGAAGTCATATGAGACAATTGTGAAGGAAGGAAGCTTTGTTCCGGCAGATGCTGCAACCGTAGGCGTTCCTGATGAGGTTATTAAGAGAGCAGCCTTTGTTTTGGATGCTATGGAGAATCATAAGCATGTTGAGCGGCTGCACAATGAGAATTTATCCGCTCAAGATAAGCTATACCAGGATGCCGTCGACAAGTTGCTAAGACTTGATGTTAACAAGTGTGATCTTAGCCGTTTCTTTCAGGACATATTTAGTTCTTAATCGAACGTTTAAGTTTGCAATTGCAGCCTTGGTTGGCAGAAGATATCTGCCCCCCTAGTGGAGGTAATACAGACAGACAAGGGGCATTTGTTTGACTCAAGATCATTTTTCATGCATCTTTATCATTCAAAAAGAAGAAAAAGGAAAAAAAAAGTTCAATATATAAAATTTTAATGGATAAACTAAATGGAGTTAAAACTATAATAGCAAAACAAGGCAAAATGACATGACGTTTGGAATCTATTGATAATTATCCAATTGAATTAGAATTTTAATCGAGGCTTGGCAGCTTCTTTTTTCAATACAACAATGGCTAGGAATCGAACATTTGACTTTAAATGAG

Coding sequence (CDS)

ATGAATGACGTGATGTCTGAGGCTCCTACAGTGAAGCTTGTGAAGAGTTCGATTTTCAGCTACGAACAGGCCTGGCACAGGTTCTCTGTATTTGGCATGATGAATAAGAAATTCAATTCCCCAAGCTCAACATATTCTTCTGGTGATTGGACCGCATTCTTGAAGGTTATGGGCGTCCTGGATGTTAGTAGAAGCAAAGAGAAGTCATATGAGACAATTGTGAAGGAAGGAAGCTTTGTTCCGGCAGATGCTGCAACCGTAGGCGTTCCTGATGAGGTTATTAAGAGAGCAGCCTTTGTTTTGGATGCTATGGAGAATCATAAGCATGTTGAGCGGCTGCACAATGAGAATTTATCCGCTCAAGATAAGCTATACCAGGATGCCGTCGACAAGTTGCTAAGACTTGATGTTAACAAGTGTGATCTTAGCCGTTTCTTTCAGGACATATTTAGTTCTTAA

Protein sequence

MNDVMSEAPTVKLVKSSIFSYEQAWHRFSVFGMMNKKFNSPSSTYSSGDWTAFLKVMGVLDVSRSKEKSYETIVKEGSFVPADAATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLSRFFQDIFSS
Homology
BLAST of Lsi05G005470 vs. ExPASy Swiss-Prot
Match: F4JEP5 (DNA mismatch repair protein MSH5 OS=Arabidopsis thaliana OX=3702 GN=MSH5 PE=2 SV=1)

HSP 1 Score: 77.4 bits (189), Expect = 1.5e-13
Identity = 36/69 (52.17%), Postives = 53/69 (76.81%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVP+EV+KRAA VLDA E++ +V++L  + +S+QD+ ++DAVDK   LD++K D+ 
Sbjct: 739 ALLAGVPEEVVKRAAIVLDAFESNNNVDKLSLDKISSQDQAFKDAVDKFAELDISKGDIH 798

Query: 144 RFFQDIFSS 153
            FFQDIF+S
Sbjct: 799 AFFQDIFTS 807


HSP 2 Score: 41.2 bits (95), Expect = 1.2e-02
Identity = 19/26 (73.08%), Postives = 19/26 (73.08%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           ND   E   VKLVKSS FSYEQAWHR
Sbjct: 81  NDGTDETTMVKLVKSSTFSYEQAWHR 106

BLAST of Lsi05G005470 vs. ExPASy Swiss-Prot
Match: Q6L4V0 (DNA mismatch repair protein MSH5 OS=Oryza sativa subsp. japonica OX=39947 GN=MSH5 PE=2 SV=1)

HSP 1 Score: 45.4 bits (106), Expect = 6.5e-04
Identity = 20/26 (76.92%), Postives = 21/26 (80.77%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           ND   EAP VKL+KSS FSYEQAWHR
Sbjct: 86  NDCNDEAPAVKLMKSSTFSYEQAWHR 111

BLAST of Lsi05G005470 vs. ExPASy TrEMBL
Match: A0A0A0L665 (DNA_MISMATCH_REPAIR_2 domain-containing protein OS=Cucumis sativus OX=3659 GN=Csa_3G064210 PE=4 SV=1)

HSP 1 Score: 128.6 bits (322), Expect = 2.2e-26
Identity = 64/69 (92.75%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 733 ALLAGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLG 792

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 793 RFFQDIFLS 801

BLAST of Lsi05G005470 vs. ExPASy TrEMBL
Match: A0A0A0L665 (DNA_MISMATCH_REPAIR_2 domain-containing protein OS=Cucumis sativus OX=3659 GN=Csa_3G064210 PE=4 SV=1)

HSP 1 Score: 52.0 bits (123), Expect = 2.6e-03
Identity = 24/26 (92.31%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2  NDVMSEAPTVKLVKSSIFSYEQAWHR 28
          +D MSEAPTVKLVKSSIFSYEQAWHR
Sbjct: 68 SDGMSEAPTVKLVKSSIFSYEQAWHR 93


HSP 2 Score: 125.9 bits (315), Expect = 1.4e-25
Identity = 62/69 (89.86%), Postives = 63/69 (91.30%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAM+NHKHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMDNHKHVERLHNENLSTQDKLYQDAVDKLLRLDVNKCDLG 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. ExPASy TrEMBL
Match: A0A1S3BM83 (DNA mismatch repair protein MSH5 OS=Cucumis melo OX=3656 GN=LOC103491072 PE=4 SV=1)

HSP 1 Score: 50.8 bits (120), Expect = 5.7e-03
Identity = 23/26 (88.46%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MS+APTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSDAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.6 bits (314), Expect = 1.8e-25
Identity = 67/83 (80.72%), Postives = 69/83 (83.13%), Query Frame = 0

Query: 71  ETIVKEGSFVPADA-ATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAV 130
           E IV     VP  A  + GVPDEVIKRAAFVLDAM+NHKHVERLHNENLS QDKLYQDAV
Sbjct: 715 EDIVFLYRLVPGHALPSYGVPDEVIKRAAFVLDAMDNHKHVERLHNENLSTQDKLYQDAV 774

Query: 131 DKLLRLDVNKCDLSRFFQDIFSS 153
           DKLLRLDVNKCDL RFFQDIF S
Sbjct: 775 DKLLRLDVNKCDLGRFFQDIFLS 797

BLAST of Lsi05G005470 vs. ExPASy TrEMBL
Match: A0A5A7VBY4 (DNA mismatch repair protein MSH5 OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27_scaffold37G001290 PE=4 SV=1)

HSP 1 Score: 50.8 bits (120), Expect = 5.7e-03
Identity = 23/26 (88.46%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2  NDVMSEAPTVKLVKSSIFSYEQAWHR 28
          +D MS+APTVKLVKSSIFSYEQAWHR
Sbjct: 68 SDGMSDAPTVKLVKSSIFSYEQAWHR 93


HSP 2 Score: 125.6 bits (314), Expect = 1.8e-25
Identity = 67/83 (80.72%), Postives = 69/83 (83.13%), Query Frame = 0

Query: 71  ETIVKEGSFVPADA-ATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAV 130
           E IV     VP  A  + GVPDEVIKRAAFVLDAM+NHKHVERLHNENLS QDKLYQDAV
Sbjct: 701 EDIVFLYRLVPGHALPSYGVPDEVIKRAAFVLDAMDNHKHVERLHNENLSTQDKLYQDAV 760

Query: 131 DKLLRLDVNKCDLSRFFQDIFSS 153
           DKLLRLDVNKCDL RFFQDIF S
Sbjct: 761 DKLLRLDVNKCDLGRFFQDIFLS 783

BLAST of Lsi05G005470 vs. ExPASy TrEMBL
Match: A0A5D3BD47 (DNA mismatch repair protein MSH5 OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold546G002230 PE=4 SV=1)

HSP 1 Score: 50.8 bits (120), Expect = 5.7e-03
Identity = 23/26 (88.46%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2  NDVMSEAPTVKLVKSSIFSYEQAWHR 28
          +D MS+APTVKLVKSSIFSYEQAWHR
Sbjct: 68 SDGMSDAPTVKLVKSSIFSYEQAWHR 93


HSP 2 Score: 119.8 bits (299), Expect = 1.0e-23
Identity = 61/69 (88.41%), Postives = 62/69 (89.86%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAM N+KHVERLHNENLSAQDKLYQDAVDKLL LDVNKCDLS
Sbjct: 758 ALLAGVPDEVIKRAAFVLDAMGNNKHVERLHNENLSAQDKLYQDAVDKLLGLDVNKCDLS 817

Query: 144 RFFQDIFSS 153
           RFFQ IF S
Sbjct: 818 RFFQGIFPS 826

BLAST of Lsi05G005470 vs. NCBI nr
Match: KAE8650117.1 (hypothetical protein Csa_010033 [Cucumis sativus])

HSP 1 Score: 128.6 bits (322), Expect = 4.4e-26
Identity = 64/69 (92.75%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 507 ALLAGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLG 566

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 567 RFFQDIFLS 575

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_004149586.1 (DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737823.1 DNA mismatch repair protein MSH5 [Cucumis sativus])

HSP 1 Score: 128.6 bits (322), Expect = 4.4e-26
Identity = 64/69 (92.75%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLG 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_004149586.1 (DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737823.1 DNA mismatch repair protein MSH5 [Cucumis sativus])

HSP 1 Score: 52.0 bits (123), Expect = 5.3e-03
Identity = 24/26 (92.31%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MSEAPTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSEAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.9 bits (315), Expect = 2.9e-25
Identity = 62/69 (89.86%), Postives = 63/69 (91.30%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAM+NHKHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMDNHKHVERLHNENLSTQDKLYQDAVDKLLRLDVNKCDLG 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_008449117.1 (PREDICTED: DNA mismatch repair protein MSH5 [Cucumis melo])

HSP 1 Score: 50.8 bits (120), Expect = 1.2e-02
Identity = 23/26 (88.46%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MS+APTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSDAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.9 bits (315), Expect = 2.9e-25
Identity = 63/69 (91.30%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMEN+KHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDLS
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMENNKHVERLHNENLSVQDKLYQDAVDKLLRLDVNKCDLS 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_038903565.1 (DNA mismatch repair protein MSH5 isoform X2 [Benincasa hispida])

HSP 1 Score: 52.0 bits (123), Expect = 5.3e-03
Identity = 24/26 (92.31%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MSEAPTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSEAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.9 bits (315), Expect = 2.9e-25
Identity = 63/69 (91.30%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMEN+KHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDLS
Sbjct: 610 ALLAGVPDEVIKRAAFVLDAMENNKHVERLHNENLSVQDKLYQDAVDKLLRLDVNKCDLS 669

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 670 RFFQDIFLS 678

BLAST of Lsi05G005470 vs. TAIR 10
Match: AT3G20475.1 (MUTS-homologue 5 )

HSP 1 Score: 77.4 bits (189), Expect = 1.1e-14
Identity = 36/69 (52.17%), Postives = 53/69 (76.81%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVP+EV+KRAA VLDA E++ +V++L  + +S+QD+ ++DAVDK   LD++K D+ 
Sbjct: 739 ALLAGVPEEVVKRAAIVLDAFESNNNVDKLSLDKISSQDQAFKDAVDKFAELDISKGDIH 798

Query: 144 RFFQDIFSS 153
            FFQDIF+S
Sbjct: 799 AFFQDIFTS 807


HSP 2 Score: 43.9 bits (102), Expect = 1.3e-04
Identity = 40/132 (30.30%), Postives = 52/132 (39.39%), Query Frame = 0

Query: 36  KKFNSPSSTYSSGDWTAFLK---------------------------------------- 95
           KKFNSP+S  +S DWTAFLK                                        
Sbjct: 281 KKFNSPTSLCTSNDWTAFLKSISALLHVNKIFEVGVSESLREHMRRFNLDIIEKAGLCIS 340

Query: 96  ---------VMGVLDVSRSKEKSYETIVKEGSFVPADAATVGVPDEVIKRAAFVLDAMEN 119
                    V+GV+DV+RSKE+ Y+T+VKEG     D   +    E +      + AME 
Sbjct: 341 TELDYVYELVIGVIDVTRSKERGYQTLVKEGFCAELD--ELRQIYEELPEFLQEVSAME- 400


HSP 3 Score: 41.2 bits (95), Expect = 8.7e-04
Identity = 19/26 (73.08%), Postives = 19/26 (73.08%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           ND   E   VKLVKSS FSYEQAWHR
Sbjct: 81  NDGTDETTMVKLVKSSTFSYEQAWHR 106

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
F4JEP51.5e-1352.17DNA mismatch repair protein MSH5 OS=Arabidopsis thaliana OX=3702 GN=MSH5 PE=2 SV... [more]
Q6L4V06.5e-0476.92DNA mismatch repair protein MSH5 OS=Oryza sativa subsp. japonica OX=39947 GN=MSH... [more]
Match NameE-valueIdentityDescription
A0A0A0L6652.2e-2692.75DNA_MISMATCH_REPAIR_2 domain-containing protein OS=Cucumis sativus OX=3659 GN=Cs... [more]
A0A0A0L6652.6e-0392.31DNA_MISMATCH_REPAIR_2 domain-containing protein OS=Cucumis sativus OX=3659 GN=Cs... [more]
A0A1S3BM835.7e-0388.46DNA mismatch repair protein MSH5 OS=Cucumis melo OX=3656 GN=LOC103491072 PE=4 SV... [more]
A0A5A7VBY45.7e-0388.46DNA mismatch repair protein MSH5 OS=Cucumis melo var. makuwa OX=1194695 GN=E6C27... [more]
A0A5D3BD475.7e-0388.46DNA mismatch repair protein MSH5 OS=Cucumis melo var. makuwa OX=1194695 GN=E5676... [more]

Pages

Match NameE-valueIdentityDescription
KAE8650117.14.4e-2692.75hypothetical protein Csa_010033 [Cucumis sativus][more]
XP_004149586.14.4e-2692.75DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch ... [more]
XP_004149586.15.3e-0392.31DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch ... [more]
XP_008449117.11.2e-0288.46PREDICTED: DNA mismatch repair protein MSH5 [Cucumis melo][more]
XP_038903565.15.3e-0392.31DNA mismatch repair protein MSH5 isoform X2 [Benincasa hispida][more]
Match NameE-valueIdentityDescription
AT3G20475.11.1e-1452.17MUTS-homologue 5 [more]
Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Lsi05G005470.1Lsi05G005470.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0051026 chiasma assembly
biological_process GO:0010777 meiotic mismatch repair involved in reciprocal meiotic recombination
cellular_component GO:0000794 condensed nuclear chromosome
cellular_component GO:0043073 germ cell nucleus
molecular_function GO:0005524 ATP binding
molecular_function GO:0030983 mismatched DNA binding