Lsi05G005470 (gene) Bottle gourd (USVL1VR-Ls) v1

Overview
NameLsi05G005470
Typegene
OrganismLagenaria siceraria (Bottle gourd (USVL1VR-Ls) v1)
DescriptionDNA mismatch repair protein MSH5
Locationchr05: 6793328 .. 6816932 (-)
RNA-Seq ExpressionLsi05G005470
SyntenyLsi05G005470
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideexonCDSthree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGAATGGTAAATAGTCCCGATGACAAAGCGGGCGGTGACGATGTGAACGGCATAAGTATAGAATGTCCCCCTTCCCATGGGATGGGATGGAATTTCCTAGGATTAATTAAGAAATGTGGGTGGTTTTAAGAAAAAATTGGTAAAAAAGAGTGGTTTTAAAATTAAATAGGAAAATAGGGTAGTTTTTTTTGTCTTTTAGTGAAAACACTTTTTGAAAGTTGGAATGGGACCTACATCATGAAGGAAATGGCAATTATTTTGATTTTTTTTTTTTTACAAATTAATTTACTTTATTTTTGTTTAAGGAAATATAATATTGTTATAAATATTTGAATTAGATATGGATGTCCATAGATTTTATATCCTTAGATATTATTTCCAATATCTTTCCCTTTATCTCCTCCTTGTATTTAGTTTTTCCATATCTTGTAAACTCTATAAATAGTGGTCATTGGGACCTTTGAGAAACACAATTGAATAGAGAATACATTCAGTCTCTACTTTCTCTTCTCTCTACTTTGTTCTTTATTCTCTTGTTTTATAACACGTTATCAGCACGAGACTCTACCACTTTAAAGATTGGTTTTGGATTTGATTCATTGGAATACCAAGAACGCTAAAGGCTACATATTATCGAGGTATTTAAAACTAATAAGGTGAGTACTTTGTTTTAATATCATATATGTGATTGATGTGTTTGCAAATTGATTGCTATGGTACATTTAGCATTAGTTTTATATTTGATTAAATTGTATTGGATTTGCGATTTGACTAACACATGAAATATTTGCAACCGAATTTAGTTTGAAGTTAATTAAGAAAAAATCTTTTGATATCAAATTGTGTTATTACGAATGACATTCATTGTTAAAATTTTGGGTTCATGCATATCAACCTAACATGCATATTTATAAGTATATATTGTCAACTTGAAGTTTATTTGAAGTATATGCATATATTGGTGTTGAGTAAGTAAAAGAGTTTTGGCTGGCCAACTTTCCAAAGCACTTCAAAATCTAGGGTTTTTAGAAACCTATTTTTTCGAATGTCTAAAATAGATTGAAAGATATAATATCTTGAATTTAAATCGTTGTAATTCAAATTGTCTTCAATTTCTTAAAGCTAACAAATATGTTTAGTCAATTTTGCTATTTAACTTTACTTATGTATTTGATATATGTTTTACATTGTTCAACTAATTCTAAGTATTGATATTCATGTGGTTGTTGTAACCATGTGGATGTCTATTAGTGGTGTGATGATCCACTAAACCTTGTTGAATCAAATCTTGAGGTTTAGTCAATTTGAAGATTTAGAATTCTAATTATGATAATTTAAATTGTCCTCAATCTCTTATGACTATATTATGCATGTTTATGTTAGCAATCATGCATCTTATTTTTAAGTTTTATCTTTGAAAAATTTGATTAAGATATTTTCCTAATTAGTTTATATTTCTATATCTTTAAATATAATTATTATATATGTGAAAAATTAAATTAAGATATTTGTTTTCTTAATTGGATTATATATTTGTTGTTAAGATTTGAATTTCTTTTAAATAAAGATATGATTATCTCCTATTAATATTACCTTTTATTTGTTAAGATTGTCTTTTGATAAATATTATATTTATTTTGAAAGATTTAAGATATTAAAGATTATTTCTTAAAGTGGATTTGTTTTAATAAGATAAATAATTCGCTTAGATTCATTAATCTATTAAAAGATTAATGAATTAAAAATAAAAATTGACTCTGTCTAAGGATTATTCTGGCTAGGCTGAGGTATTTAAGCTGGGAACACCTCTACATGAGAACTAACCTGGGAGTTGAATTAGTCAAATTTTATTTTTCATGCTAATATTGAAATTTATTTGATTGTTGAATATTAAAATTATTCTCATGTAGATTTTGTAAACTTTAAAATTTTATATATAGTGATTATATATATTTGAAAGAATTCTCTCATGACTGAAGTTTAAAAGTTATAATAGTTAATTACTCTTCCTAATTTTGATTTAATACACCTGAAGTTGCATAAATCAATTAGTGCTTATTGTTTTTACGTTGCACCTGTAGTTGCACATATTTTAAATTAATAAGCATATATTACTTTCATACATCAAACATGCTATGCTCTTGCATTAGCAATTTGAAAAAGAAAGTTTGAAATATTGTGATGAATATTTATCTAATATATTTTGAGGTTAAAACATTTGGCCATATGCTCTATTACCAAATAATTTAATATCATTCCCTGAAGTGAATGTTGCAATATTTAATAATTGAGGTCGGAATAATATTAGTAAAGGAAGAAGTAATTATTCTATTAAAACCACACATATTTATATAAGAATTTCATATTTCAAATGTGATGCAAAAGAGACAATGATCTTGTACCTGTCGTAAGAGTTTTTTTTTTTGAAAAATTAAAATCCTTAATAATGAAAAGGAAGACGATGTGTGGTATAGCAAATTTTGAGATTTTATTTGAATCTCTTGAAGAGATCATAACTTATCATTTTAACCCCTAAATATGATGATATTTGGATGTTACAAGTTTTTAGAATCTTCTAAAGAGATTATTATTATTTTTGACCTATTTGTATATGAGATATTTGGTTTTCTTTTGAATCTCCTGAAGAAAAAAGAATAATTAATAATATTTATGTTTTGCATATAGTACATCTATGCATATGATACTTAGAAGTAGACAATACATTTTCCAAAATTCAAATGCTTGAAGCAAAAAAAAAATCAAATTAATATATATTAAGTCATGTAGACTTGATTAAATATTTTGGAAAAGAAAATATTATTTTGCTCATATGAGCAAAATTTACGATTGATATACCACATTCTCTTGTAAATCAAAGAGAAGTTTAGTAAATTTGGAAGGTATATATTGTAATAAATATCATCTAGAGAAATTGATAATCTATTGTCTCCTACGGGAAATGCATATAGAAAAGTTGTATGTTTTTCCTTCTAAACTGTATTACACATATTCGTGTAATTGAAATATATGCAACAATGAACCCGAAGTTCATTGATCCAAATATATTTTTATTTGACATGATGAGTCATTTTGGGTCAATAGTGAAAATAATTATTGAAAATCTACATTCACATCCACGGAAGAACTAGAAAATTCTTCCATCTAATAAATTGTCCTATGTGGATTTGTTCTCAAGAGATTAATTATCAAACTCTTACTAGTTAAAATTGAAACTCAACCTTTCAAGAGAACCATTTAAATATTTTATGGTTTTGTTAGCGCATCCAGTTGATGGTCACATATATGTTTATTATCTTCAAAACCTTACATCTGCAAGGTTCGTTGCTCAAATAATTAAGTGTACAATTTCATGATTTTGAAATTAAACATTTTGTTTTGATAATGCTAGTGAGTTTGCATCCCAACATTTGATAATTGATTGGGAAACTTCTATCTGTATGAGATCACATTGTTATGTATGCTCTAAACCAATAGCTTATGAGCTCATGGCCAGAAGCCAAATATATTTCATGTGTGCAAATGTGCAGTAAATGATTAAATTGTTCCACAACAACAATTATGATGATGGATCAATTAAAATGAGTCCTCAAAAGAGGTTATGAATTTATGTTGCAATTGATTTCACATCAATCTTTGGATCCCTGATAGGTGATAATATATTTACTACACAATTTACTAGTTGTCATTAATGAGACAAATTTTCCAACATTAGGGGGAGGAATTAAGAAGTTGGAAAAATAAATTGAATGAAATGTATAAGTATTGTCTCATTTCGATCATCATACAGATCAATTTGAACTAGAAGTTCAAAAGCTAATTCATTTGCAAAATATTGCAAATCAAATGCTAGATGCAATTATAGAACAACATTTACTGTTGCAAGAAAGTGACCAAGTTATATGAAATGGTTGTAAATGCACCATCTAATATTAATATCCCAATGCAACAAGTTGTCAATACTAATGAGTCTTTAACACGCCTGAAGCATGATAGACATATGGGTTCCAAAGATAAAGATACTCGAAAAAAGGCGTCAATGATCAAAATGACTCAGTTAAGAATATGGATATTCCAGAAGAAATCCTGAATATGAGTACTCATAAGAATCTTGAAGTAAAAGAGGATAACAAAGAGATCTCGATAAAATATGTCATGACAAGAAAAAGATGGAATATACTTAAATAAGTTGACAACATTTTTGCATACAATGTTGCTCACGATATTATTTATGAAAATGAGTATACTCATATATACATTGAAAAATGTCGCGACATAGAAAAGATTGACTTATGTGGAAAGAAACAATCCAATAGAAATAAACTTATTTTTCAAATCGTGAGAACTAGTAGTTCAAACATTAGAGAATGTCAAACATGTGGGATACAAGTGAATATTTGTAAGAAAGACAAATAGAATGTGGTCACATTATACAATGCGAGACAAGTTCCACAATAATTCTCGCAAATAAATGATATTGATTATAATGAGACATAATCTTTTATGTTGGATACAATACCATGAGATATCTAATTTATTTGGTTGTGTATGAAAAACTTAACATACATCTCGTGGATGTAGTAATTATACATTTATATGAATCTCTTAATAATTATATCCCTTAAGGATTAAAGAAATCACAACCTGAGATTTACTATATATTATTTGAGCATGAACTCCTGAAGAGATTTCAAAGGCAAATAGAGTTTCTTAAGAAATAAATTGAGATGATAAGTTTTGCCTCAGCTTGCAATAGCAGATGGAATTGCATCAATTTATACATATAAGATCTTATATGAACTAGTTTCATCATTGAACATTCCTACCATGGTTCATTCAGGTGTGAAAAAGTTATAACATCTAATATCAGAAAGATAATGAAGAACTTTAGGTCCCGAAGAACCATAATTTTGATAAATAAGTGCACTTATATCTTTGCTAGTTTATACGCTACCTGTCGTAGCATAATTATAATATTTCTTCAAAGAAATATATTAGAATAGAGTTAAACGTATGTTATGTTTTTATTTGAGAATTAGTTTACATGGATTTATTTTATTCTCATAAATATAATTGTGATATATTTTATTGGGAAGATGCATGTTACTTATCTAACCCATAAGAACTAGATCTTAAACAGGTTACTTAGTACAGAGAGAAGAATTCTTATATTATGACAACTTATGAAGCAGATCATAATAACTACCTTAAATCATGTTATAATCTTGATGATGTACGAAGCAAGCTAATAGTAATCCTTATATGAAGATGATAAAGCATAAAGTACCGACATCACTACTCAACGAATTTATTCAAAAGACAACTTGGGAGACTTATTGACGAAGGTGTTTTCTGCAAAAACATTTAAGGAGTTAACACATACAACTGTATGTGACAACCAAGAGTATCAAGTGATGTTTTCATGAGGGGGAGTAAATGTGCTGCACTCTTTTTCCCTTGACTATGGTTTTGTCCCACTGGGTTTTCCTAGCAAGGTTTTTAATGAGGCAGTTACTAAAGTATACGAATAATGTACTCTTTTTCCTTCACTAAATTTTTATCCCATTGGGTTTTTCCTAGTAAGGTTTTAATGAAGCATATATTCTATACACTATGGACATCTAAGAGGGAGTGTTATAAATATTTGAATTAGATATAGATGTCCATAGATTTTATATCCTTAGATATTATTTCCAATATCTTTCCCTTTATCTTCTCCTTGTATTTAGCTTTTCCATATCTTGTAAACTCTATAAATAGTGGTCATTGGGACCTTTGAGAAACACAATTGAATAGAGAATACATTCAGTCTCTACTTTCTCTTCTCTTTATTCTCTTGTTTTATAAAAAATATCACTTTTTTTTTTATAATTGTTATTTTATTATATCATGTAATTTTCTTTCATTTTTTTAGCAAGATTAAATCTAATTAAAAAATATTACATATTTAATCATTTTATTTGTAAAATAATAAACTATTAAATATAAATTAAGATAATACCATTATTTTTTTTAATCTTACATCATATTGTAGTTTTATTTTAAACAATATGATAGCAAAATCAAGGGAAAAAAATCTAAACATATAGCACTTCTTTAAAATGTTTGCAAATATGGCAAATGTTGACAAGTCAACTTTTAAATTTTTTTAAAACTTTTAAATTTGTCCTTGTTCGTATGTTAGGGAGCACATGTTTCCATCTTCTTCTTCCTTTTTTTTCCTTTTTTCCTTTTTCTGGTTGTTGCAGTCTTCGATTTCATTATACTCGCTCATATTACAGCATTCCCTGTTTCTTCTCTTCATCTTCAACTTTTCCGACTTGAACCATGAAATTTCAAGCTAACTTTTAATTAATTTTTTTAAAATTACAAGTTTCCCCTTCTTCTTCTTCCTCCTCATTCACACAAAATATTAGAATTGTCAAAACTCAAAAGATCAACAACATATATTGATTGAGATTAATTTTAAATTTATCCTTCATTATGAACATATAATCATTATAGATTATTTATAATCAATTAATTATTTATTATGATTAATTTTTATTACTTCATTCATTATTAATATATCATATTTCTAAAAAAAATTAGTATTCTTTATTAACATATCATATTTTTATTTGTTTGTTTCACTTTTTATATAATCTATTATTTATTAAAATATATTTTCTTATATTATTTAATTAATATTAAAATTACTAGTGTTGAACTTAATTAATTATAAAAATGATTAAATAATAATATTATAATTAATATGATGTTCATTAAATACATTAATTGGTTAATTTCAATTATAAATTACTTAATTTTTAAAAATTTATAATTAAGATTATTATTGATTCTTAATTAATTATTTTTTATCAATGTATTGAATGATGTCTATTGTTTAATTAATTAATCTATTACAATTATATAAGATTGTCAGGCTTAATTTTATAAATCCTTAAACCAAACGGCCCCTAACAGTTATGTCATGTAAATGACTAAAATTGAGCATTATTGAAATCTCAGGGACAAAAGTGTTAGATTTTAAAACATAGAAACCAAATAGAAATTAAATCCAAATCTAATAAACCAAAAGGTATTTTTTCGAAAAATATAACTATCCACTAATTTTACTTAGAAGGATTAGTAATATATTAGAAAAAATTAGAACTTTTGATATTTCCACGTAGCAAGGTTTTAGAATTTTACTTATCTATGTAATAAATTTATTTTACTATATCATATTGTAGTTTTCTTTTTAAATATTACCTAGTTCACAAATTTAGTAAAATAAAACAACAATATGATGTAAAAAAAAAGTAGTGGTATTATCTTTATCCATAGATAATAGTTTATTATTTTACAAATAAAATGATTAAATATATAATATTTTTTTAATTAAATTCAATAAGATAATAATTATAAAAAAATGGTATTATGTTTCCTTAAAAAGTTAAAAAAAATGAATTTGTTAAAAAAAATCACAATAATTATCATTTCATTCATTATGTGGGTCCCATTCCAGCTTTCAATAAAGTTTTCACTAAAAGACAAAAAAAACTACCCTATTTTCCTAAATAATTTTAAAATTATCCGTTTTCACCAATTTTTTCTTAAAACTACCCTTATTTTCTAATTGACCCGATTTCCTATGGTAGGAAATCGGAGTGGGAGTGGGAGAAATTTTTTTTCGAAAGCTAAATGGGGACAAAAATGGGAAATAATATAACATTAAATTCCTCGTCTCCGTCCCCGCCCCGTTAGACTTTTTTTTCTTATATTTATTATAATAATTTAATGGTATGTTATTTATTTTTATTATATAAATATTATAATTAATTTATAAGATTTATTGTTTAATGGTGAAAATAATGAATATATTTGAATTAGTGTAAAAAAAAGATATGTTTGAAGGGAAATTTTTACGGATAGAAAAAATGTCAAACTATTTACATAAAATAGCAAAAGAAAACACTGATAGACATTGATAGACTTCTATCAGTATCTATCAGTGATAGACTACTATCATTTCTATCACTGATAGACTCTGATAGACTTCTATTAGTGTCTATCACAACTATCTAAAAATTTGCTATTTTGTGTAAATAATTTTCCTAATTTTTCTATTTTTAAAAACTCCCCATGTTTGAATCCTAATGAATTTAGATTATATATATGAATAATTCGATAGATAATTATTTCCTTGAACTTGAATTTTTTGAATAATTTCTCTTTAAATTCTAATAATCCATGTGAAATTAATCATATAAAAGGTAACCATTTAATTAAAGTTTTTCATAATAGTGATTTATGGTAATTGGTTTTTTTTTTTAAAAAAAAAAACCAAACGAGAAAAAATTTTCCGCGGGGATTCCCGCCTCCATCCCATGGGGAATTTAGCGGGAATGGGGAAGCCATCTCCGGCCCCACCCCCTCCCCGTGGACATCTCTACATAAGCAGCGACAATACCCAACGACAACAATCACGACTAGCGACGGTGGCGTTTAGAGACCATTGACAGATGTTGACGAAAGGCGGCGAGCTTGCAGCTACTGGTTCCAACGGGTTGTATCAATCGATGAAATCTAAGAGAGAGAGTGAGAGAGATGTCATATGACTTACCCACAATGGTCAGCGGTCGTCGACGGGCAGTAACTAACGGTGCAACTGGCTTGTAGGTTGGAGCTGATGCGTCTCAAGCGAAAAATGAAAAGATGGGGTTTGCACGAAGGAGAAGATGGGGGGGGGGNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGGGGGAGGGAGGGAGGGGGGGGCGGGGGCGTGCCGCGCTAATAGGCTAGATAACTTAAGCTTTTTTTTCAAAGTCACATAAACAACATATATATATATATCCTCACTCTTAATCTAAATTTGACTTTGATTTTTTTCTTCTCCTTCTTAGATTCAAATCTTTCAATAACTTTCTCAAATTAAACAAACCAATCATCTTCTCCAAATTAATTAAATTTGGGCTCCATACTCCAAAATTTGAGAAAAATAAAATCCAACGATTTTTTCTCAACAATTCTATCTAACCCAACTTACTTCAATATACTTACTTAAGGTGAAACCTTAAATTTTAAACTTTATAGAAATTAATCTCATTTGAAAATGCACGACGCTACATTGAAGATCTACATAGAAAAAGAGAATGCATTCATGCTAAAGAAATAAAAATAGAAAATCTAAATTATGAACTCGAATAAATTAATTACAGTGAAATCAAAGATATATATTCATTGCACTTTACTACTATTCTAAAAGATTCCATATTTTATTATATTTGCGGATGAAACTGTAATTTGTGCTTTACGATCTAAATTCGCTTGAGAATTAAGGACTCTTGGAACTTTGAGGTGAATAACTAGATCCTTCGCAAGCTCACTTCAACTTCAAGTTCCATTTAAAATTCTTTTGCTCCTAATTCATACGACCCGACCCGACCCGGTTTAATAGGAGGTATAAATTCAATTTCGCGGGCTCGCTATCTTAGAATGGGCTTTTGAGTTTTCGCGCTCTATTCGGGACAAATGGAGGAAGTGGATGAAACGGAAGCGGTGCCTCAGGTTGATCACTTTCATTCTCCTCTTCTCTCTGCATTATATCTTTTTCACAATATTCTTTTCAATCCAATGCATGGATGTTCTTCTGTATTGTGATTAGATGAAACGAGAAAAGTTAAGAATTCGATTTTAATCTTCTCTGCATTTCTCCGTCTTAATTCCTCTCTGGTTGGTGAGAAATGGATGAAAAGAAAAGCAAAGGATACTGTGATTGGTTTGTAGTGTAACTGGATGAGAACAGAAAAAATAAGCGTGAATTTAAATCATTTGAAGGATCTTGGACTGGACTACTGATTCTGCCTTGTTGAATTTACTTTGGATTTGATCTCTCCAATGTATGTTAATAATTCGGTTTGGATGCTGAGAAAATTGAAGAGCAAAGAGAAGCATGGATCAGTTGGTCTTTTTCGAAATCAGATTTATTAATTTCGTTGTTAAGAATTTGGAAACAAAGTCAATGCTGAATGGAAAAAGGACGGAAGAGAAGCACAGCGAATCACTTGGCATTTATCTTCTAAATTAGGAAAAGCTATGGAATAGAGATGATAAGGAGACAGCTTTCTTCATAATCTCTGTTTACAGTGAATTAATGTCATTTGATTTAATTAATGGATAACTTAACTAATCAAAATTATTCTTTAATTCAAATGTTTTAAATTACAAACTAGCTTCATATTTGCTGACAGTTTTAAATCAAGAAATGTTCTTCACTGGTTTAGTAGTTCACCACTTTCTCACTCTGTTTCCCTTTTTATTCCCCTGGCTTGTACGACAGATATACATGGCTTGTGTCAAACATGGACAGAGGTGAGGATATCTCTACCATACTATACATTTCTTCTGGGTTCCTACCATTTGATTGAACATCTGTCAGTATCAAGAGAAAACTTTATGCGAGAAATTTACACTTATTTGAAGTATAGTAGCATGCCAGTAGGTGATTGGACTTTTTTTTTTTTTCTTTTTGAGCGAAAGGTGATTGACTTTTATCTGTATGTTAGATGCATACTGATACTATCTGTTGCTGAATAAATATCTAAAATGGTTTTCTATCATATTTACAGGAAAGTAATGGTCCAATGGACATCTTCTTAGGCATTGACAAAAGGAAAAAAAAGAAAAAGAAAAGCTAAAATATATTTTTTTCATAATATTTATGTCACTAAGTTCTAAGACACAAAAGGTTTAGTTGATGTATAAGGTTATCTTGGCAAAAGGAGGATGTAAATATTCATTAAATATTGCTGAATTGTAAGACATGCATGGCTTAGTAAGTTTTCTTCTCAGAGTGGGAGTTTCATACTATGATTCTAGCATCCGCCAGCTTCATGTGCTGGAAGTTTGGGAAGATGGCAGCATGGAATATCCTCTCATTGATCTAGGTATGAGTTCAAGCTGCTTTGTAAGGATGTAAGCTTTCTGATATGGTTTAATTCAATTAGGTAAGTTGCCTGATTATAGCTGGAGAACTTTAATGATATTGTCATTCCCACGGTTCAGATATCTTTTCTCTAAATTTCTTTGACCGCAGTTATCAAATTCTAATAGCTTTGTGCATCATGTTTGCCCCTTCTTTTCCTTTCTTCTTGATTCAGTGAAGTATCAAGCTAAGCCCCTAATGATATATACTAGCACTAAAAGTGAGGAGTCTTTCTTGGCTGCTTTGCAACGGAGTGGTATGCTAATTTTTGCTGATTTTAATTATGGAATATAATACTTTGGTCTTTGTTTAACTTTTAAGCAATGCAGACGTGATGTCTGAGGCTCCTACAGTGAAGCTTGTGAAGAGTTCGATTTTCAGCTACGAACAGGCCTGGCACAGGTATCAAGCACAAAACTATTGTTTGATTATCAGTAACTATGGAAAATATTTGAATGGTGCAATCTTCATTCTTCAGGATGAGAAAAAACTTCTATTTATAAACAGGCTAGTTTGATCCCTGCCCCTTAACCCTCTTACTGAAGTAGTTCCTTTATTGGTTTACCCTCAATTTCTTGCTGCACAGACTGGTATACCTACGAGTAACAGGAATGGATGATGGATTAAACGTCAAGGAGAGAATTTGTTATGTAAGTTGATAACTGATATATATTTTTCAGACTTCTTTTGCTTCTCTTATATTTATCGCTACTGTTGATATAGAAGTTCAGTTATATATTGTAAAGAAGAGCTAGAGCCTACAGAGCCGGTGATGCTATCCTAGTTTGCAAACTGGTTCAATATGTGCTTCTGTGAACATATTGACTTGGTTAATTGGTTATTGAATGAACAAGAAAACATAAAATAATATGATGCTATTAGATTATTTTATTATGGATGACCACAGAATTTATTAAAATAGATTATAGATACACCATCAAAGTTTGCTCATTCTTTAGAGCTACCTTTTCCATATACTTGTCTTTTTTATGTGTATGGACTGTATCGATGTTTATCTGTTTAATATTTATTTTCTTTTGTTGTTTGAATCATTAGCTAACATCATTTGCAATGAGAAATTTTGTATTCTGTTAATATTTACTTCCTTTTAAAATTTTGCTTTGTAGTTCCACTGCAGTATCAGTTTAACTTTTTAATCTGGAATTGAACAATTATTTTGGTGGGGGTGGGGGTGGGGGTGTTTCCTCTGACCGAAAATTCTAGTTGAGTTCTATGATGGACGTGGGAAGTGACGTTCAAATTCGTGCTAGTGGAGGTCTTCTCGCCATACTGGAAAATGAAAGGATTGTGGACACGCTTGAACAAAAGGAACTTGGAACTTCATCAATAACGATTGATTCTGTCATTGAAATTTCACTGTATGCTTTTATTTGTTATCTTATTAGCCAAGTTACTTGCACTTAAAATTTGAACATATGAGAGAAGTTTATGTTAATCCCTCCTTTACTTCTGATAAAACAGAAACAACTTTCTAAAACTCGATGCAACAGCTTTGGAAGCATTGCAAATATTTCAAACTGACAAACATCCCAGCCATATGGGCATCGGAAGAGCAAAAGAAGGGTGATTTGAAAACTTACTCATCAGTGTTGCTCTGAAGGAAACTAAACCAATATTTCTTGTTGCAGGTTCTCTGTATTTGGCATGATGAATAAGGTTTGTATGTATTGGTTTATTTTATAATTTGAAGCACATATACATGAGTTATTGATACAATCTCCTCATTCCAGTGTGTGACACCAATGGGTAGACGCCTCTTGAGGTATACATTTTCTGCTAGGAACTTACTGACAGCCTTTCTCCATATATCTCTAATTTTCCAAAAACTTGGATATTGGCTGTTTTTATTTAGAAACTGGTTCCTGAGGCCATTACTGGATCTTGAAAATTTGAATAAGCGACTTAATGCTGTATCCTTCCATTGTTTGACAATATAGAAGTGAGCTTACATTTAAATGTATAAACAATATGTGTTATGTCAGTAATATTCTGAAAGAAAAAAAAGAGAGAGAAGAATGTGCCTTTGTTCTTTAACAATTAACACAATAAAGATATCATTCTTTATTTCTTCCGATGAATTGATGCATTCATTACGCGAAACTCTAAGGATTGTCAAGGACATTCCCCATATACTCAAGGTAGAAGGGTGTCTTCTATTTTTCATAATTTGTATAATATTTGCTCATCAAAGACATCACCCACGAACATGGACAGTTAGTTTCCACTTGTAATTGGCTTAATATGTTTATTTTTCAAATTTTCTTACATGGAAGAAATTCAATTCCCCAAGCTCAACATATTCTTCTGGTGATTGGACCGCATTCTTGAAGGTATGTTGACCTCCTTTTCCAAATGCTATGACTTTTTGACATTGTTGCGCATCTAATTAGTAACCATTATTAGATGATATGATGTTAAATTTGCCTTCAATCATCAGCTTAAGCTTTTGGATCAATCAGTGATTTAAGATGGTATCAGAGTAGGTGGTCTACGCAGGTCTTGTGTTCAAACCCTTGCAATGGTATTTCCTCCCCAATTAATATTGATTTTCACTTGTTGGGTCTTCTTCATATTTCAAGCCCACAAGTGAGGGGAGTATTAGATGATATGATATTAAATTTGTCTTCACCCATCAGCTTAAGCTTTTCGGTCAATCGGTGATTTAAGAACCATCCACGTTAAGAAGTACCCCAAATGTTGGCCAAAGAGCCATGCCCAAGCTATGAGAGACTTGTTGCATCATTTTGTTCGGATGATTTCTCAACTTTTGCTCACAATTGGTTCCTTGCGACTTGTGTGTCACACTTAAAGACGGTTGATAATCGAATAAGTTGCCGTCTTTTAATGTTAATTCATCAAATGATCTTTTATATCATCATGAATATGTTTTTTAGTGCACCATCATTATAGTCCACTCAAATAGTGATCATGTGAGGTTGGGAAAATCATTTTCCCTTGGCAACATTGTATTAAAGTTCCTTCCATCTCATCAACTACATTTCCAGTTATCATGTGATTTTATACTAATGAGAAGAAAATTCATGGGGAGTTGGCAGCCAACTCTCTCTCTCTCTCTCTCTCTCCATTTTTATTATTATTTTACTTTTTTCCATCTGTACCTCTACATATTGTGAGACATATTTTCGTTAACAATAAATTCTTTAACTTTTATTTTGATCTTTCTTTTCTTTTCTTCTCTACTGCAGAGTATTTGCTCTCTTCTGCACGTGAATAAGATATTTGAAGTTGGCATGTCAGAGAATCTTAGGGAAAACATGAAGTACTTGAATTTGGACATTGTTGAGAAGGTACTCAATAATAGCTTTTTTGACTCACTTTCTGTTTGATCAAAATACCATTTTAATGAGTCTTTGTCTTTGTTTATTGCAGGCCAATACGTGCATTACAACAGAGTTGGCTTATGTTTATGAACTGGTCCTTGTTTCTTACTTCCCTGGTATTCTATTTATATTTCTGTTTAATCTGCTGATGTTGCAATAATGGAGAAAGAAATCATGGGTTTCTTGTTATAATTTGGGTGATGGAACTAGTAAGGGTCACTTTCTCTTCATTGTGCCCTTTAAATGTTTATTACTATGATTGGATTTTCTATAGGCCCATTGGATTGTCCTTTAAGCACTTCTGCAGTGGACCTCATAAAATATTGTGCCTTTCATCTTGAAGGTTATGGGCGTCCTGGATGTTAGTAGAAGCAAAGAGAAGTCATATGAGACAATTGTGAAGGAAGGTTTTTGTGAAGAGGTAAGAGATAGTTAACCAGTTGAAGTCCTCTTCTTACCAAAGTATTACTATATTCTTAGAGCGTATTTTTCCTGTCTGACAAGATACTGATTATCCTCTTCCTGTCATCTTTCCAAGGTTAGTTTATTAAAATGTTGGTATATCATGGATAAAGTTAATTCGTTATCTTTAAGAATAATAATGAACAATTTAAATCTGACTTGGTATTGAACTTTTATTTCTGGTTTACATTGGAAACTACATATTTTTCTTTTGGATGGCTAATAGTTGGATGAGCTGAGGGAAATCTACGAGGAACTGCCTGAATTTTTGGAGGAGGTGCATTATGCATATTTTAAACTTCAAAAAGTAGACGTTCAGTAAGATGTATGAATGAGTTTATCTATTAATTTCGCCACTCCCAACAGGTTTCATCAATGGAACTTGCTCAATTCCCTCAGTTGTGTAAAGACAAGATTGCCCCTTGTATAGTCTATATACATCAAATAGGTAGGCATTCTTTCCAGAGCATTCCCCTGAAAGGGTTTCTTTTAACTATCCATACTTTGTAGGCATTTCTGGTGGGTACTTGGGACTGAGTATATGAAATGGCCTGTTAATGTGATTTTATGCAATGATTTTCAATGTCTTGTCACCCCATATAATGCACCTTGTAAGAGACTAGGACATGATCATTACCATTCTTTAATGCGGAGAAAAAGGAAAACCCAAAAAGAAAAAGAAAAGAAAAGAAAAGCTACTTGTTTTTATGCATGGTCAGTGTTATGCATATCTTGTGTGTTATTGTGTTTTCATTTTCCAGCAATGGGAGCCAGGATTTTTATCTCTCTCTCCCCCTGCCCAACCCCTTCCACCCTCCAGGATATTTATTATGCATATTTGAAGAGAAACTTGACGAAAGCACATTAGAGATCCTACGAGACTTTGAATTTGCTGTAAGTTGTTTAATCTTTGTTATAATTGATACTTCTTACATTATTCGAGTTCCTAAAAGTTTTACAAATGTAGTTCTCTGATATGGATGGAGATATAAAGAGATTCTTTTACCATAGTCCAAAAACACGAGAATTGGATAATCTGCTTGGAGACATTTATCACAAAATCTTAGGTACTACAAGTTAGTACCTATTGCTCTGTATTTTCCTTATTTTCTTGCAGTAGATTATTAAAGAATTTTCTGTTGGCGTATATTTCAGCAGAACTGAATAAGACTTTGATGATTAGCTCCAAATTCCAATTTATTTAAAAAAATTAGCACTTAACAGATGGAAATTAAAAAAGAGAAAAAGCCTTCAATCTTCAATTGTCACGTCCATTAACTTACACTTCAAATATTTGACCTTGCGTATATTGATTTCTAGAAGATATGGAGAGGGCAATTATTAGAGACTTGGTGTCACACATACTTGTTTTCTCTCTGCATCTGCTTAAGGCTGTAGATTTTGCGGCTGAACTTGATTGGTGAGAATAAGTTTTTCTTTTTCATTTATGCTCTGTTGTCTATACATGTTACTCCTTTCTCGGAGGACTCTGAATGTAGCTGGCACTCTCATTGTGCATTTGAACATATATCAATCATCTTGATGGTTTTGTACAGCTTTTTATCACTAGCACTGATTGCACGTCAGAACAACTATGTAAGGCCAGATTTAACTGCAGATAGCATGCTTGATATTAAGAATGGAAGGTTGGAACCTTTGAATGTGCAAGTCATGTTGAATATTCACTCAAAACCCTGATAAGCGAGTACTTAGATTAGTAGTACATTTGTTGTAGGCATGTTTTGCAGGAAATGGCAGTAGATACATTTATTCCCAATGACACGAAGATTTTTTATGATGGTAAATTGACGGTGCATTGCATATCTGTATTCAACTTCAATCTAGAAATGCGCATCTGTTTCTAATAATTTGTAGTTCATGTCTTTTCAGAAAGAGTTAATATCATTACTGGCCCAAATTATTCTGGTAAAAGTATCTACATAAAACAGGTAAATAAATGTTCAGCTTTTCTTTCTAGAATGGGGTGCTATCTTCCTCTCTCCCCACGTTATTGCATATTTGGTAAATTCATTACATATCTTTGGTATGTGTTCATTCATTGGATCAAATTGCCATCATTCATCTGTTAAAACTATGCCTTTTAAGTCACATTATGGTAGTGATGCCGCTGAGCAAGCTAACTTCCAAAGATTAGCAAATCCTAATGATGTTGTAGATGAACTCCTTAGAGACGATACTTTAGAAGAGGTTATACTCAACTGTGGAGAGCTCAGCAATGGATTAAAGACTGGCAGACCAGGGATTGAGATAGCTGAGTTATGTAGAGGGGTGATTCAGCTTTGCATTGCCTAGTATGTAAATTATAAATTAGCTCAACATTCTATGGTCCTTGTAGAAGGAATGGTTGGAAACGTGGCTTATCATCTGTTCTTGCGAAATTTATGTTCTATGTTTCATGAGTCACAAACTCATCTTGCTTGACGAACTTGAGCATAGTTCAACGGGTTAAGATATATACTCTCGATCAAGAGGTTAAATGTTTGAATCTCCCACAAACATGTTAAACTTTAAAAAAAAAAAAAAAGAAGAAAAAACTTCATCTTGCTTGTGGGTCTATTATTGAAGGTATACCACCGACAGTGAACTCATTGTGACACCTTATTCGACTGCATGAAGCAACCTAGTTGAGTAGGTCAGAGCACTCATTAAATGGCATGGGTATGCGATGATCCTTGGAACTGTTCCACATTGCAATCCAAGAGTTTCCATCTTTTCACTTTGAGAATAAAGAGAAACTTCTGGTACGCATCATGTAGCCACAAAGGGCAGTAGAACGGTAAATTGAGGCTACGGGCAGACCAGAAATTTTCTTGGAAGGAATACAGTTTTACCTGCTAACTTTTTATGCACAAAATATTTTAATTCTGAAAATTTAGACGAGCAAATAAGAGAAAACTGCAAAGTCTTAAATACTTCACGTATAGTTTCTGACTTACAAAAAGCTAAGAGGGGGCTCTCTTTTTTTCTTTGTTCCGCTTCTGCGTGAGGTGAGCAAATAAATGGCTAAGAAGTAATAGTTAGGGTTTGGGCAAAGCCTTTGCCCCCTTTTATGTACATTAATGAGTTGAAAGGAATAACAAGTCTGCATAGTTATAATTCCAGTTCTCCCTCTCCTTCCAGGTTGCTCTTATTGTATTCTTGTCTCATATAGGAAGCTTTGTTCCGGCAGATGCTGCAACCGTAGGTTTGACAGATAGGTCCGCCTTCCATGTGATAATATCTTCCCTCGTTCTAGTGTTGAATTTTAATCATTGCTTATCAATGATTGCTAAATGGGCTTTCGCAGAATATTTTGTGCTATGGGAAGCAAGCATATGACTGCAGAACAATCAACTTTTATGCTTGACTTACTTCAAGTGGGGATGATGCTGAGGTACATTCGATAAATAGTTCCTAACTGTATACATAACCAGAAAAGCAGCAGAGGTTGCAATATATTTGTAGAATAAATCTTGATTGTTGCGTAGCTAATGTCTACTGTGGAAACTTAGATTCGAGGGCCCGATCAATGACATGACCTTAACAGTTGAATCTGCCTCTTCTCTATCATTGATTTTTGTTTTATTAACAAAATACACTAATCCTTCTATTTTAAATACTATAATTGTTAAAAATTCAGGCAGGCAACGTGTCAATCTTTGTGCTTGATTGATGAATTTGGTAAAGGTACCCTTACAGAAGGTTAGGCTCACCAATTTACACTCATTTGAATGTACTTTTTATATCCTGCGTATGATTTATGTTTGGCAGTTGAAATGCGTAGGATGTTAGTAAACTCACTGTTTCGTCTGTACATTTAAGATGGCATTGGTCTTCTTGGTGGAACGATCACCTGCTTTGCAAGTTCTAATGACTCTCCAAAGGTTTGACTTACTCTCCTTAATAGCATATTGTTTTTATTGCTTGGTTAAAGTTTCAATTCTTTTGAAGCATCAACAGCTCTTCTTGTTCTATATTGACGAAACAATGGAACTATTTTCAAATTCTCTGCTTTACGAACTACTTTATTCAATTTTTATTTCTTAAGCCTGAGTTCATCATCTCAATTCAGTTTTCATTGTGACTCTTATTTTTATTTCACTAGTCAAATTTGTTTAATATAAGGTCCTATTCTGATCTCGTGAGTTTCATATTTATTCTATTTTAGTACCTTTTAGTTAACAGTTATATGAATTTAGTGTAGTTGAATTTAACTTTGAGAAAAAAGATTCAGTTTGTACCTCAAAGTTTTGGAGTTGTATCACTTAAATCCTAGCTAATTATTGTATAAATTAAAGGGTTGTTTTCAAATATAGAAAAATGAGTCAAACTATTTACAAATATAGAAAATTTTTACTATCTATCAGAGATAGACTGCAATAGACTGCAATAGAATTCTATTGCAGTCTATCGCTGATAGACAGTGAAATTTTTCTATATTTGTAAATAGTTTGATAGTTTTTCTGTTTATAGTAATTTCCCTAAATTAAAACCTCAACTTTCATAATTGAATCAATTTAGACCTTTTATTAGAATTCCATTTTAAAAACACTAATGCATAACATTTACATGTGTTTAAGATTTCTTTAAAAGTAGGGCTAACGTAATATATATTAGAGAGAAATGCTACAATCAAATAGATAGTGTTGAGAAAATAAAAAAATATTGCGGAAGCAATAATCAAAATATTAATTTTTGGTAAGCAAAAAGAAGAAATAGAAAATAAGAGAGTGAAATCTAATAGACGAATAAACTTTTTATTGACCTAGAAAAAATAGGTGAATGCAAACTTTTCATGGAAGTTCACCCTTATGTAGGTACAAGAATGAACCAAATTTAATACTACTAACTTATAAATTAGAAACAATATTAAAAGTATAAACTAACCAAAACTAAAAGAAAACTTAAAATGACAAAAAAATGGAAGGTAAAATCTAACTTTTAAACAGAAACGTCAAACATTAAATTGAAAATTTTAAGGGCAATTACATATATATGACTATTTAACACAAAATAATAGTAAATCTAGCACAATTGAAAACTATTTGCTAATATAGCATGATTGTAACTTCAATTAGAACCTATCACTAATTGAGGTTTGTCACAAGACCTATCAATAACAAAGGTCTATCACTGATTGACCCATCTGATAGACCTATCAATGATTAAGGTCTATCGGTGATAGGTGTCTATTATTGATGGTTTTCATGCTCATTTGCAATTATGTTTGTTACTAGTATATCATATCAATAGAATATAAATATGGTACATAACTAAGAATTATATTAGTTTACCTCATTTACTTTTAGGCGACTTCTTACATGTTCATTATCTATCTTCCATTATTTGTGTTCATTTGTTATCAAATGTATTACTAATATACCACATCAATAGAATTAAAAATAGTAAATTAGTGATATTTGAAATTGCTTTTTTCCCATCATTGTTTGAAAATTACCATATTTGCAAATTATTTATTTGCGCGTCATAGTGCAAATGTGGCAACCAATTTTGTACCCATTACCATTATCCAAAATGTGAAAAAGAAAAACTCATAACTCAATTGGTAGAAGTGGTTTCTCATACAGTCATACTTATTCAAGAAAAAGTTGTGGTCATTTATTTATTTTTCTTTGTATTCTTATTTTTTGCTACTTTGATAGGATTTTGGGAGAAAAATAATTTTGTTTTAAGTGATTTTAAATCTATTTTAAGTGAAGAAAAGTGAAAATGGTTCTAAATCACTAACAAAAAGTCTAAATTGATTCGCTTATAGAAGTTTTGCATTTAAAATAAAACAATTATTAGTTTGGAGTTTTAATTGATACAATTTTATTTTTATCCTTTAGTTTTTTCAGGCATTTAAAAGAAATCTAAGGTAATATCATTCCCAGAATTGCCCATGTAATGGCCAGATAATATTTATGCTAAATGTGATATGAAAACTCAACTGTAGGGATCAACATGGATTTGTATGCAAAGTTCGGAGTTAAAAGGAAAATATTTAGTGTTGGAACCAAAATGAAGCAACTGTAAGAGCAAAAGGCCAACAAAAATAAAAAAATAATTTTATGAAGCTGCTTCTGGATAATGAAAGGCCTTCACCATTTTGTTTCAAAATTACGTAGGGTTAGATTATAGGGAGTCCTTAAAATGAATGCTCATGTTTCCAGGTGCTGGTGTGCACTCATCTAACTGAGCTAATTAATGAGAGTTTACTGCCAATGGTAATTCATTTGAGTTCTTCCATTCTAAAACATTGTGACATGAAATTTCTAATTCCCTTTTCACTTATTTTAGTGCGAAAGGATCAAGTTCTACAACATGAGTGTGATACGAGCTGACAATGATTGCACTGAAAATGAAGATATTGTATTTCTTTATCGGTAAGAAATGTCATCTTTTGTTAGGTTGCTCATAATCCCAGCTTCTCCTTTGGTAGCATTATTTTTTCGTTGCTTTTGATTATCTATTTTTCTATTTGTTTCTTTAAATTTGAAATTGAAAAAGAAGATAGACGTTTCACCATTTATTCTATTGTATTTATGTTTACCAGAAAAGAAGCATGAAACTTTGCTTTAACTCAAACTTGCACAGACTAGAAATGAGACGATTTCAAGCACATATTCTTAATAACCTGAAAATAAGATCAATTTTTCTTTATTTGTTGGTTTTCATAGAGTTTTTGGGCGGGCAGAATCTCCCTAGACCGCGTGCTGATAGTTAAATATCTAATAACATATTCAATATGTTTTGCTAATTAACTGCTCTAAAGTACAGTTGACTTCTATGCATTATCTCTGGATGTTGTCTTATGGGCCATATTCTCAATTTCAACCCTTCTTTAGCCTTAAGACATAGGACTTAATACACTCGAATTTCTCATGTTTGACGGTATTCTGGTCTTCGCACATTGCAGTTTGGTCCCAGGACATGCACTTCCTAGCTATGGTAAGTAGATGATATAAAATCTAAGTACATAGTTACATCTTTATGTAAATATACTCGGCACTTGCGCTGACCAGCCGTAGGGGCCTTCCGGCCCCCAAAGGCACGTGTCGTTGGCTAAGCCCTCGTGACGGATGAGTCGCGGGGGCCGCCTTGTAACGTAATTCCCACTGAGCGGCCATATACAAACATAAATACACATCATTCGTAATCTGTCTTCACCAACGTAGGTAACCTGCATTCATACATACACTTCCGTAAATAATTTCAGAACTGTAAATTTACATTCTGCAGGTCTGCATTGTGCATTGCTTGCTGGTATGTCTCAAACTAAGGACTCAAGGACAGATGAGTTTTAGGGATAAAGCTTAGTTCGCTTTAGAATTTTCCAGAGTCAAAAAAGCTCTAGGATCGTTGATTGTACCATAATTACCTTGCTCCCATTAGTGCTGCAACCTAATCCTATTTCTTGTATAGGCGTTCCTGATGAGGTTATTAAGAGAGCAGCCTTTGTTTTGGATGCTATGGAGAATCATAAGCATGTTGAGCGGCTGCACAATGAGAATTTATCCGCTCAAGATAAGCTATACCAGGTGTTTTATGACTTGAAATTTTCCTTGGGTTGTGGTTATTTGTGTAGTTTGCACTATTAATGAAGCCTTGCAAGCTACTTTGAACTATACACAGGATGCCGTCGACAAGTTGCTAAGACTTGATGTTAACAAGTGTGATCTTAGCCGTTTCTTTCAGGACATATTTAGTTCTTAATCGAACGTTTAAGGTAATCCTGTTTTGCTCTCTACCCACATACACACACATATCTTAGTTAAATTACAACTTTAAATCCTAAACTACTTATATTTCATTATTATATTTCTTTAGTTTTGAAGTTTGGAAAGTTTCAATTAGGTTGTAGAACTATTATTACTGTTATTTAAATATTGACATAGCAACATGTTATGACTTAGGTTGATGCGACTAGACTGATTGGATAAATAGGACAAACGTGCATGGAAGATTTTAAATCAATATTTGTAATTTGTTAACACTTGTTTTAACGTTGGTCTTCTTGCATGCATCACATATGCCAAATGGTCGTTTTTCAATCAATGTTTCATGTTCATGTTTAAGTGATTGAGTTATATATTAGAATTTATTAGAATCAAAATTAATGAAGGTTTACTTAAAATTGATTTTTTTTAATTGAAGGACCAAATTGATACAACTATTTTTTTTTATTGAATTAATTGATACAACTATTAAAATGTGACGGACTAAATTTGTAATTTAACTATTATTTTTATTTCTGAACAGTTTGCAATTGCAGCCTTGGTTGGCAGAAGATATCTGCCCCCCTAGTGGAGGTAATACAGACAGACAAGGGGCATTTGTTTGACTCAAGATCATTTTTCATGCATCTTTATCATTCAAAAAGAAGAAAAAGGAAAAAAAAAGTTCAATATATAAAATTTTAATGGATAAACTAAATGGAGTTAAAACTATAATAGCAAAACAAGGCAAAATGACATGACGTTTGGAATCTATTGATAATTATCCAATTGAATTAGAATTTTAATCGAGGCTTGGCAGCTTCTTTTTTCAATACAACAATGGCTAGGAATCGAACATTTGACTTTAAATGAG

mRNA sequence

ATGAATGACGTGATGTCTGAGGCTCCTACAGTGAAGCTTGTGAAGAGTTCGATTTTCAGCTACGAACAGGCCTGGCACAGGTTCTCTGTATTTGGCATGATGAATAAGAAATTCAATTCCCCAAGCTCAACATATTCTTCTGGTGATTGGACCGCATTCTTGAAGGTTATGGGCGTCCTGGATGTTAGTAGAAGCAAAGAGAAGTCATATGAGACAATTGTGAAGGAAGGAAGCTTTGTTCCGGCAGATGCTGCAACCGTAGGCGTTCCTGATGAGGTTATTAAGAGAGCAGCCTTTGTTTTGGATGCTATGGAGAATCATAAGCATGTTGAGCGGCTGCACAATGAGAATTTATCCGCTCAAGATAAGCTATACCAGGATGCCGTCGACAAGTTGCTAAGACTTGATGTTAACAAGTGTGATCTTAGCCGTTTCTTTCAGGACATATTTAGTTCTTAATCGAACGTTTAAGTTTGCAATTGCAGCCTTGGTTGGCAGAAGATATCTGCCCCCCTAGTGGAGGTAATACAGACAGACAAGGGGCATTTGTTTGACTCAAGATCATTTTTCATGCATCTTTATCATTCAAAAAGAAGAAAAAGGAAAAAAAAAGTTCAATATATAAAATTTTAATGGATAAACTAAATGGAGTTAAAACTATAATAGCAAAACAAGGCAAAATGACATGACGTTTGGAATCTATTGATAATTATCCAATTGAATTAGAATTTTAATCGAGGCTTGGCAGCTTCTTTTTTCAATACAACAATGGCTAGGAATCGAACATTTGACTTTAAATGAG

Coding sequence (CDS)

ATGAATGACGTGATGTCTGAGGCTCCTACAGTGAAGCTTGTGAAGAGTTCGATTTTCAGCTACGAACAGGCCTGGCACAGGTTCTCTGTATTTGGCATGATGAATAAGAAATTCAATTCCCCAAGCTCAACATATTCTTCTGGTGATTGGACCGCATTCTTGAAGGTTATGGGCGTCCTGGATGTTAGTAGAAGCAAAGAGAAGTCATATGAGACAATTGTGAAGGAAGGAAGCTTTGTTCCGGCAGATGCTGCAACCGTAGGCGTTCCTGATGAGGTTATTAAGAGAGCAGCCTTTGTTTTGGATGCTATGGAGAATCATAAGCATGTTGAGCGGCTGCACAATGAGAATTTATCCGCTCAAGATAAGCTATACCAGGATGCCGTCGACAAGTTGCTAAGACTTGATGTTAACAAGTGTGATCTTAGCCGTTTCTTTCAGGACATATTTAGTTCTTAA

Protein sequence

MNDVMSEAPTVKLVKSSIFSYEQAWHRFSVFGMMNKKFNSPSSTYSSGDWTAFLKVMGVLDVSRSKEKSYETIVKEGSFVPADAATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLSRFFQDIFSS
Homology
BLAST of Lsi05G005470 vs. ExPASy Swiss-Prot
Match: F4JEP5 (DNA mismatch repair protein MSH5 OS=Arabidopsis thaliana OX=3702 GN=MSH5 PE=2 SV=1)

HSP 1 Score: 77.4 bits (189), Expect = 1.5e-13
Identity = 36/69 (52.17%), Postives = 53/69 (76.81%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVP+EV+KRAA VLDA E++ +V++L  + +S+QD+ ++DAVDK   LD++K D+ 
Sbjct: 739 ALLAGVPEEVVKRAAIVLDAFESNNNVDKLSLDKISSQDQAFKDAVDKFAELDISKGDIH 798

Query: 144 RFFQDIFSS 153
            FFQDIF+S
Sbjct: 799 AFFQDIFTS 807


HSP 2 Score: 41.2 bits (95), Expect = 1.2e-02
Identity = 19/26 (73.08%), Postives = 19/26 (73.08%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           ND   E   VKLVKSS FSYEQAWHR
Sbjct: 81  NDGTDETTMVKLVKSSTFSYEQAWHR 106

BLAST of Lsi05G005470 vs. ExPASy Swiss-Prot
Match: Q6L4V0 (DNA mismatch repair protein MSH5 OS=Oryza sativa subsp. japonica OX=39947 GN=MSH5 PE=2 SV=1)

HSP 1 Score: 45.4 bits (106), Expect = 6.5e-04
Identity = 20/26 (76.92%), Postives = 21/26 (80.77%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           ND   EAP VKL+KSS FSYEQAWHR
Sbjct: 86  NDCNDEAPAVKLMKSSTFSYEQAWHR 111

BLAST of Lsi05G005470 vs. ExPASy TrEMBL
Match: A0A6J1L1D5 (DNA mismatch repair protein MSH5 isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111500234 PE=4 SV=1)

HSP 1 Score: 50.4 bits (119), Expect = 7.5e-03
Identity = 23/26 (88.46%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D +SEAPTVKLVKSSIFSYEQAWHR
Sbjct: 99  SDGISEAPTVKLVKSSIFSYEQAWHR 124

BLAST of Lsi05G005470 vs. NCBI nr
Match: KAE8650117.1 (hypothetical protein Csa_010033 [Cucumis sativus])

HSP 1 Score: 128.6 bits (322), Expect = 4.4e-26
Identity = 64/69 (92.75%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 507 ALLAGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLG 566

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 567 RFFQDIFLS 575

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_004149586.1 (DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737823.1 DNA mismatch repair protein MSH5 [Cucumis sativus])

HSP 1 Score: 128.6 bits (322), Expect = 4.4e-26
Identity = 64/69 (92.75%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLG 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_004149586.1 (DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737823.1 DNA mismatch repair protein MSH5 [Cucumis sativus])

HSP 1 Score: 52.0 bits (123), Expect = 5.3e-03
Identity = 24/26 (92.31%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MSEAPTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSEAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.9 bits (315), Expect = 2.9e-25
Identity = 62/69 (89.86%), Postives = 63/69 (91.30%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAM+NHKHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDL 
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMDNHKHVERLHNENLSTQDKLYQDAVDKLLRLDVNKCDLG 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_008449117.1 (PREDICTED: DNA mismatch repair protein MSH5 [Cucumis melo])

HSP 1 Score: 50.8 bits (120), Expect = 1.2e-02
Identity = 23/26 (88.46%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MS+APTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSDAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.9 bits (315), Expect = 2.9e-25
Identity = 63/69 (91.30%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMEN+KHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDLS
Sbjct: 739 ALLAGVPDEVIKRAAFVLDAMENNKHVERLHNENLSVQDKLYQDAVDKLLRLDVNKCDLS 798

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 799 RFFQDIFLS 807

BLAST of Lsi05G005470 vs. NCBI nr
Match: XP_038903565.1 (DNA mismatch repair protein MSH5 isoform X2 [Benincasa hispida])

HSP 1 Score: 52.0 bits (123), Expect = 5.3e-03
Identity = 24/26 (92.31%), Postives = 25/26 (96.15%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           +D MSEAPTVKLVKSSIFSYEQAWHR
Sbjct: 81  SDGMSEAPTVKLVKSSIFSYEQAWHR 106


HSP 2 Score: 125.9 bits (315), Expect = 2.9e-25
Identity = 63/69 (91.30%), Postives = 64/69 (92.75%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVPDEVIKRAAFVLDAMEN+KHVERLHNENLS QDKLYQDAVDKLLRLDVNKCDLS
Sbjct: 610 ALLAGVPDEVIKRAAFVLDAMENNKHVERLHNENLSVQDKLYQDAVDKLLRLDVNKCDLS 669

Query: 144 RFFQDIFSS 153
           RFFQDIF S
Sbjct: 670 RFFQDIFLS 678

BLAST of Lsi05G005470 vs. TAIR 10
Match: AT3G20475.1 (MUTS-homologue 5 )

HSP 1 Score: 77.4 bits (189), Expect = 1.1e-14
Identity = 36/69 (52.17%), Postives = 53/69 (76.81%), Query Frame = 0

Query: 84  AATVGVPDEVIKRAAFVLDAMENHKHVERLHNENLSAQDKLYQDAVDKLLRLDVNKCDLS 143
           A   GVP+EV+KRAA VLDA E++ +V++L  + +S+QD+ ++DAVDK   LD++K D+ 
Sbjct: 739 ALLAGVPEEVVKRAAIVLDAFESNNNVDKLSLDKISSQDQAFKDAVDKFAELDISKGDIH 798

Query: 144 RFFQDIFSS 153
            FFQDIF+S
Sbjct: 799 AFFQDIFTS 807


HSP 2 Score: 43.9 bits (102), Expect = 1.3e-04
Identity = 40/132 (30.30%), Postives = 52/132 (39.39%), Query Frame = 0

Query: 36  KKFNSPSSTYSSGDWTAFLK---------------------------------------- 95
           KKFNSP+S  +S DWTAFLK                                        
Sbjct: 281 KKFNSPTSLCTSNDWTAFLKSISALLHVNKIFEVGVSESLREHMRRFNLDIIEKAGLCIS 340

Query: 96  ---------VMGVLDVSRSKEKSYETIVKEGSFVPADAATVGVPDEVIKRAAFVLDAMEN 119
                    V+GV+DV+RSKE+ Y+T+VKEG     D   +    E +      + AME 
Sbjct: 341 TELDYVYELVIGVIDVTRSKERGYQTLVKEGFCAELD--ELRQIYEELPEFLQEVSAME- 400


HSP 3 Score: 41.2 bits (95), Expect = 8.7e-04
Identity = 19/26 (73.08%), Postives = 19/26 (73.08%), Query Frame = 0

Query: 2   NDVMSEAPTVKLVKSSIFSYEQAWHR 28
           ND   E   VKLVKSS FSYEQAWHR
Sbjct: 81  NDGTDETTMVKLVKSSTFSYEQAWHR 106

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
F4JEP51.5e-1352.17DNA mismatch repair protein MSH5 OS=Arabidopsis thaliana OX=3702 GN=MSH5 PE=2 SV... [more]
Q6L4V06.5e-0476.92DNA mismatch repair protein MSH5 OS=Oryza sativa subsp. japonica OX=39947 GN=MSH... [more]
Match NameE-valueIdentityDescription
A0A6J1L1D57.5e-0388.46DNA mismatch repair protein MSH5 isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC11... [more]

Pages

Match NameE-valueIdentityDescription
KAE8650117.14.4e-2692.75hypothetical protein Csa_010033 [Cucumis sativus][more]
XP_004149586.14.4e-2692.75DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch ... [more]
XP_004149586.15.3e-0392.31DNA mismatch repair protein MSH5 [Cucumis sativus] >XP_031737822.1 DNA mismatch ... [more]
XP_008449117.11.2e-0288.46PREDICTED: DNA mismatch repair protein MSH5 [Cucumis melo][more]
XP_038903565.15.3e-0392.31DNA mismatch repair protein MSH5 isoform X2 [Benincasa hispida][more]
Match NameE-valueIdentityDescription
AT3G20475.11.1e-1452.17MUTS-homologue 5 [more]
Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Lsi05G005470.1Lsi05G005470.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0051026 chiasma assembly
biological_process GO:0010777 meiotic mismatch repair involved in reciprocal meiotic recombination
cellular_component GO:0000794 condensed nuclear chromosome
cellular_component GO:0043073 germ cell nucleus
molecular_function GO:0005524 ATP binding
molecular_function GO:0030983 mismatched DNA binding