CmaCh06G010660 (gene) Cucurbita maxima (Rimu) v1.1

Overview
NameCmaCh06G010660
Typegene
OrganismCucurbita maxima (Cucurbita maxima (Rimu) v1.1)
Descriptionmediator of RNA polymerase II transcription subunit 12-like
LocationCma_Chr06: 7158249 .. 7175836 (-)
RNA-Seq ExpressionCmaCh06G010660
SyntenyCmaCh06G010660
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideexonCDSthree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGCTAGCTCCATAACCATGGCTTTTCTGGCCTTCCGTGCTCGTTCTAGTCGTCGAACTACTAATGCCTTCGACGGAGAAGGTTTAAAAGTTTGGTCGTAGCTGAAACACAGAGTTTGGTCCTTCATATCTGTCTTTTACAGCTGACATATATCATCTGCGGGATCGGGAACGAGATTCGTATAGTTATCGTATTGTAGGTGGCGCCATCCTTTGTAGATCTTGTAGAGTTTCGTGTGTTATATTAGTCGAGGAAGTCGATATCGTGTGGTTTGATTCATTGATTTTTCTCTTTTCTTTTCTGGTTTCGGTTGTGAGAATTGCTCCTTTTTTCTTATAAGTATGTAATAAAGTGCGTTCCCTTTTCATGCAGTCGAGATTTGAACGGTAACCAATAAGGATTCAAACATCTAACTAGTTCAGATATTTTTGATTTAATAAGATTTGGTCGGTTTTATTAGGATGTTTGAATTTGTTGGTTTGGTTAGTTCAAATTTTGCTATTTGTTTTTCACGTTCATCTAACCTTCGATAACCCACAACGTTTTCGAGAAAAAAATTAAAAAAAGTGACGGAGATGGTGTGATGTGTGATGTCCCACGTTAGTTAGGTAAGAGAACAAACTACCATTTATAAGGGTTTGTAAACCTTCCCCTTGTTGATACGTTTTAAAGCTTTGAGTGGAAGCCCGAATGGAAAAGCCCAAAAAAGACAATATTTGCTAGCAGTGGATCTAGCCGTTACAAATGGTATCAGAGCCTCACATCAGACGATGTGCCAGCCTTCTCGTTCTTCCTCGAAGGGGGTAGACACAAGACAGCGTGCCGGTAAGAACGCTGGGCTCCAAAGGGGTGGATTTGGGGGCATTCCACATCGATTGGAGGAAGGAAAGAGTGACAGCGAGGATGTTGGGCCCCAGAGGGGAAGGAGAATAAACCACCATTTATAAGGCCGTGGAAACCTTCCCCTAGCAGACTCGTTTTAAAGCCTTGAGGAGAAGCTCGAAACGGAGAGCAGCCCAAACAGGATAATATATGTTTTCCCCTTAGCAGACGCGTTTTAAAAGTCTTGAGGAGAAGCCTGAAAGGGAAAGCTCAAATAAGACAATATCTGCTAACGATGGATCTGACCCGTTACAGACGGGGAAGAGGACGAAGAAGGCTTCTCCATTCCCGCTCCTTCTCGTGGGCATTTCAAAATATACCCGTTTGATGCTAATTTTGACTAAAAACCATATTTGTTAATTTGTTTGTCTATTAAACTTGGGGGTTTATTAATGGCTTTACCTTTTTTCTACTCCAAATTTGTTAATTTGTTTGTCTATTAAACTTGGGGGTTTATTAATGGCTTTACCTTTTTTCTACTCCAAATTTGGAAGTTAGCTTACAAATTCATTAATACTCTTTACTTTTTTACCTTTTTATGTCATTTTTTTGTCTATATCTGCAACACATGCAAACTAGCAAAGGAAATTAGTTATCCTTAACAACCTTTCATTTTTTGTCTATATCTGCAACACATGCAAACTAGCAAAGGAAATTAGTTATCCTTAACAACCTTTCAAATTGTATTGGTGACTTACAATTATATATGTAATAATTTAGTTTTTTTAATTTATAATAAAATAATTTCCATTTTTTTTAATAAAAAATTAAGTGTCGTTTCTATATTCGTAGTTTATAAACGTATCAGAGCCCTAATTAGTTTATCGATCTATGTAAATAAATTAATTATTATAAATTTTAAATGACATAAAACTAAATTTGTACGTAATAAAATGCTTATATTTTGCTCGTATTTTTATTACGTAATTTGAGAATTTCGAATTAATAACTTTTAAACGCAATCGACCAACTTGGTAGTGGACAACTTACCTACCTTTTATCATGTTGTCGTATAGCTCTACGATATATCAATGCATGCACTATTACTGTTCCCTCGTACGTGCTCGTTTTGTATTAAAGTCACTATTGCAAACCTAACAATAATTTTAGTTGGTTGCAGTGATTTTATTGCTAATATTTTGCTCGTATCTTTATATACGTAATTTGAGAATTTCTAATTAATAACTTTTAAACGCATTCGATCAACTTGGTAATGGACAACTTACATACCTTTTATCGTGTTGTCGTATAGCTCTACGACATATTAATGCATGCACTATTACTGTTACCTCGTATACGCTTGTTTTGTATTAAAGTAACGATTAGATAACTCATCGTACACGCTCGTTTTTCTTACACTTCCTCATCGCATTAAATAATAAAATTTTGTTGCACAAAAATTTGGGATATTTGCAAAATAGCCCCAATCCCCATGCTTGAATGACTTTGGAAGTGGGCATTTTAGCAAGAAGATTTAGTAAAAGTGGATATAAACTAAATAAATAAAAATAAATTTATTTCTTATTAATTACGAGATCACCCCCAGTCTTTCCATTATTCCAACACCGGGGTAGCCAGAGGCGTCGTCGTCGTCGTCACCAGCATTAAGCTGAAGAGTCAAAGCCTTCAAGGTCCGACACCCTTCTTCTTCCTTCACGAATTCCTCCATTTATCTGCTCTGGAAACTGCTTGCAAGTTTTTTTTTTTTTTCCTTTTCCTTTTGGCGTCCATTAATGGCTTCAAAATCTCGTACAGTTGCGTTCTCCAAGTGAAATCCCAATATTGTATTTTTATATTTTTTCTTCCATTCTCTCCTTATTCGTTTATATCTTCTGAATCGTGTAGAAAACCCTTGCTCCACTGCGTACTTGTACCTAATTAGTCACTCCCAGAAGAACCGGCTTGCTGCGTCGAATTCGGGATCAGGTTTTTCCCTAAACCCTAGTTTCCGTTGGGGCGTTTTTATTTCCAAATTGTGTTATTTGATTTGATGCTTTTAGAATTTTAGTTCAGATCACGCATAATTGCCCTTGAAATTTAGGGTTTATAGTAGTTCGTTCTGAACTGTTAATGAGCTTAGTTTTGTTTCATGTATTTGAGCGTAGTCTTCTATATTAATCATTACGAGGGTTCTCCGAGCTGATTAGAGCTTTTTTGGGGTTCATATTTAGTATGGCTTTGCCAACAAACTTCGAAGTATAGGCATCACCTTGGCTCGTACTTCAAGAGATACGGTATTCATCTCCGACTTCAATGTGTTATGCTGACCGTAGTTTACTCTGTTCAGTCCTGGGGAATGTATGTTATATCAAGCATTGTTTCTCTACGCCTGTTATAAATTTGAATAATCTTCGGGTCACATGACTTATTTGAGATTAAAATTTAAACTGCAATCTTATGGACTGCAAATTTAGATGGATGCGATGTTGGTTGTAAACTTTGACAAGACATGTTAAATGTAATTGAACTATATAAACTTGAGTTTCGTTGTGATAGTCCTTGACAAGATATGTTAAATTCTGGAACTGGGTTTGTTGCACATTGAAATGTGCAATCATCAAGCAGAATTTGTGACTCGTGTTGTTTATTTCACACTGCCGCTGTATATTTTCACAATGTTTTATCACCACAAAACTTTTATTCCTAAGATTGTTTGCAATTCGTTTCTGATTCCTTGGATTCAACTTCATACAAAATGGACAAGATCTTGAATCTCTGAACGTGTATCTTCAGTTTATGTCTTTTTGTTATTGTTTGAAATTGACTAGCTTTTGAATTGCTCGGTTGGACTTGTATGGCTAAAGAATTTGCAACGGGATCTTACACCTGTTCTTCACCCGATAGAACTAAGTTACAAGCACGCAATTTGAATGTGGTCTGTTTGGCACAGCTTTATATAGCAGACCGATGCTGACGGAAGTATGCAGTTGATGGTTGGGAGATATGCAAAGGTATCATCCTGCCAGCTGCACTAGTGCAGTTAATAATAGTGCAATAGGTGGGCCATCAGCAAGGGATGCAATCCGAGCTGATTCTTCTTCATTGCCAGCCAATTTTCCTTTAAATTCCAGGTAAAGAGATTTATAGATTCTGTGAAACTGGGGATTTTTTTTTTTGGCGATAAGGATTCTGTAGCCTTTTTTATATATAGTTCTTCCTGTAACGTTTCCTTTTTTGTTCTCTGTGCAGTTTAGTTACTTTTTTTTAAGGCATGTAGTAGTTAAGAGTTTTTTACTTCATCAGTCTGCAACTTTGTTAACTGCTGTATTGTGGTCTGAGACATGTACATTTTATTCAGGGAAAACTGCAAACTCTCCATTTCAAGTTCCCCCATTAGCTAATTACGATGCTGTCCTGAATTTTTTTTCTAATTTTGTCAGATGTATCTTTAAGGCTGTAAGTCTCTGTAGTTGTCGTAAGTTATGCCATGCTGTTAGAACTATGAACTTTGAAATGTTGAGATAAAATTGAAGCAGCTGAAAAGTAAAAGAAATAGACAATGGTTTGATCTATGATTTGAGGAAATTGAGTGGTTTGAGAAAATTAAGGAAATAAAAAGAAGTGAGATATGGACTAACTTTTTTGTTTTGGTTTTATTTTTGGATCGTCCCCTTTCATTTTTGTCTTGTGCTGTTTTATTATCATTATTATTCTTGTTGTTGGCTTGTTTATTTAATAATTTTCTCATGAAAGTATTATTATTAATTATTTAATTATTATTATTTTTTTTTGTAAAAGACAATGATAAAAGTTAGCCCTTGTTGTGTAATGGTATGACTATCAAACTAAAAGGAGTATATATGTTATGACTACCAAACTAAAAGGATTATATAGTTATCTTCCCAAATAGTTTTTGGGTTGCATTTGAAATTCTCCCGTACTATATAAATGAGAGCAATTTATTGCATTTGATTTCTCAAATGTTTGTTGCTTACAAGATTATGAGCAGCCGGTGGGATTAATGGCTTGCTTGCTGTTTAATTTTTTCTATTTCTGGGAGGATATGCTGATTTACCTATTCTTCGGTACTCTTCTTTTTCACCTTGAATTTATCTCTCCCGAAATCAACTGAATATTTCTTGATTTGCAGGCGGCCAGCTCCACTTGCACCATACAAGTTGAAGTGCGAGAAGGAGGCTTTAAGTAATCGGTATTGGTTTGCAATATTTTCTTTTTACCAACTTCTTGTTTCATTTCATGCCAATAATTTGTAAGTTCGTTTTCTAAATATTTGTGTGATCTGATTTACATCATGGGTTGAATGAAATTTAATTGTTTTCTTTTCAGTTTTAAAGTTTTATAGAACATTTTGAGTGCTCGATTGATTGCATCTATATGGATTTGCTATTCTTTTCCTGGGTAGTATTTTTTTTTCTCACACAATGCTTTGTTCTCTGTCAATCTTAGGTTAGGGCCTCCTGACTATTACCCTCAAACTCCTAGCTGTCCCGAGGAGAACCTCACTAGAGAGTATGCGCAGTCTGGATACAAAGAGACTGTCGAAGGGCTTGAGGTACATCTTTCTTATCAGCAGCTTTTAGATTGAGTTTGTGTAATCGTATTTTCTTTCTGGTTTGGTGAAGTTTAATGTATTACCTTAGCGAATATAAGCAATTCAATTGAACACACATTTTGGAGGTTCTAATGATGCACTTCAATATGTTTTCTCCTCGTCCCATTAGCTTTCCTTACACTCATTCATGTGCTTGATTCACTTGACAAATATCTTTCCTTCATGGATGAAAATTTTAAATTTTATCTAGATTGTGCTCTTGTTCATGTAATAAAATTATTTGAGTTTAGAGCTTGACCAACTTGATCAAGTTTGTAATTACCATTGGATGAACATATTTTGACTATTCTACATGTAATAAAATTATTTGAGTTTAGAGCTTGACCAACTTGATCAAGTTTGTAATTACCATTGGATGAACATATTTTGACTATTCTAACATATTTTGACTATTCTACATGTAATAAAATTATTTGAGTTTAGAGCTTGACCAACTTGATCAAGTTTGTAATTACTATTGGATGAACATATTTTGACTATTCTAACCAACCTCTTCTTTGTATTGAGTGCTTGTTTGACTTATGTTTATAACAATATAAGCAATTTAACCTTTTCCCTATTTTGTTTTCTAATTCATCAAAACATTTCTGTTTGTAATAGATTATGTTTCTTGGAAAAAAAAAAAAAAAGATTATGCAATTTATTTGTCTTTGTTGAGTGTGTCAGGAGGCCAGAGAAATCTTATTGACTCAGGTTCAAGCATTTTCTAAGCATCTCGTCATCAAGTGCAAGGATGTATGTTACTCGAATCAATAGCTACCAAATTCCCCCCACCCCCCATGTTGCATACTTGTAAAATTTTATTTCTGCTAATAATTTTAATTCTTATGGATTTTAAGGTGATCAATTGGTTAGATGTGCAGTAAGAAACTTATTTGTCTTTCTCTGCAGGCTATAAGAAAACGTCTGAGGGCCATAAATGATTCACGTGCTCAGAAGCGGAAGGTGAAACTTTCTTCCTTCATTATTTAGTAAGGATTTTCTAACCATCCATTTGTTAACCTCATTCTAATTTTTTCTTTCGTTATTATATGACAGGCTGGTCAAGTTTATGGTGTTCCCCTATCTGTTTCTTTATTAACAAAGCCTGGCATCTTTCCCGAACAAAAACCTTGTAGTGAAGATTTTCGGAAAAAGTGGATTGAGGTACTCCTTCCTTCTGCATAGAAGAAAATAAAGGGATATTGAAAATTGATTTTAGCTACCTATACTTTTCTAATGGTTAGAGCAAAATTTTTATAAATTTCATGTTATGACTTAGTTCACCTTTTTTGGGGAGTATCTTTTCTCTTTCTTCAATTGCTATACATTGAATAGTAGAGAGGTAGTTCTTTTCTGATTTGTCCATGGGTGATGTATAGCTGTATGAGTAACCACGTGAAAGCATGTAGGAGTGGGGTATTTTCACATGCACGATTCTATGTCAAGAACACACACACACATATTAGTTAACGAAGTGGGGGTGGGGGGGGGGGGGGGGGANNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNNGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGGTGAAAGTAAAAGGGAATTTCCATTCTCTCATTTGGTATACTTCAATCGACAACATTCTCTTTTAAGAAATTAAAATTTCCATTTCATCTGTTTTAGCTATTAATTGAGTGATACTTCAACATGGTATTAGGATAGGATGGGTTTGGACACATGTAGCGTCATTTTCCTCCCCAATTAAACTGATAGTTACTTGTTAGGACTTATGCCAATTTCCAAGCCATTAGGCCAAGTTTAATTGAAAGTTGATTAGTAGAATGAAGAGCAACTACTGAATTACAAAGTATCAACAGCCTAATATTCGAATATGATCGCCTTTGATTCATTGAATTCTTTATTCTTTTTCTTGATTTAATCACTCTATACACCCTCTTGGTCCAACCCAGACGCTCATAAAGATCCTTTTCCAAACCTGCTCCGGTTGTTTCAAGTCGAGAGATAGATAAATACATGCATCCTATTGCACTGATTAGTGTTGTTCATAGTGACCAGGGGGTTTGGCAACTAAGAAGTGAGTTATTATCAGCCAAATGTTCTCCAAAATATGGACCATAAATAAATATTGATTAAGCAACCCATGCATAATATTGTGAATTTTTTTTTGCCGCTACCAAGTATCAGCAAGAATTACTACAGAAAACATATAAAATTGTTTGCCCATGTGGTGAGGGGAGTTAAGAAATTAATTTTATCATAATCAAACCAGTGCCTGTTGTTGCATGAGATGTTATTATACTAGGTGCTAAAGCATGGTGTTTTGTATCAATTGAGCAAAGAGGGTTGTCATTGTGTAGCGGTATTTGAATACATATCTTGAGGACGACCTACAGCACTCATGTTATCATTATGAATATACAAACCAAAACAGGGAACACCTAAAAATATACACACCCAATTGAGATGTGATATGATTGCATCACGATGTCTAAGTATACAATTTAAAATATTGTTGTAGCGAGTAGTTGGATCAAAATCTTGTACCATAAAAATGGCTGCATGCTCAGCAACACAGACTATATCCACCAATCGACATGCGATGTGTGAACAATGAAAGTTATGTACCATAGTCGATAGTTAGATGTGGATAAGGGGGTATCAAATAGATATGGTGAGCTACAGTAATGGTTTAAGAGCCCAACATAGCTAGGTCAAGGGATAATTGAACACACGGTGACATTGTTAAATTGAACACGCGGTGACACTGTTAGGATCTCATATAGTCCTTCATGGCCCTTGCTTGTAAATGAATCTTTATTTGCTGCTAAACTATCTTTTATACTATAACCAATGCCCTTTTAACTAAAGCTCTTGGGTTGAGTGGTGTTTTAACATTCCTCAAGTTCAACCACTCCTCACTTAATTTGAAACATTATGTCCTCTTGATGCAGGGTTTATCACAACAGCATAAACATTTGCGATCTTTGGCAGATAATGTCCCTCATGGGTATAGGAAAAGGGCTCTTTTTGAAGTTCTCATTAGGAATAATGTCCCATTGCTGAGAGCAACTTGGTTCATTAAAATTACTTATCTTAATCAGGTGAATGTGCTCAAACTTTGTGATGGTCACTTAAACCTAGGTTGACAATTTTGAATGTAGCAGTTTATGGTTTTACATTACAGGTGCGCCCTAATTCTGCTAGTATATCATGTGGAGCATTCGACAAAGCTCAATTATCCCGTACTGAATTTTGGACCAAAGATGTGGTTGACTATTTGGAATGCCTGGTGGAGGAATTTTTTTCAAGAGGCAATTCTCATTTGACTCCACCAAACAAAGACCAGTCTCCGCAAATGTTTTCTGTTGGGCTCTCACATACAAAGGGTGATCCTCCTTCAGCGATCTTTGATGGTGAAGAGCCTTCATTACATTTCAAATGGTGGTATGTGGTTAGGCTATTGCTATGGCATCAAGCTGAAGGGCTTCTGCTTCCCTCTCTCATTGTCGATTGGGTGCTGGGACAATTAGAGGTATTAAATCCTAAAATGATTGGAGAAGAATTTGGAAATATCTTGAGTATTTAGTTTCATCTCTCAAAGATTTTATTTTCCTGTTTGTTTTCTCAGGAAAATGATGTTCTCGAGTTTTTGGAGTTGCTGCTGCCAATTATTTATGGTGTTTTAGATACAATTGTCCTATCTCAGACCTATGTTCGTACTCTTGTCAGAATTTCTGTTCGGTTTATCCGAGATTCTTTTCCTGGTGGGTCAGATCTAGTAGATAATTCAAGGAGAGCATACACAACATCTGCTTTGGTGGAAATGGTTCGCTATTTAGTTCTGGCTGTGCCCGACACATTTGTTGCTTTGGATTGCTTCCCATTTCCACCTTGTGTTGTATCACATACGGTTAATGAAGGGAATTTTGGGTCAAAGGTACCTGAAGATGCAACAAAACTGAGATATGCTTCAGCAGAAGTTGCCAGTCCCTTCAGAAGTAAAGGGATTGATTTTCAGTATCAATCCTCAGCTTTTGATAATGTTGTTTCATCAATACAGAAGTGTACAGACAGTCTTGCAAAGGCAGTAAACCCTGAATTCCCAGTTTGCAGCGTGGCTAAAGCTGTGCATGCATTGGATAAGTCTCTACTACATGGAGATATTGGAGTAGCTTATAAATATCTTTTTGAAAACTGCTGTAATGGATCCATATGTGAAGCTTGGTTTGAAGAAGTAAACCCGTGTTTAAGAATGCCATTGAAATGGAACCAGACTGTCAATGTGGCATTTGCTTGTTCAGTATTTTTTCTTTGTGAGTGGGCAACATGTGACTACAGGGATTTTTGGAGTGCTGCACCTCGAGAGCTAAAGCTCACTGGTGGGAAGGTTTTCTCTCAGGTTTATATTGCCACTAGACTTCTGAAAATGAAAGCCAGAGATCTTCGAAGTTTATCTGGACGTAAATATGAAAATGCAATTGGACCTAATTCCACCATTGTAAAGGGTTCTAGCCATCAGAACAGTTCATTTGGTAGGAAACCAGTTGGGAATTTACATGAACCAAAAAGTAGGTTGAAAAGGTCGGGAGGTGCTGGTTCTTTAGATTTGTTTGAAAGTCCAGGTCCTTTACATGATATTCTTGTTTGTTGGATTGATCAACATGAAGTGCAAAAAGGAGAAGGTTTTGAGCGTGTTCAGTTTCTCATTGTGGAACTTATACGTGCTGGTATATTTTATCCTCATTTATATGTAAGGCAGCTAATAGTTAGTGGAATTGTGGACTCCAATGGCCCAGCAGTTGCGCCACATAGAAGGAGGAGACACCAACAAATCTTGAAATATTTACCCGGAAGTTTTATTCATGCCACTCTGGATGATGGGAAAATTGCACAAGGAGCACAACTTGTAGACATTATAAATGTCTACTCCAAAGAACGTCGTCTAGTACTTCATGGGCTCGAATGGGAACAAAAAAGTGATATTAGCTGTGCAAATACATCATTAAATCAAAAGCGAAAGATGTGTCCAACCTCCGACAAGGTTTCTAGTTCTGTTACTTCTGTTAACCAATTGAAATCAATTAAGTCAGTGTCCAACATGAGCACTACTAAAAGTGTCATAAGTGAAGTTGACATTGAAGAGCTGAAGGAAGCCATATCATTGCTTTTACGGTTTCCAAACAGTTCGTCAACTCCCACAGATACTGATCTAGATGATACTACAGGGACTGCTAAGAAGTCTTTTGCATCAGTATATGGGAAAATAGATATTGCAGAAGCAACACCTGGGTGTGAAGATTGCAGAAGAGCCAAAAAAAGGAAAGTAAGTGATGAAAAGCCCTTGTACCTTCATGGATCTTCTTCACCAGTCCCATCAGATGACGAAGATGCGTGGTGGGTGAAGAAGGGGCCTAAATCCTCTGAAACATTGAAGGTTGATCCACCGGTAAAGACAACAAAGCCAGTTTTAAAGGGAAGACGCAAGACACAAAGTCTTGCTCATCTAGCTGCGTCTAGGATTGAAGGTAGTCAGGGTGCATCAACGAGTCATCTATGTGATAATAGGGTGGCCTGTCCTCACCATAGATCTGGAATGGAAGGTGATTCTACCAGACCAATAGATGGTAGCAAAATAAATCATGGTGGTGATATTGCTTTTATTGGAAAAAGTTTAAAACGACTTCGACTTACTGAGAAGCGAGCAATTTCAAGTTGGTTTATGACTGCTGTTAAGCAGATTATCGAAGAGACTGAGAAGACTATCACAAAAGCTGGCCAATTTGGTCGGTCCTTAACAGCTGTTGACGATAGGAATACCATACGCTGGAAGTTTGGCGAGGATCAGCTTTCATCCATATTGTATTTAACAGATGTATGTAATGATTTTGTTTCAGGGGTCAAATTTCTCCTCTGGTTGCTGCCAAAAGTCCTTATTAGTTCAAATTCTACCATGAACAGCCGGAGGAGCATTCTACTTTTACCAAGGAATGTAGAAAATCAAGTGTGTGAAGTGGGCGAGGCATATCTATTATCTTCTCTCCGAAGGTGCACTATCTTTTTGCCTTTTGAGTAATGATTTTTCATTATACTTCTAATGACGGTGGGATTTTTGGTGAACTTGCCTACAATAGTTATTATTCTCTCTTAGCATTATTCCATATATTTCTTAATTACTATTGATCTGACTGTATTTTCTTGATCTGCTCCGCCTTCTTCTCTCTGCCTCCTTTCTTCCTGTGACTTCTGGAAATCTATTTTAGACTTCTCTCTTTCTTTCATTGATCATTATACATCATGTAGATACAACTACCATAGGAAATGAGAAACCAAATGTAGATAAAGTTATTTCTGTGATTTAATTTTGAGTCATGTTTCCTTCCTGCAAATACCTCTGGGTGTTGACAAAGCATGTAATTTAGAAGGATTTTATGAGAACTTCTGTTTCTTTCATTTTTTTTTCCAGTTTGTATTTCTGCTTTATGCTTGTAAATTAATAAATACCTGTAGATGATCTATACGCCTGCAATTTTCTACAAAAGTTTAGCTTGTCTAGTTTTCCCCTCCTCTGTTAAGTAATATATGAGACATGAATGTTTTCTGTAGACTTTTGGCTTGTTTAGATAAATCGCGTGCTCTCTCTCTCTATCAATACTTATGCATGCGCGTGTAATATATTGTCGTGGAGGTGCTTTATAAGATATTATGACTGTGGATAAATAACACATAAATCGAGGGCTCACAGACATTCCTCGGGCAAACTTCTGTTTATCTCAATGTCTCTTACCATTGTACTTGCAGGTACGAGAATGTACTTGTTGCAGCTGATCTTATTTCAGAAGCGTTGTCATCTATAGTCCATCGTGCTATGGCTATTATGGCTTCAAATGGCCGTATTTCAGGCTCTGCAGCGGTAATTTATGCTCGACATTTATTGAAAAAATATGGCAGCATACCTAGTGTCGTTGAATGGGAGAAGAGTTTTAAGACAACATGTGACAAGAGACTTATTGCTGAACTTGATCCAGCAAGCTCATTGGATGGAGAGTTGGGGCTTCCACTTGGAGTTCCTGCAGGTGTGGAGGATCTTGATGATTTTTTTAGGCAAAAGATTGGGGGTGGACGACTCTCTAGAGTTGGAATGAGTATGCGAGAACTGGTACAGCGACAAATTGATGATGCCTTTCACTATTTGTTTGGAAAAGATAGGAAAGTCGTTACTGGTGGTGCTTCGAAGGTGCTTGCCTCAGAGAAATCAGATGAGGGATATCAGATAGCTCAAAAAATAATTACAGGATTGATGGAATGCATCAGGCATACAGGTGGTGCTGCTCAGGAAGGTGATCCATCCTTGGTGTCTTCTGCTGTTTCAGCTATTGTTGGTAATCTGGGTTCAACTGTGTCTAAGATGGCTGATTTTATAGCTGGAGGATGCTCGAATTTTCCATCCGCTTCTGGTTCATTGGACTTTGTTAGGCGCATTTTATGCATTCATATTACCTGCCTATGCCTACTCAAGGAAGCTCTAGGAGAACGTCAAAGCCGTGTATTTGAGATTGCGCTTGCAACGGAAGCCTTTTCTGCACTTGCTGGAGTATATTCTCCTGGGAAGCCATCAAGATCTCAGTTTCAATTATTAGCTGATTCCCATGAATCTAACGCTCATGTCTTTGGTGATAGCACCAAAGTAATAGGTAGAGCCACAAAAATTGCAGCAGCTATTTCTGCACTTGTCATTGGGGCAGTTATTCAGGGGGTTTGTAGTCTTGAACGGCTGGTAACACTCTTTAGGTTAAAAGAAGGATTAGATTTTATTCAGTTTGTTAGAACTACTAGGTCAAATGCAAATGGCAACACTCGTACAATGGGAATGCATAAGATTGAAAGTTCCATAGAGGATTATGTACATTGGTTTAGGTTGCTTGTTGGAAATTGCAGAACTGTGTTTGATGGGTTGATTGTGGAGCTACTAGGTGAGCCGTCTATTGTGGCACTTTTTAGAATGCAACGGTTGCTTCCACTTAGCTTGGTCCTATCTCCTGCCTATTCAATATTCTCATTTGTTGTATGGCGCCCTTTTATCCAGAATGCTGCTTTTACTGCTCGTGAAGATGTGAATCAACTGTGTCAATCTTTAACAATCGCAATTGGTGATATTGTAAGACATTTGCCTTTTCGGGATGTTTGTTTTAGGGATAGTCAGGGTTTCTATAACCATTTGATGAACGATACCAGTGATGTAGAATTTGCTGCTATACTGGAGTTGAATGATATTCCCTTGAAGCCCATGGCCTTTGTTCCTCTACGTGCAAGGCTATTCTTGAATACTATTATTGATTGTAAGTTGCCAAGTTCTGTGTACAATCAAGATGATGGGAGTAGGATTTCGGGAGTTGGTGATAGTAAAGGTCATTATTCTGAGAGAAAAATGAAGTTGCTGGACAGGCTTGTATATGTTTTGGATACCTTACAACCTGCAAAATTTCATTGGCAGTGGGTGGAACTTAGGCTTCTTTTGAATGAACAAGCCCTTATCGAGAAACTTGAGACACTTGAGACACGAGATCTGTCCTTAGCTGATGCTGTTCGTTTGTCGTCACCAAGTCCTGAAAAAGTAGCTGCTTCTGATAATGAGAAGAATTTTATTGAGATTATTCTTACAAGGTTGTTGGTCAGGCCTGATGCTGCACCTCTTTTCTCAGATGTGATTCATCTTTTTGGCAGGTCTCTTGAAGATTCAATGTTGTTGCAAGCCAAATGGTTTCTTGGAGGTCAAGATGTCCTATTTGGAAGGAAATCAATACGACAGAGACTAACTAATATTGCCGAGAGTAAAGGTCTATCGACTAAAACCATGTTTTGGAAGCCTTGGGTTTGGTGTATTTCTGGCTCGGATTCTTCTTATCTTGAAGAAGGAGAGGTTGTTGAAGAAGGCACAGATTCTAGCAAGTATAGCCAAAAGTCTGTTGAATTGCTTGACAACGAAGTCTTGCATTCCAGTCAGCAACATGTGACCGAGAGGGCTCTTATTGAATTAGTTCTTCCATGCATAGATCAGAGTTCTGAAGAATCACGCAACACCTTTGCTAATGATTTAATCAAGCAGTTGAATAATATTGAGCAACAAATAAATGCAGTTACTTCAGGGTCAAGTAAACAAACAGGACTTGTTCCCTCAGGGATAGAGGGCCCTACGAGCAAAGGAAGTAATCGCAAAATGAAAGGAGGCAGTCCTGGATTAGCTAGACGTTCAACAGGCTCAACAGATTCTCCTCTACCCTCACCTGCAGCTTTGCGAGCATCAATGTCATTGCGTTTACAATTAATATTGAGGTTACTTCCGGTCATCCTCGAAGATAGGTAAATTTAGGAGTAATATTGGGATTACTCCCTGCTATACTAACTATTTTGATAATGCCAATTCTTTTTTATGCCTTATTTGTTAACATTACATATTGTTTGCATTTCTCAACTCACTGTCTATAAATGCTTTTCTTGCCGCTGCTTCATTATGGTTTTTCATGGTTCACTAGAGTCTGCAGCACTGATTACATTCTGAATTTTCCAGCATTCAAGTTAAGTTCTAGTTTTTCTAAAAAAAATAAATAAATAAATAAATAAAAAATCCATTTGCAGGGAGCCATCAGGACGGAACATGAGGCATATGCTTGCCTCTGTCATCCTTCGTCTTCTTGGCAGTCGAATAGTTCACGAGGATGCAAACCTTACCTTTTGTCCCACCCATAGTTCGATGGTAAAGAAGGAAGTAGAGTCATCTTCCGAAGCGTCACTTGCTATATTTGCAGACCTACCAGGTGAAAGTCTTTTTGGTAGTATGTTATTGATTCTACATGGGCTATTGAGCAGTTGCCAGCCAAGTTGGCTAGGTTTGAAAACTGCTGCTAAGTCGACCAATGAAACAAGCAAGGATTCTACTGCTCTTGTTCGTGAACTGGCTGAAAGTTTACAGGTTAGCCATCAACCTTAGTCTTCACATTTTCACAAATAACTTTTTACTCTCATAACAGAAACAGAAAAAGCATAGGGTGAAAGGTAGCAATAATTACACAATAGACTCTTCAAATATTCAATTGTTTCTAGTTCAATTTTTTTTATCCATTATATTGAACCACTTGTTTTTTCGTTCATCAACTCTAACATTTCTGGAAGGAGGGCTAGATATTTGTTTTAGTCACCATGTGAGAATATTATCAGCTTAGTAGGTTGCTGTATCGATATGCCAGATCATTCTTTTGACCCTTGGAATGGAAGATGGGACAAAATGTTTCTTTTACAGAGGAAACTCTTGTATTTTGTTTCTGTTGACGGAGTGAAAAAGGGCACGATATCATAGTTGTCTACTAGCCCCACAATATTGATAACTAGCATTAGCTGTTTCAATGTCACTAGATGTGCACGCCGGTAATTCAACTTAATATAGAATTAAACGTCATATTGATAAACTATCGACACTAATAGTGCAAATGTCAATCTTTGTCGGATTCTAAAAGAGTAATACTCTGATCCTGTATCAAGGCAAAATATTATATGGATGTTTCTTTTCAATCTGGTACTTGAAGGAAATATAATATCATCCTTACGAGTTGTTTTGAATTAATTTGTTGACAGAATGAATTGCACCACATGCAACTACCTGATATGATTAGATGGCGCATCCAAGCTGCAATGCCCATTCCACTTCCTTCTGCTCGGTGCCTTTTATCTTACCAGCCACCAACAACATCTCCTTCTGCCCTTTATCCATTTCAATCCAGAAGTTCCACACCTGGACTTGGTTCTGGAAATAGTAGCATGCCTCAAGGGAGCAAAGTAGCGTCACCAAGGGTTGTGCCTAATGCTCCTGGGAAGTCGAAACATTTGCCACCGCAGCAGGATTATGATACAGAAATTGACCCTTGGTTGCTTCTAGAAGATGGTGCTGGATCAAGTCAATCTTCCAGCAACGCTGCTGTAATTGGTGCTGGAGAACATGCGAATTTCCGAGCATCTTACTGGCTTAAAGGGGCTGTGCGGGTGAGACGGACAGATTTGACGTATATTGGCGCAATGGATGATGACAGCTGATCATTTATTCACTGATCTTTTTATTTTATCTGGAGCTAGCAATCCCCTCAGCAGGTAAATTCTCGCATCCTGAAATTGCCCAAAATCAGATCAAGATGGTAATCTTGAGCTCGTTTGAAGATGAAAAAGATATCTGTTGTGACTGGGAAATTTTTTTATGGGGTGGGTGACCATCGTGGAGGTAATCTGAGTGATGATGTTCACACACATCCATCCTACAGGGTGTTGGCCTAGCTCGGATTCTAACCCTTCAATTGTCCCGCGTTTGGAACTGCAGGGTGCGGTTCGGAGGTTTGTTGTATATATAGGGATTAATTGTTTCACTTCACTGATTAATCCAAATGGAAAAAAATCATAATATGATCTGTTAGTTGCATGCCCATATTACTCTCCCTCCCTCCAGATAAGCTTTGCAGCTGTTTATTTTGTAGAGGTATGTTTGAAATTCATTTCTTGCATTCTGTGAACTAGACAGCCATTCTTTACTTGGTTATATTAAATGTTGAAATTGGAATTGGAATTGAGATATACTTCCTACTGTCGTATGCTTCGAAGGCAGATTAGCAATACCACCACGCCCCGGGATTTCGACAACATTTTTTCAGATTGCGTTAAGCATCTGCTCTGTTGAGTTCTTAGAGGGCTTAGAAATTAAAGTATCAATCAGGAAATTGCAGTTTGGCTTTATGCGCTTGCTTTCTGTGTATATGTATTTATACGCTGTAGGCCAAAGTAATTTGGTGTTTTCTTATTTTGTTGTCTTAATTTGCTTTCTATGAGAATTGTCTATCTGATGATTAGATATCAGCTTCCAATTCCTTTGGACACAACTGCTGATAGTGTTCTTATCTCTTGATTGAGTATTGGCTGCTGTAAGATCAATTATTGGTATTTTTTTCATCTTCTAATCCTTGAATGGCCACGTCCATATCCAGTTCATCCTTTGGAACCATATCACATATCGAATTTAATGTCCGATGAAATAGGATGAATTGAAGCGGGG

mRNA sequence

ATGGCTAGCTCCATAACCATGGCTTTTCTGGCCTTCCGTGCTCGTTCTAGTCGTCGAACTACTAATGCCTTCGACGGAGAAGAAAACCCTTGCTCCACTGCGTACTTGTACCTAATTAGTCACTCCCAGAAGAACCGGCTTGCTGCGTCGAATTCGGGATCAGTATGGCTTTGCCAACAAACTTCGAAGTATAGGCATCACCTTGGCTCGTACTTCAAGAGATACGGTATTCATCTCCGACTTCAATGTGTTATGCTGACCGTAGTTTACTCTGTTCAGTCCTGGGGAATGTATCATCCTGCCAGCTGCACTAGTGCAGTTAATAATAGTGCAATAGGTGGGCCATCAGCAAGGGATGCAATCCGAGCTGATTCTTCTTCATTGCCAGCCAATTTTCCTTTAAATTCCAGGCGGCCAGCTCCACTTGCACCATACAAGTTGAAGTGCGAGAAGGAGGCTTTAAGTAATCGGTATTGGTTTGCAATATTTTCTTTTTACCAACTTCTTGTTTCATTTCATGCCAATAATTTGTTAGGGCCTCCTGACTATTACCCTCAAACTCCTAGCTGTCCCGAGGAGAACCTCACTAGAGAGTATGCGCAGTCTGGATACAAAGAGACTGTCGAAGGGCTTGAGGAGGCCAGAGAAATCTTATTGACTCAGGTTCAAGCATTTTCTAAGCATCTCGTCATCAAGTGCAAGGATGCTATAAGAAAACGTCTGAGGGCCATAAATGATTCACGTGCTCAGAAGCGGAAGGCTGGTCAAGTTTATGGTGTTCCCCTATCTGTTTCTTTATTAACAAAGCCTGGCATCTTTCCCGAACAAAAACCTTGTAGTGAAGATTTTCGGAAAAAGTGGATTGAGGGTTTATCACAACAGCATAAACATTTGCGATCTTTGGCAGATAATGTCCCTCATGGGTATAGGAAAAGGGCTCTTTTTGAAGTTCTCATTAGGAATAATGTCCCATTGCTGAGAGCAACTTGGTTCATTAAAATTACTTATCTTAATCAGGTGCGCCCTAATTCTGCTAGTATATCATGTGGAGCATTCGACAAAGCTCAATTATCCCGTACTGAATTTTGGACCAAAGATGTGGTTGACTATTTGGAATGCCTGGTGGAGGAATTTTTTTCAAGAGGCAATTCTCATTTGACTCCACCAAACAAAGACCAGTCTCCGCAAATGTTTTCTGTTGGGCTCTCACATACAAAGGGTGATCCTCCTTCAGCGATCTTTGATGGTGAAGAGCCTTCATTACATTTCAAATGGTGGTATGTGGTTAGGCTATTGCTATGGCATCAAGCTGAAGGGCTTCTGCTTCCCTCTCTCATTGTCGATTGGGTGCTGGGACAATTAGAGGAAAATGATGTTCTCGAGTTTTTGGAGTTGCTGCTGCCAATTATTTATGGTGTTTTAGATACAATTGTCCTATCTCAGACCTATGTTCGTACTCTTGTCAGAATTTCTGTTCGGTTTATCCGAGATTCTTTTCCTGGTGGGTCAGATCTAGTAGATAATTCAAGGAGAGCATACACAACATCTGCTTTGGTGGAAATGGTTCGCTATTTAGTTCTGGCTGTGCCCGACACATTTGTTGCTTTGGATTGCTTCCCATTTCCACCTTGTGTTGTATCACATACGGTTAATGAAGGGAATTTTGGGTCAAAGGTACCTGAAGATGCAACAAAACTGAGATATGCTTCAGCAGAAGTTGCCAGTCCCTTCAGAAGTAAAGGGATTGATTTTCAGTATCAATCCTCAGCTTTTGATAATGTTGTTTCATCAATACAGAAGTGTACAGACAGTCTTGCAAAGGCAGTAAACCCTGAATTCCCAGTTTGCAGCGTGGCTAAAGCTGTGCATGCATTGGATAAGTCTCTACTACATGGAGATATTGGAGTAGCTTATAAATATCTTTTTGAAAACTGCTGTAATGGATCCATATGTGAAGCTTGGTTTGAAGAAGTAAACCCGTGTTTAAGAATGCCATTGAAATGGAACCAGACTGTCAATGTGGCATTTGCTTGTTCAGTATTTTTTCTTTGTGAGTGGGCAACATGTGACTACAGGGATTTTTGGAGTGCTGCACCTCGAGAGCTAAAGCTCACTGGTGGGAAGGTTTTCTCTCAGGTTTATATTGCCACTAGACTTCTGAAAATGAAAGCCAGAGATCTTCGAAGTTTATCTGGACGTAAATATGAAAATGCAATTGGACCTAATTCCACCATTGTAAAGGGTTCTAGCCATCAGAACAGTTCATTTGGTAGGAAACCAGTTGGGAATTTACATGAACCAAAAAGTAGGTTGAAAAGGTCGGGAGGTGCTGGTTCTTTAGATTTGTTTGAAAGTCCAGGTCCTTTACATGATATTCTTGTTTGTTGGATTGATCAACATGAAGTGCAAAAAGGAGAAGGTTTTGAGCGTGTTCAGTTTCTCATTGTGGAACTTATACGTGCTGGTATATTTTATCCTCATTTATATGTAAGGCAGCTAATAGTTAGTGGAATTGTGGACTCCAATGGCCCAGCAGTTGCGCCACATAGAAGGAGGAGACACCAACAAATCTTGAAATATTTACCCGGAAGTTTTATTCATGCCACTCTGGATGATGGGAAAATTGCACAAGGAGCACAACTTGTAGACATTATAAATGTCTACTCCAAAGAACGTCGTCTAGTACTTCATGGGCTCGAATGGGAACAAAAAAGTGATATTAGCTGTGCAAATACATCATTAAATCAAAAGCGAAAGATGTGTCCAACCTCCGACAAGGTTTCTAGTTCTGTTACTTCTGTTAACCAATTGAAATCAATTAAGTCAGTGTCCAACATGAGCACTACTAAAAGTGTCATAAGTGAAGTTGACATTGAAGAGCTGAAGGAAGCCATATCATTGCTTTTACGGTTTCCAAACAGTTCGTCAACTCCCACAGATACTGATCTAGATGATACTACAGGGACTGCTAAGAAGTCTTTTGCATCAGTATATGGGAAAATAGATATTGCAGAAGCAACACCTGGGTGTGAAGATTGCAGAAGAGCCAAAAAAAGGAAAGTAAGTGATGAAAAGCCCTTGTACCTTCATGGATCTTCTTCACCAGTCCCATCAGATGACGAAGATGCGTGGTGGGTGAAGAAGGGGCCTAAATCCTCTGAAACATTGAAGGTTGATCCACCGGTAAAGACAACAAAGCCAGTTTTAAAGGGAAGACGCAAGACACAAAGTCTTGCTCATCTAGCTGCGTCTAGGATTGAAGGTAGTCAGGGTGCATCAACGAGTCATCTATGTGATAATAGGGTGGCCTGTCCTCACCATAGATCTGGAATGGAAGGTGATTCTACCAGACCAATAGATGGTAGCAAAATAAATCATGGTGGTGATATTGCTTTTATTGGAAAAAGTTTAAAACGACTTCGACTTACTGAGAAGCGAGCAATTTCAAGTTGGTTTATGACTGCTGTTAAGCAGATTATCGAAGAGACTGAGAAGACTATCACAAAAGCTGGCCAATTTGGTCGGTCCTTAACAGCTGTTGACGATAGGAATACCATACGCTGGAAGTTTGGCGAGGATCAGCTTTCATCCATATTGTATTTAACAGATGTATGTAATGATTTTGTTTCAGGGGTCAAATTTCTCCTCTGGTTGCTGCCAAAAGTCCTTATTAGTTCAAATTCTACCATGAACAGCCGGAGGAGCATTCTACTTTTACCAAGGAATGTAGAAAATCAAGTGTGTGAAGTGGGCGAGGCATATCTATTATCTTCTCTCCGAAGGTACGAGAATGTACTTGTTGCAGCTGATCTTATTTCAGAAGCGTTGTCATCTATAGTCCATCGTGCTATGGCTATTATGGCTTCAAATGGCCGTATTTCAGGCTCTGCAGCGGTAATTTATGCTCGACATTTATTGAAAAAATATGGCAGCATACCTAGTGTCGTTGAATGGGAGAAGAGTTTTAAGACAACATGTGACAAGAGACTTATTGCTGAACTTGATCCAGCAAGCTCATTGGATGGAGAGTTGGGGCTTCCACTTGGAGTTCCTGCAGGTGTGGAGGATCTTGATGATTTTTTTAGGCAAAAGATTGGGGGTGGACGACTCTCTAGAGTTGGAATGAGTATGCGAGAACTGGTACAGCGACAAATTGATGATGCCTTTCACTATTTGTTTGGAAAAGATAGGAAAGTCGTTACTGGTGGTGCTTCGAAGGTGCTTGCCTCAGAGAAATCAGATGAGGGATATCAGATAGCTCAAAAAATAATTACAGGATTGATGGAATGCATCAGGCATACAGGTGGTGCTGCTCAGGAAGGTGATCCATCCTTGGTGTCTTCTGCTGTTTCAGCTATTGTTGGTAATCTGGGTTCAACTGTGTCTAAGATGGCTGATTTTATAGCTGGAGGATGCTCGAATTTTCCATCCGCTTCTGGTTCATTGGACTTTGTTAGGCGCATTTTATGCATTCATATTACCTGCCTATGCCTACTCAAGGAAGCTCTAGGAGAACGTCAAAGCCGTGTATTTGAGATTGCGCTTGCAACGGAAGCCTTTTCTGCACTTGCTGGAGTATATTCTCCTGGGAAGCCATCAAGATCTCAGTTTCAATTATTAGCTGATTCCCATGAATCTAACGCTCATGTCTTTGGTGATAGCACCAAAGTAATAGGTAGAGCCACAAAAATTGCAGCAGCTATTTCTGCACTTGTCATTGGGGCAGTTATTCAGGGGGTTTGTAGTCTTGAACGGCTGGTAACACTCTTTAGGTTAAAAGAAGGATTAGATTTTATTCAGTTTGTTAGAACTACTAGGTCAAATGCAAATGGCAACACTCGTACAATGGGAATGCATAAGATTGAAAGTTCCATAGAGGATTATGTACATTGGTTTAGGTTGCTTGTTGGAAATTGCAGAACTGTGTTTGATGGGTTGATTGTGGAGCTACTAGGTGAGCCGTCTATTGTGGCACTTTTTAGAATGCAACGGTTGCTTCCACTTAGCTTGGTCCTATCTCCTGCCTATTCAATATTCTCATTTGTTGTATGGCGCCCTTTTATCCAGAATGCTGCTTTTACTGCTCGTGAAGATGTGAATCAACTGTGTCAATCTTTAACAATCGCAATTGGTGATATTGTAAGACATTTGCCTTTTCGGGATGTTTGTTTTAGGGATAGTCAGGGTTTCTATAACCATTTGATGAACGATACCAGTGATGTAGAATTTGCTGCTATACTGGAGTTGAATGATATTCCCTTGAAGCCCATGGCCTTTGTTCCTCTACGTGCAAGGCTATTCTTGAATACTATTATTGATTGTAAGTTGCCAAGTTCTGTGTACAATCAAGATGATGGGAGTAGGATTTCGGGAGTTGGTGATAGTAAAGGTCATTATTCTGAGAGAAAAATGAAGTTGCTGGACAGGCTTGTATATGTTTTGGATACCTTACAACCTGCAAAATTTCATTGGCAGTGGGTGGAACTTAGGCTTCTTTTGAATGAACAAGCCCTTATCGAGAAACTTGAGACACTTGAGACACGAGATCTGTCCTTAGCTGATGCTGTTCGTTTGTCGTCACCAAGTCCTGAAAAAGTAGCTGCTTCTGATAATGAGAAGAATTTTATTGAGATTATTCTTACAAGGTTGTTGGTCAGGCCTGATGCTGCACCTCTTTTCTCAGATGTGATTCATCTTTTTGGCAGGTCTCTTGAAGATTCAATGTTGTTGCAAGCCAAATGGTTTCTTGGAGGTCAAGATGTCCTATTTGGAAGGAAATCAATACGACAGAGACTAACTAATATTGCCGAGAGTAAAGGTCTATCGACTAAAACCATGTTTTGGAAGCCTTGGGTTTGGTGTATTTCTGGCTCGGATTCTTCTTATCTTGAAGAAGGAGAGGTTGTTGAAGAAGGCACAGATTCTAGCAAGTATAGCCAAAAGTCTGTTGAATTGCTTGACAACGAAGTCTTGCATTCCAGTCAGCAACATGTGACCGAGAGGGCTCTTATTGAATTAGTTCTTCCATGCATAGATCAGAGTTCTGAAGAATCACGCAACACCTTTGCTAATGATTTAATCAAGCAGTTGAATAATATTGAGCAACAAATAAATGCAGTTACTTCAGGGTCAAGTAAACAAACAGGACTTGTTCCCTCAGGGATAGAGGGCCCTACGAGCAAAGGAAGTAATCGCAAAATGAAAGGAGGCAGTCCTGGATTAGCTAGACGTTCAACAGGCTCAACAGATTCTCCTCTACCCTCACCTGCAGCTTTGCGAGCATCAATGTCATTGCGTTTACAATTAATATTGAGGTTACTTCCGGTCATCCTCGAAGATAGGGAGCCATCAGGACGGAACATGAGGCATATGCTTGCCTCTGTCATCCTTCGTCTTCTTGGCAGTCGAATAGTTCACGAGGATGCAAACCTTACCTTTTGTCCCACCCATAGTTCGATGGTAAAGAAGGAAGTAGAGTCATCTTCCGAAGCGTCACTTGCTATATTTGCAGACCTACCAGGTGAAAGTCTTTTTGGTAGTATGTTATTGATTCTACATGGGCTATTGAGCAGTTGCCAGCCAAGTTGGCTAGGTTTGAAAACTGCTGCTAAGTCGACCAATGAAACAAGCAAGGATTCTACTGCTCTTGTTCGTGAACTGGCTGAAAGTTTACAGAATGAATTGCACCACATGCAACTACCTGATATGATTAGATGGCGCATCCAAGCTGCAATGCCCATTCCACTTCCTTCTGCTCGGTGCCTTTTATCTTACCAGCCACCAACAACATCTCCTTCTGCCCTTTATCCATTTCAATCCAGAAGTTCCACACCTGGACTTGGTTCTGGAAATAGTAGCATGCCTCAAGGGAGCAAAGTAGCGTCACCAAGGGTTGTGCCTAATGCTCCTGGGAAGTCGAAACATTTGCCACCGCAGCAGGATTATGATACAGAAATTGACCCTTGGTTGCTTCTAGAAGATGGTGCTGGATCAAGTCAATCTTCCAGCAACGCTGCTGTAATTGGTGCTGGAGAACATGCGAATTTCCGAGCATCTTACTGGCTTAAAGGGGCTGTGCGGGTGAGACGGACAGATTTGACGTATATTGGCGCAATGGATGATGACAGCTGATCATTTATTCACTGATCTTTTTATTTTATCTGGAGCTAGCAATCCCCTCAGCAGGTAAATTCTCGCATCCTGAAATTGCCCAAAATCAGATCAAGATGGTAATCTTGAGCTCGTTTGAAGATGAAAAAGATATCTGTTGTGACTGGGAAATTTTTTTATGGGGTGGGTGACCATCGTGGAGGTAATCTGAGTGATGATGTTCACACACATCCATCCTACAGGGTGTTGGCCTAGCTCGGATTCTAACCCTTCAATTGTCCCGCGTTTGGAACTGCAGGGTGCGGTTCGGAGGTTTGTTGTATATATAGGGATTAATTGTTTCACTTCACTGATTAATCCAAATGGAAAAAAATCATAATATGATCTGTTAGTTGCATGCCCATATTACTCTCCCTCCCTCCAGATAAGCTTTGCAGCTGTTTATTTTGTAGAGGTATGTTTGAAATTCATTTCTTGCATTCTGTGAACTAGACAGCCATTCTTTACTTGGTTATATTAAATGTTGAAATTGGAATTGGAATTGAGATATACTTCCTACTGTCGTATGCTTCGAAGGCAGATTAGCAATACCACCACGCCCCGGGATTTCGACAACATTTTTTCAGATTGCGTTAAGCATCTGCTCTGTTGAGTTCTTAGAGGGCTTAGAAATTAAAGTATCAATCAGGAAATTGCAGTTTGGCTTTATGCGCTTGCTTTCTGTGTATATGTATTTATACGCTGTAGGCCAAAGTAATTTGGTGTTTTCTTATTTTGTTGTCTTAATTTGCTTTCTATGAGAATTGTCTATCTGATGATTAGATATCAGCTTCCAATTCCTTTGGACACAACTGCTGATAGTGTTCTTATCTCTTGATTGAGTATTGGCTGCTGTAAGATCAATTATTGGTATTTTTTTCATCTTCTAATCCTTGAATGGCCACGTCCATATCCAGTTCATCCTTTGGAACCATATCACATATCGAATTTAATGTCCGATGAAATAGGATGAATTGAAGCGGGG

Coding sequence (CDS)

ATGGCTAGCTCCATAACCATGGCTTTTCTGGCCTTCCGTGCTCGTTCTAGTCGTCGAACTACTAATGCCTTCGACGGAGAAGAAAACCCTTGCTCCACTGCGTACTTGTACCTAATTAGTCACTCCCAGAAGAACCGGCTTGCTGCGTCGAATTCGGGATCAGTATGGCTTTGCCAACAAACTTCGAAGTATAGGCATCACCTTGGCTCGTACTTCAAGAGATACGGTATTCATCTCCGACTTCAATGTGTTATGCTGACCGTAGTTTACTCTGTTCAGTCCTGGGGAATGTATCATCCTGCCAGCTGCACTAGTGCAGTTAATAATAGTGCAATAGGTGGGCCATCAGCAAGGGATGCAATCCGAGCTGATTCTTCTTCATTGCCAGCCAATTTTCCTTTAAATTCCAGGCGGCCAGCTCCACTTGCACCATACAAGTTGAAGTGCGAGAAGGAGGCTTTAAGTAATCGGTATTGGTTTGCAATATTTTCTTTTTACCAACTTCTTGTTTCATTTCATGCCAATAATTTGTTAGGGCCTCCTGACTATTACCCTCAAACTCCTAGCTGTCCCGAGGAGAACCTCACTAGAGAGTATGCGCAGTCTGGATACAAAGAGACTGTCGAAGGGCTTGAGGAGGCCAGAGAAATCTTATTGACTCAGGTTCAAGCATTTTCTAAGCATCTCGTCATCAAGTGCAAGGATGCTATAAGAAAACGTCTGAGGGCCATAAATGATTCACGTGCTCAGAAGCGGAAGGCTGGTCAAGTTTATGGTGTTCCCCTATCTGTTTCTTTATTAACAAAGCCTGGCATCTTTCCCGAACAAAAACCTTGTAGTGAAGATTTTCGGAAAAAGTGGATTGAGGGTTTATCACAACAGCATAAACATTTGCGATCTTTGGCAGATAATGTCCCTCATGGGTATAGGAAAAGGGCTCTTTTTGAAGTTCTCATTAGGAATAATGTCCCATTGCTGAGAGCAACTTGGTTCATTAAAATTACTTATCTTAATCAGGTGCGCCCTAATTCTGCTAGTATATCATGTGGAGCATTCGACAAAGCTCAATTATCCCGTACTGAATTTTGGACCAAAGATGTGGTTGACTATTTGGAATGCCTGGTGGAGGAATTTTTTTCAAGAGGCAATTCTCATTTGACTCCACCAAACAAAGACCAGTCTCCGCAAATGTTTTCTGTTGGGCTCTCACATACAAAGGGTGATCCTCCTTCAGCGATCTTTGATGGTGAAGAGCCTTCATTACATTTCAAATGGTGGTATGTGGTTAGGCTATTGCTATGGCATCAAGCTGAAGGGCTTCTGCTTCCCTCTCTCATTGTCGATTGGGTGCTGGGACAATTAGAGGAAAATGATGTTCTCGAGTTTTTGGAGTTGCTGCTGCCAATTATTTATGGTGTTTTAGATACAATTGTCCTATCTCAGACCTATGTTCGTACTCTTGTCAGAATTTCTGTTCGGTTTATCCGAGATTCTTTTCCTGGTGGGTCAGATCTAGTAGATAATTCAAGGAGAGCATACACAACATCTGCTTTGGTGGAAATGGTTCGCTATTTAGTTCTGGCTGTGCCCGACACATTTGTTGCTTTGGATTGCTTCCCATTTCCACCTTGTGTTGTATCACATACGGTTAATGAAGGGAATTTTGGGTCAAAGGTACCTGAAGATGCAACAAAACTGAGATATGCTTCAGCAGAAGTTGCCAGTCCCTTCAGAAGTAAAGGGATTGATTTTCAGTATCAATCCTCAGCTTTTGATAATGTTGTTTCATCAATACAGAAGTGTACAGACAGTCTTGCAAAGGCAGTAAACCCTGAATTCCCAGTTTGCAGCGTGGCTAAAGCTGTGCATGCATTGGATAAGTCTCTACTACATGGAGATATTGGAGTAGCTTATAAATATCTTTTTGAAAACTGCTGTAATGGATCCATATGTGAAGCTTGGTTTGAAGAAGTAAACCCGTGTTTAAGAATGCCATTGAAATGGAACCAGACTGTCAATGTGGCATTTGCTTGTTCAGTATTTTTTCTTTGTGAGTGGGCAACATGTGACTACAGGGATTTTTGGAGTGCTGCACCTCGAGAGCTAAAGCTCACTGGTGGGAAGGTTTTCTCTCAGGTTTATATTGCCACTAGACTTCTGAAAATGAAAGCCAGAGATCTTCGAAGTTTATCTGGACGTAAATATGAAAATGCAATTGGACCTAATTCCACCATTGTAAAGGGTTCTAGCCATCAGAACAGTTCATTTGGTAGGAAACCAGTTGGGAATTTACATGAACCAAAAAGTAGGTTGAAAAGGTCGGGAGGTGCTGGTTCTTTAGATTTGTTTGAAAGTCCAGGTCCTTTACATGATATTCTTGTTTGTTGGATTGATCAACATGAAGTGCAAAAAGGAGAAGGTTTTGAGCGTGTTCAGTTTCTCATTGTGGAACTTATACGTGCTGGTATATTTTATCCTCATTTATATGTAAGGCAGCTAATAGTTAGTGGAATTGTGGACTCCAATGGCCCAGCAGTTGCGCCACATAGAAGGAGGAGACACCAACAAATCTTGAAATATTTACCCGGAAGTTTTATTCATGCCACTCTGGATGATGGGAAAATTGCACAAGGAGCACAACTTGTAGACATTATAAATGTCTACTCCAAAGAACGTCGTCTAGTACTTCATGGGCTCGAATGGGAACAAAAAAGTGATATTAGCTGTGCAAATACATCATTAAATCAAAAGCGAAAGATGTGTCCAACCTCCGACAAGGTTTCTAGTTCTGTTACTTCTGTTAACCAATTGAAATCAATTAAGTCAGTGTCCAACATGAGCACTACTAAAAGTGTCATAAGTGAAGTTGACATTGAAGAGCTGAAGGAAGCCATATCATTGCTTTTACGGTTTCCAAACAGTTCGTCAACTCCCACAGATACTGATCTAGATGATACTACAGGGACTGCTAAGAAGTCTTTTGCATCAGTATATGGGAAAATAGATATTGCAGAAGCAACACCTGGGTGTGAAGATTGCAGAAGAGCCAAAAAAAGGAAAGTAAGTGATGAAAAGCCCTTGTACCTTCATGGATCTTCTTCACCAGTCCCATCAGATGACGAAGATGCGTGGTGGGTGAAGAAGGGGCCTAAATCCTCTGAAACATTGAAGGTTGATCCACCGGTAAAGACAACAAAGCCAGTTTTAAAGGGAAGACGCAAGACACAAAGTCTTGCTCATCTAGCTGCGTCTAGGATTGAAGGTAGTCAGGGTGCATCAACGAGTCATCTATGTGATAATAGGGTGGCCTGTCCTCACCATAGATCTGGAATGGAAGGTGATTCTACCAGACCAATAGATGGTAGCAAAATAAATCATGGTGGTGATATTGCTTTTATTGGAAAAAGTTTAAAACGACTTCGACTTACTGAGAAGCGAGCAATTTCAAGTTGGTTTATGACTGCTGTTAAGCAGATTATCGAAGAGACTGAGAAGACTATCACAAAAGCTGGCCAATTTGGTCGGTCCTTAACAGCTGTTGACGATAGGAATACCATACGCTGGAAGTTTGGCGAGGATCAGCTTTCATCCATATTGTATTTAACAGATGTATGTAATGATTTTGTTTCAGGGGTCAAATTTCTCCTCTGGTTGCTGCCAAAAGTCCTTATTAGTTCAAATTCTACCATGAACAGCCGGAGGAGCATTCTACTTTTACCAAGGAATGTAGAAAATCAAGTGTGTGAAGTGGGCGAGGCATATCTATTATCTTCTCTCCGAAGGTACGAGAATGTACTTGTTGCAGCTGATCTTATTTCAGAAGCGTTGTCATCTATAGTCCATCGTGCTATGGCTATTATGGCTTCAAATGGCCGTATTTCAGGCTCTGCAGCGGTAATTTATGCTCGACATTTATTGAAAAAATATGGCAGCATACCTAGTGTCGTTGAATGGGAGAAGAGTTTTAAGACAACATGTGACAAGAGACTTATTGCTGAACTTGATCCAGCAAGCTCATTGGATGGAGAGTTGGGGCTTCCACTTGGAGTTCCTGCAGGTGTGGAGGATCTTGATGATTTTTTTAGGCAAAAGATTGGGGGTGGACGACTCTCTAGAGTTGGAATGAGTATGCGAGAACTGGTACAGCGACAAATTGATGATGCCTTTCACTATTTGTTTGGAAAAGATAGGAAAGTCGTTACTGGTGGTGCTTCGAAGGTGCTTGCCTCAGAGAAATCAGATGAGGGATATCAGATAGCTCAAAAAATAATTACAGGATTGATGGAATGCATCAGGCATACAGGTGGTGCTGCTCAGGAAGGTGATCCATCCTTGGTGTCTTCTGCTGTTTCAGCTATTGTTGGTAATCTGGGTTCAACTGTGTCTAAGATGGCTGATTTTATAGCTGGAGGATGCTCGAATTTTCCATCCGCTTCTGGTTCATTGGACTTTGTTAGGCGCATTTTATGCATTCATATTACCTGCCTATGCCTACTCAAGGAAGCTCTAGGAGAACGTCAAAGCCGTGTATTTGAGATTGCGCTTGCAACGGAAGCCTTTTCTGCACTTGCTGGAGTATATTCTCCTGGGAAGCCATCAAGATCTCAGTTTCAATTATTAGCTGATTCCCATGAATCTAACGCTCATGTCTTTGGTGATAGCACCAAAGTAATAGGTAGAGCCACAAAAATTGCAGCAGCTATTTCTGCACTTGTCATTGGGGCAGTTATTCAGGGGGTTTGTAGTCTTGAACGGCTGGTAACACTCTTTAGGTTAAAAGAAGGATTAGATTTTATTCAGTTTGTTAGAACTACTAGGTCAAATGCAAATGGCAACACTCGTACAATGGGAATGCATAAGATTGAAAGTTCCATAGAGGATTATGTACATTGGTTTAGGTTGCTTGTTGGAAATTGCAGAACTGTGTTTGATGGGTTGATTGTGGAGCTACTAGGTGAGCCGTCTATTGTGGCACTTTTTAGAATGCAACGGTTGCTTCCACTTAGCTTGGTCCTATCTCCTGCCTATTCAATATTCTCATTTGTTGTATGGCGCCCTTTTATCCAGAATGCTGCTTTTACTGCTCGTGAAGATGTGAATCAACTGTGTCAATCTTTAACAATCGCAATTGGTGATATTGTAAGACATTTGCCTTTTCGGGATGTTTGTTTTAGGGATAGTCAGGGTTTCTATAACCATTTGATGAACGATACCAGTGATGTAGAATTTGCTGCTATACTGGAGTTGAATGATATTCCCTTGAAGCCCATGGCCTTTGTTCCTCTACGTGCAAGGCTATTCTTGAATACTATTATTGATTGTAAGTTGCCAAGTTCTGTGTACAATCAAGATGATGGGAGTAGGATTTCGGGAGTTGGTGATAGTAAAGGTCATTATTCTGAGAGAAAAATGAAGTTGCTGGACAGGCTTGTATATGTTTTGGATACCTTACAACCTGCAAAATTTCATTGGCAGTGGGTGGAACTTAGGCTTCTTTTGAATGAACAAGCCCTTATCGAGAAACTTGAGACACTTGAGACACGAGATCTGTCCTTAGCTGATGCTGTTCGTTTGTCGTCACCAAGTCCTGAAAAAGTAGCTGCTTCTGATAATGAGAAGAATTTTATTGAGATTATTCTTACAAGGTTGTTGGTCAGGCCTGATGCTGCACCTCTTTTCTCAGATGTGATTCATCTTTTTGGCAGGTCTCTTGAAGATTCAATGTTGTTGCAAGCCAAATGGTTTCTTGGAGGTCAAGATGTCCTATTTGGAAGGAAATCAATACGACAGAGACTAACTAATATTGCCGAGAGTAAAGGTCTATCGACTAAAACCATGTTTTGGAAGCCTTGGGTTTGGTGTATTTCTGGCTCGGATTCTTCTTATCTTGAAGAAGGAGAGGTTGTTGAAGAAGGCACAGATTCTAGCAAGTATAGCCAAAAGTCTGTTGAATTGCTTGACAACGAAGTCTTGCATTCCAGTCAGCAACATGTGACCGAGAGGGCTCTTATTGAATTAGTTCTTCCATGCATAGATCAGAGTTCTGAAGAATCACGCAACACCTTTGCTAATGATTTAATCAAGCAGTTGAATAATATTGAGCAACAAATAAATGCAGTTACTTCAGGGTCAAGTAAACAAACAGGACTTGTTCCCTCAGGGATAGAGGGCCCTACGAGCAAAGGAAGTAATCGCAAAATGAAAGGAGGCAGTCCTGGATTAGCTAGACGTTCAACAGGCTCAACAGATTCTCCTCTACCCTCACCTGCAGCTTTGCGAGCATCAATGTCATTGCGTTTACAATTAATATTGAGGTTACTTCCGGTCATCCTCGAAGATAGGGAGCCATCAGGACGGAACATGAGGCATATGCTTGCCTCTGTCATCCTTCGTCTTCTTGGCAGTCGAATAGTTCACGAGGATGCAAACCTTACCTTTTGTCCCACCCATAGTTCGATGGTAAAGAAGGAAGTAGAGTCATCTTCCGAAGCGTCACTTGCTATATTTGCAGACCTACCAGGTGAAAGTCTTTTTGGTAGTATGTTATTGATTCTACATGGGCTATTGAGCAGTTGCCAGCCAAGTTGGCTAGGTTTGAAAACTGCTGCTAAGTCGACCAATGAAACAAGCAAGGATTCTACTGCTCTTGTTCGTGAACTGGCTGAAAGTTTACAGAATGAATTGCACCACATGCAACTACCTGATATGATTAGATGGCGCATCCAAGCTGCAATGCCCATTCCACTTCCTTCTGCTCGGTGCCTTTTATCTTACCAGCCACCAACAACATCTCCTTCTGCCCTTTATCCATTTCAATCCAGAAGTTCCACACCTGGACTTGGTTCTGGAAATAGTAGCATGCCTCAAGGGAGCAAAGTAGCGTCACCAAGGGTTGTGCCTAATGCTCCTGGGAAGTCGAAACATTTGCCACCGCAGCAGGATTATGATACAGAAATTGACCCTTGGTTGCTTCTAGAAGATGGTGCTGGATCAAGTCAATCTTCCAGCAACGCTGCTGTAATTGGTGCTGGAGAACATGCGAATTTCCGAGCATCTTACTGGCTTAAAGGGGCTGTGCGGGTGAGACGGACAGATTTGACGTATATTGGCGCAATGGATGATGACAGCTGA

Protein sequence

MASSITMAFLAFRARSSRRTTNAFDGEENPCSTAYLYLISHSQKNRLAASNSGSVWLCQQTSKYRHHLGSYFKRYGIHLRLQCVMLTVVYSVQSWGMYHPASCTSAVNNSAIGGPSARDAIRADSSSLPANFPLNSRRPAPLAPYKLKCEKEALSNRYWFAIFSFYQLLVSFHANNLLGPPDYYPQTPSCPEENLTREYAQSGYKETVEGLEEAREILLTQVQAFSKHLVIKCKDAIRKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQKPCSEDFRKKWIEGLSQQHKHLRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYLNQVRPNSASISCGAFDKAQLSRTEFWTKDVVDYLECLVEEFFSRGNSHLTPPNKDQSPQMFSVGLSHTKGDPPSAIFDGEEPSLHFKWWYVVRLLLWHQAEGLLLPSLIVDWVLGQLEENDVLEFLELLLPIIYGVLDTIVLSQTYVRTLVRISVRFIRDSFPGGSDLVDNSRRAYTTSALVEMVRYLVLAVPDTFVALDCFPFPPCVVSHTVNEGNFGSKVPEDATKLRYASAEVASPFRSKGIDFQYQSSAFDNVVSSIQKCTDSLAKAVNPEFPVCSVAKAVHALDKSLLHGDIGVAYKYLFENCCNGSICEAWFEEVNPCLRMPLKWNQTVNVAFACSVFFLCEWATCDYRDFWSAAPRELKLTGGKVFSQVYIATRLLKMKARDLRSLSGRKYENAIGPNSTIVKGSSHQNSSFGRKPVGNLHEPKSRLKRSGGAGSLDLFESPGPLHDILVCWIDQHEVQKGEGFERVQFLIVELIRAGIFYPHLYVRQLIVSGIVDSNGPAVAPHRRRRHQQILKYLPGSFIHATLDDGKIAQGAQLVDIINVYSKERRLVLHGLEWEQKSDISCANTSLNQKRKMCPTSDKVSSSVTSVNQLKSIKSVSNMSTTKSVISEVDIEELKEAISLLLRFPNSSSTPTDTDLDDTTGTAKKSFASVYGKIDIAEATPGCEDCRRAKKRKVSDEKPLYLHGSSSPVPSDDEDAWWVKKGPKSSETLKVDPPVKTTKPVLKGRRKTQSLAHLAASRIEGSQGASTSHLCDNRVACPHHRSGMEGDSTRPIDGSKINHGGDIAFIGKSLKRLRLTEKRAISSWFMTAVKQIIEETEKTITKAGQFGRSLTAVDDRNTIRWKFGEDQLSSILYLTDVCNDFVSGVKFLLWLLPKVLISSNSTMNSRRSILLLPRNVENQVCEVGEAYLLSSLRRYENVLVAADLISEALSSIVHRAMAIMASNGRISGSAAVIYARHLLKKYGSIPSVVEWEKSFKTTCDKRLIAELDPASSLDGELGLPLGVPAGVEDLDDFFRQKIGGGRLSRVGMSMRELVQRQIDDAFHYLFGKDRKVVTGGASKVLASEKSDEGYQIAQKIITGLMECIRHTGGAAQEGDPSLVSSAVSAIVGNLGSTVSKMADFIAGGCSNFPSASGSLDFVRRILCIHITCLCLLKEALGERQSRVFEIALATEAFSALAGVYSPGKPSRSQFQLLADSHESNAHVFGDSTKVIGRATKIAAAISALVIGAVIQGVCSLERLVTLFRLKEGLDFIQFVRTTRSNANGNTRTMGMHKIESSIEDYVHWFRLLVGNCRTVFDGLIVELLGEPSIVALFRMQRLLPLSLVLSPAYSIFSFVVWRPFIQNAAFTAREDVNQLCQSLTIAIGDIVRHLPFRDVCFRDSQGFYNHLMNDTSDVEFAAILELNDIPLKPMAFVPLRARLFLNTIIDCKLPSSVYNQDDGSRISGVGDSKGHYSERKMKLLDRLVYVLDTLQPAKFHWQWVELRLLLNEQALIEKLETLETRDLSLADAVRLSSPSPEKVAASDNEKNFIEIILTRLLVRPDAAPLFSDVIHLFGRSLEDSMLLQAKWFLGGQDVLFGRKSIRQRLTNIAESKGLSTKTMFWKPWVWCISGSDSSYLEEGEVVEEGTDSSKYSQKSVELLDNEVLHSSQQHVTERALIELVLPCIDQSSEESRNTFANDLIKQLNNIEQQINAVTSGSSKQTGLVPSGIEGPTSKGSNRKMKGGSPGLARRSTGSTDSPLPSPAALRASMSLRLQLILRLLPVILEDREPSGRNMRHMLASVILRLLGSRIVHEDANLTFCPTHSSMVKKEVESSSEASLAIFADLPGESLFGSMLLILHGLLSSCQPSWLGLKTAAKSTNETSKDSTALVRELAESLQNELHHMQLPDMIRWRIQAAMPIPLPSARCLLSYQPPTTSPSALYPFQSRSSTPGLGSGNSSMPQGSKVASPRVVPNAPGKSKHLPPQQDYDTEIDPWLLLEDGAGSSQSSSNAAVIGAGEHANFRASYWLKGAVRVRRTDLTYIGAMDDDS
Homology
BLAST of CmaCh06G010660 vs. ExPASy Swiss-Prot
Match: H3K2Y6 (Mediator of RNA polymerase II transcription subunit 12 OS=Arabidopsis thaliana OX=3702 GN=MED12 PE=1 SV=1)

HSP 1 Score: 2331.2 bits (6040), Expect = 0.0e+00
Identity = 1282/2326 (55.12%), Postives = 1647/2326 (70.81%), Query Frame = 0

Query: 98   YHPASCTSAVNNSAIGGPSARDAIRADSSSLPANFPLNSRRPAPLAPYKLKCEKEALSNR 157
            YH A+CTSAVNNSAIGG SARD+ RADSSS+  N+ LNSRRP PL PYKLKCEK+ L++R
Sbjct: 4    YHAANCTSAVNNSAIGGASARDSGRADSSSI-GNYSLNSRRPPPLTPYKLKCEKDGLNSR 63

Query: 158  YWFAIFSFYQLLVSFHANNLLGPPDYYPQTPSCPEENLTREYAQSGYKETVEGLEEAREI 217
                                LGPPD++P T + PEENLT+EY Q GYKETV+GL+E+ EI
Sbjct: 64   --------------------LGPPDFHPPTSNSPEENLTKEYVQFGYKETVDGLKESEEI 123

Query: 218  LLTQVQAFSKHLVIKCKDAIRKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQK 277
            +L+QV  FSK +V KCK+A+RK LRAIN+SRA KRKAGQVYGVPLS SLL KPG FPEQ+
Sbjct: 124  ILSQVHTFSKPVVHKCKEAVRKCLRAINESRALKRKAGQVYGVPLSGSLLCKPG-FPEQR 183

Query: 278  PCSEDFRKKWIEGLSQQHKHLRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYL 337
             C E+ +K+WIE LSQQHK LRSLADN+P GYR++ LFEVLIRNNVPLLRATWFIK+TYL
Sbjct: 184  SCGEETKKRWIESLSQQHKRLRSLADNIP-GYRRKTLFEVLIRNNVPLLRATWFIKVTYL 243

Query: 338  NQVRPNSASISCGAFDKAQLSRTEFWTKDVVDYLECLVEEFFSRGNSHLTPPNKDQSPQM 397
            NQVRP+ A+IS G  DK Q SR E WTKDV++YL+ L++E  SR +S      +D+SPQM
Sbjct: 244  NQVRPSPAAISSGTPDKTQASRCEQWTKDVIEYLQYLLDELLSRNSSFPAQQTRDRSPQM 303

Query: 398  FSVGLSHTKGDPPSAIFDGEEPSLHFKWWYVVRLLLWHQAEGLLLPSLIVDWVLGQLEEN 457
               G S  K  P S    GEE SLHFKWWY+VRLL WH AEGLL P+LIVDWVL  L+E 
Sbjct: 304  LYTG-SMQKNSPASTSLYGEETSLHFKWWYMVRLLQWHHAEGLLFPNLIVDWVLKLLQEK 363

Query: 458  DVLEFLELLLPIIYGVLDTIVLSQTYVRTLVRISVRFIRDSFPGGSDLVDNSRRAYTTSA 517
            ++ E L+LLLPI+YGVL++IVLSQTYV++LV I+VRFI++  PGGSDLVDNSRRAYT SA
Sbjct: 364  EIFEILQLLLPIVYGVLESIVLSQTYVQSLVAIAVRFIQEPAPGGSDLVDNSRRAYTLSA 423

Query: 518  LVEMVRYLVLAVPDTFVALDCFPFPPCVVSHTVNEGNFGSKVPEDATKLRYASAEVASPF 577
            L+EMVRYLVLA PDTFVA D FP PP V +   N+ ++ SK  E+  KLR  SAE+++ F
Sbjct: 424  LIEMVRYLVLAAPDTFVASDFFPLPPSVAACGPNDVSYTSKAYENLEKLRSNSAEISAQF 483

Query: 578  RSKGIDFQYQSSAFDNVVSSIQKCTDSLAKAVNPEFPVCSVAKAVHALDKSLLHGDIGVA 637
            + +G+  +++  +FD  +S+IQ+  D LAK  +  +P  +VAKAV ALDK+L  GDI  A
Sbjct: 484  QGRGVLSRFEFLSFDYTISTIQRSADDLAKIASAGYPQHNVAKAVQALDKALSDGDIRAA 543

Query: 638  YKYLFENCCNGSICEAWFEEVNPCLRMPLKWNQTVNVAFACSVFFLCEWATCDYRDFWSA 697
            Y YLFE+ CNG++ EAW  +V+PCLR  L+W   ++ +F CSVFFL EWATCD+RDF + 
Sbjct: 544  YSYLFEDLCNGAVDEAWITDVSPCLRSSLRWIGAISTSFVCSVFFLIEWATCDFRDFRAG 603

Query: 698  APRELKLTGGKVFSQVYIATRLLKMKARDLRSLSGRKYENAIGPNSTIVKGSSHQNSSFG 757
             P+++K +G K  SQVY+  +LLK K               +G   T  KG + +N+  G
Sbjct: 604  VPKDIKFSGRKDCSQVYLVIQLLKQK--------------ILGGEFTARKGKNCRNNFLG 663

Query: 758  -RKPVGNLHEPKSRLKRSGGAGSLDLFESPGPLHDILVCWIDQHEVQKGEGFERVQFLIV 817
              KP                +GS+D FESPGPLHDI+VCWIDQHEV KG G +R+Q L+ 
Sbjct: 664  VSKP----------------SGSMDAFESPGPLHDIIVCWIDQHEVHKG-GAKRLQLLVF 723

Query: 818  ELIRAGIFYPHLYVRQLIVSGIVDSNGPAVAPHRRRRHQQILKYLPGSFIHATLDDGKIA 877
            ELIR+GIF P  YVRQLIVSG++D   PAV P RR RH +ILK LPG F+H TL++ ++ 
Sbjct: 724  ELIRSGIFNPIAYVRQLIVSGMIDVIQPAVDPERRMRHHRILKQLPGCFVHETLEEAQLF 783

Query: 878  QGAQLVDIINVYSKERRLVLHGLEWEQKSDISCANTSLNQKRKMCPTSDKVSSSVTSVNQ 937
             G +L + +  YS ERRL+L  L  E+    +  N  L+ ++     S K+S+S++SV  
Sbjct: 784  GGDKLSEAVRTYSNERRLLLRELLVEKGKYWN--NLVLSDQK-----SKKISTSLSSVIF 843

Query: 938  LKSIKSVSN-MSTTKSVISEVDIEELKEAISLLLRFPNSSSTPTDTDLDDTTGTAKKSFA 997
             ++  + SN     K   S VDI ELKE IS LL+FP  S        D+   + K+S  
Sbjct: 844  PRACNAKSNSKGPRKHTKSSVDIRELKERISALLQFPGMSCGVETPVRDEFQNSVKRSSG 903

Query: 998  SVYGKIDIAEATPGCEDCRRAKKRKVSDEKPLYLHGSSSPVPSDDEDAWWVKKGPKSSE- 1057
            SVY K+D  EATPGCEDCRRAK+ K++DEK     G +SP+ SD+ED WW+KKG K+ E 
Sbjct: 904  SVYSKMDQPEATPGCEDCRRAKRPKMNDEKSSCYQG-NSPIASDEEDNWWIKKGSKTVES 963

Query: 1058 TLKVDPPVKTTKPVLKGR----RKTQSLAHLAASRIEGSQGASTSHLCDNRVACPHHRSG 1117
            +LKVDP ++ TK V +GR    RKTQSLA L A+RIEGSQGASTSH+CDN+V+CPHH  G
Sbjct: 964  SLKVDPQIEITKQVPRGRQKMARKTQSLAQLQAARIEGSQGASTSHVCDNKVSCPHHGPG 1023

Query: 1118 MEGDSTRPIDGSKINHGGDIAFIGKSLKRLRLTEKRAISSWFMTAVKQIIEETEKTITKA 1177
            +EG++ + +D  + +   D+  +G SLK+L+  +KR+I+ W  TAV+Q++EE +K+  + 
Sbjct: 1024 VEGENQKVVDVFRTSTPVDMVSVGNSLKQLQFVDKRSIAVWLTTAVRQLVEEPQKSSVRV 1083

Query: 1178 GQFGRSLTAVDDRNTIRWKFGEDQLSSILYLTDVCNDFVSGVKFLLWLLPKVLISSNSTM 1237
            GQF R    V+++NTIRWK G D+L SIL+L D+  D VS VKFLLWLLPK   + +  +
Sbjct: 1084 GQFNRG-APVEEKNTIRWKLGADELYSILFLLDISLDLVSAVKFLLWLLPKANSTPSFAV 1143

Query: 1238 NSRRSILLLPRNVENQVCEVGEAYLLSSLRRYENVLVAADLISEALSSIVHRAMAIMASN 1297
               R+++ +PRNVEN +CE+GEA L+SSLRRYEN+L++ADL+ EA++++++RA ++M+SN
Sbjct: 1144 QGGRNLVTVPRNVENNMCEIGEAILVSSLRRYENILLSADLVPEAMTALMNRAASLMSSN 1203

Query: 1298 GRISGSAAVIYARHLLKKYGSIPSVVEWEKSFKTTCDKRLIAELDPASSLDGELGLPLGV 1357
            G+ISGSAA++Y R++LK+YGS+PSVVEW  +FK T +K+L++ELD   S +GE G PLGV
Sbjct: 1204 GKISGSAALVYTRYILKRYGSLPSVVEWHNNFKATSEKKLLSELDHTRSGNGEYGNPLGV 1263

Query: 1358 PAGVEDLDDFFRQK--IGGGRLSRVGMSMRELVQRQIDDAFHYLFGKDRKVVTGGASKVL 1417
            PAGV++ DD+ R+K  IGG R SRVG+SMR+++QR +++A HYL    +K++  G  K  
Sbjct: 1264 PAGVDNPDDYLRKKISIGGARPSRVGLSMRDVLQRHVEEATHYL----KKLIGTGTMKAS 1323

Query: 1418 ASEKSDEGYQIAQKIITGLMECIRHTGGAAQEGDPSLVSSAVSAIVGNLGSTVSKMADFI 1477
             +EK+D+GYQ+AQ+I+ GLM+CIR TGGAAQEGDPSLVSSAVSAI+ ++G +V+++ DF 
Sbjct: 1324 LAEKNDDGYQVAQQIVVGLMDCIRQTGGAAQEGDPSLVSSAVSAIINSVGLSVARITDFS 1383

Query: 1478 AGGC-SNFPSASGSLDFVRRILCIHITCLCLLKEALGERQSRVFEIALATEAFSALAGVY 1537
             G    N PS   S +  R IL IHITCLCLLKEALGERQSRVFEIALATE+ +AL GV+
Sbjct: 1384 LGNIYQNHPSGVDSSNIARYILRIHITCLCLLKEALGERQSRVFEIALATESSTALTGVF 1443

Query: 1538 SPGKPSRSQFQLLADSHESNAH------VFGDSTKVIGRATKIAAAISALVIGAVIQGVC 1597
            +P K SR Q QL  +S++SNA+        G     + RATKI AA+SALVIG++  GV 
Sbjct: 1444 APVKGSRGQHQLSPESYDSNANNSTIDMSNGTGKMALSRATKITAAVSALVIGSITHGVI 1503

Query: 1598 SLERLVTLFRLKEGLDFIQFVRTTRSNANGNTRTMGMHKIESSIEDYVHWFRLLVGNCRT 1657
            +LER+V L RLK+ LDF+QFVR T+S++NG+ R+MG  K+ES IE YVHWFRLLVGNC+T
Sbjct: 1504 TLERIVGLLRLKDYLDFVQFVRRTKSSSNGSARSMGASKVESPIEVYVHWFRLLVGNCKT 1563

Query: 1658 VFDGLIVELLGEPSIVALFRMQRLLPLSLVLSPAYSIFSFVVWRPFI--QNAAFTAREDV 1717
            V +GL++EL+GE S+VA+ RMQR+LPL LV  PAYSI +FV+WRPF+   N+  +  ED 
Sbjct: 1564 VSEGLVLELVGESSVVAISRMQRMLPLKLVFPPAYSIIAFVLWRPFVSNSNSNSSVHEDT 1623

Query: 1718 NQLCQSLTIAIGDIVRHLPFRDVCFRDSQGFYNHLMNDTSDVEFAAILELN--DIPLKPM 1777
            ++L QSLT+A  D+++HLPFRDVCFRD+QG Y  ++ D++D EFA++ E +  D+ LK +
Sbjct: 1624 HRLYQSLTMAFHDVIKHLPFRDVCFRDTQGLYELIVADSTDAEFASVFESHGLDMHLKSV 1683

Query: 1778 AFVPLRARLFLNTIIDCKLPSSVYNQDDGSRISGVGDSKGHYSERKMKLLDRLVYVLDTL 1837
            AF PLRARLFLN++IDCK+PSS Y+ +      GV ++K  +     KL+D+LV VLD L
Sbjct: 1684 AFAPLRARLFLNSLIDCKVPSSGYSHE------GVSEAKNRHQGNGTKLVDKLVSVLDCL 1743

Query: 1838 QPAKFHWQWVELRLLLNEQALIEKLETLETRDLSLADAVRLSSPSPEKVAASDNEKNFIE 1897
            QPAKFHWQWVELRLLLNEQAL EK   LE  D+ L DA+R S P+ EK  AS+NEKNFI+
Sbjct: 1744 QPAKFHWQWVELRLLLNEQALAEK---LENHDMPLTDAIRSSCPTSEKPDASENEKNFIQ 1803

Query: 1898 IILTRLLVRPDAAPLFSDVIHLFGRSLEDSMLLQAKWFLGGQDVLFGRKSIRQRLTNIAE 1957
            I+LTRLLVRPDA PLFS+V+HLFGRS+EDSML QA+WFL GQDVLFGRK+IRQ+L  + E
Sbjct: 1804 ILLTRLLVRPDAVPLFSEVVHLFGRSVEDSMLKQAEWFLAGQDVLFGRKTIRQKLIIVGE 1863

Query: 1958 SKGLSTKTMFWKPWVWCISGS---------------DSSYLEEGEVVEEGTDSSKYSQKS 2017
            SKGL TK  FWKPW WC S S               + + +EEGEV+EEG+ S K     
Sbjct: 1864 SKGLPTKPQFWKPWGWCNSSSSDHITANKAGKKRKFEITSIEEGEVIEEGSGSRKVLLPR 1923

Query: 2018 VELLDNEVLHSSQQHVTERALIELVLPCIDQSSEESRNTFANDLIKQLNNIEQQINAVT- 2077
            V  LD           TERA ++LVLPCIDQSS+ESR+TF N+L++Q +NIEQQ+++VT 
Sbjct: 1924 V--LDENSPSVGYGITTERAFVQLVLPCIDQSSDESRSTFVNELVRQFSNIEQQLSSVTN 1983

Query: 2078 --SGSSKQTGLVPSGIEGPTSKGSNRK-MKGGSPGLARRSTGST--DSPLPSPAALRASM 2137
              + S+KQ G   SG E  ++KGS RK ++GGSP LARRS+ +T   SP PSPAALRASM
Sbjct: 1984 RSTTSNKQMGTASSGSEISSNKGSTRKGLRGGSPSLARRSSANTTDTSPPPSPAALRASM 2043

Query: 2138 SLRLQLILRLLPVILEDREPSGRNMRHMLASVILRLLGSRIVHEDANLTFCPTHSSMVKK 2197
            SLRLQ +LRLLPVI    EPS +N RH LAS I+RLLGSR+V+ED     C   S + K 
Sbjct: 2044 SLRLQFLLRLLPVIC--GEPSFKNTRHALASTIVRLLGSRVVYED--YAVCSPRSELSKA 2103

Query: 2198 EVESSSEASLAIFADLPGESLFGSMLLILHGLLSSCQPSWLGLKTAAKSTNETSKDSTAL 2257
            E ES+ + S    ADL  E LF  +L +LHGLLS+ QP WL       S+NE+SKD T  
Sbjct: 2104 ETESTIDPS--SMADLSSEVLFDRLLFVLHGLLSNHQPKWL---KPRPSSNESSKDFTLF 2163

Query: 2258 VRELAESLQNELHHMQLPDMIRWRIQAAMPIPLPSARCLLSYQPPTTSPSALYPFQSRSS 2317
             R+ AESLQNEL  MQLPD IRWRIQAAMPI LPS RC LS QP +  P+AL   Q   S
Sbjct: 2164 DRDAAESLQNELSRMQLPDTIRWRIQAAMPILLPSLRCSLSCQPHSVPPTALTLVQPSGS 2223

Query: 2318 TPGLGSGNSSMPQGSKVASPRVVPNAPGKSK------HLPPQQDYDTEIDPWLLLEDGAG 2377
            T   G+   + P  SK  +      A GK K      H   + D    +DPW LLEDG  
Sbjct: 2224 TAAAGTNQRNSPAISKSGTAA----AQGKLKPTMLAPHQQQEADNTDVVDPWTLLEDGTS 2235

BLAST of CmaCh06G010660 vs. ExPASy Swiss-Prot
Match: Q54U49 (Putative mediator of RNA polymerase II transcription subunit 12 OS=Dictyostelium discoideum OX=44689 GN=med12 PE=3 SV=2)

HSP 1 Score: 94.7 bits (234), Expect = 1.5e-17
Identity = 76/303 (25.08%), Postives = 132/303 (43.56%), Query Frame = 0

Query: 178 LGPPDYYPQTPSCPEENLTREYAQSGYKETVEGLEEAREILLTQVQAFSKHLVIKCKDAI 237
           LG PD+YP      E+ L +E+   G+ E  +      +   +    F      K K+ +
Sbjct: 364 LGVPDFYPLDDKSKEDTLPQEFILGGFCERYQ-----HDECKSSSSIFKNFDFPKVKEQL 423

Query: 238 RKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQKPCSEDFRKKWIEGLSQQHKH 297
            + +  +   ++  +K+GQ    P  ++        PEQK  S + R+ W+  L+  ++ 
Sbjct: 424 LQSIYQVEWKKSSTQKSGQ----PPVMNKSGNKRPVPEQKAWSANHRESWVLKLA-GNEP 483

Query: 298 LRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYLNQVRPNSASISCGAFDKAQL 357
           L+ LA +VPHGY+   L ++ + N VPL+RATW+ KI Y N  +  +   S         
Sbjct: 484 LQKLASSVPHGYKGETLLKMFLDNQVPLIRATWYTKIVYGNMPKHKTVEPS--------- 543

Query: 358 SRTEFWTKDVVDYLECLVEEFFSRGNSHLTPPNKDQSPQMFSVGLSHTKGDPPSAIFDGE 417
                WTK +V  L  L+       NS              S   ++  G    +    +
Sbjct: 544 ---NDWTKTIVQSLFALIRNTTGENNS------------SGSSSSNNVLGGNSGSGVVKK 603

Query: 418 EPSLHFKWWYVVRLLLWHQAEGLLLPSLIVDWVLGQLEENDVLEFLELLLPIIYGVLDTI 477
             S +    Y+ RL+ W+ +EGLL   +++  ++  L E D  E   L+  ++    DT+
Sbjct: 604 ATSSYTGILYIERLIKWNFSEGLLNKDILLSMLIDHLNETDRPEEAVLISSLLLYYSDTL 632

Query: 478 VLS 481
           +LS
Sbjct: 664 ILS 632

BLAST of CmaCh06G010660 vs. ExPASy Swiss-Prot
Match: Q86YW9 (Mediator of RNA polymerase II transcription subunit 12-like protein OS=Homo sapiens OX=9606 GN=MED12L PE=1 SV=2)

HSP 1 Score: 59.3 bits (142), Expect = 6.8e-07
Identity = 77/324 (23.77%), Postives = 128/324 (39.51%), Query Frame = 0

Query: 178 LGPPDYYPQTPSCPEENLTREYAQSGYKE----TVEGLEEAREILL--TQVQAFSKHLVI 237
           LGPPD YPQ P   E+ LT    + G+      T +    AR I++  +++ A+   ++ 
Sbjct: 19  LGPPDVYPQDPKQKEDELTAVNVKQGFNNQPAFTGDEHGSARNIVINPSKIGAYFSSIL- 78

Query: 238 KCKDAIRKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQKPCSEDFRKKWIEGL 297
               A + +L    D+  +K +        L  +              S+     W   L
Sbjct: 79  ----AEKLKLNTFQDTGKKKPQVNAKDNYWLVTAR-------------SQSAIHSWFSDL 138

Query: 298 SQQHKHLRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYLNQVRPNSASISCGA 357
           +  +K L  LA  VP   +K  +F  L + +VP++RATW IK+T       + A I    
Sbjct: 139 A-GNKPLSILAKKVPILSKKEDVFAYLAKYSVPMVRATWLIKMTCAYYSAISEAKIKKRQ 198

Query: 358 FDKAQLSRTEFWTKDVVDYLECLVEEFFSRGNSHLTPPNKDQSPQMFSVGLSHTKGDPPS 417
                L  T+  T+ + + L   + +F+   +S                      GD P 
Sbjct: 199 APDPNLEWTQISTRYLREQL-AKISDFYHMASS---------------------TGDGPV 258

Query: 418 AIFDGEEPSLHFKWWYVVRLLLWHQAEGLLLPSLIVDWVLGQLEENDVL--EFLELLLPI 477
            +    E ++  +W Y  +L      EG+L     + W+L  LE+   +  + L+LLLP+
Sbjct: 259 PVPPEVEQAMK-QWEYNEKLAFHMFQEGMLEKHEYLTWILDVLEKIRPMDDDLLKLLLPL 300

Query: 478 IYGVLDTIVLSQTYVRTLVRISVR 494
           +    D  V S    R L     R
Sbjct: 319 MLQYSDEFVQSAYLSRRLAYFCAR 300

BLAST of CmaCh06G010660 vs. ExPASy Swiss-Prot
Match: Q751D2 (Mediator of RNA polymerase II transcription subunit 12 OS=Ashbya gossypii (strain ATCC 10895 / CBS 109.51 / FGSC 9923 / NRRL Y-1056) OX=284811 GN=SRB8 PE=3 SV=2)

HSP 1 Score: 59.3 bits (142), Expect = 6.8e-07
Identity = 44/202 (21.78%), Postives = 88/202 (43.56%), Query Frame = 0

Query: 181 PDYYPQTPSCPEENLTREYAQSGY----KETVEGLEEAREILLTQVQAFSKHLVIKCKDA 240
           PD+ P   +  E+ +   +   G+    K   E +  AR  L   +   +  L  +    
Sbjct: 29  PDFDPWAHTEIEDKILLSFVAKGHYTSAKVNFESI-SARSSLQESLPKVAGMLAEQFSKV 88

Query: 241 IRKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQKPCSEDFRKKWIEGLSQQHK 300
           +  R + IN    +  ++  + G      L       P +   ++  R +W++ LS  + 
Sbjct: 89  VHLREQTINKVSGESEES--IRGKAKFTDLAGPGFSLPNRVTLTDQRRTQWLQELSSPNV 148

Query: 301 HLRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYLNQVRPNSASISCGAFDKAQ 360
            L  LA ++PHG++++ + E      +PL RA W IK +Y  + +  ++ +  G  ++  
Sbjct: 149 SLSKLAKSIPHGFKRKQILEQCYMRQLPLQRAIWLIKSSYSIEWKSLTSKLKPGQTNEGV 208

Query: 361 LSRT-EFWTKDVVDYLECLVEE 378
           +S+    WT  +V  +E L+ E
Sbjct: 209 VSQLYNLWTNSMVSIMERLLFE 227

BLAST of CmaCh06G010660 vs. ExPASy Swiss-Prot
Match: A2AGH6 (Mediator of RNA polymerase II transcription subunit 12 OS=Mus musculus OX=10090 GN=Med12 PE=1 SV=1)

HSP 1 Score: 56.6 bits (135), Expect = 4.4e-06
Identity = 90/350 (25.71%), Postives = 135/350 (38.57%), Query Frame = 0

Query: 178 LGPPDYYPQTPSCPEENLTREYAQSGY--KETVEGLE--EAREILLTQVQAFSKHLVIKC 237
           LGPPD YPQ P   E+ LT    + G+  +  V G E   A+ +     +  S    I  
Sbjct: 19  LGPPDVYPQDPKQKEDELTALNVKQGFNNQPAVSGDEHGSAKNVNFNPAKISSNFSSI-- 78

Query: 238 KDAIRKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQKPCSEDFRKKWIEGLSQ 297
              I ++LR    S   +RK           SL+ +   F      S+     W   L+ 
Sbjct: 79  ---IAEKLRCNTLSDTGRRK-----------SLMNQKDNFWLVTARSQSAINTWFTDLAG 138

Query: 298 QHKHLRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYLNQVRPNSASISCGAFD 357
             K L  LA  VP   +K  +F  L +  VP++RA W IK+T       +   +      
Sbjct: 139 T-KPLTHLAKKVPIFSKKEEVFGYLAKYTVPVMRAAWLIKMTCAYYAAMSETKVK----K 198

Query: 358 KAQLSRTEFWTKDVVDYL-ECL--VEEFFSRGNSHLTPPNKDQSPQMFSVGLSHTKGDPP 417
           K        WT+ +  YL E L  + E++  G +              S G   T G  P
Sbjct: 199 KNTADPFTEWTQIITKYLWEQLQKMAEYYRPGPAG-------------SGGCGSTIGPLP 258

Query: 418 SAIFDGEEPSLHFKWWYVVRLLLWHQAEGLLLPSLIVDWVLGQLEE--NDVLEFLELLLP 477
             +    E ++  +W Y  +L L+   +G+L     + WVL   E+      E L+LLLP
Sbjct: 259 HDV----EMAIR-QWDYNEKLALFMFQDGMLDRHEFLTWVLECFEKIRPGEDELLKLLLP 318

Query: 478 IIYGVLDTIVLSQTYVRTLVRISVRFIRDSFPGGSDLVDNSRRAYTTSAL 519
           ++       V S    R L     R +     G S    +   A +TS+L
Sbjct: 319 LLLRYSGEFVQSAYLSRRLAYFCTRRLALQLDGVSSHSSHVIAAQSTSSL 329

BLAST of CmaCh06G010660 vs. TAIR 10
Match: AT4G00450.1 (RNA polymerase II transcription mediators )

HSP 1 Score: 2180.6 bits (5649), Expect = 0.0e+00
Identity = 1234/2358 (52.33%), Postives = 1607/2358 (68.15%), Query Frame = 0

Query: 98   YHPASCTSAVNNSAIGGPSARDAIRADSSSLPANFPLNSRRPAPLAPYKLKCEKEALSNR 157
            YH A+CTSAVNNSAIGG SARD+ RADSSS+  N+ LNSRRP PL PYKLKCEK+ L++R
Sbjct: 4    YHAANCTSAVNNSAIGGASARDSGRADSSSI-GNYSLNSRRPPPLTPYKLKCEKDGLNSR 63

Query: 158  YWFAIFSFYQLLVSFHANNLLGPPDYYPQTPSCPEENLTREYAQSGYKETVEGLEEAREI 217
                                LGPPD++P T + PEENLT+EY Q GYKETV+GL+E+ EI
Sbjct: 64   --------------------LGPPDFHPPTSNSPEENLTKEYVQFGYKETVDGLKESEEI 123

Query: 218  LLTQVQAFSKHLVIKCKDAIRKRLRAINDSRAQKRKAGQVYGVPLSVSLLTKPGIFPEQK 277
            +L+QV  FSK +V KCK+A+RK LRAIN+SRA KRKAGQVYGVPLS SLL KPG FPEQ+
Sbjct: 124  ILSQVHTFSKPVVHKCKEAVRKCLRAINESRALKRKAGQVYGVPLSGSLLCKPG-FPEQR 183

Query: 278  PCSEDFRKKWIEGLSQQHKHLRSLADNVPHGYRKRALFEVLIRNNVPLLRATWFIKITYL 337
             C E+ +K+WIE LSQQHK LRSLADN+P GYR++ LFEVLIRNNVPLLRATWFIK+TYL
Sbjct: 184  SCGEETKKRWIESLSQQHKRLRSLADNIP-GYRRKTLFEVLIRNNVPLLRATWFIKVTYL 243

Query: 338  NQV---------------------RPNSASISCGAFDKAQLSRTEFW-----------TK 397
            NQV                     R     +S G      +  T +            +K
Sbjct: 244  NQVHCWAINWCDLVLLLFLQEHLTRHKLLGVSNGQKMLLNICNTSWMNFCHGIAHFLLSK 303

Query: 398  DVVDYLECLVEEFFSRGNSHLTPPNKDQSPQMFSVGLSHTKGDPPSAIFDGEEPSLHFKW 457
              + +  C +++   R   H       Q        L    G      + G   ++   +
Sbjct: 304  LEIGHHRCFIQDQCKRIVQH-------QQAFTARKHLYILNGGIWCVFYSG---TMLKGF 363

Query: 458  WYVVRLLLWHQAEGLLLPSLIVDWVLGQLEENDVLEFLELLLPIIYGVLDTIVLSQTYVR 517
            ++++ LL+     G       V++    L+E ++ E L+LLLPI+YGVL++IVLSQTYV+
Sbjct: 364  FFLISLLI-----GFSSSYSFVNFHFALLQEKEIFEILQLLLPIVYGVLESIVLSQTYVQ 423

Query: 518  TLVRISVRFIRDSFPGGSDLVDNSRRAYTTSALVEMVRYLVLAVPDTFVALDCFPFPPCV 577
            +LV I+VRFI++  PGGSDLVDNSRRAYT SAL+EMVRYLVLA PDTFVA D FP PP V
Sbjct: 424  SLVAIAVRFIQEPAPGGSDLVDNSRRAYTLSALIEMVRYLVLAAPDTFVASDFFPLPPSV 483

Query: 578  VSHTVNEGNFGSKVPEDATKLRYASAEVASPFRSKGIDFQYQSSAFDNVVSSIQKCTDSL 637
             +   N+ ++ SK  E+  KLR  SAE+++ F+ +G+  +++  +FD  +S+IQ+  D L
Sbjct: 484  AACGPNDVSYTSKAYENLEKLRSNSAEISAQFQGRGVLSRFEFLSFDYTISTIQRSADDL 543

Query: 638  AKAVNPEFPVCSVAKAVHALDKSLLHGDIGVAYKYLFENCCNGSICEAWFEEVNPCLRMP 697
            AK  +  +P  +VAKAV ALDK+L  GDI  AY YLFE+ CNG++ EAW  +V+PCLR  
Sbjct: 544  AKIASAGYPQHNVAKAVQALDKALSDGDIRAAYSYLFEDLCNGAVDEAWITDVSPCLRSS 603

Query: 698  LKWNQTVNVAFACSVFFLCEWATCDYRDFWSAAPRELKLTGGKVFSQVYIATRLLKMKAR 757
            L+W   ++ +F CSVFFL EWATCD+RDF +  P+++K +G K  SQVY+  +LLK K  
Sbjct: 604  LRWIGAISTSFVCSVFFLIEWATCDFRDFRAGVPKDIKFSGRKDCSQVYLVIQLLKQK-- 663

Query: 758  DLRSLSGRKYENAIGPNSTIVKGSSHQNSSFG-RKPVGNLHEPKSRLKRSGGAGSLDLFE 817
                         +G   T  KG + +N+  G  KP                +GS+D FE
Sbjct: 664  ------------ILGGEFTARKGKNCRNNFLGVSKP----------------SGSMDAFE 723

Query: 818  SPGPLHDILVCWIDQHEVQKGEGFERVQFLIVELIRAGIFYPHLYVRQLIVSGIVDSNGP 877
            SPGPLHDI+VCWIDQHEV KG G +R+Q L+ ELIR+GIF P  YVRQLIVSG++D   P
Sbjct: 724  SPGPLHDIIVCWIDQHEVHKG-GAKRLQLLVFELIRSGIFNPIAYVRQLIVSGMIDVIQP 783

Query: 878  AVAPHRRRRHQQILKYLPGSFIHATLDDGKIAQGAQLVDIINVYSKERRLVLHGLEWEQK 937
            AV P RR RH +ILK LPG F+H TL++ ++  G +L + +  YS ERRL+L  L  E+ 
Sbjct: 784  AVDPERRMRHHRILKQLPGCFVHETLEEAQLFGGDKLSEAVRTYSNERRLLLRELLVEKG 843

Query: 938  SDISCANTSLNQKRKMCPTSDKVSSSVTSVNQLKSIKSVSN-MSTTKSVISEVDIEELKE 997
               +  N  L+ ++     S K+S+S++SV   ++  + SN     K   S VDI ELKE
Sbjct: 844  KYWN--NLVLSDQK-----SKKISTSLSSVIFPRACNAKSNSKGPRKHTKSSVDIRELKE 903

Query: 998  AISLLLRFPNSSSTPTDTDLDDTTGTAKKSFASVYGKIDIAEATPGCEDCRRAKKRKVSD 1057
             IS LL+FP  S        D+   + K+S  SVY K+D  EATPGCEDCRRAK+ K++D
Sbjct: 904  RISALLQFPGMSCGVETPVRDEFQNSVKRSSGSVYSKMDQPEATPGCEDCRRAKRPKMND 963

Query: 1058 EKPLYLHGSSSPVPSDDEDAWWVKKGPKSSE-TLKVDPPVKTTKPVLKGR----RKTQSL 1117
            EK     G +SP+ SD+ED WW+KKG K+ E +LKVDP ++ TK V +GR    RKTQSL
Sbjct: 964  EKSSCYQG-NSPIASDEEDNWWIKKGSKTVESSLKVDPQIEITKQVPRGRQKMARKTQSL 1023

Query: 1118 AHLAASRIEGSQGASTSHLCDNRVACPHHRSGMEGDSTRPIDGSKINHGGDIAFIGKSLK 1177
            A L A+RIEGSQGASTSH+CDN+V+CPHH  G+EG++ + +D  + +   D+  +G SLK
Sbjct: 1024 AQLQAARIEGSQGASTSHVCDNKVSCPHHGPGVEGENQKVVDVFRTSTPVDMVSVGNSLK 1083

Query: 1178 RLRLTEKRAISSWFMTAVKQIIEETEKTITKAGQFGRSLTAVDDRNTIRWKFGEDQLSSI 1237
            +L+  +KR+I+ W  TAV+Q++EE +K+  + GQF R    V+++NTIRWK G D+L SI
Sbjct: 1084 QLQFVDKRSIAVWLTTAVRQLVEEPQKSSVRVGQFNRG-APVEEKNTIRWKLGADELYSI 1143

Query: 1238 LYLTDVCNDFVSGVKFLLWLLPKVLISSNSTMNSRRSILLLPRNVENQVCEVGEAYLLSS 1297
            L+L D+  D VS VKFLLWLLPK   + +  +   R+++ +PRNVEN +CE+GEA L+SS
Sbjct: 1144 LFLLDISLDLVSAVKFLLWLLPKANSTPSFAVQGGRNLVTVPRNVENNMCEIGEAILVSS 1203

Query: 1298 LRRYENVLVAADLISEALSSIVHRAMAIMASNGRISGSAAVIYARHLLKKYGSIPSVVEW 1357
            LRRYEN+L++ADL+ EA++++++RA ++M+SNG+ISGSAA++Y R++LK+YGS+PSVVEW
Sbjct: 1204 LRRYENILLSADLVPEAMTALMNRAASLMSSNGKISGSAALVYTRYILKRYGSLPSVVEW 1263

Query: 1358 EKSFKTTCDKRLIAELDPASSLDGELGLPLGVPAGVEDLDDFFRQK--IGGGRLSRVGMS 1417
              +FK T +K+L++ELD   S +GE G PLGVPAGV++ DD+ R+K  IGG R SRVG+S
Sbjct: 1264 HNNFKATSEKKLLSELDHTRSGNGEYGNPLGVPAGVDNPDDYLRKKISIGGARPSRVGLS 1323

Query: 1418 MRELVQRQIDDAFHYLFGKDRKVVTGGASKVLASEKSDEGYQIAQKIITGLMECIRHTGG 1477
            MR+++QR +++A HYL    +K++  G  K   +EK+D+GYQ+AQ+I+ GLM+CIR TGG
Sbjct: 1324 MRDVLQRHVEEATHYL----KKLIGTGTMKASLAEKNDDGYQVAQQIVVGLMDCIRQTGG 1383

Query: 1478 AAQEGDPSLVSSAVSAIVGNLGSTVSKMADFIAGGC-SNFPSASGSLDFVRRILCIHITC 1537
            AAQEGDPSLVSSAVSAI+ ++G +V+++ DF  G    N PS   S +  R IL IHITC
Sbjct: 1384 AAQEGDPSLVSSAVSAIINSVGLSVARITDFSLGNIYQNHPSGVDSSNIARYILRIHITC 1443

Query: 1538 LCLLKEALGERQSRVFEIALATEAFSALAGVYSPGKPSRSQFQLLADSHESNAH------ 1597
            LCLLKEALGERQSRVFEIALATE+ +AL GV++P K SR Q QL  +S++SNA+      
Sbjct: 1444 LCLLKEALGERQSRVFEIALATESSTALTGVFAPVKGSRGQHQLSPESYDSNANNSTIDM 1503

Query: 1598 VFGDSTKVIGRATKIAAAISALVIGAVIQGVCSLERLVTLFRLKEGLDFIQFVRTTRSNA 1657
              G     + RATKI AA+SALVIG++  GV +LER+V L RLK+ LDF+QFVR T+S++
Sbjct: 1504 SNGTGKMALSRATKITAAVSALVIGSITHGVITLERIVGLLRLKDYLDFVQFVRRTKSSS 1563

Query: 1658 NGNTRTMGMHKIESSIEDYVHWFRLLVGNCRTVFDGLIVELLGEPSIVALFRMQRLLPLS 1717
            NG+ R+MG  K+ES IE YVHWFRLLVGNC+TV +GL++EL+GE S+VA+ RMQR+LPL 
Sbjct: 1564 NGSARSMGASKVESPIEVYVHWFRLLVGNCKTVSEGLVLELVGESSVVAISRMQRMLPLK 1623

Query: 1718 LVLSPAYSIFSFVVWRPFI--QNAAFTAREDVNQLCQSLTIAIGDIVRHLPFRDVCFRDS 1777
            LV  PAYSI +FV+WRPF+   N+  +  ED ++L QSLT+A  D+++HLPFRDVCFRD+
Sbjct: 1624 LVFPPAYSIIAFVLWRPFVSNSNSNSSVHEDTHRLYQSLTMAFHDVIKHLPFRDVCFRDT 1683

Query: 1778 QGFYNHLMNDTSDVEFAAILELN--DIPLKPMAFVPLRARLFLNTIIDCKLPSSVYNQDD 1837
            QG Y  ++ D++D EFA++ E +  D+ LK +AF PLRARLFLN++IDCK+PSS Y+ + 
Sbjct: 1684 QGLYELIVADSTDAEFASVFESHGLDMHLKSVAFAPLRARLFLNSLIDCKVPSSGYSHE- 1743

Query: 1838 GSRISGVGDSKGHYSERKMKLLDRLVYVLDTLQPAKFHWQWVELRLLLNEQALIEKLETL 1897
                 GV ++K  +     KL+D+LV VLD LQPAKFHWQWVELRLLLNEQAL EK   L
Sbjct: 1744 -----GVSEAKNRHQGNGTKLVDKLVSVLDCLQPAKFHWQWVELRLLLNEQALAEK---L 1803

Query: 1898 ETRDLSLADAVRLSSPSPEKVAASDNEKNFIEIILTRLLVRPDAAPLFSDVIHLFGRSLE 1957
            E  D+ L DA+R S P+ EK  AS+NEKNFI+I+LTRLLVRPDA PLFS+V+HLFGRS+E
Sbjct: 1804 ENHDMPLTDAIRSSCPTSEKPDASENEKNFIQILLTRLLVRPDAVPLFSEVVHLFGRSVE 1863

Query: 1958 DSMLLQAKWFLGGQDVLFGRKSIRQRLTNIAESKGLSTKTMFWKPWVWCISGS------- 2017
            DSML QA+WFL GQDVLFGRK+IRQ+L  + ESKGL TK  FWKPW WC S S       
Sbjct: 1864 DSMLKQAEWFLAGQDVLFGRKTIRQKLIIVGESKGLPTKPQFWKPWGWCNSSSSDHITAN 1923

Query: 2018 --------DSSYLEEGEVVEEGTDSSKYSQKSVELLDNEVLHSSQQHVTERALIELVLPC 2077
                    + + +EEGEV+EEG+ S K     V  LD           TERA ++LVLPC
Sbjct: 1924 KAGKKRKFEITSIEEGEVIEEGSGSRKVLLPRV--LDENSPSVGYGITTERAFVQLVLPC 1983

Query: 2078 IDQSSEESRNTFANDLIKQLNNIEQQINAVT---SGSSKQTGLVPSGIEGPTSKGSNRK- 2137
            IDQSS+ESR+TF N+L++Q +NIEQQ+++VT   + S+KQ G   SG E  ++KGS RK 
Sbjct: 1984 IDQSSDESRSTFVNELVRQFSNIEQQLSSVTNRSTTSNKQMGTASSGSEISSNKGSTRKG 2043

Query: 2138 MKGGSPGLARRSTGST--DSPLPSPAALRASMSLRLQLILRLLPVILEDREPSGRNMRHM 2197
            ++GGSP LARRS+ +T   SP PSPAALRASMSLRLQ +LRLLPVI    EPS +N RH 
Sbjct: 2044 LRGGSPSLARRSSANTTDTSPPPSPAALRASMSLRLQFLLRLLPVIC--GEPSFKNTRHA 2103

Query: 2198 LASVILRLLGSRIVHEDANLTFCPTHSSMVKKEVESSSEASLAIFADLPGESLFGSMLLI 2257
            LAS I+RLLGSR+V+ED     C   S + K E ES+ + S    ADL  E LF  +L +
Sbjct: 2104 LASTIVRLLGSRVVYED--YAVCSPRSELSKAETESTIDPS--SMADLSSEVLFDRLLFV 2163

Query: 2258 LHGLLSSCQPSWLGLKTAAKSTNETSKDSTALVRELAESLQNELHHMQLPDMIRWRIQAA 2317
            LHGLLS+ QP WL       S+NE+SKD T   R+ AESLQNEL  MQLPD IRWRIQAA
Sbjct: 2164 LHGLLSNHQPKWL---KPRPSSNESSKDFTLFDRDAAESLQNELSRMQLPDTIRWRIQAA 2223

Query: 2318 MPIPLPSARCLLSYQPPTTSPSALYPFQSRSSTPGLGSGNSSMPQGSKVASPRVVPNAPG 2377
            MPI LPS RC LS QP +  P+AL   Q   ST   G+   + P  SK  +      A G
Sbjct: 2224 MPILLPSLRCSLSCQPHSVPPTALTLVQPSGSTAAAGTNQRNSPAISKSGTAA----AQG 2253

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
H3K2Y60.0e+0055.12Mediator of RNA polymerase II transcription subunit 12 OS=Arabidopsis thaliana O... [more]
Q54U491.5e-1725.08Putative mediator of RNA polymerase II transcription subunit 12 OS=Dictyostelium... [more]
Q86YW96.8e-0723.77Mediator of RNA polymerase II transcription subunit 12-like protein OS=Homo sapi... [more]
Q751D26.8e-0721.78Mediator of RNA polymerase II transcription subunit 12 OS=Ashbya gossypii (strai... [more]
A2AGH64.4e-0625.71Mediator of RNA polymerase II transcription subunit 12 OS=Mus musculus OX=10090 ... [more]
Match NameE-valueIdentityDescription
AT4G00450.10.0e+0052.33RNA polymerase II transcription mediators [more]
InterPro
Analysis Name: InterPro Annotations of Cucurbita maxima (Rimu) v1.1
Date Performed: 2021-10-25
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR019035Mediator complex, subunit Med12SMARTSM01281Med12_2coord: 272..333
e-value: 1.1E-23
score: 94.7
IPR019035Mediator complex, subunit Med12PFAMPF09497Med12coord: 273..333
e-value: 2.7E-18
score: 66.0
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 2041..2090
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 747..773
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 2264..2292
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 2264..2314
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1054..1075
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 2041..2066
NoneNo IPR availablePANTHERPTHR46567MEDIATOR OF RNA POLYMERASE II TRANSCRIPTION SUBUNIT 12coord: 98..2376
NoneNo IPR availablePANTHERPTHR46567:SF2RNA POLYMERASE II TRANSCRIPTION MEDIATORS PROTEINcoord: 98..2376

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
CmaCh06G010660.1CmaCh06G010660.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0040034 regulation of development, heterochronic
biological_process GO:0090213 regulation of radial pattern formation
biological_process GO:0006357 regulation of transcription by RNA polymerase II
cellular_component GO:0016592 mediator complex
molecular_function GO:0003712 transcription coregulator activity