HG10011341 (gene) Bottle gourd (Hangzhou Gourd) v1

Overview
NameHG10011341
Typegene
OrganismLagenaria siceraria cv. Hangzhou Gourd (Bottle gourd (Hangzhou Gourd) v1)
Descriptionprotein root UVB sensitive 1, chloroplastic isoform X1
LocationChr01: 4965567 .. 5022274 (+)
RNA-Seq ExpressionHG10011341
SyntenyHG10011341
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: CDSpolypeptide
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGAGGCTATTTCAGATACAGATTTGAAGTATTTATTGGACAATTTGGATGGAAGGATAAATGAGAATGAGAAATGGGAACGTGTTGTAGAAAAAACTAATGATCATCTTTCATATAGTGCTAAATGCTGCAAGCCTAAGGTTCTCATCCTCTCTTTCCTTTTTCACATGTGGGATGATATTTTGGTCAAGTTATGAATTACTATTCTATTTGTTTATTGAGAGTTCTTTGTTTATTTGGTTTGTGAAGTGAATGATTCTGAGTTCAAATGGTCAAATACTGATCTTGTTGCAGGATGGTCCCCTGAAATACTCGAGTGTGACAGTATTTGAAAATTGCTGTCCAAAATTGTTGAGAGACTTCTACATGGACAATGACTATAGAAAACAGTGGGACAGTACCATGCTTATGCATGAGCAGCTACAAATGGATGGAACTAGCGGAATTGAAGTCGGTCGCACCTTAAAAAAATTTCCATTATTGACGCCCAGGGAGTATATACTATCATGGAGATTATGGGAAGGGAAAGATAAATCCTTTTACTGTTTTACCAAGGTATTGATTTTAATGCTTTGCCCACCGTGGCGTGCACTCATGCACATGAACACAAAAAGTATGTATTTATTCTGTTTATATTATTTTGATAATTCCCAAACAAGGAAAAGCTCACTATATTGTGGTTCTCTGCCTGGAGGATTGTATTGTATTATAAATTTCTCTTTTATATTGCTTCTAGTAGGAAGATTTATATGTATATAAGAAACAGAACGTTTCTTAAATCTAAGATTGAGAATCTATCAAGCCAATGCAATTACAAGTCCATCATTGTGAGAAGGAGATGGATTTCTCTTTACTCACTCTTCCTCTCCCCATCCATCATTGTCCTCCTCTTCTTCTGTTGGTTCTTCTTTCTCAACAGCCCTACAAGTATTGAGATGCTAAAAACGGTCAATGCCTTCCCAAATGGACAACAAGCAAGCCTTTCAATCTTTGACAATATAAATAAAGAAAACATTAGCCTATACAGTGCCCAACTCAATACCCCCTCCTGCCATGACACCCTTTCTTTCCCTCCCACCCCCTCTGCCACGAAGATGAACTCACCTACCTGCATCCCAACAATGGAAAAGGCACCATCGACATACTTTGCCACCATAGAGAAAAGAATTACAGTATAGAGACCAATAGCATAGCAAACTTTAAGGAACTGGAGTTAAAGATCTCAGTGAGGACAAGGGATTGAGCCTTCTTTATTAGCACCCACTAGTCGTCTCTATGTTGGCCAGAAGAATCTTTCTCGTTTCCTCCTCATACTCCCCTAAACTAGATATTCTTCAAGGAAGCTCACATAGAAGGCCAAACTATCTAGGTAGAAAAGGCCTTAAATAGAAAGGGAACCATAACTGAAATTACCCTTCTATCCAACTATGGAGGGATAAACAGAATTATCTTCCCAGTGGGAGATGAAAGAAAAGGACAACATGGGCTTTATAATCTCATCTCCAACTACCCCTCTGCTTCGCCTGTAGGGAGCATTAACCATCCCAAACCCCCTTCCCAGGGTTCAAGCTCAGCACTAAATCCCCCGCTTTAAATGTCTACTTTATTCTACAAGGAAATAGTTTCTCCAAGCAGGAAGGAGGATTTGTAATTTACCTCGAATCAACCTCACACATACCCCTACTCCTTCACAAGATACCTCCACAGTGTCTACAAGGAAATGCTTCCATGACGAATGATACAAAATTATAAGGCCCTTTATTCCCTTATTAGTGATTTCTGCCTTTTAAATCCTTTTTGGTTAAATAAGGCTCTTTTACTTGTGAAAATGGGGACCTAGCCAAAACCCATTGCTTCTAAGTTTATTTCCTTGAAAATGACTTTTGGCAGGAGTGTGAACATCCTTTGGCACCACAACAGAAGAAGTACGTGCGAGTGAAATTTTTCAGATCTGGTTGGCGAATCAGGAGAGGCAAGTGGCTGTCCTCTCTCTTGTTGCTTTTTTTAATGGTCATTAGTTTTTTAATTCACCTAGGAACATTGCATATTTTATCAAAGAAACTCCAAATCCAATTGCATATTGTTAATTGCTCAGGTCATAGAAACGCGGTATAATTAATGTCTGTAAAAAGTTCCCTTCCTTTTTTGTTATGCTGTCTTGGAGTTCATAGATGGTTAACTGACGTTTTTCTTTCTTTATAGGGCATTTTTTAAAATATTAGGGGAAATTATCTTTTAGTCCTCTTTTGCTTACTTCTAAAGAAAGTTTCTATTTGCTCCCCACGTTTCTTGCTGCAGTCAACAAAAGGTGATTGAATAATTTTAAAAAAATTAGATTTGTAACGTTAGTTGTGTTGACACAAACATTTGCAACAATTACTTGGTTTTATATTTTTCTTGTATCTCACTTCGCAATTTTATAAATCAAGTCAAATTGTCAAATTACCAAAGACTAAGAAAAAATTTAACAACAATTTTTAAATTAAAAAATGAACCCAATTTTGTAAAAATTCAAGCCGGAAAGGTGTTTGGAATGATAATAAATTAGTTGGGGATTTTATCTATTGGGGAACTAGAAATGGTTGTGTTCTGTCCCTTGATCCTTTAGGCTGTTCCGGTTGAGTTTTTTTATTTATTTTTTAAACCAAACACAAAAAATATACATGTACATAAGAGGAAAAATGTATATGTTTGTGCCTTTGTTTATTGTTATTATTATTATTTCCTTTCCGTTAGAAAAGGAAAACTGGAGCTTGCTTGAAGTCAAAGTTCTTGTTAATTGTTATGGATATTGCCAAGTCTAAGCCCACGGTTTCTTTGTTCTGATATTATATAATTAATACAATTAAAAAGAAGCCAGTTTTTCACTATCCTGGCTTACCATAAAGAACTATAAGAGTGTTTGGACCCCCAACTTTAAGTAGGTGGAGTAGGCCAATTATGATAGTTGGTTTTTCCAACTGTTATAACTTACAATTAACTACAATATTACTATTTTAAATCCCTCTTTGTCATAGATTTTACTATTTTTTACTCGTCCTCTCTTTCCTTCTTTGTTATAGTGTTTACTATTTTCTACTCAGACTAAACTAGTCTACACCCCAAACACAGACTGTTATAACCCACAAACTATTATAACCACTAACTATAATAACCAACCCAGTACCCCAAACACTCTCTATTTTACTATCTTTTAGAATTCAAGGATTTTATTTAATTTTTATTATTTTTTTAATGAGAATTTTAGGATTCAAGGATTAAAATGTCACTTTTAAAATTATGGGATCAGATGGAAACTTTCTTGAGAACTCATGAATATTAGGGATTTTGCAAAATGGAACTTTTTTTTTTAAAACCATCTAAGTAAATAAGCTAGCTATAAGTGTAGAAGATTAGGCGTACATTTTTTCTAGACTTCAAATCTGAACCACTTATCCTAATGGTTTCAGATTATTATAATTGCAGTATCCGGCAGAAATGCATGTGAGATCAGTATGTTGCACCAAGAAGATGCTGGTTTGAATGTGGAGATGGCAAAACTTGCGTTTGCAAAGGGCATATGGAACTTTGTCTGTAAAATGGATAAAGCATTACGCAAATACGCTCTAATCCACTGCCCTCAATCAAGTTCACTTGTCACTGCAATTACTCTGATTAAGAAGGTTAAAATGTTTACTCTTTACTTTATTGATACTAATTATACAATTTGGTCAAGATTAATGTTCGTCATTTTATTCATTATCCAAGTGTACGTAGTATGTACTTAATTGTTTTATGGAGTGTTCTTATACTCACGCCCCTTACTGTTGTGGCAGAGAACACACTTCGTTAGTTTGCTTCGGGCAGTGTTAGTGGTCTGTTTATAGGTTGAGCTTCGATTTGTAGAAATTTGTCGTAAAGGGAATTCCATGACAAACATGTTATAGATTTAGGTCACTTTGAACAGAAAAAAATTATGGCAGAGTTTTTAAAGTATAAGTGACAATAGTACATACATGTTCCTCTTATTGGTGTTCTCTTCCCAAGGTGTCCTCTCCGACATTTAGTTCGAAAAGAATCAACGAATTTTTCAGAATTCTGCTTAAACTTCTTTTGCTTGCTTCGACTCGGCTTGTCTAAAGGCTTCTAATTAATGGAGTTCTCTTTTCAACACTTTGGATGGGTTTTCAATTCAGGATATCTATAGTGGATGAAATGCTTTCATTAATCCCTTTTAAGCTTTTTAAGACTTTGTTTTTTAAGGTTATGCTCTTGTATGTGTTATTAGTCTCTTTTCATGTTATCCTCATTTTGCGTTGAGTTATATCCTTTGGAATACATGTTCCTCTTATAGCTTTCTTATGATGGATATGACTGAAACCCATTTTCGTACATAAAGGTTCCAGATGGATTTGAGGACATGGATGGCATTATCTCTAAAGCAAACATTGTAGAAACCGAGTCTTGTGGAGAAGTTTCTTCAGAAGAGAGAAAGCTCTCGAGGGCATCAAAAAAACTTGTGGCCAATGGTTTGCTTCTAATTGGTGGTGTGATCTGCCTGTCGCGAGGTCACTCTAGTCTTGGTGCCAAAGTTGTTATGGCATATATTCTTACAAAGCTAAGCAAGCGAGTTGATGCACCAGGAGGCCAAATGGCAACTAAAGAACCGTAATTATATGACATAGTGAAGGAAGGGAGGAGATATAACCATGTTTTCTTTCGAGCACTAGGCTCTTTATACTACACAAATGAAAAGTTTCGTTTTTTTTTCCCCTTTAAATAAAAAATCTTGTTCAAATATCTGTATCATACAGTATAGTAAGTTGCAAAGTGTTTGTTTTTGTCATTAATATTTGTTATAGATCATATGCTTCATTTGTTTCTATAGAGGTTATAGTGTCAAAAAGAGTTTGTTTGGATTATGGGCCATTTGGATTGATTTTCTAAGTATTTATATTTAAACACTTTGAAAGTCAATCCAAGCGGGTCCTTTCTAGGTGCTTAAAAGTACTTTCAAGCATTTAAAAAGTCATTCTAAATATGTCAAAAGGTGAGAAGTACCATAATTCTGATGATCTGTCAAGATATATTCATTAATTGGTCATTCACGATTAAATGTCCAGATCTCGATAAAACTAAGGGGTTGTTTGGGCGTCAGGTTTGGAATGGGATTGAGTTGCAATGTAATCGAGTTGCAATGTAATAAAAAACCTATGTTTGGATTGAGTGTTTTGAGCCTGATTTGTAATATCAAACTCATTTTGTTTTCCACAATTCTCAAACCAACTCTCTTTTCCATCGTTTTCACGTCTTATGATCTCATTTCCATTCCGCCCTTGAGTTCTATTCTCAATAATTTTGTTTACATTCAAGCCTTTCAAATAGCTCCTAAATAGCGTAGTTATTTAGTTCAATCTTAACCATAAATTCTCTGCCAACTAATTACTATTTTCATAGGTAGGATTTTGCTCTGCTAAAAACACCCACCAAATTACCACCTTCCACATTATCAAATGAGCCCAAATGAATGTAAAGATCCTACATGACCAGATACAAAAATTCCTTAACAAAGGACATAATTTTCCAAACCTTAGTCCTTGTGTCGTACCAATCTTTACTCACACAAGAGAAAGAAGGTTCAAGGAGAACGTGTATTGATAATTGAACGATACACATGTAGATTCATCATTCCTTATATCTAGAATCATGATTATAAAAACTTAATTTTAAGTAGGTTACTTTTTTTTTTTTTTTTTTTTTTTTATATAATCAACAACCTTTTTGGGTACAAATAACAAAATTTGTGAAGTGGAAACGTATTTTTTGAAAGAACAAGAGTTTAAAAGTACTTTCTATAATTTACCATTATATAAAAATAAAAAGCTTGAACTTTGCCATTTATTTTAGAAGCTTCCATGGTTTCAAATTATGGATGTATTTAGTTTAACTTAGACCCCGTTTGATAATTATTTTGGCCTCGTTAGGTAACCATTTCATTTTTTGTTTTTGGTTTTTGAAAATTAAGTCTATTTTTTCTCATTTTCTTACAATGGTTTCAGTTTACATCTTTTTTAAGTATAAGAGTTGCATTCTTAACCAAATTCCAAAAAACAAAAAATACTTTTTTAAAACTATTAGAATATCCTAAAAAGTAAAGAAGTAATGAAGTTGGATTTGAGATTTGGTGAGGGGATTTAAGAGATTCTAACATACCTTCCTTAAAGTCACTAACCAACCATTGGAAGTCCCAACATAATATATACATCTAGTTTGAAGCAACTCTAAGTATTGAATTTCGCACTTTAAAACGTTGTAGAAACATTGAAGATGCTTTGGCTCATCATCGTCGTCATTGTAGGGAAGCATTAGACACGAAGGGTACGAGTGGTTAGAAAATTTGTACGGATGACCCAAAAATTTGGCAAAAAATGTCAAATGACTTGGATTTTCAAAAAAATGTCAAACGACCCTTTGCTGACGTCAAGATCGGATGAAATTACCAAAATAAACTCGCACACGCAGAAAGCCCATCTCGCTCTCGCTCTCTTTCTCTCCCCCTCTCTCTCTCTCCCTCTCTCTCCCCCTCTCTCTCCCCCTCTCTCTCTCTCCCTCCCTCTCTCTCTCCCTCTCCCTTCCTCTCTTTCTCTCATCTTCCTCTCTCTCGCTCTCTCTTTCTTGCTCTCTCTCTATTTTCTCACTCACCGTCACTCTCATTTTTCTCGCTCTCGCTTACTTTCACCACCATTGTTCTCGCTCTCACTCTCGCTCACTTTCACCACCATTGCTCTCGCTCTCGCTCACTCTCGGTCACTCTGCTCTCGCCCACCATTACTGTCGCTTTCGCTCTCGCTCTTTCTCACTCTCGCTCACCGGAGTGACTCGTCGTGTCGGAGAAGAAGGAGAAGACGAAGAAGAGGGAGAAGGAGGATTTTGGGAAGAAGAGAAAAAAGGAGGAAAAAAAAGTTAGAACGACGCGGGAGAAAGGAAGGAAGAAAGAAAAAAAAGAAGGGCAACGGTGTAATTTCACGTGGTCATGGTATAATCAAAGGGTCATTTGGCATTTTTTTAAAAAATTAGGTCATTTGCCATTTTGAGCCTTTAAAATGGGTTTTTATGCAATTTTTCCCGAGTGGTTGGGCCACTTAGGCAAATTGTTTCTCCACTAAGAATAAACGCCATGAAATCGGACATAATCGGTGTATGTATCCAACAATTCTCCGATTACTCTTCACAGATCACTTGGAAGATCGCTCAAATCCCTTTCCATGTCTCTGCGTTAGATGCGATTTGTTGAGTGATTAAGCGATTGAAACAACACACAAACGACTCTCTTACTTAAATAGACGGATGAAAAATGATTAGGTGTAGTCACATACATCCCTTTTCTATACAAAGTACAAAAAAAAATAATTCAATTTTTTTTAGTGGCATACCACTTGAGTATTAAAAGAAATCCATCCATATGGTCGAGAGAATTGAATGTTCTATATTCAAAAGCTCCCTATTAGAGTCTTACACGGGTTGTTTATAGCCTTACAAGAAAATAAGTCAACCAACTAATTAATTTTAATTAAACATTTATTAATCTAAATTAACAACTAAACTAAATACTAATTAAAATGTTTAAATACTATTTTGGTCCTTATATTTTTAGTTTTGATTTATTTTTGTCTCTATACTTTTAAAATATTCATTTTGGTCCTTATACTTTCAACTTTGATTCATTTTGGCCCCTGTACTTCCAAAATGTTCGTTTTGGTTCTTTACTTTAAAAAATGACTATTTTGGTTCCTTCATTTTCATTTCTACTTTATTTTTAAGGAATCGAAATGATCATTTTTTAAAAGTTCAAGGACCAAAATGAACAAAAGTTGAAAGTATAGAGACTAAAATGAATCAAAATGAAAAATACAAGGACCAACGTAGTATTTAAACTTTATTAAAATATACTAATTATCTTCTAATTCTTCTTATCACATCTTTTTAATGTCTACTTCTTTGTTTGTTGTTCTCTCTTTACTTATCTAAATGAATAATCTCAATCATGATTCTTAACCTATTATTCAATTTCTTCGTGTGTTGTTTTATTTTCATCTTCATAGTGTCACAAGAAATATAGGGGTCAAATTATTAGCTCTTATCATTTAATAATGTTTATTAATCAATCACTATTGATGTGAAATTTTAGAGGAAATCGGAAGATGGGGTTCACCTTTCCAAAAAAGTATAGGAGAAAATGAGTTTTGAAATAGGAATCTTCCCCTTCTTGGAAGATAACTGGGAAAATAATGCTATCAATTTGAAAAAATAGGTTGAAATGAATGTTTATAGACTTAATTTAAAAAAATAAAAAAATTATTACTAAATCGTGCCTTAAGTTTAATTTTGGAAAAAAAGTCATTTAAAAAAAAGTTGGAGTGTTTGACAACTATTTAAAATTGTTTTTTTAAAAAAAAAGTTTATGAAATAAGTTGGCTTGAGAGAAACACTCCAAATCAACTTTTAGAAAACTAATTTTTGAGTGTTTAATGGTTAATCTCTCCCTAATTTGTATAATACATAAAATTATCAAAATGCCGTCACTAGTCCTCTATCTCACTTCTACATGTATGCTGCTAGTTACCGCGCTCTCTGTAGACGAAACTTTTGGCAACCATCTTCAGTGACCTCCACCGGTGATCACCATTGGATTTGGCAACTACTAACTCCAGTGGCCACCACTAACAGCAAACTCCAACGACCACTACTGGTAACCAACTCTAGTAACCACTTACAACGTCCACCTTCGACGATTAACTCCAACGACCACTTCCAACAATCAACTACAACGACAAACTCCAGTAATGACCACTAATGATTCACTGGTTCAAAGAAATATTCAACTAATGAAAGTATTTTTAAATAATTAGTTCATTTATTGTAATTTTACAAAGATATGTATGAAATCAAAATAAATTTGTATATAAAAATATAAATATAAAGTGTAACAAACACATGAATATTTTTATTTTAAGTAATTTTCATAGAACTTTTCGAAAAACATTTTTTTTCCCCAAAGGTACATACATAAAATGTGTTTGCCGGTTGCCTGAAATGGATGTGGGCAGTGTTCCAATTTTACCTTCCAAGTCATAATGGTCCAAGCGACTTGCTTGTTTCGCTTCATATATATAACTCCATCGATCTGCACGTCACGGACTCTCAATCGCAGAGCCACCGGCGTCTTTCTTCATTGCAATGTATGGGCTGCTGCCGTTCTCTTATCAGCCGCCGGAGCCGATTTCATTACGTCGAATCTATGCCGGTGTTTTAAACTATGTACCAGGCGGCCGTTTTCACCATTGCTCGGATTCTTCTATGCGAAGGTCATCCGCAGCACGAAGACCTCCTCTTAGCGTATTTCCCCACTTTCTTAAGTCCACAAAACTCGTCCAAGGTTACTTCTCTCCTTGTATCGGAACTAGAATGAAACCTGCTCTCGTTCATTCTCCTTTGCTGGCTGGTGACGGCCATGGGCATGGTGGAAACAACAATGGTGGTTGGAATAATTCGAATCCTTTTGGGGGTTTTGGATGGTGGCAGGATGACGGTGATTCTTCCCCATGGTCGGACAATGCCTTCTTTGCCTTCTTCTTTACCTCCATTTTGGGCTGTTTCTGCCTTTTTCAATTGGCAGCAGCGCTAGCACGTAATGAAATGAACTATGAGTCTGTTTGGGAAGTAAAAGGAGGTAAGCGAATCCGCCTCATTCTCGATACGTTTAGGGATGAGTTCCATGTTGCAACTGGCATGCCGTCGTCTTCGTTATCCTTTTCCTTTGTCAATGTTTGGCTTCGTTGCAGCGATGTATTCAGGCGTTTGATGCTTCCGGAGGGTTTTCCAGACAGCGTTACCAGCGACTATCTGGAATATTCTCTTTGGCGAGGAGTGCAGGGGATTGCCAGCCAAGTTAGTGGGGTCCTTGCAACTCAGGTGCCCATTTACGTTCGTCTATGGTTCCTCTTTCCTATTTCTCATCCAACAAAAGAATAATTGACTGCATTTTGCTTGAACCTCTGCTGGAATCCAGGCACTGCTTTATGCTGTTGGATTGGGAAAAGGAGCTATTCCGACTGCTGCTGCAGTGAATTGGGTACTGAAAGATGGATTTGGATATCTGAGTAAAATTTTATTCTCAAAATATGGACGGCACTTTGACGTTCATCCGAAGGGATGGAGGTTGTTTGCTGATCTTCTGGAAAACGCTGCCTATGGGATGGAAATGTTAACTCCCGCATTTCCCCTGCATTTTTTCGTGATCGGTGCTGCTGCTGGGGCTGGACGATCTGCAGCCGCCTTGATTCAGGTTCTTGGTAGTTGATACGTAATTTACACACGATATTGGAAGTTGTGCTTGTGCCTCATTCCCTGTGTTTGTTACCTTATATTTATATATTTAATCTGCTGATTAGTTCTTTCGACTAGGTAGCTTAATTTGATTTAAAAAGTGAAACGCAGAAGTATTTAGGGAAACCAATGGATGGGAAACTGTCTAAGCTTTTGATAGTTTGTGGAGAATTTTGGTTACATGCAACGAGAAGTAGATCAAGATCACAAATGTATTAGAGGGAACCTTTTCTTTAACAATCAAAGTGGAGGGATAGTGGAGAAGAAGTTTGGGTTTCAAATGTTTACGGTCCTTCAAATTATAGAGAAAGAAAGGTGTTTTCGGAAGAACTATAGGGAGTGTCATCGGAGATATCGTGAGAGATAATTGTATAGAAGCCTCAAAAAATAAGTCCAAAATGGATTTTGCCCTACTTTTTGAAACTTAAGAACTTTGCCCTTTTGCTTATGTCATCATCTGCTAAAAACACCAAATTATCCTTAATTTGTTTTGCTCTCTTCCTCTTCCCGATTTTCTCTTTCTCCACTTTTTTTTTTTAATAAATTTTATATATGATTATTATTATTTTTTGGATAGAAACAACTGTTTTCATTGAGAAAAAAATGAAGGAATACAAGAGCATACAAAAAAATCAAGCTCACAGAAAAATCCCACTAGAGAAAGGGTTTTCAACTAAGTAAGATATTGCTTAGGGAATAATAAAAAAATCTTTGAAACCGAAGCCCAAAGAAAAACGTAAAACCTCACCAAAGACCAAACCTCACAAAGATCCCCATCCACACCTCGAAGCGCTCTATTGTTCCTCTCCTCCCAAAGATTCCACAACAACACGCCCCCCCCCCCCCCCAACCAAAGAAAACGACCTTTCTCTTCGAAAGGCGGATGAAGGAGGAACTCCCCTATCATGAACTGAACATCTTTCTGACGAGCAAGCATAAAATCAAACTCCTGAAAGAATCCATTCCACACAGATCTCTCAAACTGACACTCGCAAAGGTGATCCAGGTTTTCCTCTGCCTTCCGACAAAGGATACAACAATAAGGACCTATTAACGTAGGCATCTTTCTCAAAAGCCTATCCATCGTGTTCACATGGCCAAGAAAATAATTTGACTTTCTTTGGAATCTTAATCCTCCATAAAACATAAAAGAGAGACTCAACAAGAGGAGAGAGATCCAATAAAATCTTAAAGAACGACTTACAAGAGAAGCCCTCCAAGGGGTTAGGACTCCACACACGAACATCCTGTCTCCCAAGCTTAAAGTTAAAACCCTCAATCAAGGAGAGAAGAGAGGCCACCTCTGTCATTTTCCTATTGAACAACAACCGACGAAAATCAAAAGAGAAAGAAATAGAGTTCCCCAACTAAACCAAAAAGTTTGGCATGAGAAAATTTTTCAAGGAAGACAAATGATATAACTGAGGAAATGCATAAGAGTGTGGTCCATCCCCCATCCAATGATCTTCCCAAAAATACGTTTCCTTACCATCTCCCAAAACACAAAAAACAAGATAGGAAAAGGAAGGGAGCTGAATAGAAATATCATTCCACGGATTTCGGTGCGTGCCTTTATTCCCCTTAGTTGCAAGGGTCACCGAATGTGGGATTTCATTGGAGAGGGAGGTCACCGAAATGGGTTTGTGTTGCATTGGGGGATTTTCGCTCGAATGGGTTTGTCAAATCTGTGGGTTTTTGCTCGAGAGTGAGAGAGAGGAGATCTAGAGAGTGAGAATGTGAGTGAGAGAAGAATTGCCTTTGCGGCAGAAGTTAGAGAGCGAGAAAATTTTAACCAATCAATAAACACTCACAAAGAAGAAAGGGTTTGTCTGCAAAGAGTGAGAGAAGATCGACAGAGGGGGGCGAGATGAGAGAGCGAAAGCGAGAGGCCCAACTTGCATGTGTGACATTCCGGTTTGGTAATTTCACTCGGATGATGTAAGCAAAAGAGCAAAAATCTTAAACTTTATAAAGTAGGTTAAAAATCATTTCGACCCAAAATTTTGGGTTATCTATATAGTTTTCCCATATCGTGAGGAATTTTTGCATTTCGGTGTAACTTGAATATATATATGTATATAAAGACTTGAACTTTCATTGAGAAAAAAATGAAACAATACTAGGGCATACAAAAAATAAAAGAAAAAAGAAAGAAGGAAAAAATAAGCCCACCAAAAAGAGCCCAACTAAAGGGGGCTCTAATCAAGTGAAGTGAGACCTATTGGACAATTACAAAAGAAAATTTCGTCATTAATGTCTAAAGAGAAACTTTGAACCTAACAAGGGACCAAACATCACTAGGATCCCTCTCTAACTCTCTAAAAGTTCTATTATTCCTTGCACCCTACAAACTCCATAACAAAGCACAAACCTTCACTTGCCACAAAAACCTCTAATTCTCTCGAAAAGGTTGATGGAGAAGGAACTCCTTAATCATCTCCCAGAGCCATATGTATCTGGCAAGTTGAAAGCTAAACGTGTTAGAAAAAAGATTCCATACCATCCAAGCACAGTTGCAACACCACAAATATGATTAAGATTTTCCTTCGCCCTTTGAAAAAGAATGCAACAAAAAGGCTCAACCAAGAAGACTCTGCATTAATTCTTATGGTGATGCCCAATGAGAAACATTAAATCTCACAAGACTCCCTCTCAATCCCTCTAAGGATTCTATTATTTCTCTCCCCTATAAACCCCACAACAAAGCATACACTCTGGCCTGCCATAAAAAAACTTCCCTTCCCCAAATTGGAAGATGGATGAAGAACTCTTCGATCGTATCACTAAAAGCTTTGTGCCAAGCCAATTGAAGGCCAAACACATCAAAGAAGGCAAAGGATGCAACAGAAAGACCCAACCTATCTAATGTAATGAATTTTCCATGGATGACCTGCCAGACAAAGAACTTCACCTTTTTTTTGGTTGAGATTTTCACCTTTCAAAGACTCGAAAAGACGAACTCCCTAGCAGGGAAGGGTCCTCCAATAAATAATGAAAGAAAGAGTTACAAGAAAAGCATTTAGAAGGGTTAGGGCTCCAAAAATGAATATCCCTTCTCCTTTGAATAAGATCGAAATCTCCAATTAAATAAAGAAGAGCCATGGTCGCTGACATTTTTCTTTCTATCAACGAACAACAAAACCCAAACGAAAGAGAGAATGAGCCCCCTAAATGAACAAGGGCAGCAACAACACAATGATTTTTCATAGGGATGAGTGATAATGATTAGTGAAACTCCTGCAGTGAGGTCAATCCCCCCTCCACTTGTCCTCCCAAAAATAAGTATACTTCCTGTCACCCACCACACACCTAATCAGGTCAGAAAAAGAGGGGAGCTCATTGGAAATTTCTTTCCAAGGATTTGTGAATGTGCCTTTAACCCCACCCCACATCTAATCTAATAGATGAGAATCGTACTTGCTCATGTAATCCTATGCTGAAGAGAGAAGGACCGATGTAAGTAGAATGTGGTTAAATTGGGTAGGTAATAGGTTTAAGTTAATTCCCCTTTACCCCCACTTATACTAAAACTCTACTAAATAGGAGTCTTCCCCCCACGTATGGACAAATAATGAATAAGATTTTCCTTCAAGAATTCTCCAAGTTTCGTAGTCTACATCAAATTGGTATCAGAGCGCCTTCGTGAAAGGGCCTGATGGTGGTCAAGAACACCAACAAGCTTCCCAACCTTCAAACTCATGATGCGAAAGCATCCTTCTCCACATCTCCTCAAACCGTGAATCAAAGACTTGGCAATTTGGAAACTTTAGCGGGTGGTTTATGAGACAATATGATTTTGATGCAAACCTCAATGGCCAGTTGCAACAAGATATTGAGAAACTATCGTTGGAAGTGGAAAAGATGACCAACAATCAATCAAGAACCAACCAAGAAAATCCAAGGATGCAAGAAGTCCACCCAGAAGACAAGTTTTAGAATTTCAACCAACAATCAATTATCAAAATCATTCGGTAGGTATTCTTCCCCAACAACAATACGATGGGATATGATTTGGACTCTTCAAGCGATGAAGGTTGTCCACAATTCCACCAAAATTATTTTTCAAGGTACCTTCCTAACCCTTTGTATCAAGAAAACCATCTTCAAGCCCAAGAACCATACCAAAAACACAAAAATTATAGTCATAATAGCCTTGTTTTCTATCAAGAGGAGAATTATGCCCTCCCAAGACCTCAAGATCAAGCACGTAATAATTCCCATGGCCAAGAAACTTATCAAACTCATCATAATGGTCAACAACATCACCCACTGTTTACACATTATGACCAAGAAGTTGTCCAAGAAACAGATGAGAATCCGGGCTAGGGTGCCTCGACTAATCTCATGGGACAACTTACCTAACCCTACAACATTTGGATATCAAGGAAACTTATAAGATATTAATTCTTAGGTAGGTGGCCACCATAGATTGAACTCATGACCTTTTAGCCATTTATTGAGACTATGTCTCCTTTTTTACCATTAGGCCAATCCATGATGGTTGAAAACTCAAAATATTAAATCTTAGGTAGGTGGCCACCATGGATTGGGAGAAAGAGCCTTTCGTTATTCTTAGGCACAAGTATCTTCTAATCTTTCTTGAATATTTTTTGTTGGGGGGGGGGGGGGGGGAATTTATACCCCTAAACTTTGGGAGTTGTATCAGTTAAATTCTATACTTTCATATTTGTATCATCTGATAGAATTGTGTTCTAAATGTTGGTAATGCATAATTTCACACATGTATAAGACTTCTTTAAATGCACAGAGTAACTTAATATTAGAGAAAAATGCTAGAAGCCTAGAATCAAATAGATAGTAGCGAATTTTCATTAATATGAGTGGGTTTTTTTATCTTCTTGTCTTCCTCTATTTTTTTCTATTTATTTAGGAGAATTTGCACGTTTAATTTTCTTGTTACTTTGATAGGATTTTAGAAGAATATTTTTATTTAGGTAATTTTGAGTTGATTTAAAATGCAATCAAGTGAAAATAGATAAGATTGATTCATTTATGAAAGTTTAGGGTTTAAATTGATACAATTATGAGTTTGGTGTTTTCATTGATATAACCCTCAAAGTTTATAGGTATAAACTGATTTTCCCCTTTTTATTATTATTATTTTATTTTGTCCTTCCCATATTCTACTTTAAAGTTTTCTTTTCATGTGCCCATTTGTAAAGATTTTTCCTTCTGTCTCTGATTCTTTTTTACTAGTAATCTACTATGCGCACTTGGCCTGCTGGATCCTTTATCAAAAAATATATATTAATAGAATACAAATATATAAGTTTCCTCATTCATCTTTCTTGTTTGACATATCCAACAGCATGTGCATCTATGTTTTTTGTAACTTCAACTCTTCAAGTCATTGGTATCTCCCTCAACATCTACATTTAGCTTTTTGATTTCAAGTTGAATATCATATATTGGCATTTTACCTCATTCAAGCTTTTGCCTTTCATATAAGTTCCAAAACTTTTCTGCTTTATGCCATACAATCTGGGTGAAAAAAGGCAAGCTCCAAGATAACATTCATGGGCTTAGTGACTTCACCTTAAATACCTCGTAAAATAAGTTACATCTTTTTTTTAAGAAAAATATTATTATTTTAAGTTTTAATGGAGTTGCACAATTTTTGAAAGTCGAATACAATTTTCTTCTTCCTCAGGCTGCTACTAGGAGTTGTTTTTATGCTGGCTTTGCTGCTCAAAGGAATTTTGCCGAGGTGAAATAGAGTAATCTCTTCTCTGGTTAGTGTGTGCTAGCAAAGTTACAAACACCATACTTTCTTGTAGTTGTAGCTGCAAGATTCATGTAAGGAAAGAAATAATTACCACCGAGGTTATTAACTCGTGAATCGGAGTGCGTATTGAAATTAAAAATTAGTGTATCGTGTACGGTAAGTTTTGACTTTTAGTTAACATTTGAATATAAATTATTTGTATACATATATAAGCAAGAATTAATCTTGATTCTTGAATTCTGAGTTGTTGATGAAATCTTATAAATATGAAGGGTTTTTAAGAAAAGAAATGTAGTCATTAGTGTCTTAATATTACAGACCTATTGTTCTTTCATCTTCCTTAGAATTAGAGGCTAAGAAGAAGCACAAATACAGATATTAGACATAGAAACGATACAATACAGACACGGCGACATGTCATTTTTTAAAAATCTAGGACACCACACGACAAGGACATGTTTATTAAATTATGCATTTTTAAAAGTATATATCATTTTTATACCAAAAGAAAATTCAAAGTAAATGGGTTGATGCACTTATATGCTTAAAAAACTTTGTTTGATGTATTTCACACTAAAAAATTCCAATGCTTAAAAAACTTATGTGTCTTTCGAGTCTACTCAACAAGTTTTCTATACACATCTAACACATTTGTTGCACTAACGAGTGTCGGATACGTGTTCAACAAGTGTCGAAGTGTCCAAGTATCCAACACGTATCAGACACTGACATGTTAGCCAAACTAAAGTACTCGCTTCTTAGATTAGAAGATTCTTTAATTCTCTCAAGTCCCAGAATTAAGACCCTCTTAGTCCTTTCTCCTTCTTTAAACCTAACCTAGTCTTAAACTCGAGGAATTAACTATTTAGTGACTTCATCTATCCCTTTCATTTATTTCATTCCAAGTCCCAAGATCAACATTTAGGGGTGAGCATCGGTTGGTCGATATTGGTTTTGGGCAAAAACGGGCGCCAGCCACCAACACGTCGGTTTTCGTGGTCGTGGGATGAGTTAGAACACCAATCGGCCAACTAGTCAGGCGGGCGGCGCGGTTTCGTTGGGTTTCTAGTTTTGGAGAATTGAAAAAAAAATGAGAGGAGGGAGAAGTAAAGAAAGAAAAAAATGGAGAATAGAGAAGAAAAATAAAAAAAATAAAGGAGAAGGGAGAAGGAAGAAAATAAGGAAAATTAGAGCACGAAAAAAAAAGATTGGGAAGAGAAAAAAGGAAGAAGAGAAAGAGAGGGGGAAAGAAAAGAAAATGGAGAAAGAGAAGGAGAAGGGGGAGGGTTTCGTGAGAGGGAGGGGAAAGAAGAGAGAGAAGGAAAAAGATAATGATGATTATTGGATAGGAAAGGAGAGAAGAGAGAGAAGGTAAAGAATTAATGATGACTATTGGTAGCTGGGAAAAGAGATGAGAGATAATAAAATTAATTATTATTTTATAAATACCAAAGTGGTTTTTGTGAAAACCATTAGTTTTGGGCATTAAATGTAATATAATTACACATTATTGACTATTTCTTTTTCCCACCATCCATATGCACATTTTTTTGAAAAAAAGTATGGAGGTTGGTCGGGGCCGGTCAGAATCCCTGGTTTTTCTTGGACGTCCCGTTTTGTAATGGACCAAACCGACCTCTGACCAGTTACATGGAAAAACCAACTGGCTACCTTCGGTTCGGCTGGTTTCGGTCGTTTGGCTCAGTTTTTCGGAATGCCTTGCACACCCCTATCAACATTTAGCCCTTCCACTTGTGCATGTGCCACAACAATCTTCATCTTCTTCAATTTTCCTTTTCATGTTGGATGAACTGTTCTGTTTTCTTTGATATCCGCATGGGCACACCAAAGTAAAAGACATGCATCGCTTGTATTAAATGCATGCCGGCAAATTCATCGCTTGAGATGAGGCGTACGCACAAAGGCTTATGCCTCAAGAGGCGTAAGCCTTGAGGCACAATATTGCCGCCTCATCTCAAGGTTTATGATAGGTTTGGAAAGTGAACTGGTGATTTAGTTGTGTGATTAAGAGACCTACGGTAGCACAGGATGTGAGATGACATGAGGTATATGTTGAAGTTATCTATGAGGTGAAATGAATGAGAATACACACAAGGTTGTCACCCAAAACACTAGCAGAAGTATACACTATTGCTTCGGCAAGTAATACACTGAAAGTATTCCAAGATCGAACCCACAGGAAAATTTTGCAAACATCAATTATTACAGGCATGCGTGCTACAACAGGTTAGCCTCGATATGCTGGTAACTTAAAATGAATAAAAAGGTGGTGGACTAAGCATTGAAATGAAAGTAGAATAGTAAATGTAAAAGATATGGATGATGGTGAGAAGCAAGACTCAACTCATGACTCACCCCTATGTTGTGTTGGTCACGTTGCTCTAGATGTACCTTGACACATCATGAATCTCCTCATACAATGCTCTTTCGATACATTATGATGCTCAACATGGATCAATATATGTCTATTTGGTTTTTGTTGATAAAATTGGCCCAAACCCTCCTATGTTGGTAAGTGGTTGGATTATGTCTATAATGCAACCTAGTTGTTTTGAGTATTTCCACACACCTTGACCCTCTCGGTGCCTAAAGCATGCTACTATTTTATATCGGTTGATCAGACAAATAATAGTAATTTAAACAAACACTCTCAAAACAACAATTCATTTCATTAAGAAATCAAAGCGCTACTAGATCATAGCCGAAACACAATATAGAGGTTTGCCGCGCTACTAGATCATGGCTAAAACACAATATAGAGGTTTGTCAAGCAAAGTCTTGCTAATAGAACTTAGATCATGATGGTGATGAAAAACATAAAAGAAATAGTAGAAGAAAGGAAACTTAAATACATTGTTCAAGATGTTGAAGATAACTCAAATACAAGAAGAAAAAAATAAAGTAAATGCTTCAAAACTATAGAGAAATTTCTAAGGTTGCGGTAGAACAAGAATGCTGAAGAAAGATGGAGTGTAGCGCCCGTCGGTCCCTAGCAACTCTGGTGGAAAGTTGATGAAAAGTGGTGGATGAAAAGGGTAAACTGGAGAGCAAAGGAGGTGGTGACCTGAGGAGGAAGATGATCTGAGGCCCCCCAAGTCCTCGAAAATCCATTTGAAGAGCAATGTCTTCTCCTATTTATACTACTATGCTCTCTACAAGAAATTGTCATGTGTCTTCTACTTTTTCTCCTCCCACTATCCTTCTGCCAATGCCCTTTTCTACTTTCCACCAAAGATGTAAGTGGTTTTGAAATTACTTTTTACTTTTTCTGATGCAGTGGGTGCAAGGTGGGATTATGCTGGTGAGCAATGTTGGATCAAAGATACTTTTGATTGGTTGTTTAAAGGGATTAAAGGTACTCACCAGTATTTGTAGGAAGATATCTTTAAAGAGCTCCCTTCGTTTGCTCATCTGGTCCGTTGTGTGGTGGAGGAAAGGGAGAGAAACGTATTTCTGAGAAGATCATTGGGTGGGGAAGAGACCTCTATGTGTTTCATTCCCTTATTTGTATCACTTGTCTTCTCTTAAAAACCATTTCGTGGCCGACTTCTTAGTGTGGTTAGGGAGCTCTTATTCCTTTTCTTTTGGGTTCCGTCATTCTCTTTCCGATAGAGAAACGATGGAGGTGATTGCTCTTCTTTCTTTACTCGAGGGTCACCACTTTAGTTTGGGGAGAAGGGATGTCAGATTTTGGAGTTTCAATCCTTTGGAAGGGTTCTCGTGTAAGTCTTTCTTTCAGTGCTTGGTTAATCCTTCCCCTTTAGGCGAGTCTGTCTTTTCGGTGCTTTGGAGGATTAAGGTTCCTAGAAAGGTGAGGTTCTTTTCCTGGCAGGTCCTTCTCAGTCGTACTAATACTTTGGGCAGACTTGTCAGGAAGTTGCCTTCGGTTATTGGGCCTTTTTGTTGTATTCTCTGTTAGAAGGCGGAGGAAGACCTGAACCATATTCTTTGCACTATGATTTTGCGAGTGGTGTCTGAGATTCCTTTCTCCATACGTTTGGCATGTCGAGTACTTGTCACAGAGACATCAGTGCTATGATCGAGGAGTTCTTCCTTAATCTGCCTTTTGGGGAGAAAGGTCGGTTTCTTTAGCGTGTTGGTGTTTGTGCGATTTTATGGGTTTTGTGGAGAGTGGAGAGGGACTCTAGTTGTCATATGATAAGAGACCTCAAAATCTCCATCCATCTGGATGAAAGAGTCTGAGTTTGAAGAATTAGGGACTTTTGATTACCTTGTTGCATACTCTTGAAAGCACTTACACTTGTAGAATTTGCTTTGTTCAACAATGGTAGAATATTGTTATTTGGTAGAAGTCAACTGAGAGTGAAACAGTGACATGTTGAAAGAACAATAGTTCGAGCAGAAACGAAATTTACCATTTTGGAGATGAATCGGGCAGACTTGCTGAACATCAGCACAAATAGAGGTATATAAGAACTTCTTGTAGGATAGTGGCAGTAAATCAAGTATAAGTGGCAAATTTGAAAAAGAAAAACCAATGGTGGTGATGATGATTGATGAAAACCACACATGGACCACCAAATCTGGAAGCTAGGGGTTGTTGAAGAACGAAGTCAGAACTCAGAAAAGAGATTTCATGAAATTTCACAACTATACACTCTATCAATAATCGAGCTAAAAAAAACAGGGTGTTATGGGTGTGTCAACCTAGTTGAGATAAACGGGTGCACTTGCTGATCCCTAGTTCTTGTTATTTCGTTGTTTTTTTATAATTCAAGCATTAGTCTCTTTTCATTTCATCAATGGAAAGGGTTGTTTCCGTTTTTAAAAAGACATATACCATGGTACTTTTGAATTGGTGCCTGTCACCTTGGTGTTTGGGCTGTATTATGGACTTTGATTGTTTTATTTGGTTTACTTAGTTCTTATTGGATATGATTAGGGTGCTAAGGGGATGTCGACCTAGTTGAGATGTCCGTGTGCACCTACTAATCCTTAGGTTATTACGTACTTGGTTTCCTCTTGTATCTTGAGCATTAGTCTCATTTCATTACCTTAATGAAGAGACTTGTTTCTTGTTTTAAAAAAAAAACTAGTTTAAATATATACTGTGTACGTAGTACTAGTTAAAATTTAATGCAATAAACGTATACAATGTATCCCCCTAGAAAAAAGTTCATTGTAGTACGCAGTACTAGTTAACACTTAATGCAAGTTCATGTATGGTAAGGAAATCAACTACTATATGTTGTATAAATAACATCAAACATTCCTAATTAGTCAATCCAAATCAAAATTGATCAACCATGGCTTGACATCTAAAAGGTGTTCAAAAATCAACCATGACAGATCAAATACATAAAGCATTATGTGAGTATAAGAGAGATCACCCCACATGCACTCAAAAAGATTTGCAACAGTGGATTGATGAAAATTTTCACTCAAAGATTTGTAGCTTGAACTTCTTAAGGTACAATATCGAACACACTCGAGCGATCATTTGAGTACTTTTCGGCTAACTTAGAAAAAGGAGGGGATACCAAACGGCGCAAACTTGTAAAATATCCAGAGATGGAGAAGGTTCTTTTTGAGTGGTTTCTCCAATACCAAGAATGTGTGAACATGTACGGAGAGCTAATTTTGGAGAAGGCAAGAGACACGATGGAACTTCTATACCCTCAACAACCTCTTGAGTTGCGCAAATTTTCTCAAGGTTGGCTTGAGAAGTTCAAGCTAAGACATGGTATCAAGTAATTTTGTCATTTTGGTGGTTCTATAGACATAGAGGATGTGGAGAACAAATTGGTGGCTATAAGGGAAAAAATAAACCAGTATCCTAAGAAGAATGTTTTTAATATGGATGAAACTGGTTGGTTTTATAGGTTGCAAGCTAATCATTCTCTTGCAATAAAACAACTTGAAGGAAGAAAACAAAGCAAAGAAAGGCTTACTATTGTTATTTAATGCAATGAGGACGACTCTGAAAAAATTCCTTTATGGTTTATTGGAAAGTACGCAAAGCCATGTTGCTTCAAAAATATTAACATGAACGGCTTGAATAGTCAATGTCGTTCCAACGGACGATGGGTGACAGGTTTGCTTTTTGATGAATATGTTAATTGGCTGGACCAGAAAATGCATGGTAGAAGAATTTTTGGTAAATGGTAAATACTTGTCCAGCCCATCCGACAAATGTTGGACTACTTAATATTGTGTTGTATTTTTTGCCACCCAACATGATATCAAAAATCCAATCATGTGATGCAGGGGTAATAAGAACTTTCAAGATGCACTACTGTAGGAGATTTTATTGTAGGGTATTAGAGGGCTATGAGTTGGGAGAATTTGATTCAGAAAAGACTAAGTTTTAGGTGCCATCAATCTTGTAGTCTTAGCTTGGACGTCGGACGATAAATGTTCAGCAAGAGATAATAGCAAATTGTTTTTGACACTGTAAAATTCGTTCGCAGGATGAAGTAGCCTCAATAAATTTGAATGAAGGAACTACTAAAAAGGCATTCATGAACTTGATACGATGATTAATGGTCTTGGGCACCGCAACAAAATGGATGCCAATCACCTGTTGGATTACCCAAGTGAAAATGATACATGTTCAGAGGTCCAAAGTTTAAAAGAAATTATAGCTAGTGATGTTGAAATTCCTATTGAGGATGAAGCTGAAGATGATACAATGCCTATGCAACCAATTACGTGGAAGGAACTAGGAAGCACTCATAGCGGTAACCACTCTTCGCAATTTTTTGTTGTAGTATGAGAAAGCAACACCGGAGCTTTTTTTTGGGGATATAGTAAGAAAAGTTAGAGATGAAATACAACTAGATTTACATTTTAAGAAGAAACAAACAACAATAGAATCATATTTTACTAAGTTGTCCTAATTATATTTGTAGTTTTTTAGAATTATGAATTTATAATATTTGAAGGGACCATAAATTTATATATGCATCTTCCAGAAAATTATTATCTTATTAATTTATCGAAATTATTAATTTTGACCTTGGTCCCAAGTCGGGACCCAAAATAATTATTATTTTAGAGGTTATTAATTTATTGAGTATTAAATTATAGAGGTTCTACTGTATTCCAATATTTTATAACTTGTTCTGCATCCTTGTGTTTTGTATGTGCGGACAAATGAGGGACATATATTAGTTTACCTTTGCTGATGTCTTGCTTAAATTTATTCTATTTAACCTTCACGTGTAGGTGGATGCCTTTTAATTACTTCTACATTTTTGTCACTTCAATCCATCTTCATAACTGTAGTTTACATATTATTTCACCACACAAACCACCCAAAGCACTTATCTCCTTGTTTAAGCTGGGCTTGAGGCATGTGGCCATTTTCTATCTTTTCTTACTCCTGATGCATGTGGAAAATAAGATCTTTTGCTTTTAATAGATACCTTGAATGAATTTGACCCTATCCTTCCTATTCATATTGCTGAAAGAAACAGAAATTGATTCTAGGTGATTGCCAAAGGTGAAGCACAAGGAATGGTGAGCAAGTCTATTGGTATGATGCTTGGCATTACATTGGCTAATCGTATAAGGTCCTCAACATCTCTTGCTCTTGGATGCTTTAGCATAGTGACCTTAATCCACATGTTCTGCAATCTAAAATCATACAAGTCCATTGAACTAAGGACACTAAATCCTTATCGTGCAAGTAAGTTCTCTTTCCTGCATTTGCAATTTAGGGTTGATGAGATGTATGTGTACTGTTTTTATTACATTATCACTATCACAATATATCATGGTGATTGGCTTGCTTGGTAGTAAGTTAGATAATACCCTATTTCACCCACCCCCTTGCACTTCTTGAGGGGACTTTTTGGAATATTTTACATGGCAAACAGAAGACATTTTCTAGGGTTGATGGGGGCAAGGTTGTTAACTTATGAATCAAAACGTTAAATTAAAATTTGATGTGACGTGTATTATAAATAAAAATTATTTGTGTATATATATATACCAGGAACTTGACCTTATGTTGTTAAGGGAGTTTTATAAATACAAGGGATTTTTAAAAACAAATTTAGTCATTAGTTTGTTTGAAAATGTCTAAATGACCCATTAGCCTTTTCACCTTTTTTTTCTTAAAAGTTAAATTGAGTCTTCAAAGTCTTTCCAGTTGAAAATTTTGAAAAAGCTCTTTGTTCTTGTAGTGCTTATATTCTTGGCTCAAGTGTATTTGTTTTTTTGCATTTCTCTTTTTCTTTCTCTCCAGCAATCACTTCTTTAAATAAGACAGCTGTCTTTATTGATGCTTAATACAACCTGTTTACTTCTTTATTTTCTACCTTTCCTTTGGTATTGTATTTGTTATCTGTTACTAGTACTTCACTCTCTTGTGGAGTTTGTTTCCCTTGAGCATTAGTCTCTTTTCATTTTATCAATGAAAAGTTTTGTCTCTTGTTAAAAAAAAAAAAATTAAGACTTCAACCAGTTTTATCTGTCAGGTATTCAACCAGTTTCAATGTAGCTTTTGTAGTAATGGTACTTGCTATTGGGGATGGGTCAAAAGGGCTGGGGAAAAGTTGCTGGAAGTCAGATGGGGGTTATGTCCATGGTACGGATTCTTTCAAAAATGGTAGCATCTAAAATATCATCGGTATGCAGGCTAGCCTTCACCAGAAGTTTGGTTGGAGCACCATGAACTCATCATAGAGACGTTAGTGATATGATCGAGGAGTTCCTCCTTAATCCGCCTTTTGGGGAGAAAGGGCCGTTTTTTGTGGTGGGTGGGAGCGTGTGCTATTTTATGGGTTTTATGGGGTGAGCAAAACAGTAGGGTGTTTAGAGGAGTGGATGGGGATCCTTCGGATGTTTGGTCCCTCGTTCATTTCATGTTTTTTTGCGGGCTGCGATCTCGAAGATTTTTTGTAATTATTCTATAGGCATGATCTTGCATAGTTGGAGTCCCTTCTTGTAATGGGAGCTCTCTTTTTTTTGTAGGCTTGTTTTTTTGTATACCCGTGTATTCTTTCATTTTTTCTCAATGAAAACTGTTCTTTTATTAAAAAAAAAATTCAACTCCAGCACTAATTTTAAAAAATGGGTCAATCAAAACCATGTTACCCATGGCTGATGAGGAGGGAAGGTTCATCATGATATTTTGGCCTTAAACTAGTGTCTGAAGAAGTCAATTCTGATGAAAATTTTGGTGAAGATTTTGCAGTATTATTCCATAGTTCGGCTAAGGATAAATCAAGTCAGAGGCTGTGTTAGAAGTTCTCCCAGTCAGCCCCCTCTGAAATCCCCTTTATGTTTTCTTCTTTGATTGAGGAGTGTGGTTTGATACTTGGAAAAGCCTCTCTTCACGCATCTAAAGCTAGTTGTTGACAGTACTAGTTTCTTTTTAGCATTAACGGAAATCTTCAGAGGGATCACCCGTGGACTTGGGGTTAAATTCGAAGCTGTCGCATTGACAAAGCTTCTCCAACAAACCCATTTGGATGCTGTTTTAGTTCAAGAGTCAAATAAGGAGGAAGTGGTAGGTTTTCTTATTAATTCGTAATGGAGTCTAAAGTTTTTGGCTGGGCCTTTTTTGAATCTTGTGGAAAATCAGGAGGCATGTTTTCTTTGTGGGTTGAGAGTAAGCTGACAACCTTGGAATTTCTCAAAGGGTTTTTTTTTCTCCCTATTTCAGTAAAGTTTTCAACTAAAAGCATCAAGCTATTGTGAAGGCCCTTGGTATGTAGGTAGCCCAGGCACTTCACACGTTTTGCAGTTGGGACTTTCTTCACTTATTGGGGCATTGCTGCTATTTCCTTTACTGGCATTTAGCTGGCTAGTCGTTTTGATGAATTTAACAACACTGAAGGTGAGTTAGCGGTTCAAGGACAACCAATGAACAAAAATAGCCCCAACGGCTGTATCAAAGAAAGAAATGAAGTTACCAATGGCTAGAAATATATTGAAGAAAAAGTAACATAAGTAGACTGCATCAAACTTCCTAATGTAATCGCAAAAGAAAAACAAATGACACAGATATTTGCATAAAGAGTCCTTTTTTTTTACTAATGTATTTTATCGGTAAATGTCTTATCATCATATCTGTGGCATAACCATGTTCCATGTTCTTGTCATTGTTTGATTGTAGTTTATTTAATGTGCTCCCAATTCCTTAAAGAAGTCCTAGCATTAAATGTGTTCTATACGGGTGGATGTCTGGAAGTTTAATCATTTTAATTCCTCTTTTTGGACTGTGCTCAAGTTATTTTCTTTTCTGATTTTTTACATTAAATAATCACTAGGCATTGTTCCATTCTTGTTACTATTTTTTGGCAGCTCTCCCATTCTTGTAAGCACACAAGGGGACTAAAAGATATGACACCCCAAACAGGGAGGGAACTAATTGAAAGCAATAGTATATTATAAGAAGTTGCTTCAGTTGTTAAATAGTAGAAGATAATGGATAATTAATTTTGACGAAAATGCCCTCATTTCACACGCCCTCTCAAAAGTCAAAACCACTACCAAACATTACTTTTGAAAATTTGAAATTTAAACTTTATCTTTTAGTGGTAAATCTTACCTTAAATGTTTAACAGGTTTGGTGTTTAGTGAATATCTGTTGAGTGGTGAGGTGCCTTCTATTAAAGATGTAAACAATGAAGAACCTCTTTTTCCAGCTGTACCATTTCTTAATACAAGGCTTGCTTGTGATGTGAGTGAATTTCTTTTCTATTGCTATTTATGACACTATTCCTTCTTAATTTTTCTTTTTAAATATTAAATGTGTTCATTTTAATAATACGCCAATGTAACGATTGCAATGTTGGGGCTTGGTTGGAGAGAAATCATAGAATCTTCAAGGTTATTTCTAGGGATAGCAAGAAGCGGAGTTATCAAATAAAAGGGGAAAAATATGGAGTTCTCTTTTTAAGTTAATTTTATTGGAGAATTTCTTTTTGTAAACCAAGCTTTTTGGAGCACTCGTGCGCACCCGTGCCTCCAACTTCTCACTAATAGTGATCCTCTTGATAAAACACTTCCCATAGCAATAATATGGAAAGTGCTCTGGTTTGAAGTAGGGATGCCTAATGTTCGGATGTTCACTTGGAAAGGTGGGGACAAGGATGGCTTCCATGTCATCATCCTTGCCCATTTTATTCCCTCATCACTATGAAAATTTCTGCTAAAATTTTTAAGGATCAAGTTCTTCGCAGGGAATTATTTCCCGTTTATTTCTTTTTTTCATAATCAAATAAATTTTTTTAGATTTTTTATCATTAAATAGTTACTTTTCCGTCGAAAATTTTCATATAAATGGTTAATTACACATGGAGAATCTCCATTAATAAAGAAATCTCTTAAACCTCCTAATGGAAACCAAATAATTAACCTATCAAATTATATAACTATCCATGTACATAAAAAGTTGGCTAATAATCTTGTTAAAGACAGTTATCTCAAATAGAGAAAAGTAAAAAGAACGTAATTTATTTTATTTTTATTAGATTGAAGGTGGTTTTTACTTTCCTTGAGAGAAGAAGCTTCAGAGTTTCTTGTTGGAGGGTGATGGTAGCCCTCATTGTGGATTTCTTCAAGTCCCCGGGAGGGTTTTCTTGCTGATTGTTGGACGAGTTTTGGATGTTTAGTTTGATGTTCTAATTTTTATCCTGTAGTATTTTTGTGCTTCTTTCTTTTTGGCTGTTTTGTCTTTTTCCATTTCCATTAGGAACTTGTATCCTCAAAAAAAAAAAAATTCTTTGAAAATTTGTTGTTTTTTTATAAGAAAAAAAGAAAATAAAATAAAAGGAAAGATAGGATGCCAATCAATCAAATCAGAACCAAACCTCCATCAAGTTGAGATTTGGGGACTAATTGCCATCTAACAAAATGATTTATCTTCCCACCAATGCTTTCTTCCCAAAAAGTAGATCTTTCTTTCCAATTCAAACAAATAGTAGGGGGAATAAGGAAAAGGAATATATCATGAGGGGAGAATGGATAGTACCTATTTTCATGAGGTTAATCTTCCACCTCTGGGAAGAATAAATCTTTTCCACCGATTTTGCTTCTTATTGATTTTGTCTACAATTGGGCTACCAAGATGAAGCATTTCTTGGATGGCCTCCAAGAGGTAGACCAATGTATAAGGAGGGTGGAGATTCAATCTTACGGACCCTTCATATTTGAATCTCCCTATAACTAATCTCATTCTTAGAATTAACCCTTCGTATTTTTCTACATGTTGGAATAGTTTGTATTTTTTTTTTATTAAAAAAAAAAAATCTGGACTTAATGCTGGATCGATCCTCTAGCTGTTCATATATCAATCCAATTAACTGGATCTTTTTTTTTTTTAAGATCATCTGGACTTAATGCTGGATAGATCCTCTAGCTGTTCATATTTCAATACGATTAACTGACTTTTGCAATATTTTATTTTAATAAGGAGCCAAAATTGGGTTTACTATCTGCTGAAGCAAAGGAATCAGCAGCTAATATTGAAAAGCGACTGCAGTTGGGATCTAAGCTCAGTGATGTGGCCACCTGTGAGGAGGATGTTCTTGAACTCTTAAGTCTGTTTAATAAAGAAAATTACATTCTGTCAGAGCACAGGGGGAAATATTGTGTAAGTAAAATCTAACCCATTTCATTTTGGACCTGCATACTACTTTTCTTTGGGAAGGGCGAAGTTGATGGATTTCTTTTTTTCTACTCTCAATTAAATTTGCATTTAGAGTCAATTTTGTTTCTTCCAGTAGCCATTTATTAACTGTATTTCCAATGTGTGAATTGTTTTGGATTATGGAGCTTGCTTCTCTCAGTCTAATAAATACTTGATATGAAAAGCTTCACAACCTTGTTCCCCTTAGATTAGTAGTGTACTTTAATTTTATCAACCGACACTTGAAACCTGTCTCATCAATTATGTTTGAGATATATAAGTGTAGAAAATAGATTGAATAATTCAAGTTAGGTTTTGAAACTTTAAGCCCTTGTTCCCCTTGGATTAGTAGTGTACTTTAATTTTATCAACCAACATTTGAAACCTGTCTCATCAATTATGTTGGAGATATGTAAGTGTAGAAAATAGATTGAATAATTCAAGTTAAGTTTTGAAACTTTAAGTTCAAATTCTGCTCCATTATTTTCTTCCTCATTTAATATAGATAGTATTTTAAACCATGAGGAAGATAGTGAGTGATTGCTTCGGAAGCAGGATGCTCCGATCTATGAAGGCAACAAGGTTTCTGATGGCAGCTAGGTTTTCTAGTGGTCATTAGGCTAGGGTCTCCGATACCATCTTAGTTTGAAGGAGTAAAATTAAATGTATTCCAATTATTTGAAGAAGAAATGCATGACTCTCTTTCGGATAGCAGCATGTAGGAGAGCCTCTTTTGGACTTTCTTTAGCATGTTTATGCTTCTTAGAGCCACATTCTAGATACAGTAATTGACTTGTTTGACTTTTCATTAAGTAAATGAAAAGAGACTAATGCTCAAAATACACAGATAAAAACCAACTGAAAAAAGAATCCCTCAGTACAAATAATAGACAGTGGGCCTTTGTAATCTCCTGCGATTCAAGATCTCGAATGGTTTCCTTACTGTGGTCCTTTGTTTTTTATGGAAATGGTCTCTCAGATTTGGTGTTTGAGGCGGTCTCAGGCAGCGTCTTTCAGTGGCCTTCTCTTTGCTGTTTGTTATTTAGTGTCTTTTCTCTCACTTGGTGGAGTGTGGTTTCTTCCTCTTGCCCTCCTTGTTCAGCTGTTGCAGAGTTCTGTTTTGTCTAGGGCTTTAAGTTTGTTCTCATTATTCCTTTTGGACTTCTTATTGAGGGATTTTTGTTCAGATTCTGTTAATTTTTTAGGTTGTTTTTTCTGTTCTATCTTTCGAACCCTTGTTAGTTTGTAACCTTTGAGCATTAGTCACTTTTCATCTCTGAAAAGTTCCTTTTCTTGTTCCACACCAAGACATCATTGTTCTGTCGCGGTCTCACATTTTCCAGCAAAGAAAATAGACAATCCCATTCATCTATTTTCTTTTTGATGAGACTTCCAAGTTTGGTCTATCTCTAATTCTTCAGATTATATTGGTCTTGGTCCCAAGTCCAAGTCTTAGTTGCCACTTGAAAAACAACTTGTTATTATTGTCTAAACATGTTGGCAGTATCCTTTTGTGTCACTTTCTACATTCTTATTGATGCCCCACATTATATTTAATACAGAGCATATCAATTTGGATGATCCTTTATCTTCTTTTGATAAGAATGATATTTTTCCTCTAATCTCTTAAATTTTTGTTCTATTGATTTTTGTTAAACACTGATTCATGTTTTATGCATGATGGTTATTTAAGTATGGCTTGTTCTTGTTATGACCTTGCTTGAGCAGGATTTATCTAATAGGTTGTACGTATCCTTGAGTTCTAAATAGCATGGTCCTGTTCTTTTTAGTGTGCAGTATAATTTTCCTAGGCAAAGGTTTATTTCATATACCCATTTTGTATTTCAGCATTTATTACCTGTTCCCATCATTGCAGTTTTTAAGGGGGCGTTTGGCCCAGGAGTTGGGAAGTAAGAAGTTGTGAACTCTACTCTTTGTTTGGCCCAAGGAGTTCGTGGATCTTACGACTAAAATATGTCAATTTTATACCTATTATCTCCTTACATTATGGGTCCAAGAGTTCACAACTCCCTAGACTTCACAACTCTACTCCTTGCCCTAAACACCCTTTTTTCTTTCTTTCTTTTTAATTGTGTAATCTCAACAAAATTCTACAAGAAGTTAAAAATGGTTATTCAACTAATCAAGAGGGAAATGGTTGCATCATTTATTTGATTTCAAGATTCAATTGAATTAAATAATAATAATCTTCCAATTCTACCTGGTGAGGATTCTGAGTATTTTCAATTCTAGACCGCATCAACAAGAAAGTTTATATCTTTAGCAAGATCTTTTGTGAGAGCATTTCATGTAGTTGATTATATTTAATTTTTATGTGCTTATCATGTGCTATGCTCTTGAGTATTAAGGATTTGCCTCTTTTTGGCACCCTCATTGCCTGCCCTTATGTTCTTCCGTTGTTTTTAGTTAAAAGTTAGAGGCACTTTAGGAGATATTTGTACAGATGACCTTTTCATAAGCACCTTTATGATCAATGACTCGCCTCCCACAAATATATGAAATCTAAGCTTCTGCTTACATTAGAGCGCACTACCGCATTTTATAACCTATTGCGATAGGGATGGTTATGTCTATTATAGTCCTATCGCGATGGTTATCTACATCGCGATCTTCATTCACAGGTACTTTTTAACTCAAACAATTATCACCACAGAAAGGCTAATGCAGGCCAGAGTTATTACAATAAACAGTCCACGTCCTTGTTCATTTGAAGCAAAATAAGGCGCTGTTCATTTTGTGAATCATTTTATTTGAAGTGACTAAGTGTATTTGCTGAGAGTAACATCATGTAAACTCAAAATCTTCTTGGGAATGTTATGGTGCAGGTAATTCTTAAAGAAAGTGCTTCACCAGTAGACATGCTGAAGGCAGTGTTTCATGTCAATTATTTGCACTGGTTAGAGAGAAACGCTGGAATAACAGCAAGAAGTGCTTCTAATGACTGCAGACCAGGAGGAAGGCTGCAAATGTCTTTGGAATATGTGGAGAGGGAATTCAACCATATCAAATATGATGGGGAATTGGCTGGTTGGTTGACTGATGGCCTAATTGCAAGGCCGTTAACTAATAGGATTTGTGAATGTCATGTAGCCACCTAAGGACGAGTTACTACACTACCAAAGCTACCCAGGACATTTCTAATAACACTGGATTTTGAGAAATTGGTATGAAATTCATCTCACTTTAAAAAAATTCAAACAATCAAATAGGATGCATGTGACATACAATATATTTGACAGTCTAGAAATTCACCAAATCCATGATATCATACTCTCATGGATCTACATGTGTTCTACTTTTAAACAAATCATACCTTTGTTCCATAGAAATTTCAGTATATAAATTCACCGAATTCATGATCTTAAATTAGTATCAAGAATCTAATAAGAGCTTGTTTGTTTCATTGATTTCACCCTGAGTTTCCAAACATGAATTTAATATTTTTGTTTGTTTTGTAGATTTTCATTTATTTTTAAATTTAGGATCGAGGATGAAAAAAATGTGATATTTTCACGATATATTGCGGAAATATTGCTAAAATTGTGGAACCGATAGAGATATGAGGGTGTGCTATCTTTTTCCTAAAAAATTCACAATATATTGTTGTGGATATATCGCTAACAACAATAGATTGTCATTGATCGCGCATCATGACATCAACGCTTGCGTACTATGATGTTAGCAATCTTGTGTACTATGATGTTAGCAATCGTGTGCTATTTTTGCGTATATGATAATTTTGTTTTTGTTATATCTTTGGTGATACAACTTTGTTTTAGTTAAACGATCACTCGTTTTTATACGTTTTTTATGTTCTTTCCAACTATGCTTAGAAATTGAGCAAAATGTTGAAGCATCTTTACTTTTAAATGACATTGAATTTTTGTTTTTTGGTTGTTGAGAGAGAAGAGCAAAAGAGACGTAGGAAATAGAGGAGAAGGTGAAGTATTTAATATTGAGGGTAAAAGTGGTATTTCACATGCTAAAAGAGTCAATAGCAAACAAGTTTTTAGAAAGAAGTTAGTCATAGAAATTTTTTTGCTTTTTGTGCAATTTTGACCAATTTTTCGCTTGAGGGTCCAATTTCTACAAGTACTATTGCCTGCGAAGTTCTTTTTATTATTATTATTATTATTATTTTAAACTTAAATAAGAATATCATTATCAAATATATTAATAGTATATTAGTTAAACGATTCGTCAATATAAACAAGTGCATCACTATTAAGTTTATTAATAGTATATCAATCAAGTGTATAAATGATTATATCATTATCAAGTTTATCAGTCAAGTGTATTAATAGTATATCAATTAAGTGTATATCAGTAGTATAATAAGTGTATTGAGTGTATCAAGTGTATATGAATAGTGAGGGCATGACAAACATTTTACATGTTTAAACGTGGGTTGGGCCTCATTTGTTGATACATCTGTGAGCTACGACCCTGACTTTTACATTTTTTTTACTCTTCGTTGAATCAATTTTTAAAGCTATTTAGCATATCAATTGGATTTCTAAGCATGCCAGTTACTACTTCATTGAGAACTATTGTCTTGATACAAACCGACACAAACCAACATATATCCAACACAAAGATGGATATGTCTTTTCCAATCACATATATTTAATAAGGCAAAATTGGTTATGTATATTTGAAGACACAAGCTTCAGTTCTCTCTACTAAACAAAAAAACACGCAAATTGGGAGATTTCACTTATAAATAAGACAATGGAATCAAATAGTTGTTTGATGACGATATTTTAAAAAACCCAAGTGAAGGAAGTTACAAGAAGTTGAACAATTACAATTAGAAGCAAGATTACGAAACCTTAACTAGTTTGTAGATCTCTACAAAGTTACAAAAATACAAGTTTTAAATAATGTCACTTTGCGTGTATCTCAAGTTATTGATTCACTAAAGCATGTGAAAAATTTACAAAGGAATATTTATTTTGAAGAATTCAGGAAGCGATGCAACTGTTTGTAATTATTTGGATGTAGGATTTTATTAAACCAACTGAAAAACCTCAAAAGGAGACCTAATCATTCACAAAGGAGAAAAATTGTTGTGAGAAACCCAATTGGGACTCAAACAATTTTCTGAGTAAAAAGTATTTGGTGAAAATCTGGGGACTGGCCACCTTACCGTCAATAAACTAAATTCAAAGTTCAAAATATGGGGACAACCTCAGGTTGGACTATAGACATGTGTCGAAGCTCATCATAAAAGATAGGCAAGTTAACTCTGCTTAACTGCAGGAGGATGAAAACTAGGAGACTGATTAGTTACAATGATGATCTAATCAACACTCCAAATTAGGCTTGTCAAATAGGGGTAGCCCAAAATTGACAGAAAAAGCCAAGCTCGAGTATCCATGCCCCTCAAGATAGGACAAACACGATACCAATACTTGAGCTCAACGTTGCTTAGTTATGGTGGATGTACGCCAGAAAATCAGCTAAACCTTCAAAAAGAAAAAGGGGATTTAGATAGATATTTCAGGCATGACTAGAGATCCGAGAATGATCTTAGAGGAGCCAAGTTTTATATGGTTATACCAACGTGATAAAATCCTAGATCAAATCCCCTATAAATATACCATTATGACTCCATATAAGGTAACTTAAACTTCTTACTTCTTCTCTATTCTTCAATTCTAATCTTTAACTTTGGCGCCAGTGCTCTTTTCTTTTTGCATTTCTTTTCTTCCCTAAGTTACAAATTTATTTTTGTTGTTACGTACAAGTCAGGTGCATTTTTCCTTGGCTAAACTTTGGCATCAACACACAATATATTTTTTTTTTCAAAAAAGTTATTTGTTGGAGCATTTTTTTAATTTAAAAGCAATTTGGTCTTATATGACTTTTAACTCTACAAAAGTGACAAGTAGGCACAAATTTTTATTTTTAATGCACATTTCAAGCATTTCCATGATTAGGCACAAACTTAATACTATGGTTACATTTAGATTTTTCATGAATATGTTTAGACACAATCTTTTAATTTTTCATGTAAATCTCTTGTGTCTTCATGTTTATTTTCAGATTTCACATTATGATTTTGTTTTTTTTATCTATAATGATTTTGTTTATAACTTTTGAATTTCCATGGATATGTTTAATTTTTACATATTTTGGCACAAATTTAGCTTTAAAAAAATTAAGCACTTGGTAAGACATCTTGAGACAAACAAGAGATGACTTTAACAAAAGTAATATCTTAGCAGTAGATGAACAATTTTCATTCACATAGCTTAATCCCTTTGTCATTAAAAAATGTCAATAATTTTACTAAATTTTTTAGCACCAATAGTCAATTTCTTAATTGGCTCATCGCATACAAAAGATCATTTTTCTCATGACTATTTTTCTAATGCAAATTCTTTGTAAGTCAATCTTAGAATGCCCTTTTAAGCTTTTAATTCTAGTAGAAAGCAGACATTTTTAATATTCCTTTTATGGAAACATTCTTTTAAAATATAATCTTTTTTTTACCTTTATTTCATTCTTTTGCTTTTTAGAAATTGAATGTTGAATTTAACTCTTTAATTTTTTTTTTACCTAACTTAGGTAATATAATTTCATACCCAAATCTCAGTTACTCTCTTCTCTATGACTTTGTCGATTCTTTTAAATTGCTTGAACCTCGAGAGCGATGGTTTTCTTCTATACCCTCTTTAATATGTGAGGATCATTTTAGATGAAGCTGTGTGTATTTACAACGATGTTGAAAAGAGAAAAAAAGAACTACAAAATCATATAAAAAAGGAAAATCAAAAGATTTTCCTCCTAAACTTCTTTTAATTAGTATAAAATATAAAATAGATGGATAAATAAATTTAAATTTATCCAAATATGTCGTGAAGTCATATAATGGTGGTGTATTTTTCTCCTTTTTTGGGGAAACTTGTGTTGAAAGTAAAAATATAATAATATTGAATAGTTTATAAAAGCCTTAATTAAACTTAAACAAATTTGTTTCAAAAGTTGACAATTTGGTCGAGTGGTCTAAGGTGCTAGATTTAGGCTCTGGTTCGAAAGGGCGTGGATTCAAATCCCATAGTTGGTTAATATTTGTTTTTTAAAATAATATATTATAAAATCTACCGTATAAGTGAGGAAACCAAACCAAGTCGACTTGGTGAGGACAGTGTGAGTGAAGGATACGAGTGTAGGTCTGAGTGCGAGTGAGTGGTGTTGATTGAAGCGCATGGATACAAATAGAGTCTATCTAGCTGATGGGAGGAGGGTAGATTTGGGCACGCCATTCTGTCGCAAGCTCCTTTGAGTGAGCGAACAAGCTCCATGAAGATAGATGGAGCAAAACTAGGTGATGGATAGGAAGACTGCAAAGCACTTTGAAAAGTGCTTTATTTGCCTTTAATTTAGAGTTTTCTTTACTTGATAATATAAGATTTGACATTGTTTGCTAGTAATTTTTATGAGTTGAGCAAAAGAACGAGATTTTGAGTTAAAAAAAGTGAAAACGAACCATTTTTGCTCACAAAAACGATAAGGGGCTACTGAAAAAGGGGTGTCGCAATACCCAAACCTGAGGGCTACACAATAGCGCAACACCGCGACACTGTGGACAAATTCAAGGAGAGGGTATTTTCTTCGATAGCATTGTGGCACTGCCTATAGTGTCGAGATGCCACTGTATTTTTGAAAATTTTCTTTTATAATATCTTTAGTTTCCAACCTTTTTGGGTATGAGTCTTGTCGTTTTGAAGGCCAAGAGAGAAGGTTTTGAACAGATTTCAGAGGTAGTTGGTGCCAAAGACGATTGGAGAGTGTAGGAGGAATGATTCTACCTCATAAACGGAATTGGAACACCAAATAATGCCTCTCTTTCTCTTTTGTATCCTTGATTCTTATCTGTATTTTTGCATTCTCAACTTGATTTTGTCTATAAAAGTTATGTTAGGTTGATCTTTCATTGTTCTAAAGCTAGATGAATTCTTTGGATGGTTTCAATTAGCATCAATACTTTTTGGCATGACTATTCTTATTGTTTTTAATTGTTTGATCAACAATTGAATGATTTTATGGTCTATTATCTTATTGTAACAAGAGGGTACCATGCGTGCTAAACTATCGTTTAAACATACTAATGTTATCGAAAAACGATAGAGATTGTTGATGAAAGTTTCAATTGTTTTGCTTAATTAGTAAATTAAAGAAGAGATAATATTAATGAATAATGATTTATTTATAATTAATCTTTAATGACCTATTTTGTAAATTAATAAATCAAAGAAGGGATAAAAATGTCTAAAAATATTGGTCTAAAAGATGCAAAAGTGGAATGCATGCTTAAGAGCATTTTGGCCGCTCTACTTTTTAGATATTTTTTCTAAGCGAAGGGTATTTTCCTCCAAATTTTTATTATTTATTTTTTATTTTTACCAACCCCAAATTACTTTTTAGAATTTTACTCCCACTCCAAAATTAGATCGACCACCTCTCCCTTGTTCCTCGTGTCGTACACTGGCCGGTCGACCAACTCCAACGCCACCGTTCCAGTCGGCCATTGGAGGACCTTGCCTCTGTCCGCCAGCCATATTACCCACACAGCTGCTCCACACCTCATCAAGAACGCATTGACAGCGTCAATCGAGGGGAACAGAAGCAGGCCAAGAATAGAAAACAAGCCATCATCCAATTCTCGCCCAGCATTGGTTGAAGTCTACAAAGTGAGATAATATCAGACTACATATTTTTATCTAATGATTGTCAATTTCATGTTTGTCTCATTCTTGATATAAATTCTACTCATTGGACTATATGCATATTTGTAAATAGAAAAATTGAACAAAAGGTTTTGCCCTGATGCATTTACATGTCCCAGGTTGTTTATTTTTATCCGAATACAATTCTCTGATTTGTTTGCTGTTATACAAATCAAATCGGCATGATAGGATGCGTCCTTGAAATCGAACTCTCAACGGGAAATGATAGGATTGCATCGTAATGATTTTGTTGATTGGTTTAATTTGTATGATTTGGGTAAATTAACTTGTGCTTAGCGGATGTGGTGGAACGATTACATGAAGATTGGTTTATTGATATGTTCGTCTATTTATTTCCAGGGCTGTAAAAGTTGTAATCGTCTGTGGACTGGGCCAGTCGCTTGGGCGTAATCTGCTGGAGTTTATAATGCAGCCATGGACACAGGTTTAGACTAAGCATATATGCCGTAGATGGCGTCGCGTTTAGGACTGGAATTTTTTGGAAGTGTTTCGGTAGTTGCAGTCAGCATTCTTGGGCCATTGTTATGTCGTGTCCGAGTCAATTGCTAGCTTCTTCTGGGAATACTGAAAACAAAGATAAACTACATAGGTGTTAAAGAGATGGAATTGCGAATGAAAGTCACTCAAGCAGTTCACGTCCTAAATCATGATACCCAATCTTGCAACCGTGTGGCAGCGAATCAATGGTTAGTTCAGTTTCAACAGACAGGTGCTGCTTGGGAAGTTGCCACTGCTATCCTTACCTCCGATCATGTTCAACATCCACTGTCCTCCTTTGTCCCTGATTTGGAAGTCGAGTTCTTCGCTGCTCAGATTCTTAAACGCAAGGTTATTAGTTTGACTTTAATTTTAATTCCAACCCAATTTCACACTGTTGAAACATCTTTTTTTCCTTATTTTGTGCCGGCCTATTTTTTTGCTTAAGCATAATAACTTCGACACTAGATTTAATTTTGCAACCAGGAAGAATCTAACTTATATAAATTTCATTTAAAAAAAGAATTAATTTAATTAATTTATCTTTTTATTATAATAAGTAAAGGAACCTTTCATTCAGAGCAGTTTGATAAGCCATCATCTTCATTGGGTCTTTCAGTAACATCGATCCTTTCCCTGTCGGAGTCTTAGCCTTCTCCTTCTTTGGGTTTTCGTCGCCTGTTTGATCAATAGGGAAACAATGGCCATCTTGACTCTGTTATCTTTGTGGGGAAGTTTTTCTTTGGAGTCCTTGTTAGTTCAAAGGCTTTTCTTCTTCCTTTGCTTGTCCATCCTTCCCCCATCTAGCAGTTTTGTTTTTTCTTTGGTATGGAAGATGAAAATTTCCAAGAAGGTAAGTTATTTGTGTGGCAGGTTCTGCAAGAAAGAGTCAACACCTTGGATAGGCTCTTGGCCAGAGGGTCCTTTTTGGTTAGGCCAAATTGTTGTATTATTTGCACGAAGACTGTAGAGGGCCTTGACCATATTCTTTGGAGTTGTGATTTTACTCGGGTCGTTTGACATGGTGTCTTCGAGATGTTTGACTATATTTGCTAGTTCGTAGGGATTTGGGGGGGGGGGGGGGTTGGGTTACAGGGAGTCGATCAAAGAATTTCTCCTCCATTGGCTTTTCGAGTGAAGGGTATGTTTTTGTGGCAGGTTGGGGTGTGTGCTATTCAATGGGGTATGAGGGGGGAGAAAAGCAATAGAATCTTCAAGAGGAAGGAGATTTCTTGTACTGATGTTTGGGCCCTTAGGTTCTTTGTTTCTCATTGGGCCTAGGTGTCTAGATCTTTTTGTAATTATTCGCTTAGTCACATTTTTACTTCATTGGACCCCTTCTTATAGTTGGCTCTTGTTTTGGTGGGCTTCTTCTTTTTATATGCTTTTGTATTCTTTCATTTTCTTCTCAATGAAAGTATGATTGTTGCGTAAAAATAATCTTTTGAATAAGAGGTTGCATTCGTTACCTTTGGGATTTCCTTAGACTTATGCTATACTCTGTCTGTTAGAGTGATGATTGATGTGATGGGTCTTCTTTCTTTTCTTCGTGACTAGTTGGTGAGCCTTGGGGGAAGGGATGTTAGATTTTGGACATGGACGCTTGATCCTTCGAGGGACTTTTGTCCCATTCCATTTTCTATATCTTGTCTACCTCTTCTCCCCCATTGGATGCCTAAGATTTTTCTACTTTTTCCTCATTTTAGAAAGCTAAAATTTCATAGAAGGTTAAGGTTTTTGTGTGGTAGGTTCTACATGGAAGAGTTAACACCATAGATCACTTCGAAAGACATTCTTTCTATGTGTTGTTTTTGCAATGGTGCATTCTTGATCATTTGCTGTGGGAGTGTTAGTTTGCTCTTTACCTTTGGGGTTGATGGAAAAGCTCATTCTGGGTGTGTGGGTAGGGATGGCAAAATTCCCCGTGGGGTCGGGTCCCCGACCTGATCATGGCGGGGAATCCTCGGTTTGATCGGGTATGGGGGTCAAACTGGGGATTTAAATCGGGTCCTCTGTTGGGGACGGGGAGGGGATCCCCACCCCGTCCCTGGCCCCAACCCTGTCCCCAAACCTGACCCCCGCCCCTACCCTGAATTTTTTTAATTGTTTATTTATATATATATAAAAGTGAAAAAAAACTACTAAATTTTTTTACTTATATATATAATATAATACAAAGTAAATGCTATATATAATATATATAAAAACTACTAAACAGTAGCTTCAGCTACTGTTTTAGTTGATTTTTTTTTCTAATTTTAATTTTCTAATATAATAAATTTCATTTTTTTTATTTAATTTATATTAAAAAGTACTAAAATATTTTTTAATTATTTATTTAAACAAATATATATAGTAATAATATTAATTTCTTACTTAAAATATTTACAATTTCAAAGAAAATACTAAATTTTAATTAATTTTAAATAATAAAAAGAATAAAAATAATATTAAACAAGGATTTTCCCCCGTGGGGACCCGAATTCCCGAACGGGGAATCCTCGACCCCGACCCCGACTCCCCAAAACGGGGAATGGGGTAGGGATAGGGATTAAAAATCCCCACGGGGACGGGGATGGGGAGTGCATCCCCGACCCCGCTCCATTGCCATCCCTATGTGTGGGGCTTTGACAAAAAAGGTTGGATGGTGTATTGGGAAATGGTATTTGATTTCCTCTCAACTCTTTAAAGTAAGTTGCCTTCAGAAATTGCTTCTTCCGATCAGATGAAACTAGCAGGAACTTCCTTTGTTGTGGGGTCTTCTTTTTGGGTTGAAAGGAAAAGGAAATAGTGGCTTTGAATTTCAAATCCATTTTGGTGGTTTCTTGCTTGCTTGCTCATTACTCTTGGAAGGACGTCCGATACGCCTTAGAAGATTTTCGGTCCAAAGTTTCTGTTAATCCTTTTATGGATGATAAAGCTAGTAAAGATTAGAAGAAGATTTTTCAGATCTCATCTTTAATGGCAAGTGGGATCTTTTTGGTGACCTTCATTTGAAGCTTGAGCGTTGGTCCTTTGTGAATCATTCTCATCTGGAGGTGATTAAAAGTTATGAAGGTTGGTTATTAATTATAAACCTACCTCTGGAGTATTGGAAGAGATCTGTCTTTGAAGCTATTGGGCAAAATTTAGGTGGGTTGATCAGTATTGCATCCCACATCCATAATTTCATTGATTGTTCTGCGACTTTCATTTAAGTTAAAAAAAGCTTCGTGGCTTCATTCCAGCAGAGGTTACTGTTCAGGTTGGTAATACTGGTTCTTTCTCTCTTCGATTTGGCGTGTAGATGCAGTGGAAATGCCAAGTCCAAATATTATACATCATGGCAATTTATCTTTTAATGACTTTTCTAATTCGATTGATTTAAAGAGGATAAAAAAGGTACTGGAAGAGGAAGCTTGTATTTTGTCGATCGATGGGAACTTTGGTCCTAAGGAAGTTGCTCCTTCTCTTCCCGTTGATAATTCCTCTCCTCAAGAACTTCTAGAAGACGTAATGCAGTCATCATCTTCAGCCTACAGTGAGTTCTAACAGGGTAAAGCCATGGCTCATGGAAGTTTCCCTTGGCATTATTCTCGAAAGAAAGTTGTTCCCAATGTTCTTGTTTGTGAAGAGAGAAATTCTGATGCTTTAGACGAATCTTGCACCCATCTTTTGATTTCTTCATCAATCGCTTTGAATCATTATTAGCCTTTGGATCCTTACAATTACTTTAAGCAATTATTATCTCTCTCTGGATCTGATATTCAGTTTAGTTTATTAAAGAGGTATCCTACCTCCCTTCTTCTAAAGAAGGTTTATCTTCTTTTGAAGATAATGAGAAATTAGTGGTAAGCGTGAGCAGTGAAGAAGTAGAAGTTCCTATGGAAGAATCAGTGCAACAAGAGTTGCTATTAGAGGATATATTTGCAGAAATCTATAATCATATTTTTGCAAGTGAAGACATAGCATTTTGCTGCAGCTTCTCCAATGTCTTCTTCTTTGATTCCTGACAATTTGCTTCTTTGGTTAAGGCTTGGAGCCTTTAGTTTCAGGCAATTCCTTCTAGTTCTCAAGGAGCTACAGTTTAAGGGTGTTTGCCTTGTTTGTTTAGAGTTATTTTTACTTTTTACAAATTGCTCAAGGTGTTTTTTTAAGTCCCATTTGCATTAGGGTCTCGTCTCCCTCTCATAAAGGCTTTTTAAGAGTTTTTTGATCGTTTGTCAGTTTTTTTGGTTTGTTGTTTCTCTGTGTTTGACCTGGTTTGTCTTGGTTAAATTTATCTCTTAGTTTCTTATGGGACTCTGGCCTGTGTTCATCATTAATTGTGTTTGTCTCCTATTTTTGTCTTCTATTTGAAGATTTTGTATTTTGGAACAGTAGTCTCTTTTCATTATATCAATGAAATTTTTGTTTCTGTTTCAAGAAAAAAGGTGGCTATCTAATATATCATCATTTAAAAGTACACATTTGAAAGCCCATAATTATACAATATCTCATTTGAATTTGAAATTCTTACCTGCCAGATCCAGAATGAAGGCTATCATTTACAATTAGGAGTAAAAGATGCTCTACTAAACGCTCTTCTTGTGGCTGCCAAAAAGTTTAGTTCAGGCCCTCCTCAGGTGCTTCACTTATTTCTTGCAATTTGAGCATTTGTATATTTTCATCATTTAGAAATTTGTATATTCGGTAAAACAGAAAATATATTTATTAATAGTCTAGATAGGTGTGCTTATTTGAAAATTTTGATTTCTCTTTAAACTCCCTCCCAAAATTATTTATTCTCATATTCATGAAATGAATGAATGTCTCTTATTAAAAAATAGAAAAATTGTTTATTCATTTTTGTTTGGGTAAGAGATAACAGTGTATGAAGTTTGAAGTCTAAATGGAACGTAAAACTTCTTTAACTGTAGTTAAAGCCTAAAATAACCTTCTCTGTTCATTTTTCTATTTTTTTTTATCTATTTATATTATAGAGTATCATATCATGTCTCTGTATTATTTATCTAGTTAATGGTCTAAATAAGTTTTTAACTTGTTACTTCTTCCTTACCTTAGGATATGCCCTCTGCTTTTGTGACAGCTTTTAACTCAAATCTGTCTTGCACTCTCTGCGCTTATTCTGAGAACAGTAGAGCATGGGAAACCCATTGATCGTCTTTTCTACAGTCTTCAGAATCTGCAGAGTGTGGACAATGGCAATTTGGCTGTTTTGGAGATGCTTACTGTTTTACCTGAAGAAGTTGTTGACAGCCAAAATGTTGATTGTAAAATAAGTTCATCCTGTAGGAGCCAATATGCCCGAGAGGTGTAGGAACTTTCTATCTGTACTAATGTGTTTGCAGCCTCCTAATTTATGGTCCACTTTATCTTTTATTGTTTTCCATTTTGTTCAACTTTAATCCTGCAGCTTCTGTTGCACACGCCTATGGTTCTTGAGTTCCTACTGCAGCAATCTGAGAAAGGGTTTGATTGTGGGACACAGCCGCAGGAAAGGAACAGAAAAATTCTTCGATGTTTGCTGAGTTGGGTATGATGGTTATCAACATTATGCCACTCTGACGAAACTAAAGATTTATAATGATGTGTTGGGTGGGGTTCTTTTTTCTGTCTGCTTATAAATTTCCAGGGTTAAGTATTGACTATTATCTCATATAACGAAAAACAGCGTTTTGCAGTGTTCTGCTTTAGCTTTTGGCATGGAATTTCATTTTCGCTAATATTATATGTCTCATTTCCTTGCGAATGTTACAGCTTCCCTATGTTTTTTCTTCTTTATAAAAGTTAGTTTTCTTGTGTCCAGGTGCGTGTTGGGTGCTTCTCTGAGATACCTCAGGGTTCATTGCCAACGCATCCCCTTCTTAATTTTGTGCTCAAGTCCTTGCAGGTAGTAATTATAATAACACTTACGAATTTTAGTCTGCTTGTTTAGCATCTAAAAGTTATTCTTGTATAGGATGCAGCTTCATTTGATTTGGCTATTGAAGTTCTTGTTGAGCTTGTGAGTAGACATGAGGTATGCATCATACCTTACAAGCAGTACATTATTGAAATATAGAATGCACAGTATGGTTGTACAAATTATTTGTTATATATAACAGTCACATTATGTAAAAAGTTTTGGGGAAGACTCGAAGATTTGTCATATATAAGATTCTGATTGCTTTTTGGTATCGTGTATTTTTGACGAGTAGTCTTTTCATTTTATCAATGAAAAGTCTTGTTTCCTTTTTAAAAAAAAAGGGTTGCTGATACTCCATCTTAGTTTTAATTAAAAGATTCGTTTCTTATTAAAAAAAAGTCTCCATCTTAGTTGAAAGGCCCATAGGATGTTTTTATATTATTTTCTCAGAAATAGAAACAAAATCCATTCATGTTAAACTAAATTAAAAGTAAAAGCAACATGAGCAAATACTAGAAGACTAAAGGGACCAATTGCTTTCCTTAGAGTTCAAGTTTGAGAAAAGAGGCTGAATGGTAGCAACTTAAAAGATTGAGGTAATGGCCTTTGAAACCCTAGCCATCGGAACTAACCCTAGCTACCACTGTTAGCGAACCTAACCCTAGCTGCTTCGCTGCTAGACCTAACCCTAGCCACCCTGTTGCTGCTCCTATTTGTTGTCGTTTGATAGGTTGTTTTTGTTCGTTGTCCTCTTCTTAGTTTTCAACAACCATCCTCGTCCGCGACCTCAATCATTGAGTCTTGTTCGCGAAAGCCGTTCTCTCTCCCTGGTGGGTTAACTTTGAGAGTGCACAAAGATGTAAGGCATAAATCTCATTACCTGTATTCCATAAGTTCGTTGAGGGTTTCTTGTTTTCCACTTTTATTATTTATTTATTTTTTCTGAGCAAAACAACTTTTTGTTGATAGATGAAAAAAATGCAATATGTTCAATTAAAGAACCTCCTAAAAGGAGAAAAATACTATGACCGACCAAATAAAATGGGCTAAAATAGCTGTCCCCTAAAGAAAGAATTCAGAAGCAAAAACAACTTCTCCAAGTATTATACACAGAAAAAAAGATTTTTTTTTTTTGCAGAATTCCAGAAGTTGAAAAGACCCTTGTCTTTTCAGATTTAAATGAGAACGGCCATTGTTTCCATAATTCTTCTTCATCCTTTCCTCTTCACCATTCTTGAATTTTTAAAGGCTTTGGAGAGTCATCCCTTCTAGTCACTTCTATGGAAGCAAATTTTAAGGAGGGTGAATGGTCTAAGGGTTATGTTGATTCTTCTTCAGCTACTACAAGGCTTATACCAGTTCTTCCTTTGCATTATTCTTGCTAAGGAGTTCCCTTTATTTCAACAATGAGTGTATAAGATAATGCCGATTTGATAGTCAGGTGCACTTTCATTCAAGTACTAGCTTTAGCCCTTTCGTCCCTCCCAGAAATTTAAGTTTTCAAAATTCTCTCTTCCGGAGTCAAAACCTAATTTATTAGGGGTATTCCTATTTGCTCATCTCCAAGAAGTCGTTTAATTCATAATAATTCAGATGATGACTCTGATATTAGTGTCATTAGTGAAGAGTTAGACACTTTTGTTGAAGCCCTTAAGAATGAGCTTAGTTTCTGAAGAGTTATACAATTTTGTTGAAGCCTCTGAAGATGTAATAATATGTTTTGACATAATCATAGAGACTGTTCAATTGAGATTAATCAACCCAACTGATGAGATTGATAAAAAACACTTATATCCTTTGCAACTTGGTAGAACTCTACCAAATGCAGATAAAATTGATTTGGTTTGGTGAGGACAAAATTAACTAACTGGAAACCAAATCAAATGATACCCACCGAGGAGAATTGATTTCAACGCAAAACTCGCACCAAACTCCATAGATACGGCTGGAAAATGTGGTTGGACGGCAGCGGACGCACAACGGGATGGTCGACGTTGAAAACGGCGACAGTTGCGGTGGCTTAGATAGTTGATGATGGCGGTGGCTGATGGCTACTGAATCACAGGCTGAGAGAAAAATATATATATTCTTGCTGGATTCTCGTCAGAGAAGATGACGGAGATAGCATCAGAGATGAAGCGGCAGTAGAACGATCAAAGATGGGGATGAAACCCACGCTAACTGGAAGATCCACGCGAAATGAATAAACCCACGATGCAAGATTTGAAAAACCCATGTGAACTGTTGTATGATGGCGCGAAAGACGGGCGAAGGCGTTGAAGATGACGACGAGAAGGATAGGGCTACCAGAGTGTGTTGAAGATTTCCTCGGAGATGGACATCGCTGTTTGCGATGACTAGGGGTTTTTCTTTAAAAAGTTAGGATTTTACTGCTCTGATACCATGTTAAATCACCAACCAACCCAAAAACTTAAGCTCATGGGTGAAGGTAAATTTAATATTATATCAACATTTTAGCCATAACTGTCACCAACTTCCAAAGCAGCTTTGCCTTGGGGTTCGGAAGAGGACCCATGAGTGGCTAAGATATATTGCTTTTGAAAATACTGGAAAAGGCCTAATGAAGGTTAAAAATCTCGAACGCCTTTGGCCAAAACAGACGAGCATAAGAGCATTAAAAAAATATGATCGGGAGAATTTTTGGCCAATCGAGATAGCGATCAAACTGACAGCATGATGCACTCATAGCAAACTTTCTTTTGCAAAACTTATGATGTATCGTGTATTGAGGCTGCAATTCAACAAATTGACGGTGTCTAAAGAGATACTAATAAGACCACCACATTTCTTACCAATGATGTCTAAGGTTTCCTAGTTCCACAAAGAGATAGGTAAGTTTCTTATTTAATCCAACCCCCAGTACCTTTTATTATTTTCCCATCAAAATATGAAAACCTTCCACTTTCTCCAAACACCAGCCTCGCGATTCAACGTGATTGCTTGACCGACACCCAATTTAATCAAAGGTTTATCAAAAGCAAAAGGGTTAATCAAACAATTCTCACAAATTTCTTTCTTAGGGGTCTCAGAAATAGTATTCTAATCATCGATAGAATGTAACATAGTGGTTACAAATAATTCATCAAAATTCAAGGCTACCCCTTCTTTCCCTTTTTGATCCAAAAATTCTTTGAAGAAGCAACAACAATGGACTCCAGAGCAGATGAAAGAACCTGTTTGACAATCCCCCCACCTTTGTTGACTTGAGATGCATCAAAACTCTTAGCCTCAATCTTCTTAATTTTTGAAGAAGTTCATCCAACATTTCCCATTAAACCTTCCAGCCTCTTTTCTGAATCCCAATTGGAACCGAGTTACTTTTTTCCCACCTCCATTGGATGTAAAAGAGAATTCCACGAACCAACCAAACTGATTGGAACCTTTTAAGATCCTTAGAACTCAAGGACACAGTTGTACAACCTATAGAACAGATCTTGTTCAAGTAAGGTCGTGGAACCTTTTAAGATCCTAAAACAACCATTTTCAACATGAATTTGTTTGGACAGTTTGACACTGAAAGGACTTCCCCAAAGAAGAGCAAGGGATTTCTCCAACTGTTGCAAGACATTCCATTGGAACTTAATAAAAAAGAACGATCCCACTTTTTTTCTTTCAACAAATAATAACCACAAGCAAAAGGAAGGAAGAAAGATTTGTTGGCAACTCAAAAACTACTCTCCATATTAGAACTACTTGACTTGAACTTACCTTAGAAAACTACAAGGAGAGAGGAGAGAGCATTTTTGGTCTCTAGTCTTCTTAAAAGCTCTTGTTTCCCACTTTTTTGTTTATTCTGTTTTAATTCTGAATACAAATTTCTGTTTTCTTTAATCTGAAAAAAAAGCTAGATGTTGGTTACATTTTTTATGGAAATTCTAGTACTTTACAACTATTGATAGTTGAAAGCCATTGCTTCTTTTCTCTTGGTATCTAATGATTGTGCTATCTGCATATGTGGATGAGGCAAGTGCTAGATCAATTCTTCTACTAAATCTTTGTCTAGATTCACATTACTTCTTTTTATATGCTCTAATGTCTGTGGATCTCTGCAGGGGTTACCTCAGGTCTTGCTGTGCAGAGTACATTTTCTTAAGGAAATGCTTCTTTTGCCTTCGCTTAGTAGTGGAGATGAGAAAGTGATCAGTGGTCTTGCATGCTTGTTCTCAGAAGTTGGGCAAGCAGTATGTTGACTTGGGTTCTTGTTTAAGTTATATTTTTCTTATTGCCCTGTGAATTAGTTAGCAACCTCAGTTGGTTCTTTCATTCATAGTTTGACTCTTGGATCAAAGAAGATGATGTAAATACTTACTCGGAATTTACACCTTTAAAATTTTATAAGCTTGGATTCATGAGTCAATTGTGTTCTTAAAGTTAGTAGTAATGCTTAAAATGATCTTTGTATTATTTGGGTGAGTCTATATCCCATTCTTAGAATGTTTGTTTTTCTCTTATTTTTGTTCCCTTTCCCTCTTTATTGGAGTTTGGATCCTTTAAATTGTTTTTCTTTTATTTTCACTCCTTATTGGAGTTTGTATCATATGAACTTTTTTGTTTATTTTCATTGAGATGAAAAGTTGGTATCTTGTTGAAAAAAGGTATCAATGCTTGAAAAAGTAAATGAAACACATTTATTTTCATGAATTGTTCCTTGTGTACCTGGCCCTTTCTAAGTTATGACTATTATTTTTAAATCCATGTCAGGCACCATCCTTAATTGTAGATGCCAGTGCTGAAGCCCTTGCTCTAGCTGATGCTCTCTTGAGGTGATCATTTGTTGGGTTTTTGGATGATGGTTTCCCTAATATGTTCATACGTGATATAATTTAAATGAAATGATTTATGATGGCCTTTCTTGACCAACCTATTGAGGAGAGACTTCTTCTAACCATATTGAATTACATGTGTCGTGAGTATTTTTTTTTTTTTGACAATATGTGGGGTGGGAGAAACGAACCTCTGATTTTGAGGTTGATAGTTCAAGTACTATGCCAGTTGAGCTTTCCTCATTTTGGCTACATATATTGTGAGTATTTAGGTTAAGAGCTCCATTCTTGAGATTTGTAAGCACGACTTATGCAGTTACCTTTGTTGGGTGGTCTCACGAACAAGAAGTTGAGTCAATATGTTGTGCGATACTTTTTTTCTTTTGGAAGGAAATAGAACTTTTCATTGATATAATGAAAAGGGACTAATACTCAAAATACAAAAAAAAAAAAAATATAAATAAAGAAATAGTAAGAGTAAGACATCAATGGTACAAGACAATTGAAAGATCAAATAGAAAAGATAAAAGCTTCCCACCCAATTTTGATAAATATCTTGAATAGAAAAATTCGCAAAAAGTTTAGAAAGAGAACACCAAGTAGAAGCATTGAGTCTTGCAACTTCAAAACGGTCAATCCATTGAAGATGTTTATCATGGAAAACTCTTTGGTTCCTTTCAAACCATATGTTAGCAAGTAATGCTTTGACAACATTAACCCATGACAGAAGTGACAAAGGATCAAGCTTTCTTCATCTCCATCCATTGGGCCTCTCTCCTGGCTCACAAGTACTTTCTCCTCTCTCCTCATAGCCTTAATAAACCAAAAGTTCTTTAGCGAGAAATGGGTGGATGAGCTAACATTGTGAATTGAGAAAATTTTGAATGGAAAAGGCATCGTGGAAGAGCTTGCAAAGCTGGTCAACAATGGGGTCAAACAAAATATTGATTCCAATAGGAGAAGGATGAGAGTGTAAAGCTTTTTATACTCTTTTTTTATTTGACAGGAAACAACAACCATTCATTGATATGATGAAATGATATACCATTGAAGATCTTATCAACAGATAATTGCAAAAAATACCTCCATTGGCTAGCAAGGGTGTTAAGATTATAATTACAAAAAGGAGGAGATAATTTGCTCCAAGTGATAAATTGCTCCAAGGATATTAGAAGCTCTCGGCCGCAACTTTGTTTCAAGTGTCATAGAAGAGTTGTGGTTGTTGTCTTGAGGCCTTTCAATATTAGCAAGGTTGTTTTGTTGGTCTGTAGCGGTACTTTCAGAGTTTTGTTCGGTGAAGTGTTTTATATACAAGCAGTTTTCGACGAGGAGCTATTTTATTATTTTGGTTAGGTGGTGTTCATGGAGCTGGCAGCTTGCAAGTCAGTATGGTTATGAGTTCATCCTCAAGCCTTCTCTGCCTTCAAATCTTTTTGGCTCTGAAGTTCAAGTCTTGTTCTAAGCTTGTTCTTTGGGCGTTATTTGTAATATATTGGTCTATGTATTGTTCTTTTTGGTTCTTTTTTGTTTTTTGTTTTTGTTGCCCCGTTTTCCTATACTATATTTTGAGCGTTAGTCTCTTTTCATTAATTCAATGAATGAAGTTCGTTTCCATTTAAAAAAAAAATTGCTCCAAGTGATAACTAGTAGAGAAGTAGAATCAATAAAGTACCCTATGTTCCTTTTTATACACTTTAAGTTGGAGTTCTCAACAAACTTGTCCAACCACCACAAAAATTGAAGACCTAATCTTAAGTTTCTACACTTCCTCCAAGTCTGTTGGGGTAAGATCTATCCCCCTTAACTTACAATGGACAAGAGTGACAAGGGAACAAAACTTGCAGCTAGTGGCCAGCTTTAACCAACCTGAGATTAGAAGGGCAGTGAAGGCATTGGGGAGAAATAAAGCCCCAGGACCGGATGGATTTACATCGGAATTCATCCTTAAGTTCTAAGACCTTTTAAAAGATAATTTCATGAAGCTTTTTGAGGAGTTTCATAGTAATGGGAAGCTAAAACAATGCAGAAGAGTCATTACCCAAACATCTCTGAATCTGGTTGGAATAAGGGGAACTGTAGAGCAGATAAAGCGCCAAGGAGATCTGTAAGCAGAGTGGTGCACAATCTGGGGCCAAGGACCATTGATCTTTGGATGGCAATATTTAACAACAATTACCTTATGCCAATGAGCAGAATCCGCATGAATGAATCTTCAAACCCATTTAGCTAAGAGAGCCAAATTACATTGATGGAATTGGCAAAAGTCAAAGGGGGGAAAAGTGGGTCATAAAAGGTACCTTTTTAAGCAAATAAAACAAGATAGGTACACTATTCTAAACTTTTGGGTAATGGCTCTTCTACATTGTTTTGGCATGATTTTTGGCTGAGTTGTGGGGTTCTTGCATCAACTTTCCCTCGACTTTGTTGTTGACAAATCGGCCTAGAAGTACAGGGAGTGAGTTTTGGGTTGTCTCAGATGCTGCTTGGAGTTTGCACCATCACAAAGAATCAATTGACCTTTGTGGAAGGTAGACAAATACTAGACACTTTCTTAATTGCTAATGAACTCATTGATGATTGGAAAGGAAGAAAAAATGACCGATATATTATTTAATTTTTCTCAGTGGAAGTTTGGGTTTTCATAAAAAAAAAAGAAGAAAAAAAAAAAAAAGAAAAGAAAAGAAGAAGAAGATGATGAAGAAGAAAAAATGGGTCACAGCAAAGCTTCACATGAAAAAGGCTTTTTGAAAAAGTGGTTTGGGATTTTCTGGTCAACATTCTATCTTTTTGATAAGGGCTTTGGTGAAAGACGGTGGAGGTGGATTAAGGGGTGCAAATCTACCACAAAAATTACCATCATTATTAATGGGAGACCTAGGGGGAGGCTTCGCACCACTAGGGGGCTAAGGCAAAACCTACTCTCCCCCTTTATCTAACTTGGTTGTTGATTGTCTTAGTAGGTTATTTACACAAGTGAAAGAAAATGGCTTTATCAAATACTTTGATTTTGGGAGAGAAACCATTAGCATTAGCCACCTTCAATTTGCGAGCGACACCTTCTTTTCTCCATGTTTGAGAAGGATGCTTTGAGTTGAAAAAGCAGGAGGAGGAGGATAGAAGTCTTTTGGCTAAGTGGATTTGGAGATATTAGTTTGAGAGAGATGCTCTATAGAGGAGGCTTATGATGCTAAATATGGCTCCCCCTACAACCACAAGGTCGATATTTTAAACAATCTAAGGGCCCTGGATACACATTGCAAAATAGATTACTCTCATCCATAATAATTACTCTCATCCATAATAATTATTCTCATCCATAATAATATTGCCTATGTTATTGGCAATGGTGCATCCACTTCCTTTTGGAATGACATTTGGGTCGGCGCTTCACCCCTTAAAATTGCCTATCAAAGATTATTTGCACTCTCTAGCCAAAAGGAGGCTACCATTGCACAATGCTAGAATTTGGAATATGAATCATCAGACCTTGGTTTGCGGCGAAATCTTAACGAAGAAGAGATTCTTGAATGGACTATTCTTTCTACTTTACTTGTGGCCCCTAATGACCCCACGGTGGATGACAAATGGAGATGGAAAGTGGATAAGTCAGGCAAATTTACCACTAAATCACTCACCCAACTCCTTGCATCAAGTGGTAATGAATAGAACGCTCTCCTTTATAAGAACATCTGGAAGGGTCCAATTCCAAAGAAGATTCGGTTCTTTCTATGGTTGGTTAGCCATAGTAGCATTAACATAGCTGATGTTCTTATCAAAAAGGCCTCATGGATGGTGTCTGCCTCGAGTTGGTGTTTCCTATGTCACCAAAGTGATGAAACGATTATGCACATCCTTGTTTTTTGTGACTTCGTTCAATCGTTTTGGATGAGAATGTTATCATGTTTCAACTACCATGAATATGCTTCTTATTGGTCAACCATTCAAGAATGAGAAGGTGATCATGTGGACCTTCATCATCAAAGGCTTCTTTTGGCTCATATGGAATGAACGGAATCATCGTATTTTTTAAGATAGAGAAATAGAATTCACTCAATTTTTAGATCATTTTTTGTATACATCTCTGTTGTGGTGTAAATTCACTTATTTTTTTTATGTGATTACAATCTTACTTCTCTTATAGCACAGTAGAATAGCATTATGTAATCTCTCACGGCGTTTCTCATCGAGAAAAAAAGGTTTATGAAGAATTTAGAGTTGGCAAAGACAAAATTCACGTTTCTCTCCTTCAATTTGCCGATGATATATTATTATTTTGCAAAAATGATGATGACATGTTCGATAAACTAGTCCCAACATAGGAGCTATTTGAGTGGTTCTTGGGGTTGAAAATCAATTGGGAATAAGTAGCTTTGTCCGATATTAATATGGATGCTTCAAAAGTTAGTGTATCTGCATCACGTCTCCGGTGTATAGTTGAAGTCTTGCCAATCATTTATTTGGGTCTCCCTCTTGGTGGTCATCCCAAATCAAAAGCTTTTCGGCAACCGGTCATAGACAAAATTCAGACAAAAAACTTAATAGATGGAAGCGTTTTTCTTTTTCTCGTCATGGTCGTCTAACTCTTTGTTCATCGACAGTATTAAGCATTCCGCTATAGTATTTGTCTATTTTTTATGCGTCCATCGGTTAGCCATCACATGAATCACCTGTTGCGGTCTTTCTTTTGGGAAGGAACTAATGGTAATAAACTAAATTAGTTGGTCCACTGGAGTCTTGTGTCAAAGTCACAACTGGTTGGACTTGGATTTTGAGATTTAAAACTCAGAAATATTGGCCTTGTTAGCAAAATGGGGGTGGAGATTTATGAATGAACGCCATTATTTTTGGCGGAAAGTTATCAGTATTCATGGTTCTTCAGATTTTCGTTGGATTTTTGGTTCAATGAATAATTTGAGTCTTAGGAGCCCTTGGTTGAATATTGCATATCTTTGGAAGGATTTTGATTCACTTGCTCATTAAAAATTGGGAAATGGCAGAAGAGTTCTATTTTGGATTGGTATTTGGATGGGAACTTTTCTGTGAAATCTTCCTTTCCCAGGTTGTTTTTTTTGAGGTTGACTTCGAGGTTTTCTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTTGCTTTTGAAATGTAATACAGACCTTAGCAACTGCTACATCAGTTGTCGCAACCACTTGAAAGTAGAAAGGATATGGAGCCTATCATCAGGCTCTACATTTATTCTAACATATGATAGGTAAGATACAACACAAGCAGGACAGTTTTATTCCATCACTTGATTATTAACAAGATAGAGCTCATTGGTGTTCCAATTCCTTTTGGAAGTCTGCATTATCAACAAGGACCAGGTTGCTTTCTGTATGTTCCTCTCGTAATGGGACTGTTTCTGATCATTTGGACAACCAAATAGTCAGAAAATTTCTTTTCGAAGATCTTTGAACAAAGAAGAAATATTACCTCAAATTTTTTTTCAGTAAAATCTTTATCCAAGCATTTGGTGCCTTTGTTACCAATTGATAAGGTGAAATTCTCGGCTCTCTAGAAGCATAAAAGTCCCAAAAGGGTCAATATTTTGATTTGGGTTATGTTGAATGGTAATCTTAATACCTCAGAGGTCTTGCAAAGGAAAGATCCCAAGAAGTGTGTCATGCCATCATTTTTCTGCCTCTGTTATTCGGCTGAGGAAACTCTTTTTTGACTGCCATAATGCTAGACAGATTTGGGCTCATTTGTTTGCAATCTTTAATTCTCTTTGGGTGTTCTGTAATATTTTCAGAATTAATGTTTCAATATTGCTGTGGTTCTCGTGCCATCAACACACAAGGAAAAGCTCCCGCACAGTTTTCTATGGATGGCTATTTCTCCCCACTGATGTATTTTGTGTAAAAGTTCTATTTCACTCCTGCCCTTTTGCTTATTGGTTTTGGAGCAATATTCTCACCTACTTCAATTGGACAGTAGTGCTTTCACAAGACCCCCTACACCTCATCTCCCTCACATTGCTACCACCATTTAAAAAGGAGAAAGAGCTCCTTTGGTTGAACATCAACAGGGCCTTCTTTTGGTCAGTTTGAATTGAGAGAAATCACCATCTTTTTGTGGGACAAAGAACAATCTTTAAGAGCTTGTTGATCATATTATGTTCCTTGCAAGTACTTGGTGTAAATTGTCACCTCTCTTTCACTCTTCTAGCTTTTCTAATCTTTTATCCAATTGGAGAAGTCTTATGTAGCCTTTTGATAAGGCTTTTTGCCTCTTTTCTTTCGTAAATTTCATAATACATCAATGTAATTGTTTTTTATCAAATATATATGTATGTGTGATTGAGTAAAATAGTAAGCATGGCCAGGGAGGAATGTGCAACCTCTGTAGGCGATTTCTCAATTCTAATTATTAGATGGTACATAATCCATACAGGACATATGTCTCAAGTGGAATGCCTTCGTTTCTACAGTTTAATTATGTTGTTTATGTTTGTATGTCTTAAGTCTTTATGATGTATCGTTTTATGAACTATATGTTCCATCTTGTGGTTATATTTTGTATTGGGATATACTAAGGTTGTGTCAACCTAGTTGAGATAACCTGATGCATCTACTGACCCATCGTTTTCTTTGAGTTGTATGATCTTTGTCTCTTTGTACTCTGAGCATTAGTTTCTTTTCATTATATCAATAAAAAGTTTGTTTTTGTTTCAAAAAAAATTATTAGATGGTACACGCTAAAATGTTATAATGACAAGGTCTTGTGTCTTATATTAGATTTTTGTCTCACACATTTTAGTTTATCTTTTCCTAATTGATGCAGTTGTGTGGCTTTTCCAAGTGAAGATTGGGAGATTGCTGACTCAACATTGCAATTTTGGTATTTTCATATTCTTGCTAAAATTTTAAGGTGTTATGAATTTTTTTTTACACAAAAGATATATCTGTAATATAGTATCTAAGAAGCATAGACATGGATACAAAGACGATTGGATACAACCATAAGCCAATTTCTAAAAAGTTAAGATACAAATACGTTGAGGATATGTTTCGTTATATATATATATATATATATATATTCATTTTATATTTTTTTGATATATGTGAATTTAACATAAATATACCCAGATTTTTTTTTTTGAAAAGGAAACATAACTTTTCATTGATTAAATGAAAAAAAGACTTGCTCAAAATACAAGGGTATAAAGTGAAGAGACAGAAAACTAGAACAAAGTACAATCCCTAGAGGACCAAGCACTAGAACAAAGAATAGGCAAAAAAAAAAACAAGAGTCCCCAATTAAACAAGTATTTTGGAGAGAAAAAAATCACATAAATCTTAAAACAAGGACACCAATAAGATTTGGATAATCATGTAGCTTGAAAACGATCGAGCCAAAGGAGGAATTATTGTGGAAATCCCTTTGAATCCTCTCGAACCAAACATCTCATTCATGAAATGAGATACCAAGTTAATACTTATTTTGGCAGGCATGTACATCAAAATGGCAAGGAGTCATACACTAAGAAAACAAGATGGAAATGAAAACAAACTACAAAATTAATAACAAGGTATAAATATAAGGTGGTTGAAGATGGTTTGGGCATGCAGTCATAGGCTAACCGTTACACTCCCTGGACAAGCATGCCCAAGACACTCTACAAGTGGTATAGTGATTTTTCTCCTCTAGCTGTGGTTTTTCTAGGGACAAAGTCGTTACAACAACAACAATAATCCTTTATTTTTTTTTATATCTTTTTCTAATGTAACTCTTATTGGTGCTGTGAGAATTACAAGAATGTGAATTCTTAAATCTCTTCTCAGGTCTTCTCTCGCGAGCTATATTCTTGGCCTTGATGAGAATAATTCGGCAAATAGGAAACATGTGGAAGATGTGTTTCTATCTGTATTTTCAGCATTGCTTGATGGGCTTCTATTACGTGCTCAGGTTTCCTTTCCTGTTCTGCTTGTCCTGGATACACCAAACACAAAGTTGGTCTTAGTTGCTTGCTTATCTGAACGTTTGTTAATTTATTTTATGCTATCTTTTGTATAG

mRNA sequence

ATGGAGGCTATTTCAGATACAGATTTGAAGTATTTATTGGACAATTTGGATGGAAGGATAAATGAGAATGAGAAATGGGAACGTGTTGTAGAAAAAACTAATGATCATCTTTCATATAGTGCTAAATGCTGCAAGCCTAAGGATGGTCCCCTGAAATACTCGAGTGTGACAGTATTTGAAAATTGCTGTCCAAAATTGTTGAGAGACTTCTACATGGACAATGACTATAGAAAACAGTGGGACAGTACCATGCTTATGCATGAGCAGCTACAAATGGATGGAACTAGCGGAATTGAAGTCGGTCGCACCTTAAAAAAATTTCCATTATTGACGCCCAGGGAGTATATACTATCATGGAGATTATGGGAAGGGAAAGATAAATCCTTTTACTGTTTTACCAAGGAGTGTGAACATCCTTTGGCACCACAACAGAAGAAGTACGTGCGAGTGAAATTTTTCAGATCTGTATCCGGCAGAAATGCATGTGAGATCAGTATGTTGCACCAAGAAGATGCTGGTTTGAATGTGGAGATGGCAAAACTTGCGTTTGCAAAGGGCATATGGAACTTTGTCTGTAAAATGGATAAAGCATTACGCAAATACGCTCTAATCCACTGCCCTCAATCAAGTTCACTTGTCACTGCAATTACTCTGATTAAGAAGGTTCCAGATGGATTTGAGGACATGGATGGCATTATCTCTAAAGCAAACATTGTAGAAACCGAGTCTTGTGGAGAAGTTTCTTCAGAAGAGAGAAAGCTCTCGAGGGCATCAAAAAAACTTGTGGCCAATGGTTTGCTTCTAATTGGTGGTGTGATCTGCCTGTCGCGAGGTCACTCTAGTCTTGGTGCCAAAGTTGTTATGGCATATATTCTTACAAAGCTAAGCAAGCGAGTTGATGCACCAGGAGGCCAAATGGCAACTAAAGAACCGTCATCCGCAGCACGAAGACCTCCTCTTAGCGTATTTCCCCACTTTCTTAAGTCCACAAAACTCGTCCAAGGTTACTTCTCTCCTTGTATCGGAACTAGAATGAAACCTGCTCTCGTTCATTCTCCTTTGCTGGCTGGTGACGGCCATGGGCATGGTGGAAACAACAATGGTGGTTGGAATAATTCGAATCCTTTTGGGGGTTTTGGATGGTGGCAGGATGACGGTGATTCTTCCCCATGGTCGGACAATGCCTTCTTTGCCTTCTTCTTTACCTCCATTTTGGGCTGTTTCTGCCTTTTTCAATTGGCAGCAGCGCTAGCACGTAATGAAATGAACTATGAGTCTGTTTGGGAAGTAAAAGGAGGTAAGCGAATCCGCCTCATTCTCGATACGTTTAGGGATGAGTTCCATGTTGCAACTGGCATGCCGTCGTCTTCGTTATCCTTTTCCTTTGTCAATGTTTGGCTTCGTTGCAGCGATGTATTCAGGCGTTTGATGCTTCCGGAGGGTTTTCCAGACAGCGTTACCAGCGACTATCTGGAATATTCTCTTTGGCGAGGAGTGCAGGGGATTGCCAGCCAAGTTAGTGGGGTCCTTGCAACTCAGGCACTGCTTTATGCTGTTGGATTGGGAAAAGGAGCTATTCCGACTGCTGCTGCAGTGAATTGGGTACTGAAAGATGGATTTGGATATCTGAGTAAAATTTTATTCTCAAAATATGGACGGCACTTTGACGTTCATCCGAAGGGATGGAGGTTGTTTGCTGATCTTCTGGAAAACGCTGCCTATGGGATGGAAATGTTAACTCCCGCATTTCCCCTGCATTTTTTCGTGATCGGTGCTGCTGCTGGGGCTGGACGATCTGCAGCCGCCTTGATTCAGGCTGCTACTAGGAGTTGTTTTTATGCTGGCTTTGCTGCTCAAAGGAATTTTGCCGAGGTGATTGCCAAAGGTGAAGCACAAGGAATGGTGAGCAAGTCTATTGGTATGATGCTTGGCATTACATTGGCTAATCGTATAAGGTCCTCAACATCTCTTGCTCTTGGATGCTTTAGCATAGTGACCTTAATCCACATGTTCTGCAATCTAAAATCATACAAGTCCATTGAACTAAGGACACTAAATCCTTATCGTGCAAGTTTGGTGTTTAGTGAATATCTGTTGAGTGGTGAGGTGCCTTCTATTAAAGATGTAAACAATGAAGAACCTCTTTTTCCAGCTGTACCATTTCTTAATACAAGGCTTGCTTGTGATGAGCCAAAATTGGGTTTACTATCTGCTGAAGCAAAGGAATCAGCAGCTAATATTGAAAAGCGACTGCAGTTGGGATCTAAGCTCAGTGATGTGGCCACCTGTGAGGAGGATGTTCTTGAACTCTTAAGTCTGTTTAATAAAGAAAATTACATTCTGTCAGAGCACAGGGGGAAATATTGTGTAATTCTTAAAGAAAGTGCTTCACCAGTAGACATGCTGAAGGCAGTGTTTCATGTCAATTATTTGCACTGGTTAGAGAGAAACGCTGGAATAACAGCAAGAAGTGCTTCTAATGACTGCAGACCAGGAGGAAGGCTGCAAATGTCTTTGGAATATGTGGAGAGGGAATTCAACCATATCAAATATGATGGGGAATTGGCTGAATTTTACTCCCACTCCAAAATTAGATCGACCACCTCTCCCTTGTTCCTCGTGTCGTACACTGGCCGGTCGACCAACTCCAACGCCACCGTTCCAGTCGGCCATTGGAGGACCTTGCCTCTGTCCGCCAGCCATATTACCCACACAGCTGCTCCACACCTCATCAAGAACGCATTGACAGCGTCAATCGAGGGGAACAGAAGCAGGCCAAGAATAGAAAACAAGCCATCATCCAATTCTCGCCCAGCATTGGTTGAAGTCTACAAAGATGCGTCCTTGAAATCGAACTCTCAACGGGAAATGATAGGATTGCATCGTAATGATTTTGTTGATTGGTTTAATTTGGCTGTAAAAGTTGTAATCGTCTGTGGACTGGGCCAGTCGCTTGGGCGTAATCTGCTGGAGTTTATAATGCAGCCATGGACACAGCTTCTTCTGGGAATACTGAAAACAAAGATAAACTACATAGGTGTTAAAGAGATGGAATTGCGAATGAAAGTCACTCAAGCAGTTCACGTCCTAAATCATGATACCCAATCTTGCAACCGTGTGGCAGCGAATCAATGGTTAGTTCAGTTTCAACAGACAGGTGCTGCTTGGGAAGTTGCCACTGCTATCCTTACCTCCGATCATGTTCAACATCCACTGTCCTCCTTTGTCCCTGATTTGGAAGTCGAGTTCTTCGCTGCTCAGATTCTTAAACGCAAGAGGATAAAAAAGGTACTGGAAGAGGAAGCTTGTATTTTGTCGATCGATGGGAACTTTGGTCCTAAGGAAGTTGCTCCTTCTCTTCCCGTTGATAATTCCTCTCCTCAAGAACTTCTAGAAGACGTAATGCAGTCATCATCTTCAGCCTACACTTCTCCAATGTCTTCTTCTTTGATTCCTGACAATTTGCTTCTTTGGTTAAGGCTTGGAGCCTTTAGTTTCAGGCAATTCCTTCTAGTTCTCAAGGAGCTACAGTTTAAGGGTGTTTGCCTTATCCAGAATGAAGGCTATCATTTACAATTAGGAGTAAAAGATGCTCTACTAAACGCTCTTCTTGTGGCTGCCAAAAAGTTTAGTTCAGGCCCTCCTCAGCTTTTAACTCAAATCTGTCTTGCACTCTCTGCGCTTATTCTGAGAACAGTAGAGCATGGGAAACCCATTGATCGTCTTTTCTACAGTCTTCAGAATCTGCAGAGTGTGGACAATGGCAATTTGGCTGTTTTGGAGATGCTTACTGTTTTACCTGAAGAAGTTGTTGACAGCCAAAATGTTGATTGTAAAATAAGTTCATCCTGTAGGAGCCAATATGCCCGAGAGCTTCTGTTGCACACGCCTATGGTTCTTGAGTTCCTACTGCAGCAATCTGAGAAAGGGTTTGATTGTGGGACACAGCCGCAGGAAAGGAACAGAAAAATTCTTCGATGTTTGCTGAGTTGGGTGCGTGTTGGGTGCTTCTCTGAGATACCTCAGGGTTCATTGCCAACGCATCCCCTTCTTAATTTTGTGCTCAAGTCCTTGCAGGATGCAGCTTCATTTGATTTGGCTATTGAAGTTCTTGTTGAGCTTGTGAGTAGACATGAGGGGTTACCTCAGGTCTTGCTGTGCAGAGTACATTTTCTTAAGGAAATGCTTCTTTTGCCTTCGCTTAGTAGTGGAGATGAGAAAGTGATCAGTGGTCTTGCATGCTTGTTCTCAGAAGTTGGGCAAGCAGCACCATCCTTAATTGTAGATGCCAGTGCTGAAGCCCTTGCTCTAGCTGATGCTCTCTTGAGTTGTGTGGCTTTTCCAAGTGAAGATTGGGAGATTGCTGACTCAACATTGCAATTTTGGTCTTCTCTCGCGAGCTATATTCTTGGCCTTGATGAGAATAATTCGGCAAATAGGAAACATGTGGAAGATGTGTTTCTATCTGTATTTTCAGCATTGCTTGATGGGCTTCTATTACGTGCTCAGGTTTCCTTTCCTGTTCTGCTTGTCCTGGATACACCAAACACAAAGTTGGTCTTAGTTGCTTGCTTATCTGAACGTTTGTTAATTTATTTTATGCTATCTTTTGTATAG

Coding sequence (CDS)

ATGGAGGCTATTTCAGATACAGATTTGAAGTATTTATTGGACAATTTGGATGGAAGGATAAATGAGAATGAGAAATGGGAACGTGTTGTAGAAAAAACTAATGATCATCTTTCATATAGTGCTAAATGCTGCAAGCCTAAGGATGGTCCCCTGAAATACTCGAGTGTGACAGTATTTGAAAATTGCTGTCCAAAATTGTTGAGAGACTTCTACATGGACAATGACTATAGAAAACAGTGGGACAGTACCATGCTTATGCATGAGCAGCTACAAATGGATGGAACTAGCGGAATTGAAGTCGGTCGCACCTTAAAAAAATTTCCATTATTGACGCCCAGGGAGTATATACTATCATGGAGATTATGGGAAGGGAAAGATAAATCCTTTTACTGTTTTACCAAGGAGTGTGAACATCCTTTGGCACCACAACAGAAGAAGTACGTGCGAGTGAAATTTTTCAGATCTGTATCCGGCAGAAATGCATGTGAGATCAGTATGTTGCACCAAGAAGATGCTGGTTTGAATGTGGAGATGGCAAAACTTGCGTTTGCAAAGGGCATATGGAACTTTGTCTGTAAAATGGATAAAGCATTACGCAAATACGCTCTAATCCACTGCCCTCAATCAAGTTCACTTGTCACTGCAATTACTCTGATTAAGAAGGTTCCAGATGGATTTGAGGACATGGATGGCATTATCTCTAAAGCAAACATTGTAGAAACCGAGTCTTGTGGAGAAGTTTCTTCAGAAGAGAGAAAGCTCTCGAGGGCATCAAAAAAACTTGTGGCCAATGGTTTGCTTCTAATTGGTGGTGTGATCTGCCTGTCGCGAGGTCACTCTAGTCTTGGTGCCAAAGTTGTTATGGCATATATTCTTACAAAGCTAAGCAAGCGAGTTGATGCACCAGGAGGCCAAATGGCAACTAAAGAACCGTCATCCGCAGCACGAAGACCTCCTCTTAGCGTATTTCCCCACTTTCTTAAGTCCACAAAACTCGTCCAAGGTTACTTCTCTCCTTGTATCGGAACTAGAATGAAACCTGCTCTCGTTCATTCTCCTTTGCTGGCTGGTGACGGCCATGGGCATGGTGGAAACAACAATGGTGGTTGGAATAATTCGAATCCTTTTGGGGGTTTTGGATGGTGGCAGGATGACGGTGATTCTTCCCCATGGTCGGACAATGCCTTCTTTGCCTTCTTCTTTACCTCCATTTTGGGCTGTTTCTGCCTTTTTCAATTGGCAGCAGCGCTAGCACGTAATGAAATGAACTATGAGTCTGTTTGGGAAGTAAAAGGAGGTAAGCGAATCCGCCTCATTCTCGATACGTTTAGGGATGAGTTCCATGTTGCAACTGGCATGCCGTCGTCTTCGTTATCCTTTTCCTTTGTCAATGTTTGGCTTCGTTGCAGCGATGTATTCAGGCGTTTGATGCTTCCGGAGGGTTTTCCAGACAGCGTTACCAGCGACTATCTGGAATATTCTCTTTGGCGAGGAGTGCAGGGGATTGCCAGCCAAGTTAGTGGGGTCCTTGCAACTCAGGCACTGCTTTATGCTGTTGGATTGGGAAAAGGAGCTATTCCGACTGCTGCTGCAGTGAATTGGGTACTGAAAGATGGATTTGGATATCTGAGTAAAATTTTATTCTCAAAATATGGACGGCACTTTGACGTTCATCCGAAGGGATGGAGGTTGTTTGCTGATCTTCTGGAAAACGCTGCCTATGGGATGGAAATGTTAACTCCCGCATTTCCCCTGCATTTTTTCGTGATCGGTGCTGCTGCTGGGGCTGGACGATCTGCAGCCGCCTTGATTCAGGCTGCTACTAGGAGTTGTTTTTATGCTGGCTTTGCTGCTCAAAGGAATTTTGCCGAGGTGATTGCCAAAGGTGAAGCACAAGGAATGGTGAGCAAGTCTATTGGTATGATGCTTGGCATTACATTGGCTAATCGTATAAGGTCCTCAACATCTCTTGCTCTTGGATGCTTTAGCATAGTGACCTTAATCCACATGTTCTGCAATCTAAAATCATACAAGTCCATTGAACTAAGGACACTAAATCCTTATCGTGCAAGTTTGGTGTTTAGTGAATATCTGTTGAGTGGTGAGGTGCCTTCTATTAAAGATGTAAACAATGAAGAACCTCTTTTTCCAGCTGTACCATTTCTTAATACAAGGCTTGCTTGTGATGAGCCAAAATTGGGTTTACTATCTGCTGAAGCAAAGGAATCAGCAGCTAATATTGAAAAGCGACTGCAGTTGGGATCTAAGCTCAGTGATGTGGCCACCTGTGAGGAGGATGTTCTTGAACTCTTAAGTCTGTTTAATAAAGAAAATTACATTCTGTCAGAGCACAGGGGGAAATATTGTGTAATTCTTAAAGAAAGTGCTTCACCAGTAGACATGCTGAAGGCAGTGTTTCATGTCAATTATTTGCACTGGTTAGAGAGAAACGCTGGAATAACAGCAAGAAGTGCTTCTAATGACTGCAGACCAGGAGGAAGGCTGCAAATGTCTTTGGAATATGTGGAGAGGGAATTCAACCATATCAAATATGATGGGGAATTGGCTGAATTTTACTCCCACTCCAAAATTAGATCGACCACCTCTCCCTTGTTCCTCGTGTCGTACACTGGCCGGTCGACCAACTCCAACGCCACCGTTCCAGTCGGCCATTGGAGGACCTTGCCTCTGTCCGCCAGCCATATTACCCACACAGCTGCTCCACACCTCATCAAGAACGCATTGACAGCGTCAATCGAGGGGAACAGAAGCAGGCCAAGAATAGAAAACAAGCCATCATCCAATTCTCGCCCAGCATTGGTTGAAGTCTACAAAGATGCGTCCTTGAAATCGAACTCTCAACGGGAAATGATAGGATTGCATCGTAATGATTTTGTTGATTGGTTTAATTTGGCTGTAAAAGTTGTAATCGTCTGTGGACTGGGCCAGTCGCTTGGGCGTAATCTGCTGGAGTTTATAATGCAGCCATGGACACAGCTTCTTCTGGGAATACTGAAAACAAAGATAAACTACATAGGTGTTAAAGAGATGGAATTGCGAATGAAAGTCACTCAAGCAGTTCACGTCCTAAATCATGATACCCAATCTTGCAACCGTGTGGCAGCGAATCAATGGTTAGTTCAGTTTCAACAGACAGGTGCTGCTTGGGAAGTTGCCACTGCTATCCTTACCTCCGATCATGTTCAACATCCACTGTCCTCCTTTGTCCCTGATTTGGAAGTCGAGTTCTTCGCTGCTCAGATTCTTAAACGCAAGAGGATAAAAAAGGTACTGGAAGAGGAAGCTTGTATTTTGTCGATCGATGGGAACTTTGGTCCTAAGGAAGTTGCTCCTTCTCTTCCCGTTGATAATTCCTCTCCTCAAGAACTTCTAGAAGACGTAATGCAGTCATCATCTTCAGCCTACACTTCTCCAATGTCTTCTTCTTTGATTCCTGACAATTTGCTTCTTTGGTTAAGGCTTGGAGCCTTTAGTTTCAGGCAATTCCTTCTAGTTCTCAAGGAGCTACAGTTTAAGGGTGTTTGCCTTATCCAGAATGAAGGCTATCATTTACAATTAGGAGTAAAAGATGCTCTACTAAACGCTCTTCTTGTGGCTGCCAAAAAGTTTAGTTCAGGCCCTCCTCAGCTTTTAACTCAAATCTGTCTTGCACTCTCTGCGCTTATTCTGAGAACAGTAGAGCATGGGAAACCCATTGATCGTCTTTTCTACAGTCTTCAGAATCTGCAGAGTGTGGACAATGGCAATTTGGCTGTTTTGGAGATGCTTACTGTTTTACCTGAAGAAGTTGTTGACAGCCAAAATGTTGATTGTAAAATAAGTTCATCCTGTAGGAGCCAATATGCCCGAGAGCTTCTGTTGCACACGCCTATGGTTCTTGAGTTCCTACTGCAGCAATCTGAGAAAGGGTTTGATTGTGGGACACAGCCGCAGGAAAGGAACAGAAAAATTCTTCGATGTTTGCTGAGTTGGGTGCGTGTTGGGTGCTTCTCTGAGATACCTCAGGGTTCATTGCCAACGCATCCCCTTCTTAATTTTGTGCTCAAGTCCTTGCAGGATGCAGCTTCATTTGATTTGGCTATTGAAGTTCTTGTTGAGCTTGTGAGTAGACATGAGGGGTTACCTCAGGTCTTGCTGTGCAGAGTACATTTTCTTAAGGAAATGCTTCTTTTGCCTTCGCTTAGTAGTGGAGATGAGAAAGTGATCAGTGGTCTTGCATGCTTGTTCTCAGAAGTTGGGCAAGCAGCACCATCCTTAATTGTAGATGCCAGTGCTGAAGCCCTTGCTCTAGCTGATGCTCTCTTGAGTTGTGTGGCTTTTCCAAGTGAAGATTGGGAGATTGCTGACTCAACATTGCAATTTTGGTCTTCTCTCGCGAGCTATATTCTTGGCCTTGATGAGAATAATTCGGCAAATAGGAAACATGTGGAAGATGTGTTTCTATCTGTATTTTCAGCATTGCTTGATGGGCTTCTATTACGTGCTCAGGTTTCCTTTCCTGTTCTGCTTGTCCTGGATACACCAAACACAAAGTTGGTCTTAGTTGCTTGCTTATCTGAACGTTTGTTAATTTATTTTATGCTATCTTTTGTATAG

Protein sequence

MEAISDTDLKYLLDNLDGRINENEKWERVVEKTNDHLSYSAKCCKPKDGPLKYSSVTVFENCCPKLLRDFYMDNDYRKQWDSTMLMHEQLQMDGTSGIEVGRTLKKFPLLTPREYILSWRLWEGKDKSFYCFTKECEHPLAPQQKKYVRVKFFRSVSGRNACEISMLHQEDAGLNVEMAKLAFAKGIWNFVCKMDKALRKYALIHCPQSSSLVTAITLIKKVPDGFEDMDGIISKANIVETESCGEVSSEERKLSRASKKLVANGLLLIGGVICLSRGHSSLGAKVVMAYILTKLSKRVDAPGGQMATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHSPLLAGDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPFLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFNHIKYDGELAEFYSHSKIRSTTSPLFLVSYTGRSTNSNATVPVGHWRTLPLSASHITHTAAPHLIKNALTASIEGNRSRPRIENKPSSNSRPALVEVYKDASLKSNSQREMIGLHRNDFVDWFNLAVKVVIVCGLGQSLGRNLLEFIMQPWTQLLLGILKTKINYIGVKEMELRMKVTQAVHVLNHDTQSCNRVAANQWLVQFQQTGAAWEVATAILTSDHVQHPLSSFVPDLEVEFFAAQILKRKRIKKVLEEEACILSIDGNFGPKEVAPSLPVDNSSPQELLEDVMQSSSSAYTSPMSSSLIPDNLLLWLRLGAFSFRQFLLVLKELQFKGVCLIQNEGYHLQLGVKDALLNALLVAAKKFSSGPPQLLTQICLALSALILRTVEHGKPIDRLFYSLQNLQSVDNGNLAVLEMLTVLPEEVVDSQNVDCKISSSCRSQYARELLLHTPMVLEFLLQQSEKGFDCGTQPQERNRKILRCLLSWVRVGCFSEIPQGSLPTHPLLNFVLKSLQDAASFDLAIEVLVELVSRHEGLPQVLLCRVHFLKEMLLLPSLSSGDEKVISGLACLFSEVGQAAPSLIVDASAEALALADALLSCVAFPSEDWEIADSTLQFWSSLASYILGLDENNSANRKHVEDVFLSVFSALLDGLLLRAQVSFPVLLVLDTPNTKLVLVACLSERLLIYFMLSFV
Homology
BLAST of HG10011341 vs. NCBI nr
Match: XP_038881395.1 (protein root UVB sensitive 1, chloroplastic [Benincasa hispida])

HSP 1 Score: 1048.5 bits (2710), Expect = 5.6e-302
Identity = 521/560 (93.04%), Postives = 538/560 (96.07%), Query Frame = 0

Query: 302 PGGQM-----ATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHSPLLA 361
           PGG       ++K  + AA   PLSVFPHFLK T+ VQGYFSPCIGTR+KPALVHSPLLA
Sbjct: 29  PGGHFHHCSDSSKRRACAALTLPLSVFPHFLKPTEQVQGYFSPCIGTRIKPALVHSPLLA 88

Query: 362 GDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAA 421
           GDGHG GGNNNGGWNNSNPFGGFGWWQ+DGDS PWSDNAF AFFFTS+LGCFCL Q AAA
Sbjct: 89  GDGHGCGGNNNGGWNNSNPFGGFGWWQNDGDSPPWSDNAFLAFFFTSVLGCFCLLQFAAA 148

Query: 422 LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRL 481
           LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVW+RCSD+F+RL
Sbjct: 149 LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWIRCSDIFKRL 208

Query: 482 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 541
           MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL
Sbjct: 209 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 268

Query: 542 KDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGA 601
           KDGFGYLSKIL SKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHF VIGAAAGA
Sbjct: 269 KDGFGYLSKILLSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFVVIGAAAGA 328

Query: 602 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 661
           GRSAAALIQA+TRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS
Sbjct: 329 GRSAAALIQASTRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 388

Query: 662 LALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 721
           LALGCFSIVTL+HMFCNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF
Sbjct: 389 LALGCFSIVTLVHMFCNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 448

Query: 722 PAVPFLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNK 781
           PAVPFLNTRLACDEPKLG+LSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNK
Sbjct: 449 PAVPFLNTRLACDEPKLGILSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNK 508

Query: 782 ENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQ 841
           ENYILSEHRGKYCV+LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDC+PGGRLQ
Sbjct: 509 ENYILSEHRGKYCVMLKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCKPGGRLQ 568

Query: 842 MSLEYVEREFNHIKYDGELA 857
           MSLEYVEREFNH+KYDGELA
Sbjct: 569 MSLEYVEREFNHVKYDGELA 588

BLAST of HG10011341 vs. NCBI nr
Match: XP_011651345.1 (protein root UVB sensitive 1, chloroplastic isoform X1 [Cucumis sativus] >KAE8650562.1 hypothetical protein Csa_009558 [Cucumis sativus])

HSP 1 Score: 1025.4 bits (2650), Expect = 5.1e-295
Identity = 511/545 (93.76%), Postives = 521/545 (95.60%), Query Frame = 0

Query: 312 SSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHSPLLAGDGHGHGGNNNGGWN 371
           S  A RP LSVFPHFLK TKL QGY SPC GTR+KPALVHSPLLAGDGHG  GNNNGGWN
Sbjct: 46  SCTALRPSLSVFPHFLKPTKLFQGYSSPCNGTRIKPALVHSPLLAGDGHGCDGNNNGGWN 105

Query: 372 NSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALARNEMNYESVWEVK 431
           NSNPFGGFGWWQ DGDS PWSDNAF AFFF+S+LGCFCLFQLA ALARN MN ES+WEVK
Sbjct: 106 NSNPFGGFGWWQYDGDSPPWSDNAFLAFFFSSVLGCFCLFQLAVALARNNMNTESIWEVK 165

Query: 432 GGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPEGFPDSVTSDYL 491
           GGKRIRLILDT+RDEFHVATGMPSSSLSFSFVNVWLRCSD+F RLMLPEGFPDSVTSDYL
Sbjct: 166 GGKRIRLILDTYRDEFHVATGMPSSSLSFSFVNVWLRCSDIFTRLMLPEGFPDSVTSDYL 225

Query: 492 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKILFSKY 551
           EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKI  SKY
Sbjct: 226 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKIFLSKY 285

Query: 552 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSAAALIQAATRSC 611
           GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHF VIGAAAGAGRSAAALIQAATRSC
Sbjct: 286 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFVVIGAAAGAGRSAAALIQAATRSC 345

Query: 612 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF 671
           FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF
Sbjct: 346 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF 405

Query: 672 CNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPFLNTRLACDEP 731
           CNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVP LN +LACDEP
Sbjct: 406 CNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPLLNRKLACDEP 465

Query: 732 KLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVI 791
           KL LLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCV+
Sbjct: 466 KLSLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVM 525

Query: 792 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFNHIKY 851
           LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREF H+KY
Sbjct: 526 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFKHVKY 585

Query: 852 DGELA 857
           DGELA
Sbjct: 586 DGELA 590

BLAST of HG10011341 vs. NCBI nr
Match: XP_008449956.1 (PREDICTED: protein root UVB sensitive 1, chloroplastic isoform X1 [Cucumis melo])

HSP 1 Score: 1008.1 bits (2605), Expect = 8.4e-290
Identity = 501/545 (91.93%), Postives = 517/545 (94.86%), Query Frame = 0

Query: 312 SSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHSPLLAGDGHGHGGNNNGGWN 371
           S  + RPPLSVFPHFLK  KL +GY SPC GTR+KPALVHSPLLAGDG+G  GNNNGGWN
Sbjct: 45  SCKSLRPPLSVFPHFLKPAKLFRGYSSPCNGTRIKPALVHSPLLAGDGYGCDGNNNGGWN 104

Query: 372 NSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALARNEMNYESVWEVK 431
           NSNPFGGFGWWQ D DS PWSDNAF A FFTS+LGCFCLFQLA ALARN+M  ES+WEVK
Sbjct: 105 NSNPFGGFGWWQYDSDSPPWSDNAFLALFFTSVLGCFCLFQLAVALARNDMKTESIWEVK 164

Query: 432 GGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPEGFPDSVTSDYL 491
           GGKRIRLILDT+RDEFHVATGMPSSSLSFSFVNVWLRCSD+F+RLMLPEGFPDSVTSDYL
Sbjct: 165 GGKRIRLILDTYRDEFHVATGMPSSSLSFSFVNVWLRCSDIFKRLMLPEGFPDSVTSDYL 224

Query: 492 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKILFSKY 551
           EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKI  SKY
Sbjct: 225 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKIFLSKY 284

Query: 552 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSAAALIQAATRSC 611
           GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHF VIGAAAGAGRSAAALIQAATRSC
Sbjct: 285 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFVVIGAAAGAGRSAAALIQAATRSC 344

Query: 612 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF 671
           FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLAN IRSSTSLALGCFSIVTLIHMF
Sbjct: 345 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANHIRSSTSLALGCFSIVTLIHMF 404

Query: 672 CNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPFLNTRLACDEP 731
            NLKSYKSI+LRTLNPYRASLVFSEYL SGEVPSIK+VNNEEPLFPAVP LNTRL CDEP
Sbjct: 405 SNLKSYKSIQLRTLNPYRASLVFSEYLFSGEVPSIKEVNNEEPLFPAVPLLNTRLGCDEP 464

Query: 732 KLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVI 791
           KLGLLSAEAKESAANI++RLQLGSKLSDVATCE DVLELLSLFNKENYILSEHRGKYCV+
Sbjct: 465 KLGLLSAEAKESAANIDQRLQLGSKLSDVATCEADVLELLSLFNKENYILSEHRGKYCVM 524

Query: 792 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFNHIKY 851
           LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREF H+KY
Sbjct: 525 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFKHVKY 584

Query: 852 DGELA 857
           DGELA
Sbjct: 585 DGELA 589

BLAST of HG10011341 vs. NCBI nr
Match: XP_031738101.1 (protein root UVB sensitive 1, chloroplastic isoform X2 [Cucumis sativus])

HSP 1 Score: 977.6 bits (2526), Expect = 1.2e-280
Identity = 492/545 (90.28%), Postives = 502/545 (92.11%), Query Frame = 0

Query: 312 SSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHSPLLAGDGHGHGGNNNGGWN 371
           S  A RP LSVFPHFLK TKL QGY SPC GTR+KPALVHSPLLAGDGHG  GNNNGGWN
Sbjct: 46  SCTALRPSLSVFPHFLKPTKLFQGYSSPCNGTRIKPALVHSPLLAGDGHGCDGNNNGGWN 105

Query: 372 NSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALARNEMNYESVWEVK 431
           NSNPFGGFGWWQ DGDS PWSDNAF AFFF+S+LGCFCLFQLA ALARN MN ES+WEVK
Sbjct: 106 NSNPFGGFGWWQYDGDSPPWSDNAFLAFFFSSVLGCFCLFQLAVALARNNMNTESIWEVK 165

Query: 432 GGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPEGFPDSVTSDYL 491
           GGKRIRLILDT+RDEFHVATGMPSSSLSFSFVNVWLRCSD+F RLMLPEGFPDSVTSDYL
Sbjct: 166 GGKRIRLILDTYRDEFHVATGMPSSSLSFSFVNVWLRCSDIFTRLMLPEGFPDSVTSDYL 225

Query: 492 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKILFSKY 551
           EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKI  SKY
Sbjct: 226 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKIFLSKY 285

Query: 552 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSAAALIQAATRSC 611
           GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHF VIGAAAGAGRSAAALIQ      
Sbjct: 286 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFVVIGAAAGAGRSAAALIQ------ 345

Query: 612 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF 671
                        VIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF
Sbjct: 346 -------------VIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF 405

Query: 672 CNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPFLNTRLACDEP 731
           CNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVP LN +LACDEP
Sbjct: 406 CNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPLLNRKLACDEP 465

Query: 732 KLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVI 791
           KL LLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCV+
Sbjct: 466 KLSLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVM 525

Query: 792 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFNHIKY 851
           LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREF H+KY
Sbjct: 526 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFKHVKY 571

Query: 852 DGELA 857
           DGELA
Sbjct: 586 DGELA 571

BLAST of HG10011341 vs. NCBI nr
Match: KAG6581156.1 (Protein root UVB sensitive 1, chloroplastic, partial [Cucurbita argyrosperma subsp. sororia])

HSP 1 Score: 964.5 bits (2492), Expect = 1.1e-276
Identity = 517/703 (73.54%), Postives = 563/703 (80.09%), Query Frame = 0

Query: 302  PGG--QMATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHS---PLLA 361
            PGG     +   S AARRPPL+VFP  LK  KL QG FSPCIGTR+KP LVHS   P L 
Sbjct: 28   PGGCFHHYSTRSSCAARRPPLNVFPDLLKPIKLAQGCFSPCIGTRIKPTLVHSHLLPPLL 87

Query: 362  GDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAA 421
             DGHG GGNNNGGWN+S  FGGFGWWQD  +SSP   NAF A   TS+LGCFC FQLAAA
Sbjct: 88   DDGHGCGGNNNGGWNSSYRFGGFGWWQDGSNSSPGWRNAFLALVLTSVLGCFCHFQLAAA 147

Query: 422  LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRL 481
            LARN MN ESVWEV+GGKRIRLILDTFRDEF+VATG+PSS LSFSFVN WLRCS++F+RL
Sbjct: 148  LARNGMNSESVWEVRGGKRIRLILDTFRDEFYVATGVPSSPLSFSFVNFWLRCSEIFKRL 207

Query: 482  MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 541
            MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL
Sbjct: 208  MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 267

Query: 542  KDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGA 601
            KDGFGYLSKIL SKYGRHFDV+PKGWRLFADLLENAA+GMEMLTPAFPLHF VIGAAAGA
Sbjct: 268  KDGFGYLSKILLSKYGRHFDVNPKGWRLFADLLENAAFGMEMLTPAFPLHFVVIGAAAGA 327

Query: 602  GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 661
            GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGM+LGI LANRIRSSTS
Sbjct: 328  GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMLLGIALANRIRSSTS 387

Query: 662  LALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 721
            LALGCFS+VT+IHMFCNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIK+VNNEEPLF
Sbjct: 388  LALGCFSVVTIIHMFCNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKNVNNEEPLF 447

Query: 722  PAVPFLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNK 781
            PAVPFLNTRLACDEPK+GLLS EAKESAANIEKRLQLGSKLSDVA CEEDVL+L+SL+  
Sbjct: 448  PAVPFLNTRLACDEPKVGLLSTEAKESAANIEKRLQLGSKLSDVARCEEDVLQLISLYKN 507

Query: 782  ENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQ 841
            ENYILSEHRG+YCV+LKESA P DMLKA+FHVNYLHWLERNAGI ARSA+NDC+PGGRLQ
Sbjct: 508  ENYILSEHRGRYCVMLKESALPKDMLKALFHVNYLHWLERNAGIEARSAANDCKPGGRLQ 567

Query: 842  MSLEYVEREFNHIKYDGELAEFYSHSKIRSTTSPLFLVSYTGRSTNSNATVPVGHWRTLP 901
            +SLEYVEREF H+KYDGELA+      + S++ P    S  GR T            T P
Sbjct: 568  ISLEYVEREFIHVKYDGELAD---PPPLPSSSCP----SLAGRPT-----------PTPP 627

Query: 902  LSASHITHTAAPHLIKNALTASIEGNRSRPRIENKPSSNSRPALVEVYKDASLKSNSQRE 961
              +++      P L   A+T                 +N  P L + +    LKS     
Sbjct: 628  FQSAN----GGPCLCPPAVT-----------------TNHHPILAQHW----LKSTK--- 669

Query: 962  MIGLHRNDFVDWFNLAVKVVIVCGLGQSLGRNLLEFIMQPWTQ 1000
                            V+VV +CGLGQ+LGR+LL+F MQP TQ
Sbjct: 688  ---------------VVEVVSLCGLGQTLGRSLLKFKMQPRTQ 669

BLAST of HG10011341 vs. ExPASy Swiss-Prot
Match: Q7X6P3 (Protein root UVB sensitive 1, chloroplastic OS=Arabidopsis thaliana OX=3702 GN=RUS1 PE=1 SV=1)

HSP 1 Score: 595.5 bits (1534), Expect = 1.7e-168
Identity = 328/554 (59.21%), Postives = 404/554 (72.92%), Query Frame = 0

Query: 311 PSSAARRPPLSVFPHFLKSTKLVQGYFS-PCIGTRMKPALVHSPLLAGDGHGHGGNNNGG 370
           P  + R+P  S F   ++    V  +FS   + TR   A V S  L G  +G+  N NGG
Sbjct: 31  PRQSLRQPSGSSFSRCVRLVANVNDHFSKQSLATRNCLASVFSADLGG-SNGNNDNGNGG 90

Query: 371 WNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALA---------RN 430
                  GG G   +  DSS   D  +  F     L CF  F+L+AA A           
Sbjct: 91  GG-----GGDGGGDNSDDSS--FDLRYLCFLLLG-LSCFFHFRLSAASAIAKDQNSDSNG 150

Query: 431 EMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPE 490
           +   E+VWEV+G KR RL+ D  +DEF         S S +  N+  +C ++  + +LPE
Sbjct: 151 DAVKETVWEVRGSKRKRLVPDFVKDEFVSEESAFELSSSLTPENLLAQCRNLLTQFLLPE 210

Query: 491 GFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGF 550
           GFP+SVTSDYL+YSLWRGVQGIASQ+SGVLATQ+LLYAVGLGKGAIPTAAA+NWVLKDG 
Sbjct: 211 GFPNSVTSDYLDYSLWRGVQGIASQISGVLATQSLLYAVGLGKGAIPTAAAINWVLKDGI 270

Query: 551 GYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSA 610
           GYLSKI+ SKYGRHFDVHPKGWRLFADLLENAA+GMEMLTP FP  F +IGAAAGAGRSA
Sbjct: 271 GYLSKIMLSKYGRHFDVHPKGWRLFADLLENAAFGMEMLTPVFPQFFVMIGAAAGAGRSA 330

Query: 611 AALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALG 670
           AALIQAATRSCF AGFA+QRNFAEVIAKGEAQGMVSKS+G++LGI +AN I +STSLAL 
Sbjct: 331 AALIQAATRSCFNAGFASQRNFAEVIAKGEAQGMVSKSVGILLGIVVANCIGTSTSLALA 390

Query: 671 CFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVP 730
            F +VT IHM+ NLKSY+ I+LRTLNPYRASLVFSEYL+SG+ P IK+VN+EEPLFP V 
Sbjct: 391 AFGVVTTIHMYTNLKSYQCIQLRTLNPYRASLVFSEYLISGQAPLIKEVNDEEPLFPTVR 450

Query: 731 FLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYI 790
           F N + + ++ +  +LS+EAK +AA+IE+RLQLGSKLSDV   +E+ + L  L+  E YI
Sbjct: 451 FSNMK-SPEKLQDFVLSSEAKAAAADIEERLQLGSKLSDVIHNKEEAIALFDLYRNEGYI 510

Query: 791 LSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLE 850
           L+EH+G++CV+LKES++P DML+++F VNYL+WLE+NAGI   S  +DC+PGGRL +SL+
Sbjct: 511 LTEHKGRFCVMLKESSTPQDMLRSLFQVNYLYWLEKNAGIEPASTYSDCKPGGRLHISLD 570

Query: 851 YVEREFNHIKYDGE 855
           YV REF H K D E
Sbjct: 571 YVRREFEHAKEDSE 574

BLAST of HG10011341 vs. ExPASy Swiss-Prot
Match: Q84JB8 (Protein root UVB sensitive 3 OS=Arabidopsis thaliana OX=3702 GN=RUS3 PE=2 SV=1)

HSP 1 Score: 176.8 bits (447), Expect = 1.9e-42
Identity = 127/374 (33.96%), Postives = 196/374 (52.41%), Query Frame = 0

Query: 447 FHVATGMPSSSLSFS-----FVNVWLRCSDVFRRLMLPEGFPDSVTSDYLEYSLWRGVQG 506
           F  AT   SSSLS       F +VW R    F    +PEGFP SVT DY+ + LW  +QG
Sbjct: 26  FKTATITASSSLSIQRSANRFNHVWRRVLQAF----VPEGFPGSVTPDYVGFQLWDTLQG 85

Query: 507 IASQVSGVLATQALLYAVGLG-KGAIPTAAAVNWVLKDGFGYLSKILFSKY-GRHFDVHP 566
           +++    +L+TQALL A+G+G K A    A   W L+D  G L  ILF+ Y G + D + 
Sbjct: 86  LSTYTKMMLSTQALLSAIGVGEKSATVIGATFQWFLRDFTGMLGGILFTFYQGSNLDSNA 145

Query: 567 KGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSAAALIQAATRSCFYAGFAAQ 626
           K WRL ADL+ +    M++L+P FP  F V+       RS   +   ATR+     FA Q
Sbjct: 146 KMWRLVADLMNDIGMLMDLLSPLFPSAFIVVVCLGSLSRSFTGVASGATRAALTQHFALQ 205

Query: 627 RNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALG-CFSIVTLIHMFCNLKSYK 686
            N A++ AK  +Q  ++  +GM LG+ LA R  S   +A+   F  +T+ HM+ N ++ +
Sbjct: 206 DNAADISAKEGSQETMATMMGMSLGMLLA-RFTSGNPMAIWLSFLSLTVFHMYANYRAVR 265

Query: 687 SIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPFLNTRLACDEPKLGLLSA 746
            + L +LN  R+S++ + ++ +G+V S + V++ E + P               L   S 
Sbjct: 266 CLVLNSLNFERSSILLTHFIQTGQVLSPEQVSSMEGVLP---------------LWATSL 325

Query: 747 EAKESAANIEKRLQLGSKLSDVATCEEDVLELL-----SLFNKENYILSEHRGKYCVILK 806
            +  S   + KR+QLG ++S +     D+L+LL     S +    Y+L+  +G   VIL 
Sbjct: 326 RSTNSKP-LHKRVQLGVRVSSLPRL--DMLQLLNGVGASSYKNAKYLLAHIKGNVSVILH 376

Query: 807 ESASPVDMLKAVFH 808
           + + P D+LK+  H
Sbjct: 386 KDSKPADVLKSYIH 376

BLAST of HG10011341 vs. ExPASy Swiss-Prot
Match: Q499P8 (RUS family member 1 OS=Rattus norvegicus OX=10116 GN=Rusf1 PE=2 SV=1)

HSP 1 Score: 167.5 bits (423), Expect = 1.1e-39
Identity = 90/245 (36.73%), Postives = 142/245 (57.96%), Query Frame = 0

Query: 474 RRLMLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKG-AIPTAAAV 533
           R ++LP+GFPDSV+ DYL+Y LW  VQ  AS +SG LATQA+L  +G+G   A  +AA  
Sbjct: 72  RSVLLPQGFPDSVSPDYLQYQLWDSVQAFASSLSGSLATQAVLQGLGVGNAKASVSAATS 131

Query: 534 NWVLKDGFGYLSKILFSKY-GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIG 593
            W++KD  G L +I+F+ + G   D + K WRLFAD+L + A  +E++ P +P+ F +  
Sbjct: 132 TWLVKDSTGMLGRIIFAWWKGSKLDCNAKQWRLFADILNDTAMFLEIMAPMYPIFFTMTV 191

Query: 594 AAAGAGRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRI 653
           + +   +    +   ATR+      A + N A+V AK  +Q  V    G+++ + +   +
Sbjct: 192 STSNLAKCIVGVAGGATRAALTMHQARRNNMADVSAKDSSQETVVNLAGLLVSLLMLPLV 251

Query: 654 RSSTSLALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNN 713
               SL+LGCF ++T +H++ N ++ +++ L TLN  R  LV   +L  GEV      N 
Sbjct: 252 SDCLSLSLGCFILLTALHIYANYRAVRALVLETLNESRLQLVLKHFLQRGEVLEPASANQ 311

Query: 714 EEPLF 717
            EPL+
Sbjct: 312 MEPLW 316

BLAST of HG10011341 vs. ExPASy Swiss-Prot
Match: Q91W34 (RUS family member 1 OS=Mus musculus OX=10090 GN=Rusf1 PE=1 SV=1)

HSP 1 Score: 164.1 bits (414), Expect = 1.3e-38
Identity = 89/245 (36.33%), Postives = 140/245 (57.14%), Query Frame = 0

Query: 474 RRLMLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKG-AIPTAAAV 533
           R ++LP+GFPDSV+ DYL Y LW  VQ  AS +SG LATQA+L  +G+G   A  +AA  
Sbjct: 72  RSVLLPQGFPDSVSPDYLPYQLWDSVQAFASSLSGSLATQAVLQGLGVGNAKASVSAATS 131

Query: 534 NWVLKDGFGYLSKILFSKY-GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIG 593
            W++KD  G L +I+ + + G   D + K WRLFAD+L + A  +E++ P +P+ F +  
Sbjct: 132 TWLVKDSTGMLGRIILAWWKGSKLDCNAKQWRLFADILNDVAMFLEIMAPMYPIFFTMTV 191

Query: 594 AAAGAGRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRI 653
           + +   +    +   ATR+      A + N A+V AK  +Q  V    G+++ + +   +
Sbjct: 192 STSNLAKCIVGVAGGATRAALTMHQARRNNMADVSAKDSSQETVVNLAGLLVSLLMLPLV 251

Query: 654 RSSTSLALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNN 713
               SL+LGCF ++T +H++ N ++ +++ L TLN  R  LV   +L  GEV      N 
Sbjct: 252 SDCPSLSLGCFVLLTALHIYANYRAVRALVLETLNESRLQLVLEHFLQRGEVLEPASANQ 311

Query: 714 EEPLF 717
            EPL+
Sbjct: 312 MEPLW 316

BLAST of HG10011341 vs. ExPASy Swiss-Prot
Match: Q5R8F6 (RUS family member 1 OS=Pongo abelii OX=9601 GN=Rusf1 PE=2 SV=1)

HSP 1 Score: 164.1 bits (414), Expect = 1.3e-38
Identity = 100/297 (33.67%), Postives = 156/297 (52.53%), Query Frame = 0

Query: 428 WEVKGGK-----RIRLILDTFRDEFHV-ATGMPSSSLSFSFVNVWLRCSDVFRRLMLPEG 487
           WEV G +     R   +    RD   V A G PS  LS              + + LP+G
Sbjct: 34  WEVGGWRWWGLSRAFTVKPEGRDSGEVGAPGAPSPPLS------------GLQAVFLPQG 93

Query: 488 FPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKG-AIPTAAAVNWVLKDGF 547
           FPDSV+ DYL Y LW  VQ  AS +SG LATQA+L  +G+G   A  +AA   W++KD  
Sbjct: 94  FPDSVSPDYLPYQLWDSVQAFASGLSGSLATQAVLLGIGVGNAKATVSAATATWLVKDST 153

Query: 548 GYLSKILFSKY-GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRS 607
           G L +I+F+ + G   D + K WRLFAD+L + A  +E++ P +P+ F +  + +   + 
Sbjct: 154 GMLGRIVFAWWKGSKLDCNAKQWRLFADILNDVAMFLEIMAPVYPICFTMTVSTSNLAKC 213

Query: 608 AAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLAL 667
             ++   ATR+      A + N A+V AK  +Q  +   +G+++ + +   +      +L
Sbjct: 214 IVSVAGGATRAALTVHQARRNNMADVSAKDSSQETLVNLVGLLVSLLMLPLVSGCPGFSL 273

Query: 668 GCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 717
           GCF  +T +H++ N ++ +++ + TLN  R  LV   YL  GEV +    N  EPL+
Sbjct: 274 GCFFFLTALHIYANYRAVRALVMETLNEGRLRLVLKHYLQRGEVLNPTAANRMEPLW 318

BLAST of HG10011341 vs. ExPASy TrEMBL
Match: A0A1S3BP56 (protein root UVB sensitive 1, chloroplastic isoform X1 OS=Cucumis melo OX=3656 GN=LOC103491686 PE=3 SV=1)

HSP 1 Score: 1008.1 bits (2605), Expect = 4.1e-290
Identity = 501/545 (91.93%), Postives = 517/545 (94.86%), Query Frame = 0

Query: 312 SSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHSPLLAGDGHGHGGNNNGGWN 371
           S  + RPPLSVFPHFLK  KL +GY SPC GTR+KPALVHSPLLAGDG+G  GNNNGGWN
Sbjct: 45  SCKSLRPPLSVFPHFLKPAKLFRGYSSPCNGTRIKPALVHSPLLAGDGYGCDGNNNGGWN 104

Query: 372 NSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALARNEMNYESVWEVK 431
           NSNPFGGFGWWQ D DS PWSDNAF A FFTS+LGCFCLFQLA ALARN+M  ES+WEVK
Sbjct: 105 NSNPFGGFGWWQYDSDSPPWSDNAFLALFFTSVLGCFCLFQLAVALARNDMKTESIWEVK 164

Query: 432 GGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPEGFPDSVTSDYL 491
           GGKRIRLILDT+RDEFHVATGMPSSSLSFSFVNVWLRCSD+F+RLMLPEGFPDSVTSDYL
Sbjct: 165 GGKRIRLILDTYRDEFHVATGMPSSSLSFSFVNVWLRCSDIFKRLMLPEGFPDSVTSDYL 224

Query: 492 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKILFSKY 551
           EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKI  SKY
Sbjct: 225 EYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGFGYLSKIFLSKY 284

Query: 552 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSAAALIQAATRSC 611
           GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHF VIGAAAGAGRSAAALIQAATRSC
Sbjct: 285 GRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFVVIGAAAGAGRSAAALIQAATRSC 344

Query: 612 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALGCFSIVTLIHMF 671
           FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLAN IRSSTSLALGCFSIVTLIHMF
Sbjct: 345 FYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANHIRSSTSLALGCFSIVTLIHMF 404

Query: 672 CNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVPFLNTRLACDEP 731
            NLKSYKSI+LRTLNPYRASLVFSEYL SGEVPSIK+VNNEEPLFPAVP LNTRL CDEP
Sbjct: 405 SNLKSYKSIQLRTLNPYRASLVFSEYLFSGEVPSIKEVNNEEPLFPAVPLLNTRLGCDEP 464

Query: 732 KLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYILSEHRGKYCVI 791
           KLGLLSAEAKESAANI++RLQLGSKLSDVATCE DVLELLSLFNKENYILSEHRGKYCV+
Sbjct: 465 KLGLLSAEAKESAANIDQRLQLGSKLSDVATCEADVLELLSLFNKENYILSEHRGKYCVM 524

Query: 792 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFNHIKY 851
           LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREF H+KY
Sbjct: 525 LKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLEYVEREFKHVKY 584

Query: 852 DGELA 857
           DGELA
Sbjct: 585 DGELA 589

BLAST of HG10011341 vs. ExPASy TrEMBL
Match: A0A6J1F2S0 (protein root UVB sensitive 1, chloroplastic isoform X2 OS=Cucurbita moschata OX=3662 GN=LOC111441619 PE=3 SV=1)

HSP 1 Score: 951.8 bits (2459), Expect = 3.5e-273
Identity = 481/560 (85.89%), Postives = 509/560 (90.89%), Query Frame = 0

Query: 302 PGG--QMATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHS---PLLA 361
           PGG     +   S AARRPPL+VFP  LK  KL QG FSPCIGTR+KP LVHS   P L 
Sbjct: 28  PGGCFHHYSTRSSCAARRPPLNVFPDLLKPIKLAQGCFSPCIGTRIKPTLVHSHLLPPLL 87

Query: 362 GDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAA 421
            DGHG GGNNNGGWN+S  FGGFGWW D  +SSP   NAF A   TS+LGCFC FQLAAA
Sbjct: 88  DDGHGCGGNNNGGWNSSYRFGGFGWWHDGSNSSPGWRNAFLALVLTSVLGCFCHFQLAAA 147

Query: 422 LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRL 481
           LARN MN ESVWEV+GGKRIRLILDTFRDEF+VATG+PSS LSFSFVN WLRCS++F+RL
Sbjct: 148 LARNGMNSESVWEVRGGKRIRLILDTFRDEFYVATGVPSSPLSFSFVNFWLRCSEIFKRL 207

Query: 482 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 541
           MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL
Sbjct: 208 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 267

Query: 542 KDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGA 601
           KDGFGYLSKIL SKYGRHFDV+PKGWRLFADLLENAA+GMEMLTPAFPLHF VIGAAAGA
Sbjct: 268 KDGFGYLSKILLSKYGRHFDVNPKGWRLFADLLENAAFGMEMLTPAFPLHFVVIGAAAGA 327

Query: 602 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 661
           GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGM+LGI LANRIRSSTS
Sbjct: 328 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMLLGIALANRIRSSTS 387

Query: 662 LALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 721
           LALGCFS+VT+IHMFCNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF
Sbjct: 388 LALGCFSVVTIIHMFCNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 447

Query: 722 PAVPFLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNK 781
           PAVPFLNTRLACDEPK+GLLS EAKESAANIEKRLQLGSKLSDVA CEEDVL+LLSL+  
Sbjct: 448 PAVPFLNTRLACDEPKVGLLSTEAKESAANIEKRLQLGSKLSDVARCEEDVLQLLSLYKN 507

Query: 782 ENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQ 841
           ENYILSEHRG+YCV+LKESA P DMLKA+FHVNYLHWLERNAGI ARSA+NDC+PGGRLQ
Sbjct: 508 ENYILSEHRGRYCVMLKESALPKDMLKALFHVNYLHWLERNAGIEARSAANDCKPGGRLQ 567

Query: 842 MSLEYVEREFNHIKYDGELA 857
           +SLEYVEREF H+KYDGELA
Sbjct: 568 ISLEYVEREFIHVKYDGELA 587

BLAST of HG10011341 vs. ExPASy TrEMBL
Match: A0A6J1F1U0 (protein root UVB sensitive 1, chloroplastic isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111441619 PE=3 SV=1)

HSP 1 Score: 947.2 bits (2447), Expect = 8.5e-272
Identity = 481/561 (85.74%), Postives = 509/561 (90.73%), Query Frame = 0

Query: 302 PGG--QMATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHS---PLLA 361
           PGG     +   S AARRPPL+VFP  LK  KL QG FSPCIGTR+KP LVHS   P L 
Sbjct: 28  PGGCFHHYSTRSSCAARRPPLNVFPDLLKPIKLAQGCFSPCIGTRIKPTLVHSHLLPPLL 87

Query: 362 GDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAA 421
            DGHG GGNNNGGWN+S  FGGFGWW D  +SSP   NAF A   TS+LGCFC FQLAAA
Sbjct: 88  DDGHGCGGNNNGGWNSSYRFGGFGWWHDGSNSSPGWRNAFLALVLTSVLGCFCHFQLAAA 147

Query: 422 LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRL 481
           LARN MN ESVWEV+GGKRIRLILDTFRDEF+VATG+PSS LSFSFVN WLRCS++F+RL
Sbjct: 148 LARNGMNSESVWEVRGGKRIRLILDTFRDEFYVATGVPSSPLSFSFVNFWLRCSEIFKRL 207

Query: 482 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 541
           MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL
Sbjct: 208 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 267

Query: 542 KDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGA 601
           KDGFGYLSKIL SKYGRHFDV+PKGWRLFADLLENAA+GMEMLTPAFPLHF VIGAAAGA
Sbjct: 268 KDGFGYLSKILLSKYGRHFDVNPKGWRLFADLLENAAFGMEMLTPAFPLHFVVIGAAAGA 327

Query: 602 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 661
           GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGM+LGI LANRIRSSTS
Sbjct: 328 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMLLGIALANRIRSSTS 387

Query: 662 LALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 721
           LALGCFS+VT+IHMFCNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF
Sbjct: 388 LALGCFSVVTIIHMFCNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 447

Query: 722 PAVPFLNTRLACD-EPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFN 781
           PAVPFLNTRLACD EPK+GLLS EAKESAANIEKRLQLGSKLSDVA CEEDVL+LLSL+ 
Sbjct: 448 PAVPFLNTRLACDKEPKVGLLSTEAKESAANIEKRLQLGSKLSDVARCEEDVLQLLSLYK 507

Query: 782 KENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRL 841
            ENYILSEHRG+YCV+LKESA P DMLKA+FHVNYLHWLERNAGI ARSA+NDC+PGGRL
Sbjct: 508 NENYILSEHRGRYCVMLKESALPKDMLKALFHVNYLHWLERNAGIEARSAANDCKPGGRL 567

Query: 842 QMSLEYVEREFNHIKYDGELA 857
           Q+SLEYVEREF H+KYDGELA
Sbjct: 568 QISLEYVEREFIHVKYDGELA 588

BLAST of HG10011341 vs. ExPASy TrEMBL
Match: A0A6J1J7M2 (protein root UVB sensitive 1, chloroplastic isoform X2 OS=Cucurbita maxima OX=3661 GN=LOC111482094 PE=3 SV=1)

HSP 1 Score: 945.7 bits (2443), Expect = 2.5e-271
Identity = 476/560 (85.00%), Postives = 510/560 (91.07%), Query Frame = 0

Query: 302 PGG--QMATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHS---PLLA 361
           PGG     +   S AARR PL+VFPH LK  KL QGYFSPC+GTR+KP LVHS   P L 
Sbjct: 28  PGGCFHHYSTRSSCAARRRPLNVFPHLLKPIKLAQGYFSPCVGTRIKPTLVHSHLLPPLL 87

Query: 362 GDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAA 421
            DGHG GGNNNGGWN+S  FGGFGWWQD  +SSP   NAF A   TS+LGCFC FQLAAA
Sbjct: 88  DDGHGCGGNNNGGWNSSYRFGGFGWWQDGSNSSPGWRNAFLALVLTSVLGCFCHFQLAAA 147

Query: 422 LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRL 481
           LARN +N ESVWEV+GGKRIRLILDTFRDEF+VATG+PSS LSFSFVN WLRCS++F+RL
Sbjct: 148 LARNGINSESVWEVRGGKRIRLILDTFRDEFYVATGVPSSPLSFSFVNFWLRCSEIFKRL 207

Query: 482 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 541
           MLPEGFPD+VTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL
Sbjct: 208 MLPEGFPDTVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 267

Query: 542 KDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGA 601
           KDGFGYLSKIL SKYGRHFDV+PKGWRLFADLLENAA+GMEMLTPAFPLHF VIGAAAGA
Sbjct: 268 KDGFGYLSKILLSKYGRHFDVNPKGWRLFADLLENAAFGMEMLTPAFPLHFVVIGAAAGA 327

Query: 602 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 661
           GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGM+LGI LANRIRSSTS
Sbjct: 328 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMLLGIALANRIRSSTS 387

Query: 662 LALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 721
           LALGCFS+VTLIHMFCNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIK+VN+EEPLF
Sbjct: 388 LALGCFSVVTLIHMFCNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKNVNDEEPLF 447

Query: 722 PAVPFLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNK 781
           PAVPFLN RLACDEPK+GLLS EAKESAANIE+RLQLGSKLSDVA CEEDVL+LLSL+  
Sbjct: 448 PAVPFLNARLACDEPKVGLLSTEAKESAANIERRLQLGSKLSDVARCEEDVLQLLSLYKN 507

Query: 782 ENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQ 841
           ENYILSEHRG+YCV+LKESA P DMLKA+FHVNYLHWLERNAGI ARSA++DC+PGGRLQ
Sbjct: 508 ENYILSEHRGRYCVMLKESALPKDMLKALFHVNYLHWLERNAGIEARSAASDCQPGGRLQ 567

Query: 842 MSLEYVEREFNHIKYDGELA 857
           +SLEYVEREF H+KYDGELA
Sbjct: 568 ISLEYVEREFIHVKYDGELA 587

BLAST of HG10011341 vs. ExPASy TrEMBL
Match: A0A6J1J7Y8 (protein root UVB sensitive 1, chloroplastic isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111482094 PE=3 SV=1)

HSP 1 Score: 941.0 bits (2431), Expect = 6.1e-270
Identity = 476/561 (84.85%), Postives = 510/561 (90.91%), Query Frame = 0

Query: 302 PGG--QMATKEPSSAARRPPLSVFPHFLKSTKLVQGYFSPCIGTRMKPALVHS---PLLA 361
           PGG     +   S AARR PL+VFPH LK  KL QGYFSPC+GTR+KP LVHS   P L 
Sbjct: 28  PGGCFHHYSTRSSCAARRRPLNVFPHLLKPIKLAQGYFSPCVGTRIKPTLVHSHLLPPLL 87

Query: 362 GDGHGHGGNNNGGWNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAA 421
            DGHG GGNNNGGWN+S  FGGFGWWQD  +SSP   NAF A   TS+LGCFC FQLAAA
Sbjct: 88  DDGHGCGGNNNGGWNSSYRFGGFGWWQDGSNSSPGWRNAFLALVLTSVLGCFCHFQLAAA 147

Query: 422 LARNEMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRL 481
           LARN +N ESVWEV+GGKRIRLILDTFRDEF+VATG+PSS LSFSFVN WLRCS++F+RL
Sbjct: 148 LARNGINSESVWEVRGGKRIRLILDTFRDEFYVATGVPSSPLSFSFVNFWLRCSEIFKRL 207

Query: 482 MLPEGFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 541
           MLPEGFPD+VTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL
Sbjct: 208 MLPEGFPDTVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVL 267

Query: 542 KDGFGYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGA 601
           KDGFGYLSKIL SKYGRHFDV+PKGWRLFADLLENAA+GMEMLTPAFPLHF VIGAAAGA
Sbjct: 268 KDGFGYLSKILLSKYGRHFDVNPKGWRLFADLLENAAFGMEMLTPAFPLHFVVIGAAAGA 327

Query: 602 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTS 661
           GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGM+LGI LANRIRSSTS
Sbjct: 328 GRSAAALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMLLGIALANRIRSSTS 387

Query: 662 LALGCFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLF 721
           LALGCFS+VTLIHMFCNLKSYKSI+LRTLNPYRASLVFSEYLLSGEVPSIK+VN+EEPLF
Sbjct: 388 LALGCFSVVTLIHMFCNLKSYKSIQLRTLNPYRASLVFSEYLLSGEVPSIKNVNDEEPLF 447

Query: 722 PAVPFLNTRLACD-EPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFN 781
           PAVPFLN RLACD EPK+GLLS EAKESAANIE+RLQLGSKLSDVA CEEDVL+LLSL+ 
Sbjct: 448 PAVPFLNARLACDKEPKVGLLSTEAKESAANIERRLQLGSKLSDVARCEEDVLQLLSLYK 507

Query: 782 KENYILSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRL 841
            ENYILSEHRG+YCV+LKESA P DMLKA+FHVNYLHWLERNAGI ARSA++DC+PGGRL
Sbjct: 508 NENYILSEHRGRYCVMLKESALPKDMLKALFHVNYLHWLERNAGIEARSAASDCQPGGRL 567

Query: 842 QMSLEYVEREFNHIKYDGELA 857
           Q+SLEYVEREF H+KYDGELA
Sbjct: 568 QISLEYVEREFIHVKYDGELA 588

BLAST of HG10011341 vs. TAIR 10
Match: AT3G45890.1 (Protein of unknown function, DUF647 )

HSP 1 Score: 595.5 bits (1534), Expect = 1.2e-169
Identity = 328/554 (59.21%), Postives = 404/554 (72.92%), Query Frame = 0

Query: 311 PSSAARRPPLSVFPHFLKSTKLVQGYFS-PCIGTRMKPALVHSPLLAGDGHGHGGNNNGG 370
           P  + R+P  S F   ++    V  +FS   + TR   A V S  L G  +G+  N NGG
Sbjct: 31  PRQSLRQPSGSSFSRCVRLVANVNDHFSKQSLATRNCLASVFSADLGG-SNGNNDNGNGG 90

Query: 371 WNNSNPFGGFGWWQDDGDSSPWSDNAFFAFFFTSILGCFCLFQLAAALA---------RN 430
                  GG G   +  DSS   D  +  F     L CF  F+L+AA A           
Sbjct: 91  GG-----GGDGGGDNSDDSS--FDLRYLCFLLLG-LSCFFHFRLSAASAIAKDQNSDSNG 150

Query: 431 EMNYESVWEVKGGKRIRLILDTFRDEFHVATGMPSSSLSFSFVNVWLRCSDVFRRLMLPE 490
           +   E+VWEV+G KR RL+ D  +DEF         S S +  N+  +C ++  + +LPE
Sbjct: 151 DAVKETVWEVRGSKRKRLVPDFVKDEFVSEESAFELSSSLTPENLLAQCRNLLTQFLLPE 210

Query: 491 GFPDSVTSDYLEYSLWRGVQGIASQVSGVLATQALLYAVGLGKGAIPTAAAVNWVLKDGF 550
           GFP+SVTSDYL+YSLWRGVQGIASQ+SGVLATQ+LLYAVGLGKGAIPTAAA+NWVLKDG 
Sbjct: 211 GFPNSVTSDYLDYSLWRGVQGIASQISGVLATQSLLYAVGLGKGAIPTAAAINWVLKDGI 270

Query: 551 GYLSKILFSKYGRHFDVHPKGWRLFADLLENAAYGMEMLTPAFPLHFFVIGAAAGAGRSA 610
           GYLSKI+ SKYGRHFDVHPKGWRLFADLLENAA+GMEMLTP FP  F +IGAAAGAGRSA
Sbjct: 271 GYLSKIMLSKYGRHFDVHPKGWRLFADLLENAAFGMEMLTPVFPQFFVMIGAAAGAGRSA 330

Query: 611 AALIQAATRSCFYAGFAAQRNFAEVIAKGEAQGMVSKSIGMMLGITLANRIRSSTSLALG 670
           AALIQAATRSCF AGFA+QRNFAEVIAKGEAQGMVSKS+G++LGI +AN I +STSLAL 
Sbjct: 331 AALIQAATRSCFNAGFASQRNFAEVIAKGEAQGMVSKSVGILLGIVVANCIGTSTSLALA 390

Query: 671 CFSIVTLIHMFCNLKSYKSIELRTLNPYRASLVFSEYLLSGEVPSIKDVNNEEPLFPAVP 730
            F +VT IHM+ NLKSY+ I+LRTLNPYRASLVFSEYL+SG+ P IK+VN+EEPLFP V 
Sbjct: 391 AFGVVTTIHMYTNLKSYQCIQLRTLNPYRASLVFSEYLISGQAPLIKEVNDEEPLFPTVR 450

Query: 731 FLNTRLACDEPKLGLLSAEAKESAANIEKRLQLGSKLSDVATCEEDVLELLSLFNKENYI 790
           F N + + ++ +  +LS+EAK +AA+IE+RLQLGSKLSDV   +E+ + L  L+  E YI
Sbjct: 451 FSNMK-SPEKLQDFVLSSEAKAAAADIEERLQLGSKLSDVIHNKEEAIALFDLYRNEGYI 510

Query: 791 LSEHRGKYCVILKESASPVDMLKAVFHVNYLHWLERNAGITARSASNDCRPGGRLQMSLE 850
           L+EH+G++CV+LKES++P DML+++F VNYL+WLE+NAGI   S  +DC+PGGRL +SL+
Sbjct: 511 LTEHKGRFCVMLKESSTPQDMLRSLFQVNYLYWLEKNAGIEPASTYSDCKPGGRLHISLD 570

Query: 851 YVEREFNHIKYDGE 855
           YV REF H K D E
Sbjct: 571 YVRREFEHAKEDSE 574

BLAST of HG10011341 vs. TAIR 10
Match: AT1G12930.1 (ARM repeat superfamily protein )

HSP 1 Score: 438.7 bits (1127), Expect = 1.9e-122
Identity = 252/488 (51.64%), Postives = 311/488 (63.73%), Query Frame = 0

Query: 1017 MELRMKVTQAVHVLNHDTQSCNRVAANQWLVQFQQTGAAWEVATAILTSDHVQHPLSSFV 1076
            MEL+ KV +A+HVLNHD +S NRVAANQWLVQFQ T AAW+V+T++LTS     P+ S  
Sbjct: 1    MELQRKVAEAIHVLNHDPESSNRVAANQWLVQFQLTPAAWDVSTSLLTS-----PIVSL- 60

Query: 1077 PDLEVEFFAAQILKRKRIKKVLEEEACILSIDGNFGPKEVAPSLPVDNSSPQELLEDVMQ 1136
               +++FFAAQIL+RK                                            
Sbjct: 61   --FDLQFFAAQILRRK-------------------------------------------- 120

Query: 1137 SSSSAYTSPMSSSLIPDNLLLWLRLGAFSFRQFLLVLKELQFKGVCLIQNEGYHLQLGVK 1196
                                                           IQNE  +LQ   K
Sbjct: 121  -----------------------------------------------IQNEASNLQSTAK 180

Query: 1197 DALLNALLVAAKKFSSGPPQLLTQICLALSALILRTVEHGKPIDRLFYSLQNLQSVDNGN 1256
            DALLNALL+AAK++SSG PQLLTQICLALSAL+L +  + KP D+L ++LQNLQ+ D+GN
Sbjct: 181  DALLNALLLAAKRYSSGVPQLLTQICLALSALLLHSDPYSKPFDKLMFALQNLQAHDDGN 240

Query: 1257 LAVLEMLTVLPEEVVDSQNVDCKISSSCRSQYARELLLHTPMVLEFLLQQSEKGFDCGTQ 1316
            + +LE+LTVLPEE+ D+++       S  S   +ELL HT MVL+FLLQQSE  F     
Sbjct: 241  VVLLELLTVLPEEISDTRHF------SHHSDLRQELLSHTSMVLDFLLQQSENQFVSPLY 300

Query: 1317 PQERNRKILRCLLSWVRVGCFSEIPQGSLPTHPLLNFVLKSLQDAASFDLAIEVLVELVS 1376
            P + NRKILRCLLSWVR GCFSEIPQG++P+HPLLN+V  +LQ   +FDLAIEVLVELV+
Sbjct: 301  PHDNNRKILRCLLSWVRAGCFSEIPQGAVPSHPLLNYVFNALQ-GTTFDLAIEVLVELVT 360

Query: 1377 RHEGLPQVLLCRVHFLKEMLLLPSLSSGDEKVISGLACLFSEVGQAAPSLIVDASAEALA 1436
            RHE LPQVLL +V FL++ LL P+L + D K+ISGLACL SE+GQAAP LIV+AS+EAL 
Sbjct: 361  RHEDLPQVLLYKVQFLRDTLLKPALINADLKIISGLACLMSEIGQAAPCLIVEASSEALI 382

Query: 1437 LADALLSCVAFPSEDWEIADSTLQFWSSLASYILGLDENNSANRKHVEDVFLSVFSALLD 1496
            L DA+LSCV FPSEDWEIADST+QFWS+ A+YIL L  N   +R  V+D FL VFSAL+D
Sbjct: 421  LTDAILSCVTFPSEDWEIADSTVQFWSTFATYILSLGGNRQNDRTRVKDTFLPVFSALVD 382

Query: 1497 GLLLRAQV 1505
             L+LRAQV
Sbjct: 481  ALVLRAQV 382

BLAST of HG10011341 vs. TAIR 10
Match: AT3G13062.2 (Polyketide cyclase/dehydrase and lipid transport superfamily protein )

HSP 1 Score: 371.3 bits (952), Expect = 3.7e-102
Identity = 184/309 (59.55%), Postives = 235/309 (76.05%), Query Frame = 0

Query: 4   ISDTDLKYLLDNLDGRINENEKWERVVEKTNDHLSYSAKCCKPKDG-PLKYSSVTVFENC 63
           +SD DLK L+  L  R  + E WE V++K+N  +SY+AKCCKP DG P+KY S TVFE+C
Sbjct: 84  VSDEDLKGLIQKLGERSEDAEIWEDVIKKSNPRISYTAKCCKPTDGSPMKYLSTTVFEDC 143

Query: 64  CPKLLRDFYMDNDYRKQWDSTMLMHEQLQMDGTSGIEVGRTLKKFPLLTPREYILSWRLW 123
            P++LRDFYMDN+YRKQWD T++ HEQLQ+D  SGIE+GRT+KKFPLLTPREY+L+W+LW
Sbjct: 144 SPEVLRDFYMDNEYRKQWDKTVVEHEQLQVDSNSGIEIGRTIKKFPLLTPREYVLAWKLW 203

Query: 124 EGKDKSFYCFTKECEHPLAPQQKKYVRVKFFRS------VSGRNACEISMLHQEDAGLNV 183
           EGKDK FYCF KEC+H + PQQ+KYVRV +FRS      V GRNACEI M+HQEDAGLNV
Sbjct: 204 EGKDK-FYCFIKECDHNMVPQQRKYVRVSYFRSGWRIRKVPGRNACEIHMVHQEDAGLNV 263

Query: 184 EMAKLAFAKGIWNFVCKMDKALRKY-ALIHCPQSSSLVTAITLIKKVPDGFEDMDGIISK 243
           EMAKLAF++GIW++VCKM+ ALRKY A  H PQ  +L +A++L+KK+P   E     I+ 
Sbjct: 264 EMAKLAFSRGIWSYVCKMENALRKYIATSHRPQGPTL-SAVSLMKKIPSELESQTDDITN 323

Query: 244 ANIVETES--CGEVSSEERKLSRASKKLVANGLLL----IGGVICLSRGHSSLGAKVVMA 299
           ++   T     GE +  ++ L + SKKL+ANG+LL    +GG ICLSRGHS+LGAKV +A
Sbjct: 324 SSGTTTSGMHTGEGAKRKKLLRKPSKKLIANGMLLVGGAVGGAICLSRGHSALGAKVALA 383

BLAST of HG10011341 vs. TAIR 10
Match: AT3G13062.1 (Polyketide cyclase/dehydrase and lipid transport superfamily protein )

HSP 1 Score: 371.3 bits (952), Expect = 3.7e-102
Identity = 184/309 (59.55%), Postives = 235/309 (76.05%), Query Frame = 0

Query: 4   ISDTDLKYLLDNLDGRINENEKWERVVEKTNDHLSYSAKCCKPKDG-PLKYSSVTVFENC 63
           +SD DLK L+  L  R  + E WE V++K+N  +SY+AKCCKP DG P+KY S TVFE+C
Sbjct: 84  VSDEDLKGLIQKLGERSEDAEIWEDVIKKSNPRISYTAKCCKPTDGSPMKYLSTTVFEDC 143

Query: 64  CPKLLRDFYMDNDYRKQWDSTMLMHEQLQMDGTSGIEVGRTLKKFPLLTPREYILSWRLW 123
            P++LRDFYMDN+YRKQWD T++ HEQLQ+D  SGIE+GRT+KKFPLLTPREY+L+W+LW
Sbjct: 144 SPEVLRDFYMDNEYRKQWDKTVVEHEQLQVDSNSGIEIGRTIKKFPLLTPREYVLAWKLW 203

Query: 124 EGKDKSFYCFTKECEHPLAPQQKKYVRVKFFRS------VSGRNACEISMLHQEDAGLNV 183
           EGKDK FYCF KEC+H + PQQ+KYVRV +FRS      V GRNACEI M+HQEDAGLNV
Sbjct: 204 EGKDK-FYCFIKECDHNMVPQQRKYVRVSYFRSGWRIRKVPGRNACEIHMVHQEDAGLNV 263

Query: 184 EMAKLAFAKGIWNFVCKMDKALRKY-ALIHCPQSSSLVTAITLIKKVPDGFEDMDGIISK 243
           EMAKLAF++GIW++VCKM+ ALRKY A  H PQ  +L +A++L+KK+P   E     I+ 
Sbjct: 264 EMAKLAFSRGIWSYVCKMENALRKYIATSHRPQGPTL-SAVSLMKKIPSELESQTDDITN 323

Query: 244 ANIVETES--CGEVSSEERKLSRASKKLVANGLLL----IGGVICLSRGHSSLGAKVVMA 299
           ++   T     GE +  ++ L + SKKL+ANG+LL    +GG ICLSRGHS+LGAKV +A
Sbjct: 324 SSGTTTSGMHTGEGAKRKKLLRKPSKKLIANGMLLVGGAVGGAICLSRGHSALGAKVALA 383

BLAST of HG10011341 vs. TAIR 10
Match: AT3G13062.3 (Polyketide cyclase/dehydrase and lipid transport superfamily protein )

HSP 1 Score: 364.0 bits (933), Expect = 5.9e-100
Identity = 184/317 (58.04%), Postives = 235/317 (74.13%), Query Frame = 0

Query: 4   ISDTDLKYLLDNLDGRINENEKWERVVEKTNDHLSYSAKCCKPK--------DG-PLKYS 63
           +SD DLK L+  L  R  + E WE V++K+N  +SY+AKCCKP         DG P+KY 
Sbjct: 84  VSDEDLKGLIQKLGERSEDAEIWEDVIKKSNPRISYTAKCCKPTVISKFYLCDGSPMKYL 143

Query: 64  SVTVFENCCPKLLRDFYMDNDYRKQWDSTMLMHEQLQMDGTSGIEVGRTLKKFPLLTPRE 123
           S TVFE+C P++LRDFYMDN+YRKQWD T++ HEQLQ+D  SGIE+GRT+KKFPLLTPRE
Sbjct: 144 STTVFEDCSPEVLRDFYMDNEYRKQWDKTVVEHEQLQVDSNSGIEIGRTIKKFPLLTPRE 203

Query: 124 YILSWRLWEGKDKSFYCFTKECEHPLAPQQKKYVRVKFFRS------VSGRNACEISMLH 183
           Y+L+W+LWEGKDK FYCF KEC+H + PQQ+KYVRV +FRS      V GRNACEI M+H
Sbjct: 204 YVLAWKLWEGKDK-FYCFIKECDHNMVPQQRKYVRVSYFRSGWRIRKVPGRNACEIHMVH 263

Query: 184 QEDAGLNVEMAKLAFAKGIWNFVCKMDKALRKY-ALIHCPQSSSLVTAITLIKKVPDGFE 243
           QEDAGLNVEMAKLAF++GIW++VCKM+ ALRKY A  H PQ  +L +A++L+KK+P   E
Sbjct: 264 QEDAGLNVEMAKLAFSRGIWSYVCKMENALRKYIATSHRPQGPTL-SAVSLMKKIPSELE 323

Query: 244 DMDGIISKANIVETES--CGEVSSEERKLSRASKKLVANGLLL----IGGVICLSRGHSS 299
                I+ ++   T     GE +  ++ L + SKKL+ANG+LL    +GG ICLSRGHS+
Sbjct: 324 SQTDDITNSSGTTTSGMHTGEGAKRKKLLRKPSKKLIANGMLLVGGAVGGAICLSRGHSA 383

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
XP_038881395.15.6e-30293.04protein root UVB sensitive 1, chloroplastic [Benincasa hispida][more]
XP_011651345.15.1e-29593.76protein root UVB sensitive 1, chloroplastic isoform X1 [Cucumis sativus] >KAE865... [more]
XP_008449956.18.4e-29091.93PREDICTED: protein root UVB sensitive 1, chloroplastic isoform X1 [Cucumis melo][more]
XP_031738101.11.2e-28090.28protein root UVB sensitive 1, chloroplastic isoform X2 [Cucumis sativus][more]
KAG6581156.11.1e-27673.54Protein root UVB sensitive 1, chloroplastic, partial [Cucurbita argyrosperma sub... [more]
Match NameE-valueIdentityDescription
Q7X6P31.7e-16859.21Protein root UVB sensitive 1, chloroplastic OS=Arabidopsis thaliana OX=3702 GN=R... [more]
Q84JB81.9e-4233.96Protein root UVB sensitive 3 OS=Arabidopsis thaliana OX=3702 GN=RUS3 PE=2 SV=1[more]
Q499P81.1e-3936.73RUS family member 1 OS=Rattus norvegicus OX=10116 GN=Rusf1 PE=2 SV=1[more]
Q91W341.3e-3836.33RUS family member 1 OS=Mus musculus OX=10090 GN=Rusf1 PE=1 SV=1[more]
Q5R8F61.3e-3833.67RUS family member 1 OS=Pongo abelii OX=9601 GN=Rusf1 PE=2 SV=1[more]
Match NameE-valueIdentityDescription
A0A1S3BP564.1e-29091.93protein root UVB sensitive 1, chloroplastic isoform X1 OS=Cucumis melo OX=3656 G... [more]
A0A6J1F2S03.5e-27385.89protein root UVB sensitive 1, chloroplastic isoform X2 OS=Cucurbita moschata OX=... [more]
A0A6J1F1U08.5e-27285.74protein root UVB sensitive 1, chloroplastic isoform X1 OS=Cucurbita moschata OX=... [more]
A0A6J1J7M22.5e-27185.00protein root UVB sensitive 1, chloroplastic isoform X2 OS=Cucurbita maxima OX=36... [more]
A0A6J1J7Y86.1e-27084.85protein root UVB sensitive 1, chloroplastic isoform X1 OS=Cucurbita maxima OX=36... [more]
Match NameE-valueIdentityDescription
AT3G45890.11.2e-16959.21Protein of unknown function, DUF647 [more]
AT1G12930.11.9e-12251.64ARM repeat superfamily protein [more]
AT3G13062.23.7e-10259.55Polyketide cyclase/dehydrase and lipid transport superfamily protein [more]
AT3G13062.13.7e-10259.55Polyketide cyclase/dehydrase and lipid transport superfamily protein [more]
AT3G13062.35.9e-10058.04Polyketide cyclase/dehydrase and lipid transport superfamily protein [more]
InterPro
Analysis Name: InterPro Annotations of Bottle gourd (Hangzhou Gourd) v1
Date Performed: 2022-08-01
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR006968Root UVB sensitive familyPFAMPF04884DUF647coord: 468..699
e-value: 1.7E-72
score: 243.9
IPR002913START domainPFAMPF01852STARTcoord: 22..153
e-value: 4.5E-5
score: 22.9
IPR002913START domainPROSITEPS50848STARTcoord: 22..155
score: 16.051805
IPR023393START-like domain superfamilyGENE3D3.30.530.20coord: 1..202
e-value: 1.9E-32
score: 114.4
IPR013598Exportin-1/Importin-beta-likePFAMPF08389Xpo1coord: 1214..1371
e-value: 1.5E-17
score: 64.0
IPR011989Armadillo-like helicalGENE3D1.25.10.10coord: 1018..1100
e-value: 1.2E-16
score: 62.1
coord: 1183..1508
e-value: 1.0E-67
score: 231.0
NoneNo IPR availablePANTHERPTHR12363:SF44ARM REPEAT SUPERFAMILY PROTEINcoord: 1017..1092
NoneNo IPR availablePANTHERPTHR12363:SF44ARM REPEAT SUPERFAMILY PROTEINcoord: 1184..1507
NoneNo IPR availablePANTHERPTHR12363TRANSPORTIN 3 AND IMPORTIN 13coord: 1184..1507
coord: 1017..1092
NoneNo IPR availableCDDcd08870START_STARD2_7-likecoord: 5..201
e-value: 1.05703E-73
score: 242.285
NoneNo IPR availableSUPERFAMILY55961Bet v1-likecoord: 13..201
IPR016024Armadillo-type foldSUPERFAMILY48371ARM repeatcoord: 1017..1496

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
HG10011341.1HG10011341.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0007155 cell adhesion
cellular_component GO:0016021 integral component of membrane
molecular_function GO:0005540 hyaluronic acid binding
molecular_function GO:0008289 lipid binding