Sgr018104 (gene) Monk fruit (Qingpiguo) v1

Overview
NameSgr018104
Typegene
OrganismSiraitia grosvenorii (Monk fruit (Qingpiguo) v1)
DescriptionHNHc domain-containing protein
Locationtig00153092: 1574149 .. 1598189 (-)
RNA-Seq ExpressionSgr018104
SyntenySgr018104
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideexonCDS
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGATAGATGCAGCAGAATCTAAAGCTTTACCATCGCCTAAGGAAACAGTGACAAGGAAGGATAAAAAAAGGGACAGGGAGACGAGTTCCTCGAAAAAAAAAACCACAAAAGGAAAGAAGCAAAAGGGTAAAAAGAAGGTAATACCCTATTTTATTTGAACAGAAAAAATTGCAAATTATAAGTACTGACCTCTTAAACTGGAATGTATGTAATTAAGTCATCAAAAGGAGGTGACGCGAAGAAAGGGGATAGGAGCAAGGAAGAACACAAATCTCCAACAAAATCTAATGATGGCAAGGTATTTATAATATGATTTTGTAACATTGTAAACTATTGTACTCAATTCTTGTGCTGTTTAATAGATGAAGAAAGATCAAACAAACAAATTACCGATGATGGAGGACAAAATTCATAAAAGAATTCAAGAACTGATACAGATTATTCAGGTCAACACCACTCTTCAAGTAAGGACAACTCAAGTTTGAAGTCTGAACAGCATGCCAAAAAAAAAAGGGAAACTAAAGAACATGAAGAAGGTAAGACATTATTTGCAAGCTAACAAACAAACTTCTTTTAAAAAGATGAACTCTTGCACTTGCAGGTGGTTGTTAAAAAATATGTTGTAAAAGGAAAGAATAAAAACACTAAAAAGGCTAGGGGTAAAGCTAGCGAAAAAGGGAAACAAGCAGATAATGATGGTGAAGAGATATGTTATAATTAAGGTTGTATATAGAAACTTGGATACTATAATTACATATGAATGACAATTACTTAGTCTTGTCTTTGTCAAGTAATATGCTAGGAAGAATTTTATTTGATGGCTAAGTCGAAGAGAACACAACCTTGAAAGATAAATTTGCAAATGAAATTAGATATTATAGAGAAAATTAAGATTAACTTAGGGAAACGACTGATGAGAAGGTTTCGACCAACCTATTTTGGACAGTTTTGGGATTTTGCAATTACAAAGCAATCCTCACAGTTGCTTCTACACTTAATTCAAAGGCAGTGCAAGTCGAAGAGATCCTCTGAGATTAATTTTTTCATAGAAGGCAAGGTTTTAAAATTTGGACTTAGAGAGTTTGCTTTAATTACTAGATTGAATTGTGGTCTGCTGCCTCAAGTTGACAGAGATAACATAAAGAGGGGAGCATTTACGGAATGTTTACTTTGAAAGAGAGAAGGTTATTAGTAGGAAGTACTTGAACATGGGGTTCAATGTAAACAAGAGTACACCAGATGATGACATGGTGAAGATGTCTCTATTGTATTGTTTGGAGAGCTTTCTACCACCTCGACAAGACTCCATTTATGTAGAGATGGATTACATAGTTATGGTTAATGATGAAGAACTGTTTAACAGCTACCCATGGGGGAGAGTTGCTTTCAAGTTTGTAATTGATTACATGAAAAAGGCCACGGTGAGTATGGGGACTACAGGCATATTGATGGGTGGCTTCATATTTGCCCTTTTCGCTTGAGCAAATGAAGTCATACCAACGCTTAGTACAACGTTGAACTTCTATGCTTGAAGAGTAGGTCAGCAAGTTCCCCAGATAGTTAATTAGGCGCCTGATACACAACCCGAGTGGAAAGAGCTAGTAGCACGTGTCTTCGAATCGTCCAAGGTAACCATGCATTTTACATCAAAGAATGGAAAATAGAGTATATACTGAACTTATGTATTTTCTATTTACATGTGTTTTATTGTGTCATTGACAGCTAGAAGTTTGTCTGATGATTGCCACACCCGAAGAGCTCAAAATACCCTATTTTGCTCCATACCTTGAGGAGGAAGCAACTTTGAGAAGGGATGCTACTAAAGATCAAAGAATTGAAGGTAGAGTCGAAGGCATTATAAATCTGACCATAAATAAGAGAGCATCGTCTTTTTCTGATTTTTTATATATTAGAGAACGACTTGACATCATAGAGACAAGGGCAGGGTGATACCCGGGGTAGTCAGAAAATAAAGGAGGAAACCAAGTAAAAACATTTGTCTATAATTGAGAATTGTAGATTATCAGTAAGAAAAATTGTATTGTAGGGATATGATGCTTCAAATGATTTAGATGAAGTGTAAATGAGGTAATAAGGTCAATAGACGAATATGAAGTCTATGAACTTAAAAGGAATATAAAGAGAAAGATTGTTGTCAAAGTATTTTCTTTTAGTATTTATAGTTTTTGTTAATGAATATTATGTTTAACATTAACAAAAATTATGTTTTTGTTTTCTGAATAAATAAAGAATTCAATACATGCACAAATTTCAGGGGGAAGGTTTCTGATGTTCAATAGCCACCTGTGAAGAATAATTAGGCACATAAGAAAGGGAATGAGGTACACAGATTACTATTTTGATTCTACTAATATATCTAAGGTTATTCTTCCTTAACATTCTTTTACATTGTGAAATGGTTGGAATAAAAAAAGATAAGGAGGCAACAAGGTCCAACGCTAGTTAAGTGGGGGGATGGTTCTTGCAGAGTTATTTAACCTGTTATACTTTGTTAATTTTTATATTAAAATTCGTGAACATACATAGGCTAATCTTATATTTTGTTTTTACTAGATAAATGCAAATATAAAACCATTTGAAATGAAAGCGAAAAGGATGCCTAAAGTAGCTATAAATTTGGGTCATGGTAAAACTGACAAGCTAGGACACTAAAGGCCATGAGTGTGTATATAGATGCATTGCAAGGGCGTGTGAGGCCACCACACCCGCTAAACCTTTAGTAGTGTATTGCGAGCCTTCCTTTAATCTTTCTCTAACCCAGACGCAAGAATAGCATGCTATCTCCTTTATCTGACTTGCTATTTTGTACCTGTTTAATGAACGATAGATATTGGACTTATTTTGTTTGATTTTTTTTTTTGAACCAGTTATAACTTGTTATAAGAAGGTTTTTTAATATTTGATGCTTAATATATTTGTCTTACGTTATTGTTGTCTTTTGAATATTTTTATAGACATGACTTATATATGTTTCGAAAATGACTAGAAGGGATGTTGTACGTGGTTGTTTTCAATTTGATTCTGATGCCTTCTTAAAACAAAACAGACAATGCAAATGTAAAAGGGTTTAATGTTGAATTTAAAACTAAGTAAATTGTGATATCTCCTAGTGTACATGTTTATGGGTATAATCTATTAACAAAAGGTTATTGTTAGAAAAAATAGGTAGGTGTAACTAAATACACTGTAATTATGCAACATCACACATCTAAAGAAAAACGTGTTCTTATAATTCGAAAGAAAGAGTTTTCTCCAAGGAAGATCAATAGGGCACAAAATATAGTTAAATGTCTTCAATAGAGCACGTAATATAACCACAACAGTTAAAATTAAGGAATAACTTTCTTTTATACATGATTCAATTGGCATGTGAATTGGGAAGTGATATAACAAAAAGTACCTACGTAGGTGTGACTAAATACACTGTAATTATGAAACATCACACATCTAAAGAATAATGTGTTCTTATAGTTCGTAAGAAATAGTTATCTCCAAGGGAGATCAATAAAGCACAAAATAAATATAGTTAGGTGTCTTTAATAGGCACATAATATAATCACAGTCATTTAATTAAGGAGTAGCTTCTTTTTATTAATGATTTAATTGGCATGTGAATTGGGAAGTATGATATAAAACTTAAAAAGTAGCAACATCTACCATATTTACATGTCTAAACAACCTAAAGGAATAAATAACATCAGTTCAATAGTGCATTTTTGCAACATCTTCGATTATGTCCTAATTGTCCACATCAACCACATTTGAGTGTTACATTCCTTTCACTACAAGACAAAAGTCTCATTTTCCTAGGTTTGCCCACAGATCGTTTGACATTAGGAGATCCAATTGGAGTTTCATCTTCAATAGTTGAATGATTGATATACTCAATTCTGCCTATTAGATGTATATCAATACTGTATAACTGTTGGAGGGCTAAAAGACCATAAAACTCATGTACATATAAATGTAAATTTAGACCTCTACAACATAAAGCAAAGCAAGAATGAGGGCAATGGATCATGTCCAGGTCCCATTGTCCACATGTGCAATTTGGAGCAAGAATGTTAACCTCAAAATATTTATTACAATCATGAACTTCAAATTGGTACTGGTTTATAGGGTATATTTGAAAATGGAAAGAGTAAGGCAATCAGTAAAAGAATAATGATTAATGTATAAATATAAAAAAAACTCACATCCATTGTGCGATTGTCCTTCAGTGATGAACGAAGTTCATTGTCCGCCCAAGTGGTAAGGTTTATTTGTTGAAAGTTTGAGAAACTTTTGCGCTCATAAAACCATCTTCGCATCAAATCCCTTATGTGCTTAAGAAAGGGTTGATTGGTAGCTCACGGTCGTCTTTCAAGATGGAGTTCATACTCACAGAAATATTGGTTGTCATCAAAGAATATATTTTTCTGACAAAGAATGCTCGAGCCCTCCATGGGAGCCCTATTTCTTCTAACTCTACTCTAATTGAAAAAGGACTATATATTCCAGTTGCCTCATATAATAGAACTCAGTTATTGTATAGGCCTTTGCACACGTAAGAAATAAATGGTCAATAGGTTTCGATTTGTGTCTTTGTTTGAGATTTTTCAAAAGATGATAAATATAAAACTCATGTTCAGCAGAGTTCTATACCCTACTAACTCCTTTCGATATGTTGTTGTGTCTATCAGAAACTATAACTAACGCATTTGGCTCCCCTAATACATATTTTAAATTACGAAAAAATCATTTCCATGACACATCATTTTTTTAGTCAACTATGCAAAAAGCAAGAGGAAAGATTTGTGAATTGTCATCCAATGTACATGTTGTAAGTAGCATGCCATAAAATGTGTTTCTTAGAAAAGTACCATCAACAAAAATAACTGGCAAGCAATGTTTCCAGCCATTGATTGAAGCAAACAAGCACATGAAAAAAAAATTAAATCTAGATTCTTGATCCACTTCATATGTCGTGTAAGTACTTGTAAAACATTAATGTATAGTTAAATAAGAAAAAGACCAATGTAAACAAAAACAGTATTTTGCTTCGACTGTGTCATCAAATACAAATATGAGGTATGTGCTTGATAATCTGTATATTACACATGAAGATAGATGTTGTACCTAAGTGCTTTGCAATTAGACTAACCTCAAATGAAGGGATAAGAGCATATGATTCCTCGGGAGAACCCCTAATGAATTTCACTGCATGCTCACATGGCCTCTAGCTTTGTCATAGCTAATATTAAGACCGTATTTTCTCGGTATGTAATCAATAACATCACGTGGCCAACACTATATCTTACTATTCATTTTTAGAATTGACTTTATACACTCACTTATGATAAATGATGTAGCCTGCCTATGGTCATTCTGCACAACATCAATTGAACAGTCATGCTAATAAAAAAAACTTCCTAATTATTCACAGCTCACCTTCTCCATACCATAAGGATCAGAGGTACCAATTACAAACTTCTTTAATGCATCTTACTACTAATTATTTTTTATTTGATTTGATAGTCTTGCATTGCAAACTTCCTTTTATAGCAAGAGTGTATACAACCTTTTTTAGTTCTAACTTACTCTGGAAAATGCTATTTTCTTTCAATGTGAAATCAGGCAACAATGAATCAACGTCGATGAAATGCATAAACCTAAATTCCTTTTTATTATGTTCCTCTAGGTTCAATAAGCAATTAGTACTTCCTTCTATGTACCCTGTATTTATTACTTTTCCTCTGTTTATTTATCCACTATCCACTACAATACAGCAGCATTGCACATGCCATTTGCAAAAACCAACAAACGTCTCTATCATCATATATTCTAATTATGGTGGATTTGTTAGCACCATTTCTATACATGGTCAAGCATGTGACCTTCTACTTGACACCAAAATTAAGCTCCTAACCAATGGAATAATTTAGCTATGATATTGAAGACTCCATGGGATCAAAACCTCCCTAACTTTGAAGTTCATGTAGATATTTTTTTCATCCCATCTTCCATCATGCAGAATAGTGACGGGTTGAAGGGGCATCCCTGAATTAATGTAACCAAAATACGTAAAATGTGTTAGAATTTTTTAAATAAAAAGCATAAAAAAGGAGGAGGGAGTAAATAGTGATATATGTATATGACTCATCGAAATATGATGAGGATGGATGAACTAAAATGGCGTTAAAAATCAAATTCATTTATAAACGTGGGAGTAGGACGATTAAAAAAAATGATGGAAAAATGTGTAGAAATGTCGTCTTTGGAGTGATGAAGAAGAAGGGAAATGAAAAAACAAGTCCAAAAATAAAGGAGTGTGAATGGAGAAATTGGAAACTGTTAAAGCAAATCAAATCAGGAGGAAAAAAAACTAAATGTTGAAAATGCAATTGAAATATCAAATCTAAAATCTAGGATATATGATTTAAAAATTGGAGTCCCACCTATTTAGGAATTCATTTAAATGGAGAGAAAAAGGGTAAACTTGGAATAATTACAAACGGAAACTACCCCCATAATTCGGTGGCCATTTTTCAAAATGACAGTGTAGAAAGGGACACCCACACCAATTTCTCTTTACATAAAGGCAATTGGGTCCAAAACCCCAAGTACACATAAGGATGATTGAGCCTAAAGCCAAATAAGCCTGCCTAGGTGAGTCCCACAAAAAACTCTTGGAAGTCATTCACCATTTGTGGGAGCCAGAGGTTACAAATTAGAGAATAACTCTTAAAACTCTTTGAAGACGTAGAAGACTCAAAAGATCCAAAAGTTAGAAAGTTAGAGGAGATCTAGAAGACTTAGAAAGATCTAGTAGTTAGACAGTTAAAGAAAATCTAGAAGACTCGACAGACTTGGAAGATCCAGATGTTAGAAGTAAGAGAAGACTCAAAAGACTCTTTGAAGACTCATAAACTCTACAAACCATATGAAGATTAAGAACTACATTCACAAAGTTTAGAAAATATAGAAGACTCTCTGAAGATTCTCATAAGGCTTGAAGATTTTGAAGAAAAATTGATATATTTTAAACTTACATGACTCCAAGAAATTGATTGTCTCTTCACAAGCTAAAAAGCTAAAATACTCAATCTCCTTGATTCGAAACAAACCATTAGCCTTTGAATAGAAGTTTTTATTAAAAAAAAAAGAATCAGAAGAATATTTTCATTCGAGATTGTAACCATTCAAAATTAATAAAATCGAGTTTATTCCATGAATTACATATTTTAGAAATCTCGTGTCAACATCAATATTTTTTAAAAGTTTTGTTATCCATACTATCCCTCCTTGATTGTTGAGAAAATAGTTGGGCATTGCCATTTTGGTCCTTGAACTTTTGGGTTTAATCCATTTTAGTTTCTAAATTTTAAAAATGTTTATTTTAGTCACTTAACTTAAAAAAAATATCAATATTGATATCTTCAACTTTCATAAATGTTTATTATAGTCCATAAACTTTGAAAAATGAAACCAATCTTTTTTTAATTCAACAAATGTGTGGGTAGGGCATTGAATCTTCAACTTTAGAAAAGGTAATAAGTGTCTTATCTCTGAGCTATACTCAGATTGATAAAAAACAAACCAATTTAGTCCTTGATATTATTTTGTCATCTAATATATATCCACCGAATACCCGCCTCAGCCAACCTATGTGGCTCCACTACATGCCCATGCAATCATGTCTACATATATATTCAAAATCACGTTGTCCATCTGTTAAACAATTAACGACAAACAATAGCAATGAGCAAAATGATGATTTTTTAAAGGTTCAAAAACTAAAATGATATATATACTCTATAAAATTTGGTTTTTTTTTTAAATAAAAACTATAAGTTGAGTAATTATGAAAACAATCCTTTTCTTTACTTATTTTCCCATATTGTGTTTTCAGGTTATGTTCAGAGTAAAGTACTTTTGATATATTTTATAAAGTTTGATTTCTTTAAAAAAATAGTTATATTTCGTAGCTTATGTGTCATAGCTTTAGTTATATTCTAAAAAGAAAACGGATTTTTTTTCACTAATAATGTAGTTTAAAAAACAAAAAACAAACATAGATAGTTTTTAAAGTTATTTCAAAAATAGAGTTGCTAAATCACGTGCAAGTAGTGAGATTTAGAAAAATCGCGGGCCTTACATGCATTTTCAATGTAAATCGCGGGCTAGGCATGCGATTTACATTAAAATCGTGTGCAAAGCCCTCGATTTACGCTGACTACCCTGTGAGCACTATTGACAAGCTGACCACTTGGAGCTAATGTGGAGATGTAAATCACAACGAACACATGCAATTATCGACATATCGCGACACGTGATTTTATGCCGCAATCTATGGATACATCGCGACACTCAAGATCGGCAAGAAATTTATGAAGCAATCGCGGCACACGATCCCGACACGCGATCTAAAGCGCGGTTGTCAGATTTCCAAAAGTCGCCGGTCTGGCTGTGAGTACTGCTGACAAGTCTGGCTGCCAGTTTGTCAAATTCCCAAAAATTGCGTGCATTGCACGAGATTTTCATGGCCCCAAAACTGGGGCCTTCCCCTTTTTTCTCATTCTTCCAACACAGACCGTTTCTCTCTGTCACTCTCTCATCTCTCTGCTGCTGCTCTCACTCCCTCAGTCGCAAATTGTCACTCTTCCAGCGCTGACTTCTCTGTTCGTCACTCTTCCCTGCCCGCTCCTCTCTTCTCGTTGCTGTAGAGGTAAGTGGCTATATTTTTCTTTTTTTTTTTTCCTCTTCGTCTTCCTGATTTTAGACTGGTTGTTGGGGTTCTGATTTTTAGACTGATTGTTGATGATGGCTGCTTTTAAATCAGTTTGAATTGATTTTGTATGGATTTTGAATTGTTTTGAAATATTGTTATTTATTTTGGTCTGTTTGCATTGTTTGTTTTGGACTGTATGTAGTTTTGGACTATATGGTTTATTGGACCAATTGATTTCGAACTCTTTTGGACGATTTTAAAATTTTTTTCTTTTTCAATTAGTAATTAATTTAAACTTAATTATAAAATTGATATAACTTTAATAATTAAAACAGTAAAATAGTTTTTAAAAAACATTAACATAATTGATTATAACCTTAAAACTAAGGTTTAGAAAACATTAATTAATGATTATTTTAATAATTTTTATTATTTATTTTATGTTAATAATGTAAAATGAAATCAATTATAATTTTACTAATTAATAAATTTACTTAATTAATAATTAATGAATTTACTAAATAAATGGTTAATTAATTTACGAAATTAATAACTAATTGATTTACAAAATTAATAAGTAATGAATTTACTGAATTAATAGTTAATGAATTTACTAAATTAATAGTTAATAAATTTACTAAATTAATACGTAGTTAATTTACTAAATTAATCGTGAATTAATTTACTAAATAAATAACTAGTTAATTTATGAAATTAATAACTAATTAATTTACTAATTAATAATACTTCAATTAATTATTAATTTACTAAATTCATAATTAATTAAAGTAATTTTTTTAAAAAAAATTTAATGATTAATTAAACTAATTTTTTGAATAATTTCATATTTTATATGTAATTTAATTGTAACTTTTAATTAATTATTGATGAGTAAATTAAAATAATTTATAAAGTGTACATTTGATAATTGAAAATAATTTTAATTAATTTATTTGATGATTGAAAATAGTTTTAATTAATTTTTTTGATGATTGAAAATAAATTTAATTAATTATATATTTACTATAATTTTAAATTTAATAGTCATAAAATTAGATATTTGTGATATTATACAATAACATGTTTTTTTCATTTTGTACAGTTTTGTGTTAAAAGATCTAAACTTTGAACCAAGTAGGTCAAATATGACGTTGCCTCATGATGAACTTGTTATACTTAAACCTGGAAATGGTGGTTATATTGATATAGAAGTAGAAGTTGATAAACTATATGGAATAAATTTGAACTCCTCCCCCCCAAGTCAAAATGAAGAGGCACCTTCGGATATATTCACACATATAGATTTTCATATTATTGATTCGATGTGTGAAGAAGGGTCGATGTATGAAGAAGAGTCAAGGTGTTCAGATATGGAATCAAGTAGAACACGTAAGGGGTTGATATTTGAAACTAAAAAAGATCTACAACTTGCCGTTAAAAAATATTATGTTGAACAACATTATCAGTTTATTGTGGTAGAAATCAAACCAAGATATTTGGTATGTTAAATGCAAACAGTGGAATGAGGGTTGCAAATGAAGGCTTCGTGCTTGTCAGCGTAAAACTCATGGAATGTTTGAAATTACCAAACTTGAAGAGAATTATTCATGCTTATACTCAGAACTCACACAGGATCACTCACAACTTAATTCAAATTTAATTTGTAATGAAATTCAAAATATTATACGACGTGATCCTAGTACGTCTATTACTTCACCGCAAGAAACTATCAAAAAGGATTTTGGATATTGCGTGAACTATAGACGCGTGTGGCAAGCTAAGCGAAAAGCATTAGTTAAAGTTTTTGGTGATTGGGAGAAATCATATGAAGAACTTCCTTATTGGTTGAATGTTGTTGTACATTATAATCCAGGCACGGGATTTGATTCCAACTAGTGTACTAGGTAATCTTATTTTTGGTAGAGTTTTTTGGTCGTTTGGTCCTATAATTGAAGGCTTTAAATATCGTAGACCCTTGATCCAAAAAGATGGTACACACTTATATGGTAAGTATAAAGAAAAATTATTAATAGCCACCTCCATTGACTCAAATGGGCACATATTTCCACTTGCTTTTGCTGTTGTTGAAGAGGAAAGTGCTTCTAGTTGGTCGTGGTTTTTATATGCCTTACGAACATTAGTTACCCAACGAGACGGTATATGTTTAATTTCTAATAGACATGGTGGCATCTTAGCGACTATGAATAATGAGGAAAATGATTGGAGGGATGCAAGAGCACATCATCATTATTGTCATCAACATGTGGCTAGTAACTTCAATAAAAGGTAGGATTTGATGTATCGTGCAAGGTGTCAACACCAAAGGCATAAGTTTGAACAGTGCATGAATGAATTAAAACGTTTGAACCCAGATTGCCTTGAATTTTTCTCACTTAAATCTAGAAAAATGGACACAATCACATGATAACGGGTTTCACTATGGATGGATGACAACAAATCTAGCAGAATATATTAATGGGGTTTTCAAGGGAGCTAGAATATTACCAATCACATCGTTGGTTAAGTTGACATTTTATCGCACAATTGCATATTTTGAAAAACGTAGAGAAAAGATTAGTGAAGCATTGGGTCGTGGTGAAATATATACAAATTATGCTTTAAAAAAACTTAGGAAATGGACAAATAGAGCTGCTTCACATACTGTGACTTCTATTGACAGAGTGACGAGAAACTTTGAAATTGAAACAGGGATAAATATGTTTTCTCCTTACAAAGGCCAACAAACGCAAGTTGCTTGCTTGAGAGATCAGACATGTACTTGCAATAAGTGGCAGTCATTCAAGATACCACGCTCTCATGCAATAGCAGTTTGTAATCATATTCACTTGGAACATTTGCCTTATGTAGAGGATTTTTACAAATTATTAAAATAACAACGATGTTATGAATCTCATTTTCACCCTATACAACATAGAGATTACTGGCCAGAAGTAAAGTTTGATGTTATTCATCCAAACCAAAACTTATTGAGGGAACATGGACGTCCGAGAACTTCACGCATTCATAATGAGATGGATTGGTGAGAGGCTAGTTCGAACGTTCTTTGTGGATTATGCAAAAAAGGATATAACAAACATACTTGTCCAACACGTAATTTAGGCGTGTCTTCTTCTTCTAGACAAATGGATGAACAAGGTCTATTTTGTTTTTAATTTTTTTTTATTGTTATTGTTTCATTATTATTGAACTTAATTTCACTATTTTTTATATACATGTATGAAGCATATTGGAGTTTTCTTTAATGTTGTAATCTAATTTATTGTTATTTTAGTTTTTTTTTTCTTTTTAGTTTGTAATATACTTTGGTGTTATATTAGTTTTTATATACTTTTTTTATTTGTAATTTTATTTAATTAGTTTAATTTAATTTAATTTAATGTAGTTGTTTTTATGATGGATTAATGGTATTGAATATGTGTTAAATCCTTATATATGAAAAAAGTTGTTATTTGCGTTTATTGTTTTTCAGTATTGATTATGGATCCTTGGCCAATTGATTTGTCACAATTATATTTACAACCTACACATCGTTCTCAATCAATATCTACGGTTATTTGGTTTTTTTGGAGCAGCATAGATTGGATTTACCCAACTGGATTGACACCTTATTACTGCCTTAGTGGAGCGATGGAGATCTGAAACCCACTCATTCCATATGCCTGGAGGAGAGTGCACTATTACGTTACAGGACGTTGTTGTTCAGTTTGGATTACCTGTTGATGGTGAGCCGGTAATTGGATCGTTGCAGTACAATTGGGCACAAGTACGTGAGGATTTTTTAGGAGTACGGCCTCCCCAAATTAAGGGGTCTAGATTAAGCATACCGTGGTTGGCAGCACAATTCACAGAATTACCTCCTGATGTTGATGATCTCATGATCCAAAGATATGCAAGAGCATATATTATGCAACTTATTGGAGGATTTTTATTTGCTGACAAGTCTAATACACTCATGCATCTCATGTTTCTTCTGTTGTTGGGTGATTTCGAGGCAGTTGGACCATATTCTTAGGGTAGTGCATGTCTTGCATGGTTATTTAGAGAGTTATGTCGGGCTAGTCGAGTTGATGATTTAGAAATAGCAGGCCCGCTCATACTATTGCAAGTTTGGGCTTGGGATAGATTTTCTATTATTGCCCTTGCCTCAGCTAACGACCTTTGATCAATATGTTGGGCGTCCTCTCAGTGCTCGGTACGTTTTATTTTATTTTTACATTATTTTTTATTGAACAATTATGTGACTATTGTGTAACTAAATGTATTATATACTCTTATAGATGGAACAACACTTTAATTGCTTCTGAATAATCTACAAAATGTTGAACTAGTATCAAATTTCATTTGATCGATTTTTGCCCAACCAGGTAAAAATACAGTTTATTTTATAAGCCTCACATAAATATTAATTATAATTATTAATTTATTTTTTATTTCAGATCGTTTGGACACCTTACACACCGGACATTACGACTTCATTGCCTGACTATTGTCATAATGGACAAGATATTTGGTTGATAGTAAGCCCTCTTATATGCTTTCATATTGTAGAGTGACATCATCCAAATAGGGTGTTGAGACAATTCGGACTGATACAAACTGTGCCACCATATTGTGATACAAACACACAATTGCATCAAGTGGACTTACGATGTGAGTCAGATCATGATTGGAGACATCAGCATGCTACATATATATCTCTATGGCGTCAACGTCGTAGTCGTTGTGCATCTGGTGGAATAATAAATGGGCCATCTGTGTCAGATGATTACGTATCTTGGTATAATGCAATTGCAAGAAAATATATCACACAAGAAGGGGCTTATTACGACCGTACGGTAAATATTACTTTACTTAAAGTCGATATTTAAATTATATTTTTAAATTTTATTACAGAGTACTTTTGTTAGGAATGTACAGAAGTATTTAGTGCAACAAAACTTACCAAACTTAAGTTCTTTATGTGTGAGTTATATTGAAGATACAGATGAGTTCATTCATAACACTAGCAGACCCGATGTTCCTAACTTTGATAGGAGACGCGCTCATTGTAGACGCCCACAACCACCAGTTGAAGATATTTCAGACCCAGATCTTCCTGTTGCTGAAGATCCGATTTCGATGACTCCCATGCACTCACCTTTTCTAATGATATCGACACTGGGAGTTCAAATTGACTTTGCATCAAGTTTTCTACTCATCCACCAAACTACTATGCACCTGACTCATTGCCACCTGTTATATCATTTGTTGATGTAACACAACAAGATATTGATAAAGTCATCCATCATTCACTACAAATTAATATGTCTTGACCTCGTCGTGGAATTCGTGCAAGAAGACGACCACCGTGTGGTACATGAGCGAATATGAATTTTATGTTTTATATTTTATTTTGAAGTTTGTTGTAAACTATCAATTTAATTAAATTTCAAATTTTAAATTGAGCAAATATTTGATTCGATTTCATTATTTATGAATATTGATGAGTAGTGCATAACAAAAAAAATTAAATTACAAAATAAAAAAATTTACTCAATATCATATTTATATTACTTAATTAAACTTCAACATATCATATTTTTAATATTATAAATAAAATACAAGATGTGTGAAGTAAACTAGAAAATTAAATTAAGAAAGTAACAATTTTTCATTCATTTATTATAAATCGTTTCTTTGATCTTCTCAAGAGCTTCTTTTACTTTGGTATTTTATTAAAAAAATAGAAATTCTTAATAAAATTAAGATTATTGTGTATATCAAATTAAAATGAGTAATATTATTATTACTGATCAATAATAATTTATAAAAAAAGAAAAATTTATTTTAAAAATTACAGCAGAAAAACAAATATCAAATTGATAGTAATGAAAAAAAAGATTACACTATTAGGGAATTGTAAAAAAAGGAAAGATATCTAAAAGTATCGTTTGACCCATCTATAGATCGCGTGTCGCGCTATAAATTGCGTATCGCTATTTGCTTGTAAATTGCGTGCATTGGATGCGATTTACCTATAAATCGCGTGCGTCCCCCCTCCACATCATCTCCAGGTCAGCACAGGTAACTCGCGTACCTTAGACGCGAGTTTCGAGCCCACAAAAATTATCCTATTTTTGTCAATATTTTCCTCAAAAACCTTATTTTTGAAATTTTTTTTATTTAAAATGCATTTATTTTAATATTATTTTAAAATATACTCTATTTTTAGAATTTTCTTTTAAAAAACCATTATTTTTGAACTCTCCCATTACTTTATTGATATTTCAAAAAATAAAAATGAAAATAAGTGTAAGATTTCTACGTGCACGTGCTAGTTGATTACCCGACAAGATAACAGGACTCCAATTTTCAGCTGACAAGCAATTTTTGGAAAACCAAGATATGTAGTGAATGTGCGGGAAAATATGTGGTGACGGCCTTTTCCGTGCGCATGTAATGTTCTTTTCTTATGTAGCTCAACTACTGGGGTTTGATTTGTTCTTCTGATGAGCAAGCTTCATTTTGATTTCCAGTGACTGCTCGTAGCAGCCAATTGCAGCTGAGAAATGGCCCAGTTCACCACACACAGTCGGGTTAAGTTGCTGCTCAATGGAGACGGAGTGCCATTCGGTTCAGAACCCAAAGATCGATTAAGATACCAGCTCAGATCAGTTCGAACCCTCAAACGCAGAATCCCCTTATCTGGTGCCTCCGCTGGACTTTCCCCTTCTGCCTCCTCTGCTTCAGCTTCAAGGAAATCCGCTCAACATGTTGCGGAGATGCGTGTTGGTTTGAGGGATGAGAGCGTTAGCGATGACGACGCCATTGTTGATCTTGACTACGAGCTCGAGAGTGATGATTTGGCTTGTTTCAGAGGTCTGGTCTTGGATATTTCCTACAGGTTATTAAACTTTATACCCACTTTTTTTTTTACTGACTTATTCTTTTTGGGTGATGTACCCTGTAAAGTGTGCTCCCCTGTTAGCAAAATATTTCCTGTTGTTTTCTTCGATGAAAATCCCAACCGCTCCCCTAGTACCTTTGGACTTGTTTCTTTCTCTCTCTCTTTTTATTGGTGAAATTATGGGTAGAACTCGACTTCTTCTGAGTAGCATTGGATTGCTTCTGTCCTCTTCGAACGTTTATTTGGAAGATGACTGCTAGACTAGACTTATTTATTATCGATAATGCTATTCCGATTAGTTGTTTGACTTGGTCTTACTGTATCTAAACGAATAAAAAATTGCCACAACTGTTAATGTTGAAGCAATTGCTAGCTTGCAGTAAGTCAATGATTTAACAAAATTCTGATATTTGGAGCTAAAAGTGGGCAACATTCTAACACAAGAGAAAAACATGAAGCCAGCTAATACATCAAATTGATTATTCTTGTTTTTGTGCGAATGAGCAGAAGCTAATATACTATGTATTCAAAGTATTACAGATAATTTTTCCTTCATGTAGCATAAAATTTCAAGTACTATTATGAAATATTCGTAGGCTTTTGATTTTGATGAAAGGTTTCTAGGAGGCTCAATAACCAGAGCTTGTATTTTGCCTATTTATAGCCCAAGTATAACAGGAGAGAGGGGGCTGCCAATGTAGCCCGGAAGTGGATACATGTCCAGCTCAAAGTTCTGGAAAGAATACAAGGCCCATGAACTGTATACACATGTAAAGCAATGTGAAGAAAGAAAAGAAGTTGACTGAAAGAAATATTGTTAATAAGTGAATTGAGTTGTCTATTCAATTCATCTCCTCAATCTAGACTGATCTTGCATGTCAAGCTTGTCACATAAACGAATGAAGTCACCTCTTGGCAAAGCTTTTTTCATTTTTTTGAAAATATCAGCCATCTGAGCTTCAGCAATATGTGGTTAATCTCAACTTCTGTATTCTGGAAATGCTCTCTTATAAAGTGGCTGTCAATCTCTTTATATTTGCTCCTGGAGTGGAGAACAAGATTTGATGCAAATGATGCAACCTCCATGTTATTGAAGTCATCGTTAGCATGAGTAAGTTTGCCATGCTAATCATTTTTTAAAAAAATGTATGGCTATGGAACATGAAGAACATGATTCCAATGTAACAACCTTTGATTCAATGTTGAGGCGTTAGATAATGCTATAGAAATCTCTATCTTTCAAGCATAGAGATTGGTCTTTGGCTCTCGGCATTACTTCAGAATTGGCTTCCTCGACAAGGCATAGACTCTCTTAGTTGGTTACCAGATGCTAATGGTTGTTTTTCAATACAGTCGGCCTACTTTACTCTTCAAGATAGTCCTCCACTTTTGAATAGTCTTCTCAGCAAACAAATTTGGAAAGGCAACAGCCAAAAAAAAAACAAAATTTTTTGTTTGGTCTTTAGCTCACAGAAGTTTAAACAACTCAGACAAAGTTCAGAAAAGAAATCCGAACTTAGCCCTGTCTCCAAATGTTTGTGCTATGTGCAAAGCTCATGCTGAAACTAGTCACCACCTCTTTCTCAGGTCCTTTTGCTTACAAAGGTGGGAACTTCATTTGTAATTGTTTCGATTTTGCTTGGTGCCTCCTAGAAAACGTAGAAGAGGGTCTCTTAGAATTGTTTTCTGGCTGGTGGCTTAATGACAAAGGAAAGGTTCTTTGGTCCAACGCTGTTAGAGCTCTTCTATGGCTTCTTTGGAAAGAGAGGAATTCTAGAATTTTCTTAGATAAGTCGTCCTCTTTTGATATTTTTTGTGATCGTGTTCACTATACAGCCTCAAATTGGAGTGCCTTACACAATTCCTTTTGTAATATTCGCTCTTTCCTCATTTCTTTAGATTTGAGACCTTTTGTTTGACTCCTTTTCTTTAGGCTTAGGGATTCCTCATCTCTAAGGTCTTTCGGTTGTCTTCTCCTTTTTTTTTTGTTTATATGAATAGATTCTATCGTTTCTTACCAAAAAAAAAGATAATGCTATAGATATCTGACAGACATGATGTATGTTCAAGTCTTTTCATTACCTACAATCAATTTTCAGGGCCTCCATGTTCAATTCTGATGTTCGGGTTGCTAAGTTCACTGATCATGTGGCTTGTTGCCCAACAGTCCATATACCATCCCGAATTTGATGCAGTCCCTCGTGATGCAAATAGACTTGCTGCCAACGAGACTCATCTTGCTTAAGAGAGGGGCTGCAGTCACTGATCATGTGGCTTGAGAGTATGAGGTAGCTCAAAAACTAAAACTGTATTTTTCCTATTTATAGCAGAAAATGCACAAGAGGGGGCTGCCAACGTAGCCTTGAATTGGGTACATGTCCAGCTCAAAATGCTATAGAGGATACAAGCCCAATGACCTTATAATCGTGTAAAGCAATATGAAGAAAGAAAAGAAGTTGACTAAAAGAATAATATAATATGGAGTACGTTGGTCTTTCGAGGGAAAGTATGGCAAAGAAAGAAGGCAACCTCTTGGCTAAGCTTTAGTGAAAATATGGAGCGTTTGAACTTTTGAGGGAACATAGAAAATCTCACCTTGCCATTTATCCTTGAAGTAGTATAAAATTTCAATTATTAGATATGACTGCCATTTTCACTTTGCTAGCCAATTCCCTCTTGCACCATACGTTCGGATTCTTGCAAATGTTGATACAATGTTCCTGGTGGTCTTTCGTGTACCATAAGCTTCCAACAACATATGACTGAAGTGTCCCTGGTGGTTTTTTTTTAGATAATGCTTCATTCTCAACATTTCAGCTATTTGATATACGCATGTGGTAACCAATGATATTTTGAGTCCGTGTCCTACATATAGTACCATGCACTTAAGACAGCAAACAAACACAGACAAACTCCACTCTTTTCCAGTACTTTTTGCTCAATATTTTGAGTTCATTTCCTACTATTTAGTCAAACAAATCCTTGACATGATTTCTGTACGTGGAATGGGTTGACCTCCACTTTTTTGTGTTTACTTGTTTCATATTGCTTTTCTCTCTCCATATTATTTGTATGACTGGAAAGATTTGCAGTTTATCTTTTGCTATGTAATTCCTTGCTTCAGGCCAGTCAATGTCGTTTGTTGGAAGCGTGCAATTTGTTTGGAGTTCATGGAGAAGGTTTGACTACTCTCTTTTACGTAATATGTATACAAATGGAGATAATATATAGTTCCTAGGGTGTCAATTTGATTGGTTTCATAGTTCTTATGGAAAATATGTTTAGAAGATGAGAAAGTTATCTTCATTTTGAAATTTCTCTTTCTTTCTTTCTTTTTTGTTTTTGTTTTGGTTTTAAGATTAGAAACATGTACATTGATAAGAAAATATGTACAAAAAGTAAGGTGAATTAAGGTGAGACTAGTGTACAACCCAAGTCATAGAAGCCCAAAGAGATGCCCTTGCTGCATACTCTCTCAAAATCTTAAAAGAATCCTCGAAATTCTGTTTATTTGTAAGAAGTGAAATATCCCTCAAATTGGTATGGGTAAATAAAAGAAAGTATAATGACAAAACTCTTTTGAAGGAGTGCACCAAGAGGAAGCCAATAATCTCACTAAATCAACAACTTAGAAAAATCATTGTTGATACTGTAAAGAATTTTTTGTTCCTTTCCAACAACATCTTCTAGAGCAATGCTTTAACTACATTTATTCGAAGGACCCTAGATTTTCTTTTGAAGATGTGGCCACAGAAAAGCTACTCCATAAACTCCTCCAACCTTTTCAAAAAGCACCATTGCATACTAAAATTATCAGATACCTTGCTCCAATATCTACGAGAGAAGACATAGCTCATGAAGAGGTGATCAGAGTCTTTCCGACTATTTTTGTACATAATGCATCAACTGGAGGAAAACATGATAGAAGGGTGTTCCTTTTCTTTCTTTTATGTCAAACAAGAAACAAAACTTTTTTGTTGATGAGTGAAAAGTTACAAAGCAATTCCAACCTAAAAAAAGACTTAAGTATTACAAACAAAGACTACTCTCCAATATGCGTACCCCCCTCCCAATTTGTGTTAATTAGAAAGGGAATATAAGCTACAAACTCTCTATCAGTAGGAACCCAAGAAAAACCTGGAATTTTGCCAATCTCAACTCCATACCTTAGCCTGTCAAGGTTGTTTCTTTCGAACCAAATGCTCCAAACGACTTTGATCTAATAGTGTTGACCCATTGTATCCTTTCTTTCTACTTAAAAAGATGGCCACACAATAATTGCACCAAGTTTCCATCTATGGAACTGTGAGGAGCCTGGGATAAACTGAAAATTTGTGGTAAAGAATCTCAAATGGTTTAAATAACTGTTTGGTCCTATCAATTGATTGAGGTTGGTCAAGTAGTTTTGAGTCTACTGTGAGTGTTAAAAATGCATGTTTTGATGTCTTTATCTCAAACTTTTTTGGTTTTTCCAGGCTGATGTATTGGAATACTATGACCAGACTGTGAGTTCTCCAAGTGGATCATTCTATATACCAGCAGTATTAAGGGTATGCATAAACAATGTCTGGTTCATGGGTTTTTTCATAGGATTGTTACATGTTATCGGTCTTTATTTCCATAACCAGGAGAAGAAGTTCAAGACTGACTTCATCTTTACGACTCGAATCTATTCCTTGTCAAAGGCCTTTGAACTAACTATGTTGTCCTCCTTTCAGGTTCCCCATTTATTGCAAGTTGTAAAGAGAAGAAGAATCAAGAACTCTTTAAGTCGTAAAAACATACTTTATCGGGACAATTACACTTGTCAGTAAGTTGATAAATATTCACAATTGATTAGTTTTGTTCAATTTATCCTTTAATATTGATATGGCAGAAGTTATTTTGAGATGCTTTGCTAATTTCATGGTGGGGAAACTTGTATTGATTATCTAATTATTTTAATTGTAGTTTCTTTTTTTTTTTTATAGGAAACGTGATATTCATTCAATAGGCAAAATCCAAACAAAACAACCTAAAGGACAAAGGGACAAGGAGTCCCTTTTCCTAAGGAGGGGGTCAAACAAAAGCCCTCCAATATAGATTGATAAAAAAAGTAGAGTAACAAAAAAGCTTGTGTTGAGTACTCCATTAAGTGAACTGTACAAGGTCACAAATATAATTGTACTTATCTCAAAAAATTCTCGAGTTTCTTCCCTTCCAAATACACCATAAAAGAGCTCAAGAGGCATTTGACCAAAGCACTCTAGCTTTGTCTTTTAACCACCAATCAGATAAAATCTCGAGAAGCCAAACCCTCCAAGATATTCGGACAGCACCAATCTAACCCAAACCTTTTACAAATGAAATTCCAGGCGTTTGAGGCGAAATGTATTGCTATTTTAATTGTAGTTTCATTTAACATACTTTGCTATTTTAATTTTATTGCTATTTTTTTGCCGATAAGTGGCACACTCCACATATTTTCAAACATCCTTCTTCATACCTTGCCAATATTACTCCACTGTGAAACTCTTATAGGTCCTTAAGAACCCCGAATGCCCCCCATTGTTAAACCATAAAAGGTATCCTATGGTAGGTATTAATACGAACGAGGTAAGGCAAAATGTCCCTTAGACGACAAGTTTCACTATTCCAGCATATGCTTGGGACAAGAATTACGGTCTGATGACAAGTCTTGTTTGATTTTCGGAAGGCGTAGGTCCTGATTGACTTGTTCAGCGACCTGTTGAGTGTCAATTAGGGAGGCCATGGTTAGAGTGCCTATGGAGGACAGCGAGAAAGAGTTGTCTATGGCCTTGTTTTCAAACCCCAACCAATATTATATCTCAAAATCAATCCCCAACTGTCTCATGACCCATTTCTAAAAATCTGATTGCACTACCCTCTTGAGTGTTCTTTGATGTGTTTGTAGAATAATCTGCCTGCCTGGTACATCATGTCCCCATTTTTGGATTCGCCATCAATGCTCATTCATTATTAGGTTTCATAAATTGGTCTCTGGCAAGATTTTTTAGAAACACTTGAATAAAATAAGCTATTGTCCATTGGTTTTGCATTAGCACTGTCCCCAATCTCGTGCCAAGAGCGTCCATCCTGATAATAAAGGGTAACAAGAAATCAGGTAAGGCCAACATATGCATGGCTATCATCACTTGTTTCAACCACTCAGAAGCCTGAATAGCCTTTGAATTCCATTGTTTCAACCACTCAAAAGCCTGAATAACCTTTGAATTCCATGTGAACTCATCCCTTTCCAGCCCTTGGGTAAGGGGAGATGAGGTAGCACTATGAGTTGTTGACAACTCATAGTACTCTGTCATGCTCAGAAAACTGTGTAATTCCTTCAAAGATTTCAAAGTTGGCCACTGTATCATGGCCTGCACCTTATTGGGCCTCTACACCTTCGGATGCGATCCAATGTATTCTTACCTCTTTTGTGCAAATTGGAACTTCTTAATATTCATGTATCGTTTATGATCATTGAGGATAGTGAACACAGCGGCTAGATGTTTAACATTGGATTCAATATTGGGGTTGTACACTAATTGGAGGGTGGTTTCTTTGGCTTCTGAAAATGGAGGTTTGGGTATTGGAAACTTGAAGAATATAAATAAGCCTTAATATCGAAATGACTTCGAGGTTCTTGATGAGTTTGATCAGTTTTCCCACAAGGTCTTTGTAGTATTAATGGAAAGAATGAAGACTGGTTCACCCTTCAAAGGAGTGGGGTGGTGGAAGAAGCCTCTGGAAGAATATCTCAAAAATGAACAACTTAGTCTTAAATAATTCAAAGATTAAAGAGGGCAATAGAAGATTGACTAGATTTTGGGAGGATGTTTGGGTAGGGATGATTTATCGTTGGCTGAAATGTTCCCGAGACCGTACTAGGTGGTGGATTCTAAATTGAGTTTTGTTAACACCTGTAAGTTTTTTTTTTTTCTAAGAAACAAATCTTTCTTTGATAATTGAAAAGTTACACAAAAACAAGAAATTAAACTCCAATTAGGAGTATAAAGCCAAAAACCCCTCAATACATTACAAACTTTACAATCTTCCCCACCCCCCACCACCCCCCCCCCCCCCCCCCCCCCCCCCCCCCAACTATACATGATATCCTGAAGGGTATAAAGGATGAATAGTGCCTCTGATGTATTATTCAAGTAATGAATCCAAGTATTTAAATACACATTGTACACGTAACTAATTTTCCAGCTGTAAACTAAATAAACCAAGTCAGTAACAAAGTGTTAACAGACTAACAATTCTAGGGAGATGAATATTAAATTTATCATGATTAGAGTTCTAGTAGACCTGTTATCCCAATGGCTTAAGCTTTTAGATTTAGGTTTTTAAATTCTTAACACTACTTTCAATAGGAAGGGCTAACTAGACTATTAATAATGAAATGAGGGATGATATTGCAAGGATCTGAATGCAAAATTTTTGCTCCAATTCTTTTTAATTTTATTATTTTCTGGCAAGGGTGAATATTATTCCCATCCAATGCAATTTTTATATGCTGTCTTTTTATTCTTTTTCTTAATTCTTTTGTTGCCTCAAATGGGTCTTTTATCAACAGGTATTGTTCATCGCATGATAGTTTGACCATTGACCATGTTTTGCCTATATCCCGGGGTGGAGAATGGACATGGGAAAATCTGGTGAGTTATCCATTAGGTATTAATATTAGACTACATATGCTAAACTGAATTTCATTTTGCCATAATGTTGAAATTGTCAATCATCCCTTAAAAGACGCGGTCCTGATTCCAAAACATAGAGATGTCCATAGGTTTTCTAGGTATTAAAATAGAACACAAAAAACCATCCTAATAACAGTAAAAAGGCCAAATTGGCAAAGCACTCATCAGTTTACTCTGAACAATTCACCTGCTACATTGTGAATTCTGAGACCATATAAATATATCGAGTTCCAAAAATTATTCTCTGGTTGTGTTTTTGGGGAAGATGGTTGGGAAATGGGACTTACCAGCAACTCTTCATTTTCATAATGGTTTACTGTTTTCTGTGATCTCTAATAACTTATGTTGTAATAGGTTGCTGCCTGTGTAAAATGCAATTCAAAGAAAGGTCAAAAAACTGTAGAAGAAGCAAATATGAAGCTGAAAAAGACTCCCAAGGTAATATTATGCCTGTTTATAATGACAAAATGAATTAAATATTATGACAGAAACTTTTGATTTGGTTTCCTATGCTTCATCATAATTATGTTTGATCAGGTCTTACTGTATCTAGTTTTGATTTTTACTTGAATTTTGCAGGCCCCAAAAGATTATGATATACTTGCCATCCCTCTAACAAGCACCGCAATAAAAATGTTGAAACTGAGAAAGGGGACCCCTGCAGAATGGCGTCAATATCTGTCAAATGAGCAATGA

mRNA sequence

ATGATAGATGCAGCAGAATCTAAAGCTTTACCATCGCCTAAGGAAACAGTGACAAGGAAGGATAAAAAAAGGGACAGGGAGACGAGTTCCTCGAAAAAAAAAACCACAAAAGGAAAGAAGCAAAAGGGTAAAAAGAAGTCATCAAAAGGAGGTGACGCGAAGAAAGGGGATAGGAGCAAGGAAGAACACAAATCTCCAACAAAATCTAATGATGGCAAGATGAAGAAAGATCAAACAAACAAATTACCGATGATGGAGGACAAAATTCATAAAAGAATTCAAGAACTGATACAGATTATTCAGGTCAACACCACTCTTCAAGTTATGTTCAGAGTAAAATTTCCAAAAGTCGCCGGTCTGGCTGTGAGTACTGCTGACAAGTCTGGCTGCCAGTTTGTCAAATTCCCAAAAATTGCGTGCATTGCACGAGATTTTCATGGCCCCAAAACTGGGGCCTTCCCCTTTTTTCTCATTCTTCCAACACAGACCGTTTCTCTCTGTCACTCTCTCATCTCTCTGCTGCTGCTCTCACTCCCTCAGTCGCAAATTGTCACTCTTCCAGCGCTGACTTCTCTGTTCGTCACTCTTCCCTGCCCGCTCCTCTCTTCTCGTTGCTGTAGAGATCATGATTGGAGACATCAGCATGCTACATATATATCTCTATGGCGTCAACGTCGTAGTCGTTGTGCATCTGGTGGAATAATAAATGGGCCATCTGTGTCAGATGATTACGTATCTTGGTATAATGCAATTGCAAGAAAATATATCACACAAGAAGGGGCTTATTACGACCATGAGTTCATTCATAACACTAGCAGACCCGATGTTCCTAACTTTGATAGGAGACGCGCTCATTGTAGACGCCCACAACCACCAGTTGAAGATATTTCAGACCCAGATCTTCCTGTTGCTGAAGATCCGATTTCGATGACTCCCATGCACTCACCTTTTCTAATGATATCGACACTGGGAGTTCAAATTGACTTTGCATCAATGACTGCTCGTAGCAGCCAATTGCAGCTGAGAAATGGCCCAGTTCACCACACACAGTCGGAACCCAAAGATCGATTAAGATACCAGCTCAGATCAGTTCGAACCCTCAAACGCAGAATCCCCTTATCTGGTGCCTCCGCTGGACTTTCCCCTTCTGCCTCCTCTGCTTCAGCTTCAAGGAAATCCGCTCAACATGTTGCGGAGATGCGTGTTGGTTTGAGGGATGAGAGCGTTAGCGATGACGACGCCATTGTTGATCTTGACTACGAGCTCGAGAGTGATGATTTGGCTTGTTTCAGAGGTCTGGTCTTGGATATTTCCTACAGGCCAGTCAATGTCGTTTGTTGGAAGCGTGCAATTTGTTTGGAGTTCATGGAGAAGGCTGATGTATTGGAATACTATGACCAGACTGTGAGTTCTCCAAGTGGATCATTCTATATACCAGCAGTATTAAGGGTTCCCCATTTATTGCAAGTTGTAAAGAGAAGAAGAATCAAGAACTCTTTAAGTCGTAAAAACATACTTTATCGGGACAATTACACTTGTCAGTATTGTTCATCGCATGATAGTTTGACCATTGACCATGTTTTGCCTATATCCCGGGGTGGAGAATGGACATGGGAAAATCTGGTTGCTGCCTGTGTAAAATGCAATTCAAAGAAAGGTCAAAAAACTGTAGAAGAAGCAAATATGAAGCTGAAAAAGACTCCCAAGGCCCCAAAAGATTATGATATACTTGCCATCCCTCTAACAAGCACCGCAATAAAAATGTTGAAACTGAGAAAGGGGACCCCTGCAGAATGGCGTCAATATCTGTCAAATGAGCAATGA

Coding sequence (CDS)

ATGATAGATGCAGCAGAATCTAAAGCTTTACCATCGCCTAAGGAAACAGTGACAAGGAAGGATAAAAAAAGGGACAGGGAGACGAGTTCCTCGAAAAAAAAAACCACAAAAGGAAAGAAGCAAAAGGGTAAAAAGAAGTCATCAAAAGGAGGTGACGCGAAGAAAGGGGATAGGAGCAAGGAAGAACACAAATCTCCAACAAAATCTAATGATGGCAAGATGAAGAAAGATCAAACAAACAAATTACCGATGATGGAGGACAAAATTCATAAAAGAATTCAAGAACTGATACAGATTATTCAGGTCAACACCACTCTTCAAGTTATGTTCAGAGTAAAATTTCCAAAAGTCGCCGGTCTGGCTGTGAGTACTGCTGACAAGTCTGGCTGCCAGTTTGTCAAATTCCCAAAAATTGCGTGCATTGCACGAGATTTTCATGGCCCCAAAACTGGGGCCTTCCCCTTTTTTCTCATTCTTCCAACACAGACCGTTTCTCTCTGTCACTCTCTCATCTCTCTGCTGCTGCTCTCACTCCCTCAGTCGCAAATTGTCACTCTTCCAGCGCTGACTTCTCTGTTCGTCACTCTTCCCTGCCCGCTCCTCTCTTCTCGTTGCTGTAGAGATCATGATTGGAGACATCAGCATGCTACATATATATCTCTATGGCGTCAACGTCGTAGTCGTTGTGCATCTGGTGGAATAATAAATGGGCCATCTGTGTCAGATGATTACGTATCTTGGTATAATGCAATTGCAAGAAAATATATCACACAAGAAGGGGCTTATTACGACCATGAGTTCATTCATAACACTAGCAGACCCGATGTTCCTAACTTTGATAGGAGACGCGCTCATTGTAGACGCCCACAACCACCAGTTGAAGATATTTCAGACCCAGATCTTCCTGTTGCTGAAGATCCGATTTCGATGACTCCCATGCACTCACCTTTTCTAATGATATCGACACTGGGAGTTCAAATTGACTTTGCATCAATGACTGCTCGTAGCAGCCAATTGCAGCTGAGAAATGGCCCAGTTCACCACACACAGTCGGAACCCAAAGATCGATTAAGATACCAGCTCAGATCAGTTCGAACCCTCAAACGCAGAATCCCCTTATCTGGTGCCTCCGCTGGACTTTCCCCTTCTGCCTCCTCTGCTTCAGCTTCAAGGAAATCCGCTCAACATGTTGCGGAGATGCGTGTTGGTTTGAGGGATGAGAGCGTTAGCGATGACGACGCCATTGTTGATCTTGACTACGAGCTCGAGAGTGATGATTTGGCTTGTTTCAGAGGTCTGGTCTTGGATATTTCCTACAGGCCAGTCAATGTCGTTTGTTGGAAGCGTGCAATTTGTTTGGAGTTCATGGAGAAGGCTGATGTATTGGAATACTATGACCAGACTGTGAGTTCTCCAAGTGGATCATTCTATATACCAGCAGTATTAAGGGTTCCCCATTTATTGCAAGTTGTAAAGAGAAGAAGAATCAAGAACTCTTTAAGTCGTAAAAACATACTTTATCGGGACAATTACACTTGTCAGTATTGTTCATCGCATGATAGTTTGACCATTGACCATGTTTTGCCTATATCCCGGGGTGGAGAATGGACATGGGAAAATCTGGTTGCTGCCTGTGTAAAATGCAATTCAAAGAAAGGTCAAAAAACTGTAGAAGAAGCAAATATGAAGCTGAAAAAGACTCCCAAGGCCCCAAAAGATTATGATATACTTGCCATCCCTCTAACAAGCACCGCAATAAAAATGTTGAAACTGAGAAAGGGGACCCCTGCAGAATGGCGTCAATATCTGTCAAATGAGCAATGA

Protein sequence

MIDAAESKALPSPKETVTRKDKKRDRETSSSKKKTTKGKKQKGKKKSSKGGDAKKGDRSKEEHKSPTKSNDGKMKKDQTNKLPMMEDKIHKRIQELIQIIQVNTTLQVMFRVKFPKVAGLAVSTADKSGCQFVKFPKIACIARDFHGPKTGAFPFFLILPTQTVSLCHSLISLLLLSLPQSQIVTLPALTSLFVTLPCPLLSSRCCRDHDWRHQHATYISLWRQRRSRCASGGIINGPSVSDDYVSWYNAIARKYITQEGAYYDHEFIHNTSRPDVPNFDRRRAHCRRPQPPVEDISDPDLPVAEDPISMTPMHSPFLMISTLGVQIDFASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASASRKSAQHVAEMRVGLRDESVSDDDAIVDLDYELESDDLACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILYRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ
Homology
BLAST of Sgr018104 vs. NCBI nr
Match: XP_022152374.1 (uncharacterized protein LOC111020122 [Momordica charantia])

HSP 1 Score: 468.0 bits (1203), Expect = 1.2e-127
Identity = 246/280 (87.86%), Postives = 251/280 (89.64%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASA 389
           A  T  +    L NG      SE KDRLRY+LRSV    RRIPLS AS G+SPSASSASA
Sbjct: 2   AQFTTLNRVKLLLNGDGVPFGSESKDRLRYKLRSV----RRIPLSAASTGISPSASSASA 61

Query: 390 SRKSAQHVAEMRVGLRDESVSDDDAIV--DLDYELESDDLACFRGLVLDISYRPVNVVCW 449
            RKSAQHVAEMRVG+RDESVSDD AIV  D DYE ESDDLACFRGLVLDISYRPVNVVCW
Sbjct: 62  LRKSAQHVAEMRVGVRDESVSDDGAIVGLDCDYEFESDDLACFRGLVLDISYRPVNVVCW 121

Query: 450 KRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY 509
           KRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY
Sbjct: 122 KRAICLEFMEKADVLEYYDQTVNSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY 181

Query: 510 RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT 569
           RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT
Sbjct: 182 RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT 241

Query: 570 PKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           PKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLSNEQ
Sbjct: 242 PKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSNEQ 277

BLAST of Sgr018104 vs. NCBI nr
Match: XP_038905692.1 (uncharacterized protein LOC120091663 [Benincasa hispida])

HSP 1 Score: 463.8 bits (1192), Expect = 2.3e-126
Identity = 243/280 (86.79%), Postives = 250/280 (89.29%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASA 389
           A  TA S    L NG      SEPKDR RY+LR VRTLKRRIPLSG     SPS SSASA
Sbjct: 2   AQFTAHSRVKLLLNGDGVPFGSEPKDRFRYKLRLVRTLKRRIPLSGP----SPSTSSASA 61

Query: 390 SRKSAQHVAEMRVGLRDESVSDDDAIVDL--DYELESDDLACFRGLVLDISYRPVNVVCW 449
            RKSAQH AE+RVG+R ESVS DDAIVDL  DYE E+DDLACFRGLVLDISYRPVNVVCW
Sbjct: 62  LRKSAQHAAEVRVGVRGESVSGDDAIVDLDYDYEFETDDLACFRGLVLDISYRPVNVVCW 121

Query: 450 KRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY 509
           KRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY
Sbjct: 122 KRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY 181

Query: 510 RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT 569
           RDNYTCQYCSSH+SLTIDHVLPISRGGEWTWENLVAACV+CNSKKGQKTVEEANMKLKKT
Sbjct: 182 RDNYTCQYCSSHESLTIDHVLPISRGGEWTWENLVAACVQCNSKKGQKTVEEANMKLKKT 241

Query: 570 PKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           PKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 PKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 277

BLAST of Sgr018104 vs. NCBI nr
Match: XP_022932702.1 (uncharacterized protein LOC111439170 [Cucurbita moschata] >XP_022932703.1 uncharacterized protein LOC111439170 [Cucurbita moschata] >XP_022972084.1 uncharacterized protein LOC111470725 [Cucurbita maxima] >XP_023539770.1 uncharacterized protein LOC111800353 [Cucurbita pepo subsp. pepo])

HSP 1 Score: 454.9 bits (1169), Expect = 1.1e-123
Identity = 241/281 (85.77%), Postives = 251/281 (89.32%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASA-GLSPSASSAS 389
           A  TA S    L NG      SEPKDR R++LRSVRTLKRR PLSGAS+ GLSPS+SSAS
Sbjct: 2   AQFTAHSRVKLLLNGDGVPFGSEPKDRSRHKLRSVRTLKRRTPLSGASSTGLSPSSSSAS 61

Query: 390 ASRKSAQHVAEMRVGLRDESVSDDDAIVDL--DYELESDDLACFRGLVLDISYRPVNVVC 449
           A RKSAQ     RVG+R ESVS DDAI+D+  DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  ALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 277

BLAST of Sgr018104 vs. NCBI nr
Match: KAG6597719.1 (hypothetical protein SDJN03_10899, partial [Cucurbita argyrosperma subsp. sororia] >KAG7029166.1 hypothetical protein SDJN02_10351, partial [Cucurbita argyrosperma subsp. argyrosperma])

HSP 1 Score: 452.6 bits (1163), Expect = 5.4e-123
Identity = 240/281 (85.41%), Postives = 250/281 (88.97%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASA-GLSPSASSAS 389
           A  TA S    L NG      SEPKDR R +LRS+RTLKRR PLSGAS+ GLSPS+SSAS
Sbjct: 2   AQFTAHSRVKLLLNGDGVPFGSEPKDRSRQKLRSLRTLKRRTPLSGASSTGLSPSSSSAS 61

Query: 390 ASRKSAQHVAEMRVGLRDESVSDDDAIVDL--DYELESDDLACFRGLVLDISYRPVNVVC 449
           A RKSAQ     RVG+R ESVS DDAI+D+  DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  ALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 277

BLAST of Sgr018104 vs. NCBI nr
Match: XP_008465340.1 (PREDICTED: uncharacterized protein LOC103502982 [Cucumis melo] >KAA0051262.1 HNH endonuclease [Cucumis melo var. makuwa] >TYK29998.1 HNH endonuclease [Cucumis melo var. makuwa])

HSP 1 Score: 439.9 bits (1130), Expect = 3.6e-119
Identity = 235/281 (83.63%), Postives = 243/281 (86.48%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASA 389
           A  TA S    L NG      SE KDR RY+LRSVR   RR PLS  S+    S SS SA
Sbjct: 2   AQFTAHSRVKLLLNGDGLPCGSESKDRFRYKLRSVRA--RRFPLSAPSS----STSSTSA 61

Query: 390 SRKSAQHVAEMRVGLRDESVS-DDDAIV--DLDYELESDDLACFRGLVLDISYRPVNVVC 449
            RKS QH AE+RVG+RDESV+  DDAIV  D DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  LRKSTQHAAEVRVGVRDESVTGGDDAIVGFDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVNSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 276

BLAST of Sgr018104 vs. ExPASy TrEMBL
Match: A0A6J1DFU6 (uncharacterized protein LOC111020122 OS=Momordica charantia OX=3673 GN=LOC111020122 PE=4 SV=1)

HSP 1 Score: 468.0 bits (1203), Expect = 6.0e-128
Identity = 246/280 (87.86%), Postives = 251/280 (89.64%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASA 389
           A  T  +    L NG      SE KDRLRY+LRSV    RRIPLS AS G+SPSASSASA
Sbjct: 2   AQFTTLNRVKLLLNGDGVPFGSESKDRLRYKLRSV----RRIPLSAASTGISPSASSASA 61

Query: 390 SRKSAQHVAEMRVGLRDESVSDDDAIV--DLDYELESDDLACFRGLVLDISYRPVNVVCW 449
            RKSAQHVAEMRVG+RDESVSDD AIV  D DYE ESDDLACFRGLVLDISYRPVNVVCW
Sbjct: 62  LRKSAQHVAEMRVGVRDESVSDDGAIVGLDCDYEFESDDLACFRGLVLDISYRPVNVVCW 121

Query: 450 KRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY 509
           KRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY
Sbjct: 122 KRAICLEFMEKADVLEYYDQTVNSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNILY 181

Query: 510 RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT 569
           RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT
Sbjct: 182 RDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKKT 241

Query: 570 PKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           PKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLSNEQ
Sbjct: 242 PKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSNEQ 277

BLAST of Sgr018104 vs. ExPASy TrEMBL
Match: A0A6J1F2H9 (uncharacterized protein LOC111439170 OS=Cucurbita moschata OX=3662 GN=LOC111439170 PE=4 SV=1)

HSP 1 Score: 454.9 bits (1169), Expect = 5.2e-124
Identity = 241/281 (85.77%), Postives = 251/281 (89.32%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASA-GLSPSASSAS 389
           A  TA S    L NG      SEPKDR R++LRSVRTLKRR PLSGAS+ GLSPS+SSAS
Sbjct: 2   AQFTAHSRVKLLLNGDGVPFGSEPKDRSRHKLRSVRTLKRRTPLSGASSTGLSPSSSSAS 61

Query: 390 ASRKSAQHVAEMRVGLRDESVSDDDAIVDL--DYELESDDLACFRGLVLDISYRPVNVVC 449
           A RKSAQ     RVG+R ESVS DDAI+D+  DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  ALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 277

BLAST of Sgr018104 vs. ExPASy TrEMBL
Match: A0A6J1IAG4 (uncharacterized protein LOC111470725 OS=Cucurbita maxima OX=3661 GN=LOC111470725 PE=4 SV=1)

HSP 1 Score: 454.9 bits (1169), Expect = 5.2e-124
Identity = 241/281 (85.77%), Postives = 251/281 (89.32%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASA-GLSPSASSAS 389
           A  TA S    L NG      SEPKDR R++LRSVRTLKRR PLSGAS+ GLSPS+SSAS
Sbjct: 2   AQFTAHSRVKLLLNGDGVPFGSEPKDRSRHKLRSVRTLKRRTPLSGASSTGLSPSSSSAS 61

Query: 390 ASRKSAQHVAEMRVGLRDESVSDDDAIVDL--DYELESDDLACFRGLVLDISYRPVNVVC 449
           A RKSAQ     RVG+R ESVS DDAI+D+  DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  ALRKSAQ-----RVGVRGESVSGDDAILDIDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIK SLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKQSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLP+SRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPVSRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 277

BLAST of Sgr018104 vs. ExPASy TrEMBL
Match: A0A5D3E2H2 (HNH endonuclease OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold734G00280 PE=4 SV=1)

HSP 1 Score: 439.9 bits (1130), Expect = 1.7e-119
Identity = 235/281 (83.63%), Postives = 243/281 (86.48%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASA 389
           A  TA S    L NG      SE KDR RY+LRSVR   RR PLS  S+    S SS SA
Sbjct: 2   AQFTAHSRVKLLLNGDGLPCGSESKDRFRYKLRSVRA--RRFPLSAPSS----STSSTSA 61

Query: 390 SRKSAQHVAEMRVGLRDESVS-DDDAIV--DLDYELESDDLACFRGLVLDISYRPVNVVC 449
            RKS QH AE+RVG+RDESV+  DDAIV  D DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  LRKSTQHAAEVRVGVRDESVTGGDDAIVGFDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVNSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 276

BLAST of Sgr018104 vs. ExPASy TrEMBL
Match: A0A1S3CNK0 (uncharacterized protein LOC103502982 OS=Cucumis melo OX=3656 GN=LOC103502982 PE=4 SV=1)

HSP 1 Score: 439.9 bits (1130), Expect = 1.7e-119
Identity = 235/281 (83.63%), Postives = 243/281 (86.48%), Query Frame = 0

Query: 330 ASMTARSSQLQLRNGPVHHTQSEPKDRLRYQLRSVRTLKRRIPLSGASAGLSPSASSASA 389
           A  TA S    L NG      SE KDR RY+LRSVR   RR PLS  S+    S SS SA
Sbjct: 2   AQFTAHSRVKLLLNGDGLPCGSESKDRFRYKLRSVRA--RRFPLSAPSS----STSSTSA 61

Query: 390 SRKSAQHVAEMRVGLRDESVS-DDDAIV--DLDYELESDDLACFRGLVLDISYRPVNVVC 449
            RKS QH AE+RVG+RDESV+  DDAIV  D DYE ESDDLACFRGLVLDISYRPVNVVC
Sbjct: 62  LRKSTQHAAEVRVGVRDESVTGGDDAIVGFDYDYEFESDDLACFRGLVLDISYRPVNVVC 121

Query: 450 WKRAICLEFMEKADVLEYYDQTVSSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 509
           WKRAICLEFMEKADVLEYYDQTV+SPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL
Sbjct: 122 WKRAICLEFMEKADVLEYYDQTVNSPSGSFYIPAVLRVPHLLQVVKRRRIKNSLSRKNIL 181

Query: 510 YRDNYTCQYCSSHDSLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 569
           YRDNYTCQYCSSH+SLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK
Sbjct: 182 YRDNYTCQYCSSHESLTIDHVLPISRGGEWTWENLVAACVKCNSKKGQKTVEEANMKLKK 241

Query: 570 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPAEWRQYLSNEQ 608
           TPKAPKDYDILAIPLTSTAIKMLKLRKGTP EWRQYLS+EQ
Sbjct: 242 TPKAPKDYDILAIPLTSTAIKMLKLRKGTPEEWRQYLSSEQ 276

BLAST of Sgr018104 vs. TAIR 10
Match: AT2G23840.1 (HNH endonuclease )

HSP 1 Score: 321.6 bits (823), Expect = 1.3e-87
Identity = 151/187 (80.75%), Postives = 172/187 (91.98%), Query Frame = 0

Query: 419 DYELESDD-LACFRGLVLDISYRPVNVVCWKRAICLEFMEKADVLEYYDQTVSSPSGSFY 478
           D  LE+DD L+CFRGLVLDISYRPVNVVCWKRAICLE+M+KADVLEYYDQTVSSP+GSFY
Sbjct: 92  DDGLETDDHLSCFRGLVLDISYRPVNVVCWKRAICLEYMDKADVLEYYDQTVSSPTGSFY 151

Query: 479 IPAVLRVPHLLQVVKRRRIKNSLSRKNILYRDNYTCQYCSSHDSLTIDHVLPISRGGEWT 538
           IPAVLRVPHLLQVVKRRR+KNSLSRKNIL RD+YTCQYCSS ++LTIDHV+P+SRGGEWT
Sbjct: 152 IPAVLRVPHLLQVVKRRRVKNSLSRKNILLRDDYTCQYCSSRENLTIDHVMPVSRGGEWT 211

Query: 539 WENLVAACVKCNSKKGQKTVEEANMKLKKTPKAPKDYDILAIPLTSTAIKMLKLRKGTPA 598
           W+NLVAAC +CNS+KGQKT +EA+MKL K PK PKDYDI+AIPLT+ AI+ML+  KG P 
Sbjct: 212 WQNLVAACSRCNSRKGQKTADEAHMKLLKVPKEPKDYDIVAIPLTNAAIRMLRSNKGMPE 271

Query: 599 EWRQYLS 605
           EWRQYL+
Sbjct: 272 EWRQYLA 278

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
XP_022152374.11.2e-12787.86uncharacterized protein LOC111020122 [Momordica charantia][more]
XP_038905692.12.3e-12686.79uncharacterized protein LOC120091663 [Benincasa hispida][more]
XP_022932702.11.1e-12385.77uncharacterized protein LOC111439170 [Cucurbita moschata] >XP_022932703.1 unchar... [more]
KAG6597719.15.4e-12385.41hypothetical protein SDJN03_10899, partial [Cucurbita argyrosperma subsp. sorori... [more]
XP_008465340.13.6e-11983.63PREDICTED: uncharacterized protein LOC103502982 [Cucumis melo] >KAA0051262.1 HNH... [more]
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
A0A6J1DFU66.0e-12887.86uncharacterized protein LOC111020122 OS=Momordica charantia OX=3673 GN=LOC111020... [more]
A0A6J1F2H95.2e-12485.77uncharacterized protein LOC111439170 OS=Cucurbita moschata OX=3662 GN=LOC1114391... [more]
A0A6J1IAG45.2e-12485.77uncharacterized protein LOC111470725 OS=Cucurbita maxima OX=3661 GN=LOC111470725... [more]
A0A5D3E2H21.7e-11983.63HNH endonuclease OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold734G002... [more]
A0A1S3CNK01.7e-11983.63uncharacterized protein LOC103502982 OS=Cucumis melo OX=3656 GN=LOC103502982 PE=... [more]
Match NameE-valueIdentityDescription
AT2G23840.11.3e-8780.75HNH endonuclease [more]
InterPro
Analysis Name: InterPro Annotations of Monk fruit (Qingpiguo) v1
Date Performed: 2022-08-01
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR003615HNH nucleaseSMARTSM00507HNH_5coord: 500..550
e-value: 3.4E-14
score: 63.1
IPR003615HNH nucleaseCDDcd00085HNHccoord: 502..553
e-value: 5.96037E-12
score: 59.0223
IPR029471HNH endonuclease 5PFAMPF14279HNH_5coord: 513..564
e-value: 7.3E-15
score: 54.6
NoneNo IPR availableGENE3D1.10.30.50coord: 488..577
e-value: 2.3E-23
score: 83.8
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 50..81
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 278..294
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 278..300
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 13..34
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1..81
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 35..49
NoneNo IPR availablePANTHERPTHR33877:SF2SLL1193 PROTEINcoord: 387..605
NoneNo IPR availablePANTHERPTHR33877SLL1193 PROTEINcoord: 387..605

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Sgr018104.1Sgr018104.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0090305 nucleic acid phosphodiester bond hydrolysis
molecular_function GO:0004519 endonuclease activity