Sequences
The following sequences are available for this feature:
Gene sequence (with intron)
Legend: exonfive_prime_UTRCDSpolypeptidethree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
AAAAAATTTAAGCTCATTCGTGATTATCTTACAAAACACCTCTTTAGGCGGTGCTCTTCGTCTTCCATAGAATGTGACAAACAAGAAAAGTTGAAACCGACTGAAAATACTCTCACACTCCCACTCTCCGATTCTCTCCTTCTTTTCCCATTTTCACACTCATATCAAAAACTCTGGGAGCGAAGAAATGGAGGAATTTTCTTTGGATGATCCGTCTCAGCTACTCGAAGCAGCTGCAAACTTCGCAAATTATCCCGGTTAATCATCTGTTACATATATTCACCTTCCAATTCTACGTATTCTACTGAAAATGCACCAGAATCTGACTTTCTTAAGTATTTCCCCTTTGCGAAGGTGTTCGGACTGATGCGTCGGTTAAGGAATTTCTCGACCGCTTCCCCCTTCCCGTCATCATCAAGTATTATTTACGATTTCAAAATCGAACCATCTCTTATTTGATCAATTGTTTTTTGCTGTTATGTGTATTATGATTGCTCTTTTGGTTCTTCATTTCTGCCAGTGCTTTACAAACAAAAGCAGAAATTCCTGGTCTAGAGAACACTCTGGTTGCATGTCTTCACAGGATATTCAAAACCAAGTATGGTGCTTCTCTCATACCTCATTATATGGTATGAACACTTCCCTTGTACTTTTGGCTCATGTTTAGGACGTGCTTAGTTTTCTGATACTGTAGAGGGTGCCATGATGGAGGTTTTGTCAGGATTTGGTTCTTTCCGCATTCGTCAGATACTTACGGCTCAGTTGAATTCAGTGAAAACCCCTGTACTTGTGTTTCAAGTGCTTTAGCATTTCCCTTCTCTTCTTCCTATTCCCCTGTTCTCTTGACTACACGAGTCCACTTCATCCAATCAAAATTAGGACATTGGATGTGTTTTGCTTTGGTCGGTCAGTTGTATTAATTATTTCTGTTCCCCCTTCCCCTGCAGCCTTTTGTACAGGTTGGACTACGGGCAGATTCTCAAACAGTTAGAAGCTTAGCTTGTAAAACGGTCGGTTTCGTTGCCATTATTTAGTTCAACTTCAACTAGTTATCCTTCTTTCTTGTTAACTAGTATTTCCTTTCTTTTTGAACTTCATCTGTTTGTTATCACTGTGCAAGCTATAATCTTTTGTATTCTTAAACTAAGAATTAAATATTTCTTCAGGTCACTCGCCTTTTACAGGAGTCTGATGAAACTGCTCTTTTGGCTATACAACTAATTATTGACTACGGCCTCTATCCACTTTTGCTCGAGTGCCTTCTCAATGGGTAAAAAAAAAGTACCGATGATCGTGGATTAAATTATGAATGATATTGAGTTTTTGCTGGTATTGGAACATATAGTTTTTTCTGCTTCAACCGTTACTTACTTCAAGAGTTTCGAGACTATAAATAGCATTTCTGAATCATTAGAAAAATTGTTGTATTGTGCATGCAATTTACACTTCTCTTGTACATTTGTTATTATTGCAAAACTATTATAATTGAGTTCTATGATTGACGAACCTAGGGATGTAGGATTTGATCTTGACCCCTTCAACTCCCTTCTTTTAGCTTCCTTGTGTTAAGCAGCATTTACCTGATAAAACTCCTAAGCAACAGACATTTAATTAAAGCCATTAACATTGGAGCAAACGACGTTGTTCTTTGCATATTCTACCTTCAGTTTGATAATTCTCCAACAGGGAAGAAAATATCTAAGTTTTTCCAAGTTTACTTAGATTCTGAATCCATGCATTCCATCTGTTAGTTTGCTGTGGAATTAAGCGTGAAGTTGTCCATTTTATCCTTTTTTTTTTTTTTTTTGGTTGTAGTAATGAAGAAGTTGCTAACTCATCAATGGATACAATTAAGACATTGGCTGCATTTCCACAGGGGATGGTAAATATACAATACCAATAGCTGTTATTTTTCTGCTTTATACGGTTAACTTGTCCTATGTTACAATAAATATATTTTTTCCAAAATTGAGTGCAATTTGTTGTTCTGTAGGCGATCATCTTCCCAACAAATAAAACAGAAGCAACCCACCTAGAAACTGTAGCTTCAACATGTTCATCTCTGGTATTGTAGCGGGTACTATGACTTTGAGATATTTTATTTTTATTTGGGCGGCACTTAATACTTGCTGAATATTGTTTTTAAGAAAAATTCCTTCAATCATGTCCTCTTATGATAGAGTATATGTTTATTCGTTGTTTCTTTTTAGCATCATTACTTAAAAGAGTCCCCTTTCTTGCAGTTTACTTGCTAGTAATTTGTGCTTATTGAAATTAAAATTTCTCAGGGCAGAGTTCGAGTCATGGCTTTGGTAGTGAAACTATTTTCAGTTTCTAGCTCTGTGGCATCGGCAGTATACAATGCAAATTTACTAAGCCTACTGGAAAGTGAAATCAGCAATTCAAATGATACACTTGTAACTTTAAGTGTGTTGGAACTCTTGTATGAGGTTTATTGTCTCTTTCTCCCTGACCTCTTGTTTATGAACATGGTGATGCTATAAATTATGTTATCCCTTTAGCCTTTTCCAATGTCAGTAAACTTGCACAAGATGGGTTATTGTGATCTCAGTTACAAGAGTCGTAACATGAGTAGGAAATAGACATGATTTCAATACAATGGTCATGGCTGAAACGAGCTGCCTCTGACATCCTGTTTCAAATTCAGAAGTAAGATGGTAGTTGCTTAGTGGGTTAATCATGCAAGAAAAGTCATTATTCTTGACCACTGTAGATTGCGTTAATGAAGCTGTAAGGACAATTTGACACAAACCAGTATGGCCTTGGTTGGCCATTATAGAAATATAAATGTACATTTATTGGTGCTATTGGCAAAATAATGCAAAAAGAAATCGCTAAGAATGTTATTAGAATAAACGTTAGGATTAATGTTACTATATTAGGGTTATTGGACATTTAAAAAAGGAATTTGCTAGCAGAATGGTTATAATCAATGGAGGTGGGAAGGGCTTTTGTGTCATGCGTATTGTGGAAATGGTCTTGCAAGACAACTAAGCCTCTCAAATGCTGAGTACCTTCATAATGTTTATCTCGACATTTGAATAATTTTTAGATGCTAACTTCTTCATTTCTGATCTCAAGATTGGGTTTCTATTAGAATTATGGCCGGGATTCATTTTGACTCAAGCATGCATCATCATCATGAGTTATGTCATGCCTCTTACATTCTTCCTTGGTCTTACCATTCCCATCTTTGAAATTTTCATTTTGATATATTTGATTTTCCTTTTTAGTCAATTTATAATGTAACTTGTAACATATGTTCATTATATTTCCAATTGATGAAGCTAGTGGAGGTTGAACATGGTACAAAGTTCTTGCCAAGGACCAGCTTTCTCCAACTTCTAAGCTCTATAATCAGGTTTTTAATGAAAGAATTATGAACTTCAGTTATACAAGCAAATTGGCTTCGTAACTTTTTGTTGTTTATTGCAGCAACTCATCAGCAGAGTCTATTGTACGATCAAGAGCCATGGTCATTAGTGGAAGACTTTTGTCTAAAGAGAACATTTGCTCACTTGTAGATGAATCATGTAAGAAATAAGTTGACCTTCTGGACATTTCATTTACCTGCAAGTCTGCAACACTACATCATTTGATTTGAAGTTTTTTGAGAACTCTAATTCTAAAAAGGTGTGGATTAGATAAGCTAGCCAAAATGTCAATTTTCACATAGCAAACCCCTTTCATCGGCCCATGGACCTGTGGTTACCCATTTAAGCATCATTGATATAAAATCTACTGTAGATCATGAAGATCACATTCTACTTATTAACTTTGTGGAAGGAATTAGGAAGCATGGACACTTAGTTTAAGATAGAGCTTCTGTGTCGAACATAGTATCCATTCATCTGACATGCTAAATATGTGTGTAATATTTAATAATATGGGGGAAAAAACAGAGTCCAACCTAAAAAGTTCTTATAAAAGAAGAGAGATTCTGTAACAATGTCTAATCCTGATTATGTTTTGATCAGATAGAGCTTCTTGTCGAACATAGCATCCATTCATCTGGACATGTCTGACATGCTAAATATGTGTGTAATATTTAATAATATGGGGGAAAAAATGGAGTCCAACCTAAAAAGTTCTTTTAAAAGAAGAGAGATTCTGTAACATTGTCTAATCCTTATTATGTTTTGATCATGCCTATAGTTTAGGAATATATATTCTTCCTCTAGCCACAGCCAACCAAATTCTTCATCAAGTTCTTCAAATAATGTTAATTGATTTGATTATGTATCTTTATGCTGGAGTATATATATATATTTTATGTAAAATTTACATGTTTTTATCTTTGATGAAGTATTAAATATATCAATCTATAGACATATATTCTATAAGAAAAAGGATCGACAACGTGTGTGTGTGTTAGTGCTCCTTTGAGAAGGAATTGCGTGCCTTATATGTTCTCAATTTAAATTTGGCATAAACATCATTCAGGTAAAAAATTACAAAGTTTTTGCAAGGCTGGAGAAATTGCATAAACAATGTCCAACCTAGGTTATGAGTTGAATCACTTCATTTCACAAGTAAATTTTTTTTAGAATGAGAACCTTTCACTGGTTATTTTCTTGTTCTAATCCAAAAATATGAAGATCACTTGAGATCTTAGCACATCTAATTGATTGCATTGAAAACAGTTGACAATAATCTATAATCATATCATGCAGGTGATCCTATTGCCTAATTATCAGTCTTCTAAATCTGCAAGTTTTTTATGATCAGTCGCACCAAGCAATATTCTGATAGTTTCTTGTTTTGCATTTATATTCTCATTTCTCAGGTGTACGGAATTTGATATCTGCTATAGATGGAATTCTTGGGTCATCTGAAGGACAAGATGTAAACGAATGCGAAGCTGCATTTGAAGCACTGGGTCAAATTGGGTCAAGTAAGCAGCCATTGTCACTTGGAATCTAAGATTTGTTTATTTAATATGAGCAACTTATAATATTCTGTTTAACCCTATCTCCTTTGAAGAAAGAGAGCGTACAACTGAAGTTGCAATGTTATGCACTTCCAAATGGATGAAGACTAGTTATCCAGGGAAAATAAACCTAGAACTCTTTAGAACATGTTAAATATTATCTTGCTTTTAGTTTCTTTTCTTCTTCATCCTTACCGGCAAATTATGAACTTGAAAGCTAGTATATACCCACAAAAATAAGTATTGGATGCTTAGAAACTATTGGCAGTGATGAAAAATATCAAATGGGATCAGGTTTTAATTGTTAGAAAGAGAGTGTACGGTCTTCCTTTAAAAGTCTTAAGCTAAGAGGGTTCCATACTCGTGACAATATTCAAGGTAGAAAATCTAACATCCTCCTTTCCCCTAATTGGTGCCGTCTGTATAATAGGACAGAGGGTTGTGGACCATTTGTTCTTTTTGTGCCCTTTGAATCAAGCTCCTGATTATTATTATTATTATACGACCTTACTTGAACAAGATCTGTTCTATAGGTTGTACAACTGTGTCCTTGAGTTCTAAAGATTATTTCAACAACTTTCTTCCTTTATTTTTGTGGGGTCATCTCCAAAGAAGTAAGGCTAAAATCCTCGAAACTGTGTGACCTCCATCTGAAAATTTTGCATGTGAACCTTGACTTTTAATATGGAAAATACTTGGCATTTAATTCCTCCTGGTCATCACTTTTTTATGGATACAGAAAAATATCACAACTTTTTATGCAAACAGGAATAGTTATTCTTTTTGTTAATGAGGACTTTGGCATAAGTGCAAATTGATATATCCTTGACCATGCTAGCCTCCCTAAACATTCTAAGCAACCTTTTGGTTTGTGAAACTAAGGTGTTTTTCATCATCCTGACATTTTATTTTCATCTTTACAAACATTTCATCCCCTAGAAGCCAACATTTACCGATTCAATTGCTGTCTCTCAGGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCAACTTGTGTGGAGCTTGTAATTTATGCAGCTTTTGATCGGCATGAGCACAGCAAACAGTTGGTATGTATGTTAAACCTTTTGGTTTATATTTATGTTTAATCTTTTTTTGCGCCCACTTTGATTAAACCATTAGGTAAGGTAGGTATACGGTAAAAGAACTAGATGTTCCTTCCAGCAAGCATTGTAAATGATTGAATTTGAACAAGCCCTTGAAACTAAATGTTTTAGGACGAGAAAATTCTATGCTAAAGTTCTTTCAAGGCTTATTAGCGGAAGCGTAGAGTGAGATAATGATTTCAACAAGGTTTAAGGTAGAACAGTAATATTTTCCCTACAATGCTATGATATTAACAACAGATATGAAAATCAAAATAATTTTTTGAATTGTAAAGTTGTAAAATTTTGGTATTCACTCCTGCTTTTGTTAAATTATTTATCAAAATCATTTTTTAATAAGAAAACCTGCTTTCATTGAGAGAAACGACTTATTTCATTTTTTATCTTTGTGTAAAGCATTGTTTTGACTTGGAAAGTAAGATGTTTATGGAAAGAGTGCAAACTGAAATATGTGATTGTCAACCATATACTTAAAGCAAGGCTAGTATCTAATCATATATATTTTATGTACATACCTTATTCACTTATATTTTCAACTGTCATTACAGGCAGCCATGCATGCTCTTGGTAATATCTTTGGAGAAACTCGATCTGAGAATGATATTGTACTAAATGATAATGCCGAAGAAAATTTGCGGGATTTGATATATCAAATTGCATCCAAAAGTCCAAAAATGATGCCCTCGGTGAGTGAAGGGTTTAGGGTTTATTCTTTTGATAATAGTTTCCTGCTTTGTTATGTTTTCTATCTGAAGTAAATTGGAATTTGATATATACTCTGCTTTTGTTGCAGAATTTATGTCACTCCAATTCAAACTAATCCTTCTGCACTTATGAAACAAGATTGGGCATTCCTCTTTTTCATTACATGTTAGGAACTTAGGATTGAAAGAAAATGCTTAAGCTGATAGTAATGGAGTTAAGTTCATATATCAAAACATATAGGTCAACAGGCTTCAAGATGTATCGGATTGTTGAGATTAGAGCTGCTGTGTTAATGCTCATGAAATTAATTTGATTGCCAATATAAATGGTGTTGATGCTTCATACCTTACTTGGTTACTGCTGTCGTAAAAGTCTGTTAGAGGATGTTTTCCATGTCCTTTTGGAGTATCTGGAGTGAATAATATTTTCTTATTCAAGATTGCTTCAACTGAAGAAATTGATCTATTTTCACTTATTTGAGCTTCAGTAAGCTACAATTTGACGTTGCCCTTCATTTCTTACGTGATTATAGTTTCTTCAAGTTTTAATGAGCTGCTGTCTGTGGCAGGGTCTTTTTCTAGCTGTCCTCCAACAGGACTCTGAGATTCGCTTGGCGGTGAGTATTTCCGCAATAGTTGCTTCCAACACTTCTTACCTGGCATGAATATTTCTGTAATTGTTGCTGTTAGGAATCCAATTGCAATTTAATAATTCTATTCCCAACAGATCAATTCCCAGAGAAAAAGCAAGCTCTGATTATATTATTTATATACCACTGAGAAATTACAACTATCAAATGAAAGATAAAAGAAAGATAGTACCAGCACTTTGTAGAGGGCTGGAAATCCTCTCCCCACAAGGCAAGCTTGATTTCTCACCCAAATGATCATATCCCTCCTTCACTATCCTAACCCCTACTTAAACCTCACAGCCTCCCGATGGTCCCCACCCAAGTACACATTCCCTCCATAACTATAACGCTCTGTACAATTCCTTTCTTACCCCTACATTTATATGCATGTATGATTAGGGACCTCACATTTGCTTCCAACACTCCTTACCTGGCCTTAAAAGGAGCTTGTTATTGGTTTTCTATTAAAAAAAATCCCAAAAGATTAAAATAGATGATGCTGGACATAAATTCAAGGACCCTTGGATTTAAGAGGACATGAACTACAAATTCATTTAGATTATGTTGGGTACACGTAAGCCTTTCTTACAAACAAAATATCCTTGGGTTAGACCATCCAATGAAAATAGATGGTTCTTGCAATTTACATGATAATTTATTGTCCTTTTTCATTATTGTGGAAGGAGTGCCTTGCTCTTTTTTATGGAAATTGGCATGGAGACATTTTTCAACAAATATGAACTCAAATGCTAAAAACATGGACATGAATGCTTATAAATGGGTGCATGTATAAACATTTCGATGTAGGTACGCGGGCTGTGTATTCCCTCATGTAAACTAGACATGGCAAAACATTTTGATGTTCAGAGAATAAATATCTCATCTGGAAGTGCACCCTATGAATTTGCTTCTAAGTGGGTCTTCCTTAATCTAGACAATACTCTTGCTTGGTTTGTTAGTTTAGGAATCTCAATTTCCAGCAAGTAGGCTGCTTAGTAATGGGTTTGGTCTCATCCTGGACTGAAACTATGTAATTTCTAACTTCCTATGAATCTAAATTTATGACTTAATTTTTTTTTTCAGAGTTACAGAATGATAACTGGGTTGGTCGCTCGACCTTGGTGCCTAATGGAAATCTGCTCAAAACAAGACATAATAAATATAGTTACTGATGCAAGTACTGAGACTACTAAAATAGGTATATGTGCTTGCTTTGCCTTGCATCCGAGTTTTGAGGTTAAGCTAATATTAATCACATGGTTTATTTATTTTCTTCTTTATTTAGGAATGGAAGCTAGATATAAGTGTTGTTTGGCTTTCCATAAGGCCTTCATGTCTTCAACTAGGCTTACTGGCGATCCTGCTCTTGCTGGAATAGCTTCAAAGGTTAGATATGGATGCAAATACTTATGTGCATAAGCATTTCATATTTTTCTTCAACTTTTCCAGGCAGTTAATTCTATTAGTACCCATAAAAGTGGAAAGGCTCCGTCTTTTGGATCATACTCTGATTGTTTTCTGAGAAAGAAAGGTCTAATTGATATATTCATATGCCTAAGCAAAGAATATATATATATATATATATATATATATATTTTAATATCCGTAAGTGTCTAGGCTAGTTTATGTGTACTTTGACTAATCTCACATGACAACCCGCCTAACCTTACAACATTTGGGTGTTAAGAAACCCGTAGGATATTAAATCTTAGATAGGTGGCCAGGGATACCTATGACCCCTTAGTCCTTTGGCCTTTTTTTGATGCTCTCACCACCACTAGGCTAACCCATGATGGTTGCCTATGCAAGAATATCTTCAAACAAGAAGACAAAAAAAAGAAAGTAAAAACCAAACTAACAAGAAGACAAAAAAAAGAAAGTAAAAACCAAACTAGGAGCTTGGAAAAGCTAAAAAGACCTTCCTATGGCTGGCATATTTGGAAGTGATTTTAGTAGTAGTGAGAATAATGTTTACCAGCAATATTCAAGTACTCGTTTTAACATTTAGTTCTATATTGAATTGACTAAATGTATGTTTTGGAGTGTTGTTCCATAACCCTTCAAAATCACTTCGAAGCCAAATTTTGTGTAAATTTGAACTTTTGGGTGGTTATGCTCAGGCTAATGCTTAGAATGGTTTGTCTGCAGCTGCAGGAAGCTTTTAGAAATGGTCCATATCTTAATAGAAGGAATCTTGAAACTCAACCAGCAATAATGACAGCTGAGAGATTTTAAGAGTACACTATGGTTCAAAAGGCAAGCCTTATATACAGTGGTTTGTAGGTTGTTACATCTTTTGTTTCTAACTTTCTAGTTGAAAATCATCACTTGGGGAGTTCACAGTAATATTTGAAAATAGATTTTTTAGTATTTTCCATGGATTGTGTGTAGTAATATTTCTCTATCTCTTTGGATATATGTTTGTGAATGGATTGATGTGTTTATTAAATTTGCTCGGGACAGCGA
mRNA sequence
AAAAAATTTAAGCTCATTCGTGATTATCTTACAAAACACCTCTTTAGGCGGTGCTCTTCGTCTTCCATAGAATGTGACAAACAAGAAAAGTTGAAACCGACTGAAAATACTCTCACACTCCCACTCTCCGATTCTCTCCTTCTTTTCCCATTTTCACACTCATATCAAAAACTCTGGGAGCGAAGAAATGGAGGAATTTTCTTTGGATGATCCGTCTCAGCTACTCGAAGCAGCTGCAAACTTCGCAAATTATCCCGGTGTTCGGACTGATGCGTCGGTTAAGGAATTTCTCGACCGCTTCCCCCTTCCCGTCATCATCAATGCTTTACAAACAAAAGCAGAAATTCCTGGTCTAGAGAACACTCTGGTTGCATGTCTTCACAGGATATTCAAAACCAAGTATGGTGCTTCTCTCATACCTCATTATATGCCTTTTGTACAGGTTGGACTACGGGCAGATTCTCAAACAGTTAGAAGCTTAGCTTGTAAAACGGTCACTCGCCTTTTACAGGAGTCTGATGAAACTGCTCTTTTGGCTATACAACTAATTATTGACTACGGCCTCTATCCACTTTTGCTCGAGTGCCTTCTCAATGGTAATGAAGAAGTTGCTAACTCATCAATGGATACAATTAAGACATTGGCTGCATTTCCACAGGGGATGGCGATCATCTTCCCAACAAATAAAACAGAAGCAACCCACCTAGAAACTGTAGCTTCAACATGTTCATCTCTGGGCAGAGTTCGAGTCATGGCTTTGGTAGTGAAACTATTTTCAGTTTCTAGCTCTGTGGCATCGGCAGTATACAATGCAAATTTACTAAGCCTACTGGAAAGTGAAATCAGCAATTCAAATGATACACTTGTAACTTTAAGTGTGTTGGAACTCTTGTATGAGGTTTATTGTCTCTTTCTCCCTGACCTCTTGTTTATGAACATGCTAGTGGAGGTTGAACATGGTACAAAGTTCTTGCCAAGGACCAGCTTTCTCCAACTTCTAAGCTCTATAATCAGCAACTCATCAGCAGAGTCTATTGTACGATCAAGAGCCATGGTCATTAGTGGAAGACTTTTGTCTAAAGAGAACATTTGCTCACTTGTAGATGAATCATGTGTACGGAATTTGATATCTGCTATAGATGGAATTCTTGGGTCATCTGAAGGACAAGATGTAAACGAATGCGAAGCTGCATTTGAAGCACTGGGTCAAATTGGGTCAAGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCAACTTGTGTGGAGCTTGTAATTTATGCAGCTTTTGATCGGCATGAGCACAGCAAACAGTTGGCAGCCATGCATGCTCTTGGTAATATCTTTGGAGAAACTCGATCTGAGAATGATATTGTACTAAATGATAATGCCGAAGAAAATTTGCGGGATTTGATATATCAAATTGCATCCAAAAGTCCAAAAATGATGCCCTCGGGTCTTTTTCTAGCTGTCCTCCAACAGGACTCTGAGATTCGCTTGGCGAGTTACAGAATGATAACTGGGTTGGTCGCTCGACCTTGGTGCCTAATGGAAATCTGCTCAAAACAAGACATAATAAATATAGTTACTGATGCAAGTACTGAGACTACTAAAATAGGAATGGAAGCTAGATATAAGTGTTGTTTGGCTTTCCATAAGGCCTTCATGTCTTCAACTAGGCTTACTGGCGATCCTGCTCTTGCTGGAATAGCTTCAAAGCTGCAGGAAGCTTTTAGAAATGGTCCATATCTTAATAGAAGGAATCTTGAAACTCAACCAGCAATAATGACAGCTGAGAGATTTTAAGAGTACACTATGGTTCAAAAGGCAAGCCTTATATACAGTGGTTTGTAGGTTGTTACATCTTTTGTTTCTAACTTTCTAGTTGAAAATCATCACTTGGGGAGTTCACAGTAATATTTGAAAATAGATTTTTTAGTATTTTCCATGGATTGTGTGTAGTAATATTTCTCTATCTCTTTGGATATATGTTTGTGAATGGATTGATGTGTTTATTAAATTTGCTCGGGACAGCGA
Coding sequence (CDS)
ATGGAGGAATTTTCTTTGGATGATCCGTCTCAGCTACTCGAAGCAGCTGCAAACTTCGCAAATTATCCCGGTGTTCGGACTGATGCGTCGGTTAAGGAATTTCTCGACCGCTTCCCCCTTCCCGTCATCATCAATGCTTTACAAACAAAAGCAGAAATTCCTGGTCTAGAGAACACTCTGGTTGCATGTCTTCACAGGATATTCAAAACCAAGTATGGTGCTTCTCTCATACCTCATTATATGCCTTTTGTACAGGTTGGACTACGGGCAGATTCTCAAACAGTTAGAAGCTTAGCTTGTAAAACGGTCACTCGCCTTTTACAGGAGTCTGATGAAACTGCTCTTTTGGCTATACAACTAATTATTGACTACGGCCTCTATCCACTTTTGCTCGAGTGCCTTCTCAATGGTAATGAAGAAGTTGCTAACTCATCAATGGATACAATTAAGACATTGGCTGCATTTCCACAGGGGATGGCGATCATCTTCCCAACAAATAAAACAGAAGCAACCCACCTAGAAACTGTAGCTTCAACATGTTCATCTCTGGGCAGAGTTCGAGTCATGGCTTTGGTAGTGAAACTATTTTCAGTTTCTAGCTCTGTGGCATCGGCAGTATACAATGCAAATTTACTAAGCCTACTGGAAAGTGAAATCAGCAATTCAAATGATACACTTGTAACTTTAAGTGTGTTGGAACTCTTGTATGAGGTTTATTGTCTCTTTCTCCCTGACCTCTTGTTTATGAACATGCTAGTGGAGGTTGAACATGGTACAAAGTTCTTGCCAAGGACCAGCTTTCTCCAACTTCTAAGCTCTATAATCAGCAACTCATCAGCAGAGTCTATTGTACGATCAAGAGCCATGGTCATTAGTGGAAGACTTTTGTCTAAAGAGAACATTTGCTCACTTGTAGATGAATCATGTGTACGGAATTTGATATCTGCTATAGATGGAATTCTTGGGTCATCTGAAGGACAAGATGTAAACGAATGCGAAGCTGCATTTGAAGCACTGGGTCAAATTGGGTCAAGCAAATGGGGAGCCACTTTACTGCTGTCAAGTTTTCCAACTTGTGTGGAGCTTGTAATTTATGCAGCTTTTGATCGGCATGAGCACAGCAAACAGTTGGCAGCCATGCATGCTCTTGGTAATATCTTTGGAGAAACTCGATCTGAGAATGATATTGTACTAAATGATAATGCCGAAGAAAATTTGCGGGATTTGATATATCAAATTGCATCCAAAAGTCCAAAAATGATGCCCTCGGGTCTTTTTCTAGCTGTCCTCCAACAGGACTCTGAGATTCGCTTGGCGAGTTACAGAATGATAACTGGGTTGGTCGCTCGACCTTGGTGCCTAATGGAAATCTGCTCAAAACAAGACATAATAAATATAGTTACTGATGCAAGTACTGAGACTACTAAAATAGGAATGGAAGCTAGATATAAGTGTTGTTTGGCTTTCCATAAGGCCTTCATGTCTTCAACTAGGCTTACTGGCGATCCTGCTCTTGCTGGAATAGCTTCAAAGCTGCAGGAAGCTTTTAGAAATGGTCCATATCTTAATAGAAGGAATCTTGAAACTCAACCAGCAATAATGACAGCTGAGAGATTTTAA
Protein sequence
MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTLVACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQLIIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTCSSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYCLFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKENICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCVELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKMMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGMEARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF
Homology
BLAST of Cla97C11G223840 vs. NCBI nr
Match:
XP_038898234.1 (uncharacterized protein LOC120085959 isoform X1 [Benincasa hispida])
HSP 1 Score: 922.9 bits (2384), Expect = 1.2e-264
Identity = 485/539 (89.98%), Postives = 504/539 (93.51%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEFS+DDP++LLEAAA+FANYPGVRTDASVKEFLDRFPLP IINALQTKAEIP LENTL
Sbjct: 1 MEEFSVDDPTRLLEAAADFANYPGVRTDASVKEFLDRFPLPAIINALQTKAEIPRLENTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGLRADSQ VRSLACKTVTRLLQESDET LLAIQL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLRADSQIVRSLACKTVTRLLQESDETTLLAIQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
IIDYG+YPLLL+CL+NGNE+VANSSMD IKTLAAFP GM IIFPTNKTEATHL TVASTC
Sbjct: 121 IIDYGIYPLLLKCLVNGNEQVANSSMDAIKTLAAFPHGMEIIFPTNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMALVVKLFSVSSSVASAVYNANLL LLESEI+NSNDTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLGLLESEINNSNDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGTKFLPRTSF+ LLSSIISNSSAESI+RSRAMVI GRLLSK+N
Sbjct: 241 -----------LVEIEHGTKFLPRTSFILLLSSIISNSSAESILRSRAMVICGRLLSKDN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVRNLISAIDGILGSSEGQDVN CEAAFEALGQIGSS WGATLLLSSFPTCV
Sbjct: 301 IFSLVDESCVRNLISAIDGILGSSEGQDVNVCEAAFEALGQIGSSMWGATLLLSSFPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ VIYAAFDRHEH KQLAAMHALGNIFGETRSEND++LNDNAEENLRDLIYQIAS+S KM
Sbjct: 361 KHVIYAAFDRHEHGKQLAAMHALGNIFGETRSENDVMLNDNAEENLRDLIYQIASRSSKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
MPSGLFLAVLQQDSEIRLASYRM+TGLVARPWCLMEICSKQDIINIV+DASTETTKIGME
Sbjct: 421 MPSGLFLAVLQQDSEIRLASYRMMTGLVARPWCLMEICSKQDIINIVSDASTETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCLA HKAFMSSTRLTGDPALAGIASKLQEA RNGPYLNRRNLETQPAIMTAERF
Sbjct: 481 ARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVRNGPYLNRRNLETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. NCBI nr
Match:
KAG7037420.1 (26S proteasome non-ATPase regulatory subunit 5 [Cucurbita argyrosperma subsp. argyrosperma])
HSP 1 Score: 906.0 bits (2340), Expect = 1.6e-259
Identity = 475/548 (86.68%), Postives = 503/548 (91.79%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEF++DDP+QLLEAAA+FANYPGVRTDASVKEF RFPLPV+INALQ KAEIPGLENTL
Sbjct: 1 MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFFSRFPLPVVINALQAKAEIPGLENTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+A+SQ VRSLACKTVTRLL+E+D T LA QL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQANSQAVRSLACKTVTRLLEETDPTTQLAPQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
I+DY +YPLL+ECLLNGNE+VANSSMD IK LAAFP+GM IIFPTNKTEATHL TVASTC
Sbjct: 121 IVDYNIYPLLIECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMAL+VKLFSVSSSVASAVYN+NLL+LLESEISNSNDTLVTLSVLELLYEVY
Sbjct: 181 SSLGRVRVMALIVKLFSVSSSVASAVYNSNLLNLLESEISNSNDTLVTLSVLELLYEVYY 240
Query: 241 LFLPDLLFMNM---------LVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVI 300
L LPD LF +M LVE+EHGT FLPRTSFLQLLSSIISN SAESI+RSRAMVI
Sbjct: 241 LLLPDFLFTSMCIPRLFLLLLVEIEHGTNFLPRTSFLQLLSSIISNRSAESILRSRAMVI 300
Query: 301 SGRLLSKENICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATL 360
SGRLLSKENI SLVDESCVR LISAID ILGSSEGQDVN CE+AFEALGQIGSSKWGATL
Sbjct: 301 SGRLLSKENIFSLVDESCVRILISAIDEILGSSEGQDVNVCESAFEALGQIGSSKWGATL 360
Query: 361 LLSSFPTCVELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIY 420
LLSS+PTCV+ VI AAFDRHEH KQLAAMHALGNIFGETRSENDI+LNDNAEENLRDLIY
Sbjct: 361 LLSSYPTCVKYVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIY 420
Query: 421 QIASKSPKMMPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDAS 480
Q AS+SPKM PSGL LAVLQQDSEIRLASYRMITGLV RPWCLMEICSKQDIINIV+DAS
Sbjct: 421 QTASRSPKMTPSGLILAVLQQDSEIRLASYRMITGLVPRPWCLMEICSKQDIINIVSDAS 480
Query: 481 TETTKIGMEARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQP 540
TETTKIGMEARY CCLA HK FMSSTRLTGDPALAGIASKLQEA +NGPYL+RR LETQP
Sbjct: 481 TETTKIGMEARYNCCLAIHKTFMSSTRLTGDPALAGIASKLQEAVQNGPYLSRRKLETQP 540
BLAST of Cla97C11G223840 vs. NCBI nr
Match:
XP_004146048.1 (uncharacterized protein LOC101213054 [Cucumis sativus] >KGN55104.1 hypothetical protein Csa_011973 [Cucumis sativus])
HSP 1 Score: 899.4 bits (2323), Expect = 1.5e-257
Identity = 473/539 (87.76%), Postives = 498/539 (92.39%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEFS++DP++LL+AAANFANYPGVRTDASVKEFLDRFPLP IINALQTKAE PGLE+TL
Sbjct: 1 MEEFSVNDPTRLLQAAANFANYPGVRTDASVKEFLDRFPLPAIINALQTKAEFPGLEDTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQTVR+LACKTVTRLLQESDETAL IQL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQTVRTLACKTVTRLLQESDETALSPIQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
IIDYG+YPLLL+CLLNGNE+VANSSMD+IKTLAAFPQGM II P+NKTEATHL TVASTC
Sbjct: 121 IIDYGIYPLLLDCLLNGNEQVANSSMDSIKTLAAFPQGMEIIIPSNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEI+NS DTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEINNSKDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGTKFLPRTSFLQLL SIISNSSAESI+RSRAMVI GRLLSKEN
Sbjct: 241 -----------LVEIEHGTKFLPRTSFLQLLGSIISNSSAESILRSRAMVICGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESC+RNLISA+DGILGSSEG+DVN EAA EALGQIGSS WGATLLLSSFPTCV
Sbjct: 301 IFSLVDESCLRNLISAVDGILGSSEGEDVNVSEAAIEALGQIGSSTWGATLLLSSFPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ VIYAAFDRHEH KQLAAMHALGNIFGE RSENDI+LNDNAEENLRDLIYQIAS+S KM
Sbjct: 361 KHVIYAAFDRHEHGKQLAAMHALGNIFGEGRSENDIMLNDNAEENLRDLIYQIASRSSKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQDI+NIV DAS+ETTKIGME
Sbjct: 421 TPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLTEICSKQDIVNIVGDASSETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCLA HKAFMSS RLTGDPALAGIASKLQEA RNGPYLNRRN+ETQPAIMTAERF
Sbjct: 481 ARYNCCLAIHKAFMSSPRLTGDPALAGIASKLQEAVRNGPYLNRRNVETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. NCBI nr
Match:
XP_022940916.1 (uncharacterized protein LOC111446360 [Cucurbita moschata])
HSP 1 Score: 894.0 bits (2309), Expect = 6.2e-256
Identity = 469/539 (87.01%), Postives = 495/539 (91.84%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEF++DDP+QLLEAAA+FANYPGVRTDASVKEF RFPLPV+INALQ KAEIPGLENTL
Sbjct: 1 MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFFSRFPLPVVINALQAKAEIPGLENTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQ VRSLACKTVTRLL+E+D T LA QL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQAVRSLACKTVTRLLEETDPTTQLAPQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
I+DY +YPLL+ECLLNGNE+VANSSMD IK LAAFP+GM IIFPTNKTEATHL TVASTC
Sbjct: 121 IVDYNIYPLLIECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMAL+VKLFSVSSSVASAVYN+NLL+LLESEISNSNDTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALIVKLFSVSSSVASAVYNSNLLNLLESEISNSNDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGT FLPRTSFLQLLSSIISN SAESI+RSRAMVISGRLLSKEN
Sbjct: 241 -----------LVEIEHGTNFLPRTSFLQLLSSIISNRSAESILRSRAMVISGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVR LISAID ILGSSEGQDVN CE+AFEALGQIGSSKWGATLLLSS+PTCV
Sbjct: 301 IFSLVDESCVRILISAIDEILGSSEGQDVNVCESAFEALGQIGSSKWGATLLLSSYPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ VI AAFDRHEH KQLAAMHALGNIFGETRSENDI+LNDNAEENLRDLIYQ AS+SPKM
Sbjct: 361 KYVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQTASRSPKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIV+DASTETTKIGME
Sbjct: 421 TPSGLILAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVSDASTETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCLA HKAFMSSTRLTGDPALAGIASKLQEA +NGPYL+RR LETQPAIMTAERF
Sbjct: 481 ARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVQNGPYLSRRKLETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. NCBI nr
Match:
XP_008463698.1 (PREDICTED: uncharacterized protein LOC103501781 isoform X1 [Cucumis melo])
HSP 1 Score: 893.6 bits (2308), Expect = 8.1e-256
Identity = 469/539 (87.01%), Postives = 496/539 (92.02%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
ME+FS++DP+QLL+AAANFANYPGVRTDASVKEFLDRFPLP IINALQTKAE PG+E+TL
Sbjct: 1 MEDFSVNDPTQLLQAAANFANYPGVRTDASVKEFLDRFPLPAIINALQTKAEFPGVEDTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQTVR+LACKTVTRLLQESDET AIQL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQTVRTLACKTVTRLLQESDETVPSAIQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
IIDYG+YPLLL+CLLNGNE+VANSSMD+IKTLAAFPQGM II P+NKTEATHL VASTC
Sbjct: 121 IIDYGIYPLLLDCLLNGNEQVANSSMDSIKTLAAFPQGMEIIIPSNKTEATHLGIVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEI+NS DTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEINNSKDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGTKFLPRTSFLQLLSSIISNSSAESI+RSRAMVI GRLLSKEN
Sbjct: 241 -----------LVEIEHGTKFLPRTSFLQLLSSIISNSSAESILRSRAMVICGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVRNLISA+DGILGSSEG+DVN EAA EALGQIGSS WGATLLLSSFPTCV
Sbjct: 301 IFSLVDESCVRNLISAVDGILGSSEGEDVNVSEAAIEALGQIGSSTWGATLLLSSFPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ IY AFDRHEH KQLAAMHALGNIFGE+RSENDIVLNDNAEENLRDLIYQIAS+S KM
Sbjct: 361 KHAIYTAFDRHEHGKQLAAMHALGNIFGESRSENDIVLNDNAEENLRDLIYQIASRSSKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQ+I+NIV DAS+ETTKIGME
Sbjct: 421 TPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLTEICSKQEIVNIVCDASSETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCL+ HKAFMSS RLTGDPALAGIASKLQEA RNGPYLNRRN+ETQPAIMTAERF
Sbjct: 481 ARYNCCLSIHKAFMSSPRLTGDPALAGIASKLQEAVRNGPYLNRRNVETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. ExPASy TrEMBL
Match:
A0A0A0L246 (Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_4G629990 PE=4 SV=1)
HSP 1 Score: 899.4 bits (2323), Expect = 7.1e-258
Identity = 473/539 (87.76%), Postives = 498/539 (92.39%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEFS++DP++LL+AAANFANYPGVRTDASVKEFLDRFPLP IINALQTKAE PGLE+TL
Sbjct: 1 MEEFSVNDPTRLLQAAANFANYPGVRTDASVKEFLDRFPLPAIINALQTKAEFPGLEDTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQTVR+LACKTVTRLLQESDETAL IQL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQTVRTLACKTVTRLLQESDETALSPIQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
IIDYG+YPLLL+CLLNGNE+VANSSMD+IKTLAAFPQGM II P+NKTEATHL TVASTC
Sbjct: 121 IIDYGIYPLLLDCLLNGNEQVANSSMDSIKTLAAFPQGMEIIIPSNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEI+NS DTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEINNSKDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGTKFLPRTSFLQLL SIISNSSAESI+RSRAMVI GRLLSKEN
Sbjct: 241 -----------LVEIEHGTKFLPRTSFLQLLGSIISNSSAESILRSRAMVICGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESC+RNLISA+DGILGSSEG+DVN EAA EALGQIGSS WGATLLLSSFPTCV
Sbjct: 301 IFSLVDESCLRNLISAVDGILGSSEGEDVNVSEAAIEALGQIGSSTWGATLLLSSFPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ VIYAAFDRHEH KQLAAMHALGNIFGE RSENDI+LNDNAEENLRDLIYQIAS+S KM
Sbjct: 361 KHVIYAAFDRHEHGKQLAAMHALGNIFGEGRSENDIMLNDNAEENLRDLIYQIASRSSKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQDI+NIV DAS+ETTKIGME
Sbjct: 421 TPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLTEICSKQDIVNIVGDASSETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCLA HKAFMSS RLTGDPALAGIASKLQEA RNGPYLNRRN+ETQPAIMTAERF
Sbjct: 481 ARYNCCLAIHKAFMSSPRLTGDPALAGIASKLQEAVRNGPYLNRRNVETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. ExPASy TrEMBL
Match:
A0A6J1FJQ7 (uncharacterized protein LOC111446360 OS=Cucurbita moschata OX=3662 GN=LOC111446360 PE=4 SV=1)
HSP 1 Score: 894.0 bits (2309), Expect = 3.0e-256
Identity = 469/539 (87.01%), Postives = 495/539 (91.84%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEF++DDP+QLLEAAA+FANYPGVRTDASVKEF RFPLPV+INALQ KAEIPGLENTL
Sbjct: 1 MEEFAVDDPTQLLEAAADFANYPGVRTDASVKEFFSRFPLPVVINALQAKAEIPGLENTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQ VRSLACKTVTRLL+E+D T LA QL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQAVRSLACKTVTRLLEETDPTTQLAPQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
I+DY +YPLL+ECLLNGNE+VANSSMD IK LAAFP+GM IIFPTNKTEATHL TVASTC
Sbjct: 121 IVDYNIYPLLIECLLNGNEQVANSSMDAIKKLAAFPKGMEIIFPTNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMAL+VKLFSVSSSVASAVYN+NLL+LLESEISNSNDTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALIVKLFSVSSSVASAVYNSNLLNLLESEISNSNDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGT FLPRTSFLQLLSSIISN SAESI+RSRAMVISGRLLSKEN
Sbjct: 241 -----------LVEIEHGTNFLPRTSFLQLLSSIISNRSAESILRSRAMVISGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVR LISAID ILGSSEGQDVN CE+AFEALGQIGSSKWGATLLLSS+PTCV
Sbjct: 301 IFSLVDESCVRILISAIDEILGSSEGQDVNVCESAFEALGQIGSSKWGATLLLSSYPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ VI AAFDRHEH KQLAAMHALGNIFGETRSENDI+LNDNAEENLRDLIYQ AS+SPKM
Sbjct: 361 KYVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLRDLIYQTASRSPKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIV+DASTETTKIGME
Sbjct: 421 TPSGLILAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVSDASTETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCLA HKAFMSSTRLTGDPALAGIASKLQEA +NGPYL+RR LETQPAIMTAERF
Sbjct: 481 ARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVQNGPYLSRRKLETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. ExPASy TrEMBL
Match:
A0A1S3CKC0 (uncharacterized protein LOC103501781 isoform X1 OS=Cucumis melo OX=3656 GN=LOC103501781 PE=4 SV=1)
HSP 1 Score: 893.6 bits (2308), Expect = 3.9e-256
Identity = 469/539 (87.01%), Postives = 496/539 (92.02%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
ME+FS++DP+QLL+AAANFANYPGVRTDASVKEFLDRFPLP IINALQTKAE PG+E+TL
Sbjct: 1 MEDFSVNDPTQLLQAAANFANYPGVRTDASVKEFLDRFPLPAIINALQTKAEFPGVEDTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQTVR+LACKTVTRLLQESDET AIQL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQTVRTLACKTVTRLLQESDETVPSAIQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
IIDYG+YPLLL+CLLNGNE+VANSSMD+IKTLAAFPQGM II P+NKTEATHL VASTC
Sbjct: 121 IIDYGIYPLLLDCLLNGNEQVANSSMDSIKTLAAFPQGMEIIIPSNKTEATHLGIVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEI+NS DTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEINNSKDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGTKFLPRTSFLQLLSSIISNSSAESI+RSRAMVI GRLLSKEN
Sbjct: 241 -----------LVEIEHGTKFLPRTSFLQLLSSIISNSSAESILRSRAMVICGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVRNLISA+DGILGSSEG+DVN EAA EALGQIGSS WGATLLLSSFPTCV
Sbjct: 301 IFSLVDESCVRNLISAVDGILGSSEGEDVNVSEAAIEALGQIGSSTWGATLLLSSFPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ IY AFDRHEH KQLAAMHALGNIFGE+RSENDIVLNDNAEENLRDLIYQIAS+S KM
Sbjct: 361 KHAIYTAFDRHEHGKQLAAMHALGNIFGESRSENDIVLNDNAEENLRDLIYQIASRSSKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQ+I+NIV DAS+ETTKIGME
Sbjct: 421 TPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLTEICSKQEIVNIVCDASSETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCL+ HKAFMSS RLTGDPALAGIASKLQEA RNGPYLNRRN+ETQPAIMTAERF
Sbjct: 481 ARYNCCLSIHKAFMSSPRLTGDPALAGIASKLQEAVRNGPYLNRRNVETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. ExPASy TrEMBL
Match:
A0A6J1IVZ7 (uncharacterized protein LOC111480433 OS=Cucurbita maxima OX=3661 GN=LOC111480433 PE=4 SV=1)
HSP 1 Score: 885.9 bits (2288), Expect = 8.2e-254
Identity = 464/539 (86.09%), Postives = 493/539 (91.47%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
MEEF++DDP+QLLEAAA+FANYPGVRTD SVKEF RFPLPV+INALQ KAEIPGLENTL
Sbjct: 1 MEEFAVDDPTQLLEAAADFANYPGVRTDESVKEFFSRFPLPVVINALQAKAEIPGLENTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQ VRSLACKTVTRLL+E+D T LA QL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQAVRSLACKTVTRLLEETDPTTQLAPQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
I+DY +YPLL+ECLLNGNE+VANSSMD +K LAAFP+GM IIFPTNKTEATHL TVASTC
Sbjct: 121 IVDYNIYPLLIECLLNGNEQVANSSMDALKKLAAFPKGMEIIFPTNKTEATHLGTVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMAL+VKLFSVSSSVASAVYN+NLL+LLESEISNSNDTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALIVKLFSVSSSVASAVYNSNLLNLLESEISNSNDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGT FLPRTSFLQLLSSIISN SAESI+RSRAMVISGRLLSKEN
Sbjct: 241 -----------LVEIEHGTNFLPRTSFLQLLSSIISNRSAESILRSRAMVISGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVR LIS+ID ILGSSEGQDVN CE+AFEALGQIGSSKWGATLLLSS+PTCV
Sbjct: 301 IFSLVDESCVRILISSIDEILGSSEGQDVNVCESAFEALGQIGSSKWGATLLLSSYPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ VI AAFDRHEH KQLAAMHALGNIFGETRSENDI+LNDNAEENL DLIYQ AS+SPK+
Sbjct: 361 KYVINAAFDRHEHGKQLAAMHALGNIFGETRSENDIMLNDNAEENLGDLIYQTASRSPKI 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGL LAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIV+DASTETTKIGME
Sbjct: 421 TPSGLILAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVSDASTETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCLA HKAFMSSTRLTGDPALAGIASKLQEA +NGPYL+RR LETQPAIMTAERF
Sbjct: 481 ARYNCCLAIHKAFMSSTRLTGDPALAGIASKLQEAVQNGPYLSRRKLETQPAIMTAERF 525
BLAST of Cla97C11G223840 vs. ExPASy TrEMBL
Match:
A0A5D3DVV9 (Armadillo-like helical OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold384G001610 PE=4 SV=1)
HSP 1 Score: 882.9 bits (2280), Expect = 6.9e-253
Identity = 466/539 (86.46%), Postives = 493/539 (91.47%), Query Frame = 0
Query: 1 MEEFSLDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTL 60
ME+FS++DP+QLL+AAANFANYPGVR DASVKEFLDRFPLP IINALQTKAE PG+E+TL
Sbjct: 1 MEDFSVNDPTQLLQAAANFANYPGVRIDASVKEFLDRFPLPAIINALQTKAEFPGVEDTL 60
Query: 61 VACLHRIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQL 120
VACL RIFKTKYGASLIPHYMPFVQVGL+ADSQTVR+LACKTVTRLLQESDET AIQL
Sbjct: 61 VACLDRIFKTKYGASLIPHYMPFVQVGLQADSQTVRTLACKTVTRLLQESDETVPSAIQL 120
Query: 121 IIDYGLYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTC 180
IIDYG+YPLLL+CLLNGNE+VANSSMD+IKTLAAFPQGM II P+NKTEATHL VASTC
Sbjct: 121 IIDYGIYPLLLDCLLNGNEQVANSSMDSIKTLAAFPQGMEIIIPSNKTEATHLGIVASTC 180
Query: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYC 240
SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEI+NS DTLVTLSVLELLYE
Sbjct: 181 SSLGRVRVMALVVKLFSVSSSVASAVYNANLLSLLESEINNSKDTLVTLSVLELLYE--- 240
Query: 241 LFLPDLLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKEN 300
LVE+EHGTKFLPRTSFLQLLSSIISNSSAESI+RSRAMVI GRLLSKEN
Sbjct: 241 -----------LVEIEHGTKFLPRTSFLQLLSSIISNSSAESILRSRAMVICGRLLSKEN 300
Query: 301 ICSLVDESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCV 360
I SLVDESCVRNLISA+DGILGSSEG+DVN EAA EALGQIGSS WGATLLLSSFPTCV
Sbjct: 301 IFSLVDESCVRNLISAVDGILGSSEGEDVNVSEAAIEALGQIGSSTWGATLLLSSFPTCV 360
Query: 361 ELVIYAAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKM 420
+ IY AFDRHEH KQLAAMHALGNIFGE+RSENDIVLNDNAEENLRDLIYQIAS+S KM
Sbjct: 361 KHAIYTAFDRHEHGKQLAAMHALGNIFGESRSENDIVLNDNAEENLRDLIYQIASRSSKM 420
Query: 421 MPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGME 480
PSGLFLAVLQQDSEIRLASYRMITGLVARPWCL EICSKQ+I+NIV DAS+ETTKIGME
Sbjct: 421 TPSGLFLAVLQQDSEIRLASYRMITGLVARPWCLTEICSKQEIVNIVCDASSETTKIGME 480
Query: 481 ARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
ARY CCL+ HKAFMSS RLTGDPALAGIASK EA RNGPYLNRRN+ETQPAIMTAERF
Sbjct: 481 ARYNCCLSIHKAFMSSPRLTGDPALAGIASK--EAVRNGPYLNRRNVETQPAIMTAERF 523
BLAST of Cla97C11G223840 vs. TAIR 10
Match:
AT3G15180.1 (ARM repeat superfamily protein )
HSP 1 Score: 567.0 bits (1460), Expect = 1.6e-161
Identity = 298/534 (55.81%), Postives = 393/534 (73.60%), Query Frame = 0
Query: 6 LDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTLVACLH 65
++D +QL +AA FA+YPG + + SVKEFLDRFPLPVI NALQT +IPG ENTLV CL
Sbjct: 1 MEDVNQLFDAAFEFAHYPGAQNETSVKEFLDRFPLPVIFNALQTDPDIPGFENTLVTCLE 60
Query: 66 RIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQLIIDYG 125
R+FKTKYGASLIP YMP +QVGL+ADS V+SLACKTV LL++ D + ++QL+++ G
Sbjct: 61 RLFKTKYGASLIPQYMPVLQVGLKADSAVVKSLACKTVLCLLEDCDTNDVSSVQLVVNNG 120
Query: 126 LYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTCSSLGR 185
+YPLLL+ ++N ++EVAN++ +TIK+LA FP M++IFP+ + THL +A+ CSSL R
Sbjct: 121 IYPLLLDYIINSDDEVANAASETIKSLARFPDAMSVIFPSETNDPTHLRNLAARCSSLAR 180
Query: 186 VRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYCLFLPD 245
VRV++L+VKLFS+S VAS V + LL LLE+E+ + DTLV L+VLEL YE
Sbjct: 181 VRVLSLIVKLFSISRLVASEVKKSGLLDLLEAEMKGTKDTLVILNVLELYYE-------- 240
Query: 246 LLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKENICSLV 305
L+EVEH ++F+P+TS +QLL SIIS +S + RAM+ISGRLLSKENI +V
Sbjct: 241 ------LMEVEHSSEFVPQTSLIQLLCSIISGTSTGPYEKLRAMMISGRLLSKENIYKVV 300
Query: 306 DESCVRNLISAIDGILGSSEGQDVNECEAAFEALGQIGSSKWGATLLLSSFPTCVELVIY 365
+E+ V+ LISAIDG L S E D + EAA +ALGQ+GS+ GA L+LS+ P V+
Sbjct: 301 EEASVKALISAIDGSLESVEMNDTDAQEAAIDALGQMGSTTKGADLVLSTSPPAARHVVA 360
Query: 366 AAFDRHEHSKQLAAMHALGNIFGETRSENDIVLNDNAEENLRDLIYQIASKSPKMMPSGL 425
+AFDR+ H KQLAA+HAL NI GETR +++ +++ AEE+LR LIY A++S K+ PSGL
Sbjct: 361 SAFDRNAHGKQLAALHALANIAGETRPKSNRIVDGKAEESLRCLIYDAAAQSTKLTPSGL 420
Query: 426 FLAVLQQDSEIRLASYRMITGLVARPWCLMEICSKQDIINIVTDASTETTKIGMEARYKC 485
FL+VLQQ SEIRLA YR +T LVARPWCL+EI +K++IINIVTDA+TET KI MEARY C
Sbjct: 421 FLSVLQQSSEIRLAGYRTLTALVARPWCLVEILAKEEIINIVTDATTETAKIAMEARYNC 480
Query: 486 CLAFHKAFMSSTRLTGDPALAGIASKLQEAFRNGPYLNRRNLETQPAIMTAERF 540
C A H+AF+ S DP KLQEA R+GPY+++++ +P +MT E F
Sbjct: 481 CKAIHEAFLCS-NFVDDPRRLKTGDKLQEAVRSGPYMSKKHRGARPEVMTGEGF 519
BLAST of Cla97C11G223840 vs. TAIR 10
Match:
AT3G15180.2 (ARM repeat superfamily protein )
HSP 1 Score: 554.3 bits (1427), Expect = 1.1e-157
Identity = 299/566 (52.83%), Postives = 394/566 (69.61%), Query Frame = 0
Query: 6 LDDPSQLLEAAANFANYPGVRTDASVKEFLDRFPLPVIINALQTKAEIPGLENTLVACLH 65
++D +QL +AA FA+YPG + + SVKEFLDRFPLPVI NALQT +IPG ENTLV CL
Sbjct: 1 MEDVNQLFDAAFEFAHYPGAQNETSVKEFLDRFPLPVIFNALQTDPDIPGFENTLVTCLE 60
Query: 66 RIFKTKYGASLIPHYMPFVQVGLRADSQTVRSLACKTVTRLLQESDETALLAIQLIIDYG 125
R+FKTKYGASLIP YMP +QVGL+ADS V+SLACKTV LL++ D + ++QL+++ G
Sbjct: 61 RLFKTKYGASLIPQYMPVLQVGLKADSAVVKSLACKTVLCLLEDCDTNDVSSVQLVVNNG 120
Query: 126 LYPLLLECLLNGNEEVANSSMDTIKTLAAFPQGMAIIFPTNKTEATHLETVASTCSSLGR 185
+YPLLL+ ++N ++EVAN++ +TIK+LA FP M++IFP+ + THL +A+ CSSL R
Sbjct: 121 IYPLLLDYIINSDDEVANAASETIKSLARFPDAMSVIFPSETNDPTHLRNLAARCSSLAR 180
Query: 186 VRVMALVVKLFSVSSSVASAVYNANLLSLLESEISNSNDTLVTLSVLELLYEVYCLFLPD 245
VRV++L+VKLFS+S VAS V + LL LLE+E+ + DTLV L+VLEL YE
Sbjct: 181 VRVLSLIVKLFSISRLVASEVKKSGLLDLLEAEMKGTKDTLVILNVLELYYE-------- 240
Query: 246 LLFMNMLVEVEHGTKFLPRTSFLQLLSSIISNSSAESIVRSRAMVISGRLLSKENICSLV 305
L+EVEH ++F+P+TS +QLL SIIS +S + RAM+ISGRLLSKENI +V
Sbjct: 241 ------LMEVEHSSEFVPQTSLIQLLCSIISGTSTGPYEKLRAMMISGRLLSKENIYKVV 300
Query: 306 DES--------------------------------CVRNLISAIDGILGSSEGQDVNECE 365
+E+ CV+ LISAIDG L S E D + E
Sbjct: 301 EEARPVVPCLKASVCCAHKTSDEVEKLTTNCFVSECVKALISAIDGSLESVEMNDTDAQE 360
Query: 366 AAFEALGQIGSSKWGATLLLSSFPTCVELVIYAAFDRHEHSKQLAAMHALGNIFGETRSE 425
AA +ALGQ+GS+ GA L+LS+ P V+ +AFDR+ H KQLAA+HAL NI GETR +
Sbjct: 361 AAIDALGQMGSTTKGADLVLSTSPPAARHVVASAFDRNAHGKQLAALHALANIAGETRPK 420
Query: 426 NDIVLNDNAEENLRDLIYQIASKSPKMMPSGLFLAVLQQDSEIRLASYRMITGLVARPWC 485
++ +++ AEE+LR LIY A++S K+ PSGLFL+VLQQ SEIRLA YR +T LVARPWC
Sbjct: 421 SNRIVDGKAEESLRCLIYDAAAQSTKLTPSGLFLSVLQQSSEIRLAGYRTLTALVARPWC 480
Query: 486 LMEICSKQDIINIVTDASTETTKIGMEARYKCCLAFHKAFMSSTRLTGDPALAGIASKLQ 540
L+EI +K++IINIVTDA+TET KI MEARY CC A H+AF+ S DP KLQ
Sbjct: 481 LVEILAKEEIINIVTDATTETAKIAMEARYNCCKAIHEAFLCS-NFVDDPRRLKTGDKLQ 540
The following BLAST results are available for this feature:
Match Name | E-value | Identity | Description | |
XP_038898234.1 | 1.2e-264 | 89.98 | uncharacterized protein LOC120085959 isoform X1 [Benincasa hispida] | [more] |
KAG7037420.1 | 1.6e-259 | 86.68 | 26S proteasome non-ATPase regulatory subunit 5 [Cucurbita argyrosperma subsp. ar... | [more] |
XP_004146048.1 | 1.5e-257 | 87.76 | uncharacterized protein LOC101213054 [Cucumis sativus] >KGN55104.1 hypothetical ... | [more] |
XP_022940916.1 | 6.2e-256 | 87.01 | uncharacterized protein LOC111446360 [Cucurbita moschata] | [more] |
XP_008463698.1 | 8.1e-256 | 87.01 | PREDICTED: uncharacterized protein LOC103501781 isoform X1 [Cucumis melo] | [more] |
Match Name | E-value | Identity | Description | |
Match Name | E-value | Identity | Description | |
A0A0A0L246 | 7.1e-258 | 87.76 | Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_4G629990 PE=4 SV=1 | [more] |
A0A6J1FJQ7 | 3.0e-256 | 87.01 | uncharacterized protein LOC111446360 OS=Cucurbita moschata OX=3662 GN=LOC1114463... | [more] |
A0A1S3CKC0 | 3.9e-256 | 87.01 | uncharacterized protein LOC103501781 isoform X1 OS=Cucumis melo OX=3656 GN=LOC10... | [more] |
A0A6J1IVZ7 | 8.2e-254 | 86.09 | uncharacterized protein LOC111480433 OS=Cucurbita maxima OX=3661 GN=LOC111480433... | [more] |
A0A5D3DVV9 | 6.9e-253 | 86.46 | Armadillo-like helical OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold3... | [more] |