Tan0010066.1 (mRNA) Snake gourd v1

Overview
NameTan0010066.1
TypemRNA
OrganismTrichosanthes anguina (Snake gourd v1)
DescriptionUnknown protein
LocationLG11: 55904496 .. 55936248 (+)
Sequence length465
RNA-Seq ExpressionTan0010066.1
SyntenyTan0010066.1
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: exonCDSpolypeptide
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGGGAATCCAACGCGCATCACTTCCTCAAAATTTCAAGGCACAATTGGAGCCGTGTTTGTAGAGGCTTTTGCCTTCTATCTTCGCTCCCTTTTTGGACTGGTTTTTTGTATTGCCAATTGCCCCGTTGTATTTCCCTTAATTTGCTCGGTTGTTTTTAGAGGATGGAAGAGGAAAAGGAGAACACAAAAACGGCTACTATTTACATTGTGTATTGATGTGTTGTAATTTCAAGATATAAACCTAAAGTCTTATTTATAGGAGTGATACAAGATCAAATAAAATCTAATACAATAAATATAATTTAACATCTCCTCTCAAACTCATAATACTTTGTGAGTTTGTTTAAACGTGTAGCCACCTATTTTTGCCCGACTCATTTTTAATTAAATTGTTAGATCATAAATATCTATAATTTTTTTTGCTCACTTTGATTTTTATTTGTTATTTTCTAATTTCACTTTTCTTTTTAAAAAATGGAGAAATCATATTTTTTGGAGAAAAGACAAGTCTTTGATTAAGTGGGTAAGTTTAGTTTTTATTTTGATTGACCAAAATGTTGTTGGTCTTTTTAAGTGTAAGTTCTCTTTTGGCATTGGATTTTCAAATTTCAACAATTGTGGTTTTGGTTTTATACACAAAAAAGTAATGGTTTTGGTCTTTATATACATCTCTTTCTCTTCTTCAAAAGGAACACTCACAAAAAACCCTACTTCTTCTACACTCCCACACATCATTCTCATCCATTCTCAACTCTACAAAACTCCATAGCCAAATACCTTCACAACCATAAAGATGGAGAGTTTTTTTGTAAAAAAAAATACTCCAAAATCCCATAGCACAAAAATAACCCTAGCTTAGTTGGAGGTTGCATTTGGTAGGATTTTGTTCCAAGGATCCACACCTCAAACAACAAGCTAGTTGGTTTGTTCTTGACACCAACTTCTTGATCTTCATTTTTATTTCGAAATGTCCCCGAAAAACAATAGTTGAGTAAGGGTTTTATGAGCTTTTCTTTCATTTTTTGTTGTTCATTACATTTCTTCTTTACTTTTATTACAATGTGAATCCTTGTCTATTTTATTGTTATGTTTTGCTACTAACTTTATCTTTAACTCAATCTCTAAATATCCCTGAAAAACAATAGTTGAGTAAGGGTTTTATGAGTTTTGTTTTTATTTTTGTTATTTATTACATCTCTTTTTACTTTTATTATAATGTGAATCTTTGCCTTTTTTTTTGTTTGCATTAATGTCCAAGATCCTTTGTTATGTTGATTTTACTAACTTTATTTTATGGTTTACTTCCCCTACTTATCTATCATTTTCTTTTTTCCATATTTTTTCTTCTTGGCTCTAGAGTTCATTGCACTAAAAGAGAGAGAGAAAAAGAACAAGAGAAAAAAGAAGCAAAGTGTTGTGAAATTTAAAAAATGGTCATGTTTAGATTAGTTGAGTATGTGTGAATAGAGTTTTGTTTCTAAAAAAACAAAAGTGTTGTTGCCTAGATAGCTTTTGTTTTTCATTTGAGAAAAAAACCAACAAGTTGAAAAAGACAAAAAAGTTGAGAAAAATGATCATAGGAATAATGTGAGGGAGTGAAAAAAAAAAAAGAAATTGAAAAATAAAAAAAATGAAAAAAGTAAATGGCTAATAAAATTTTTGTTTAAAAAGTTTAGTTTTGATTATTTTTTTTGTACATCTACCCATGAGTGCTCTTTTCAAAATTTGTGTATGGTCAAATCATGGATATTTGTCACTAATATTTTTTTTTTCATTTATTTCCTCTTTCTTTCTTTTATTTTTTTTTATTATTGTTATTTTATTTTTATTTTTTCTCTTTCTCCAAAATTTGATTTTTGCATCTATTTATATACTTTATTTGCAAGTCATATATCTTATCTATTTATTTATCATTTTGTTCTTAGTATTTTCACCATGTTGTTAATTTCATGTGATTGTTTTTTTTTTCTTTAAATTTATATTTCTTGTTATAAAAAAATATGCCGACGACGGAATCAAGAAATATTTGGGAGTCCGATTTTCTAGTTTTCTTAGGTGAGGAATTGATTATTTGGATGTCCAAGATCAACTCCAATACGTTTTTTTTTTTAGAAAAATTAATCATATTCGTATATTATGTTTGTTCACTTATTTGCTATGAATAAATTATCATACATGCTCAACTTATCTTGTCATTGCATTTATTTGCTTTGCTTAACTTTGATTTTCTTGATTTTTCTTAGTGATTTCTATTTTTTTTTTACAAACTCTATTCTCATTTTTTGTAATATTATTTCTCAATTTCTTTAAAATTGCCCTTTTTGTTTATAAAAGTTTGTTTTCAAAGCCAAAGTATTTTATTTTCTAAGTTTTAAAACCTTTTTTTAAAATGTGAATTTTCTTTTAAGGTTGTTTTTTCCTAAAAATTCCTACGACGGAATCTAGAAATATTTGGAAATTCGATTTTCTAGAATTCTTGAGGTGAGGGATCATTATCTTTGGGTGTCAGAGATCTTGGTCCCAAGAAAAAATGAATTTAATTAAAACTTTTTTTTAAAAAAAAATATTTTATAAGAGGTTATCCTATGATAGATTTGAGAAATTGTAAAATTTTCTCATATTCTTGAGATGATATTATTTCTAAAATCTTGGAAATAATTTCAATGTAGCCACATTGATGGATTTTCATCCACTTGTTTTATGGGATCATGACTCGAAATATTGGAGTAATGAGGGGTAAAATAAGACATTGTGTTAAAAAATCTTTTTTTTACCTAAATAAGTTTTTTTAAAAAATATTTTTGCAATTCAAGATTAAATTTGGCCACCGTTAAAAACGGGTGTTGTGGGGTGCTAACACCTTCCCCATACACAAACAACTCCCGAACCCAAAATCTGGTTTTCGCATACCATTTTTTTTAAAAAAGTTATTTTATTCTATTTTGGTGCCCAATCACACCATAAAAAAAAAATTGGTGGCGACTCCTTTTAAATATCCCTATTTCGAGGACGTCGACTGCTCCGCGTCGCAGGTACGTGGCGACAAAACGAATGTCGAAGAGGTAACAGGGTGCCAAAGCACAAGCAGATCGAAGCACAAGTAGAGACAGGGTGTCGAATCACAAGTAGAGACAGGGGCACCGTGTCAGCACAAGCGAGACAAGCATGGTGTTGAAGCACAACGGAGAGTCAGGCAGATGATGTCGAAGTTGGCAAGCAGATGATGCCGAAGCATCGCAGGCAAAGTTTCGAAGCACAAGTAGCAGGAAAGGAAGATTCAGATTCAGAGGCCTTGAAGAAAACCACCAATCGAACAAACAAGTGAACTAAGAGACCAATGCGAGAAGGGGAAGGGTTTGAGGTTTCGACAAAGGCAATGGCGACAATGGCTTGAGAGCTCTGATACCATGATGTTCTTAGAGGATGGAGGAGGAAAAGGAGAACACAAAGACGGCTAGGGTTTACATTGTGTATTGATGTGTTGTAATCTCAAGATACAAACCTAAACTCCTATTTATAGGAGTGATACTAGATCAAATAAAATCTAATACAATAAAATATAATTTAACATGCTCTATGAAAGAATGGGGTTTTTTGCCCCTGACAGTCGTGTCTCTATTTTTTTTAGTTAATTTCTACGATTAAAAAAGTTTTATACAGAGGTGAAAATTATGTATTAATGGTTTTAAAATAGCATTCTTATGGAAGGTCTAAATTGATTCATTTGTAAAGTTCAGAGTTTTAAATGATACAACCTCTCAGCTTAGGGGTATATATTGATCTTTTTCCGTTAATGATTATCACCGAATTGTTTGCTTTCCCTTTACGGTACCTTTCCTCACATTACAATATCCCAACCTACACTAACTTACTCTAAACTAACTTGTAAGGCTAATATGTAGTTCTATATTTATCATCTCAAATAACTAATTTGTCTAAGAAACTCTACATTCTATAATTATTAAGAAATAAATTAGATATATTTGTACTTAGTTAATAAGTTGTTGATAAGTGGTTGATAAACGGTTGTATTTTTTGTATATAAATTGGGTCATATCCATGAATAATATACTACTGAGATTTTTCTCTCCATCTTTCTGTTATGGTATCAGAGAAGAAAAAGCTTCCTATCGCATGCACTCTACTCTAATCATGGCCACGACGATTCAGTCTTCAAATGAAGTAGCGTTGAATCCGTATACCTTGCATCACAGTGATACTTCTAATTTGGTTCTTGTCACAGAGCCCTTAACCGATGACAACTACGTTTCATGGAGCAGATCGATGATCCTAGCACTTTCGATTAAGAATAAATTGGGTTTCATCGATGGAACGATTCCACAGCCCACGGGAGAACTTCATCCGCTCTGGATTCGTAACAATCACATGGTCATAGCACGAATACTTAATTCCGTATCGAAGGCGATTTCTTCGAGTGTACTTTTCTCCGATTCGGCACGAGCAATCTGGTTAGACTTGAAAGATCATTTTCAGAGACGCAATGGGCCACGCATTTTTCATCTTAAGCGTGAGTTGGCGACCTTGAAGCAAGATTAAGAATCTGTGACCATGTATTTCTCCAAGATCAAAAGTATATGGGATGAATATGTCACTTACAAGTCGGGGTGTACTTGTGGCCATTGTTCTTGTGGATGAATCAAGAAGATCGAGGATTTCTTTCAATTCGAGTATCTCATGTATTTTCTTATGGGTCTTAGTAGTGATTATGGCCACGCTCGATCGCAGATATTGTTGATGGATGCCCCACCTCCTATGAATAAAGCATTTGCCTTAATCACACAAGAAGAAGAGCAGAAGTCGATCCAGCAGCCCCCTGCTTTTGCTTTAGCAGTAGGAAGTGTTGTAACACCAAGCCAAAATCAGGCGTTGTTAAGCACCCATAGTTCTTCCAACCAAAGTTCAAATCATAATCACAATCATGGCCAAAATCAGAACTATAACCAGCGATCTCGAAATCGCCCAATTTGTACACATTGTGGTTTACAAGGGCATACTGTTGACAAGTGTTACAAGATTCATGGATATCGACCAAGAGGACAACGCTCTAATTCTGCATCAAATAGTCAGGGACAACGAGGGAATTCCAGCACAAATGCTTCCAACCATGTCTCTACTGTCAATGATTCCCAAAGAAGCAACAACCTCGACTCTTTTCAGCAAATTCTCAATATGCTCCAATCCAAGTTAGAGGCTGTTAAGTCAGAAACAGAGAAAACAGAGGCTACTAACTCCTACTTAACAGGTATTTGTCCTAAAACTGGTCTATCATATAGTGTTGATTGGATCATTGACTCTGGTGCATCTACACACATATGTTTTAAATGAGATATGTTTGATTTCATGAAGTCCGTCAATACAACTGTAGTGCTGCCTGATAACACTCGCATACCTGTCTTCCATACTGGTTGTGTAACTTTGTATGGCTCTTTGGTGCTGAAGAAGGTCTTGTTTGTGCCTAAGTTTAAGTATAATCTTCTATCAATCAGTGTTTTAACATCAGACAATGCAACTTCTGTTATTTTCGATGTTGATTGTTGTATAATTCAGGAAAAGTCCACTTTGAAGATGATTGGCAAGGGTAAACTCCAGAATGGCTTATATGTCCTTAAGAATAGTTTGATTGGTGGCATATCTGATGAAGTTCATGTTCAACATGTTCAATGTGATTCCATTTCTCTTTGGCATTCCAGACTAGGACATCCTTCCCTAGATAGGCTCAATGCTTTAAAAGATTTCTTGATGTATAAAACTATACATATGCACTCTCCCTGTGATGTCTGCCCTGTTGCCAAACAAAAACGATTGCCTTTTCATTCCAATAACAATCGTGTAGCTACTTCTTTTGAACTAATACATGCCGATATTTGGGGCCCCTTTGAGACTGTTTCACATGCTGGCCATCGATATTTTCTTACACTTGTTGATGACTATAGTAGATACACTTGGGTTTTCCTTATGAAACAGAAGTCAGATGTTCTTACCATCATTCCTGCCTTTTTTAAACTTGTTGAAACACAGTATGGCAAGACAATTAAGAAGTTTCGGTCTGATAACGCTCCCGAGTTACTTTTTACTCAATTTTTTCAAGAAAAAAGGGTTGTGCATCAGTTTTCATGTGTCGAAATACCTGAACAGAATTCGGTTGTAGAGCGTAAACACCAACATATATTAAATGTAGCCCGTGCACTGTTTTTTCAGTCACGAGTACCTCTTCCATTATGGAGTAAATGTATATTGACTGCTGTGTATCTTATTAATAGAACACCCTCATCCTTATTACATTGGGCCACCCCTTTTGCTCTACTAAATGGTGTTGCTACAGATTATTCGTTTCTAAAGGTTTTTGGATGCTTATGTTTTGCCTCCACCCTCACAACCCACCGCACAAAATTCTCACCCCGAGCCATCCCTGCTGTTTTTCTTGGTTATCTGCCTGGTATGAAGGCCTATAAGCTTCTTGATATTGCCTCTAATCGTATTTTTATCTCTAGGGATGTTGTTTTCCATGAGGCACTATTGCCTTTTCACAAAGTTGTTTCCCCTTCACAAATGCCAAATTTTTTATCCGACCTAGTCCTGCCAAAGCCATACAACGTTGTCATCCCAACCCCTGAGCCTACTACTACTACCAATGCCATCCCACATCGCTTGAGTCTCCTGACCTTATTGATTCTACACCACTTGACTCTTCGTCTTTATCCATCCCTTCTACTTCTCACACGTCAGTGTCCCTTCCACCTGAGTCCCCTGGTCTTGAACCCCGAAGGTCTTCTCGAGTCAGTAAGCCACCTTCTTATCTTCAACACTACCAGTGCAAACTCTTGCTCAATGACCAAACCCCTCACCTGTCCACCCGATACCCTATCCATGACCAATTATCCTATTCTAAATTGTGTGCTGCCTTCCAAACCTTTTCAATGCAAGTATCAACCCACTTTGAGCCTCAGTTTTACCATCAGGTTGTTCCCTTTGCCCATTGACAGGATGCTATGCTAGATGAATTAGGTGCCATGGAAGCAAATAATACTTAGGTTGTCACTACATTGCTAAGGATAAACATACCATTGGTTGTCGATGGGTTTACAAGATTAAACACCGAGTAGATGGATCTATAGAACGTTACAAAGCCCGGTTAGTGGCTAAGGGCTACACCCAACAAGAAGGTCTTGATTTTTTAGAAACCTTCTCTCCAGTAGAAAAACTTGTTACTGTTCGAGTTCTATTAACTATGGCAGTGTCCTATCAATGGCCTCTTATTCAGCTTGACGTGAATAATGCCTTCCTGCATGGAGACTTACTAGAAGAAGTATATATGGATTTGCCTTTGGGTTACAGGGCAAATGCTTCTTCAAGTCATGGGGAGAGGCTTGTGTGCAAGTTGAACAAGTCAATATATGGCTTGAAGCAAGCTTCACGACAATGGTTCTCTAAATTTACAGATGCTATGCTATCTTTGGGGTTTCATCAATCCAAAGATGATTACTCATTGTTTGTACGAGGGCAAGGCGTTGATTTCATTGCCTTACTAGTATATGTAGATGATATTATTGTTACTGGTGCAAACCAAAAAGTTGTTGATCAGTTGAAAACCTTGTTACATAGCAAATTCAAACTCAAAGATCTTGGCAACTTAAAATACTTTCTCGGACTTGAGTTAGCTCGTTCTACTCGAGGCATATATATCTCTCAGCGACATTACACTCTCCAGTTATTGGAAGACACAGGACTTTTAGGTGCCAAGCCGACATCTGTTCCCTTGGACCCTCTGTTTAAGTTGCATATGGACTCTGATTTTTTGGAAGACCCATCTGTCTATAGAAGACTTATTGGAAGACTTATATATCTCACTATATCTCGTCCAAACATCACTTTTGTTGTTAATAAACTTAGCCAGTTTGTTGCTAAGCCTTGTAAGCATCACCTCACGACAACTCATCATCTCTTGCGATTTTTAAAAGCAGCGTCAGGGCAGGGCATCCTCTTACGACCAACTAAGTCTTTTGAATTACGTGCTTTTGCTGACTCAGATTGGGCATCTTGTCTTGACACAAGGCGTTCAACCACTTGATTCGTCATCTTTCTAGGAGATTCCATTGTCTCATGGAAATCTAAAAAGCAGAGTATTATCTCACGTTCTTCAGCAGAGGCAGAATACCGAGCATTAGCTCTTACTGTTTGTGAGTTGGTGTGCCTTTCTTACTTACTCAAAGAACTCCAAATTGACTGCACACAACCTGCCCTTCTGTTTTGCGATAATCAGGCTGTAGTACACATTACCACTAATCCTATTTTCCATGAGCGTACCAAACATATCGAGTTAGATTGTCATTTTGTTTGCGACAAGATCCAAGATAGATTTTTGAAGTTGCTGCCCATCCGGTCTAAACATCAACTAGCTGATGTTTTTACTAAACCACTTCCGTCATCTACTCTATTTCCTTTAGTTTCCAAGTTTGGTGTTTGTAATATCTTTGGCCCAACTTGAGGGGGAGTATTAAGAAATAGATTAGATATATTTGTACTTAGTTAATAAGTTGTTGATAAGTGGTTAATAAACGGTTGTATTTTTTGTATATAAATTGGGTCATGTCCCTGAATAATATACTACTGAGATTTTTCTCTCCATCTTTCTATTAATAATAAATAACTGCCTTCTTTTTAATGCTGAAAATGCTATATTAATTCCTAGAAGAGTGTGTTGATACAGTGTTTGTGGCCTTCTTTTTCTGTATTATGTTGTTTCTAGTACAACAATTGCATTGAATGTGCCGAATACGTTAATATTATTGTTCATTTTGTGTACATGGCAAATATGGTTGAGTAGACAATTAATAATGCAGTATGGTCAACTCTTTAATTCGTATAAGTACGACCCTCCTTTCCTAATAAATTAATGGATAAAATATCATTTTGGTTCTTGAGTTTTGAGTATAGTTTCCATGTGGTCACTTGGTTTCAAAATGTGACATATTTACTCGTGAGTTTTGAGTTGAGTTTTCATTTGGTTCTTATGTTTCATGATTTTACACTTTTACACCCTAGTTTTCAGTTTTCACTAGTGCTCATTTTTTTGTGATTAGTGTTAGTTTTCTATTCATTTTTTAAGTAATTATAATTAAATTAATTTTCACTAATTTTCTACAACAAATAAAATTAATTAAAAAATTATACATTATAATTATTTTAAATTAATTAATAGAATGTTAACCGCAAGGGCCAAAAGTGTGCATTAATGAAAACGTAGCTCTGGGGTAAAAGTGTAAAATCTTGAAGGACCAAATGGAAACTAAATTTAAAGCTCAAGGGTAAAAGTGTACGACCAAATGGAAACTAAAATTAAAACTCAAATGTAAAAATTTAACATTATGTTGAAATTTGGGGACCAAATGAAAATGATACTCGAAACTTAAGGACAAGAAGGGGTTTTCCCCTAAATTAATCATCTCAGCTTCTTTTGACTCTCCATCATCCGAAAGGGAAAAGTGGTCAAAACTTCATCTCCCTCGTATTAGGTCCCAGGGTAAGGTGGTTAGGACATTGAATTCTGAATCCAGTATACTTCTATTAAATAACTAGAAAAATAAAACGATCGGGTGTTATTTGTTGGAAAAAAAAACTTCTTACTACTCCCGCAGAAATAAGAAGAAATAATTGAGAAATTAAAACAAAGCAACAAAATAAGAAACACAAGAATTTACGTGAAAAAACTCCAAACCCGAAGAAAAAAACCACGAATAGAAAGAAATTTTACTATGTAAAAAATTGTTACAATCACACAGAATACTCTCACAAAACTTTATATCAATAACACCCTTGAGGGAATTTAACTAGAGCTAGTACACCAACCTTAAAATGTTTCTAACTTGGATGCTTTGAAACTAAAACCATAGGCTCCTTTTATAGTGTCAGGAGCCCATCACTTCCTTGCACCTATCCATTGTGGGACAATTTCACTTCTAATATATTGCCAAAAATTTAATAAATTCGACATTGGCAAAATATTTGAAGAATCTAAATCTCTTGCTACATCATTGTTTTTACTGACAATCATAATCCTCAACTCAGAGAACTATTATCTACTCCATAAAAGTAGACCACTTGGAATATCACTTTCCAGGACTTTTCTTTTTCGTCACATGTTGATAAACCCTACTGAAATTTATAGTGCAACTTCCACCTACTTGGCTCACCCGAAAGTTCTTCAACAATCGACATAACTTCTACCACACACCTTGCATAACCACCCAGTCAATGTCCGTGTGCAAACTTGTGGAACCACTAACATCACATCCTCTATCATGGCAAAGCGGACATACCATAAGAATGAATTTTGTCTTTCTTCAGAAGATGTCACCATCTCCTCTGACGAGAGAGACCGCGTTAGCATCCGACCGAGAGCCTCTTGACGAACTTGCTCTGTTAGGACAATTCCTTTTCATGTGTCCAGACTATCCGCATTCCCAACAACCTTTCTTTTGCACGATGTTTTTATTCTTCATCTTCCAATTCCATATAGTCATACTAGACTTATTAGAACCTCTGCTGGAACTACCACTGGACTCTGTCTGACCACCATCACCGCATAACATTTCAGGAACACCACGACTCGATCTTCCCTTCAAAACCTTGTGTAACCCAGATTGTATAAGCACATCTTTGACTTGCATTTGCCACAAGCCAAAGTTCAACATTCCGTCAAATTTCTCCACGTCAATCTTTACTGGACTCATAAGGCTTGACATATTTGCTTCACTTCTAGCGAATCTTCAAATAGTGAACAACTCACACTATTTACAATACCAGCTATAACCCGTTTCAAGAAATCTTTTATGATGTGGAAGCTCAGACGATGCTGCAACCACAGAGCATACTCAGATACTTAAGAAACTACAAACTTAAATATATAATACCACTTGTTGGGAAAAAAACTTCTTACTACTAACGCAGAAATAATCAGAAATAACTGAGAAATTAAAAAAAGCAACAAAATAAGAAACACAAGAATTTACGTGGAAAAACTCTAAACTCGAAGAAAAACCACGAACATACAGAAATTCCACTATGTGAAAATTTTTTACAATCACATAAAATTCTCTCCCCGAACCCAACTACAAAAACACTCTCCCAAAGCTTTATATGACTCACACCCTTAAGGGAATTTAAGTAGAGCTAGTACACCAAGCTTAAAGTGTTTCTAACTGGGATGCTTTAAAACTAAAGTCATAGCCTCCTTTTATAGTTGTAGGAGTCCATCACTTCCTTGCATCTTTTCAATGTGGGACAATTTTACTTCTAATATATTGCCAAAAATCCAATATTATTTTGAAAATTTTCTTCTTATCTTATTCATTGTCAGGTACGAAATTTGCTGGGATGTTCATTCATACAATCAATTTCTTTTATATGCTTATCTCTCTTTAATATATAAATTCAGTTGTTGTTGGTTGGAGGTCGAGTTGACAAAGCACTCAATCAAATGGAAAATATCTGTCGTGATGCCAATGCAACACTTCTCAAAGCCCTTGGTTGAGTTGTTTTGTATTTAGGGATTGAAATTGAATATTTAAGAAATCATAGGTAAAAGAGAATGAAGAAGGAACATTTTGATCGTAGTAACGATGTCTTGCTTTCAACTTGTTATGAGCAAATATTGAAGAAGGATCCAACATGTTGTCATTCACTGCTAAAACTAGTTCACATGCATAAAAACACGGTATGTTAACTGTAGAGAAAACAGTCTTCTATGATGAACTATTAGACCTCAAGGAGATGTACAAATTTGAGATTCTGAGGTGATAATTTGTGGTTGAATTCCTCACAACATACATACATATCTATTCTCTAGTATTAGAAGCGTATGATGGACACTCACAAACAAAAAATCAAACAAGGAATATATTTCATAACAAATAATTCACTTGTATTAAAAAATACTACTTAAGAGAAGCTACAAACTTGGTTCACACTTTTTTCTCTAAACTCACTTTGTTTTTCTTCTTAATCACTTGCTTGGATATGATACAATACCAAAATGACCCTATTTATAGGACTTATGGAAAACTCTAGATCCATAACTCCGTTACATAAACATAAGCTCAAATTTATGAATATAAAATTCTCATACATAAACAAGTCCTATCCAAGACATCTAAATCCATTAACAATGCTTTAATTAAACTTAAAACTCATACAAATGTGTAAACCTAACATTAAAAATATGTTTAACTGTCCAACATCCCCCATTAAACATAATTTTCTGAAAGAACTCCCGCCAAGATTCTCAACTTGTTAAACACGACAACTTTAAGTGGCTTCGTGAAAATAACTACAATTCGATCTTTTGTCTTCACATATTCAACATGAATCTTCTTTCTTGAAATACAATCTCGAATAAAGTTAAATCTTGTATCAATGTGCTTACTACGATCATGGAACATTGAATTGTTTGCTAGAGCAATTGTTGACTTATTATCCACATGGATCACTATTGCGTCCTCTTGCAAAATTCCAACTTCTTGAAGCAAATTTCTCAACCAAACTACATGACAAACACATGATGTTGCAACAACATATTCTATTTCACAAGTAGATAGTGTCACAATAGGTTGTTTCTTAGAACTCCACTAAAAGTTGTATTACCAACAAAGAACACATATCCACTTGTACTTTTTCGATCATTAAGATCTCCAACCCAATTACTATCACAATAATCTTCAAGCAAAAAATCTTTACACGATGCATAAAATAATCCATAGTCAAGTGTACCTTTGAGGTAACGAAGAATTCTCTTTGTCACTTTCAAATGAGTAGTTGTAGGAAATTCCATAAATCGAGTCACCAATCCAACACTAAATAGAATATCTGGTCGTGTGCAAGTTAAATACTTCAAATTCCCACTTAAACTTTTGAAATATGACGGATCAACAACATCTCCATCTTTATATTTGGACAGTTTTGCCCCAGTTTCCATCAGAGTTGTGACAAGTTTAACATTAAACATCTTGAATTTCTCAATAATTTCTCTTGTATATTGTTCTTGAGATATGAAAATAAATTCCTCTGATTATTTCACCTCAATGCCAAGATAATATGATATAAGCTTGATATCTGTGACATAAAATTCTTGAGTCATTTCCTTCTTAAGATCTTCAAACATGCTTACACAATTCCCTGTAAAAATTAAGTCATCCACATATAGGTAAACCAACAAAGTATCTCCATGATCGTTAGTATTAATATAAAGAGAATGTTCATAGGGAATCTCAAACACCCATTATCAAGGAAATATTTCTTGATTCTGCTATTTCACATTCTTGGCGCTTGTTTCAATCCGTACAAGGCATTCTTTAATTTCAAGACTTTATCTTCTTAACCTTTCACAAAATAACCAAGAGGTTGTTCTAATTAGACTACTTCTTCAAGATATCCATTTAAAAATGCTGATTTGACATCTATCCGAAAGATCTTCCATTTATTTTCAGCAACAAGTGCAATGAACAACTTTATGGTCTCCATGCGAGCCATAGAAGCAAACACTTCATCATAATCAATTTTCTTTTTTTTAGAATAACCTTTCGCAACTAATCTTGCTTTATGTCTCTCCAGTTCTCCTTTTTTATTTCTTTTTATCTTGAACACTCATTTGACACCTACTGCTTTCTTTCCACTCGGAAGAGTATAAAGTTTTCATGTAGCATTCTTCTTTACGGCCTTTATCTTTTCATCCATAGCAGCCTTCCTTTTTTCATACTGTGAAGTTTCTTCTAACGTTAAAGGTTCACTTTCACCAAAAAGAAAAAATAGTGTGAGATCACTAAAACTTTGAGTTAACTCTTCGGTTTATAGATGCCTTGCAAATTTCTCATGCGACGAGGTGCTTCACTTGAGCTTGTAGATGATGAAGGTGTGCTTTGTTGTGGAATGGTTGGTGATGTTGGTGGAGTTGATGGAGAAGCAATTTCAATAGATTCATCATTGTCTTCGGAAAAAAATAGAAACTTATAGTCTTTTACTTCATCATTCCAATTCCACGTTGTTTCGTCATTGAACACATCTCTACTTACCATTATCTTCTCTGTAACAGGATTATAAAGCTTGTAACTCTTTGAGTTTGCATCATATCTAATCAAAACATGCTTCTCACTTCTATCATCGAGCTTACTACGTTTTTGATTTGGTACATGTGCATAAGCTATACTCCCAAAAAACTCTCAAATGAACAATAGATGGCTTTCTTCTTGTGTTTGTTGACAAGTTTTGTTCCACAAGCTTCTAGTTGGGAAATGTTTTGACAAGTAAACGACACATTTAACTGCTTGTGCCCAAAATTCTTCTGGCATCTTCTTACTCTTCCACATGCTCTGAGCCATATTGAGTATCGTTTTGTTCTTCCTCTCCACAACATTGTTTTGTTGTGGAATCCATTGAACTGTCATAGGTCGACGAATTTCATTTTCTTCACAAAAGTATTTGAATTCATTTGATGTGAATTCTCCTCCTCTGTCACATGTCAAAGCTTTTATAAGGCAACTTTCTTTCTCAACTAGAGCTTTAAATCTCTTGAACATGCCAAATACCTCTAATTTCTCCTTGACAAAGTAAACCCAAGTTTTTTCGGCTAAAATCATCAATAAACAATAAGAAATAATCATTATTACCAAAAGAACTTTGTTTTATCGGTCAACAAAGATAGTGTGAACAAGTTCTAATGGTCTCCTTGCTTTTGAGAAAGATTCTCGGGGAAAACTTTTCCTTGATTGCTTGCCACAAAGACAACGTTCACAAAATTGATTTGGATACTTGACATATGGCAATCATTTCACCATTTTCTTCCTGGTTAACAGTCTCAAACCTTCAAAGTTCAAGTGCTCAAATCTCAAGTGCCAAACACAAGCATGACTTCAAGCATTTTGCAACGTCAGTTAGAATGTTTAACAAAAACATTTTATTCTTCGACATTTGCACATTAGCAATCATATTATCATGATAATCTTTTATTGAAATACTATAATCCTTCATCAAAATATTATAGTCTTTCACAAGGAGTTGTCCCAAACTCAAAAATATTGTTTTTCATCTTTGGCACATAATAGACATTGGAGATAAACTCATGCTTTCCATTATTTAAGTTGATTAAAATCTTACATTTTCCTTTCACATGAATTTTTGTAGCATCACCAAATACGATAATATTTCCACCAACAGATTCATCAAGTTCCACGAACATTGATTTACTTCACACATGTGATTGCTTGCACCACTATGAAGATCCCACAAATTATTTTCACATGTCTTTCCACCTTTGCATGCTAAAAGCAAAGATGGCTCATTGCTTTTAACATCTTGCTCCACATAGTTGACAATTTCTTCGACTTTATTTCTGCATTCCCAAGAATAATTACCAAATTTATGACGATTATAACATTCCACTTGACTTTGGTTATACCTTCTATCATTATTTGATCTTCCTCCATATGGCCACAAATAATTTTTTCTTCCACGACCTCTTGATGAACTAGTATTTGAATCTTCAAAATTTCTTTGATTTAAATTTCCTCGACCTCGTCCTCTAAAGTCACCACGTCCACGACTGTGACCATGCCCTTCACATCGATTTCCTTTTTCTTGGCTACTTCTTTATCTCTCAACTGCAACTTTGATTGAAAAAGTTGTTCAGTTGTCTGTTTATTTTTTCTTGAAAACCTTCCCTTCATAGGCTTGTAAACTACCCACAAGTTGATCAACGGACACTGTATTCAATTCCTTTTATTCTTCAATAACAACAACGATGAAATTGAATTTTTCATCTAATGAGTGAAGTATCTTTTCAATTACTTTCTCATCATTTATTGTCTCACCATATCTCTTCATTTCATTTACTATTGCTAACAATCTTGAAGTATAATATGAAATTAATTTCGACTCCTTCATGTGTAACGATTCATAATAACCTTCCAATTTTTGGAGGTGGACCTTCTTGACTCGTTTTATTTCTTTATAAGTATTCTCCAAAATTTATCATGCTTGTCTCGCAGTAGTTGCTCAAGAAATCTTCTCAAAATTTATTTCATCAATAGCTTGATGAATAATAGTGAGTGCCTTTTGGTCTTTCTTTCTAGTATTTTACAAAACTTCTCGTTGAGCTTGAATCAAAGTCGTGTCATTCCTTGGTTTGGCATAGCGTCTATCAACAATTTTTCATGCATCTTGTGAACTAAGTAGAGCTTTCATATGTATACACCAACTGTTATAATTTTCTTTCGTAAGTTGAGGCACATGGTGAGGAACCAAATTATTGGTTGTCATTTGCAAAAACAATTCTCTTTTCTTGAACTCACGCTCTGATACCACTTTGTTGGAAGCGTGTGATGGAAGCTCACAAATAAATAATCAAACAAGGAATATATTTCAGAACAAATAATTCACTTGTAATAAAAAAATACTTTTTAAGAGAAACTACTGTTAAGTTATGAAGCCAAAAACTAAGGCCCATTGTCCCACTTCTCACACTTAACCTAAGTTATAAGTGTATAGATATATATCCTTGCGTTTTTTTGGGGGTTGTGTTTTTTCAAGACAAAAAAGTTGCGGCAGTATTACAAAAAAAAAAACAGAGCTTACATGAAGTTTTTTTTCTTTGGTGTTGTTTTACAAGAGTGTCTTTTCTCCATTGAAGAGTTTTGTTATAGTGTGATTCGTGAGCATTTTCCTTGAGAGAAAAGTGAGAGAAATCACCATTGAGCGTTGTAAACTCTTGTAACTTCCTCCCTGACAATTTTAGTGGAACCTGCATCGATAGCAGAGAACTGGACGTAGCCATCATTGGGTGAACCACTATAAATTCAGTGTCAGTTTCTCTTTCCCTAAACTTGATTTATTTATCGTTCTTGTAGCTTAAAGGTTTAGGTTGGTTTATCTATTCTTTTAGGCTTGCTAATTCCAAATTGATTATTCCACAAAATATTTGGAATTATAACCTGATCTGGAATTTGGGATAAAATATATATTGTCTGAATCTGGTAGAATTTAGATTGATTGTATTTTGTCACATTCACACCTAACAAGTGGTATCAGAGCATTGGGTTGTAGAACGATGTCAGAAGAAGATGAGAAATTGGTTACTTTTAATGGATCTGATTTTCGTTTTGGAAGTGTCAGATATTAGATTATTTGCATTCCAAGGAATTGGACTTGCCATTAGAAGGAAAGCCTGAAGACATGGGAGAAGCTGAATGGAAAAAGTTAGATGTAAAGGTGTTGGGATGCTATTAACTCGACAAAGAATGTGCAAAGTAGTGTAGCGAAAGCAACGACGACAGCAGAGCTAATGGAACCTTTGTCTAACATGTATGAAAACCCCTCTGTAAACAATAAGGTATATCTCGCAACCAAATTCTTTAATTTGAAAATGGCTGAAGGTGCATCTGTTACTGCCCATATTAATGAATTTGATTTGTTGATAAACAAATTGGTTGTTGTTGAGTTAGAATTTACTGATCAACTAAATGCGATTTTGTTGTTGAGATCTTTACCTGATAGTTGAAAAACCATGAAAGTTGTACTTTCTAATTAATGTGGGAAAGAGAAATTACAGTTTTCACAGGTTAGAGATTCTACAATTGCAGAAGAGGTTCGTAGAAAGGACTCAGGTGTTACTTCTACTTCGGGTTCAACATTGAATGTGGATAGAGGGAGGAGTAATAACAGAAATTACGGGAATCGAGGTAAATCGAAAAATAACAGAAGTAAGTCTAGAAACAGCAGATTAGAATGTTGGAACTGTAGTAAGACTGGACATCTGAAAATGAACTGCAAGGCTCCAAAGAAAACTGAGGGGAATGAACCTGATGTGGTTGCTAATGAGACACAAGATGCTCAGTTCGGCGAGGGAAAGTGCCCATGACCCATGGGTGATAGATTCAAAGCGTCATTTCATACTACAGACAACGTGATATTCTTGAAAATTATGTTGCAGGAAATCATGGAAAGGTGTATCTAGCTGATGGAGAGCCTTTGGACATCATTGGGATCGGTGATGTGAAATTGAAAATGGCGAATTGTTCAGTATGGAAAATTCACAAGGTACGTCATGTTCAAAATATGATGAAAAACTTGATTTCTGTAGAGCAGTTACACAATGAAGGATGTGAGGTTTGTTTTGGCCAATAAATCTTGAAAGTTACTAAAGGTGCCATGGTAGTTGCTCGAGGAAGCAAACTAGGGACTTTGTATGTCAACATCAATGATAAAGATATGGTAGCTGTTTTGGATAATTCGAGTCAGACTGATTTATGGCATAACAGGATGGGACATATGAGTGAAAAAGGTATGAAAATTCTTCACTCTACAGGGAAGTTACAGGGACTAAAGACAGTTGAACACAAGTTGTGTGAGAGTTGTGTATTTGGGAAACAGAAATGTGTCAGGTGCGTCATTTCATACTACATGACAACGTGATGTGTGGGGGCCTTCTGAAGTATCTTCCATTGATGGTTCCAGATACTATGTGACCTTCATTGATGACTCAAGTAGGAAGGTATGGACTTATTTTCTCAAACATAAATCTGATGTATTTTCTGTTTTCAAAACTTGGAAGGCTATGGTTGAGAATGAGACAGATCAGAATATTAAAAACATGAGATCGACAACGGTGGTGAATATGTTGATGGGGAATTCAAAAGATACTATGCAGACAATGGAATTGTGATGGTTAAGATGAAGGGATAGGATCCCGCAGCGGAAGCGATAGTTAATCACGTGTTCTAAATTTAGTCTAATGGATTTTAATCAAGATCAAAAATAACAAGATTAAGCATATTATAAGACATTGGACAACAAGTAACTACCTTTGAAGAACTCTTTCTTCAAGTGCTCCTTCTCCCACGATCACGATCTCACCAACTCGAACCCGAACGAATAAAGACACCACCACCGGATCTTCTCCGTTGTTCTCTAGGTGAGGGAGGAAGGTTGGTTCCTTTAGGATGAGGTGAGGTGATCTTATGAGATTGTATTTGGAACTCTTTCCAATACAATTTGAGAGAATGCTAGGGTTTTGTCAAAAAATCTTAACTTTGCTTCACCTCCAAGTTGCATCTCATGCAACCATTTATAGGGAAATAGGATGGAAATTACCATCCTATCCTTCCTTCATTCTCTTTTTAGTATATAGTTTATATTTGTATCTAATTCACATTAAAACCATATATTATATCAATTATATCACATACAACTGATATAACACCTCATATATGAAATTGAACACTTCAATTTCATTCGTAATTTTATACCCTCAATATTACCATGTTGAGCCAACGGAGGGACCTAATGGACCTACAGTTCATGAGCTCCAATGATGTGAGATTAACTGATCAAACTCTTTGATCTAGTTGATCAATATTCATTAGCTACAAGTCCCTCCACTATAGACTTGTAGCTGCACTCTCCTCACTGTAGATTATATTGTGTCTACTGATATAATCATTACCTATGAGTCGACCCTTCACAGGTTGTTCGTAATCACGGATGGGTCAAATTACCGTTTTACTCCTTTGATTACCTCTTTGTTCCTTAAGCACCACTGATCCTCTAATGAACAACAAGTCTATGGTCCTACCATAGACTCATACCCTCAGAAAGGGCGGGATCCCGTTGTTCAAGACCTGGAGTCAGTTCTTAAGGGAACAACCTATCTAATTCCCTATTGTAGGAATGAATGAATTTCATCTTGCATAGTTAAGTCCCCAGCTACCTACGAGATTCTGTCCCTGAGAAGGTAGGGTTATTGAGTCGGCTACAGGCCACTCTCACCCATACTAGTGTAAGGACAAACCCCTATAAGGAGGAGTCCTTAACTTGCTCAGGATTCAGGTCGAGTCACTAATGACCATCTATAAATTATCAGTCTTATCCTGTTAATGGCGTTATACTGGTTAGACTAATAATTTGCAGTCCGATCTTGTATGAACTCTTCATATAGGATGCCCCCACTCTCATGTCAACCACATGAATGAGTTGGATTACCTCATTTGCACTAATTACAAACTGAGTCGCATCCATGGTGTTACCAGAATAGGGTTTCCAACCTTATTCTTATACCATAGAGCCTTTTAGGCTATACTCTTGAACACAATCCAAATAGTATCTACTACACTGATGTTTAAGATACATTATAGCCTTGGAGCTTAGTTTATTGGATTTATAGAACAAGAATATAATTTCATCAACACAAATAACTCTTTATTTATTTGATCAAAATTACATAAGTTTAGGGCACAAATCCCAACAATCTCCCACTTGACCTAAAGTTTGTGGAGTACTAAAACATTACAAAAATGTAAATACAATAAACTAGGGCATTTAAACCATTTGTACAATATATTCCCACTTGCCCTAGTGAGGGAAGACTTGTAAACCTAGACCTTCTAGGTGACTTTCAAATACTTTAGCCGTAAAAGCCTTTGTAAAAGGATCAACAATGTTGTGCTCTGAGGCTATCTTCGTGACGATCACGTCTCCTAGATGCACGATCTCCTGGATGAGATGATATTTCCGCTCAATATGTTTTTCCCTCTTATGACTTTGGGGTTCCCTTGAATTTTTCACGACACCACTGTTATCACAATACAACGTGATGGGCAAACTCATATTTGGAACAACTTCCAAATTTAGCATGAATTTTCTTAACCAAACGACCTCTTTTGCTGCTTCACAAGCTACTACATATTCGACCTCCATGTTGGAATCAGCGATGCATCCCTGCTTGACGCTTCACCATAGTACAGCTCCTCCGTTAAGAGTAAATACTGACCCTGATGTAGATTTTCGAGAATCTTTATTAGTCTGAAAGTCAGAATCTATTTATCTTGTAACGATCAAATCCTTAGCCCTATACACAAGCATGTAGTTCCTTGTTCTTCGTAGATACTTAATGATTGTTTTAACTGTTGTCCAGTGTTCATATCTGGATTGGATTGATACTTACTGACCATTCCAACTGCAAAACAGATGTCTGACCTAGTACACAACATGGCGTACATCAGGCTCCCAACAGCTGATGCATGAGGAATCCGTCTCATATCCTCAACTCGTTGTGGTGTCTTAGGACACTATTCCATAGAAAAATGAACTCCATATCTGAAAGGCAATAAACCCTTTTTGGAGCCTTGCATCTTAAACCTCGACAACACTTTGTCAATGTAAGATGTCTGAGACAAGGCTAGTGTTTTATTCTTGCGGTTTCGGACAATCTAGATTCCAAGAACAAACTGTGCTTCACCCAAATCTTTCATTTGGAATTGCGTAGCTAGCCAATTCTTAATGTCAGTAAGATATCCTACATCATTCCCAATGAGTAGGATATCATCCACATATAGAACTAGGAATGCGACATAACTTTTGATGATTTTCCTGTAGACAGAAGGTTCATCATCATTCTAGTCAAAGTCAAAAGATTTGATTGACTCATCAAATCTTATATTCCATGACTTAGAGGCCTGTTTCAGTCCATAGATGAACCTTTTAAGCATGCAAACCTTTTGCTCTTGTCCTGGTTCAATGAACCTTTTAGGTTGGTCCATGTAGATGTTCTCGTCAAGATTGTCATTCAAAAAGGCTGTCTTGACATCCATTTGCCATACCTCATAGTTATAATATGCGGCAATTGCAAGTAGAATACGAATAGACTTTACCATAGCAACAGGTGAAAAGGTTTCCTCATAGTCAACCCCTTCAACCTGGGTATAACCCTTTGCTACTAGTCTAGCTTTAAAGGTTTGCACCTTTCCATCTACACCACGCTTTCTCTTGTAGATCCACTTACAACCTATAGGTTTTACCCCATCAGGTTTATCTACAAGATCCCAAACAGAATTGAAGTACATAGACTCCATTTCTTGGTCCATGGCTATGACCCATTTATCTTAGTCTTTGGCAACCATCGCTTGATTATAAGTCGATGGATCCTCACAGTCGTCATGTGGAATAACAACTTGGGTTTCAGATAAACCCATGTAACGGTCAGGTTGTGTTATAACCCTCCCACTACGTCGAGGCATGCTCAACTCTTGAGATGGACTCTCTTGATTAAACAAGCTAGTGTCAACAACTTTTGTTGACGTACTAGTTTTATTAGCAACCTTTGCTATTGTTCCGTCTAACTCACTTAACACAACTTTACTTCTTGGTTTGTGGTCCCTTATATGGTCATCCTCTAAGAAAGTGGCATTTGTCGACACAAAAACCTTATCTTTCTTAGGATCATAGAATAAACCACCTCTTGTTTCTTTTGGGTAGCCTACGAAAAGGCACAATTTTGAACGTGAATCCAACTTCTTTGGATTTGTCACAAGCACATGTGTTGGACAACCCCAAATTCTGAAATGACATAAACTACCTTTACGTCCTTTCTAGAGTTCAAAAAGTGTTTCAGAAACACTTTTTGATGGCACATTGTTCAAAATGTATCCCGCAGTATCTACTGTGTAACCCCAAAAAGAATTAGGGAGATGAGTATAACTCATCATTGATCGAACCATGTCCAACAAGGTTCTATTTCTCCTTTTCGATACACCATTTTGCTGTGGTGTACCGGGAGCTGAGAGTTGGGATGTAATTCCATGTCCTATCATATAGTTCTGGAATTTAAATCCATCTACTCTCCACCTCGATCTGATCGAAGTGTTTTAATTGTTTTACCTAATTGATTTTCAACATCAGTCAAGAATTCCTTGAACTTTTCAAGTGCTTCAGGCTTATATTGTATTAGGTAAATATGCCCAAATCTAGAATAATCATCTATAAAAGAGATGAAATATTCATAACCTCCTCTAGCTTTAACACTCATCGGACCACAAAGGTCTGAATGTATAAGCTCAAGAGGTTCTTTGGCTCTATAAACTTTTCCACTAAAAGGTCTTTTAGTCATTTTGCCTTCTAGGCACGATTCACATACAAGTAAAGCATTTTCTTCTAACTCATTTACAAGTCCATTCTTTACCAATCTCTCAATCCTATTGAGGTTAATGTGACACAATCTAAGATGCCAAAGATGAGCATTTTCTTTAGGAGAAATTTTACGTTTCTTAGTTTGTGTGTTTGCTGTTTTAAATAATTCAGTGTTCAAAACCATTTTGACTGAATTAGGCTTTAAAACATACAACCAATTTTCTAATGAAGCTGAACATATTTCCACACCTTTCTTTAAAATAAACACTTTATTCAAAGAAAAAGAAACAGAAATACATTGTTCTATAAGGCAAGAAATTGAAATAAGGTTTCTAGTAAACCCTGGTATCACTAATATATTGTCTAACAACATATATTTCTTGCCAAAATAAAACTTCATCGTACCTATTGCTACAGTTGAGACGACTTCTCCATTTCCAATCCGGAGTGTTATCTCTTCTTTCTGTAGTTGCTGTCAGGAATCAATTCCCTAAAAAGAAGAGTAAACATGATTAGTGGCGCCTGAATCAAGTATCCAAGCAGTTTTATCATTATCCATTAAACAAGCTTATAAGCAAAGTAAATAATATTTACCTTCGTTCTTCTTTTCTGCAATGTACTTCGGACAGTTTGTTTCCAATGCCCGTCTTCGTTGCAGTGGAAACACTTTCCTTTGTCTGCAACTTCTTTGACCTTCTTGCCCTTCTGAGGGGCAACTTTATCAGCTCGTTTCCCTTTACCAACCTTTTTCATGTTCTTCTTCTTTCCTTTTAGGTTAGAAGAAGATGAAGCCATTGTTTTTTATCTAGAGGTCGAACCTCTATGATAACTCCTACTGGCAACATTTGCCTCACCTTTCGATCCCTGAATTTTCATAAGAGATTGAAAGGTCTGGAGTTCATTCAGAAGGGAGGTAAGATTAAAAGTAAGCTTGTTCATAACATCATTACTTCTAAACTGTAGGAAACTATCTGGAAGGGTTTCAAGAATGAAGCTGACCTGGCTCGATTCATCGATGGAAGCACCATTCGACTCCGTGATGTTAAAGTGTACCATCATATCCAGGACATGATCCCGAACAGATGAACCCTCTGGCATCCTCGAGTTGAATATATACTTGAGGGCATTGGGTCGGGCCTGTGTAGACTGTTGTCCAAACATACCCTGCACTGAATCCATGATTTCCTCAACGGTCATCATGCCCTCGTGTTTCTTGGCTAATATGTCAGACATACTTGCCAGCATGTAGACCTTGGCCTTATCATTGGCCTTGATCCATCGATCATATGCATCACGAACATTTCGTGAAGCATTCGAGCCTGCCACCTGAGGACACCCCTCAGTTAGCACAAACTTCAGATCATCCACTACCAATATAGTGTTGAGTTTATTTTTCCACGTTATCATATTCCCTCCGGTTAAATTTTTCGCACCCTAAAAGGAAATTATAGAGCTAGACATTTTGCTGAAAATTTATAAAAGGAACTTGTATAAGTTTCTTGCTATAATTATTTAATCCAACCATGTTTAGCTAATTATTAAATGATTCCTAGGTCATTTATAATTTGCAATGATACTCCAAAGGTTTAGAATGTATGACACCGAAGGGTAATAAAAAACACTCCTCCTCTGGATCAAGACACTCTTGACCAAAACCTAATGCCAGAATAACTCTTATTCCTATAGGTTTTAGTTACCATTATTCGGTCAGGATACATACACTTCTTATGTACCTTGTGAGTGTAACCCTCTGTCTTTAGACCCCAGAGTCCCCATCCAATAAAATCTTCCGAATGGAGGACTAGATTGAAAAACAAACTAAGGAAATCTTTATAGAGTGTCTACTGTGTTCGATCCCCTATGGTCAAGCCCTCCAAAGGAATTGTCTGATCCAGGCCAAACTAGCAGGCTGGCCATAGTGATCTTATGGTGTAAACCGACTGAAGAGACCATAGGTTTTGTTTTCACTAAACTTGCTCCCACTCACTATAAGTACTCTCTCCATTCACCTTGATATTGACTCATACAAACACCATCCGAAAGGGGACGCTCTCGTTTGCGCCACGAGGCTAAGTATGAGTCTCACGGTGTGAACTTCCCGGAGATACGTAGGTGGAAAAATATGTATCATATACACTTTTCCTCCCACTGGATACTTTAACTCTATAGAAAATTTACTTAGGCTAAACCTTGCTAATGGTTTTACCTAAACTTATCAATATAACTCTTATATTGATAATCAATATAACTCTAATATTGACTTTATCCTAAGTTTGCTAATATAACTCTTTATATTAAGCCTAGAATTTCTAGTTTATTAACTCCTTAGTAAACCCGTTGATGCTACTATAATTTATAAATTCTCTGATTAAACTACCAGGTCAGTTCCTAGGTAGGGGTGTTCCGTTTCCGTCAGCTTAAATACCCCAGCCTAGTCAAAACTTTCCTTAGACAGAGTTCCTCTTTTAATCATTGTTTATAAATTACTTGGTTTCTAATTCTAATCTAATTAGAACTAGACAACCTAAGGTCTATTAATTCCAAGTTCTAAACATTTTAAAACTAATAATTAGCCTTAGGTGACATGCATACTATGTCATAGTGTTTGATCATTCATTTCATGAATAATAAGACATACATAGCATAATCATCTCATGAATTATAATGCATGTCAATGTTGTCCATAAATTAAAATAACACTTTATATTAATTATTCATGCAAACTATATAATATAACACTATATTATAAATGATGCATGGTAATGCTTAACCTAAGGTGGGATATCTAAATTAAAAGCATACATTATGCATGGCAATGATTACACAACAATTGCATAATTTAAATAGCAAAATTAGACCAATTTTGGCACCCTAAATTCAATTTTAATTAATATAATCTAATTATATTAATTAAAATGAATAAAATTAAATATAATTAAATATAAAACGTTTTTATATTTATTATATATAAATAAAAATGTTTCTGCCCGTTGCTTTTTTCCGTGAAACGGTTGGGGCGTTACAACGCTGATACTAGCGTTGCAACGCTGCAGCTCGTCCTCTTCTGTCAGTTAAAGCGTGTCTCAGCACCAGCGTTTCACAACGCCGAGGATAGCGTTGCAACGCTGTCGTCTCCTCAGGCGCGCGTCTGCCGCAGTGGCGTTGCAACGCCATTCCTAGAACAACAATTCCACTTCATTTTTCTTGCTCGTTTTTGCTTCGTTCTTCCCAACAACCACTTTGCCTCGATCGACACGGACTTACAGACTCGATTTACATAATAAAATGGCCAAAACAATAGGTCCTTACAATGAACAATTCAACGAAATTATGTAAATCTAAGAGCCAAAATTGAAACCATCTAATTTGCAAACCGTTCATTCATCACACAAAAAAACAGTAAATCCCACCTATGATCTTGATAAATCCTGAACAAAATAAAGAACACAATTGGGCTCTTATACCAATTGAAAGGATAGGATCCAGCAGCGGAAGCGATAGTTAATCGCGTGTTCTTAATTTAGTATAATGGATTTCAATCAAGATAAAAAAATAACAAGATTAAGCATATTATAAGACATTGGTCAACAAGTAATTACCTTTGAAGAACTCTTTCTTCAAGTGCTCCTTCTCTCACGATCACGATCTTGGCAACTCGAACCCGAACGAATGAAGACACCACCACCGGATCTTCTCCGTTGTTCTCTAGGTGTGGGAGGAAGGTGAGTTCCTTTAGGATGAGGTGAGGTGATCTTATGAGATTGTATTTGAAACTCTTTCCAATACAATTTGAGTGAATGCTAGGGTTTTGTTAAAAAGCCTTAACTTTGCTTCACCTCCAAGTTGCATCTCATGCAACAATTTATAGGGAAATATGATGGAATTTACCATCATATTCTTCCTTCATTCTCTTATTAGTATATAGTTTATATGTGAATCTAATTCACATTAAAACCATATATTATATCAATTATATCACATACAACTGATATAACACCTCATATATGTAATTGAACACTTCAATTTCATTCCTAACTTTATACCCTCAATATTACCATGTTGAGCCAACGGAGGGACCTAATGGACCTACAGTTCATGAGCTCCAATGATGTGAGATTAACTGATCAAACTCTTTGATCCAGTTGATCAATATTCATTAACTACAAGTCACTCCACTATAGACTTGTAGTTGCACTCTCCTCACGGTAGATTATATTGTGTCCACTGATATAATCATTACTCATGAGTTGAACCTTCACAGGTTGTTCGTAATCACGGCTGGGTCAAATTACCATTTTACCCCTGTGATTACCTCTTTGTTCCTTAAGCACCACTGATCCTCGAATGAACAACAAGTCTATGGTCCTACCATACACTCATACCCTCATAGAGGGCGGGACCCCGTTGTTCAAGACCTGGAGTCAGTTCTTAAGGGAACAACCTAACTAATTCCCTAGTGTAGGAATGAGTGAATTTCATCTTGCATAGTTAAGTCTCCAGCTACCTACGAGGTTCTGTCCCTGAGAAGGTTGGCTTATTGAGTCGGATACAGACCACTCTCACCCATACTAGTTTAAGAACAAACCCTTATAAGTAGGAGTTCTTAACTTGCTCAGGATTCAGGTCGAGTCACTAATGACCATCTATAAATTATCAATATTATCCTATTAACAGCGTTATACTGGTTAGACTAATAATTTGCAGTCTTGTCTTGTATGAACTCTTCATACAGGATGCCCTCACTCGCATGTCAACCACATGAATGAGTTGGATTACCTCATTTGTACTAATTACAAAGTGGGCCGCATCCATGGTGTTACCAGAATAGGGTTTCCAACCTTATTCTTATACCATAGACCCTTTTAGGTTATACTCTTCAACACAATCCAAATAGTGTCTACTACACTGATGTTCAAGATACATTATAGCCTTGGAGCTTAGTTTATTGGATTTATAGAACAAGAATATAATTTCATCAACACAAATAACTCTTTATTTATTTGATCAAAATTACATAAGTTTAGGGCACAAATCCCAACATAAGACTATTCCAGGGACACCGCAGTAGAATGGTGTGACTGAAATAATGAATAGGACACTAAATGAGCGTGCCAGGAGCATGAGATTACATGCAGGATTGCCTAAGATGTTTTGGGTAGAGGCAATCAACACGACAACCTATCTGATCAATAGGAGCCCGACCACATCACTAGACTTCAAGTTGCCTGAACAAGTCTTGAGTGGTAAACAGGTAAACCTTTCTCATCTAAAGGTTTTTGGTTGTTTGTCATACTTTCACATTCACACTTTCACATTGATGTTGCAGTTAGGAGTAAACTAGATGCCAAATCCAAGAAGTGTTATTTTCTTGAGTATGGTGGAGCTGAGATTGGCTATAAATTTTGAGATGACCAAAATAGAAAGATGCTTAGAAGTAAGGATGTGATCTTCAAGGAAGAAGTTCTGTACAAAGACAGAACAATAGTTAATACAAAGTAAGATGAAAACACAGAAGAGAAGACTCAGTATATAAGTCTTCCTAAAGTTGAGACCAAGATAGTGAGAGTTGAAGATCAGAATACAGTTACTCCTGAAGAAACAGTTGTGGAATCTGAGGAACAAGTTGTAGGACCAAATGAGCAGACTGTAGAGCTTGATGAAGTTCCGAGAACGCCACCTACAACAGTCAGGAAGTTTATCAGGACTATCAGACCACTAAAGAGGTATTCCCCCTACTTTGAATTATATATTATTGACTGACAGAGGTGAACCTGAATGTTATGATGAGACGGTTCAACTAGAAGATTCTGTCAAGTGGGAGTTGGCCATGAAGGATGAGATGGATTCTCTTATGACGAATCAGACATGGCAACTCGCTGAGTTACCAAGAGGTAAGAAAGGTTTGCAGAACAAATGGGTTGATAGAATCAAGCAAGAGTCTGATGGTAGCAAAAGGTATAAAGCAAGGCTTATAGTCAAAGGCTTTCAAAAGAAAGAAGGTAATGACTTTAATGAAATATTTTCTCCTGTAGTTAAATTAACTACTATTAGAACTGTGTTGTCAATAGTGGTAGAAGAGGATCTGTTTCTGGAACAGATGGATGTAAAGACAGTTTTTCTTCATGGTGATTTGGAGGAAAAAATTTACACGGTACAACCACAGGGGTTTTATAGTTCAGGGACATGAGAAAATGATTTGCAAACTTCAGATAAGCTTGTATGGTCTAAAACAAGCTCCAGACAGTGGTATAAGAAGTTTGATAGTTTTATGTGTAACAGTGGATTTGAGAGATGTCAGGAAGATCACTGTTGCTACATAAGGTCCCAAGGTAACTCATGCATTATTTTACTGCTATATGTTGATGATATGTTGATAGCATGTGCAAACAAACAGGAAATTCTGAAGATAAAGGTTGAATTATCTAAAGAATTTAATATGAAAGATTTGGGAGCTGCCAAACAAATCTTAGGAATGAGGATTGAGAGAAAATATGGTACATTGACTTTGTCACAGGAAGAATATGTGAAAAAGGTTTTGAACAGATTTCACATGGAAGATGCAAAACCTGTGAGTACTCTTTTAGCCTGCCATTTTAAATTATCTAAGGAGCACTCACCCACTATTGAGCATGAAAGAGATCACATGGCTAGAGTGCCATATGCTTCAGCTGTAGGAAGCCTAATGTACGCCATGGTTTACACAAGACCAGACATTGCACATGCAGTGGGGGTTGTTAATAGGTATATGACTAATCCAGGGAAGCAACACTGGGAGGCTGTGAAGTGGATTTTCAGATATCGGAGAAGGACAACTGATTATGCTCTGCATTTTAAGAAGTCAGATTTTAAACTGTAGGGTTATGTAGATTCAGATATGGCAGGTGATACAGATGGAAGGAAAAGTACTACCGGGTATGTTTTTACTTTGGGTGATACTGTTATTAGCTGGGTTTCTAGACTGCAGAAGATAGTAGCTTTGTCTACTACAGAGGCTGAGTACATTGTTGTTACTGAGGCAAGTAAAGAGATCACATGACTTTAGTCATTTTTAGAAGAACTTAGCTTGAAACTGGGAAAGGGGACTTTGCATTGTGACAGTTAGAGTGCTATTCATTTAGCAAAAATCTAGTGTTTCATTCGAGGACGAAACACATACACGTGAGGTATCATTTTATCAGATCAGTTTTGGAAGATGGAGTGTTGGTACTTGAAAAGATTCCAGGAAGTCAGAATCCAACGGATATGTTTACCAAGACCGTTCATATTTACAAACTGAAGTTGTGTGCAACTTCAGTTGGACTTCTCCACGAATAGAGAGGAGTCGCTACCGTTACAGGGGAGACATGTTGATTGTTTTGGTCTCCAAGTGGGAGATTGTTAAGTTATGAAGCCCAAAATTAAGGTCCATTGTCCCACTTCTAACACTTAACCTAATTTATAAGTGTATAGATATATATACTTGCATTTTTGGGGGGGCTGTGTTTTTTCAAGAGAAAAAAGTTGCGACAGTATTACAAAAATAAAAAAAACAGAGCATTACGTGAAGTTTTTTTTCTTTGGCGTTGTTTTACAAGAGCGCCTTTTCTCCATTGAAGAGTTTTGTTGTAGTGTGATTCATGAGCCTTTTCCTTGAGAGAAAAGTGAGAGAAATCACCCTTGAGTATTGTAAACTCTTGTAACTTCCTCCTTGACAATTTTAGTGGAACCTGCATCGGTAGCAGAGAACTGGACGTAGCCATCATTAGGTGAACTAGTATAAATTGATTTATTTATCGTTCTTGTATCTTAAAGGTTTAGGTTGATTTATCTATTCTTTTAGGCTTGTTAATTCCAAATTGATTATTCCGCAAAATATTTGGAATTATAACCTGATCTGGGATTTTGGATAAAATATATATTGTCTGAATCTGGTAGAATTTAGATTGATTGTATTTTGTCACATTCACACCTAACAACTATAGATTTGGTTCACATATTTTTTTTCTCTAAACTCACTTTGTTTTTCTTCTTATTCACTTGCTTGATATGATACATACCAAAATGACCCTATTTATAGGACTTATGGAAAACTCTAGATCCATGACTTCCTTACATAAATATAAACTCAAACTTATGAATATAAAACTTTGATACATAAACAACTCCTATCCAAAACTTCTAAATCCATTAACAATGCCATATGAATGTGTAAACATATCATTAAAAATATGTTTAATTAACTTTCCAACATCCAGTGCTTGTTTTTAAGAAATGGTAGTTATGATTTTGAAAAGCTATCTTATAAAGTCATGTATTCTGGTTTCATTATCCGAACACCAATTGTTTTCTATTCTTCTTCTTCATCCCAAGCCAGTTATTTAAGGAAAGCTTGTCATTTGCTTAACTTATGGGAAATAAAACTCCTGGTTCCGAGTTCTTGAATTTCTAGTCCTCAACTTGCCTGAATCTATATTTTTACATTATCAATAACATAAATTATTTCATTACACGATGATAATGTTTTCACATTACGTGATTGTTGTATGTGGTGTGATGGAGATAGCTTGTTTGTCTGTCATATAATTACTTGAAAACTTGTCTTGTAACTTTGTTTTTTTTATAAAATTCGTTTTCTTATTGAAAATGCAGGCAATTACAGTCTTGAATATCTGATGGAAATGATAGCTTTGCATTTAGATGGTACATGTGTGGAATGTGATACATGGAGAGAGTTGGCTATGTGTTTTCTGAAACTTTTTCAATTGGAAGAGGATAGAATATCAACATGTTCAATTGGGACAGGTTGA

mRNA sequence

ATGGGGAATCCAACGCGCATCACTTCCTCAAAATTTCAAGGCACAATTGGAGCCGTGTTTGTAGAGGCTTTTGCCTTCTATCTTCGCTCCCTTTTTGGACTGTTGTTGTTGGTTGGAGGTCGAGTTGACAAAGCACTCAATCAAATGGAAAATATCTGTCGTGATGCCAATGCAACACTTCTCAAAGAACATTTTGATCGTAGTAACGATGTCTTGCTTTCAACTTGTTATGAGCAAATATTGAAGAAGGATCCAACATGTTGTCATTCACTGCTAAAACTAGTTCACATGCATAAAAACACGGTATGCAATTACAGTCTTGAATATCTGATGGAAATGATAGCTTTGCATTTAGATGGTACATGTGTGGAATGTGATACATGGAGAGAGTTGGCTATGTGTTTTCTGAAACTTTTTCAATTGGAAGAGGATAGAATATCAACATGTTCAATTGGGACAGGTTGA

Coding sequence (CDS)

ATGGGGAATCCAACGCGCATCACTTCCTCAAAATTTCAAGGCACAATTGGAGCCGTGTTTGTAGAGGCTTTTGCCTTCTATCTTCGCTCCCTTTTTGGACTGTTGTTGTTGGTTGGAGGTCGAGTTGACAAAGCACTCAATCAAATGGAAAATATCTGTCGTGATGCCAATGCAACACTTCTCAAAGAACATTTTGATCGTAGTAACGATGTCTTGCTTTCAACTTGTTATGAGCAAATATTGAAGAAGGATCCAACATGTTGTCATTCACTGCTAAAACTAGTTCACATGCATAAAAACACGGTATGCAATTACAGTCTTGAATATCTGATGGAAATGATAGCTTTGCATTTAGATGGTACATGTGTGGAATGTGATACATGGAGAGAGTTGGCTATGTGTTTTCTGAAACTTTTTCAATTGGAAGAGGATAGAATATCAACATGTTCAATTGGGACAGGTTGA

Protein sequence

MGNPTRITSSKFQGTIGAVFVEAFAFYLRSLFGLLLLVGGRVDKALNQMENICRDANATLLKEHFDRSNDVLLSTCYEQILKKDPTCCHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRISTCSIGTG
Homology
BLAST of Tan0010066.1 vs. NCBI nr
Match: XP_022941583.1 (uncharacterized protein LOC111446895 [Cucurbita moschata])

HSP 1 Score: 191.4 bits (485), Expect = 5.7e-45
Identity = 97/128 (75.78%), Postives = 108/128 (84.38%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENICRD+NATL       L EHFD SN +LLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICRDSNATLPFRLRAALVEHFDHSNVLLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLVHMH+N   NYSLE L+EMIALHLDGTC E DTWRELAMCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVHMHRNG--NYSLESLLEMIALHLDGTCAEYDTWRELAMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. NCBI nr
Match: XP_023536647.1 (uncharacterized protein LOC111797853 [Cucurbita pepo subsp. pepo])

HSP 1 Score: 191.4 bits (485), Expect = 5.7e-45
Identity = 97/128 (75.78%), Postives = 108/128 (84.38%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENICRD+NATL       L EHFD SN +LLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICRDSNATLPFRLRAALVEHFDHSNVLLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLVHMH+N   NYSLE L+EMIALHLDGTC E DTWRELAMCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVHMHRNG--NYSLESLLEMIALHLDGTCAEYDTWRELAMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. NCBI nr
Match: KAG7031054.1 (hypothetical protein SDJN02_05093 [Cucurbita argyrosperma subsp. argyrosperma])

HSP 1 Score: 189.1 bits (479), Expect = 2.8e-44
Identity = 96/128 (75.00%), Postives = 107/128 (83.59%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENICRD+NATL       L EHFD SN +LLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICRDSNATLPFRLRAALVEHFDHSNVLLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLVHMH+N   NYSLE L+EMIALHLDGTC E DTWREL MCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVHMHRNG--NYSLESLLEMIALHLDGTCAEYDTWRELDMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. NCBI nr
Match: KAG6600392.1 (hypothetical protein SDJN03_05625, partial [Cucurbita argyrosperma subsp. sororia])

HSP 1 Score: 189.1 bits (479), Expect = 2.8e-44
Identity = 96/128 (75.00%), Postives = 107/128 (83.59%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENICRD+NATL       L EHFD SN +LLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICRDSNATLPFRLRAALVEHFDHSNVLLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLVHMH+N   NYSLE L+EMIALHLDGTC E DTWREL MCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVHMHRNG--NYSLESLLEMIALHLDGTCAEYDTWRELDMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. NCBI nr
Match: XP_022979683.1 (uncharacterized protein LOC111479331 [Cucurbita maxima])

HSP 1 Score: 180.6 bits (457), Expect = 1.0e-41
Identity = 95/128 (74.22%), Postives = 105/128 (82.03%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENIC D+NATL       L EHFD SN VLLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICCDSNATLPFRLKAALVEHFDHSNVVLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLV MH+N   NYSLE L+EMIALHLDGT  E DTWRELAMCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVLMHRNG--NYSLESLLEMIALHLDGTRAEYDTWRELAMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. ExPASy TrEMBL
Match: A0A6J1FSH8 (uncharacterized protein LOC111446895 OS=Cucurbita moschata OX=3662 GN=LOC111446895 PE=4 SV=1)

HSP 1 Score: 191.4 bits (485), Expect = 2.7e-45
Identity = 97/128 (75.78%), Postives = 108/128 (84.38%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENICRD+NATL       L EHFD SN +LLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICRDSNATLPFRLRAALVEHFDHSNVLLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLVHMH+N   NYSLE L+EMIALHLDGTC E DTWRELAMCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVHMHRNG--NYSLESLLEMIALHLDGTCAEYDTWRELAMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. ExPASy TrEMBL
Match: A0A6J1IWZ8 (uncharacterized protein LOC111479331 OS=Cucurbita maxima OX=3661 GN=LOC111479331 PE=4 SV=1)

HSP 1 Score: 180.6 bits (457), Expect = 4.8e-42
Identity = 95/128 (74.22%), Postives = 105/128 (82.03%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL++MENIC D+NATL       L EHFD SN VLLSTCYE+ILKKDPTC
Sbjct: 387 LLLIGGRVDKALDEMENICCDSNATLPFRLKAALVEHFDHSNVVLLSTCYEKILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHSL KLV MH+N   NYSLE L+EMIALHLDGT  E DTWRELAMCFLKL Q+EEDR+S
Sbjct: 447 CHSLGKLVLMHRNG--NYSLESLLEMIALHLDGTRAEYDTWRELAMCFLKLSQIEEDRVS 506

BLAST of Tan0010066.1 vs. ExPASy TrEMBL
Match: A0A6J1CPA4 (uncharacterized protein LOC111012919 OS=Momordica charantia OX=3673 GN=LOC111012919 PE=4 SV=1)

HSP 1 Score: 179.1 bits (453), Expect = 1.4e-41
Identity = 94/129 (72.87%), Postives = 104/129 (80.62%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGRVDKAL ++E IC D+NA L       L EHFDRSNDVLLS+CYEQILKKDPTC
Sbjct: 387 LLLIGGRVDKALKEVEKICHDSNAALPFRLRAALVEHFDRSNDVLLSSCYEQILKKDPTC 446

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHL-DGTCVECDTWRELAMCFLKLFQLEEDRI 154
           CHSL KLV MH+N   NY+LE L+EMI LHL DGTCVE D WRELA+CFLKL Q EEDR+
Sbjct: 447 CHSLGKLVDMHRNG--NYTLESLLEMIVLHLDDGTCVEYDKWRELALCFLKLSQSEEDRV 506

BLAST of Tan0010066.1 vs. ExPASy TrEMBL
Match: A0A0A0KXN5 (Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_4G089260 PE=4 SV=1)

HSP 1 Score: 174.1 bits (440), Expect = 4.5e-40
Identity = 89/128 (69.53%), Postives = 102/128 (79.69%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGR+DKAL++ME  C D+NA L       L EHFDRSN+VLLSTCYEQ LKKDPTC
Sbjct: 208 LLLIGGRIDKALDEMEKFCLDSNAALPFRLRAALVEHFDRSNNVLLSTCYEQTLKKDPTC 267

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
           CHS+ KLV MH+N   NY+LE L+EMIALHLDGT  E DTWRELA+CFL+L Q EEDR+S
Sbjct: 268 CHSMGKLVQMHRNG--NYNLESLLEMIALHLDGTYPEYDTWRELAVCFLQLHQSEEDRVS 327

BLAST of Tan0010066.1 vs. ExPASy TrEMBL
Match: A0A1S3BS63 (uncharacterized protein LOC103492916 OS=Cucumis melo OX=3656 GN=LOC103492916 PE=4 SV=1)

HSP 1 Score: 173.3 bits (438), Expect = 7.7e-40
Identity = 90/128 (70.31%), Postives = 102/128 (79.69%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDANATL-------LKEHFDRSNDVLLSTCYEQILKKDPTC 94
           LLL+GGR+DKAL++ME  C D+NA L       L EHFDRSN+VLLSTCYEQ LKKDPTC
Sbjct: 390 LLLIGGRIDKALDEMEKFCLDSNAALPFRLRAALVEHFDRSNNVLLSTCYEQTLKKDPTC 449

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQLEEDRIS 154
            HS+ KLV MH+N   NY+LE L+EMIALHLDGT  E DTWRELA+CFLKL Q EEDR+S
Sbjct: 450 YHSMGKLVQMHRNG--NYNLESLLEMIALHLDGTYPEYDTWRELAVCFLKLHQSEEDRVS 509

BLAST of Tan0010066.1 vs. TAIR 10
Match: AT1G53200.1 (unknown protein; Has 21 Blast hits to 21 proteins in 9 species: Archae - 0; Bacteria - 2; Metazoa - 0; Fungi - 0; Plants - 19; Viruses - 0; Other Eukaryotes - 0 (source: NCBI BLink). )

HSP 1 Score: 91.7 bits (226), Expect = 5.7e-19
Identity = 53/127 (41.73%), Postives = 76/127 (59.84%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDAN-------ATLLKEHFDRSNDVLLSTCYEQILKKDPTC 94
           +LL+GG VD+A+  +E +C   +         L+ E F R++D +L+ CYE ILK DP C
Sbjct: 381 ILLIGGHVDEAMKVVEEMCNKIHDVKPFRIKALMMEKFHRNSD-MLAKCYEDILKIDPCC 440

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQ-LEEDRI 154
             +L KL+ M       YS E L EMIALH++ +  E + W+ELA CF   F+ L+EDR+
Sbjct: 441 ITTLKKLIGMCLED--EYSRESLTEMIALHVEASFPEPEIWKELASCFSNFFENLDEDRL 500

BLAST of Tan0010066.1 vs. TAIR 10
Match: AT1G53200.2 (unknown protein; Has 35333 Blast hits to 34131 proteins in 2444 species: Archae - 798; Bacteria - 22429; Metazoa - 974; Fungi - 991; Plants - 531; Viruses - 0; Other Eukaryotes - 9610 (source: NCBI BLink). )

HSP 1 Score: 91.7 bits (226), Expect = 5.7e-19
Identity = 53/127 (41.73%), Postives = 76/127 (59.84%), Query Frame = 0

Query: 35  LLLVGGRVDKALNQMENICRDAN-------ATLLKEHFDRSNDVLLSTCYEQILKKDPTC 94
           +LL+GG VD+A+  +E +C   +         L+ E F R++D +L+ CYE ILK DP C
Sbjct: 242 ILLIGGHVDEAMKVVEEMCNKIHDVKPFRIKALMMEKFHRNSD-MLAKCYEDILKIDPCC 301

Query: 95  CHSLLKLVHMHKNTVCNYSLEYLMEMIALHLDGTCVECDTWRELAMCFLKLFQ-LEEDRI 154
             +L KL+ M       YS E L EMIALH++ +  E + W+ELA CF   F+ L+EDR+
Sbjct: 302 ITTLKKLIGMCLED--EYSRESLTEMIALHVEASFPEPEIWKELASCFSNFFENLDEDRL 361

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
XP_022941583.15.7e-4575.78uncharacterized protein LOC111446895 [Cucurbita moschata][more]
XP_023536647.15.7e-4575.78uncharacterized protein LOC111797853 [Cucurbita pepo subsp. pepo][more]
KAG7031054.12.8e-4475.00hypothetical protein SDJN02_05093 [Cucurbita argyrosperma subsp. argyrosperma][more]
KAG6600392.12.8e-4475.00hypothetical protein SDJN03_05625, partial [Cucurbita argyrosperma subsp. sorori... [more]
XP_022979683.11.0e-4174.22uncharacterized protein LOC111479331 [Cucurbita maxima][more]
Match NameE-valueIdentityDescription
A0A6J1FSH82.7e-4575.78uncharacterized protein LOC111446895 OS=Cucurbita moschata OX=3662 GN=LOC1114468... [more]
A0A6J1IWZ84.8e-4274.22uncharacterized protein LOC111479331 OS=Cucurbita maxima OX=3661 GN=LOC111479331... [more]
A0A6J1CPA41.4e-4172.87uncharacterized protein LOC111012919 OS=Momordica charantia OX=3673 GN=LOC111012... [more]
A0A0A0KXN54.5e-4069.53Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_4G089260 PE=4 SV=1[more]
A0A1S3BS637.7e-4070.31uncharacterized protein LOC103492916 OS=Cucumis melo OX=3656 GN=LOC103492916 PE=... [more]
Match NameE-valueIdentityDescription
AT1G53200.15.7e-1941.73unknown protein; Has 21 Blast hits to 21 proteins in 9 species: Archae - 0; Bact... [more]
AT1G53200.25.7e-1941.73unknown protein; Has 35333 Blast hits to 34131 proteins in 2444 species: Archae ... [more]
InterPro
Analysis Name: InterPro Annotations of Snake gourd (anguina) v1
Date Performed: 2021-10-25
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR039495TATA box-binding protein-associated factor RNA polymerase I subunit A-likePFAMPF14929TAF1_subAcoord: 35..146
e-value: 3.4E-18
score: 66.2
NoneNo IPR availablePANTHERPTHR36720TAF RNA POLYMERASE I SUBUNIT Acoord: 35..152

Relationships

This mRNA is a part of the following gene feature(s):

Feature NameUnique NameType
Tan0010066Tan0010066gene


The following exon feature(s) are a part of this mRNA:

Feature NameUnique NameType
Tan0010066.1-exonTan0010066.1-exon-LG11:55904496..55904597exon
Tan0010066.1-exonTan0010066.1-exon-LG11:55915953..55916036exon
Tan0010066.1-exonTan0010066.1-exon-LG11:55916115..55916235exon
Tan0010066.1-exonTan0010066.1-exon-LG11:55936091..55936248exon


The following CDS feature(s) are a part of this mRNA:

Feature NameUnique NameType
Tan0010066.1-cdsTan0010066.1-cds-LG11:55904496..55904597CDS
Tan0010066.1-cdsTan0010066.1-cds-LG11:55915953..55916036CDS
Tan0010066.1-cdsTan0010066.1-cds-LG11:55916115..55916235CDS
Tan0010066.1-cdsTan0010066.1-cds-LG11:55936091..55936248CDS


The following polypeptide feature(s) derives from this mRNA:

Feature NameUnique NameType
Tan0010066.1Tan0010066.1-proteinpolypeptide