Sgr022612 (gene) Monk fruit (Qingpiguo) v1

Overview
NameSgr022612
Typegene
OrganismSiraitia grosvenorii (Monk fruit (Qingpiguo) v1)
Descriptionnuclear pore complex protein NUP1
Locationtig00000289: 1571702 .. 1581539 (-)
RNA-Seq ExpressionSgr022612
SyntenySgr022612
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: polypeptideexonCDS
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGCTCTCCATGCTTGTCGATCCGGCGCAGAAGCTCATTACTTCCGGTGCACACAGGCTGTTTTCTACTGTTTTTCGGAAACGCCTTCCGCCGCCGCCGCCGTCATTGCCACTTTCGCGAGGTTTTTTCTTTTTTTCTTTTTGACTTTTTATATGTTTCGTACCATTTGGTTTTCAATTGAAAGGCTCTCAAAGTGGTTGTTAAAATGGTGTTTGTTTTTCATTTTCCGCATTTCTGCTGCTTTTCTGTTTGGAACAATTTTCATTTTGGAGGTTTGAAGATGCCATTTTTTTTTAAAATTTGATTTTACCGAGAAAGTTTTTATAGCCGTGAGGTTTTCTTCTTCTTCTTCTTCTTTTTTTCCCAGTGGCACCCGGATTTATCATTTGTATGATTTTGTTTGTTACTTACGCTTGTTGAAGCTCTTCGCTCTGATTTAGGACTTCAATACTTTAAATATCATCGGGTTGCCTGCTGCTTCTGTGCCGTATATGCTTCAAACATATCAAATTGCAAGTCCAAAGCTTATTAGTCTAATAGTATTGAGACTGCTTGAAATATCGTTTTGTTTCGTTTATTGGATGTCATATATATACGTATATATATTTTTCTCCAAGCATTAGGGGTTTTCTGAGTGCGATTTCTACAAATTTTTCTAAAATGATCTCCCATATGAATTTTAAAAAATTGGTTTCTATTTTTATGAAAAAAAGATTGTTAAAAGATATCTTTTGTCCTTGTATTCATGGATTTAAGCTCAAAACCAAAGCCAAGGCCAAGACCCTGTGTTGCAATGCTATTCGTGCCACCCTTGACCATCTGCGTTGATTGAAACAATGGATCTTTGAAGGCGTTTATAGAGCTCCTGAAGTAGTTTTGGAAAGAAATTTTTTTAGCCTCCTCCTCTTGGTCCTCTTAATATTTTTTAGTATTTACAGTATTTCCTCAATTATAGCCAATTAGAACTCTTTTCTACTGTTACCTTTGGCTTCAGCTCTCTTTTTATATTTTAATCAATGAATGGAATAGTTTTGTTGCCTATGAAGAAAATGTAAATTTAAAAACAGAGTAGATTTGAAGTAAGTTATACTTAAAAATAATCAATAACTATATATCAACAGTTGTCTTAGAAGACAGAAAAAAACTCATGAAACAGCAGAATTGTTTTCTTCTTCTGTTGGTTGTTCTGTAAATTGTCATTAAATGTTATCTAGCCAAACAAAACTTCTGTAAAATCATTTTTAATATTTAAAACTGAAAATTGTTTCTAAACACAGCTCTCAAACATCTTGATTTTTCATTGTACTTTTTTCATGAAAGTAACATGTAAGATTTTGAACTGTACCGATTTTAATACCCATTTTGGAAGCACGTTCCATTATTTTATTATATGTTTTGGGGTAAATAATGACGTCTCTTAGTTATACTATAGTACTTGTTCCGAGTTGAATTTTGGAAGGTGCTTGAGAGTGAGTTGAATCTAATCAGTTGTGGACTTCTATTTTCTTCCTCAGTGGCTCCCTCTCTTCTCATAACCTTGACAGTTTTTTCCACCCAATTGTTGTTTAAATAACTTTTCTCATTAACTGTACTGTTGTGCTTGCACTGACTTTTTTGATGTGGGACAGTTGCTACGTTTTGTGGACATGTAATTAACATCTTAAAAGAGCTTACCAGAAGTTCTTTATTAGATACTTTTAGATTTCTTCTTAATCTTTACTTTTAACAACTTTGTCCATGCATTTTATACTTCCAGCGGCAACGATGAGATGGAAAATAAGCACCAGGAAGAAGTTGCAGCTGTAAGTTTTATCTCTTATGGGTTTTGCTTATTGAGAGTTAGGTGTTTTAAGTTTTATCAATAACCTGTGTATGTGTGTCTTGGTTTTTATTATCCAATTATGCTATTGACTGTAAACACAAAGATTATCAGTGTGTTTTTTTCCCTTCCATGTACTTATATGTCAGGCCAGGCTTCAACATTTTCCCATTGTTCATTTATTGAAATAAAGTTATTGCCTTCTCTTGATGGTTTATTAACTTTTCTTGCCGTGATAGAATCAATAACAGTTGGAGGTAATAGTTTGAGGAAAAATATTTTGGAAAGAGGTTTCATGTATATTTGGAACATTGTCCTTTACTACATTATCACCATTGATGCAATCAGGAATATTTAGTGAACTTGACTGAGACCACTAATTGTTCTTTCCCCCCTTATTTTAATTTTTCCAATAGCACAAGGGTTGGTAGTAACAGTTAGAAAATTGGAATTCTTACTTGAAGGCCGAAAATGTATGTTTCTTATGTTATTAGAGAGCTCCTATAAGCTAATGCTATGGCTAGTTGGCTTTGTTAACTCCTTTAAGCTTGGGGGGATAGAGCTTATGTTTTCTGAAGAATTGTAGATCTCAAGTAGGTGCATTCTTGAGTGAGGCTGTCTGCGGTGCCAAAGGTGTGCCTGATTGTTCTTGGAGCCTAGGCTCGTGCCTAGTTCTGCCTTGAAATAGGGGTTGGAAAAAAAACTATGGACCTCACTGAGGGTGCACAAGGTGCACAATTAACTGGAATCAAGTGGGGGCGTTGTATGTGTGCACCTGACCATGTATCTTAAATCAATGATTTTTCTGGATAGTAATTGAAGAAATATAATAATAGTCAAAATAATTACTAGAGTAGAAGAGTGGATACGTTACTAAAAATTTGCCTGTGTAGATTATATATAGAGGTATATGGAATATAAAAAATTGAATAATGTACATTTTTAAGACCATCTTAATTTGAACTTCTAGAATGTAATCCCAAGTTGGGATTTAGTCTTTGGTTTTATTTTTCCTTGTCCACTTCCTCAGACCTTTAATATTGCAAGATGGAGATTTTTCCTGTGCACTTACATGTGCAGTACCATGCTAGTGTTGCTTAATGGTCTGGTATAACTTCTTTTGATAACAAATGTTTTGGTATAACTATTATCATGAATTGACTAAATAGGAATTGATATTGAGTGGCATTTTATTAATTTACGTTTACGTGACTTGAAATTTGTGTAAGGCCTTCCTTTATCCATCACAAAGTGTATAGTTATGGTTGAAATAGTATTGTTACATATGACCAATCTTTGTAGTTATTTTATTTATTTTTTTTGTGAGAAATAATATGTAAGCAATCGGATTTTTTGGGGTTTTCTTTGTATGATTCTAATCTGATTCAGAGTAGCCTTGGAACCTTATCCATCAATCATCTTAAGCTAAAGATTTTTGCCTCCATGGCTGATTCATAATCGCATGGGTTGTTGTGGCCCCTAGTGGTAAAAAGTTGAGTTGGAAACTGAGATTTCAAAGTTATAGGTTCAAGCCAATGTTGGCTACGTACCTAAGATATTTACTCCTTAATGCCAAATGTTGTAGGATTAGGTAATCTCTGTAAGATTAGTCGAGATGCAGGTAAGCTTAGTTTGACCCTCATGGCTATTAAAAAAATTGAATCAAGGGAAACAAAATCAATAGCTGAATAAACACTGTTGCTGAATAGAAGTGCTTCCTTCTATCTTGTGGTGTAGGCATGCAGCTCACAATTGGCAGAGAACATAGGAAAACAGGAGCTTTGTAATAGATATTTTTTTGTTCTTTTTTGCTCTTTATTTTGACTAATCTGCACGTCTTCTCTTTCTTTCATATTTGTCATTAAAAAAGTGTTATTTTACCCTGTTCTTTTAAAAAAAATAAAGAAATTAGCATTTAGTAGCTCAAGGAGACCTATTTTATTTTCATGAATGCACTATTTTCCTTCACATTGAAGTAAAACTGCTTGCAAAATCTGAGATTTTCTTGTTCTGTAGTCTCAAAATTCTATGGCAACATTTTATGTATTTTTAACAATTCTTTAGGATCCTCCTGGAACTCAAGAAGCTACTAATCTTGATTTTGTTCCGAGCGTCAATGCTAATAACACACACGGGGTGACTGAACTTGAGCAGATTTTGAAGGAGAAGACCTTTACGAGGTAAGGTTTGAGTGTTTGTTGGTCAAATTATTTTTGTCACCTACCTCAATTCTTTTAGAAGATTTTCCTGTTTTAGGTTGTGTTTCCTTTCCTGTTAATTATTATTTGAATGAATTATATAAAAATTTAATATGCATGTATTGCAATTAGTAGCATGCTAAGAAGGTATGTAATAGTGTGATATGCATGTATTGAATGAAATGTATATACCACAATGTCGCTATGAATAACATGTCAATTTTTCTCCATCTGGTTGCAAATTTGGTTTCATTTTTTAAATCCATTTTAGCAATATATGGATTTGATATTTAATATGTCAAATGCTGACCACTTAACAGATCTGAGATTGATCGCTTGACTGAACTTCTGAATTCAAGAATTGTTGATGTTCCAAGTGGGGTTGAAGAGAGGAAATTTGAACTGGTCCCTTCAATGCCCATTATCAGTTATGGAAGACAGGAAGAAACTCCAAAAATTCCAGCTCAAGATAGAGTTAGCACTCACATGGTTCCGACTCATGTTATGAGTGCAAATGTAGGAATCTTTATGTCTATTTTTTGCTGGTTTGGTTTCTGCATTGGTTAATGCTTAATGTTGGTTTTCCATAGTTTGCTAAAACTAAAAACTGCGCTTAGCACTTTTGGCCTTATTGTTACCTGTATAATCATTTCAGGTCCTTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAAGCGTACATGGGCAGCAGGCCTTCAAAAGCAACTCCATTGAATATGGTGTCCCATAGTCAAAAACTTGGGATAGTTTTGCTTCAGGAAATCCCTCAAATCCTCTGCTTTATCTCTTGTGCCAAGGTCTTCTGGCAATGTTGATGTTATTGAAAATGGTTTTGTCACCCCAAGATCTCGAGGTAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCCAGAGTTCGTGCAACCCCTAGCATAAAGGTCCACACTCTAATGCGATACATTTGCTTCACTGTTCAATTGCTCGGTAGGTTATTTATAATTAACTATTTTTTCCTCTCTGGCTGATTCTTTAGAATACTGTAGCCACAACAGATGCCTACTGGGCAACATCGTCCTCATTATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGGGTCTACCCAAGGGGTACAATTTGTGAAAATGATTTTTGCAATATATTGTGTTATTGAATCAACCTCTTAGATCATGTTATTTGATTTGATTCTTCTTTCTGTAGGCTTTAAAACGCAGGAGTTCAGTTTTAGACGATGAAATGGGATCTGTTGGTCCTATTCGCAGAATTCGACAGAAATCCAATCTCGTTTTCTCAAAAGGTTTGAGTTTACCAATTTCAGGCAGTTCCACTTCTATTTCAGTAAGTGGAATTGGTTCTGAGACAGCTCGGCATTTGCAGTCTACAAAGGTTCATCAGTTGTCATCTTCTGCTGGGAAGGCACTTTATTTGAGTGAAACCAAGCGTAATTTGTCCAAAATGTCCACAGGGTTTGAAAATGATATGACACCTCGTACAAGTTTCCCTCGGATTCCCCTTAGGTCAAGTGAGATGGCCTCAAAAATATTAGAGCAGCTTGATAAATTGACACCTCCAAAGGAAAAATCTTCTGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTGTCACCATCAATGCTGCATGGGCCAGCTCTTAGAAGCCTGGAAGATGTGGATTCATCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGCCCAGGATCTTACTTCTCAAAAAAATGACAAGGTTGAGGAAAGTAGTTCGTTAAAATTTAAAGTACCCAATGATAAATCTATTTCTTCAGGTGATGGTATAGGTTTTTCAGTGCCTACTAAGGATGCCGTATCCAGTTCTGGTCTGCCAGTTTCATCTGTTATCCCTTCCTCACAAACAAAATGGGCTTTCCAGATGAGTGCACATGAGGTGTGTGGTTAACCTTCCAGTTTATTCAATAGGTCAATCTCGTCATGGTTCTTTCTTTTAATTTATCCTCATTCATAAATTCCCAACTAAAGAGAAGATGTGTAAATGAAAACAATATTAATCAGGTTGGAGTATTTTTAATTTCGGAATCTAGCTTTTCCATTTTGAAATGAGTGAAATTATTTACCAATCATCAAACATCTTTCAATTTCCGGCATCAAAATTTTCATTCTTTTTATTTCTCAAATACACCCAAACTTGAAAAAGCAAGTAGTAAAGTATATCATTTATGTCTGTGTCCGGTATAAACCTCTATGGTGTAGGCTTACAGTTATCTATTATTTTTCTAGGATTTTGTGGATCTTGATGCCTACTATGTATATGTTCCTTATTGATCCCCCCTAGTTGCAAAATTTATGGGTTGTCTGTCTCTTTTTTGTTAGGATTTTGTGGATATGGATGAGGAAGGATATTCTAATGGGCCAGCGACTAATATATCATCTGAGAGACAAGAAAAAGTTGATGGCCCATTAGTGGCGGTGAGTAAGCCTAGTGATACTGAAGCCATTGCGGTAGATAAACCTCAGGCTTCAATCGATGTTAAACCCTCTACTGTATCTGAGATGAACAAAATAACTGACCAAGCCAAATCTGATGTTCCTGTGACTACTGAAAAGAGCGCCATCTTTTCCTTTCCAACAGCATCTTCACCTAGCATTACAGCCAATGCAATAGGTCCTGAATCAACCTTGAGACCTGAAAAAATTGTTTCATCTGAGGTATCAAAAGCAGCAACTGCACCTGTATTTGGCTTTGGAGATAAGTTGCCATCACAGAAGGAATTGATTACTTCTGCCCCCACCTTTGCTTTTGGAAACAAGGTTACCACCCCAACGAATGAACAAAATGCTGTTCCTGTTGTAACTTCTGAAGGCAATGTTGCACCAACTCAACAAGCTACCGTTCCTACGACATTTAAATTTGGCGATAAAGCTACATTTCCTAGTCCAGCAAATGCTGCTACAGAAAATGGAAATAAGAATGCAAGGTCTCCGTTTAAGTTTGCTTCAGGTTTAGTTAATGAAAAAGAAAGTGCTAAAGTAGGTAGTGCTTCAGTTTTTAAAGCAGAGAGTTCTTTCAGGTCAGTTTCCTCGTTTCCATTGTTAACTTGGACTTGGAGCATGTTTGTTTTGTTTATACCTTTACCTATGTTAGGTTATGTTTCTGTTATTAGCTTATGTGAAATGCATGATAAATGGGATTTTAAATGATCAGTGTACGAATTCTGTTCTGAAGTTATTTGATCGGTTTTATTATTTGAGGAAACTTGGATATCTTTTGTCTTACTAACCCATAGATTCCTGAGAGCTCCTACTTTTCATCTAAATTTTTGTTTTTGTAAAATACTTGCCATCTAATGGAGTACAGATGAATGGAGCTATAGCTAAGTCTGATGTGGTTTATCCCAAGGATTTTGTAATTATAGTCCTTTCTTGATTTTTTCCAGTTGGGGCACTCTTTTGTTAGTTTTTTGACTCTTCGGTGATTGCCTTGTACATTCATTCTCACATTCATTCTCGGTCATACTAAAGCATATATCTTTGCATAATTGCATCTCTTTCTTTAACTGATTCGAGAAATTTTCTTTTGCTTTATCACGTTAGATTTTGTGCACGGCATTATATCAGGTCTTATTTTTTATAACCTTATATGTATTCTATGGGGTGAGAAAAATGTTGTGCATCAACTTCGTTATGTTTGTTAGTGTGGATAACAACCTGATGTGTCTGAACTATGTGTAATTCTTGAATCTAGTTGGCCATGATGGTAACATGTGAACTGGGGATAGTTTTGTTGTTAGTTCTTCTGGAATGTTTTTAAGCAATATGTATGTGTTGCCTGATTTTTGACCTTTGGAGTACAGTTATTACTCTGGTATTTTGATGAATTTTTTACGATACCAAATAACATTGTCTGAAACAAATTTAGTAATGTTTTAAGTGCTGGTTATCTGGAATTTTCATTTTGGACGTGTAACGTTATTGAATTAGTGAATTTAATTTAATGAGGTTAGTCTTGAGGCTTCATCTGCTTTTTATTCATATTTTTTACCCTGAATTTGTAGTCTTGGTGTGACATTTTACCCACATGGCATGATATATTTAAGCTTTGTGCTTTGCGTTGGCCTTGGACATTATGAAATATTGGCATTCTTTTGATTGAAATCTTCCCCAGTCACCTTCCAAAGATAAAGGATGGATGTTTGTTTTTGGGTGGGTGGGAGTTCTGAGCCCTTTTGCAATCATACCTTTTTAGTTGTCTGGTGATACTTGTGGTGCTTTATGGAATTTACTAGGTAATTGATGTTTTAGACGGTTTTAATTGCAGCGGCCCATCATTTGCAATTTCAGAAGAATCTATATCAGATAAAGCTGATAATAAGAGTTCGAGTGCTGGTCATACAGTTGGTACATCTGAGAATGTGTTTTTGTCGTCATCTGTGTCAACATCAACACCAAGTCCGAGTGTATTTTCTTTTAGCTCGCCTAGCACTAATTCAAATCTTAATAATGGATCTCTTGTTTCTACCCCATCAATTTTTTCTTCCCCAGCTACCACCTTTTCTAATAATATTACAAATCATCAAAATTCATCCATCAAACCCTCCCCCACTGCTGTCACTAGCAGCAGTGAATCCATCACCACCAGTAGTCTTTCTACGTCTGCTCCTATGCCTTCTTTTCCAGCTGCACCTATTTTCAAATTTGGGAGCTCTAGTGTTCCTTCAACTTCCGGTTCACCTCTGTCAGCACTGATTGGAGTTGGATCTGTTGAAACCAAGACCAAGCAGGAGACGACCTTTGGCAATTTAAGTGGCATTCCTCCAAGCGAGACATCTGCTAAAGTGTCTAGTACTGGAAGTAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATTCTAATAAACGATCAGAAAATTCAACTTTTGTTCCAGGCAGTGTACCTGCATTTGGGGCTCCGGTTTCAGCTGCTAGTAGTGGGGTTGCATCTTCTACTCAGAGTACGCCTATTATGCAATTCAGTTCATCGTCTACATCATTTGGTTTGGCTGGATCTGGAAACACGGGCTTGTCTTCTGGCAGTTCTTTGTTTTCTTCTTCAGCTCCAGCATCTAATTTGTTCAGTTCAGGCACCACTTTTGGGCTGGTTTCCTCCAGTTCCTCCGCTAATAATTCTATTAGCTCCAGTGCTGGTACTAGTTCTAGTTTCTTTAATTGGCAGCCATCCTCTGCGCCATCGTTTTCTACAGGATTCAACTCAACTCCAACTGGAGGATTCTCCTTCGGGCTCACATCTTCTACTGCTGCTTCTAATAATGCACCTATGCTCTTTGGATCATCGGCCGGTGGTGCATCAACAACCTCCATTTTCTCATTTACTTCGGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTCGGCAATTCTAATCATGCCTTCACCTTTGGTTCAACCCAACCTGTTAATGATCAATCAAATATGGTGGATAGCATGGCTGAGGATACTGTTCAGACAGTCGCGCCAACTACCCCTAGTTTCGGTCAACAGCCCCTCACACCACCTCCATCATCAGGGTTTGTGTTTGGTTCAACAGCTCCTCCACTAGCAGCAAGTCCTTTCCAGTTTGGGAGCCAGCAAAATGTACCTACCCCCCAAAATCCTTCTCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGGAGCTTCTCATTGGGTGCTGGAGGCGGCGACAAAGCTAACCGCAAATACGTGAAAGTTAAAAGCAAACCACGAAAGAAGTAG

mRNA sequence

ATGGCTCTCCATGCTTGTCGATCCGGCGCAGAAGCTCATTACTTCCGGTGCACACAGGCTGTTTTCTACTGTTTTTCGGAAACGCCTTCCGCCGCCGCCGCCGTCATTGCCACTTTCGCGAGGAAATCCCTCAAATCCTCTGCTTTATCTCTTGTGCCAAGGTCTTCTGGCAATGTTGATGTTATTGAAAATGGTTTTGTCACCCCAAGATCTCGAGGTAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCCAGAGTTCGTGCAACCCCTAGCATAAAGAATACTGTAGCCACAACAGATGCCTACTGGGCAACATCGTCCTCATTATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGGGTCTACCCAAGGGGCTTTAAAACGCAGGAGTTCAGTTTTAGACGATGAAATGGGATCTGTTGGTCCTATTCGCAGAATTCGACAGAAATCCAATCTCGTTTTCTCAAAAGGTTTGAGTTTACCAATTTCAGGCAGTTCCACTTCTATTTCAGTAAGTGGAATTGGTTCTGAGACAGCTCGGCATTTGCAGTCTACAAAGGTTCATCAGTTGTCATCTTCTGCTGGGAAGGCACTTTATTTGAGTGAAACCAAGCGTAATTTGTCCAAAATGTCCACAGGGTTTGAAAATGATATGACACCTCGTACAAGTTTCCCTCGGATTCCCCTTAGGTCAAGTGAGATGGCCTCAAAAATATTAGAGCAGCTTGATAAATTGACACCTCCAAAGGAAAAATCTTCTGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTGTCACCATCAATGCTGCATGGGCCAGCTCTTAGAAGCCTGGAAGATGTGGATTCATCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGCCCAGGATCTTACTTCTCAAAAAAATGACAAGGTTGAGGAAAGTAGTTCGTTAAAATTTAAAGTACCCAATGATAAATCTATTTCTTCAGGTGATGGTATAGGTTTTTCAGTGCCTACTAAGGATGCCGTATCCAGTTCTGGTCTGCCAGTTTCATCTGTTATCCCTTCCTCACAAACAAAATGGGCTTTCCAGATGAGTGCACATGAGGATTTTGTGGATATGGATGAGGAAGGATATTCTAATGGGCCAGCGACTAATATATCATCTGAGAGACAAGAAAAAGTTGATGGCCCATTAGTGGCGGTGAGTAAGCCTAGTGATACTGAAGCCATTGCGGTAGATAAACCTCAGGCTTCAATCGATGTTAAACCCTCTACTGTATCTGAGATGAACAAAATAACTGACCAAGCCAAATCTGATGTTCCTGTGACTACTGAAAAGAGCGCCATCTTTTCCTTTCCAACAGCATCTTCACCTAGCATTACAGCCAATGCAATAGGTCCTGAATCAACCTTGAGACCTGAAAAAATTGTTTCATCTGAGGTATCAAAAGCAGCAACTGCACCTGTATTTGGCTTTGGAGATAAGTTGCCATCACAGAAGGAATTGATTACTTCTGCCCCCACCTTTGCTTTTGGAAACAAGGTTACCACCCCAACGAATGAACAAAATGCTGTTCCTGTTGTAACTTCTGAAGGCAATGTTGCACCAACTCAACAAGCTACCGTTCCTACGACATTTAAATTTGGCGATAAAGCTACATTTCCTAGTCCAGCAAATGCTGCTACAGAAAATGGAAATAAGAATGCAAGGTCTCCGTTTAAGTTTGCTTCAGGTTTAGTTAATGAAAAAGAAAGTGCTAAAGTAGGTAGTGCTTCAGTTTTTAAAGCAGAGAGTTCTTTCAGCGGCCCATCATTTGCAATTTCAGAAGAATCTATATCAGATAAAGCTGATAATAAGAGTTCGAGTGCTGGTCATACAGTTGGTACATCTGAGAATGTGTTTTTGTCGTCATCTGTGTCAACATCAACACCAAGTCCGAGTGTATTTTCTTTTAGCTCGCCTAGCACTAATTCAAATCTTAATAATGGATCTCTTGTTTCTACCCCATCAATTTTTTCTTCCCCAGCTACCACCTTTTCTAATAATATTACAAATCATCAAAATTCATCCATCAAACCCTCCCCCACTGCTGTCACTAGCAGCAGTGAATCCATCACCACCAGTAGTCTTTCTACGTCTGCTCCTATGCCTTCTTTTCCAGCTGCACCTATTTTCAAATTTGGGAGCTCTAGTGTTCCTTCAACTTCCGGTTCACCTCTGTCAGCACTGATTGGAGTTGGATCTGTTGAAACCAAGACCAAGCAGGAGACGACCTTTGGCAATTTAAGTGGCATTCCTCCAAGCGAGACATCTGCTAAAGTGTCTAGTACTGGAAGTAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATTCTAATAAACGATCAGAAAATTCAACTTTTGTTCCAGGCAGTGTACCTGCATTTGGGGCTCCGGTTTCAGCTGCTAGTAGTGGGGTTGCATCTTCTACTCAGAGTACGCCTATTATGCAATTCAGTTCATCGTCTACATCATTTGGTTTGGCTGGATCTGGAAACACGGGCTTGTCTTCTGGCAGTTCTTTGTTTTCTTCTTCAGCTCCAGCATCTAATTTGTTCAGTTCAGGCACCACTTTTGGGCTGGTTTCCTCCAGTTCCTCCGCTAATAATTCTATTAGCTCCAGTGCTGGTACTAGTTCTAGTTTCTTTAATTGGCAGCCATCCTCTGCGCCATCGTTTTCTACAGGATTCAACTCAACTCCAACTGGAGGATTCTCCTTCGGGCTCACATCTTCTACTGCTGCTTCTAATAATGCACCTATGCTCTTTGGATCATCGGCCGGTGGTGCATCAACAACCTCCATTTTCTCATTTACTTCGGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTCGGCAATTCTAATCATGCCTTCACCTTTGGTTCAACCCAACCTGTTAATGATCAATCAAATATGGTGGATAGCATGGCTGAGGATACTGTTCAGACAGTCGCGCCAACTACCCCTAGTTTCGGTCAACAGCCCCTCACACCACCTCCATCATCAGGGTTTGTGTTTGGTTCAACAGCTCCTCCACTAGCAGCAAGTCCTTTCCAGTTTGGGAGCCAGCAAAATGTACCTACCCCCCAAAATCCTTCTCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGGAGCTTCTCATTGGGTGCTGGAGGCGGCGACAAAGCTAACCGCAAATACGTGAAAGTTAAAAGCAAACCACGAAAGAAGTAG

Coding sequence (CDS)

ATGGCTCTCCATGCTTGTCGATCCGGCGCAGAAGCTCATTACTTCCGGTGCACACAGGCTGTTTTCTACTGTTTTTCGGAAACGCCTTCCGCCGCCGCCGCCGTCATTGCCACTTTCGCGAGGAAATCCCTCAAATCCTCTGCTTTATCTCTTGTGCCAAGGTCTTCTGGCAATGTTGATGTTATTGAAAATGGTTTTGTCACCCCAAGATCTCGAGGTAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCCAGAGTTCGTGCAACCCCTAGCATAAAGAATACTGTAGCCACAACAGATGCCTACTGGGCAACATCGTCCTCATTATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGGGTCTACCCAAGGGGCTTTAAAACGCAGGAGTTCAGTTTTAGACGATGAAATGGGATCTGTTGGTCCTATTCGCAGAATTCGACAGAAATCCAATCTCGTTTTCTCAAAAGGTTTGAGTTTACCAATTTCAGGCAGTTCCACTTCTATTTCAGTAAGTGGAATTGGTTCTGAGACAGCTCGGCATTTGCAGTCTACAAAGGTTCATCAGTTGTCATCTTCTGCTGGGAAGGCACTTTATTTGAGTGAAACCAAGCGTAATTTGTCCAAAATGTCCACAGGGTTTGAAAATGATATGACACCTCGTACAAGTTTCCCTCGGATTCCCCTTAGGTCAAGTGAGATGGCCTCAAAAATATTAGAGCAGCTTGATAAATTGACACCTCCAAAGGAAAAATCTTCTGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTGTCACCATCAATGCTGCATGGGCCAGCTCTTAGAAGCCTGGAAGATGTGGATTCATCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGCCCAGGATCTTACTTCTCAAAAAAATGACAAGGTTGAGGAAAGTAGTTCGTTAAAATTTAAAGTACCCAATGATAAATCTATTTCTTCAGGTGATGGTATAGGTTTTTCAGTGCCTACTAAGGATGCCGTATCCAGTTCTGGTCTGCCAGTTTCATCTGTTATCCCTTCCTCACAAACAAAATGGGCTTTCCAGATGAGTGCACATGAGGATTTTGTGGATATGGATGAGGAAGGATATTCTAATGGGCCAGCGACTAATATATCATCTGAGAGACAAGAAAAAGTTGATGGCCCATTAGTGGCGGTGAGTAAGCCTAGTGATACTGAAGCCATTGCGGTAGATAAACCTCAGGCTTCAATCGATGTTAAACCCTCTACTGTATCTGAGATGAACAAAATAACTGACCAAGCCAAATCTGATGTTCCTGTGACTACTGAAAAGAGCGCCATCTTTTCCTTTCCAACAGCATCTTCACCTAGCATTACAGCCAATGCAATAGGTCCTGAATCAACCTTGAGACCTGAAAAAATTGTTTCATCTGAGGTATCAAAAGCAGCAACTGCACCTGTATTTGGCTTTGGAGATAAGTTGCCATCACAGAAGGAATTGATTACTTCTGCCCCCACCTTTGCTTTTGGAAACAAGGTTACCACCCCAACGAATGAACAAAATGCTGTTCCTGTTGTAACTTCTGAAGGCAATGTTGCACCAACTCAACAAGCTACCGTTCCTACGACATTTAAATTTGGCGATAAAGCTACATTTCCTAGTCCAGCAAATGCTGCTACAGAAAATGGAAATAAGAATGCAAGGTCTCCGTTTAAGTTTGCTTCAGGTTTAGTTAATGAAAAAGAAAGTGCTAAAGTAGGTAGTGCTTCAGTTTTTAAAGCAGAGAGTTCTTTCAGCGGCCCATCATTTGCAATTTCAGAAGAATCTATATCAGATAAAGCTGATAATAAGAGTTCGAGTGCTGGTCATACAGTTGGTACATCTGAGAATGTGTTTTTGTCGTCATCTGTGTCAACATCAACACCAAGTCCGAGTGTATTTTCTTTTAGCTCGCCTAGCACTAATTCAAATCTTAATAATGGATCTCTTGTTTCTACCCCATCAATTTTTTCTTCCCCAGCTACCACCTTTTCTAATAATATTACAAATCATCAAAATTCATCCATCAAACCCTCCCCCACTGCTGTCACTAGCAGCAGTGAATCCATCACCACCAGTAGTCTTTCTACGTCTGCTCCTATGCCTTCTTTTCCAGCTGCACCTATTTTCAAATTTGGGAGCTCTAGTGTTCCTTCAACTTCCGGTTCACCTCTGTCAGCACTGATTGGAGTTGGATCTGTTGAAACCAAGACCAAGCAGGAGACGACCTTTGGCAATTTAAGTGGCATTCCTCCAAGCGAGACATCTGCTAAAGTGTCTAGTACTGGAAGTAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATTCTAATAAACGATCAGAAAATTCAACTTTTGTTCCAGGCAGTGTACCTGCATTTGGGGCTCCGGTTTCAGCTGCTAGTAGTGGGGTTGCATCTTCTACTCAGAGTACGCCTATTATGCAATTCAGTTCATCGTCTACATCATTTGGTTTGGCTGGATCTGGAAACACGGGCTTGTCTTCTGGCAGTTCTTTGTTTTCTTCTTCAGCTCCAGCATCTAATTTGTTCAGTTCAGGCACCACTTTTGGGCTGGTTTCCTCCAGTTCCTCCGCTAATAATTCTATTAGCTCCAGTGCTGGTACTAGTTCTAGTTTCTTTAATTGGCAGCCATCCTCTGCGCCATCGTTTTCTACAGGATTCAACTCAACTCCAACTGGAGGATTCTCCTTCGGGCTCACATCTTCTACTGCTGCTTCTAATAATGCACCTATGCTCTTTGGATCATCGGCCGGTGGTGCATCAACAACCTCCATTTTCTCATTTACTTCGGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTCGGCAATTCTAATCATGCCTTCACCTTTGGTTCAACCCAACCTGTTAATGATCAATCAAATATGGTGGATAGCATGGCTGAGGATACTGTTCAGACAGTCGCGCCAACTACCCCTAGTTTCGGTCAACAGCCCCTCACACCACCTCCATCATCAGGGTTTGTGTTTGGTTCAACAGCTCCTCCACTAGCAGCAAGTCCTTTCCAGTTTGGGAGCCAGCAAAATGTACCTACCCCCCAAAATCCTTCTCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGGAGCTTCTCATTGGGTGCTGGAGGCGGCGACAAAGCTAACCGCAAATACGTGAAAGTTAAAAGCAAACCACGAAAGAAGTAG

Protein sequence

MALHACRSGAEAHYFRCTQAVFYCFSETPSAAAAVIATFARKSLKSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKVGSASVFKAESSFSGPSFAISEESISDKADNKSSSAGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSAKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPVNDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGSTAPPLAASPFQFGSQQNVPTPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK
Homology
BLAST of Sgr022612 vs. NCBI nr
Match: XP_022133602.1 (nuclear pore complex protein NUP1 [Momordica charantia])

HSP 1 Score: 1505.3 bits (3896), Expect = 0.0e+00
Identity = 887/1069 (82.97%), Postives = 941/1069 (88.03%), Query Frame = 0

Query: 30   SAAAAVIATFARKSL-KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRV 89
            +A+  ++ +FA   L  SS LSLVPR SGNVDVI+NGFVTPR RGRSALYSMAR+PYSRV
Sbjct: 235  AASQKLVDSFASGDLSNSSTLSLVPRPSGNVDVIDNGFVTPRPRGRSALYSMARLPYSRV 294

Query: 90   RATPSIKNTVATTDAYWAT-SSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIR 149
            RAT SIKNTVATTDAY A  SSS SQSAWEQGRL+GS QGALKRRSSVLD+EMGSVGPIR
Sbjct: 295  RATSSIKNTVATTDAYRAAPSSSSSQSAWEQGRLVGSNQGALKRRSSVLDNEMGSVGPIR 354

Query: 150  RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETK 209
            RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETA+  QSTKVHQL SSAGKALY +ETK
Sbjct: 355  RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETAQRFQSTKVHQLPSSAGKALYSNETK 414

Query: 210  RNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNS 269
             NLSKMS  FENDM+P +SFPRIPLRSSEMASKILEQLDKLTPPKEKSSE KL  VRNNS
Sbjct: 415  CNLSKMSAEFENDMSPSSSFPRIPLRSSEMASKILEQLDKLTPPKEKSSEAKLF-VRNNS 474

Query: 270  PMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPN 329
            PMKLSPSMLHGPALRSLEDVDSSKYLENV+ I SNDAQDLTSQ+NDKVEESSSLKFK P 
Sbjct: 475  PMKLSPSMLHGPALRSLEDVDSSKYLENVKGIPSNDAQDLTSQRNDKVEESSSLKFKAPK 534

Query: 330  DKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGP 389
            DKSI++ DG+  SVPTK A SSSGLPVSSV PSSQTKWAFQMSAHEDFVDM+EEGYSNGP
Sbjct: 535  DKSIATSDGMVSSVPTKVAASSSGLPVSSVAPSSQTKWAFQMSAHEDFVDMEEEGYSNGP 594

Query: 390  ATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPV 449
            AT+ISS R+EKVDGPLVAVSKPSDT+  A DK QASI VKPS  SEMNKITD  KSD P 
Sbjct: 595  ATDISSGRREKVDGPLVAVSKPSDTDTTAADKSQASIHVKPS--SEMNKITDLGKSDAPA 654

Query: 450  TTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKEL 509
            TTEKS IFSF  AS PSITA+ + PE   R EKIVSSE+ KAATAP+FGFGDK P QKEL
Sbjct: 655  TTEKSPIFSFSAASPPSITASVVDPELASRSEKIVSSEIPKAATAPLFGFGDKSPIQKEL 714

Query: 510  ITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAAT 569
            ITSAPTFAFGN VTTPTN+QN V  V SEGNVAPTQ A V TTFKFGDKATFP   NA T
Sbjct: 715  ITSAPTFAFGNNVTTPTNKQNVVSDVASEGNVAPTQPAPVSTTFKFGDKATFPISGNAVT 774

Query: 570  ENGNKNARSPFKFASGLVNEKESAKVGSASVFKAESSFSGPSFAISEESISDKADNKSSS 629
            ENGNKN+ SPFKF+S LV+EKESAKVGSAS+FKAESSFS PSFA+S+ES+SDK DNKS S
Sbjct: 775  ENGNKNSGSPFKFSSPLVDEKESAKVGSASIFKAESSFSIPSFAVSKESMSDKVDNKSLS 834

Query: 630  AGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNN 689
             G TV TSENVFL SSVSTSTP+PSVFSFSSPST SNLNNGSL  TPSIFSSP T+F+NN
Sbjct: 835  TGLTVSTSENVFL-SSVSTSTPTPSVFSFSSPSTTSNLNNGSLAPTPSIFSSPVTSFANN 894

Query: 690  ITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSA 749
            ITN QNSSIKPS  A TSSSE+IT++ LSTSAPMPSFPAAPIFKFGSSSVPSTS S +SA
Sbjct: 895  ITN-QNSSIKPSLPAATSSSETITSTGLSTSAPMPSFPAAPIFKFGSSSVPSTSTSTMSA 954

Query: 750  LIGVGSVETKTKQ-ETTFGNLSGIPPSETSAKVSSTGSSVFQFGAASTTSDSNKRSENST 809
            L GVGSVETKT Q  TTFGNLSGIPPSET AK SSTGSSVFQFGAASTTSDSNKR ENST
Sbjct: 955  LTGVGSVETKTTQVTTTFGNLSGIPPSETLAKASSTGSSVFQFGAASTTSDSNKRPENST 1014

Query: 810  FVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSA 869
            F+PG+VPAFGA VS+A+SGVA+STQ TP+MQFSSSSTSFGLA  GNTGLSSGSSLF SSA
Sbjct: 1015 FLPGNVPAFGAAVSSATSGVAASTQ-TPVMQFSSSSTSFGLA--GNTGLSSGSSLFGSSA 1074

Query: 870  PASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 929
            PASNLFSSG  FGL SSSS+ANNS SS +G SSSFFNWQPSSAPSFSTGFNSTPTGGFSF
Sbjct: 1075 PASNLFSSGAGFGLASSSSAANNSNSSGSGMSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 1134

Query: 930  GLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV- 989
            GLTSS+AASN+AP LFGSSA GAST  IFSFTSAATAASSQPA GNSNHAFTFGST P  
Sbjct: 1135 GLTSSSAASNSAPALFGSSA-GASTAGIFSFTSAATAASSQPAIGNSNHAFTFGSTPPAN 1194

Query: 990  NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGSTAPPLAASPFQFGSQQNV 1049
            NDQ++M DSMAEDTVQ VAPTTPSFGQQPLTPPPSSGFVFGST  PLAA+PFQFG QQNV
Sbjct: 1195 NDQASMEDSMAEDTVQAVAPTTPSFGQQPLTPPPSSGFVFGSTTTPLAANPFQFGGQQNV 1254

Query: 1050 PTPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            PTPQNPS FQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSK RKK
Sbjct: 1255 PTPQNPSRFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKSRKK 1294

BLAST of Sgr022612 vs. NCBI nr
Match: XP_038884354.1 (nuclear pore complex protein NUP1-like isoform X2 [Benincasa hispida])

HSP 1 Score: 1419.8 bits (3674), Expect = 0.0e+00
Identity = 852/1088 (78.31%), Postives = 922/1088 (84.74%), Query Frame = 0

Query: 23   YCFSETPSAAAAVIATFARK---------SLKSSALSLVPRSSGNVDVIENGFVTPRSRG 82
            Y  S  P A    +A+ ++K           KS  LSL+PRS GN DV ENGFVTPRSRG
Sbjct: 223  YMGSRPPKATPLSMASHSQKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRG 282

Query: 83   RSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRS 142
            RSALYSMARMPYSRVRATPSIKN+VATTDAY ATSSS SQSAW QGRLLGS QGALKRR+
Sbjct: 283  RSALYSMARMPYSRVRATPSIKNSVATTDAYRATSSS-SQSAWGQGRLLGSEQGALKRRN 342

Query: 143  SVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQL 202
            SVLDDEMGSVGPIRRIR KSN +F KGLSLP   SSTSI VSGIGSET++HLQSTKVH  
Sbjct: 343  SVLDDEMGSVGPIRRIRHKSNHLFPKGLSLP--SSSTSIPVSGIGSETSQHLQSTKVHPF 402

Query: 203  SSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKE 262
            SS+ GK LY SETKRNLSKMS   ENDM P +SFP+IPLRSSEMASKILEQLDKLTPPKE
Sbjct: 403  SSTGGKGLYSSETKRNLSKMSAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKE 462

Query: 263  KSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKND 322
            KSSELKLLSVRNNSP KLSPSMLHGPALRSLEDVDS+KYLENVE IRSNDA DLTS+KND
Sbjct: 463  KSSELKLLSVRNNSPSKLSPSMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKND 522

Query: 323  KVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHE 382
            K EESS LKFKVPNDKSIS+G+G+G SVP K+ VS SG  VS V PS QTK AFQMSAHE
Sbjct: 523  KFEESSPLKFKVPNDKSISTGNGVGSSVP-KETVSGSGQQVSFVGPSLQTKCAFQMSAHE 582

Query: 383  DFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSE 442
            DFVDMDEEGYSNGP  +IS ERQEKV+  LVAVSKP++TEAI VDKPQASI+ KP TVS 
Sbjct: 583  DFVDMDEEGYSNGPVADISIERQEKVNS-LVAVSKPNNTEAITVDKPQASIEAKPPTVSA 642

Query: 443  MNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAP 502
            MNKI DQ KSDVPVTTEKS IFSFPT SSPSITAN IGPES +RPEKI SSEV KAAT P
Sbjct: 643  MNKINDQGKSDVPVTTEKSPIFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTP 702

Query: 503  VFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKF 562
            +FGFG+K PSQKE ++ APTFAF NK+TT TNEQNA+PVVTSEGNV PTQQA+ PTTFKF
Sbjct: 703  IFGFGEKFPSQKEAVSFAPTFAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKF 762

Query: 563  GDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKV-GSASVFKAESSFSG-PSFA 622
            GDKATFP PANAATENGNKN  SP  FAS LVNEKE AK  GSASVFKAESS S  PSF 
Sbjct: 763  GDKATFPIPANAATENGNKNEGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSIPSFG 822

Query: 623  ISEESISDKADNKSSSAGHTVGTSENVFLSS-SVSTSTPSPSVFSFSSPSTNSNLNNGSL 682
            + +ES+S+KA +KSSSAG  VGTS ++F SS S S STP+  +FSFSSPSTNSNLNNGSL
Sbjct: 823  VPKESMSEKAGDKSSSAGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLNNGSL 882

Query: 683  VSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIF 742
            VST   F +PATTFSNNITN QNSSIKPS  A  S+SE +TT+SL TS+ MPSF AAPI 
Sbjct: 883  VSTTPSFPTPATTFSNNITN-QNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSAAPIS 942

Query: 743  KFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSA-KVSSTGSSVFQF 802
            KFGSSSVPSTS   LSA  GVGS+E+KTKQETTFGNLSGIPPS+ SA KVSSTGSSVFQF
Sbjct: 943  KFGSSSVPSTSAPALSAPSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSSVFQF 1002

Query: 803  GAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAG 862
            GAAST SDSNKR  NSTF P +VP FGA  S  SSG+ASSTQSTP++QF+SSSTSFGL  
Sbjct: 1003 GAASTPSDSNKRPANSTFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSFGL-- 1062

Query: 863  SGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSA 922
            +GNTGL+SGSSLF SSAPASNLF+SG TFGL SSSSS NNS+SSSAGTSSSFFNWQPSS 
Sbjct: 1063 TGNTGLASGSSLFGSSAPASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQPSST 1122

Query: 923  PSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPA 982
            PSFSTGF+STPTGGFSFGL+SS+AASN+AP+LFGSS+ G+ T S+FSFTSAATA +SQPA
Sbjct: 1123 PSFSTGFSSTPTGGFSFGLSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATTSQPA 1182

Query: 983  FGNSNHAFTFGSTQPV-NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGST 1042
            FGNSNH FTFGST P  NDQ+NM DSMAEDTVQTV    PSFGQQPLTPPPSSGFVFGST
Sbjct: 1183 FGNSNHGFTFGSTPPANNDQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFVFGST 1242

Query: 1043 APPLAASPFQF-GSQQNVPTPQ-NPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVK 1095
            APPL ASPFQF GSQQNVPTPQ NPSPFQASGSLDFNASAGGSFSLGAGGGDK+NRK+VK
Sbjct: 1243 APPLGASPFQFGGSQQNVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVK 1300

BLAST of Sgr022612 vs. NCBI nr
Match: XP_038884353.1 (nuclear pore complex protein NUP1-like isoform X1 [Benincasa hispida])

HSP 1 Score: 1418.3 bits (3670), Expect = 0.0e+00
Identity = 852/1092 (78.02%), Postives = 922/1092 (84.43%), Query Frame = 0

Query: 23   YCFSETPSAAAAVIATFARK---------SLKSSALSLVPRSSGNVDVIENGFVTPRSRG 82
            Y  S  P A    +A+ ++K           KS  LSL+PRS GN DV ENGFVTPRSRG
Sbjct: 223  YMGSRPPKATPLSMASHSQKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRG 282

Query: 83   RSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRS 142
            RSALYSMARMPYSRVRATPSIKN+VATTDAY ATSSS SQSAW QGRLLGS QGALKRR+
Sbjct: 283  RSALYSMARMPYSRVRATPSIKNSVATTDAYRATSSS-SQSAWGQGRLLGSEQGALKRRN 342

Query: 143  SVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQL 202
            SVLDDEMGSVGPIRRIR KSN +F KGLSLP   SSTSI VSGIGSET++HLQSTKVH  
Sbjct: 343  SVLDDEMGSVGPIRRIRHKSNHLFPKGLSLP--SSSTSIPVSGIGSETSQHLQSTKVHPF 402

Query: 203  SSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKE 262
            SS+ GK LY SETKRNLSKMS   ENDM P +SFP+IPLRSSEMASKILEQLDKLTPPKE
Sbjct: 403  SSTGGKGLYSSETKRNLSKMSAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKE 462

Query: 263  KSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKND 322
            KSSELKLLSVRNNSP KLSPSMLHGPALRSLEDVDS+KYLENVE IRSNDA DLTS+KND
Sbjct: 463  KSSELKLLSVRNNSPSKLSPSMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKND 522

Query: 323  KVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHE 382
            K EESS LKFKVPNDKSIS+G+G+G SVP K+ VS SG  VS V PS QTK AFQMSAHE
Sbjct: 523  KFEESSPLKFKVPNDKSISTGNGVGSSVP-KETVSGSGQQVSFVGPSLQTKCAFQMSAHE 582

Query: 383  DFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSE 442
            DFVDMDEEGYSNGP  +IS ERQEKV+  LVAVSKP++TEAI VDKPQASI+ KP TVS 
Sbjct: 583  DFVDMDEEGYSNGPVADISIERQEKVNS-LVAVSKPNNTEAITVDKPQASIEAKPPTVSA 642

Query: 443  MNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAP 502
            MNKI DQ KSDVPVTTEKS IFSFPT SSPSITAN IGPES +RPEKI SSEV KAAT P
Sbjct: 643  MNKINDQGKSDVPVTTEKSPIFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTP 702

Query: 503  VFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKF 562
            +FGFG+K PSQKE ++ APTFAF NK+TT TNEQNA+PVVTSEGNV PTQQA+ PTTFKF
Sbjct: 703  IFGFGEKFPSQKEAVSFAPTFAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKF 762

Query: 563  GDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKV-GSASVFKAESSFSG----- 622
            GDKATFP PANAATENGNKN  SP  FAS LVNEKE AK  GSASVFKAESS S      
Sbjct: 763  GDKATFPIPANAATENGNKNEGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSFNCSI 822

Query: 623  PSFAISEESISDKADNKSSSAGHTVGTSENVFLSS-SVSTSTPSPSVFSFSSPSTNSNLN 682
            PSF + +ES+S+KA +KSSSAG  VGTS ++F SS S S STP+  +FSFSSPSTNSNLN
Sbjct: 823  PSFGVPKESMSEKAGDKSSSAGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLN 882

Query: 683  NGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPA 742
            NGSLVST   F +PATTFSNNITN QNSSIKPS  A  S+SE +TT+SL TS+ MPSF A
Sbjct: 883  NGSLVSTTPSFPTPATTFSNNITN-QNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSA 942

Query: 743  APIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSA-KVSSTGSS 802
            API KFGSSSVPSTS   LSA  GVGS+E+KTKQETTFGNLSGIPPS+ SA KVSSTGSS
Sbjct: 943  APISKFGSSSVPSTSAPALSAPSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSS 1002

Query: 803  VFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSF 862
            VFQFGAAST SDSNKR  NSTF P +VP FGA  S  SSG+ASSTQSTP++QF+SSSTSF
Sbjct: 1003 VFQFGAASTPSDSNKRPANSTFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSF 1062

Query: 863  GLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQ 922
            GL  +GNTGL+SGSSLF SSAPASNLF+SG TFGL SSSSS NNS+SSSAGTSSSFFNWQ
Sbjct: 1063 GL--TGNTGLASGSSLFGSSAPASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQ 1122

Query: 923  PSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAAS 982
            PSS PSFSTGF+STPTGGFSFGL+SS+AASN+AP+LFGSS+ G+ T S+FSFTSAATA +
Sbjct: 1123 PSSTPSFSTGFSSTPTGGFSFGLSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATT 1182

Query: 983  SQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFV 1042
            SQPAFGNSNH FTFGST P  NDQ+NM DSMAEDTVQTV    PSFGQQPLTPPPSSGFV
Sbjct: 1183 SQPAFGNSNHGFTFGSTPPANNDQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFV 1242

Query: 1043 FGSTAPPLAASPFQF-GSQQNVPTPQ-NPSPFQASGSLDFNASAGGSFSLGAGGGDKANR 1095
            FGSTAPPL ASPFQF GSQQNVPTPQ NPSPFQASGSLDFNASAGGSFSLGAGGGDK+NR
Sbjct: 1243 FGSTAPPLGASPFQFGGSQQNVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNR 1302

BLAST of Sgr022612 vs. NCBI nr
Match: XP_038884355.1 (nuclear pore complex protein NUP1-like isoform X3 [Benincasa hispida])

HSP 1 Score: 1418.3 bits (3670), Expect = 0.0e+00
Identity = 852/1092 (78.02%), Postives = 922/1092 (84.43%), Query Frame = 0

Query: 23   YCFSETPSAAAAVIATFARK---------SLKSSALSLVPRSSGNVDVIENGFVTPRSRG 82
            Y  S  P A    +A+ ++K           KS  LSL+PRS GN DV ENGFVTPRSRG
Sbjct: 219  YMGSRPPKATPLSMASHSQKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRG 278

Query: 83   RSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRS 142
            RSALYSMARMPYSRVRATPSIKN+VATTDAY ATSSS SQSAW QGRLLGS QGALKRR+
Sbjct: 279  RSALYSMARMPYSRVRATPSIKNSVATTDAYRATSSS-SQSAWGQGRLLGSEQGALKRRN 338

Query: 143  SVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQL 202
            SVLDDEMGSVGPIRRIR KSN +F KGLSLP   SSTSI VSGIGSET++HLQSTKVH  
Sbjct: 339  SVLDDEMGSVGPIRRIRHKSNHLFPKGLSLP--SSSTSIPVSGIGSETSQHLQSTKVHPF 398

Query: 203  SSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKE 262
            SS+ GK LY SETKRNLSKMS   ENDM P +SFP+IPLRSSEMASKILEQLDKLTPPKE
Sbjct: 399  SSTGGKGLYSSETKRNLSKMSAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKE 458

Query: 263  KSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKND 322
            KSSELKLLSVRNNSP KLSPSMLHGPALRSLEDVDS+KYLENVE IRSNDA DLTS+KND
Sbjct: 459  KSSELKLLSVRNNSPSKLSPSMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKND 518

Query: 323  KVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHE 382
            K EESS LKFKVPNDKSIS+G+G+G SVP K+ VS SG  VS V PS QTK AFQMSAHE
Sbjct: 519  KFEESSPLKFKVPNDKSISTGNGVGSSVP-KETVSGSGQQVSFVGPSLQTKCAFQMSAHE 578

Query: 383  DFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSE 442
            DFVDMDEEGYSNGP  +IS ERQEKV+  LVAVSKP++TEAI VDKPQASI+ KP TVS 
Sbjct: 579  DFVDMDEEGYSNGPVADISIERQEKVNS-LVAVSKPNNTEAITVDKPQASIEAKPPTVSA 638

Query: 443  MNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAP 502
            MNKI DQ KSDVPVTTEKS IFSFPT SSPSITAN IGPES +RPEKI SSEV KAAT P
Sbjct: 639  MNKINDQGKSDVPVTTEKSPIFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTP 698

Query: 503  VFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKF 562
            +FGFG+K PSQKE ++ APTFAF NK+TT TNEQNA+PVVTSEGNV PTQQA+ PTTFKF
Sbjct: 699  IFGFGEKFPSQKEAVSFAPTFAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKF 758

Query: 563  GDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKV-GSASVFKAESSFSG----- 622
            GDKATFP PANAATENGNKN  SP  FAS LVNEKE AK  GSASVFKAESS S      
Sbjct: 759  GDKATFPIPANAATENGNKNEGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSFNCSI 818

Query: 623  PSFAISEESISDKADNKSSSAGHTVGTSENVFLSS-SVSTSTPSPSVFSFSSPSTNSNLN 682
            PSF + +ES+S+KA +KSSSAG  VGTS ++F SS S S STP+  +FSFSSPSTNSNLN
Sbjct: 819  PSFGVPKESMSEKAGDKSSSAGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLN 878

Query: 683  NGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPA 742
            NGSLVST   F +PATTFSNNITN QNSSIKPS  A  S+SE +TT+SL TS+ MPSF A
Sbjct: 879  NGSLVSTTPSFPTPATTFSNNITN-QNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSA 938

Query: 743  APIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSA-KVSSTGSS 802
            API KFGSSSVPSTS   LSA  GVGS+E+KTKQETTFGNLSGIPPS+ SA KVSSTGSS
Sbjct: 939  APISKFGSSSVPSTSAPALSAPSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSS 998

Query: 803  VFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSF 862
            VFQFGAAST SDSNKR  NSTF P +VP FGA  S  SSG+ASSTQSTP++QF+SSSTSF
Sbjct: 999  VFQFGAASTPSDSNKRPANSTFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSF 1058

Query: 863  GLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQ 922
            GL  +GNTGL+SGSSLF SSAPASNLF+SG TFGL SSSSS NNS+SSSAGTSSSFFNWQ
Sbjct: 1059 GL--TGNTGLASGSSLFGSSAPASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQ 1118

Query: 923  PSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAAS 982
            PSS PSFSTGF+STPTGGFSFGL+SS+AASN+AP+LFGSS+ G+ T S+FSFTSAATA +
Sbjct: 1119 PSSTPSFSTGFSSTPTGGFSFGLSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATT 1178

Query: 983  SQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFV 1042
            SQPAFGNSNH FTFGST P  NDQ+NM DSMAEDTVQTV    PSFGQQPLTPPPSSGFV
Sbjct: 1179 SQPAFGNSNHGFTFGSTPPANNDQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFV 1238

Query: 1043 FGSTAPPLAASPFQF-GSQQNVPTPQ-NPSPFQASGSLDFNASAGGSFSLGAGGGDKANR 1095
            FGSTAPPL ASPFQF GSQQNVPTPQ NPSPFQASGSLDFNASAGGSFSLGAGGGDK+NR
Sbjct: 1239 FGSTAPPLGASPFQFGGSQQNVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNR 1298

BLAST of Sgr022612 vs. NCBI nr
Match: XP_022938795.1 (nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata])

HSP 1 Score: 1384.8 bits (3583), Expect = 0.0e+00
Identity = 836/1060 (78.87%), Postives = 903/1060 (85.19%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252  KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311

Query: 105  WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
             AT +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312  RATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371

Query: 165  ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
               SSTSI VSGIGSET++HLQSTKVH  SS AGKA Y SETKRNLSKMS   END TP 
Sbjct: 372  --SSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAESENDRTPS 431

Query: 225  TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
            +SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432  SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491

Query: 285  EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
            EDVDS+KYLENVEDIRSND +DLTS+K DK E+SS LK KVP+DKSIS+G G+G SVP+K
Sbjct: 492  EDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSK 551

Query: 345  DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
            D VSSSGL VS V PSS TK AFQMS  EDFVDMD+E YSNGP +  S ER+EKVD  LV
Sbjct: 552  DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERREKVDDSLV 611

Query: 405  AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
            AV KPSDTEAI VDKPQASI  KPS VSEM KI DQAKSDVPVTTEKS+IFSFPTAS  S
Sbjct: 612  AVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSS 671

Query: 465  ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
             TAN I PEST RPEKI SSEV KAA AP+FGFG+KLPSQK+ + S+PTF FGNKVTT T
Sbjct: 672  TTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTST 731

Query: 525  NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
            NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ ATENGN  A SPFKFAS L
Sbjct: 732  NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSL 791

Query: 585  VNEKESAKVGSASVFKAESSFSGP-SFAISEESISDKA-DNKSSSAGHTVGTSENVFLSS 644
            VNEKE AK GSASVFK+ESS S   SF + +ES+S+KA D KSSSAG +VGTS N+ LSS
Sbjct: 792  VNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGTSGNLLLSS 851

Query: 645  SVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTA 704
               +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKPS  A
Sbjct: 852  --VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKPSLNA 911

Query: 705  VTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQET 764
             TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPS+     SA  GVGSVETKTKQET
Sbjct: 912  ATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPSGVGSVETKTKQET 971

Query: 765  T-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVS 824
            T FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK+ E STF P SVP+FGAPV 
Sbjct: 972  TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1031

Query: 825  AASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGL 884
             ASSGVASSTQSTP+  FSSSSTSFGL  +GNTGL+SG+SL  SSAPASNLF+SG TFG 
Sbjct: 1032 PASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFTSGATFGF 1091

Query: 885  VSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPM 944
              SSSSANNS+SS AGTSSSFFNWQ SSAPSFS+GF STPTGGFSFGL SS+AAS+++PM
Sbjct: 1092 -GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPM 1151

Query: 945  LFGSS-AGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAED 1004
            LFGSS  G ASTTS+FSFTSAATAA SQPAFG SNH FTFGST P  ND +NM DSMAED
Sbjct: 1152 LFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAED 1211

Query: 1005 TVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQNPSPF 1064
            TVQTVA  T  PSFGQQPLTPPPSSGFVFGSTAP PL A+PFQF GSQQNVPTPQNP+PF
Sbjct: 1212 TVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPF 1271

Query: 1065 QASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            QASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 QASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297

BLAST of Sgr022612 vs. ExPASy Swiss-Prot
Match: Q9CAF4 (Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 SV=1)

HSP 1 Score: 270.4 bits (690), Expect = 8.9e-71
Identity = 384/1133 (33.89%), Postives = 537/1133 (47.40%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KS  +SLV + SG    +ENGFVTPRSRGRSA+YSMAR PYSR +++  I          
Sbjct: 272  KSPTMSLVTKPSGQ-RPLENGFVTPRSRGRSAVYSMARTPYSRPQSSVKI---------- 331

Query: 105  WATSSSLSQSAWEQGRLLGSTQG---ALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGL 164
              +    S S WE+    GS QG    LKRRSSVLD+++GSVGP+RRIRQKSNL  S+ L
Sbjct: 332  -GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLDNDIGSVGPVRRIRQKSNL-SSRSL 391

Query: 165  SLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDM 224
            +LP+S S  S+  +G G +T         H    SA                      + 
Sbjct: 392  ALPVSESPLSVRANG-GEKT--------THTSKDSA----------------------ED 451

Query: 225  TPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPAL 284
             P +SF  +P +SSEMASKIL+QLD            KL+S R  SP KLSPSML GPAL
Sbjct: 452  IPGSSFNLVPTKSSEMASKILQQLD------------KLVSTREKSPSKLSPSMLRGPAL 511

Query: 285  RSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSV 344
            +SL++V++ K+L N+ + ++N + D + QK +   ES S +    ++K+  + DG   + 
Sbjct: 512  KSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQEISRESVSREVLAQSEKTGDAVDGTSKTG 571

Query: 345  PTKDA-VSSSG--LPV-SSVIPSSQTKWAFQMSAHEDFVDMDEE-GYSNGPATNISSERQ 404
             +KD  +   G  +P+ +S+      K +F+MSAHEDF+++D++ G ++ P     +E+Q
Sbjct: 572  SSKDQDMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDFLELDDDLGAASTPCE--VAEKQ 631

Query: 405  EKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFS 464
               +     +S P        +KP    +  PST    N    Q  S+  + TE++   +
Sbjct: 632  NAFEVEKSHISMPIG------EKPLTPSEAMPSTSYISNGDASQGTSNGSLETERNKFVA 691

Query: 465  FP--------TASSPS------ITANAIGPESTLRPEKIVSSEVSK--AATAPVFGFGDK 524
            FP         AS P+         ++I        EK +  E  K  AA  P   F   
Sbjct: 692  FPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPTSEEKRIPLEEPKKPAAVFPNISFS-- 751

Query: 525  LPSQKELI--------------TSAPTFAFGNKVTTPTNEQ----NAVPVVTSEGNVAPT 584
             P    L+              TS+  F        PT  +    N+     S  + APT
Sbjct: 752  -PPATGLLNQNSGASADIKLEKTSSTAFGVSEAWAKPTESKKTFSNSASGAESSTSAAPT 811

Query: 585  QQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKVGS-ASVFKA 644
               ++   F  G  A  P P+N +  +      SP  F   + N      VG   S  ++
Sbjct: 812  LNGSI---FSAGANAVTPPPSNGSLTS------SP-SFPPSISNIPSDNSVGDMPSTVQS 871

Query: 645  ESSFSGPSFAISEESISDKADNKSSSAGHTVGTSENVFLSSSVSTSTP----SPSVFSFS 704
             ++    S    +   S+ ++++S+SA     TS   F   +   S P    S    S  
Sbjct: 872  FAATHNSSSIFGKLPTSNDSNSQSTSASPLSSTSPFKFGQPAAPFSAPAVSESSGQISKE 931

Query: 705  SPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLST 764
            +   N+   N S      + S+  +T    +   +++  K  P  V  SS  +  S+L+ 
Sbjct: 932  TEVKNATFGNTSTFKFGGMASADQST--GIVFGAKSAENKSRPGFVFGSSSVVGGSTLNP 991

Query: 765  SAPMPSFPAAP---IFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSE 824
            S    S P +    IF   SSS P T  S +SA     S  T T   + FG  S    S 
Sbjct: 992  STAAASAPESSGSLIFGVTSSSTPGTETSKISA----SSAATNT-GNSVFGTSSFAFTSS 1051

Query: 825  TSAKV----SSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASST 884
             S+ V    +STGSSVF F A S+ S ++ +S+ S        A  A      SG  +ST
Sbjct: 1052 GSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNL----FGAGNAQTGNTGSGTTTST 1111

Query: 885  QSTPIMQFSS-SSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANN 944
            QS P    SS S+ SFGL  SGN+ L+S SS F  S     +F+S +T  L S++SSA++
Sbjct: 1112 QSIPFQFGSSPSAPSFGL--SGNSSLASNSSPFGFSKSEPAVFTSVSTPQLSSTNSSASS 1171

Query: 945  SISSSA---GTSSSFFNWQPSSAPSFSTGF--NSTPTGGFSFGLTSSTAASNNAPMLFGS 1004
            S + S+   GTS    N  P+S P FS+ F  +STPT  FSFG +S+   S+    +FG+
Sbjct: 1172 SSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-TFSFGGSSAATVSSTTTPIFGA 1231

Query: 1005 SAGGA-STTSIFSFTSAATAASSQPAFGNSN--HAFTFGSTQP--------------VND 1064
            S     S + IF F S       QP FGNS       FG++ P               N 
Sbjct: 1232 STNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFGNSTPGFAFGAPNNGNGINNNQ 1291

Query: 1065 QSNMVDSMAEDTVQT--VAPTTPSFGQQPLTPPPSSGFVFG---STAPPLAASPFQFGSQ 1095
            Q +M DSMAEDT Q    +   P FGQ  ++  P   F FG   +T PP  A+PFQFG Q
Sbjct: 1292 QVSMEDSMAEDTDQANRASMVAPMFGQAAVS-MPQPNFAFGGGAATQPPSMANPFQFGGQ 1309

BLAST of Sgr022612 vs. ExPASy TrEMBL
Match: A0A6J1BX57 (nuclear pore complex protein NUP1 OS=Momordica charantia OX=3673 GN=LOC111006142 PE=4 SV=1)

HSP 1 Score: 1505.3 bits (3896), Expect = 0.0e+00
Identity = 887/1069 (82.97%), Postives = 941/1069 (88.03%), Query Frame = 0

Query: 30   SAAAAVIATFARKSL-KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRV 89
            +A+  ++ +FA   L  SS LSLVPR SGNVDVI+NGFVTPR RGRSALYSMAR+PYSRV
Sbjct: 235  AASQKLVDSFASGDLSNSSTLSLVPRPSGNVDVIDNGFVTPRPRGRSALYSMARLPYSRV 294

Query: 90   RATPSIKNTVATTDAYWAT-SSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIR 149
            RAT SIKNTVATTDAY A  SSS SQSAWEQGRL+GS QGALKRRSSVLD+EMGSVGPIR
Sbjct: 295  RATSSIKNTVATTDAYRAAPSSSSSQSAWEQGRLVGSNQGALKRRSSVLDNEMGSVGPIR 354

Query: 150  RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETK 209
            RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETA+  QSTKVHQL SSAGKALY +ETK
Sbjct: 355  RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETAQRFQSTKVHQLPSSAGKALYSNETK 414

Query: 210  RNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNS 269
             NLSKMS  FENDM+P +SFPRIPLRSSEMASKILEQLDKLTPPKEKSSE KL  VRNNS
Sbjct: 415  CNLSKMSAEFENDMSPSSSFPRIPLRSSEMASKILEQLDKLTPPKEKSSEAKLF-VRNNS 474

Query: 270  PMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPN 329
            PMKLSPSMLHGPALRSLEDVDSSKYLENV+ I SNDAQDLTSQ+NDKVEESSSLKFK P 
Sbjct: 475  PMKLSPSMLHGPALRSLEDVDSSKYLENVKGIPSNDAQDLTSQRNDKVEESSSLKFKAPK 534

Query: 330  DKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGP 389
            DKSI++ DG+  SVPTK A SSSGLPVSSV PSSQTKWAFQMSAHEDFVDM+EEGYSNGP
Sbjct: 535  DKSIATSDGMVSSVPTKVAASSSGLPVSSVAPSSQTKWAFQMSAHEDFVDMEEEGYSNGP 594

Query: 390  ATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPV 449
            AT+ISS R+EKVDGPLVAVSKPSDT+  A DK QASI VKPS  SEMNKITD  KSD P 
Sbjct: 595  ATDISSGRREKVDGPLVAVSKPSDTDTTAADKSQASIHVKPS--SEMNKITDLGKSDAPA 654

Query: 450  TTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKEL 509
            TTEKS IFSF  AS PSITA+ + PE   R EKIVSSE+ KAATAP+FGFGDK P QKEL
Sbjct: 655  TTEKSPIFSFSAASPPSITASVVDPELASRSEKIVSSEIPKAATAPLFGFGDKSPIQKEL 714

Query: 510  ITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAAT 569
            ITSAPTFAFGN VTTPTN+QN V  V SEGNVAPTQ A V TTFKFGDKATFP   NA T
Sbjct: 715  ITSAPTFAFGNNVTTPTNKQNVVSDVASEGNVAPTQPAPVSTTFKFGDKATFPISGNAVT 774

Query: 570  ENGNKNARSPFKFASGLVNEKESAKVGSASVFKAESSFSGPSFAISEESISDKADNKSSS 629
            ENGNKN+ SPFKF+S LV+EKESAKVGSAS+FKAESSFS PSFA+S+ES+SDK DNKS S
Sbjct: 775  ENGNKNSGSPFKFSSPLVDEKESAKVGSASIFKAESSFSIPSFAVSKESMSDKVDNKSLS 834

Query: 630  AGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNN 689
             G TV TSENVFL SSVSTSTP+PSVFSFSSPST SNLNNGSL  TPSIFSSP T+F+NN
Sbjct: 835  TGLTVSTSENVFL-SSVSTSTPTPSVFSFSSPSTTSNLNNGSLAPTPSIFSSPVTSFANN 894

Query: 690  ITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSA 749
            ITN QNSSIKPS  A TSSSE+IT++ LSTSAPMPSFPAAPIFKFGSSSVPSTS S +SA
Sbjct: 895  ITN-QNSSIKPSLPAATSSSETITSTGLSTSAPMPSFPAAPIFKFGSSSVPSTSTSTMSA 954

Query: 750  LIGVGSVETKTKQ-ETTFGNLSGIPPSETSAKVSSTGSSVFQFGAASTTSDSNKRSENST 809
            L GVGSVETKT Q  TTFGNLSGIPPSET AK SSTGSSVFQFGAASTTSDSNKR ENST
Sbjct: 955  LTGVGSVETKTTQVTTTFGNLSGIPPSETLAKASSTGSSVFQFGAASTTSDSNKRPENST 1014

Query: 810  FVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSA 869
            F+PG+VPAFGA VS+A+SGVA+STQ TP+MQFSSSSTSFGLA  GNTGLSSGSSLF SSA
Sbjct: 1015 FLPGNVPAFGAAVSSATSGVAASTQ-TPVMQFSSSSTSFGLA--GNTGLSSGSSLFGSSA 1074

Query: 870  PASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 929
            PASNLFSSG  FGL SSSS+ANNS SS +G SSSFFNWQPSSAPSFSTGFNSTPTGGFSF
Sbjct: 1075 PASNLFSSGAGFGLASSSSAANNSNSSGSGMSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 1134

Query: 930  GLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV- 989
            GLTSS+AASN+AP LFGSSA GAST  IFSFTSAATAASSQPA GNSNHAFTFGST P  
Sbjct: 1135 GLTSSSAASNSAPALFGSSA-GASTAGIFSFTSAATAASSQPAIGNSNHAFTFGSTPPAN 1194

Query: 990  NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGSTAPPLAASPFQFGSQQNV 1049
            NDQ++M DSMAEDTVQ VAPTTPSFGQQPLTPPPSSGFVFGST  PLAA+PFQFG QQNV
Sbjct: 1195 NDQASMEDSMAEDTVQAVAPTTPSFGQQPLTPPPSSGFVFGSTTTPLAANPFQFGGQQNV 1254

Query: 1050 PTPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            PTPQNPS FQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSK RKK
Sbjct: 1255 PTPQNPSRFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKSRKK 1294

BLAST of Sgr022612 vs. ExPASy TrEMBL
Match: A0A6J1FKS9 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)

HSP 1 Score: 1384.8 bits (3583), Expect = 0.0e+00
Identity = 836/1060 (78.87%), Postives = 903/1060 (85.19%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252  KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311

Query: 105  WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
             AT +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312  RATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371

Query: 165  ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
               SSTSI VSGIGSET++HLQSTKVH  SS AGKA Y SETKRNLSKMS   END TP 
Sbjct: 372  --SSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAESENDRTPS 431

Query: 225  TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
            +SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432  SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491

Query: 285  EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
            EDVDS+KYLENVEDIRSND +DLTS+K DK E+SS LK KVP+DKSIS+G G+G SVP+K
Sbjct: 492  EDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSK 551

Query: 345  DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
            D VSSSGL VS V PSS TK AFQMS  EDFVDMD+E YSNGP +  S ER+EKVD  LV
Sbjct: 552  DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERREKVDDSLV 611

Query: 405  AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
            AV KPSDTEAI VDKPQASI  KPS VSEM KI DQAKSDVPVTTEKS+IFSFPTAS  S
Sbjct: 612  AVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSS 671

Query: 465  ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
             TAN I PEST RPEKI SSEV KAA AP+FGFG+KLPSQK+ + S+PTF FGNKVTT T
Sbjct: 672  TTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTST 731

Query: 525  NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
            NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ ATENGN  A SPFKFAS L
Sbjct: 732  NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSL 791

Query: 585  VNEKESAKVGSASVFKAESSFSGP-SFAISEESISDKA-DNKSSSAGHTVGTSENVFLSS 644
            VNEKE AK GSASVFK+ESS S   SF + +ES+S+KA D KSSSAG +VGTS N+ LSS
Sbjct: 792  VNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGTSGNLLLSS 851

Query: 645  SVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTA 704
               +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKPS  A
Sbjct: 852  --VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKPSLNA 911

Query: 705  VTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQET 764
             TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPS+     SA  GVGSVETKTKQET
Sbjct: 912  ATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPSGVGSVETKTKQET 971

Query: 765  T-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVS 824
            T FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK+ E STF P SVP+FGAPV 
Sbjct: 972  TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1031

Query: 825  AASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGL 884
             ASSGVASSTQSTP+  FSSSSTSFGL  +GNTGL+SG+SL  SSAPASNLF+SG TFG 
Sbjct: 1032 PASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFTSGATFGF 1091

Query: 885  VSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPM 944
              SSSSANNS+SS AGTSSSFFNWQ SSAPSFS+GF STPTGGFSFGL SS+AAS+++PM
Sbjct: 1092 -GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPM 1151

Query: 945  LFGSS-AGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAED 1004
            LFGSS  G ASTTS+FSFTSAATAA SQPAFG SNH FTFGST P  ND +NM DSMAED
Sbjct: 1152 LFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAED 1211

Query: 1005 TVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQNPSPF 1064
            TVQTVA  T  PSFGQQPLTPPPSSGFVFGSTAP PL A+PFQF GSQQNVPTPQNP+PF
Sbjct: 1212 TVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPF 1271

Query: 1065 QASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            QASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 QASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297

BLAST of Sgr022612 vs. ExPASy TrEMBL
Match: A0A6J1FF52 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)

HSP 1 Score: 1382.5 bits (3577), Expect = 0.0e+00
Identity = 836/1064 (78.57%), Postives = 903/1064 (84.87%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252  KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311

Query: 105  WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
             AT +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312  RATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371

Query: 165  ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
               SSTSI VSGIGSET++HLQSTKVH  SS AGKA Y SETKRNLSKMS   END TP 
Sbjct: 372  --SSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAESENDRTPS 431

Query: 225  TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
            +SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432  SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491

Query: 285  EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
            EDVDS+KYLENVEDIRSND +DLTS+K DK E+SS LK KVP+DKSIS+G G+G SVP+K
Sbjct: 492  EDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSK 551

Query: 345  DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
            D VSSSGL VS V PSS TK AFQMS  EDFVDMD+E YSNGP +  S ER+EKVD  LV
Sbjct: 552  DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERREKVDDSLV 611

Query: 405  AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
            AV KPSDTEAI VDKPQASI  KPS VSEM KI DQAKSDVPVTTEKS+IFSFPTAS  S
Sbjct: 612  AVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSS 671

Query: 465  ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
             TAN I PEST RPEKI SSEV KAA AP+FGFG+KLPSQK+ + S+PTF FGNKVTT T
Sbjct: 672  TTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTST 731

Query: 525  NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
            NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ ATENGN  A SPFKFAS L
Sbjct: 732  NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSL 791

Query: 585  VNEKESAKVGSASVFKAESSFSG-----PSFAISEESISDKA-DNKSSSAGHTVGTSENV 644
            VNEKE AK GSASVFK+ESS S       SF + +ES+S+KA D KSSSAG +VGTS N+
Sbjct: 792  VNEKEGAKAGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSSSAGLSVGTSGNL 851

Query: 645  FLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKP 704
             LSS   +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKP
Sbjct: 852  LLSS--VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKP 911

Query: 705  SPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKT 764
            S  A TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPS+     SA  GVGSVETKT
Sbjct: 912  SLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPSGVGSVETKT 971

Query: 765  KQETT-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFG 824
            KQETT FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK+ E STF P SVP+FG
Sbjct: 972  KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1031

Query: 825  APVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGT 884
            APV  ASSGVASSTQSTP+  FSSSSTSFGL  +GNTGL+SG+SL  SSAPASNLF+SG 
Sbjct: 1032 APVLPASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFTSGA 1091

Query: 885  TFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASN 944
            TFG   SSSSANNS+SS AGTSSSFFNWQ SSAPSFS+GF STPTGGFSFGL SS+AAS+
Sbjct: 1092 TFGF-GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASS 1151

Query: 945  NAPMLFGSS-AGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDS 1004
            ++PMLFGSS  G ASTTS+FSFTSAATAA SQPAFG SNH FTFGST P  ND +NM DS
Sbjct: 1152 SSPMLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDS 1211

Query: 1005 MAEDTVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQN 1064
            MAEDTVQTVA  T  PSFGQQPLTPPPSSGFVFGSTAP PL A+PFQF GSQQNVPTPQN
Sbjct: 1212 MAEDTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQN 1271

Query: 1065 PSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            P+PFQASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 PNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301

BLAST of Sgr022612 vs. ExPASy TrEMBL
Match: A0A6J1K059 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)

HSP 1 Score: 1370.5 bits (3546), Expect = 0.0e+00
Identity = 829/1060 (78.21%), Postives = 897/1060 (84.62%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252  KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311

Query: 105  WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
             A+ +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312  RASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371

Query: 165  ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
               SSTSI VSGIGSET +HLQSTKVH  SS+AGKA Y SETKRNLSKMS   END TP 
Sbjct: 372  --SSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAESENDRTPS 431

Query: 225  TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
            +SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432  SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491

Query: 285  EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
            EDVDS+KYLENVEDIRSND +DLTS+KNDK E+SS LK +VP+DKSIS+G G+G SVP+K
Sbjct: 492  EDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGGVGSSVPSK 551

Query: 345  DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
            D VSSSGL VS V PSS TK AFQMS  EDFVDMD+E YSNGP    S ER+EKVD  LV
Sbjct: 552  DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERREKVDDSLV 611

Query: 405  AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
            AV KPSD EAI VDKPQASI  KPSTVSEM KI DQAKSD+PVTTEKS+IFSFPTAS  S
Sbjct: 612  AVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFSFPTASPSS 671

Query: 465  ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
             TA  I PEST RPEKI  SEV KAA AP+FGFG+K PSQK+ + S+PTF FGNKVTT T
Sbjct: 672  TTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTST 731

Query: 525  NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
            NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+  TENGN  A SPFKFAS L
Sbjct: 732  NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSL 791

Query: 585  VNEKESAKVGSASVFKAESSFSG-PSFAISEESISDKA-DNKSSSAGHTVGTSENVFLSS 644
            VNEKE AK GSASVFK+ESS S   SF + +E +S+KA D KSSSAG +VGTS N+ LSS
Sbjct: 792  VNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGTSGNLLLSS 851

Query: 645  SVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTA 704
               +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKPS  A
Sbjct: 852  --VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKPSLNA 911

Query: 705  VTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQET 764
             TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPST     SA  G GSVETKTKQET
Sbjct: 912  ATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPST-----SAPNGAGSVETKTKQET 971

Query: 765  T-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVS 824
            T FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK  E STF P SVP+FGAPV 
Sbjct: 972  TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1031

Query: 825  AASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGL 884
             ASSGVASSTQSTP+  FSSSSTSFGL  +GNTGL+SG+SL  SSAPASNLF+SG TFG 
Sbjct: 1032 PASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFASGATFGF 1091

Query: 885  VSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPM 944
              SSSSANNS+SS AGTSSSFFNWQ SS PSFS+GF STPTGGFSFGL SS+AAS++APM
Sbjct: 1092 -GSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPM 1151

Query: 945  LFGSSA-GGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAED 1004
            LFGSS+ G ASTTS+FSFTSAATAASSQPAFGNSNH FTFGST P  ND +NM DSMAED
Sbjct: 1152 LFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAED 1211

Query: 1005 TVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQNPSPF 1064
            TVQTVA  T  PSFGQQPLTPPPSSGF+FGSTAP PL A+PFQF GSQQNV TPQNP+PF
Sbjct: 1212 TVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPF 1271

Query: 1065 QASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            QASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 QASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297

BLAST of Sgr022612 vs. ExPASy TrEMBL
Match: A0A6J1JQT4 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)

HSP 1 Score: 1369.0 bits (3542), Expect = 0.0e+00
Identity = 829/1064 (77.91%), Postives = 897/1064 (84.30%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252  KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311

Query: 105  WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
             A+ +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312  RASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371

Query: 165  ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
               SSTSI VSGIGSET +HLQSTKVH  SS+AGKA Y SETKRNLSKMS   END TP 
Sbjct: 372  --SSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAESENDRTPS 431

Query: 225  TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
            +SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432  SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491

Query: 285  EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
            EDVDS+KYLENVEDIRSND +DLTS+KNDK E+SS LK +VP+DKSIS+G G+G SVP+K
Sbjct: 492  EDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGGVGSSVPSK 551

Query: 345  DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
            D VSSSGL VS V PSS TK AFQMS  EDFVDMD+E YSNGP    S ER+EKVD  LV
Sbjct: 552  DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERREKVDDSLV 611

Query: 405  AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
            AV KPSD EAI VDKPQASI  KPSTVSEM KI DQAKSD+PVTTEKS+IFSFPTAS  S
Sbjct: 612  AVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFSFPTASPSS 671

Query: 465  ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
             TA  I PEST RPEKI  SEV KAA AP+FGFG+K PSQK+ + S+PTF FGNKVTT T
Sbjct: 672  TTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTST 731

Query: 525  NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
            NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+  TENGN  A SPFKFAS L
Sbjct: 732  NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSL 791

Query: 585  VNEKESAKVGSASVFKAESSFSG-----PSFAISEESISDKA-DNKSSSAGHTVGTSENV 644
            VNEKE AK GSASVFK+ESS S       SF + +E +S+KA D KSSSAG +VGTS N+
Sbjct: 792  VNEKEGAKAGSASVFKSESSSSSFNCSILSFGVPKELMSEKAGDKKSSSAGLSVGTSGNL 851

Query: 645  FLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKP 704
             LSS   +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKP
Sbjct: 852  LLSS--VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKP 911

Query: 705  SPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKT 764
            S  A TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPST     SA  G GSVETKT
Sbjct: 912  SLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPST-----SAPNGAGSVETKT 971

Query: 765  KQETT-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFG 824
            KQETT FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK  E STF P SVP+FG
Sbjct: 972  KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1031

Query: 825  APVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGT 884
            APV  ASSGVASSTQSTP+  FSSSSTSFGL  +GNTGL+SG+SL  SSAPASNLF+SG 
Sbjct: 1032 APVLPASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFASGA 1091

Query: 885  TFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASN 944
            TFG   SSSSANNS+SS AGTSSSFFNWQ SS PSFS+GF STPTGGFSFGL SS+AAS+
Sbjct: 1092 TFGF-GSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASS 1151

Query: 945  NAPMLFGSSA-GGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDS 1004
            +APMLFGSS+ G ASTTS+FSFTSAATAASSQPAFGNSNH FTFGST P  ND +NM DS
Sbjct: 1152 SAPMLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDS 1211

Query: 1005 MAEDTVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQN 1064
            MAEDTVQTVA  T  PSFGQQPLTPPPSSGF+FGSTAP PL A+PFQF GSQQNV TPQN
Sbjct: 1212 MAEDTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQN 1271

Query: 1065 PSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
            P+PFQASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 PNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301

BLAST of Sgr022612 vs. TAIR 10
Match: AT3G10650.1 (BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.1); Has 61042 Blast hits to 31782 proteins in 2093 species: Archae - 202; Bacteria - 16480; Metazoa - 16017; Fungi - 12552; Plants - 1653; Viruses - 629; Other Eukaryotes - 13509 (source: NCBI BLink). )

HSP 1 Score: 270.4 bits (690), Expect = 6.3e-72
Identity = 384/1133 (33.89%), Postives = 537/1133 (47.40%), Query Frame = 0

Query: 45   KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
            KS  +SLV + SG    +ENGFVTPRSRGRSA+YSMAR PYSR +++  I          
Sbjct: 272  KSPTMSLVTKPSGQ-RPLENGFVTPRSRGRSAVYSMARTPYSRPQSSVKI---------- 331

Query: 105  WATSSSLSQSAWEQGRLLGSTQG---ALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGL 164
              +    S S WE+    GS QG    LKRRSSVLD+++GSVGP+RRIRQKSNL  S+ L
Sbjct: 332  -GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLDNDIGSVGPVRRIRQKSNL-SSRSL 391

Query: 165  SLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDM 224
            +LP+S S  S+  +G G +T         H    SA                      + 
Sbjct: 392  ALPVSESPLSVRANG-GEKT--------THTSKDSA----------------------ED 451

Query: 225  TPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPAL 284
             P +SF  +P +SSEMASKIL+QLD            KL+S R  SP KLSPSML GPAL
Sbjct: 452  IPGSSFNLVPTKSSEMASKILQQLD------------KLVSTREKSPSKLSPSMLRGPAL 511

Query: 285  RSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSV 344
            +SL++V++ K+L N+ + ++N + D + QK +   ES S +    ++K+  + DG   + 
Sbjct: 512  KSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQEISRESVSREVLAQSEKTGDAVDGTSKTG 571

Query: 345  PTKDA-VSSSG--LPV-SSVIPSSQTKWAFQMSAHEDFVDMDEE-GYSNGPATNISSERQ 404
             +KD  +   G  +P+ +S+      K +F+MSAHEDF+++D++ G ++ P     +E+Q
Sbjct: 572  SSKDQDMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDFLELDDDLGAASTPCE--VAEKQ 631

Query: 405  EKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFS 464
               +     +S P        +KP    +  PST    N    Q  S+  + TE++   +
Sbjct: 632  NAFEVEKSHISMPIG------EKPLTPSEAMPSTSYISNGDASQGTSNGSLETERNKFVA 691

Query: 465  FP--------TASSPS------ITANAIGPESTLRPEKIVSSEVSK--AATAPVFGFGDK 524
            FP         AS P+         ++I        EK +  E  K  AA  P   F   
Sbjct: 692  FPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPTSEEKRIPLEEPKKPAAVFPNISFS-- 751

Query: 525  LPSQKELI--------------TSAPTFAFGNKVTTPTNEQ----NAVPVVTSEGNVAPT 584
             P    L+              TS+  F        PT  +    N+     S  + APT
Sbjct: 752  -PPATGLLNQNSGASADIKLEKTSSTAFGVSEAWAKPTESKKTFSNSASGAESSTSAAPT 811

Query: 585  QQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKVGS-ASVFKA 644
               ++   F  G  A  P P+N +  +      SP  F   + N      VG   S  ++
Sbjct: 812  LNGSI---FSAGANAVTPPPSNGSLTS------SP-SFPPSISNIPSDNSVGDMPSTVQS 871

Query: 645  ESSFSGPSFAISEESISDKADNKSSSAGHTVGTSENVFLSSSVSTSTP----SPSVFSFS 704
             ++    S    +   S+ ++++S+SA     TS   F   +   S P    S    S  
Sbjct: 872  FAATHNSSSIFGKLPTSNDSNSQSTSASPLSSTSPFKFGQPAAPFSAPAVSESSGQISKE 931

Query: 705  SPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLST 764
            +   N+   N S      + S+  +T    +   +++  K  P  V  SS  +  S+L+ 
Sbjct: 932  TEVKNATFGNTSTFKFGGMASADQST--GIVFGAKSAENKSRPGFVFGSSSVVGGSTLNP 991

Query: 765  SAPMPSFPAAP---IFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSE 824
            S    S P +    IF   SSS P T  S +SA     S  T T   + FG  S    S 
Sbjct: 992  STAAASAPESSGSLIFGVTSSSTPGTETSKISA----SSAATNT-GNSVFGTSSFAFTSS 1051

Query: 825  TSAKV----SSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASST 884
             S+ V    +STGSSVF F A S+ S ++ +S+ S        A  A      SG  +ST
Sbjct: 1052 GSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNL----FGAGNAQTGNTGSGTTTST 1111

Query: 885  QSTPIMQFSS-SSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANN 944
            QS P    SS S+ SFGL  SGN+ L+S SS F  S     +F+S +T  L S++SSA++
Sbjct: 1112 QSIPFQFGSSPSAPSFGL--SGNSSLASNSSPFGFSKSEPAVFTSVSTPQLSSTNSSASS 1171

Query: 945  SISSSA---GTSSSFFNWQPSSAPSFSTGF--NSTPTGGFSFGLTSSTAASNNAPMLFGS 1004
            S + S+   GTS    N  P+S P FS+ F  +STPT  FSFG +S+   S+    +FG+
Sbjct: 1172 SSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-TFSFGGSSAATVSSTTTPIFGA 1231

Query: 1005 SAGGA-STTSIFSFTSAATAASSQPAFGNSN--HAFTFGSTQP--------------VND 1064
            S     S + IF F S       QP FGNS       FG++ P               N 
Sbjct: 1232 STNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFGNSTPGFAFGAPNNGNGINNNQ 1291

Query: 1065 QSNMVDSMAEDTVQT--VAPTTPSFGQQPLTPPPSSGFVFG---STAPPLAASPFQFGSQ 1095
            Q +M DSMAEDT Q    +   P FGQ  ++  P   F FG   +T PP  A+PFQFG Q
Sbjct: 1292 QVSMEDSMAEDTDQANRASMVAPMFGQAAVS-MPQPNFAFGGGAATQPPSMANPFQFGGQ 1309

BLAST of Sgr022612 vs. TAIR 10
Match: AT2G45000.1 (structural constituent of nuclear pore )

HSP 1 Score: 45.1 bits (105), Expect = 4.3e-04
Identity = 147/480 (30.63%), Postives = 217/480 (45.21%), Query Frame = 0

Query: 455 FSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTF 514
           F F  +S+PS    +    ST       S+ V+ A+T P FGFG    S       AP+ 
Sbjct: 68  FGFGASSTPSFGFGSSASSSTPSFGFGSSASVTPASTTPSFGFGTAASSS----APAPSL 127

Query: 515 AFGNKVTTPTNEQNAVPVVTSEGNVAPTQQAT-VPTTFKFGDKAT-----FPSPANAATE 574
            FG   ++ TN  +A P  +  G V  +  +T  P++  FG  A+       SP  AA  
Sbjct: 128 -FG---SSTTNASSAAPGSSPFGFVTSSASSTATPSSSLFGAPASSAATPSSSPFGAAPA 187

Query: 575 NGNKNARSPFKFASGLVNEKESAKVGSASVFKAESS--------FSGPSFAISEE---SI 634
           +G+      F  +  L +   SA   ++S+F A SS        F  PS A       S+
Sbjct: 188 SGSTPL---FGSSPSLFSAPSSASASNSSLFGASSSAATSTSPLFGAPSSATGATPSFSV 247

Query: 635 SDKADNKSSSAGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIF 694
           +  A   SSS     G+S +  ++SS S S+PS    + SSP   S+ + G   STPS+F
Sbjct: 248 ASSAPGSSSSIFGATGSSPSFSVASSASGSSPSIFGATGSSPFFGSSSSAG---STPSLF 307

Query: 695 ---SSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGS 754
              SS ATT S            PSP  V++ + S T+++ + SA    F A+  F F  
Sbjct: 308 ASSSSGATTSS------------PSPFGVSTFNSSSTSNTSNASA--SPFSASTGFSFLK 367

Query: 755 SSVPSTSGSPL-SALIGVGSVETKTKQETTFGNLSGIPPSETSAKVSSTGSSVFQFGAAS 814
           S+  ST+ S   SA     S  +     T+  +   +    ++A  SST  +VF     +
Sbjct: 368 STASSTTSSTTPSAPPQTASSSSSFSFGTSANSGFNLSTGSSAAPASSTSGAVFSIATTT 427

Query: 815 TTSDSNKRSENSTFVPGSVPAFGAPVSA---ASSGVASS-TQSTPIMQFSS-SSTSFGLA 874
           TTS       +ST    S PA  AP S     S GV SS T +TP    ++ S+T FGLA
Sbjct: 428 TTS-------SSTPAATSAPASSAPASTMAFPSFGVTSSATNTTPASSAATFSTTGFGLA 487

Query: 875 GS----GNTGLSSGSSLFSSSAPASN----LFSSGTTFGLVSSSSSANNSISSSAGTSSS 901
            S    G+T   +G ++  +S PAS+      S   +F L SS+S+   + SS+  T ++
Sbjct: 488 SSTPATGSTNSFTGFAVPKTSTPASSSQPQTTSPAFSFSLPSSTSTTAPATSSATTTQTT 512

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
XP_022133602.10.0e+0082.97nuclear pore complex protein NUP1 [Momordica charantia][more]
XP_038884354.10.0e+0078.31nuclear pore complex protein NUP1-like isoform X2 [Benincasa hispida][more]
XP_038884353.10.0e+0078.02nuclear pore complex protein NUP1-like isoform X1 [Benincasa hispida][more]
XP_038884355.10.0e+0078.02nuclear pore complex protein NUP1-like isoform X3 [Benincasa hispida][more]
XP_022938795.10.0e+0078.87nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata][more]
Match NameE-valueIdentityDescription
Q9CAF48.9e-7133.89Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 S... [more]
Match NameE-valueIdentityDescription
A0A6J1BX570.0e+0082.97nuclear pore complex protein NUP1 OS=Momordica charantia OX=3673 GN=LOC111006142... [more]
A0A6J1FKS90.0e+0078.87nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 ... [more]
A0A6J1FF520.0e+0078.57nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 ... [more]
A0A6J1K0590.0e+0078.21nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN... [more]
A0A6J1JQT40.0e+0077.91nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN... [more]
Match NameE-valueIdentityDescription
AT3G10650.16.3e-7233.89BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.... [more]
AT2G45000.14.3e-0430.63structural constituent of nuclear pore [more]
InterPro
Analysis Name: InterPro Annotations of Monk fruit (Qingpiguo) v1
Date Performed: 2022-08-01
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 688..718
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1004..1094
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 762..781
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1034..1066
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 303..322
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 307..322
NoneNo IPR availableMOBIDB_LITEmobidb-litedisorder_predictioncoord: 1004..1023
NoneNo IPR availablePANTHERPTHR33416:SF20NUCLEAR PORE COMPLEX PROTEIN NUP1coord: 43..886
NoneNo IPR availablePANTHERPTHR33416FAMILY NOT NAMEDcoord: 43..886
NoneNo IPR availablePANTHERPTHR33416:SF20NUCLEAR PORE COMPLEX PROTEIN NUP1coord: 823..1092
NoneNo IPR availablePANTHERPTHR33416FAMILY NOT NAMEDcoord: 823..1092

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Sgr022612.1Sgr022612.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0071763 nuclear membrane organization
biological_process GO:0016973 poly(A)+ mRNA export from nucleus
cellular_component GO:0005635 nuclear envelope