Sequences
The following sequences are available for this feature:
Gene sequence (with intron)
Legend: polypeptideexonCDS
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGCTCTCCATGCTTGTCGATCCGGCGCAGAAGCTCATTACTTCCGGTGCACACAGGCTGTTTTCTACTGTTTTTCGGAAACGCCTTCCGCCGCCGCCGCCGTCATTGCCACTTTCGCGAGGTTTTTTCTTTTTTTCTTTTTGACTTTTTATATGTTTCGTACCATTTGGTTTTCAATTGAAAGGCTCTCAAAGTGGTTGTTAAAATGGTGTTTGTTTTTCATTTTCCGCATTTCTGCTGCTTTTCTGTTTGGAACAATTTTCATTTTGGAGGTTTGAAGATGCCATTTTTTTTTAAAATTTGATTTTACCGAGAAAGTTTTTATAGCCGTGAGGTTTTCTTCTTCTTCTTCTTCTTTTTTTCCCAGTGGCACCCGGATTTATCATTTGTATGATTTTGTTTGTTACTTACGCTTGTTGAAGCTCTTCGCTCTGATTTAGGACTTCAATACTTTAAATATCATCGGGTTGCCTGCTGCTTCTGTGCCGTATATGCTTCAAACATATCAAATTGCAAGTCCAAAGCTTATTAGTCTAATAGTATTGAGACTGCTTGAAATATCGTTTTGTTTCGTTTATTGGATGTCATATATATACGTATATATATTTTTCTCCAAGCATTAGGGGTTTTCTGAGTGCGATTTCTACAAATTTTTCTAAAATGATCTCCCATATGAATTTTAAAAAATTGGTTTCTATTTTTATGAAAAAAAGATTGTTAAAAGATATCTTTTGTCCTTGTATTCATGGATTTAAGCTCAAAACCAAAGCCAAGGCCAAGACCCTGTGTTGCAATGCTATTCGTGCCACCCTTGACCATCTGCGTTGATTGAAACAATGGATCTTTGAAGGCGTTTATAGAGCTCCTGAAGTAGTTTTGGAAAGAAATTTTTTTAGCCTCCTCCTCTTGGTCCTCTTAATATTTTTTAGTATTTACAGTATTTCCTCAATTATAGCCAATTAGAACTCTTTTCTACTGTTACCTTTGGCTTCAGCTCTCTTTTTATATTTTAATCAATGAATGGAATAGTTTTGTTGCCTATGAAGAAAATGTAAATTTAAAAACAGAGTAGATTTGAAGTAAGTTATACTTAAAAATAATCAATAACTATATATCAACAGTTGTCTTAGAAGACAGAAAAAAACTCATGAAACAGCAGAATTGTTTTCTTCTTCTGTTGGTTGTTCTGTAAATTGTCATTAAATGTTATCTAGCCAAACAAAACTTCTGTAAAATCATTTTTAATATTTAAAACTGAAAATTGTTTCTAAACACAGCTCTCAAACATCTTGATTTTTCATTGTACTTTTTTCATGAAAGTAACATGTAAGATTTTGAACTGTACCGATTTTAATACCCATTTTGGAAGCACGTTCCATTATTTTATTATATGTTTTGGGGTAAATAATGACGTCTCTTAGTTATACTATAGTACTTGTTCCGAGTTGAATTTTGGAAGGTGCTTGAGAGTGAGTTGAATCTAATCAGTTGTGGACTTCTATTTTCTTCCTCAGTGGCTCCCTCTCTTCTCATAACCTTGACAGTTTTTTCCACCCAATTGTTGTTTAAATAACTTTTCTCATTAACTGTACTGTTGTGCTTGCACTGACTTTTTTGATGTGGGACAGTTGCTACGTTTTGTGGACATGTAATTAACATCTTAAAAGAGCTTACCAGAAGTTCTTTATTAGATACTTTTAGATTTCTTCTTAATCTTTACTTTTAACAACTTTGTCCATGCATTTTATACTTCCAGCGGCAACGATGAGATGGAAAATAAGCACCAGGAAGAAGTTGCAGCTGTAAGTTTTATCTCTTATGGGTTTTGCTTATTGAGAGTTAGGTGTTTTAAGTTTTATCAATAACCTGTGTATGTGTGTCTTGGTTTTTATTATCCAATTATGCTATTGACTGTAAACACAAAGATTATCAGTGTGTTTTTTTCCCTTCCATGTACTTATATGTCAGGCCAGGCTTCAACATTTTCCCATTGTTCATTTATTGAAATAAAGTTATTGCCTTCTCTTGATGGTTTATTAACTTTTCTTGCCGTGATAGAATCAATAACAGTTGGAGGTAATAGTTTGAGGAAAAATATTTTGGAAAGAGGTTTCATGTATATTTGGAACATTGTCCTTTACTACATTATCACCATTGATGCAATCAGGAATATTTAGTGAACTTGACTGAGACCACTAATTGTTCTTTCCCCCCTTATTTTAATTTTTCCAATAGCACAAGGGTTGGTAGTAACAGTTAGAAAATTGGAATTCTTACTTGAAGGCCGAAAATGTATGTTTCTTATGTTATTAGAGAGCTCCTATAAGCTAATGCTATGGCTAGTTGGCTTTGTTAACTCCTTTAAGCTTGGGGGGATAGAGCTTATGTTTTCTGAAGAATTGTAGATCTCAAGTAGGTGCATTCTTGAGTGAGGCTGTCTGCGGTGCCAAAGGTGTGCCTGATTGTTCTTGGAGCCTAGGCTCGTGCCTAGTTCTGCCTTGAAATAGGGGTTGGAAAAAAAACTATGGACCTCACTGAGGGTGCACAAGGTGCACAATTAACTGGAATCAAGTGGGGGCGTTGTATGTGTGCACCTGACCATGTATCTTAAATCAATGATTTTTCTGGATAGTAATTGAAGAAATATAATAATAGTCAAAATAATTACTAGAGTAGAAGAGTGGATACGTTACTAAAAATTTGCCTGTGTAGATTATATATAGAGGTATATGGAATATAAAAAATTGAATAATGTACATTTTTAAGACCATCTTAATTTGAACTTCTAGAATGTAATCCCAAGTTGGGATTTAGTCTTTGGTTTTATTTTTCCTTGTCCACTTCCTCAGACCTTTAATATTGCAAGATGGAGATTTTTCCTGTGCACTTACATGTGCAGTACCATGCTAGTGTTGCTTAATGGTCTGGTATAACTTCTTTTGATAACAAATGTTTTGGTATAACTATTATCATGAATTGACTAAATAGGAATTGATATTGAGTGGCATTTTATTAATTTACGTTTACGTGACTTGAAATTTGTGTAAGGCCTTCCTTTATCCATCACAAAGTGTATAGTTATGGTTGAAATAGTATTGTTACATATGACCAATCTTTGTAGTTATTTTATTTATTTTTTTTGTGAGAAATAATATGTAAGCAATCGGATTTTTTGGGGTTTTCTTTGTATGATTCTAATCTGATTCAGAGTAGCCTTGGAACCTTATCCATCAATCATCTTAAGCTAAAGATTTTTGCCTCCATGGCTGATTCATAATCGCATGGGTTGTTGTGGCCCCTAGTGGTAAAAAGTTGAGTTGGAAACTGAGATTTCAAAGTTATAGGTTCAAGCCAATGTTGGCTACGTACCTAAGATATTTACTCCTTAATGCCAAATGTTGTAGGATTAGGTAATCTCTGTAAGATTAGTCGAGATGCAGGTAAGCTTAGTTTGACCCTCATGGCTATTAAAAAAATTGAATCAAGGGAAACAAAATCAATAGCTGAATAAACACTGTTGCTGAATAGAAGTGCTTCCTTCTATCTTGTGGTGTAGGCATGCAGCTCACAATTGGCAGAGAACATAGGAAAACAGGAGCTTTGTAATAGATATTTTTTTGTTCTTTTTTGCTCTTTATTTTGACTAATCTGCACGTCTTCTCTTTCTTTCATATTTGTCATTAAAAAAGTGTTATTTTACCCTGTTCTTTTAAAAAAAATAAAGAAATTAGCATTTAGTAGCTCAAGGAGACCTATTTTATTTTCATGAATGCACTATTTTCCTTCACATTGAAGTAAAACTGCTTGCAAAATCTGAGATTTTCTTGTTCTGTAGTCTCAAAATTCTATGGCAACATTTTATGTATTTTTAACAATTCTTTAGGATCCTCCTGGAACTCAAGAAGCTACTAATCTTGATTTTGTTCCGAGCGTCAATGCTAATAACACACACGGGGTGACTGAACTTGAGCAGATTTTGAAGGAGAAGACCTTTACGAGGTAAGGTTTGAGTGTTTGTTGGTCAAATTATTTTTGTCACCTACCTCAATTCTTTTAGAAGATTTTCCTGTTTTAGGTTGTGTTTCCTTTCCTGTTAATTATTATTTGAATGAATTATATAAAAATTTAATATGCATGTATTGCAATTAGTAGCATGCTAAGAAGGTATGTAATAGTGTGATATGCATGTATTGAATGAAATGTATATACCACAATGTCGCTATGAATAACATGTCAATTTTTCTCCATCTGGTTGCAAATTTGGTTTCATTTTTTAAATCCATTTTAGCAATATATGGATTTGATATTTAATATGTCAAATGCTGACCACTTAACAGATCTGAGATTGATCGCTTGACTGAACTTCTGAATTCAAGAATTGTTGATGTTCCAAGTGGGGTTGAAGAGAGGAAATTTGAACTGGTCCCTTCAATGCCCATTATCAGTTATGGAAGACAGGAAGAAACTCCAAAAATTCCAGCTCAAGATAGAGTTAGCACTCACATGGTTCCGACTCATGTTATGAGTGCAAATGTAGGAATCTTTATGTCTATTTTTTGCTGGTTTGGTTTCTGCATTGGTTAATGCTTAATGTTGGTTTTCCATAGTTTGCTAAAACTAAAAACTGCGCTTAGCACTTTTGGCCTTATTGTTACCTGTATAATCATTTCAGGTCCTTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAAGCGTACATGGGCAGCAGGCCTTCAAAAGCAACTCCATTGAATATGGTGTCCCATAGTCAAAAACTTGGGATAGTTTTGCTTCAGGAAATCCCTCAAATCCTCTGCTTTATCTCTTGTGCCAAGGTCTTCTGGCAATGTTGATGTTATTGAAAATGGTTTTGTCACCCCAAGATCTCGAGGTAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCCAGAGTTCGTGCAACCCCTAGCATAAAGGTCCACACTCTAATGCGATACATTTGCTTCACTGTTCAATTGCTCGGTAGGTTATTTATAATTAACTATTTTTTCCTCTCTGGCTGATTCTTTAGAATACTGTAGCCACAACAGATGCCTACTGGGCAACATCGTCCTCATTATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGGGTCTACCCAAGGGGTACAATTTGTGAAAATGATTTTTGCAATATATTGTGTTATTGAATCAACCTCTTAGATCATGTTATTTGATTTGATTCTTCTTTCTGTAGGCTTTAAAACGCAGGAGTTCAGTTTTAGACGATGAAATGGGATCTGTTGGTCCTATTCGCAGAATTCGACAGAAATCCAATCTCGTTTTCTCAAAAGGTTTGAGTTTACCAATTTCAGGCAGTTCCACTTCTATTTCAGTAAGTGGAATTGGTTCTGAGACAGCTCGGCATTTGCAGTCTACAAAGGTTCATCAGTTGTCATCTTCTGCTGGGAAGGCACTTTATTTGAGTGAAACCAAGCGTAATTTGTCCAAAATGTCCACAGGGTTTGAAAATGATATGACACCTCGTACAAGTTTCCCTCGGATTCCCCTTAGGTCAAGTGAGATGGCCTCAAAAATATTAGAGCAGCTTGATAAATTGACACCTCCAAAGGAAAAATCTTCTGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTGTCACCATCAATGCTGCATGGGCCAGCTCTTAGAAGCCTGGAAGATGTGGATTCATCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGCCCAGGATCTTACTTCTCAAAAAAATGACAAGGTTGAGGAAAGTAGTTCGTTAAAATTTAAAGTACCCAATGATAAATCTATTTCTTCAGGTGATGGTATAGGTTTTTCAGTGCCTACTAAGGATGCCGTATCCAGTTCTGGTCTGCCAGTTTCATCTGTTATCCCTTCCTCACAAACAAAATGGGCTTTCCAGATGAGTGCACATGAGGTGTGTGGTTAACCTTCCAGTTTATTCAATAGGTCAATCTCGTCATGGTTCTTTCTTTTAATTTATCCTCATTCATAAATTCCCAACTAAAGAGAAGATGTGTAAATGAAAACAATATTAATCAGGTTGGAGTATTTTTAATTTCGGAATCTAGCTTTTCCATTTTGAAATGAGTGAAATTATTTACCAATCATCAAACATCTTTCAATTTCCGGCATCAAAATTTTCATTCTTTTTATTTCTCAAATACACCCAAACTTGAAAAAGCAAGTAGTAAAGTATATCATTTATGTCTGTGTCCGGTATAAACCTCTATGGTGTAGGCTTACAGTTATCTATTATTTTTCTAGGATTTTGTGGATCTTGATGCCTACTATGTATATGTTCCTTATTGATCCCCCCTAGTTGCAAAATTTATGGGTTGTCTGTCTCTTTTTTGTTAGGATTTTGTGGATATGGATGAGGAAGGATATTCTAATGGGCCAGCGACTAATATATCATCTGAGAGACAAGAAAAAGTTGATGGCCCATTAGTGGCGGTGAGTAAGCCTAGTGATACTGAAGCCATTGCGGTAGATAAACCTCAGGCTTCAATCGATGTTAAACCCTCTACTGTATCTGAGATGAACAAAATAACTGACCAAGCCAAATCTGATGTTCCTGTGACTACTGAAAAGAGCGCCATCTTTTCCTTTCCAACAGCATCTTCACCTAGCATTACAGCCAATGCAATAGGTCCTGAATCAACCTTGAGACCTGAAAAAATTGTTTCATCTGAGGTATCAAAAGCAGCAACTGCACCTGTATTTGGCTTTGGAGATAAGTTGCCATCACAGAAGGAATTGATTACTTCTGCCCCCACCTTTGCTTTTGGAAACAAGGTTACCACCCCAACGAATGAACAAAATGCTGTTCCTGTTGTAACTTCTGAAGGCAATGTTGCACCAACTCAACAAGCTACCGTTCCTACGACATTTAAATTTGGCGATAAAGCTACATTTCCTAGTCCAGCAAATGCTGCTACAGAAAATGGAAATAAGAATGCAAGGTCTCCGTTTAAGTTTGCTTCAGGTTTAGTTAATGAAAAAGAAAGTGCTAAAGTAGGTAGTGCTTCAGTTTTTAAAGCAGAGAGTTCTTTCAGGTCAGTTTCCTCGTTTCCATTGTTAACTTGGACTTGGAGCATGTTTGTTTTGTTTATACCTTTACCTATGTTAGGTTATGTTTCTGTTATTAGCTTATGTGAAATGCATGATAAATGGGATTTTAAATGATCAGTGTACGAATTCTGTTCTGAAGTTATTTGATCGGTTTTATTATTTGAGGAAACTTGGATATCTTTTGTCTTACTAACCCATAGATTCCTGAGAGCTCCTACTTTTCATCTAAATTTTTGTTTTTGTAAAATACTTGCCATCTAATGGAGTACAGATGAATGGAGCTATAGCTAAGTCTGATGTGGTTTATCCCAAGGATTTTGTAATTATAGTCCTTTCTTGATTTTTTCCAGTTGGGGCACTCTTTTGTTAGTTTTTTGACTCTTCGGTGATTGCCTTGTACATTCATTCTCACATTCATTCTCGGTCATACTAAAGCATATATCTTTGCATAATTGCATCTCTTTCTTTAACTGATTCGAGAAATTTTCTTTTGCTTTATCACGTTAGATTTTGTGCACGGCATTATATCAGGTCTTATTTTTTATAACCTTATATGTATTCTATGGGGTGAGAAAAATGTTGTGCATCAACTTCGTTATGTTTGTTAGTGTGGATAACAACCTGATGTGTCTGAACTATGTGTAATTCTTGAATCTAGTTGGCCATGATGGTAACATGTGAACTGGGGATAGTTTTGTTGTTAGTTCTTCTGGAATGTTTTTAAGCAATATGTATGTGTTGCCTGATTTTTGACCTTTGGAGTACAGTTATTACTCTGGTATTTTGATGAATTTTTTACGATACCAAATAACATTGTCTGAAACAAATTTAGTAATGTTTTAAGTGCTGGTTATCTGGAATTTTCATTTTGGACGTGTAACGTTATTGAATTAGTGAATTTAATTTAATGAGGTTAGTCTTGAGGCTTCATCTGCTTTTTATTCATATTTTTTACCCTGAATTTGTAGTCTTGGTGTGACATTTTACCCACATGGCATGATATATTTAAGCTTTGTGCTTTGCGTTGGCCTTGGACATTATGAAATATTGGCATTCTTTTGATTGAAATCTTCCCCAGTCACCTTCCAAAGATAAAGGATGGATGTTTGTTTTTGGGTGGGTGGGAGTTCTGAGCCCTTTTGCAATCATACCTTTTTAGTTGTCTGGTGATACTTGTGGTGCTTTATGGAATTTACTAGGTAATTGATGTTTTAGACGGTTTTAATTGCAGCGGCCCATCATTTGCAATTTCAGAAGAATCTATATCAGATAAAGCTGATAATAAGAGTTCGAGTGCTGGTCATACAGTTGGTACATCTGAGAATGTGTTTTTGTCGTCATCTGTGTCAACATCAACACCAAGTCCGAGTGTATTTTCTTTTAGCTCGCCTAGCACTAATTCAAATCTTAATAATGGATCTCTTGTTTCTACCCCATCAATTTTTTCTTCCCCAGCTACCACCTTTTCTAATAATATTACAAATCATCAAAATTCATCCATCAAACCCTCCCCCACTGCTGTCACTAGCAGCAGTGAATCCATCACCACCAGTAGTCTTTCTACGTCTGCTCCTATGCCTTCTTTTCCAGCTGCACCTATTTTCAAATTTGGGAGCTCTAGTGTTCCTTCAACTTCCGGTTCACCTCTGTCAGCACTGATTGGAGTTGGATCTGTTGAAACCAAGACCAAGCAGGAGACGACCTTTGGCAATTTAAGTGGCATTCCTCCAAGCGAGACATCTGCTAAAGTGTCTAGTACTGGAAGTAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATTCTAATAAACGATCAGAAAATTCAACTTTTGTTCCAGGCAGTGTACCTGCATTTGGGGCTCCGGTTTCAGCTGCTAGTAGTGGGGTTGCATCTTCTACTCAGAGTACGCCTATTATGCAATTCAGTTCATCGTCTACATCATTTGGTTTGGCTGGATCTGGAAACACGGGCTTGTCTTCTGGCAGTTCTTTGTTTTCTTCTTCAGCTCCAGCATCTAATTTGTTCAGTTCAGGCACCACTTTTGGGCTGGTTTCCTCCAGTTCCTCCGCTAATAATTCTATTAGCTCCAGTGCTGGTACTAGTTCTAGTTTCTTTAATTGGCAGCCATCCTCTGCGCCATCGTTTTCTACAGGATTCAACTCAACTCCAACTGGAGGATTCTCCTTCGGGCTCACATCTTCTACTGCTGCTTCTAATAATGCACCTATGCTCTTTGGATCATCGGCCGGTGGTGCATCAACAACCTCCATTTTCTCATTTACTTCGGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTCGGCAATTCTAATCATGCCTTCACCTTTGGTTCAACCCAACCTGTTAATGATCAATCAAATATGGTGGATAGCATGGCTGAGGATACTGTTCAGACAGTCGCGCCAACTACCCCTAGTTTCGGTCAACAGCCCCTCACACCACCTCCATCATCAGGGTTTGTGTTTGGTTCAACAGCTCCTCCACTAGCAGCAAGTCCTTTCCAGTTTGGGAGCCAGCAAAATGTACCTACCCCCCAAAATCCTTCTCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGGAGCTTCTCATTGGGTGCTGGAGGCGGCGACAAAGCTAACCGCAAATACGTGAAAGTTAAAAGCAAACCACGAAAGAAGTAG
mRNA sequence
ATGGCTCTCCATGCTTGTCGATCCGGCGCAGAAGCTCATTACTTCCGGTGCACACAGGCTGTTTTCTACTGTTTTTCGGAAACGCCTTCCGCCGCCGCCGCCGTCATTGCCACTTTCGCGAGGAAATCCCTCAAATCCTCTGCTTTATCTCTTGTGCCAAGGTCTTCTGGCAATGTTGATGTTATTGAAAATGGTTTTGTCACCCCAAGATCTCGAGGTAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCCAGAGTTCGTGCAACCCCTAGCATAAAGAATACTGTAGCCACAACAGATGCCTACTGGGCAACATCGTCCTCATTATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGGGTCTACCCAAGGGGCTTTAAAACGCAGGAGTTCAGTTTTAGACGATGAAATGGGATCTGTTGGTCCTATTCGCAGAATTCGACAGAAATCCAATCTCGTTTTCTCAAAAGGTTTGAGTTTACCAATTTCAGGCAGTTCCACTTCTATTTCAGTAAGTGGAATTGGTTCTGAGACAGCTCGGCATTTGCAGTCTACAAAGGTTCATCAGTTGTCATCTTCTGCTGGGAAGGCACTTTATTTGAGTGAAACCAAGCGTAATTTGTCCAAAATGTCCACAGGGTTTGAAAATGATATGACACCTCGTACAAGTTTCCCTCGGATTCCCCTTAGGTCAAGTGAGATGGCCTCAAAAATATTAGAGCAGCTTGATAAATTGACACCTCCAAAGGAAAAATCTTCTGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTGTCACCATCAATGCTGCATGGGCCAGCTCTTAGAAGCCTGGAAGATGTGGATTCATCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGCCCAGGATCTTACTTCTCAAAAAAATGACAAGGTTGAGGAAAGTAGTTCGTTAAAATTTAAAGTACCCAATGATAAATCTATTTCTTCAGGTGATGGTATAGGTTTTTCAGTGCCTACTAAGGATGCCGTATCCAGTTCTGGTCTGCCAGTTTCATCTGTTATCCCTTCCTCACAAACAAAATGGGCTTTCCAGATGAGTGCACATGAGGATTTTGTGGATATGGATGAGGAAGGATATTCTAATGGGCCAGCGACTAATATATCATCTGAGAGACAAGAAAAAGTTGATGGCCCATTAGTGGCGGTGAGTAAGCCTAGTGATACTGAAGCCATTGCGGTAGATAAACCTCAGGCTTCAATCGATGTTAAACCCTCTACTGTATCTGAGATGAACAAAATAACTGACCAAGCCAAATCTGATGTTCCTGTGACTACTGAAAAGAGCGCCATCTTTTCCTTTCCAACAGCATCTTCACCTAGCATTACAGCCAATGCAATAGGTCCTGAATCAACCTTGAGACCTGAAAAAATTGTTTCATCTGAGGTATCAAAAGCAGCAACTGCACCTGTATTTGGCTTTGGAGATAAGTTGCCATCACAGAAGGAATTGATTACTTCTGCCCCCACCTTTGCTTTTGGAAACAAGGTTACCACCCCAACGAATGAACAAAATGCTGTTCCTGTTGTAACTTCTGAAGGCAATGTTGCACCAACTCAACAAGCTACCGTTCCTACGACATTTAAATTTGGCGATAAAGCTACATTTCCTAGTCCAGCAAATGCTGCTACAGAAAATGGAAATAAGAATGCAAGGTCTCCGTTTAAGTTTGCTTCAGGTTTAGTTAATGAAAAAGAAAGTGCTAAAGTAGGTAGTGCTTCAGTTTTTAAAGCAGAGAGTTCTTTCAGCGGCCCATCATTTGCAATTTCAGAAGAATCTATATCAGATAAAGCTGATAATAAGAGTTCGAGTGCTGGTCATACAGTTGGTACATCTGAGAATGTGTTTTTGTCGTCATCTGTGTCAACATCAACACCAAGTCCGAGTGTATTTTCTTTTAGCTCGCCTAGCACTAATTCAAATCTTAATAATGGATCTCTTGTTTCTACCCCATCAATTTTTTCTTCCCCAGCTACCACCTTTTCTAATAATATTACAAATCATCAAAATTCATCCATCAAACCCTCCCCCACTGCTGTCACTAGCAGCAGTGAATCCATCACCACCAGTAGTCTTTCTACGTCTGCTCCTATGCCTTCTTTTCCAGCTGCACCTATTTTCAAATTTGGGAGCTCTAGTGTTCCTTCAACTTCCGGTTCACCTCTGTCAGCACTGATTGGAGTTGGATCTGTTGAAACCAAGACCAAGCAGGAGACGACCTTTGGCAATTTAAGTGGCATTCCTCCAAGCGAGACATCTGCTAAAGTGTCTAGTACTGGAAGTAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATTCTAATAAACGATCAGAAAATTCAACTTTTGTTCCAGGCAGTGTACCTGCATTTGGGGCTCCGGTTTCAGCTGCTAGTAGTGGGGTTGCATCTTCTACTCAGAGTACGCCTATTATGCAATTCAGTTCATCGTCTACATCATTTGGTTTGGCTGGATCTGGAAACACGGGCTTGTCTTCTGGCAGTTCTTTGTTTTCTTCTTCAGCTCCAGCATCTAATTTGTTCAGTTCAGGCACCACTTTTGGGCTGGTTTCCTCCAGTTCCTCCGCTAATAATTCTATTAGCTCCAGTGCTGGTACTAGTTCTAGTTTCTTTAATTGGCAGCCATCCTCTGCGCCATCGTTTTCTACAGGATTCAACTCAACTCCAACTGGAGGATTCTCCTTCGGGCTCACATCTTCTACTGCTGCTTCTAATAATGCACCTATGCTCTTTGGATCATCGGCCGGTGGTGCATCAACAACCTCCATTTTCTCATTTACTTCGGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTCGGCAATTCTAATCATGCCTTCACCTTTGGTTCAACCCAACCTGTTAATGATCAATCAAATATGGTGGATAGCATGGCTGAGGATACTGTTCAGACAGTCGCGCCAACTACCCCTAGTTTCGGTCAACAGCCCCTCACACCACCTCCATCATCAGGGTTTGTGTTTGGTTCAACAGCTCCTCCACTAGCAGCAAGTCCTTTCCAGTTTGGGAGCCAGCAAAATGTACCTACCCCCCAAAATCCTTCTCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGGAGCTTCTCATTGGGTGCTGGAGGCGGCGACAAAGCTAACCGCAAATACGTGAAAGTTAAAAGCAAACCACGAAAGAAGTAG
Coding sequence (CDS)
ATGGCTCTCCATGCTTGTCGATCCGGCGCAGAAGCTCATTACTTCCGGTGCACACAGGCTGTTTTCTACTGTTTTTCGGAAACGCCTTCCGCCGCCGCCGCCGTCATTGCCACTTTCGCGAGGAAATCCCTCAAATCCTCTGCTTTATCTCTTGTGCCAAGGTCTTCTGGCAATGTTGATGTTATTGAAAATGGTTTTGTCACCCCAAGATCTCGAGGTAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCCAGAGTTCGTGCAACCCCTAGCATAAAGAATACTGTAGCCACAACAGATGCCTACTGGGCAACATCGTCCTCATTATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGGGTCTACCCAAGGGGCTTTAAAACGCAGGAGTTCAGTTTTAGACGATGAAATGGGATCTGTTGGTCCTATTCGCAGAATTCGACAGAAATCCAATCTCGTTTTCTCAAAAGGTTTGAGTTTACCAATTTCAGGCAGTTCCACTTCTATTTCAGTAAGTGGAATTGGTTCTGAGACAGCTCGGCATTTGCAGTCTACAAAGGTTCATCAGTTGTCATCTTCTGCTGGGAAGGCACTTTATTTGAGTGAAACCAAGCGTAATTTGTCCAAAATGTCCACAGGGTTTGAAAATGATATGACACCTCGTACAAGTTTCCCTCGGATTCCCCTTAGGTCAAGTGAGATGGCCTCAAAAATATTAGAGCAGCTTGATAAATTGACACCTCCAAAGGAAAAATCTTCTGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTGTCACCATCAATGCTGCATGGGCCAGCTCTTAGAAGCCTGGAAGATGTGGATTCATCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGCCCAGGATCTTACTTCTCAAAAAAATGACAAGGTTGAGGAAAGTAGTTCGTTAAAATTTAAAGTACCCAATGATAAATCTATTTCTTCAGGTGATGGTATAGGTTTTTCAGTGCCTACTAAGGATGCCGTATCCAGTTCTGGTCTGCCAGTTTCATCTGTTATCCCTTCCTCACAAACAAAATGGGCTTTCCAGATGAGTGCACATGAGGATTTTGTGGATATGGATGAGGAAGGATATTCTAATGGGCCAGCGACTAATATATCATCTGAGAGACAAGAAAAAGTTGATGGCCCATTAGTGGCGGTGAGTAAGCCTAGTGATACTGAAGCCATTGCGGTAGATAAACCTCAGGCTTCAATCGATGTTAAACCCTCTACTGTATCTGAGATGAACAAAATAACTGACCAAGCCAAATCTGATGTTCCTGTGACTACTGAAAAGAGCGCCATCTTTTCCTTTCCAACAGCATCTTCACCTAGCATTACAGCCAATGCAATAGGTCCTGAATCAACCTTGAGACCTGAAAAAATTGTTTCATCTGAGGTATCAAAAGCAGCAACTGCACCTGTATTTGGCTTTGGAGATAAGTTGCCATCACAGAAGGAATTGATTACTTCTGCCCCCACCTTTGCTTTTGGAAACAAGGTTACCACCCCAACGAATGAACAAAATGCTGTTCCTGTTGTAACTTCTGAAGGCAATGTTGCACCAACTCAACAAGCTACCGTTCCTACGACATTTAAATTTGGCGATAAAGCTACATTTCCTAGTCCAGCAAATGCTGCTACAGAAAATGGAAATAAGAATGCAAGGTCTCCGTTTAAGTTTGCTTCAGGTTTAGTTAATGAAAAAGAAAGTGCTAAAGTAGGTAGTGCTTCAGTTTTTAAAGCAGAGAGTTCTTTCAGCGGCCCATCATTTGCAATTTCAGAAGAATCTATATCAGATAAAGCTGATAATAAGAGTTCGAGTGCTGGTCATACAGTTGGTACATCTGAGAATGTGTTTTTGTCGTCATCTGTGTCAACATCAACACCAAGTCCGAGTGTATTTTCTTTTAGCTCGCCTAGCACTAATTCAAATCTTAATAATGGATCTCTTGTTTCTACCCCATCAATTTTTTCTTCCCCAGCTACCACCTTTTCTAATAATATTACAAATCATCAAAATTCATCCATCAAACCCTCCCCCACTGCTGTCACTAGCAGCAGTGAATCCATCACCACCAGTAGTCTTTCTACGTCTGCTCCTATGCCTTCTTTTCCAGCTGCACCTATTTTCAAATTTGGGAGCTCTAGTGTTCCTTCAACTTCCGGTTCACCTCTGTCAGCACTGATTGGAGTTGGATCTGTTGAAACCAAGACCAAGCAGGAGACGACCTTTGGCAATTTAAGTGGCATTCCTCCAAGCGAGACATCTGCTAAAGTGTCTAGTACTGGAAGTAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATTCTAATAAACGATCAGAAAATTCAACTTTTGTTCCAGGCAGTGTACCTGCATTTGGGGCTCCGGTTTCAGCTGCTAGTAGTGGGGTTGCATCTTCTACTCAGAGTACGCCTATTATGCAATTCAGTTCATCGTCTACATCATTTGGTTTGGCTGGATCTGGAAACACGGGCTTGTCTTCTGGCAGTTCTTTGTTTTCTTCTTCAGCTCCAGCATCTAATTTGTTCAGTTCAGGCACCACTTTTGGGCTGGTTTCCTCCAGTTCCTCCGCTAATAATTCTATTAGCTCCAGTGCTGGTACTAGTTCTAGTTTCTTTAATTGGCAGCCATCCTCTGCGCCATCGTTTTCTACAGGATTCAACTCAACTCCAACTGGAGGATTCTCCTTCGGGCTCACATCTTCTACTGCTGCTTCTAATAATGCACCTATGCTCTTTGGATCATCGGCCGGTGGTGCATCAACAACCTCCATTTTCTCATTTACTTCGGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTCGGCAATTCTAATCATGCCTTCACCTTTGGTTCAACCCAACCTGTTAATGATCAATCAAATATGGTGGATAGCATGGCTGAGGATACTGTTCAGACAGTCGCGCCAACTACCCCTAGTTTCGGTCAACAGCCCCTCACACCACCTCCATCATCAGGGTTTGTGTTTGGTTCAACAGCTCCTCCACTAGCAGCAAGTCCTTTCCAGTTTGGGAGCCAGCAAAATGTACCTACCCCCCAAAATCCTTCTCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGGAGCTTCTCATTGGGTGCTGGAGGCGGCGACAAAGCTAACCGCAAATACGTGAAAGTTAAAAGCAAACCACGAAAGAAGTAG
Protein sequence
MALHACRSGAEAHYFRCTQAVFYCFSETPSAAAAVIATFARKSLKSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKVGSASVFKAESSFSGPSFAISEESISDKADNKSSSAGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSAKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPVNDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGSTAPPLAASPFQFGSQQNVPTPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK
Homology
BLAST of Sgr022612 vs. NCBI nr
Match:
XP_022133602.1 (nuclear pore complex protein NUP1 [Momordica charantia])
HSP 1 Score: 1505.3 bits (3896), Expect = 0.0e+00
Identity = 887/1069 (82.97%), Postives = 941/1069 (88.03%), Query Frame = 0
Query: 30 SAAAAVIATFARKSL-KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRV 89
+A+ ++ +FA L SS LSLVPR SGNVDVI+NGFVTPR RGRSALYSMAR+PYSRV
Sbjct: 235 AASQKLVDSFASGDLSNSSTLSLVPRPSGNVDVIDNGFVTPRPRGRSALYSMARLPYSRV 294
Query: 90 RATPSIKNTVATTDAYWAT-SSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIR 149
RAT SIKNTVATTDAY A SSS SQSAWEQGRL+GS QGALKRRSSVLD+EMGSVGPIR
Sbjct: 295 RATSSIKNTVATTDAYRAAPSSSSSQSAWEQGRLVGSNQGALKRRSSVLDNEMGSVGPIR 354
Query: 150 RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETK 209
RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETA+ QSTKVHQL SSAGKALY +ETK
Sbjct: 355 RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETAQRFQSTKVHQLPSSAGKALYSNETK 414
Query: 210 RNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNS 269
NLSKMS FENDM+P +SFPRIPLRSSEMASKILEQLDKLTPPKEKSSE KL VRNNS
Sbjct: 415 CNLSKMSAEFENDMSPSSSFPRIPLRSSEMASKILEQLDKLTPPKEKSSEAKLF-VRNNS 474
Query: 270 PMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPN 329
PMKLSPSMLHGPALRSLEDVDSSKYLENV+ I SNDAQDLTSQ+NDKVEESSSLKFK P
Sbjct: 475 PMKLSPSMLHGPALRSLEDVDSSKYLENVKGIPSNDAQDLTSQRNDKVEESSSLKFKAPK 534
Query: 330 DKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGP 389
DKSI++ DG+ SVPTK A SSSGLPVSSV PSSQTKWAFQMSAHEDFVDM+EEGYSNGP
Sbjct: 535 DKSIATSDGMVSSVPTKVAASSSGLPVSSVAPSSQTKWAFQMSAHEDFVDMEEEGYSNGP 594
Query: 390 ATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPV 449
AT+ISS R+EKVDGPLVAVSKPSDT+ A DK QASI VKPS SEMNKITD KSD P
Sbjct: 595 ATDISSGRREKVDGPLVAVSKPSDTDTTAADKSQASIHVKPS--SEMNKITDLGKSDAPA 654
Query: 450 TTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKEL 509
TTEKS IFSF AS PSITA+ + PE R EKIVSSE+ KAATAP+FGFGDK P QKEL
Sbjct: 655 TTEKSPIFSFSAASPPSITASVVDPELASRSEKIVSSEIPKAATAPLFGFGDKSPIQKEL 714
Query: 510 ITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAAT 569
ITSAPTFAFGN VTTPTN+QN V V SEGNVAPTQ A V TTFKFGDKATFP NA T
Sbjct: 715 ITSAPTFAFGNNVTTPTNKQNVVSDVASEGNVAPTQPAPVSTTFKFGDKATFPISGNAVT 774
Query: 570 ENGNKNARSPFKFASGLVNEKESAKVGSASVFKAESSFSGPSFAISEESISDKADNKSSS 629
ENGNKN+ SPFKF+S LV+EKESAKVGSAS+FKAESSFS PSFA+S+ES+SDK DNKS S
Sbjct: 775 ENGNKNSGSPFKFSSPLVDEKESAKVGSASIFKAESSFSIPSFAVSKESMSDKVDNKSLS 834
Query: 630 AGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNN 689
G TV TSENVFL SSVSTSTP+PSVFSFSSPST SNLNNGSL TPSIFSSP T+F+NN
Sbjct: 835 TGLTVSTSENVFL-SSVSTSTPTPSVFSFSSPSTTSNLNNGSLAPTPSIFSSPVTSFANN 894
Query: 690 ITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSA 749
ITN QNSSIKPS A TSSSE+IT++ LSTSAPMPSFPAAPIFKFGSSSVPSTS S +SA
Sbjct: 895 ITN-QNSSIKPSLPAATSSSETITSTGLSTSAPMPSFPAAPIFKFGSSSVPSTSTSTMSA 954
Query: 750 LIGVGSVETKTKQ-ETTFGNLSGIPPSETSAKVSSTGSSVFQFGAASTTSDSNKRSENST 809
L GVGSVETKT Q TTFGNLSGIPPSET AK SSTGSSVFQFGAASTTSDSNKR ENST
Sbjct: 955 LTGVGSVETKTTQVTTTFGNLSGIPPSETLAKASSTGSSVFQFGAASTTSDSNKRPENST 1014
Query: 810 FVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSA 869
F+PG+VPAFGA VS+A+SGVA+STQ TP+MQFSSSSTSFGLA GNTGLSSGSSLF SSA
Sbjct: 1015 FLPGNVPAFGAAVSSATSGVAASTQ-TPVMQFSSSSTSFGLA--GNTGLSSGSSLFGSSA 1074
Query: 870 PASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 929
PASNLFSSG FGL SSSS+ANNS SS +G SSSFFNWQPSSAPSFSTGFNSTPTGGFSF
Sbjct: 1075 PASNLFSSGAGFGLASSSSAANNSNSSGSGMSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 1134
Query: 930 GLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV- 989
GLTSS+AASN+AP LFGSSA GAST IFSFTSAATAASSQPA GNSNHAFTFGST P
Sbjct: 1135 GLTSSSAASNSAPALFGSSA-GASTAGIFSFTSAATAASSQPAIGNSNHAFTFGSTPPAN 1194
Query: 990 NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGSTAPPLAASPFQFGSQQNV 1049
NDQ++M DSMAEDTVQ VAPTTPSFGQQPLTPPPSSGFVFGST PLAA+PFQFG QQNV
Sbjct: 1195 NDQASMEDSMAEDTVQAVAPTTPSFGQQPLTPPPSSGFVFGSTTTPLAANPFQFGGQQNV 1254
Query: 1050 PTPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
PTPQNPS FQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSK RKK
Sbjct: 1255 PTPQNPSRFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKSRKK 1294
BLAST of Sgr022612 vs. NCBI nr
Match:
XP_038884354.1 (nuclear pore complex protein NUP1-like isoform X2 [Benincasa hispida])
HSP 1 Score: 1419.8 bits (3674), Expect = 0.0e+00
Identity = 852/1088 (78.31%), Postives = 922/1088 (84.74%), Query Frame = 0
Query: 23 YCFSETPSAAAAVIATFARK---------SLKSSALSLVPRSSGNVDVIENGFVTPRSRG 82
Y S P A +A+ ++K KS LSL+PRS GN DV ENGFVTPRSRG
Sbjct: 223 YMGSRPPKATPLSMASHSQKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRG 282
Query: 83 RSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRS 142
RSALYSMARMPYSRVRATPSIKN+VATTDAY ATSSS SQSAW QGRLLGS QGALKRR+
Sbjct: 283 RSALYSMARMPYSRVRATPSIKNSVATTDAYRATSSS-SQSAWGQGRLLGSEQGALKRRN 342
Query: 143 SVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQL 202
SVLDDEMGSVGPIRRIR KSN +F KGLSLP SSTSI VSGIGSET++HLQSTKVH
Sbjct: 343 SVLDDEMGSVGPIRRIRHKSNHLFPKGLSLP--SSSTSIPVSGIGSETSQHLQSTKVHPF 402
Query: 203 SSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKE 262
SS+ GK LY SETKRNLSKMS ENDM P +SFP+IPLRSSEMASKILEQLDKLTPPKE
Sbjct: 403 SSTGGKGLYSSETKRNLSKMSAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKE 462
Query: 263 KSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKND 322
KSSELKLLSVRNNSP KLSPSMLHGPALRSLEDVDS+KYLENVE IRSNDA DLTS+KND
Sbjct: 463 KSSELKLLSVRNNSPSKLSPSMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKND 522
Query: 323 KVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHE 382
K EESS LKFKVPNDKSIS+G+G+G SVP K+ VS SG VS V PS QTK AFQMSAHE
Sbjct: 523 KFEESSPLKFKVPNDKSISTGNGVGSSVP-KETVSGSGQQVSFVGPSLQTKCAFQMSAHE 582
Query: 383 DFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSE 442
DFVDMDEEGYSNGP +IS ERQEKV+ LVAVSKP++TEAI VDKPQASI+ KP TVS
Sbjct: 583 DFVDMDEEGYSNGPVADISIERQEKVNS-LVAVSKPNNTEAITVDKPQASIEAKPPTVSA 642
Query: 443 MNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAP 502
MNKI DQ KSDVPVTTEKS IFSFPT SSPSITAN IGPES +RPEKI SSEV KAAT P
Sbjct: 643 MNKINDQGKSDVPVTTEKSPIFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTP 702
Query: 503 VFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKF 562
+FGFG+K PSQKE ++ APTFAF NK+TT TNEQNA+PVVTSEGNV PTQQA+ PTTFKF
Sbjct: 703 IFGFGEKFPSQKEAVSFAPTFAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKF 762
Query: 563 GDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKV-GSASVFKAESSFSG-PSFA 622
GDKATFP PANAATENGNKN SP FAS LVNEKE AK GSASVFKAESS S PSF
Sbjct: 763 GDKATFPIPANAATENGNKNEGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSIPSFG 822
Query: 623 ISEESISDKADNKSSSAGHTVGTSENVFLSS-SVSTSTPSPSVFSFSSPSTNSNLNNGSL 682
+ +ES+S+KA +KSSSAG VGTS ++F SS S S STP+ +FSFSSPSTNSNLNNGSL
Sbjct: 823 VPKESMSEKAGDKSSSAGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLNNGSL 882
Query: 683 VSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIF 742
VST F +PATTFSNNITN QNSSIKPS A S+SE +TT+SL TS+ MPSF AAPI
Sbjct: 883 VSTTPSFPTPATTFSNNITN-QNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSAAPIS 942
Query: 743 KFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSA-KVSSTGSSVFQF 802
KFGSSSVPSTS LSA GVGS+E+KTKQETTFGNLSGIPPS+ SA KVSSTGSSVFQF
Sbjct: 943 KFGSSSVPSTSAPALSAPSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSSVFQF 1002
Query: 803 GAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAG 862
GAAST SDSNKR NSTF P +VP FGA S SSG+ASSTQSTP++QF+SSSTSFGL
Sbjct: 1003 GAASTPSDSNKRPANSTFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSFGL-- 1062
Query: 863 SGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSA 922
+GNTGL+SGSSLF SSAPASNLF+SG TFGL SSSSS NNS+SSSAGTSSSFFNWQPSS
Sbjct: 1063 TGNTGLASGSSLFGSSAPASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQPSST 1122
Query: 923 PSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPA 982
PSFSTGF+STPTGGFSFGL+SS+AASN+AP+LFGSS+ G+ T S+FSFTSAATA +SQPA
Sbjct: 1123 PSFSTGFSSTPTGGFSFGLSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATTSQPA 1182
Query: 983 FGNSNHAFTFGSTQPV-NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGST 1042
FGNSNH FTFGST P NDQ+NM DSMAEDTVQTV PSFGQQPLTPPPSSGFVFGST
Sbjct: 1183 FGNSNHGFTFGSTPPANNDQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFVFGST 1242
Query: 1043 APPLAASPFQF-GSQQNVPTPQ-NPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVK 1095
APPL ASPFQF GSQQNVPTPQ NPSPFQASGSLDFNASAGGSFSLGAGGGDK+NRK+VK
Sbjct: 1243 APPLGASPFQFGGSQQNVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVK 1300
BLAST of Sgr022612 vs. NCBI nr
Match:
XP_038884353.1 (nuclear pore complex protein NUP1-like isoform X1 [Benincasa hispida])
HSP 1 Score: 1418.3 bits (3670), Expect = 0.0e+00
Identity = 852/1092 (78.02%), Postives = 922/1092 (84.43%), Query Frame = 0
Query: 23 YCFSETPSAAAAVIATFARK---------SLKSSALSLVPRSSGNVDVIENGFVTPRSRG 82
Y S P A +A+ ++K KS LSL+PRS GN DV ENGFVTPRSRG
Sbjct: 223 YMGSRPPKATPLSMASHSQKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRG 282
Query: 83 RSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRS 142
RSALYSMARMPYSRVRATPSIKN+VATTDAY ATSSS SQSAW QGRLLGS QGALKRR+
Sbjct: 283 RSALYSMARMPYSRVRATPSIKNSVATTDAYRATSSS-SQSAWGQGRLLGSEQGALKRRN 342
Query: 143 SVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQL 202
SVLDDEMGSVGPIRRIR KSN +F KGLSLP SSTSI VSGIGSET++HLQSTKVH
Sbjct: 343 SVLDDEMGSVGPIRRIRHKSNHLFPKGLSLP--SSSTSIPVSGIGSETSQHLQSTKVHPF 402
Query: 203 SSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKE 262
SS+ GK LY SETKRNLSKMS ENDM P +SFP+IPLRSSEMASKILEQLDKLTPPKE
Sbjct: 403 SSTGGKGLYSSETKRNLSKMSAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKE 462
Query: 263 KSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKND 322
KSSELKLLSVRNNSP KLSPSMLHGPALRSLEDVDS+KYLENVE IRSNDA DLTS+KND
Sbjct: 463 KSSELKLLSVRNNSPSKLSPSMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKND 522
Query: 323 KVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHE 382
K EESS LKFKVPNDKSIS+G+G+G SVP K+ VS SG VS V PS QTK AFQMSAHE
Sbjct: 523 KFEESSPLKFKVPNDKSISTGNGVGSSVP-KETVSGSGQQVSFVGPSLQTKCAFQMSAHE 582
Query: 383 DFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSE 442
DFVDMDEEGYSNGP +IS ERQEKV+ LVAVSKP++TEAI VDKPQASI+ KP TVS
Sbjct: 583 DFVDMDEEGYSNGPVADISIERQEKVNS-LVAVSKPNNTEAITVDKPQASIEAKPPTVSA 642
Query: 443 MNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAP 502
MNKI DQ KSDVPVTTEKS IFSFPT SSPSITAN IGPES +RPEKI SSEV KAAT P
Sbjct: 643 MNKINDQGKSDVPVTTEKSPIFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTP 702
Query: 503 VFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKF 562
+FGFG+K PSQKE ++ APTFAF NK+TT TNEQNA+PVVTSEGNV PTQQA+ PTTFKF
Sbjct: 703 IFGFGEKFPSQKEAVSFAPTFAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKF 762
Query: 563 GDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKV-GSASVFKAESSFSG----- 622
GDKATFP PANAATENGNKN SP FAS LVNEKE AK GSASVFKAESS S
Sbjct: 763 GDKATFPIPANAATENGNKNEGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSFNCSI 822
Query: 623 PSFAISEESISDKADNKSSSAGHTVGTSENVFLSS-SVSTSTPSPSVFSFSSPSTNSNLN 682
PSF + +ES+S+KA +KSSSAG VGTS ++F SS S S STP+ +FSFSSPSTNSNLN
Sbjct: 823 PSFGVPKESMSEKAGDKSSSAGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLN 882
Query: 683 NGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPA 742
NGSLVST F +PATTFSNNITN QNSSIKPS A S+SE +TT+SL TS+ MPSF A
Sbjct: 883 NGSLVSTTPSFPTPATTFSNNITN-QNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSA 942
Query: 743 APIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSA-KVSSTGSS 802
API KFGSSSVPSTS LSA GVGS+E+KTKQETTFGNLSGIPPS+ SA KVSSTGSS
Sbjct: 943 APISKFGSSSVPSTSAPALSAPSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSS 1002
Query: 803 VFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSF 862
VFQFGAAST SDSNKR NSTF P +VP FGA S SSG+ASSTQSTP++QF+SSSTSF
Sbjct: 1003 VFQFGAASTPSDSNKRPANSTFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSF 1062
Query: 863 GLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQ 922
GL +GNTGL+SGSSLF SSAPASNLF+SG TFGL SSSSS NNS+SSSAGTSSSFFNWQ
Sbjct: 1063 GL--TGNTGLASGSSLFGSSAPASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQ 1122
Query: 923 PSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAAS 982
PSS PSFSTGF+STPTGGFSFGL+SS+AASN+AP+LFGSS+ G+ T S+FSFTSAATA +
Sbjct: 1123 PSSTPSFSTGFSSTPTGGFSFGLSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATT 1182
Query: 983 SQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFV 1042
SQPAFGNSNH FTFGST P NDQ+NM DSMAEDTVQTV PSFGQQPLTPPPSSGFV
Sbjct: 1183 SQPAFGNSNHGFTFGSTPPANNDQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFV 1242
Query: 1043 FGSTAPPLAASPFQF-GSQQNVPTPQ-NPSPFQASGSLDFNASAGGSFSLGAGGGDKANR 1095
FGSTAPPL ASPFQF GSQQNVPTPQ NPSPFQASGSLDFNASAGGSFSLGAGGGDK+NR
Sbjct: 1243 FGSTAPPLGASPFQFGGSQQNVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNR 1302
BLAST of Sgr022612 vs. NCBI nr
Match:
XP_038884355.1 (nuclear pore complex protein NUP1-like isoform X3 [Benincasa hispida])
HSP 1 Score: 1418.3 bits (3670), Expect = 0.0e+00
Identity = 852/1092 (78.02%), Postives = 922/1092 (84.43%), Query Frame = 0
Query: 23 YCFSETPSAAAAVIATFARK---------SLKSSALSLVPRSSGNVDVIENGFVTPRSRG 82
Y S P A +A+ ++K KS LSL+PRS GN DV ENGFVTPRSRG
Sbjct: 219 YMGSRPPKATPLSMASHSQKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRG 278
Query: 83 RSALYSMARMPYSRVRATPSIKNTVATTDAYWATSSSLSQSAWEQGRLLGSTQGALKRRS 142
RSALYSMARMPYSRVRATPSIKN+VATTDAY ATSSS SQSAW QGRLLGS QGALKRR+
Sbjct: 279 RSALYSMARMPYSRVRATPSIKNSVATTDAYRATSSS-SQSAWGQGRLLGSEQGALKRRN 338
Query: 143 SVLDDEMGSVGPIRRIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQL 202
SVLDDEMGSVGPIRRIR KSN +F KGLSLP SSTSI VSGIGSET++HLQSTKVH
Sbjct: 339 SVLDDEMGSVGPIRRIRHKSNHLFPKGLSLP--SSSTSIPVSGIGSETSQHLQSTKVHPF 398
Query: 203 SSSAGKALYLSETKRNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKE 262
SS+ GK LY SETKRNLSKMS ENDM P +SFP+IPLRSSEMASKILEQLDKLTPPKE
Sbjct: 399 SSTGGKGLYSSETKRNLSKMSAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKE 458
Query: 263 KSSELKLLSVRNNSPMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKND 322
KSSELKLLSVRNNSP KLSPSMLHGPALRSLEDVDS+KYLENVE IRSNDA DLTS+KND
Sbjct: 459 KSSELKLLSVRNNSPSKLSPSMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKND 518
Query: 323 KVEESSSLKFKVPNDKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHE 382
K EESS LKFKVPNDKSIS+G+G+G SVP K+ VS SG VS V PS QTK AFQMSAHE
Sbjct: 519 KFEESSPLKFKVPNDKSISTGNGVGSSVP-KETVSGSGQQVSFVGPSLQTKCAFQMSAHE 578
Query: 383 DFVDMDEEGYSNGPATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSE 442
DFVDMDEEGYSNGP +IS ERQEKV+ LVAVSKP++TEAI VDKPQASI+ KP TVS
Sbjct: 579 DFVDMDEEGYSNGPVADISIERQEKVNS-LVAVSKPNNTEAITVDKPQASIEAKPPTVSA 638
Query: 443 MNKITDQAKSDVPVTTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAP 502
MNKI DQ KSDVPVTTEKS IFSFPT SSPSITAN IGPES +RPEKI SSEV KAAT P
Sbjct: 639 MNKINDQGKSDVPVTTEKSPIFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTP 698
Query: 503 VFGFGDKLPSQKELITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKF 562
+FGFG+K PSQKE ++ APTFAF NK+TT TNEQNA+PVVTSEGNV PTQQA+ PTTFKF
Sbjct: 699 IFGFGEKFPSQKEAVSFAPTFAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKF 758
Query: 563 GDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKV-GSASVFKAESSFSG----- 622
GDKATFP PANAATENGNKN SP FAS LVNEKE AK GSASVFKAESS S
Sbjct: 759 GDKATFPIPANAATENGNKNEGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSFNCSI 818
Query: 623 PSFAISEESISDKADNKSSSAGHTVGTSENVFLSS-SVSTSTPSPSVFSFSSPSTNSNLN 682
PSF + +ES+S+KA +KSSSAG VGTS ++F SS S S STP+ +FSFSSPSTNSNLN
Sbjct: 819 PSFGVPKESMSEKAGDKSSSAGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLN 878
Query: 683 NGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPA 742
NGSLVST F +PATTFSNNITN QNSSIKPS A S+SE +TT+SL TS+ MPSF A
Sbjct: 879 NGSLVSTTPSFPTPATTFSNNITN-QNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSA 938
Query: 743 APIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSETSA-KVSSTGSS 802
API KFGSSSVPSTS LSA GVGS+E+KTKQETTFGNLSGIPPS+ SA KVSSTGSS
Sbjct: 939 APISKFGSSSVPSTSAPALSAPSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSS 998
Query: 803 VFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSF 862
VFQFGAAST SDSNKR NSTF P +VP FGA S SSG+ASSTQSTP++QF+SSSTSF
Sbjct: 999 VFQFGAASTPSDSNKRPANSTFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSF 1058
Query: 863 GLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQ 922
GL +GNTGL+SGSSLF SSAPASNLF+SG TFGL SSSSS NNS+SSSAGTSSSFFNWQ
Sbjct: 1059 GL--TGNTGLASGSSLFGSSAPASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQ 1118
Query: 923 PSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAAS 982
PSS PSFSTGF+STPTGGFSFGL+SS+AASN+AP+LFGSS+ G+ T S+FSFTSAATA +
Sbjct: 1119 PSSTPSFSTGFSSTPTGGFSFGLSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATT 1178
Query: 983 SQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFV 1042
SQPAFGNSNH FTFGST P NDQ+NM DSMAEDTVQTV PSFGQQPLTPPPSSGFV
Sbjct: 1179 SQPAFGNSNHGFTFGSTPPANNDQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFV 1238
Query: 1043 FGSTAPPLAASPFQF-GSQQNVPTPQ-NPSPFQASGSLDFNASAGGSFSLGAGGGDKANR 1095
FGSTAPPL ASPFQF GSQQNVPTPQ NPSPFQASGSLDFNASAGGSFSLGAGGGDK+NR
Sbjct: 1239 FGSTAPPLGASPFQFGGSQQNVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNR 1298
BLAST of Sgr022612 vs. NCBI nr
Match:
XP_022938795.1 (nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata])
HSP 1 Score: 1384.8 bits (3583), Expect = 0.0e+00
Identity = 836/1060 (78.87%), Postives = 903/1060 (85.19%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252 KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311
Query: 105 WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
AT +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312 RATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371
Query: 165 ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
SSTSI VSGIGSET++HLQSTKVH SS AGKA Y SETKRNLSKMS END TP
Sbjct: 372 --SSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAESENDRTPS 431
Query: 225 TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
+SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432 SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491
Query: 285 EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
EDVDS+KYLENVEDIRSND +DLTS+K DK E+SS LK KVP+DKSIS+G G+G SVP+K
Sbjct: 492 EDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSK 551
Query: 345 DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
D VSSSGL VS V PSS TK AFQMS EDFVDMD+E YSNGP + S ER+EKVD LV
Sbjct: 552 DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERREKVDDSLV 611
Query: 405 AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
AV KPSDTEAI VDKPQASI KPS VSEM KI DQAKSDVPVTTEKS+IFSFPTAS S
Sbjct: 612 AVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSS 671
Query: 465 ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
TAN I PEST RPEKI SSEV KAA AP+FGFG+KLPSQK+ + S+PTF FGNKVTT T
Sbjct: 672 TTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTST 731
Query: 525 NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ ATENGN A SPFKFAS L
Sbjct: 732 NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSL 791
Query: 585 VNEKESAKVGSASVFKAESSFSGP-SFAISEESISDKA-DNKSSSAGHTVGTSENVFLSS 644
VNEKE AK GSASVFK+ESS S SF + +ES+S+KA D KSSSAG +VGTS N+ LSS
Sbjct: 792 VNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGTSGNLLLSS 851
Query: 645 SVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTA 704
+STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKPS A
Sbjct: 852 --VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKPSLNA 911
Query: 705 VTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQET 764
TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPS+ SA GVGSVETKTKQET
Sbjct: 912 ATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPSGVGSVETKTKQET 971
Query: 765 T-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVS 824
T FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK+ E STF P SVP+FGAPV
Sbjct: 972 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1031
Query: 825 AASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGL 884
ASSGVASSTQSTP+ FSSSSTSFGL +GNTGL+SG+SL SSAPASNLF+SG TFG
Sbjct: 1032 PASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFTSGATFGF 1091
Query: 885 VSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPM 944
SSSSANNS+SS AGTSSSFFNWQ SSAPSFS+GF STPTGGFSFGL SS+AAS+++PM
Sbjct: 1092 -GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPM 1151
Query: 945 LFGSS-AGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAED 1004
LFGSS G ASTTS+FSFTSAATAA SQPAFG SNH FTFGST P ND +NM DSMAED
Sbjct: 1152 LFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAED 1211
Query: 1005 TVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQNPSPF 1064
TVQTVA T PSFGQQPLTPPPSSGFVFGSTAP PL A+PFQF GSQQNVPTPQNP+PF
Sbjct: 1212 TVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPF 1271
Query: 1065 QASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
QASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 QASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of Sgr022612 vs. ExPASy Swiss-Prot
Match:
Q9CAF4 (Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 SV=1)
HSP 1 Score: 270.4 bits (690), Expect = 8.9e-71
Identity = 384/1133 (33.89%), Postives = 537/1133 (47.40%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KS +SLV + SG +ENGFVTPRSRGRSA+YSMAR PYSR +++ I
Sbjct: 272 KSPTMSLVTKPSGQ-RPLENGFVTPRSRGRSAVYSMARTPYSRPQSSVKI---------- 331
Query: 105 WATSSSLSQSAWEQGRLLGSTQG---ALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGL 164
+ S S WE+ GS QG LKRRSSVLD+++GSVGP+RRIRQKSNL S+ L
Sbjct: 332 -GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLDNDIGSVGPVRRIRQKSNL-SSRSL 391
Query: 165 SLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDM 224
+LP+S S S+ +G G +T H SA +
Sbjct: 392 ALPVSESPLSVRANG-GEKT--------THTSKDSA----------------------ED 451
Query: 225 TPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPAL 284
P +SF +P +SSEMASKIL+QLD KL+S R SP KLSPSML GPAL
Sbjct: 452 IPGSSFNLVPTKSSEMASKILQQLD------------KLVSTREKSPSKLSPSMLRGPAL 511
Query: 285 RSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSV 344
+SL++V++ K+L N+ + ++N + D + QK + ES S + ++K+ + DG +
Sbjct: 512 KSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQEISRESVSREVLAQSEKTGDAVDGTSKTG 571
Query: 345 PTKDA-VSSSG--LPV-SSVIPSSQTKWAFQMSAHEDFVDMDEE-GYSNGPATNISSERQ 404
+KD + G +P+ +S+ K +F+MSAHEDF+++D++ G ++ P +E+Q
Sbjct: 572 SSKDQDMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDFLELDDDLGAASTPCE--VAEKQ 631
Query: 405 EKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFS 464
+ +S P +KP + PST N Q S+ + TE++ +
Sbjct: 632 NAFEVEKSHISMPIG------EKPLTPSEAMPSTSYISNGDASQGTSNGSLETERNKFVA 691
Query: 465 FP--------TASSPS------ITANAIGPESTLRPEKIVSSEVSK--AATAPVFGFGDK 524
FP AS P+ ++I EK + E K AA P F
Sbjct: 692 FPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPTSEEKRIPLEEPKKPAAVFPNISFS-- 751
Query: 525 LPSQKELI--------------TSAPTFAFGNKVTTPTNEQ----NAVPVVTSEGNVAPT 584
P L+ TS+ F PT + N+ S + APT
Sbjct: 752 -PPATGLLNQNSGASADIKLEKTSSTAFGVSEAWAKPTESKKTFSNSASGAESSTSAAPT 811
Query: 585 QQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKVGS-ASVFKA 644
++ F G A P P+N + + SP F + N VG S ++
Sbjct: 812 LNGSI---FSAGANAVTPPPSNGSLTS------SP-SFPPSISNIPSDNSVGDMPSTVQS 871
Query: 645 ESSFSGPSFAISEESISDKADNKSSSAGHTVGTSENVFLSSSVSTSTP----SPSVFSFS 704
++ S + S+ ++++S+SA TS F + S P S S
Sbjct: 872 FAATHNSSSIFGKLPTSNDSNSQSTSASPLSSTSPFKFGQPAAPFSAPAVSESSGQISKE 931
Query: 705 SPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLST 764
+ N+ N S + S+ +T + +++ K P V SS + S+L+
Sbjct: 932 TEVKNATFGNTSTFKFGGMASADQST--GIVFGAKSAENKSRPGFVFGSSSVVGGSTLNP 991
Query: 765 SAPMPSFPAAP---IFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSE 824
S S P + IF SSS P T S +SA S T T + FG S S
Sbjct: 992 STAAASAPESSGSLIFGVTSSSTPGTETSKISA----SSAATNT-GNSVFGTSSFAFTSS 1051
Query: 825 TSAKV----SSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASST 884
S+ V +STGSSVF F A S+ S ++ +S+ S A A SG +ST
Sbjct: 1052 GSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNL----FGAGNAQTGNTGSGTTTST 1111
Query: 885 QSTPIMQFSS-SSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANN 944
QS P SS S+ SFGL SGN+ L+S SS F S +F+S +T L S++SSA++
Sbjct: 1112 QSIPFQFGSSPSAPSFGL--SGNSSLASNSSPFGFSKSEPAVFTSVSTPQLSSTNSSASS 1171
Query: 945 SISSSA---GTSSSFFNWQPSSAPSFSTGF--NSTPTGGFSFGLTSSTAASNNAPMLFGS 1004
S + S+ GTS N P+S P FS+ F +STPT FSFG +S+ S+ +FG+
Sbjct: 1172 SSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-TFSFGGSSAATVSSTTTPIFGA 1231
Query: 1005 SAGGA-STTSIFSFTSAATAASSQPAFGNSN--HAFTFGSTQP--------------VND 1064
S S + IF F S QP FGNS FG++ P N
Sbjct: 1232 STNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFGNSTPGFAFGAPNNGNGINNNQ 1291
Query: 1065 QSNMVDSMAEDTVQT--VAPTTPSFGQQPLTPPPSSGFVFG---STAPPLAASPFQFGSQ 1095
Q +M DSMAEDT Q + P FGQ ++ P F FG +T PP A+PFQFG Q
Sbjct: 1292 QVSMEDSMAEDTDQANRASMVAPMFGQAAVS-MPQPNFAFGGGAATQPPSMANPFQFGGQ 1309
BLAST of Sgr022612 vs. ExPASy TrEMBL
Match:
A0A6J1BX57 (nuclear pore complex protein NUP1 OS=Momordica charantia OX=3673 GN=LOC111006142 PE=4 SV=1)
HSP 1 Score: 1505.3 bits (3896), Expect = 0.0e+00
Identity = 887/1069 (82.97%), Postives = 941/1069 (88.03%), Query Frame = 0
Query: 30 SAAAAVIATFARKSL-KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRV 89
+A+ ++ +FA L SS LSLVPR SGNVDVI+NGFVTPR RGRSALYSMAR+PYSRV
Sbjct: 235 AASQKLVDSFASGDLSNSSTLSLVPRPSGNVDVIDNGFVTPRPRGRSALYSMARLPYSRV 294
Query: 90 RATPSIKNTVATTDAYWAT-SSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIR 149
RAT SIKNTVATTDAY A SSS SQSAWEQGRL+GS QGALKRRSSVLD+EMGSVGPIR
Sbjct: 295 RATSSIKNTVATTDAYRAAPSSSSSQSAWEQGRLVGSNQGALKRRSSVLDNEMGSVGPIR 354
Query: 150 RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETK 209
RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETA+ QSTKVHQL SSAGKALY +ETK
Sbjct: 355 RIRQKSNLVFSKGLSLPISGSSTSISVSGIGSETAQRFQSTKVHQLPSSAGKALYSNETK 414
Query: 210 RNLSKMSTGFENDMTPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNS 269
NLSKMS FENDM+P +SFPRIPLRSSEMASKILEQLDKLTPPKEKSSE KL VRNNS
Sbjct: 415 CNLSKMSAEFENDMSPSSSFPRIPLRSSEMASKILEQLDKLTPPKEKSSEAKLF-VRNNS 474
Query: 270 PMKLSPSMLHGPALRSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPN 329
PMKLSPSMLHGPALRSLEDVDSSKYLENV+ I SNDAQDLTSQ+NDKVEESSSLKFK P
Sbjct: 475 PMKLSPSMLHGPALRSLEDVDSSKYLENVKGIPSNDAQDLTSQRNDKVEESSSLKFKAPK 534
Query: 330 DKSISSGDGIGFSVPTKDAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGP 389
DKSI++ DG+ SVPTK A SSSGLPVSSV PSSQTKWAFQMSAHEDFVDM+EEGYSNGP
Sbjct: 535 DKSIATSDGMVSSVPTKVAASSSGLPVSSVAPSSQTKWAFQMSAHEDFVDMEEEGYSNGP 594
Query: 390 ATNISSERQEKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPV 449
AT+ISS R+EKVDGPLVAVSKPSDT+ A DK QASI VKPS SEMNKITD KSD P
Sbjct: 595 ATDISSGRREKVDGPLVAVSKPSDTDTTAADKSQASIHVKPS--SEMNKITDLGKSDAPA 654
Query: 450 TTEKSAIFSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKEL 509
TTEKS IFSF AS PSITA+ + PE R EKIVSSE+ KAATAP+FGFGDK P QKEL
Sbjct: 655 TTEKSPIFSFSAASPPSITASVVDPELASRSEKIVSSEIPKAATAPLFGFGDKSPIQKEL 714
Query: 510 ITSAPTFAFGNKVTTPTNEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAAT 569
ITSAPTFAFGN VTTPTN+QN V V SEGNVAPTQ A V TTFKFGDKATFP NA T
Sbjct: 715 ITSAPTFAFGNNVTTPTNKQNVVSDVASEGNVAPTQPAPVSTTFKFGDKATFPISGNAVT 774
Query: 570 ENGNKNARSPFKFASGLVNEKESAKVGSASVFKAESSFSGPSFAISEESISDKADNKSSS 629
ENGNKN+ SPFKF+S LV+EKESAKVGSAS+FKAESSFS PSFA+S+ES+SDK DNKS S
Sbjct: 775 ENGNKNSGSPFKFSSPLVDEKESAKVGSASIFKAESSFSIPSFAVSKESMSDKVDNKSLS 834
Query: 630 AGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNN 689
G TV TSENVFL SSVSTSTP+PSVFSFSSPST SNLNNGSL TPSIFSSP T+F+NN
Sbjct: 835 TGLTVSTSENVFL-SSVSTSTPTPSVFSFSSPSTTSNLNNGSLAPTPSIFSSPVTSFANN 894
Query: 690 ITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSA 749
ITN QNSSIKPS A TSSSE+IT++ LSTSAPMPSFPAAPIFKFGSSSVPSTS S +SA
Sbjct: 895 ITN-QNSSIKPSLPAATSSSETITSTGLSTSAPMPSFPAAPIFKFGSSSVPSTSTSTMSA 954
Query: 750 LIGVGSVETKTKQ-ETTFGNLSGIPPSETSAKVSSTGSSVFQFGAASTTSDSNKRSENST 809
L GVGSVETKT Q TTFGNLSGIPPSET AK SSTGSSVFQFGAASTTSDSNKR ENST
Sbjct: 955 LTGVGSVETKTTQVTTTFGNLSGIPPSETLAKASSTGSSVFQFGAASTTSDSNKRPENST 1014
Query: 810 FVPGSVPAFGAPVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSA 869
F+PG+VPAFGA VS+A+SGVA+STQ TP+MQFSSSSTSFGLA GNTGLSSGSSLF SSA
Sbjct: 1015 FLPGNVPAFGAAVSSATSGVAASTQ-TPVMQFSSSSTSFGLA--GNTGLSSGSSLFGSSA 1074
Query: 870 PASNLFSSGTTFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 929
PASNLFSSG FGL SSSS+ANNS SS +G SSSFFNWQPSSAPSFSTGFNSTPTGGFSF
Sbjct: 1075 PASNLFSSGAGFGLASSSSAANNSNSSGSGMSSSFFNWQPSSAPSFSTGFNSTPTGGFSF 1134
Query: 930 GLTSSTAASNNAPMLFGSSAGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV- 989
GLTSS+AASN+AP LFGSSA GAST IFSFTSAATAASSQPA GNSNHAFTFGST P
Sbjct: 1135 GLTSSSAASNSAPALFGSSA-GASTAGIFSFTSAATAASSQPAIGNSNHAFTFGSTPPAN 1194
Query: 990 NDQSNMVDSMAEDTVQTVAPTTPSFGQQPLTPPPSSGFVFGSTAPPLAASPFQFGSQQNV 1049
NDQ++M DSMAEDTVQ VAPTTPSFGQQPLTPPPSSGFVFGST PLAA+PFQFG QQNV
Sbjct: 1195 NDQASMEDSMAEDTVQAVAPTTPSFGQQPLTPPPSSGFVFGSTTTPLAANPFQFGGQQNV 1254
Query: 1050 PTPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
PTPQNPS FQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSK RKK
Sbjct: 1255 PTPQNPSRFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKSRKK 1294
BLAST of Sgr022612 vs. ExPASy TrEMBL
Match:
A0A6J1FKS9 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 1384.8 bits (3583), Expect = 0.0e+00
Identity = 836/1060 (78.87%), Postives = 903/1060 (85.19%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252 KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311
Query: 105 WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
AT +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312 RATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371
Query: 165 ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
SSTSI VSGIGSET++HLQSTKVH SS AGKA Y SETKRNLSKMS END TP
Sbjct: 372 --SSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAESENDRTPS 431
Query: 225 TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
+SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432 SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491
Query: 285 EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
EDVDS+KYLENVEDIRSND +DLTS+K DK E+SS LK KVP+DKSIS+G G+G SVP+K
Sbjct: 492 EDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSK 551
Query: 345 DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
D VSSSGL VS V PSS TK AFQMS EDFVDMD+E YSNGP + S ER+EKVD LV
Sbjct: 552 DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERREKVDDSLV 611
Query: 405 AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
AV KPSDTEAI VDKPQASI KPS VSEM KI DQAKSDVPVTTEKS+IFSFPTAS S
Sbjct: 612 AVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSS 671
Query: 465 ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
TAN I PEST RPEKI SSEV KAA AP+FGFG+KLPSQK+ + S+PTF FGNKVTT T
Sbjct: 672 TTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTST 731
Query: 525 NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ ATENGN A SPFKFAS L
Sbjct: 732 NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSL 791
Query: 585 VNEKESAKVGSASVFKAESSFSGP-SFAISEESISDKA-DNKSSSAGHTVGTSENVFLSS 644
VNEKE AK GSASVFK+ESS S SF + +ES+S+KA D KSSSAG +VGTS N+ LSS
Sbjct: 792 VNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGTSGNLLLSS 851
Query: 645 SVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTA 704
+STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKPS A
Sbjct: 852 --VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKPSLNA 911
Query: 705 VTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQET 764
TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPS+ SA GVGSVETKTKQET
Sbjct: 912 ATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPSGVGSVETKTKQET 971
Query: 765 T-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVS 824
T FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK+ E STF P SVP+FGAPV
Sbjct: 972 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1031
Query: 825 AASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGL 884
ASSGVASSTQSTP+ FSSSSTSFGL +GNTGL+SG+SL SSAPASNLF+SG TFG
Sbjct: 1032 PASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFTSGATFGF 1091
Query: 885 VSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPM 944
SSSSANNS+SS AGTSSSFFNWQ SSAPSFS+GF STPTGGFSFGL SS+AAS+++PM
Sbjct: 1092 -GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPM 1151
Query: 945 LFGSS-AGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAED 1004
LFGSS G ASTTS+FSFTSAATAA SQPAFG SNH FTFGST P ND +NM DSMAED
Sbjct: 1152 LFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAED 1211
Query: 1005 TVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQNPSPF 1064
TVQTVA T PSFGQQPLTPPPSSGFVFGSTAP PL A+PFQF GSQQNVPTPQNP+PF
Sbjct: 1212 TVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPF 1271
Query: 1065 QASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
QASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 QASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of Sgr022612 vs. ExPASy TrEMBL
Match:
A0A6J1FF52 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 1382.5 bits (3577), Expect = 0.0e+00
Identity = 836/1064 (78.57%), Postives = 903/1064 (84.87%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252 KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311
Query: 105 WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
AT +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312 RATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371
Query: 165 ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
SSTSI VSGIGSET++HLQSTKVH SS AGKA Y SETKRNLSKMS END TP
Sbjct: 372 --SSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAESENDRTPS 431
Query: 225 TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
+SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432 SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491
Query: 285 EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
EDVDS+KYLENVEDIRSND +DLTS+K DK E+SS LK KVP+DKSIS+G G+G SVP+K
Sbjct: 492 EDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSK 551
Query: 345 DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
D VSSSGL VS V PSS TK AFQMS EDFVDMD+E YSNGP + S ER+EKVD LV
Sbjct: 552 DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERREKVDDSLV 611
Query: 405 AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
AV KPSDTEAI VDKPQASI KPS VSEM KI DQAKSDVPVTTEKS+IFSFPTAS S
Sbjct: 612 AVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSS 671
Query: 465 ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
TAN I PEST RPEKI SSEV KAA AP+FGFG+KLPSQK+ + S+PTF FGNKVTT T
Sbjct: 672 TTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTST 731
Query: 525 NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ ATENGN A SPFKFAS L
Sbjct: 732 NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSL 791
Query: 585 VNEKESAKVGSASVFKAESSFSG-----PSFAISEESISDKA-DNKSSSAGHTVGTSENV 644
VNEKE AK GSASVFK+ESS S SF + +ES+S+KA D KSSSAG +VGTS N+
Sbjct: 792 VNEKEGAKAGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSSSAGLSVGTSGNL 851
Query: 645 FLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKP 704
LSS +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKP
Sbjct: 852 LLSS--VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKP 911
Query: 705 SPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKT 764
S A TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPS+ SA GVGSVETKT
Sbjct: 912 SLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPSGVGSVETKT 971
Query: 765 KQETT-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFG 824
KQETT FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK+ E STF P SVP+FG
Sbjct: 972 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1031
Query: 825 APVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGT 884
APV ASSGVASSTQSTP+ FSSSSTSFGL +GNTGL+SG+SL SSAPASNLF+SG
Sbjct: 1032 APVLPASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFTSGA 1091
Query: 885 TFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASN 944
TFG SSSSANNS+SS AGTSSSFFNWQ SSAPSFS+GF STPTGGFSFGL SS+AAS+
Sbjct: 1092 TFGF-GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASS 1151
Query: 945 NAPMLFGSS-AGGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDS 1004
++PMLFGSS G ASTTS+FSFTSAATAA SQPAFG SNH FTFGST P ND +NM DS
Sbjct: 1152 SSPMLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDS 1211
Query: 1005 MAEDTVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQN 1064
MAEDTVQTVA T PSFGQQPLTPPPSSGFVFGSTAP PL A+PFQF GSQQNVPTPQN
Sbjct: 1212 MAEDTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQN 1271
Query: 1065 PSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
P+PFQASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 PNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of Sgr022612 vs. ExPASy TrEMBL
Match:
A0A6J1K059 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)
HSP 1 Score: 1370.5 bits (3546), Expect = 0.0e+00
Identity = 829/1060 (78.21%), Postives = 897/1060 (84.62%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252 KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311
Query: 105 WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
A+ +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312 RASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371
Query: 165 ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
SSTSI VSGIGSET +HLQSTKVH SS+AGKA Y SETKRNLSKMS END TP
Sbjct: 372 --SSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAESENDRTPS 431
Query: 225 TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
+SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432 SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491
Query: 285 EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
EDVDS+KYLENVEDIRSND +DLTS+KNDK E+SS LK +VP+DKSIS+G G+G SVP+K
Sbjct: 492 EDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGGVGSSVPSK 551
Query: 345 DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
D VSSSGL VS V PSS TK AFQMS EDFVDMD+E YSNGP S ER+EKVD LV
Sbjct: 552 DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERREKVDDSLV 611
Query: 405 AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
AV KPSD EAI VDKPQASI KPSTVSEM KI DQAKSD+PVTTEKS+IFSFPTAS S
Sbjct: 612 AVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFSFPTASPSS 671
Query: 465 ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
TA I PEST RPEKI SEV KAA AP+FGFG+K PSQK+ + S+PTF FGNKVTT T
Sbjct: 672 TTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTST 731
Query: 525 NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ TENGN A SPFKFAS L
Sbjct: 732 NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSL 791
Query: 585 VNEKESAKVGSASVFKAESSFSG-PSFAISEESISDKA-DNKSSSAGHTVGTSENVFLSS 644
VNEKE AK GSASVFK+ESS S SF + +E +S+KA D KSSSAG +VGTS N+ LSS
Sbjct: 792 VNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGTSGNLLLSS 851
Query: 645 SVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTA 704
+STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKPS A
Sbjct: 852 --VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKPSLNA 911
Query: 705 VTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKTKQET 764
TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPST SA G GSVETKTKQET
Sbjct: 912 ATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPST-----SAPNGAGSVETKTKQET 971
Query: 765 T-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVS 824
T FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK E STF P SVP+FGAPV
Sbjct: 972 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1031
Query: 825 AASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGL 884
ASSGVASSTQSTP+ FSSSSTSFGL +GNTGL+SG+SL SSAPASNLF+SG TFG
Sbjct: 1032 PASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFASGATFGF 1091
Query: 885 VSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASNNAPM 944
SSSSANNS+SS AGTSSSFFNWQ SS PSFS+GF STPTGGFSFGL SS+AAS++APM
Sbjct: 1092 -GSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPM 1151
Query: 945 LFGSSA-GGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDSMAED 1004
LFGSS+ G ASTTS+FSFTSAATAASSQPAFGNSNH FTFGST P ND +NM DSMAED
Sbjct: 1152 LFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAED 1211
Query: 1005 TVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQNPSPF 1064
TVQTVA T PSFGQQPLTPPPSSGF+FGSTAP PL A+PFQF GSQQNV TPQNP+PF
Sbjct: 1212 TVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPF 1271
Query: 1065 QASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
QASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 QASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of Sgr022612 vs. ExPASy TrEMBL
Match:
A0A6J1JQT4 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)
HSP 1 Score: 1369.0 bits (3542), Expect = 0.0e+00
Identity = 829/1064 (77.91%), Postives = 897/1064 (84.30%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KSS LSLVPRS GN DV EN FVTPRSRGRSALYSMARMPYSRVRATPSIKN+VATTD+Y
Sbjct: 252 KSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSY 311
Query: 105 WATSSSLSQSAWEQGRLLGSTQGALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGLSLP 164
A+ +S SQSAWEQGRLL S QGALKRRSSVLDDE+GSVGPIRRIR KSNL+F KGLSLP
Sbjct: 312 RASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLP 371
Query: 165 ISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDMTPR 224
SSTSI VSGIGSET +HLQSTKVH SS+AGKA Y SETKRNLSKMS END TP
Sbjct: 372 --SSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAESENDRTPS 431
Query: 225 TSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSL 284
+SFP+IPLRSSEMA KILEQLDKLTPPKEKSSELKL SVRNNSPMKLSPSMLHGPALRSL
Sbjct: 432 SSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 491
Query: 285 EDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSVPTK 344
EDVDS+KYLENVEDIRSND +DLTS+KNDK E+SS LK +VP+DKSIS+G G+G SVP+K
Sbjct: 492 EDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGGVGSSVPSK 551
Query: 345 DAVSSSGLPVSSVIPSSQTKWAFQMSAHEDFVDMDEEGYSNGPATNISSERQEKVDGPLV 404
D VSSSGL VS V PSS TK AFQMS EDFVDMD+E YSNGP S ER+EKVD LV
Sbjct: 552 DTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERREKVDDSLV 611
Query: 405 AVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFSFPTASSPS 464
AV KPSD EAI VDKPQASI KPSTVSEM KI DQAKSD+PVTTEKS+IFSFPTAS S
Sbjct: 612 AVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFSFPTASPSS 671
Query: 465 ITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTFAFGNKVTTPT 524
TA I PEST RPEKI SEV KAA AP+FGFG+K PSQK+ + S+PTF FGNKVTT T
Sbjct: 672 TTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTST 731
Query: 525 NEQNAVPVVTSEGNVAPTQQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGL 584
NEQNAVP VTSEGNVAPT QA+ PTTFKFGDKATFP PA+ TENGN A SPFKFAS L
Sbjct: 732 NEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSL 791
Query: 585 VNEKESAKVGSASVFKAESSFSG-----PSFAISEESISDKA-DNKSSSAGHTVGTSENV 644
VNEKE AK GSASVFK+ESS S SF + +E +S+KA D KSSSAG +VGTS N+
Sbjct: 792 VNEKEGAKAGSASVFKSESSSSSFNCSILSFGVPKELMSEKAGDKKSSSAGLSVGTSGNL 851
Query: 645 FLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKP 704
LSS +STP+PS+FSFSSP+TNSNL NGSL STPS F SP+ TF +NITN QNSSIKP
Sbjct: 852 LLSS--VSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITN-QNSSIKP 911
Query: 705 SPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGSSSVPSTSGSPLSALIGVGSVETKT 764
S A TS+SE +TT+SLSTS+PMPSF AAPIFKFGSSSVPST SA G GSVETKT
Sbjct: 912 SLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPST-----SAPNGAGSVETKT 971
Query: 765 KQETT-FGNLSGIPPSETS-AKVSSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFG 824
KQETT FGN+SGI PS+TS AKV STGSSVFQFGAASTTSDSNK E STF P SVP+FG
Sbjct: 972 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1031
Query: 825 APVSAASSGVASSTQSTPIMQFSSSSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGT 884
APV ASSGVASSTQSTP+ FSSSSTSFGL +GNTGL+SG+SL SSAPASNLF+SG
Sbjct: 1032 APVLPASSGVASSTQSTPVSPFSSSSTSFGL--TGNTGLASGNSLVGSSAPASNLFASGA 1091
Query: 885 TFGLVSSSSSANNSISSSAGTSSSFFNWQPSSAPSFSTGFNSTPTGGFSFGLTSSTAASN 944
TFG SSSSANNS+SS AGTSSSFFNWQ SS PSFS+GF STPTGGFSFGL SS+AAS+
Sbjct: 1092 TFGF-GSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASS 1151
Query: 945 NAPMLFGSSA-GGASTTSIFSFTSAATAASSQPAFGNSNHAFTFGSTQPV-NDQSNMVDS 1004
+APMLFGSS+ G ASTTS+FSFTSAATAASSQPAFGNSNH FTFGST P ND +NM DS
Sbjct: 1152 SAPMLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDS 1211
Query: 1005 MAEDTVQTVAPTT--PSFGQQPLTPPPSSGFVFGSTAP-PLAASPFQF-GSQQNVPTPQN 1064
MAEDTVQTVA T PSFGQQPLTPPPSSGF+FGSTAP PL A+PFQF GSQQNV TPQN
Sbjct: 1212 MAEDTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQN 1271
Query: 1065 PSPFQASGSLDFNASAGGSFSLGAGGGDKANRKYVKVKSKPRKK 1095
P+PFQASGSLDFNASAGGSFSLGAGGGDK+NRK+VKVKSK RKK
Sbjct: 1272 PNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of Sgr022612 vs. TAIR 10
Match:
AT3G10650.1 (BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.1); Has 61042 Blast hits to 31782 proteins in 2093 species: Archae - 202; Bacteria - 16480; Metazoa - 16017; Fungi - 12552; Plants - 1653; Viruses - 629; Other Eukaryotes - 13509 (source: NCBI BLink). )
HSP 1 Score: 270.4 bits (690), Expect = 6.3e-72
Identity = 384/1133 (33.89%), Postives = 537/1133 (47.40%), Query Frame = 0
Query: 45 KSSALSLVPRSSGNVDVIENGFVTPRSRGRSALYSMARMPYSRVRATPSIKNTVATTDAY 104
KS +SLV + SG +ENGFVTPRSRGRSA+YSMAR PYSR +++ I
Sbjct: 272 KSPTMSLVTKPSGQ-RPLENGFVTPRSRGRSAVYSMARTPYSRPQSSVKI---------- 331
Query: 105 WATSSSLSQSAWEQGRLLGSTQG---ALKRRSSVLDDEMGSVGPIRRIRQKSNLVFSKGL 164
+ S S WE+ GS QG LKRRSSVLD+++GSVGP+RRIRQKSNL S+ L
Sbjct: 332 -GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLDNDIGSVGPVRRIRQKSNL-SSRSL 391
Query: 165 SLPISGSSTSISVSGIGSETARHLQSTKVHQLSSSAGKALYLSETKRNLSKMSTGFENDM 224
+LP+S S S+ +G G +T H SA +
Sbjct: 392 ALPVSESPLSVRANG-GEKT--------THTSKDSA----------------------ED 451
Query: 225 TPRTSFPRIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPAL 284
P +SF +P +SSEMASKIL+QLD KL+S R SP KLSPSML GPAL
Sbjct: 452 IPGSSFNLVPTKSSEMASKILQQLD------------KLVSTREKSPSKLSPSMLRGPAL 511
Query: 285 RSLEDVDSSKYLENVEDIRSNDAQDLTSQKNDKVEESSSLKFKVPNDKSISSGDGIGFSV 344
+SL++V++ K+L N+ + ++N + D + QK + ES S + ++K+ + DG +
Sbjct: 512 KSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQEISRESVSREVLAQSEKTGDAVDGTSKTG 571
Query: 345 PTKDA-VSSSG--LPV-SSVIPSSQTKWAFQMSAHEDFVDMDEE-GYSNGPATNISSERQ 404
+KD + G +P+ +S+ K +F+MSAHEDF+++D++ G ++ P +E+Q
Sbjct: 572 SSKDQDMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDFLELDDDLGAASTPCE--VAEKQ 631
Query: 405 EKVDGPLVAVSKPSDTEAIAVDKPQASIDVKPSTVSEMNKITDQAKSDVPVTTEKSAIFS 464
+ +S P +KP + PST N Q S+ + TE++ +
Sbjct: 632 NAFEVEKSHISMPIG------EKPLTPSEAMPSTSYISNGDASQGTSNGSLETERNKFVA 691
Query: 465 FP--------TASSPS------ITANAIGPESTLRPEKIVSSEVSK--AATAPVFGFGDK 524
FP AS P+ ++I EK + E K AA P F
Sbjct: 692 FPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPTSEEKRIPLEEPKKPAAVFPNISFS-- 751
Query: 525 LPSQKELI--------------TSAPTFAFGNKVTTPTNEQ----NAVPVVTSEGNVAPT 584
P L+ TS+ F PT + N+ S + APT
Sbjct: 752 -PPATGLLNQNSGASADIKLEKTSSTAFGVSEAWAKPTESKKTFSNSASGAESSTSAAPT 811
Query: 585 QQATVPTTFKFGDKATFPSPANAATENGNKNARSPFKFASGLVNEKESAKVGS-ASVFKA 644
++ F G A P P+N + + SP F + N VG S ++
Sbjct: 812 LNGSI---FSAGANAVTPPPSNGSLTS------SP-SFPPSISNIPSDNSVGDMPSTVQS 871
Query: 645 ESSFSGPSFAISEESISDKADNKSSSAGHTVGTSENVFLSSSVSTSTP----SPSVFSFS 704
++ S + S+ ++++S+SA TS F + S P S S
Sbjct: 872 FAATHNSSSIFGKLPTSNDSNSQSTSASPLSSTSPFKFGQPAAPFSAPAVSESSGQISKE 931
Query: 705 SPSTNSNLNNGSLVSTPSIFSSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLST 764
+ N+ N S + S+ +T + +++ K P V SS + S+L+
Sbjct: 932 TEVKNATFGNTSTFKFGGMASADQST--GIVFGAKSAENKSRPGFVFGSSSVVGGSTLNP 991
Query: 765 SAPMPSFPAAP---IFKFGSSSVPSTSGSPLSALIGVGSVETKTKQETTFGNLSGIPPSE 824
S S P + IF SSS P T S +SA S T T + FG S S
Sbjct: 992 STAAASAPESSGSLIFGVTSSSTPGTETSKISA----SSAATNT-GNSVFGTSSFAFTSS 1051
Query: 825 TSAKV----SSTGSSVFQFGAASTTSDSNKRSENSTFVPGSVPAFGAPVSAASSGVASST 884
S+ V +STGSSVF F A S+ S ++ +S+ S A A SG +ST
Sbjct: 1052 GSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNL----FGAGNAQTGNTGSGTTTST 1111
Query: 885 QSTPIMQFSS-SSTSFGLAGSGNTGLSSGSSLFSSSAPASNLFSSGTTFGLVSSSSSANN 944
QS P SS S+ SFGL SGN+ L+S SS F S +F+S +T L S++SSA++
Sbjct: 1112 QSIPFQFGSSPSAPSFGL--SGNSSLASNSSPFGFSKSEPAVFTSVSTPQLSSTNSSASS 1171
Query: 945 SISSSA---GTSSSFFNWQPSSAPSFSTGF--NSTPTGGFSFGLTSSTAASNNAPMLFGS 1004
S + S+ GTS N P+S P FS+ F +STPT FSFG +S+ S+ +FG+
Sbjct: 1172 SSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-TFSFGGSSAATVSSTTTPIFGA 1231
Query: 1005 SAGGA-STTSIFSFTSAATAASSQPAFGNSN--HAFTFGSTQP--------------VND 1064
S S + IF F S QP FGNS FG++ P N
Sbjct: 1232 STNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFGNSTPGFAFGAPNNGNGINNNQ 1291
Query: 1065 QSNMVDSMAEDTVQT--VAPTTPSFGQQPLTPPPSSGFVFG---STAPPLAASPFQFGSQ 1095
Q +M DSMAEDT Q + P FGQ ++ P F FG +T PP A+PFQFG Q
Sbjct: 1292 QVSMEDSMAEDTDQANRASMVAPMFGQAAVS-MPQPNFAFGGGAATQPPSMANPFQFGGQ 1309
BLAST of Sgr022612 vs. TAIR 10
Match:
AT2G45000.1 (structural constituent of nuclear pore )
HSP 1 Score: 45.1 bits (105), Expect = 4.3e-04
Identity = 147/480 (30.63%), Postives = 217/480 (45.21%), Query Frame = 0
Query: 455 FSFPTASSPSITANAIGPESTLRPEKIVSSEVSKAATAPVFGFGDKLPSQKELITSAPTF 514
F F +S+PS + ST S+ V+ A+T P FGFG S AP+
Sbjct: 68 FGFGASSTPSFGFGSSASSSTPSFGFGSSASVTPASTTPSFGFGTAASSS----APAPSL 127
Query: 515 AFGNKVTTPTNEQNAVPVVTSEGNVAPTQQAT-VPTTFKFGDKAT-----FPSPANAATE 574
FG ++ TN +A P + G V + +T P++ FG A+ SP AA
Sbjct: 128 -FG---SSTTNASSAAPGSSPFGFVTSSASSTATPSSSLFGAPASSAATPSSSPFGAAPA 187
Query: 575 NGNKNARSPFKFASGLVNEKESAKVGSASVFKAESS--------FSGPSFAISEE---SI 634
+G+ F + L + SA ++S+F A SS F PS A S+
Sbjct: 188 SGSTPL---FGSSPSLFSAPSSASASNSSLFGASSSAATSTSPLFGAPSSATGATPSFSV 247
Query: 635 SDKADNKSSSAGHTVGTSENVFLSSSVSTSTPSPSVFSFSSPSTNSNLNNGSLVSTPSIF 694
+ A SSS G+S + ++SS S S+PS + SSP S+ + G STPS+F
Sbjct: 248 ASSAPGSSSSIFGATGSSPSFSVASSASGSSPSIFGATGSSPFFGSSSSAG---STPSLF 307
Query: 695 ---SSPATTFSNNITNHQNSSIKPSPTAVTSSSESITTSSLSTSAPMPSFPAAPIFKFGS 754
SS ATT S PSP V++ + S T+++ + SA F A+ F F
Sbjct: 308 ASSSSGATTSS------------PSPFGVSTFNSSSTSNTSNASA--SPFSASTGFSFLK 367
Query: 755 SSVPSTSGSPL-SALIGVGSVETKTKQETTFGNLSGIPPSETSAKVSSTGSSVFQFGAAS 814
S+ ST+ S SA S + T+ + + ++A SST +VF +
Sbjct: 368 STASSTTSSTTPSAPPQTASSSSSFSFGTSANSGFNLSTGSSAAPASSTSGAVFSIATTT 427
Query: 815 TTSDSNKRSENSTFVPGSVPAFGAPVSA---ASSGVASS-TQSTPIMQFSS-SSTSFGLA 874
TTS +ST S PA AP S S GV SS T +TP ++ S+T FGLA
Sbjct: 428 TTS-------SSTPAATSAPASSAPASTMAFPSFGVTSSATNTTPASSAATFSTTGFGLA 487
Query: 875 GS----GNTGLSSGSSLFSSSAPASN----LFSSGTTFGLVSSSSSANNSISSSAGTSSS 901
S G+T +G ++ +S PAS+ S +F L SS+S+ + SS+ T ++
Sbjct: 488 SSTPATGSTNSFTGFAVPKTSTPASSSQPQTTSPAFSFSLPSSTSTTAPATSSATTTQTT 512
The following BLAST results are available for this feature:
Match Name | E-value | Identity | Description | |
XP_022133602.1 | 0.0e+00 | 82.97 | nuclear pore complex protein NUP1 [Momordica charantia] | [more] |
XP_038884354.1 | 0.0e+00 | 78.31 | nuclear pore complex protein NUP1-like isoform X2 [Benincasa hispida] | [more] |
XP_038884353.1 | 0.0e+00 | 78.02 | nuclear pore complex protein NUP1-like isoform X1 [Benincasa hispida] | [more] |
XP_038884355.1 | 0.0e+00 | 78.02 | nuclear pore complex protein NUP1-like isoform X3 [Benincasa hispida] | [more] |
XP_022938795.1 | 0.0e+00 | 78.87 | nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata] | [more] |
Match Name | E-value | Identity | Description | |
Q9CAF4 | 8.9e-71 | 33.89 | Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 S... | [more] |
Match Name | E-value | Identity | Description | |
A0A6J1BX57 | 0.0e+00 | 82.97 | nuclear pore complex protein NUP1 OS=Momordica charantia OX=3673 GN=LOC111006142... | [more] |
A0A6J1FKS9 | 0.0e+00 | 78.87 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A6J1FF52 | 0.0e+00 | 78.57 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A6J1K059 | 0.0e+00 | 78.21 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN... | [more] |
A0A6J1JQT4 | 0.0e+00 | 77.91 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN... | [more] |
Match Name | E-value | Identity | Description | |
AT3G10650.1 | 6.3e-72 | 33.89 | BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.... | [more] |
AT2G45000.1 | 4.3e-04 | 30.63 | structural constituent of nuclear pore | [more] |