Sequences
The following sequences are available for this feature:
Gene sequence (with intron)
Legend: polypeptideCDSinitialstart_codonintroninternalterminalstop_codon
Hold the cursor over a type above to highlight its positions in the sequence below.
ATGGCGACAGAGCGTGAGGAGGTTCGTTATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTCTCAGAAGGTCGCATACGACGCCGTATGATCGGCCGCCGACTGCTCTGAGAAACTCTGCTGGAAAAGGATGGCTCTCTAAGCTTGTCGATCCGGCGCAGAAGCTCATCACCTCCAGTGCGCATAGGCTGTTTTCTAGCGTGTTTCGTAAACGCCTTCCCCCTCCGCCGCCGTCATTGCCAATTTCTCGAGGTTTTTCTTTTTGTTGTTTTTTATTTGCTTCTTAATTGCAAGGCTTTCTTACCGGTTGTTAGAATTGTTTTTGAGGTTTTCATACCGCATTCTTTCTGCTCATACGTTTGATTTTGGAGGCGTTGGCTGAAGATGCCATTTTTAAAAATAATTTTATTATTATTTTGATTTTTTCCGGCGGGAGTTCTTATAGTCTTGGGGTTTTTATTCTCTTTTCCTGGTGGAACCTGGATTTAATATTTTGTATGGTTTTAGGCGCGTTGAACTATTCTATCTCATTTAGAACTTCAATTATTTAAATGTCATTACTTTACGTGATTCCATGCTTATGAACTTGAAGTATGTCAAAGTGCAGGTTTCAACGCTTACTAGTTGAATTATATCGAGTCTGCTTGTAATGTTGTTTTGTTTTCGTTGCTTGGATGTCATCTATGTTAAAAACATCAGGAATAGTCCGAGTGTGATTCTTCCATAACATTTCTAAAATGATCCCCCATATAAAATTTAAGAGTTGGTTTCAAAAACTTCGTGAAAATTAATACTTTGTCCTTGTTTCATGTATTTAAGCTCAAAGGCAAGGTCAATGGCGTTATGTATGTATGTATTTACAGTTTTTCTCAACTATAGCCAATTAGAAGTCCATTTACCCTTTGGCTCCTTTTGTATTTTAACCAATGAATGAGATATTTTTGTTTCCCATAATAATGTTAATCTAACAACAACAATATCTTTAAAGTATGTTATACGAGGTAATAACCAATAATAATTGATCGCTGGTTGTTTAGAAGACAGCTTACAGATACACACGTAAACAGCAAAATTCTTTTTCTTTTCAGGTTGGTTGTTCTGTTTATTGTCATTCAAAATTATTTCGCTGAACAAAGATTCTGTACAAACACTTTTACTATTTTAAACTAAAAATTGTTTCTAGAAATTGCTCTTGCTCTTTAACATTTTAATCTCTCATATAATTTTTTTTTTCCACGGAAGTAACTTGCAAGATTTTGAATTATATCAATGTTGATAGCCATTTAGGAAGCATGATGCCATTATTTTATTATGCATTTTGGAGTTGATACCTTTGTGCGTGCATTGACTTTTGACTTGGGGTTGGTTGCTATAATGTGTTGATAAATAATTGATACTCGGATGGGACTGTGGCAGAAGTTTTTCATTTGATATTTAGATTTCTGCTTCAATCTTTGACTGTCCTGCCCTTGCATTTTATATTTCCAGAGGCTAATGATGAGACGGAAATTAAGAACCTGGAAGAAGTTGCAGCTGTAAGTTTTATCTGTTATGTGTTTTGCTTATCACCAACCTTTGCATCTGTATCTTGTATTCTTTTTTATCCAATTCTGCTTTTGATCTAAAGCACGATACGTCATCACTGTGTTTTCCCCCTTCTATGTACATACTTGTTTGGCTTCAACATTTTCCTATTGCAGATATTGCAAGATTTTTTTTGTTATTTTTTCCTCTTTCTTTTGACCAATCTGGATTTCTTCTTTGTTTATTTCAGATTTACAATAAAAGAGTCATTTTAAACTGTTCGTTTGAGAAAAAAATAAAAGACGTGATGACCTATGTTATTTTCATGAATGCATTAGTATCCTTATCAGTGAAGTGAAACTTCTTGCAAAAATCTGAGAAATTTGTGTTGCCGTAGTCTTAACTTCTTTGTCAACATTTTCTGAATTTTTAATTGTTCTTTAGGATCCTCCTGGAACTCAAGAAGGGACTAATAATGATTTTGTTCCAAGCATCAATTCTAATAACATACATGGGGTGAGTGACCTCGAGAAAATTTTGAAGGAGAAGACCTTTACAAGGTAAATATTTGAGTGCTTGGTGGTGAAATTATTTTTAGTTGCATTCCTCAGTTCTGTTAGAAGATTTGCCTGGTTTTTGTTGCTTTTCTTTTTCTTGTTAATATTTCATTGAGGGTCCTGTATGAAAATTTGAGTTTGCATAAATTGCGATTAGTTACATGGTAAGAAATCATGAAGCAGCTTGAAATGTATAAACCGCAATGTTGCTATAAAATACAATTTCATTTTTCTCCTTTGGGATAGAAGTCCGGTTTCATTTTCTATGTATTGATTTTAGCAAGATATGGTTTTGATGTTTAATATGTTACATGCTGACCATTTTACAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGATGTTCCAAGTGGGGTTGAATCGAGGAAATTTGAAATGGTTTCTTCAACACCTGTTATCAGTTATGACATACAGGAAGGGTCTCCAAAATTTCCAGCTCAAGAGGGAGTTAGGCCTCATATGGTTCCAACTCATGTCGTGAATGCAAATGTAGGAATCTTTGTATATATTGTCTGTGTGTTAGGTTTTTTCAGCGGTTAATGTTTAGTGCTTGTTTACCATTTGATTCTCACACTGATAACTGTACGAACTTTTGACCTTATTGTCACTTGTTTAATCATTTCAGGTCCCTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAGGCGTTCATGGGTAGCAGGCCTCCAAAAGCAACTCCGTTGAGTATGGTGGCCCATAGTCAAAAGTTTGGGGATACTTTTGCTTTAGGCAATCCCACAACGTCCTCTACTTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGAAAATGATTTTGTCACCCCAAGATCTCGTGGCAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCAAGAGTTCGTGCAACCCCCAGCATAAAGGTTTGTCCTCTAATTACGACATCTGCTTTATTGTATGCTTGCTTGGTAGCTTATGTATTTATTAGCCTTTGTTTTTTTCCTGTGGTTCATTCTTCAGAATAGTGTAGCAACAACAGATTCTTACAGGGCCACTGTGACCTCATCATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGAGTCTAATCAAGGGGTATGATTTGTGAAAATGTTCTTTTACAACATATTGTGTTATCGAGTAAACCTCTCATATTATTTTATTTGATTATTGTTTCTGTAGGCTTTGAAACGCCGAAGCTCAGTTTTAGATGATGAAATAGGATCTGTTGGTCCTATTCGAAGAATTCGCCATAAATCCAATCTCCTTTTCCCAAAAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGTTAGTGGAATTGGTTCCGAGACTTCTCAGCATTTGCAGTCCACAAAAGTTTATCCATTTTCGTCTACTGCTGGGAAGGCACCTTATTCAAGTGAGACCAAGCGTAATTTGTCCAAAATGTCTGCAGTGTCTGAAAATGATAGGACACCTAGTTCAAGTTTCCCTCAAATTCCCCTCAGGTCTAGTGAGATGGCCTTAAAAATATTAGAGCAGCTTGATAAATTGACCCCTCCAAAAGAAAAATCTTCGGAACTAAAGTTGCATAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGAAGTCTGGAAGATGTGGATTCGGCTAAGTATTTGGAAAATGTTGAAGACATTTGGTCTAATGATGGCCGTGATCTTACTTCGAAAAAGAACGATAAGTTTGAGGATAGTAGTTTGTTAAAATCTAAAGTACCCAGTGATAAATCTATTTCTACAGGTGGTGGTGTAGGTTCTTCAGTGCCTTCAAAGGATACTGTATCTAGTTCTGGTCTGCAGGTTTCATTTGTTGGCCCGTCGTCACTAACAAAATGTGCGTTCCAGATGAGTGTACAAGAGGTGTGTAGTTTCCTGCCTTCAAGTTTATAGAATAGGTCAATCCTATCTTTTAATTTATCCTCGTTCCTGCATTTTCAATTAAATAAATGAAGAGATTACTAATGGGGTTGGGGTTTCTTAGTTTCAGCATCTTGCATTTCCATTTCGAAATGAGTGTAATTACTATTCTTTCAATTTCTGTTGAAGTTTTTCATTTTTTTCATTGTTCACGCACACCCAAACCTGAAAAAAGAAGGTTGCGAAGTATAATATTATGTCTGTGTCCATTATAAAACCTCTATGGCTTAATCTTCGATTATCTATTATTTTGCTAGGATTTTGTGGATCTTGATGTCCTCTATGTTTATGCCCCTTATAGACCCCCCAAGTTGTAATATTTATGGGCCGTCTGTGTCTCTTTTTGTTAGGATTTTGTCGATATGGATGACGAAGAATATTCTAATGGGCCAGTAGCTGCTAAATCATTTGAGAGGCGAGAAAAAGTTGACGACTCATTAGTGGCAGTGGGTAAGCCGAGTGATACTGAAGCCATCACAGTAGATAAACCTCAGGCTTCAATTCAGGCTAAACCATCCCCTGTCTCTGAAATGAAGAAAATAAATGACCAAGCAAAATCTGATGTTCCTGTGACTACTGAAAAGAGTTCCATTTTTTCCTTTCCAACAGCCTCTCCATCTAGCACTACAGCCAATATGATAGAACCGGAATCAACCACGAAACCTGAAAAAATTGCTTCGTCTGAGGTACCAAAAGCAGCTGCTGCCCCTATATTTGGCTTTGGAGAAAAGTTGCCATCACAGAAGGATCCGGTATTTTCTTCTCCCACCTTTACGTTTGGAAACAAGGTTACCACCTCAACAAATGAACAAAATGCTGTTCCTGCTGTAACTTCTGAAGGCAATGTTGCACCTACTCTACAAGCTTCTGCTCCTACCACATTTAAATTTGGAGATAAAGCTACATTTCCTATTCCAGCAAGTACCGCCACCGAAAATGGAAATAGTGAGGCCGGATCTCCGTTTAAGTTTGCATCTTCTTTAGTTAACGAAAAAGAAGGTGCTAAAGCAGGCAGTGCTTCAGTTTTTAAATCAGAGAGTTCTAGCAGCAGGTTAGTTTGCTTGTTACTGTTGTCACCTTCAACTTGGATAATATTTATTTCTTTTTACTTGTATGTGTGTAGGTTTATATCTCTCTTATTAGCATATGTGAAATGCATGATAAATTGGATTTTAAATGTTCAGCATTCCAATTTCCAATTCGGTTCTGAAGATGCACCATTGGTTTTTAATTATTTTGAGAAAATTTGGATCCGTTTTCTTTAGCCTATATATTTTTGATAGCTCCCACTTTTCATCTTAAATTTTTGGTTTGGAAGTACTTTCCTCAATCTAATAAAGTACTTATGAATGATGCTAAAAATTCTCTTATTTGGTTTAATGTGGTTTATCCCAGGGGTTTCGTAATTTCGATTAGTCCTTTACTTTTACCAATTGAGGCACTTTTCTTTGAACTTTTTTTGACTCTTCATTGATTGCTGTTCTCCTTTTTTTGTGTTTGAGCTTTTTTGAGGATAGTATAGTTAGTCGAAACACAGGCGTACGTAAATTTATATGAAGTAATTGATTTATGACATTGTTGATAGATGGATCAGTTATTCTTGCTATCCTTTTTTCAAGCTTTAGTATTTCTTGTAGATTATTTGTTGGAAATTGAAATACTAGAGCATACATTTCTGCACATTTTCATCTTTCTCCTTATCTGATTCAAGAAACTTCTTTCGGTTTATCATGTTAGATTATGTCAACATTATCTCAGGGCTATATACATATATATTAAAACAGATTATTGTGCATCAACTTAGATATGTTTGTACTCTGCTTGGGCTTTAGGACATGAAATATTGGCATACCCTTTTGATTGAAATTTTCTCATTCACCTTCTAATGATAAATGGGCTGTCTGTTTCTAGGTGATATATGTTGTGCGTTACCAATTTTTCTAGTAAAACTGATGTTTTGGACGGTTTTAATTGCAGCACCCTGTCATTTGGAGTTCCGAAAGAGTCGATTTCGGAGAAAGCTGGCGATAAGAAGAGTTCAAGTGCCGGACTCTCTGTTGGCACATCTGGGAATTTGCTTTTGTCATCTGTCTCATCAACACCAACTCCCAGTTTGTTTTCTTTTAGCTCCCCTACCACTAATTCAAATCTTATTAACGGATCTCTTGGTTCCACCCCATCTACTTTTCCCTCCCCATCCAACACCTTTCCTAGTAATATAACAAATCAAAATTCATCCATCAAACCATCTCTCAATGCTGCCACTAGCAATAGCGAACCCGTCACCACTACTAGTCTTTCTACATCTTCTCCTATGCCATCTTTTTCAGCTGCACCAATTTTCAAGTTTGGGAGCTCCAGTGTTCCTTCGAGTTCAGCACCGAGCGGAGTTGGATCTGTAGAAACCAAGACCAAGCAAGAGACAACACCCTTTGGCAATGTAAGTGGCATTTCTCCGAGCGACACATCTGCTGCTAAAGTATTTAGTACTGGAAGCAGTGTTTTTCAGTTTGGAGCTGCGTCTACTACTTCAGATTCTAATAAACAACCCGAAAAGTCAACCTTCGCTCCGGTCAGTGTACCTTCATTTGGTGCTCCAGTTTTGCCTGCAAGTAGTGGGGTTGCTTCTTCTACTCAGAGTACACCTGTTTCGCCATTCAGTTCATCATCTACATCATTTGGTTTGACAGGGAATACGGGTTTGGCCTCCGGTAACACTTTGGTTGGTTCTTCAGCTCCCGCGTCTAATTTGTTCACTTCAGGTGCCACTTTTGGGTTTGGTTCCTCCAGTTCTGCTAATAATTCAGTCAGCTCCGGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGGCATCCTCCGCGCCATCATTTTCTTCTGGATTCGGCTCAACTCCAACGGGAGGATTTTCCTTTGGCCTTGCATCTTCTTCCGCTGCTTCTAGTTCCCCTATGCTCTTTGGATCATCGACAACCGGTGCAGCATCAACAACCTCGATGTTCTCATTTACTTCAGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTTGGTAATTCTAATCATGGCTTCACCTTTGGTTCAACACCTCCTGCAAATAATGATCATGCAAATATGGAGGATAGCATGGCTGAGGATACCGTCCAGACAGTCGCATCGCCAACGCCTATGCCAAGTTTCGGGCAACAACCCCTTACGCCACCTCCATCATCAGGGTTCGTGTTTGGTTCAACTGCTCCTTCTCCGCTAGGAGCAAATCCTTTCCAGTTTGGTGGTAGCCAACAAAATGTACCTACCCCACAAAATCCCAATCCATTTCAGGCTTCGGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGAAGCTTCTCACTAGGCGCTGGTGGCGGCGACAAATCGAACCGAAAATTCGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
mRNA sequence
ATGGCGACAGAGCGTGAGGAGGTTCGTTATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTCTCAGAAGGTCGCATACGACGCCGTATGATCGGCCGCCGACTGCTCTGAGAAACTCTGCTGGAAAAGGATGGCTCTCTAAGCTTGTCGATCCGGCGCAGAAGCTCATCACCTCCAGTGCGCATAGGCTGTTTTCTAGCGTGTTTCGTAAACGCCTTCCCCCTCCGCCGCCGTCATTGCCAATTTCTCGAGAGGCTAATGATGAGACGGAAATTAAGAACCTGGAAGAAGTTGCAGCTGATCCTCCTGGAACTCAAGAAGGGACTAATAATGATTTTGTTCCAAGCATCAATTCTAATAACATACATGGGGTGAGTGACCTCGAGAAAATTTTGAAGGAGAAGACCTTTACAAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGATGTTCCAAGTGGGGTTGAATCGAGGAAATTTGAAATGGTTTCTTCAACACCTGTTATCAGTTATGACATACAGGAAGGGTCTCCAAAATTTCCAGCTCAAGAGGGAGTTAGGCCTCATATGGTTCCAACTCATGTCGTGAATGCAAATGTCCCTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAGGCGTTCATGGGTAGCAGGCCTCCAAAAGCAACTCCGTTGAGTATGGTGGCCCATAGTCAAAAGTTTGGGGATACTTTTGCTTTAGGCAATCCCACAACGTCCTCTACTTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGAAAATGATTTTGTCACCCCAAGATCTCGTGGCAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCAAGAGTTCGTGCAACCCCCAGCATAAAGAATAGTGTAGCAACAACAGATTCTTACAGGGCCACTGTGACCTCATCATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGAGTCTAATCAAGGGGCTTTGAAACGCCGAAGCTCAGTTTTAGATGATGAAATAGGATCTGTTGGTCCTATTCGAAGAATTCGCCATAAATCCAATCTCCTTTTCCCAAAAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGTTAGTGGAATTGGTTCCGAGACTTCTCAGCATTTGCAGTCCACAAAAGTTTATCCATTTTCGTCTACTGCTGGGAAGGCACCTTATTCAAGTGAGACCAAGCGTAATTTGTCCAAAATGTCTGCAGTGTCTGAAAATGATAGGACACCTAGTTCAAGTTTCCCTCAAATTCCCCTCAGGTCTAGTGAGATGGCCTTAAAAATATTAGAGCAGCTTGATAAATTGACCCCTCCAAAAGAAAAATCTTCGGAACTAAAGTTGCATAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGAAGTCTGGAAGATGTGGATTCGGCTAAGTATTTGGAAAATGTTGAAGACATTTGGTCTAATGATGGCCGTGATCTTACTTCGAAAAAGAACGATAAGTTTGAGGATAGTAGTTTGTTAAAATCTAAAGTACCCAGTGATAAATCTATTTCTACAGGTGGTGGTGTAGGTTCTTCAGTGCCTTCAAAGGATACTGTATCTAGTTCTGGTCTGCAGGTTTCATTTGTTGGCCCGTCGTCACTAACAAAATGTGCGTTCCAGATGAGTGTACAAGAGGATTTTGTCGATATGGATGACGAAGAATATTCTAATGGGCCAGTAGCTGCTAAATCATTTGAGAGGCGAGAAAAAGTTGACGACTCATTAGTGGCAGTGGGTAAGCCGAGTGATACTGAAGCCATCACAGTAGATAAACCTCAGGCTTCAATTCAGGCTAAACCATCCCCTGTCTCTGAAATGAAGAAAATAAATGACCAAGCAAAATCTGATGTTCCTGTGACTACTGAAAAGAGTTCCATTTTTTCCTTTCCAACAGCCTCTCCATCTAGCACTACAGCCAATATGATAGAACCGGAATCAACCACGAAACCTGAAAAAATTGCTTCGTCTGAGGTACCAAAAGCAGCTGCTGCCCCTATATTTGGCTTTGGAGAAAAGTTGCCATCACAGAAGGATCCGGTATTTTCTTCTCCCACCTTTACGTTTGGAAACAAGGTTACCACCTCAACAAATGAACAAAATGCTGTTCCTGCTGTAACTTCTGAAGGCAATGTTGCACCTACTCTACAAGCTTCTGCTCCTACCACATTTAAATTTGGAGATAAAGCTACATTTCCTATTCCAGCAAGTACCGCCACCGAAAATGGAAATAGTGAGGCCGGATCTCCGTTTAAGTTTGCATCTTCTTTAGTTAACGAAAAAGAAGGTGCTAAAGCAGGCAGTGCTTCAGTTTTTAAATCAGAGAGTTCTAGCAGCAGCACCCTGTCATTTGGAGTTCCGAAAGAGTCGATTTCGGAGAAAGCTGGCGATAAGAAGAGTTCAAGTGCCGGACTCTCTGTTGGCACATCTGGGAATTTGCTTTTGTCATCTGTCTCATCAACACCAACTCCCACTGCACCAATTTTCAAGTTTGGGAGCTCCAGTGTTCCTTCGAGTTCAGCACCGAGCGGAGTTGGATCTGTAGAAACCAAGACCAAGCAAGAGACAACACCCTTTGGCAATGTAAGTGGCATTTCTCCGAGCGACACATCTGCTGCTAAAGTATTTAGTACTGGAAGCAGTGTTTTTCAGTTTGGAGCTGCGTCTACTACTTCAGATTCTAATAAACAACCCGAAAAGTCAACCTTCGCTCCGGTCAGTGTACCTTCATTTGGTGCTCCAGTTTTGCCTGCAAGTAGTGGGGTTGCTTCTTCTACTCAGAGTACACCTGTTTCGCCATTCAGTTCATCATCTACATCATTTGGTTTGACAGGGAATACGGGTTTGGCCTCCGGTAACACTTTGGTTGGTTCTTCAGCTCCCGCGTCTAATTTGTTCACTTCAGGTGCCACTTTTGGGTTTGGTTCCTCCAGTTCTGCTAATAATTCAGTCAGCTCCGGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGGCATCCTCCGCGCCATCATTTTCTTCTGGATTCGGCTCAACTCCAACGGGAGGATTTTCCTTTGGCCTTGCATCTTCTTCCGCTGCTTCTAGTTCCCCTATGCTCTTTGGATCATCGACAACCGGTGCAGCATCAACAACCTCGATGTTCTCATTTACTTCAGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTTGGTAATTCTAATCATGGCTTCACCTTTGGTTCAACACCTCCTGCAAATAATGATCATGCAAATATGGAGGATAGCATGGCTGAGGATACCGTCCAGACAGTCGCATCGCCAACGCCTATGCCAAGTTTCGGGCAACAACCCCTTACGCCACCTCCATCATCAGGGTTCGTGTTTGGTTCAACTGCTCCTTCTCCGCTAGGAGCAAATCCTTTCCAGTTTGGTGGTAGCCAACAAAATGTACCTACCCCACAAAATCCCAATCCATTTCAGGCTTCGGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGAAGCTTCTCACTAGGCGCTGGTGGCGGCGACAAATCGAACCGAAAATTCGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
Coding sequence (CDS)
ATGGCGACAGAGCGTGAGGAGGTTCGTTATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTCTCAGAAGGTCGCATACGACGCCGTATGATCGGCCGCCGACTGCTCTGAGAAACTCTGCTGGAAAAGGATGGCTCTCTAAGCTTGTCGATCCGGCGCAGAAGCTCATCACCTCCAGTGCGCATAGGCTGTTTTCTAGCGTGTTTCGTAAACGCCTTCCCCCTCCGCCGCCGTCATTGCCAATTTCTCGAGAGGCTAATGATGAGACGGAAATTAAGAACCTGGAAGAAGTTGCAGCTGATCCTCCTGGAACTCAAGAAGGGACTAATAATGATTTTGTTCCAAGCATCAATTCTAATAACATACATGGGGTGAGTGACCTCGAGAAAATTTTGAAGGAGAAGACCTTTACAAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGATGTTCCAAGTGGGGTTGAATCGAGGAAATTTGAAATGGTTTCTTCAACACCTGTTATCAGTTATGACATACAGGAAGGGTCTCCAAAATTTCCAGCTCAAGAGGGAGTTAGGCCTCATATGGTTCCAACTCATGTCGTGAATGCAAATGTCCCTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAGGCGTTCATGGGTAGCAGGCCTCCAAAAGCAACTCCGTTGAGTATGGTGGCCCATAGTCAAAAGTTTGGGGATACTTTTGCTTTAGGCAATCCCACAACGTCCTCTACTTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGAAAATGATTTTGTCACCCCAAGATCTCGTGGCAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCAAGAGTTCGTGCAACCCCCAGCATAAAGAATAGTGTAGCAACAACAGATTCTTACAGGGCCACTGTGACCTCATCATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGAGTCTAATCAAGGGGCTTTGAAACGCCGAAGCTCAGTTTTAGATGATGAAATAGGATCTGTTGGTCCTATTCGAAGAATTCGCCATAAATCCAATCTCCTTTTCCCAAAAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGTTAGTGGAATTGGTTCCGAGACTTCTCAGCATTTGCAGTCCACAAAAGTTTATCCATTTTCGTCTACTGCTGGGAAGGCACCTTATTCAAGTGAGACCAAGCGTAATTTGTCCAAAATGTCTGCAGTGTCTGAAAATGATAGGACACCTAGTTCAAGTTTCCCTCAAATTCCCCTCAGGTCTAGTGAGATGGCCTTAAAAATATTAGAGCAGCTTGATAAATTGACCCCTCCAAAAGAAAAATCTTCGGAACTAAAGTTGCATAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGAAGTCTGGAAGATGTGGATTCGGCTAAGTATTTGGAAAATGTTGAAGACATTTGGTCTAATGATGGCCGTGATCTTACTTCGAAAAAGAACGATAAGTTTGAGGATAGTAGTTTGTTAAAATCTAAAGTACCCAGTGATAAATCTATTTCTACAGGTGGTGGTGTAGGTTCTTCAGTGCCTTCAAAGGATACTGTATCTAGTTCTGGTCTGCAGGTTTCATTTGTTGGCCCGTCGTCACTAACAAAATGTGCGTTCCAGATGAGTGTACAAGAGGATTTTGTCGATATGGATGACGAAGAATATTCTAATGGGCCAGTAGCTGCTAAATCATTTGAGAGGCGAGAAAAAGTTGACGACTCATTAGTGGCAGTGGGTAAGCCGAGTGATACTGAAGCCATCACAGTAGATAAACCTCAGGCTTCAATTCAGGCTAAACCATCCCCTGTCTCTGAAATGAAGAAAATAAATGACCAAGCAAAATCTGATGTTCCTGTGACTACTGAAAAGAGTTCCATTTTTTCCTTTCCAACAGCCTCTCCATCTAGCACTACAGCCAATATGATAGAACCGGAATCAACCACGAAACCTGAAAAAATTGCTTCGTCTGAGGTACCAAAAGCAGCTGCTGCCCCTATATTTGGCTTTGGAGAAAAGTTGCCATCACAGAAGGATCCGGTATTTTCTTCTCCCACCTTTACGTTTGGAAACAAGGTTACCACCTCAACAAATGAACAAAATGCTGTTCCTGCTGTAACTTCTGAAGGCAATGTTGCACCTACTCTACAAGCTTCTGCTCCTACCACATTTAAATTTGGAGATAAAGCTACATTTCCTATTCCAGCAAGTACCGCCACCGAAAATGGAAATAGTGAGGCCGGATCTCCGTTTAAGTTTGCATCTTCTTTAGTTAACGAAAAAGAAGGTGCTAAAGCAGGCAGTGCTTCAGTTTTTAAATCAGAGAGTTCTAGCAGCAGCACCCTGTCATTTGGAGTTCCGAAAGAGTCGATTTCGGAGAAAGCTGGCGATAAGAAGAGTTCAAGTGCCGGACTCTCTGTTGGCACATCTGGGAATTTGCTTTTGTCATCTGTCTCATCAACACCAACTCCCACTGCACCAATTTTCAAGTTTGGGAGCTCCAGTGTTCCTTCGAGTTCAGCACCGAGCGGAGTTGGATCTGTAGAAACCAAGACCAAGCAAGAGACAACACCCTTTGGCAATGTAAGTGGCATTTCTCCGAGCGACACATCTGCTGCTAAAGTATTTAGTACTGGAAGCAGTGTTTTTCAGTTTGGAGCTGCGTCTACTACTTCAGATTCTAATAAACAACCCGAAAAGTCAACCTTCGCTCCGGTCAGTGTACCTTCATTTGGTGCTCCAGTTTTGCCTGCAAGTAGTGGGGTTGCTTCTTCTACTCAGAGTACACCTGTTTCGCCATTCAGTTCATCATCTACATCATTTGGTTTGACAGGGAATACGGGTTTGGCCTCCGGTAACACTTTGGTTGGTTCTTCAGCTCCCGCGTCTAATTTGTTCACTTCAGGTGCCACTTTTGGGTTTGGTTCCTCCAGTTCTGCTAATAATTCAGTCAGCTCCGGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGGCATCCTCCGCGCCATCATTTTCTTCTGGATTCGGCTCAACTCCAACGGGAGGATTTTCCTTTGGCCTTGCATCTTCTTCCGCTGCTTCTAGTTCCCCTATGCTCTTTGGATCATCGACAACCGGTGCAGCATCAACAACCTCGATGTTCTCATTTACTTCAGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTTGGTAATTCTAATCATGGCTTCACCTTTGGTTCAACACCTCCTGCAAATAATGATCATGCAAATATGGAGGATAGCATGGCTGAGGATACCGTCCAGACAGTCGCATCGCCAACGCCTATGCCAAGTTTCGGGCAACAACCCCTTACGCCACCTCCATCATCAGGGTTCGTGTTTGGTTCAACTGCTCCTTCTCCGCTAGGAGCAAATCCTTTCCAGTTTGGTGGTAGCCAACAAAATGTACCTACCCCACAAAATCCCAATCCATTTCAGGCTTCGGGTAGCTTAGACTTCAATGCCAGTGCTGGAGGAAGCTTCTCACTAGGCGCTGGTGGCGGCGACAAATCGAACCGAAAATTCGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
Protein sequence
MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITSSAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINSNNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQEGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQKFGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAVSENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGGVGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERREKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFSFPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGSPFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGTSGNLLLSSVSSTPTPTAPIFKFGSSSVPSSSAPSGVGSVETKTKQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGSSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Homology
BLAST of Csor.00g124720 vs. ExPASy Swiss-Prot
Match:
Q9CAF4 (Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 SV=1)
HSP 1 Score: 382.5 bits (981), Expect = 1.8e-104
Identity = 467/1376 (33.94%), Postives = 628/1376 (45.64%), Query Frame = 0
Query: 13 GRGGKFQKRPLRRSHTTPYDRPPTALRNSA-------GKGWLSKLVDPAQKLITSSAHRL 72
G GGKF+K RRS TPYDRP T++RN+ G GWLSKLVDPAQ+LIT SA RL
Sbjct: 18 GTGGKFRKPTARRSQKTPYDRPTTSVRNAGLGGGDVRGGGWLSKLVDPAQRLITYSAQRL 77
Query: 73 FSSVFRKRL---------PPPPPSLPISREANDETEIKNLEEVA----ADPPGTQEGTNN 132
F S+ RKRL P LP R N ET++ + E+V+ + E TN
Sbjct: 78 FGSLSRKRLGSGETPLQSPEQQKQLP-ERGVNQETKVGHKEDVSNLSMKNGLIRMEDTNA 137
Query: 133 DFVPSINSNNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSST 192
P + G +DLEKIL+ KTFTR E+DRLT LL+S+ AD + E ++ E+
Sbjct: 138 SVDPPKD-----GFTDLEKILQGKTFTRSEVDRLTTLLRSKAADSSTMNEEQRNEV---G 197
Query: 193 PVISYDIQEGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPL 252
V+ + + G +V T + DE +ASPA++AKA+MGSRP + TP
Sbjct: 198 MVVRHPPSHERDRTHPDNGSMNTLVSTPPGSLRTLDECIASPAQLAKAYMGSRPSEVTPS 257
Query: 253 SMVAHSQKFGDTFALGN----PTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMAR 312
+ Q + N P S T+SLV + G +EN FVTPRSRGRSA+YSMAR
Sbjct: 258 MLGLRGQAGREDSVFLNRTPFPQKSPTMSLVTKPSGQRPLENGFVTPRSRGRSAVYSMAR 317
Query: 313 MPYSRVRATPSIKNSVATTDSYRATVTSSSQSAWEQGRLLESNQG---ALKRRSSVLDDE 372
PYSR +++ I ++ +S S WE+ S QG LKRRSSVLD++
Sbjct: 318 TPYSRPQSSVKI-----------GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLDND 377
Query: 373 IGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAP 432
IGSVGP+RRIR KSN L + L+LP S + + V G E + H
Sbjct: 378 IGSVGPVRRIRQKSN-LSSRSLALPVSESPLSVRANGGEKTTH----------------- 437
Query: 433 YSSETKRNLSKMSAVSENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLH 492
SK SA + P SSF +P +SSEMA KIL+QLDKL +EK
Sbjct: 438 --------TSKDSA----EDIPGSSFNLVPTKSSEMASKILQQLDKLVSTREK------- 497
Query: 493 SVRNNSPMKLSPSMLHGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLL 552
SP KLSPSML GPAL+SL++V++ K+L N+ + +N D + +K + +S
Sbjct: 498 -----SPSKLSPSMLRGPALKSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQEISRESVSR 557
Query: 553 KSKVPSDKSISTGGGVGSSVPSKDTVSSSGLQVSFVGPSSL-----TKCAFQMSVQEDFV 612
+ S+K+ G + SKD G V +SL K +F+MS EDF+
Sbjct: 558 EVLAQSEKTGDAVDGTSKTGSSKDQ-DMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDFL 617
Query: 613 DMDDE-EYSNGPVAAKSFERREKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMK 672
++DD+ ++ P + +V+ S +++ +KP +A PS
Sbjct: 618 ELDDDLGAASTPCEVAEKQNAFEVEKSHISMP--------IGEKPLTPSEAMPSTSYISN 677
Query: 673 KINDQAKSDVPVTTEKSSIFSFP---------TASPSS-----TTANMIEPESTTKPEKI 732
Q S+ + TE++ +FP + P+S T + I T EK
Sbjct: 678 GDASQGTSNGSLETERNKFVAFPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPTSEEKR 737
Query: 733 ASSEVPKAAAAPIFGFGEKLPSQ-------------KDPVFSSPTFTFGNKVTTSTNEQ- 792
E PK AA P+ K SS F T +
Sbjct: 738 IPLEEPKKPAAVFPNISFSPPATGLLNQNSGASADIKLEKTSSTAFGVSEAWAKPTESKK 797
Query: 793 ---NAVPAVTSEGNVAPTLQAS-----------APTTFKFGDKATFPIPASTATENGNSE 852
N+ S + APTL S P+ +FP P+ + + NS
Sbjct: 798 TFSNSASGAESSTSAAPTLNGSIFSAGANAVTPPPSNGSLTSSPSFP-PSISNIPSDNSV 857
Query: 853 AGSPFKFASSLVNEKEGAKAG---------SASVFKSESSSSSTLSFGVP-----KESIS 912
P S + G S S S SS+S FG P ++S
Sbjct: 858 GDMPSTVQSFAATHNSSSIFGKLPTSNDSNSQSTSASPLSSTSPFKFGQPAAPFSAPAVS 917
Query: 913 EKAG--DKKSSSAGLSVGTSGNLLLSSVSSTPTPTA-------------PIFKFGSSSV- 972
E +G K++ + G + ++S T P F FGSSSV
Sbjct: 918 ESSGQISKETEVKNATFGNTSTFKFGGMASADQSTGIVFGAKSAENKSRPGFVFGSSSVV 977
Query: 973 ---------PSSSAPSGVGSVETKTKQETTPFGNVSGISPSD---TSAAKVF-------- 1032
++SAP GS+ +TP S IS S + VF
Sbjct: 978 GGSTLNPSTAAASAPESSGSLIFGVTSSSTPGTETSKISASSAATNTGNSVFGTSSFAFT 1037
Query: 1033 ------------STGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVLPASSGVAS 1092
STGSSVF F A S+ S ++ Q + S G SG +
Sbjct: 1038 SSGSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNLFGAGNAQTG----NTGSGTTT 1097
Query: 1093 STQSTPVSPFSS-SSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGSSSSANNS 1152
STQS P SS S+ SFGL+GN+ LAS ++ G S +FTS +T SS N+S
Sbjct: 1098 STQSIPFQFGSSPSAPSFGLSGNSSLASNSSPFGFSKSEPAVFTSVST---PQLSSTNSS 1157
Query: 1153 VSSGAGTSSSFF--NWQA-----SSAPSFSSGF--GSTPTGGFSFGLASSSAASSSPM-L 1212
SS + SS F +WQA +S P FSS F STPT FSFG +S++ SS+ +
Sbjct: 1158 ASSSSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-TFSFGGSSAATVSSTTTPI 1217
Query: 1213 FGSSTTGAASTTSMFSFTSAATAASSQPA-----------FGNSNHGFTFGSTPPA---- 1224
FG+ST S + +F F S QP FGNS GF FG+
Sbjct: 1218 FGASTNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFGNSTPGFAFGAPNNGNGIN 1277
BLAST of Csor.00g124720 vs. NCBI nr
Match:
KAG6578832.1 (Nuclear pore complex protein NUP1, partial [Cucurbita argyrosperma subsp. sororia])
HSP 1 Score: 2244 bits (5815), Expect = 0.0
Identity = 1223/1223 (100.00%), Postives = 1223/1223 (100.00%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPTAPIFKFGSSSVPSSSAPSGVGSVETKTKQETTPFGNVSGISPSD 900
SGNLLLSSVSSTPTPTAPIFKFGSSSVPSSSAPSGVGSVETKTKQETTPFGNVSGISPSD
Sbjct: 841 SGNLLLSSVSSTPTPTAPIFKFGSSSVPSSSAPSGVGSVETKTKQETTPFGNVSGISPSD 900
Query: 901 TSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVLPASSGVASSTQST 960
TSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVLPASSGVASSTQST
Sbjct: 901 TSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVLPASSGVASSTQST 960
Query: 961 PVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGSSSSANNSVSSGAG 1020
PVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGSSSSANNSVSSGAG
Sbjct: 961 PVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGSSSSANNSVSSGAG 1020
Query: 1021 TSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGSSTTGAASTTSMFS 1080
TSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGSSTTGAASTTSMFS
Sbjct: 1021 TSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGSSTTGAASTTSMFS 1080
Query: 1081 FTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQTVASPTPMPSFGQQ 1140
FTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQTVASPTPMPSFGQQ
Sbjct: 1081 FTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQTVASPTPMPSFGQQ 1140
Query: 1141 PLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASGSLDFNASAGGSFS 1200
PLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASGSLDFNASAGGSFS
Sbjct: 1141 PLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASGSLDFNASAGGSFS 1200
Query: 1201 LGAGGGDKSNRKFVKVKSKSRKK 1223
LGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1201 LGAGGGDKSNRKFVKVKSKSRKK 1223
BLAST of Csor.00g124720 vs. NCBI nr
Match:
KAG7016358.1 (Nuclear pore complex protein NUP1 [Cucurbita argyrosperma subsp. argyrosperma])
HSP 1 Score: 2204 bits (5712), Expect = 0.0
Identity = 1219/1296 (94.06%), Postives = 1221/1296 (94.21%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPT SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPTKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNL KMSAV
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLFKMSAV 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTANMIEPESTT+PEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANMIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPT-------------------------------------------- 900
SGNLLLSSVSSTPTP+
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 -----------------------------APIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
APIFKFGSSSVPSSSAPSGVGSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGS 1140
SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGS
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGS 1140
Query: 1141 STTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQT 1200
STTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQT
Sbjct: 1141 STTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQT 1200
Query: 1201 VASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASG 1223
VASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASG
Sbjct: 1201 VASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASG 1260
BLAST of Csor.00g124720 vs. NCBI nr
Match:
XP_022938795.1 (nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata])
HSP 1 Score: 2162 bits (5601), Expect = 0.0
Identity = 1201/1297 (92.60%), Postives = 1210/1297 (93.29%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRRSHTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPISREANDE EIKN EEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+ SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKV+PFSS AGKAPYSSETKRNLSKMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKK DKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTAN+IEPESTT+PEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKES+SEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPT-------------------------------------------- 900
SGNLLLSSVSSTPTP+
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 -----------------------------APIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
APIFKFGSSSVPSSSAPSGVGSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLFTSGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-PMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS PMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPMLFG 1140
Query: 1141 SSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SSTTGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1223
TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS
Sbjct: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1260
BLAST of Csor.00g124720 vs. NCBI nr
Match:
XP_023550414.1 (nuclear pore complex protein NUP1-like [Cucurbita pepo subsp. pepo])
HSP 1 Score: 2159 bits (5593), Expect = 0.0
Identity = 1201/1296 (92.67%), Postives = 1208/1296 (93.21%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSL ISREANDE EIKN EEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLAISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMV TPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVPPTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPPKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETS HL STKV+PFSSTAGKAPYSSETKRNLSK+SA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSLHLHSTKVHPFSSTAGKAPYSSETKRNLSKISAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPS VSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSTVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTAN+IEPESTT+PEKIASSEVPKAAAAPIFGFGEKLPSQKD VFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDSVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNS+AGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSDAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEK GAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEK-GAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPT-------------------------------------------- 900
SGNLLLSSVSSTPTP+
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 -----------------------------APIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
APIFKFGSSSVPSSSAPSGVGSVETKTKQET
Sbjct: 901 PSLNAATSSSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGA STTSDSNKQPEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAVSTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLFTSGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGS 1140
SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGS
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSPMLFGS 1140
Query: 1141 STTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQT 1200
STTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQT
Sbjct: 1141 STTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQT 1200
Query: 1201 VASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASG 1223
VASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASG
Sbjct: 1201 VASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQASG 1260
BLAST of Csor.00g124720 vs. NCBI nr
Match:
XP_022938794.1 (nuclear pore complex protein NUP1-like isoform X1 [Cucurbita moschata])
HSP 1 Score: 2156 bits (5586), Expect = 0.0
Identity = 1201/1301 (92.31%), Postives = 1210/1301 (93.01%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRRSHTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPISREANDE EIKN EEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+ SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKV+PFSS AGKAPYSSETKRNLSKMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKK DKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTAN+IEPESTT+PEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSS----TLSFGVPKESISEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS TLSFGVPKES+SEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPT---------------------------------------- 900
SVGTSGNLLLSSVSSTPTP+
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 ---------------------------------APIFKFGSSSVPSSSAPSGVGSVETKT 960
APIFKFGSSSVPSSSAPSGVGSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLFTSGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-P 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS P
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSP 1140
Query: 1141 MLFGSSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSSTTGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1223
DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP
Sbjct: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1260
BLAST of Csor.00g124720 vs. ExPASy TrEMBL
Match:
A0A6J1FKS9 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 2162 bits (5601), Expect = 0.0
Identity = 1201/1297 (92.60%), Postives = 1210/1297 (93.29%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRRSHTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPISREANDE EIKN EEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+ SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKV+PFSS AGKAPYSSETKRNLSKMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKK DKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTAN+IEPESTT+PEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKES+SEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPT-------------------------------------------- 900
SGNLLLSSVSSTPTP+
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 -----------------------------APIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
APIFKFGSSSVPSSSAPSGVGSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLFTSGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-PMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS PMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPMLFG 1140
Query: 1141 SSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SSTTGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1223
TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS
Sbjct: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1260
BLAST of Csor.00g124720 vs. ExPASy TrEMBL
Match:
A0A6J1FF52 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 2156 bits (5586), Expect = 0.0
Identity = 1201/1301 (92.31%), Postives = 1210/1301 (93.01%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRRSHTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPISREANDE EIKN EEVAADPPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQEGVRPHMVPTHV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+ SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKV+PFSS AGKAPYSSETKRNLSKMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKK DKFEDSSLLKSKVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTAN+IEPESTT+PEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSS----TLSFGVPKESISEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS TLSFGVPKES+SEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPT---------------------------------------- 900
SVGTSGNLLLSSVSSTPTP+
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 ---------------------------------APIFKFGSSSVPSSSAPSGVGSVETKT 960
APIFKFGSSSVPSSSAPSGVGSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLFTSGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-P 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS P
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSP 1140
Query: 1141 MLFGSSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSSTTGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1223
DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP
Sbjct: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1260
BLAST of Csor.00g124720 vs. ExPASy TrEMBL
Match:
A0A6J1K059 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)
HSP 1 Score: 2121 bits (5495), Expect = 0.0
Identity = 1179/1297 (90.90%), Postives = 1195/1297 (92.14%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRR+HTTPYDRPP ALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDE EIKN EEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+ SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKV+PFSSTAGKAPYSSETKRNLSKMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKKNDKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTA +IEPESTT+PEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE +SEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPT-------------------------------------------- 900
SGNLLLSSVSSTPTP+
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 -----------------------------APIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
APIFKFGSSSVPS+SAP+G GSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLF SGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-PMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS PMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
Query: 1141 SSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SS+TGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1223
TVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNPFQAS
Sbjct: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
BLAST of Csor.00g124720 vs. ExPASy TrEMBL
Match:
A0A6J1JQT4 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)
HSP 1 Score: 2115 bits (5480), Expect = 0.0
Identity = 1179/1301 (90.62%), Postives = 1195/1301 (91.85%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRR+HTTPYDRPP ALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDE EIKN EEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
Query: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+ SSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAV 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKV+PFSSTAGKAPYSSETKRNLSKMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKKNDKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
Query: 661 FPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
FPTASPSSTTA +IEPESTT+PEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSS----TLSFGVPKESISEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE +SEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSILSFGVPKELMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPT---------------------------------------- 900
SVGTSGNLLLSSVSSTPTP+
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 ---------------------------------APIFKFGSSSVPSSSAPSGVGSVETKT 960
APIFKFGSSSVPS+SAP+G GSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLF SGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-P 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS P
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
Query: 1141 MLFGSSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSS+TGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1223
DTVQTVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNP
Sbjct: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
BLAST of Csor.00g124720 vs. ExPASy TrEMBL
Match:
A0A1S3C4Z3 (nuclear pore complex protein NUP1-like OS=Cucumis melo OX=3656 GN=LOC103496528 PE=4 SV=1)
HSP 1 Score: 1645 bits (4259), Expect = 0.0
Identity = 975/1312 (74.31%), Postives = 1059/1312 (80.72%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEV+YEGGRGGKFQKRP+RRSHTTPYDRPPTALRNSA KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
SAHRLFS+VFRKRLPPPPPS +SREAN+E E +N EEVAADP GTQEGTN FVPSINS
Sbjct: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
+N G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVESRKFE V STPV S+ +Q
Sbjct: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
Query: 181 EGSPKFP--AQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHS 240
EGSPKFP +Q+GV PHM PTHVVNANV DEDVASPAEIAKA+MGSRPPKATPLSM
Sbjct: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
Query: 241 QKFGDTFALGNPTTSSTLSLVPRSPGNFDV-ENDFVTPRSRGRSALYSMARMPYSRVRAT 300
GNP+ SSTLSLVPRSPGNFDV EN FVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
Query: 301 PSIKNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRH 360
PSIKNS+ATTD+YRAT +SSSQSAWEQG LL S QGALKRR+SVLDD++GSVGPIRR R
Sbjct: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
Query: 361 KSNLLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKM 420
KSN LFP GLSLPSSSTSIP SGI SET++HLQSTKV+PFSS GK YSSET+RN SK
Sbjct: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
Query: 421 SAVSENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSP 480
SA S+N TPSSSFP+IPLRSSEMA KILEQLD LTPPKEKSSELKL SVRNNSPMKLSP
Sbjct: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
Query: 481 SMLHGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSIST 540
SMLHGPALRSLE+VDSAKYLENVE I SND D TS+KNDKFE+SS KS VP+DKSIST
Sbjct: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
Query: 541 GGGVGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSF 600
GVGSSVP+KD S SG+QVSFVGPS TKCAFQMS EDFVDMD+E +SNGPVA KSF
Sbjct: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
Query: 601 ERREKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSS 660
E REKVDDSLV+V KP +TEAITV K + SI+AKPS VS M KINDQ KSDVP TTEKS
Sbjct: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
Query: 661 IFSFPTASPSSTTANMIEPESTTKPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPT 720
IFSFPT S S+TAN+ PES+ +PEK+AS E+PKAA APIFGFGEK PSQK+ + PT
Sbjct: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
Query: 721 FTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSE 780
F FG+K TT TNEQNA+P VTSE N PT AS PTTFKFGDKA+F IPA+ ATENGN
Sbjct: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
Query: 781 AGSPFKFASSLVNEKEGAKAG-SASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGL 840
AGS FKF S LVNEKEGA G SASVFK+E+SSSS SFGVPKES+SEKAGDK SSS GL
Sbjct: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDK-SSSPGL 840
Query: 841 SVGTSGNLLLSSVS---STPTPT------------------------------------- 900
GTSGNL SS S STPTP+
Sbjct: 841 IFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNV 900
Query: 901 -------------------------------------APIFKFGSSSVPSSSA-----PS 960
APIFKFGSSSVPS+SA PS
Sbjct: 901 TSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPS 960
Query: 961 GVGSVETKTKQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTF 1020
GVGSVE KTK ETT FGN+SG+ PSDT+A KV STGSSVFQFGAASTTSD+NK P STF
Sbjct: 961 GVGSVEAKTKPETT-FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTF 1020
Query: 1021 APVSVPSFGAPVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPAS 1080
A ++P+FGAPV +SSG+ASSTQSTP FSSS TSFGLTGNTGLASG++L GSSAPAS
Sbjct: 1021 AQNNIPAFGAPVSFSSSGLASSTQSTPALQFSSS-TSFGLTGNTGLASGSSLFGSSAPAS 1080
Query: 1081 NLFTSGATFGFGSSSS-ANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLA 1140
N FTSGATFG SSSS ANNSVSS AGTSSSFFNWQ SS PSFS+GF STP+GGFSFGL+
Sbjct: 1081 NPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLS 1140
Query: 1141 SSSAASSS-PMLFGSSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANN- 1200
SSS+AS+S PM+FGSS+TGA S SMFSFTSAA+A +SQPAFGNSN+ FTFGSTPPANN
Sbjct: 1141 SSSSASNSAPMVFGSSSTGA-SPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNN 1200
Query: 1201 DHANMEDSMAEDTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQ 1223
+ A+MEDSMAEDTVQT + PMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQ
Sbjct: 1201 EQASMEDSMAEDTVQTAS---PMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQ 1260
BLAST of Csor.00g124720 vs. TAIR 10
Match:
AT3G10650.1 (BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.1); Has 61042 Blast hits to 31782 proteins in 2093 species: Archae - 202; Bacteria - 16480; Metazoa - 16017; Fungi - 12552; Plants - 1653; Viruses - 629; Other Eukaryotes - 13509 (source: NCBI BLink). )
HSP 1 Score: 382.5 bits (981), Expect = 1.3e-105
Identity = 467/1376 (33.94%), Postives = 628/1376 (45.64%), Query Frame = 0
Query: 13 GRGGKFQKRPLRRSHTTPYDRPPTALRNSA-------GKGWLSKLVDPAQKLITSSAHRL 72
G GGKF+K RRS TPYDRP T++RN+ G GWLSKLVDPAQ+LIT SA RL
Sbjct: 18 GTGGKFRKPTARRSQKTPYDRPTTSVRNAGLGGGDVRGGGWLSKLVDPAQRLITYSAQRL 77
Query: 73 FSSVFRKRL---------PPPPPSLPISREANDETEIKNLEEVA----ADPPGTQEGTNN 132
F S+ RKRL P LP R N ET++ + E+V+ + E TN
Sbjct: 78 FGSLSRKRLGSGETPLQSPEQQKQLP-ERGVNQETKVGHKEDVSNLSMKNGLIRMEDTNA 137
Query: 133 DFVPSINSNNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSST 192
P + G +DLEKIL+ KTFTR E+DRLT LL+S+ AD + E ++ E+
Sbjct: 138 SVDPPKD-----GFTDLEKILQGKTFTRSEVDRLTTLLRSKAADSSTMNEEQRNEV---G 197
Query: 193 PVISYDIQEGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPL 252
V+ + + G +V T + DE +ASPA++AKA+MGSRP + TP
Sbjct: 198 MVVRHPPSHERDRTHPDNGSMNTLVSTPPGSLRTLDECIASPAQLAKAYMGSRPSEVTPS 257
Query: 253 SMVAHSQKFGDTFALGN----PTTSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMAR 312
+ Q + N P S T+SLV + G +EN FVTPRSRGRSA+YSMAR
Sbjct: 258 MLGLRGQAGREDSVFLNRTPFPQKSPTMSLVTKPSGQRPLENGFVTPRSRGRSAVYSMAR 317
Query: 313 MPYSRVRATPSIKNSVATTDSYRATVTSSSQSAWEQGRLLESNQG---ALKRRSSVLDDE 372
PYSR +++ I ++ +S S WE+ S QG LKRRSSVLD++
Sbjct: 318 TPYSRPQSSVKI-----------GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLDND 377
Query: 373 IGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAP 432
IGSVGP+RRIR KSN L + L+LP S + + V G E + H
Sbjct: 378 IGSVGPVRRIRQKSN-LSSRSLALPVSESPLSVRANGGEKTTH----------------- 437
Query: 433 YSSETKRNLSKMSAVSENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLH 492
SK SA + P SSF +P +SSEMA KIL+QLDKL +EK
Sbjct: 438 --------TSKDSA----EDIPGSSFNLVPTKSSEMASKILQQLDKLVSTREK------- 497
Query: 493 SVRNNSPMKLSPSMLHGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLL 552
SP KLSPSML GPAL+SL++V++ K+L N+ + +N D + +K + +S
Sbjct: 498 -----SPSKLSPSMLRGPALKSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQEISRESVSR 557
Query: 553 KSKVPSDKSISTGGGVGSSVPSKDTVSSSGLQVSFVGPSSL-----TKCAFQMSVQEDFV 612
+ S+K+ G + SKD G V +SL K +F+MS EDF+
Sbjct: 558 EVLAQSEKTGDAVDGTSKTGSSKDQ-DMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDFL 617
Query: 613 DMDDE-EYSNGPVAAKSFERREKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMK 672
++DD+ ++ P + +V+ S +++ +KP +A PS
Sbjct: 618 ELDDDLGAASTPCEVAEKQNAFEVEKSHISMP--------IGEKPLTPSEAMPSTSYISN 677
Query: 673 KINDQAKSDVPVTTEKSSIFSFP---------TASPSS-----TTANMIEPESTTKPEKI 732
Q S+ + TE++ +FP + P+S T + I T EK
Sbjct: 678 GDASQGTSNGSLETERNKFVAFPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPTSEEKR 737
Query: 733 ASSEVPKAAAAPIFGFGEKLPSQ-------------KDPVFSSPTFTFGNKVTTSTNEQ- 792
E PK AA P+ K SS F T +
Sbjct: 738 IPLEEPKKPAAVFPNISFSPPATGLLNQNSGASADIKLEKTSSTAFGVSEAWAKPTESKK 797
Query: 793 ---NAVPAVTSEGNVAPTLQAS-----------APTTFKFGDKATFPIPASTATENGNSE 852
N+ S + APTL S P+ +FP P+ + + NS
Sbjct: 798 TFSNSASGAESSTSAAPTLNGSIFSAGANAVTPPPSNGSLTSSPSFP-PSISNIPSDNSV 857
Query: 853 AGSPFKFASSLVNEKEGAKAG---------SASVFKSESSSSSTLSFGVP-----KESIS 912
P S + G S S S SS+S FG P ++S
Sbjct: 858 GDMPSTVQSFAATHNSSSIFGKLPTSNDSNSQSTSASPLSSTSPFKFGQPAAPFSAPAVS 917
Query: 913 EKAG--DKKSSSAGLSVGTSGNLLLSSVSSTPTPTA-------------PIFKFGSSSV- 972
E +G K++ + G + ++S T P F FGSSSV
Sbjct: 918 ESSGQISKETEVKNATFGNTSTFKFGGMASADQSTGIVFGAKSAENKSRPGFVFGSSSVV 977
Query: 973 ---------PSSSAPSGVGSVETKTKQETTPFGNVSGISPSD---TSAAKVF-------- 1032
++SAP GS+ +TP S IS S + VF
Sbjct: 978 GGSTLNPSTAAASAPESSGSLIFGVTSSSTPGTETSKISASSAATNTGNSVFGTSSFAFT 1037
Query: 1033 ------------STGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVLPASSGVAS 1092
STGSSVF F A S+ S ++ Q + S G SG +
Sbjct: 1038 SSGSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNLFGAGNAQTG----NTGSGTTT 1097
Query: 1093 STQSTPVSPFSS-SSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGSSSSANNS 1152
STQS P SS S+ SFGL+GN+ LAS ++ G S +FTS +T SS N+S
Sbjct: 1098 STQSIPFQFGSSPSAPSFGLSGNSSLASNSSPFGFSKSEPAVFTSVST---PQLSSTNSS 1157
Query: 1153 VSSGAGTSSSFF--NWQA-----SSAPSFSSGF--GSTPTGGFSFGLASSSAASSSPM-L 1212
SS + SS F +WQA +S P FSS F STPT FSFG +S++ SS+ +
Sbjct: 1158 ASSSSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-TFSFGGSSAATVSSTTTPI 1217
Query: 1213 FGSSTTGAASTTSMFSFTSAATAASSQPA-----------FGNSNHGFTFGSTPPA---- 1224
FG+ST S + +F F S QP FGNS GF FG+
Sbjct: 1218 FGASTNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFGNSTPGFAFGAPNNGNGIN 1277
BLAST of Csor.00g124720 vs. TAIR 10
Match:
AT5G20200.1 (nucleoporin-related )
HSP 1 Score: 91.3 bits (225), Expect = 5.9e-18
Identity = 148/590 (25.08%), Postives = 243/590 (41.19%), Query Frame = 0
Query: 12 GGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITSSAHRLFSSVFR 71
GG GGK +++ RR TPY RP + W+S++VDPA ++I+ A R+ F
Sbjct: 22 GGVGGKLKRQSARRHAATPYSRP--TQNQVQRRPWISRIVDPAYRIISGGATRILPYFFS 81
Query: 72 KRLPPP----PP--------SLPISREANDE--TEIKNLEEVAA----DPPGTQEGTNND 131
P PP L + + ND T I N E A+ P GT +
Sbjct: 82 NAASAPALAAPPEDQNQHQGELQNNPQDNDPSVTPISNKPEPASIEVGGPSGTANVNEGN 141
Query: 132 FVPSINS------NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE 191
F S N+ +S+LE++++ KTF++ EIDRL E++ SR D+P
Sbjct: 142 FSISAQRRGKAALNDDVAISELERLMEGKTFSQAEIDRLIEMISSRAIDLPD-------- 201
Query: 192 MVSSTPVISYDIQEGSPKFPAQEGVRPHM---------------------VPTHVVNA-- 251
+ D E + + P +EG + +M PT + +
Sbjct: 202 -------VKRD--ERNLEIPLREGAKKNMSLFDKAKEPIGGKDANSEIWATPTPLAKSII 261
Query: 252 ----NVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK--FGDTFALGNPTTSSTLSL 311
+ DE SPAE+AKA+MG + ++ VA ++K + +G + +S S
Sbjct: 262 LDGDKIRDEVGLSPAELAKAYMGGQTSSSSSQGFVARNEKDCLDRSMLVGKSSLASPSSK 321
Query: 312 VPRS-PG-NFDVENDFVTPRSRGRS-ALYSMARMPYSR-VRATPSIKNSVATTDS--YRA 371
PG ++ F TP+SR S L + R PYSR + + K DS + +
Sbjct: 322 PSACWPGIKSSEQSGFATPQSRRESYGLQNFPRTPYSRTILSNSKSKLMQLQNDSSKHLS 381
Query: 372 TVTSSSQSAWEQ-GRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLPS 431
+ S SQS + G+L + G G GP RR R + S PS
Sbjct: 382 NLQSPSQSVERRYGQLSKGRDG-------------GLFGPSRRTRQSATPSMVSPYSRPS 441
Query: 432 SSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLSKMSAVSENDRTPSSSF 491
S +++ + SS AG++ Y S S+++ ++ +
Sbjct: 442 RGAS------------RFENSAIMK-SSEAGESSYLSR-----SQITTYGKHKEAEVGTL 501
Query: 492 PQIPLRSSEMALKILEQLDKL---TPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSL 539
+P SS++A IL+ L++ + PK K++ELKL + P + ++
Sbjct: 502 -TVPTHSSQIARTILDHLERTQSQSTPKNKTAELKL-ATSWRHPQSSKTVEKSSSDVTNV 547
The following BLAST results are available for this feature:
Match Name | E-value | Identity | Description | |
Q9CAF4 | 1.8e-104 | 33.94 | Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 S... | [more] |
Match Name | E-value | Identity | Description | |
KAG6578832.1 | 0.0 | 100.00 | Nuclear pore complex protein NUP1, partial [Cucurbita argyrosperma subsp. sorori... | [more] |
KAG7016358.1 | 0.0 | 94.06 | Nuclear pore complex protein NUP1 [Cucurbita argyrosperma subsp. argyrosperma] | [more] |
XP_022938795.1 | 0.0 | 92.60 | nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata] | [more] |
XP_023550414.1 | 0.0 | 92.67 | nuclear pore complex protein NUP1-like [Cucurbita pepo subsp. pepo] | [more] |
XP_022938794.1 | 0.0 | 92.31 | nuclear pore complex protein NUP1-like isoform X1 [Cucurbita moschata] | [more] |
Match Name | E-value | Identity | Description | |
A0A6J1FKS9 | 0.0 | 92.60 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A6J1FF52 | 0.0 | 92.31 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A6J1K059 | 0.0 | 90.90 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN... | [more] |
A0A6J1JQT4 | 0.0 | 90.62 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN... | [more] |
A0A1S3C4Z3 | 0.0 | 74.31 | nuclear pore complex protein NUP1-like OS=Cucumis melo OX=3656 GN=LOC103496528 P... | [more] |
Match Name | E-value | Identity | Description | |
AT3G10650.1 | 1.3e-105 | 33.94 | BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.... | [more] |
AT5G20200.1 | 5.9e-18 | 25.08 | nucleoporin-related | [more] |