Sequences
The following sequences are available for this feature:
Gene sequence (with intron)
Legend: exonfive_prime_UTRpolypeptideCDS
Hold the cursor over a type above to highlight its positions in the sequence below.
AAACACGATTTTTTTTTTTTCAAATTTCTCGCTCATCCTCTGTATCTCTCTCTCTCTCTTTCTGCGCGTGGTCTAATAAAAACCCTAATTTGCTGAATTCCCTACTTTTTTTCCTCCCCCTTTCAACAATTTCCTCAGTATTCCGGCATTGAAGAGAAGACCTCAACTCTGTGTTGTTAATGGCGACAGAGCGTGAGGAGGTTCGTTATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTCTCAGAAGGGCGCATACGACGCCGTATGATCGGCCGCCGGCTGCTCTGAGAAACTCTGCTGGAAAAGGATGGCTCTCTAAGCTTGTCGATCCGGCGCAGAAGCTCATCACCTCCAGTGCGCACAGGCTGTTTTCTAGCGTGTTTCGTAAACGCCTCCCCCCTCCGCCGCCGTCATTGCCAATTTATCGAGGTTTTTCTTTTTGTTGTTTTTTATTTGCTTCTTAATTGCAAGGCTTTCTCACCGGTTGTTAGAATTGTTTTTGGGCTTTCCATACCGCATTCTTTCTGCTCATACGTTTGATTTTGGAGGCGTTGGCTGAAGATGGCATTTTTTAAAATAATTTTATTATTATTTTGATTTTTTCCCGCGGGAGTTCTTTTAGTCTTGGGGTTTTTATTCTCTTTTCCTGGTGGAACCTGGATTTATTATTTTGTATGGTTTTAGGCGTGTTGAACTATTCTATCTCATTTAGAACTTCAATTATTTAAATGTCATTACTTTACGTGATTCCATGCTTATGAACTTGAAGCATGTCAAAGTGCAGGTTTCAACGCTTACTAGTCGAATTCTATCGAGTCTGCTTGGAATGTTGTTTTGTTTTCGTTGCTTGGATGTCACATATGTTAAAAACATCAGGAATAGTCAGAGTGTGATTCTTCCATAGCATTTCTAAAATGATCCCCCATATAAAATTTAAGAATTGGTTTCAATTTTTATTTTCAAAAACTTCGTGAAAATAAATATTTTGTCCTTGTTTCATGTACTTAAGCTCAAAGGCAAGGTCAATGGCGTTATGTATGCATGCATGCATGCATGTATGTATGTATTTACAGTTTTTCTCAATTATAGCCAATTAGAAGTCCATTTACCATTTGGCTCCTTTTGTATTTTAACCCATGAATGAGATATTTTTGTTTCCCATAATAATGTTAATCTAAGAACAATATCTTTTAAGTATGTTATACGAGGTAATAACCAATAATAGTTGATCGCTGGTTGTTTAGAAGACAGCTTACAGATACACACGTAAACAGAAAAATTCTTTTCCTTTTTATGCTGGTTGTTCTGTTTATTGTCATTCAAAATTATTTCGCTGAACAAAGATTCTGTAAAAACACTTTTAATATTTTAAACTAAAAATTGTTTCTAGAAATTGCTCTTGCTCTTAAACATTTTAATCTCTCATATAATTTTTTTTTCCCCACGGAAGTAACTTGCAAGATTTTGAATTATATCAATGTTGATAGCCATTTAGGAAGCATGAAGCCATTATTTTATTATGCATTTTGGAGTTGATACCTTTGTGCGTGCATTGACTTTTGACTTGGGGTTGGTTGCTATAATGTGTTGATAAATAATTGATAATCGCATGGGACTGTGGCAGAAGTTTTTCATTTGATATTTAGATTTCTGCTTAATCTTTGACTGTCCTGCCCTTGCATTTTATACTTCCAGAGGCAAATGATGAGATGGAAATTAAGAACCAGGAAGAAGTTGCAGCTGTAAGTTTTATCTGTTATATGTTTTGCTTATCAACAACCTTTGCATCTGTATCTTGTATTTTTTTAATCCAATTCTGCTTTTGATCTAAAGCACGATACGTCGTCACTGTGTTTTCCCCCTTCTATGTACATACTTGTTTGGCTTCCACATTTCACTATTCCAGATATTGCGAGGTTTTTTTTGTTATTTTTTCCTCTTTCTTTTGACCAATCTGGATTTCTTCTTTGTTTCTTTCAGATTTACAATAAAAGTCATTTTAAACTGTTCGTTTGAAAAAAAAAAAAAAAAAAAAAAGACGTGATAGACCTATGTTATTTTCATGAATGCATTAGTATCCTTATCAGTGAAGTGAAACTTCTTGCAAAAATCTGAGAAATTTGTGTTGCCGTAGTCTTAACTTCTTTGTCAACATTTTCTGAATTTTAATTGTTCTTTAGGATTCTCCTGGAACTCAAGAAGGGACTAATAATGATTTTGTTCCAAGCATCAATTCTAATAACATACATGGGGTGAGTGACCTCGAGAAAATTTTGAAGGAGAAGACCTTTACAAGGTAAATATTTGAGTGCTTGTTGGTGAAATTATTTTTAGTTGCATTCCTCAGTTCTGTTAGAAGATTTGCCTGGTTTTGTTGCTTTTCTTTTTCTTGTTAATATTTCATTGAGGGTCCTGTATGAAAATTTGAGTTTGCATAAATTGCGATTAGTTACATGGTAAGAAATCATGAAGCAGCATGAAATGTATAAACTGCAATGTTGCTATAAAATACAATTTCATTTTTCTCGTTTGGGATAGAAGTCCGGTTTCATTTTCTATGTATTGATTTTAGCAAGATATGGTTTTGAAATTTAATATGTTACACGCTGACCATTTTACAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGATGTTCCAAGTGGGGTTGAATCGAGAAAATTTGAAAAGGTCCCTTCAACACCTGTTATCAGTTATGACATACAGGAAGGGTCTCCAAAATTTCCAGCTCAAGAGAGAGTTAGGCCTCATATGGTTCCAAATCATGTCGTGAATGCAAATGTAGGAATCTTTGTATATATTTTCTGTGTGTTAGGTTTTTTCAGCGGTTAATGCTTAGTGCTTGTTTACCATTTGATGCTCACACTGATAACTGTACAAACTTTTGACCTTATTGTCACTTGTTTAATCATTTCAGGTCCCTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAGGCGTTCATGGGTAGCAGGCCTCCAAAAGCAACTCCGTTGAGTATGGTGGCCCATAGTCAAAAGTTTGGGGATACTTTTGCTTTAGGCAATCCCTCAAAGTCCTCTACTTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGAAAATGATTTTGTCACCCCAAGATCTCGTGGCAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCAAGAGTTCGTGCAACCCCCAGCATAAAGGTTTGTCCTCTAATTAATACATCTTCTTTATTGTATGCTTGCTTGGTAGCTTATGTATTTATTAGCCTTTGTTTTTTCCTGTGGTTCATTCTTCAGAATAGTGTAGCAACAACAGATTCTTATAGGGCCTCTGTGACCTCATCATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGAGTCTAATCAAGGGGTATGATTTGTGAAAATGTTCTTTTACAATATATTGTGTTATCGAGTAAACCTCTCATATTATTTTATTTGATTATTGTTTCTGTAGGCTTTAAAACGCCGAAGCTCAGTTTTAGATGATGAAATAGGATCTGTTGGTCCTATTCGAAGAATTCGCCATAAATCCAATCTCCTTTTCCCAAAAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGTTAGTGGAATTGGTTCCGAGACTTATCAGCATTTGCAGTCCACAAAAGTTCATCCATTTTCGTCCACTGCTGGGAAGGCACCTTATTCAAGTGAGACCAAGCGTAATTTGTCCAAAATGTCTGCAGAGTCTGAAAATGATAGGACACCTAGTTCAAGTTTCCCTCAAATTCCCCTCAGGTCTAGTGAGATGGCCTTAAAAATCTTAGAGCAGCTTGATAAATTGACCCCTCCAAAGGAAAAATCTTCGGAACTAAAGTTGCATAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGAAGTCTGGAAGATGTGGATTCGGCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGGCCGTGATCTTACTTCGAAAAAGAACGATAAGTTTGAGGATAGTAGTTTGTTAAAATCTGAAGTACCCAGTGATAAATCTATTTCTACAGGTGGTGGCGTAGGTTCTTCAGTGCCTTCAAAGGATACTGTATCTAGTTCTGGTCTGCAGGTTTCATTTGTTGGCCCATCCTCACTAACGAAATGTGCGTTCCAGATGAGTGTACAAGAGGTGTGTGGTTTCCTGCCTTCAAGTTTATAGAATAGGTCAATCCTGTCATGTTTCTATCTTTTAATTTATCCTCGTTCCTGCATTCTCAATTAAATAAATGAAAGGATTACTAATCGGGTTGGGGTTTCTCAGTTTCAGCATCTTGCACTTCCATTTTAACGACTGTAATTACTATTCTTTCAATTTCTGTTGAAGTTTTTCATTTTTTTCATTTTTCAAGCACACCCAAACCTGAAAAAAGAAGGCTGCGAAGTATAATATTATGTCTGTGTCCATTATAAAACCTCTATGGCTTAATCTTCGATTATCTATTATTTTGCTAGGATTTTGTGGATCTTGATGTTCTCTATGTTTATGCCCCTTGTAGACCCCCCAAGTTGTAATATTTATGGGCCGTCTGTCTCTTTTTGTTAGGATTTTGTGGATATGGATGATGAAGAATATTCTAATGGGCCAGTTGCTGCTAAATCGTTTGAGAGGCGAGAAAAAGTTGATGACTCATTAGTGGCGGTGGGTAAGCCGAGTGATAATGAAGCCATCATAGTCGATAAACCTCAGGCTTCAATTCAGGCTAAACCCTCCACTGTCTCTGAAATGAAGAAAATAAATGACCAAGCAAAATCTGATATTCCTGTGACTACTGAAAAGAGTTCCATTTTTTCCTTTCCAACAGCATCTCCATCTAGCACTACAGCCACTGTGATAGAACCGGAATCAACCACGAGACCTGAAAAAATTGCTTTCTCTGAGGTACCAAAAGCAGCTGTTGCCCCTATATTTGGCTTTGGAGAAAAGTTTCCATCACAGAAGGATCCGGTTTTTTCTTCTCCCACCTTTACGTTTGGAAACAAGGTTACCACCTCAACAAATGAACAAAATGCTGTTCCTGCGGTAACTTCTGAAGGCAATGTTGCACCTACTTTACAAGCTTCTGCTCCTACCACATTTAAATTTGGAGATAAAGCTACATTTCCTATTCCAGCAAGTACCACCACCGAAAATGGAAATAGTGAGGCCGGGTCTCCGTTTAAGTTTGCATCTTCTTTAGTTAACGAAAAAGAAGGTGCTAAAGCAGGCAGTGCTTCAGTTTTTAAATCTGAGAGTTCTAGCAGCAGGTTAGTTTGCTTGTCACCGTTTTCACCTCGGACTTGGAGAATATTTATTTTGTTTTTACTTTCATGTGTGTAGGCTTATATTTCTATTATTAGCTTATGTGAAATGCATGATAAATAGGATTTTAAATGTTCAGCATTCCAATATCCAATTCGGTTCTGAAGATGCACCATTGGTTTTAATTATTTTGAGAAAACTTGGATCCATAATCTTTAGCCTATATATTCCTGATATCTCCCACCTTTCATCTTAAATTTTTGGTCTGGAAGTATTTTCCTATCTAATAAAGTACTTATGAATGATGCTCAAGAATTCTCTTATTTTGTTTAATGTGGTTTATCCCAGGGATTTCGTATACCAATTGAGGCACTTTTCTTTGAACTTTTTTTTACTTTTCGTTGATTGCTGTTCTCCATTTTTTGTGTTCGAGCTTTTTTGAGGATAGGATAGTTAGTCTAAACACGGGCGTATGTAAATTTATATGAAGTAATTGATTCATGAAATTGTTGATAGATGGATCAGTTATTCTTGCTATCCTTTTTTCAAGCTTTAGTATTTCTTGTATATTATTTGTTGGAAATTGAAATACTAGAGCATACATTTCTACACATTTTCATCTTTCTCCTTGTCTGTTTCAAGAAACTTCTTTTGGTTTATCATGTTAGATTATGTCAACATTATCTCAGGGCTATATACATATATATTAAAACAGATTATTGTGCATCAACTTAGATATGTTTGTGCTCTGCTTGGGCTTTAGGACATGAAATATTGGCATACCCTTTTGATTGAAATTTTCTCATTCACCTTCCAATGATGAACGGGCTGTCTGTTTCTAGGTGATATTTGTTGTGCGTTACCAAATTTTCTAGTAAAACTGATGTTTTGGACGTTTTAATTGCAGCATCTTGTCATTTGGAGTTCCTAAAGAGTTGATGTCGGAGAAAGCTGGCGATAAGAAGAGTTCAAGTGCCGGACTCTCTGTTGGCACTTCTGGGAATTTGCTTTTGTCATCTGTCTCATCAACACCAACTCCCAGTTTGTTTTCTTTTAGCTCCCCTACCACTAATTCAAATCTTATTAACGGATCTCTTGGTTCCACCCCATCTACTTTTCCCTCCCCATCCAACACCTTTCCTAGTAATATAACAAATCAAAATTCATCCATCAAACCGTCTCTCAATGCTGCCACTAGCAATAGCGAACCCGTCACCACTACTAGTCTTTCTACGTCTTCTCCTATGCCATCTTTTTCAGCTGCGCCAATTTTCAAGTTTGGGAGCTCCAGTGTTCCTTCAACTTCAGCACCGAATGGAGCTGGATCAGTAGAAACCAAGACCAAGCAAGAGACGACACCCTTTGGCAATGTAAGTGGCATTTCTCCGAGCGACACATCTGCTGCTAAAGTATTTAGTACTGGAAGCAGTGTTTTTCAATTTGGAGCTGCGTCTACTACTTCAGATTCTAATAAAGAACCAGAAAAGTCAACCTTCGCTCCGGTCAGTGTACCTTCATTTGGTGCTCCAGTTTTGCCTGCAAGTAGTGGGGTTGCTTCTTCTACTCAGAGTACACCTGTTTCGCCGTTCAGTTCATCATCTACATCATTTGGTTTGACAGGGAATACGGGTTTGGCCTCCGGTAATTCTTTGGTTGGTTCTTCAGCTCCCGCGTCTAATTTGTTCGCTTCAGGCGCCACTTTTGGTTTTGGTTCCTCCAGTTCTGCTAATAATTCAGTCAGCTCCGGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGGCATCCTCCGGGCCATCATTTTCTTCTGGATTCGGCTCAACTCCAACGGGAGGATTTTCCTTTGGCCTTGCATCTTCTTCCGCTGCTTCTAGTAGTGCCCCTATGCTCTTTGGATCATCGTCAACCGGTGCAGCATCAACAACTTCGATGTTCTCATTTACTTCAGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTTGGTAATTCTAATCATGGCTTCACCTTTGGTTCAACACCTCCTGCAAATAATGATCATGCAAATATGGAGGACAGCATGGCTGAGGATACCGTCCAGACAGTTGCATTGCCAACGCCTATGCCGAGTTTTGGGCAACAACCCCTTACGCCACCTCCATCATCAGGGTTCATGTTTGGTTCAACTGCCCCTTCTCCACTAGGAGCAAATCCTTTCCAGTTTGGTGGTAGCCAACAAAATGTATCTACCCCACAAAATCCCAATCCATTTCAGGCTTCGGGTAGCTTAGACTTCAATGCCAGTGCTGGCGGAAGCTTCTCACTAGGTGCTGGTGGTGGCGACAAATCGAACCGAAAATTCGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
mRNA sequence
AAACACGATTTTTTTTTTTTCAAATTTCTCGCTCATCCTCTGTATCTCTCTCTCTCTCTTTCTGCGCGTGGTCTAATAAAAACCCTAATTTGCTGAATTCCCTACTTTTTTTCCTCCCCCTTTCAACAATTTCCTCAGTATTCCGGCATTGAAGAGAAGACCTCAACTCTGTGTTGTTAATGGCGACAGAGCGTGAGGAGGTTCGTTATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTCTCAGAAGGGCGCATACGACGCCGTATGATCGGCCGCCGGCTGCTCTGAGAAACTCTGCTGGAAAAGGATGGCTCTCTAAGCTTGTCGATCCGGCGCAGAAGCTCATCACCTCCAGTGCGCACAGGCTGTTTTCTAGCGTGTTTCGTAAACGCCTCCCCCCTCCGCCGCCGTCATTGCCAATTTATCGAGAGGCAAATGATGAGATGGAAATTAAGAACCAGGAAGAAGTTGCAGCTGATTCTCCTGGAACTCAAGAAGGGACTAATAATGATTTTGTTCCAAGCATCAATTCTAATAACATACATGGGGTGAGTGACCTCGAGAAAATTTTGAAGGAGAAGACCTTTACAAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGATGTTCCAAGTGGGGTTGAATCGAGAAAATTTGAAAAGGTCCCTTCAACACCTGTTATCAGTTATGACATACAGGAAGGGTCTCCAAAATTTCCAGCTCAAGAGAGAGTTAGGCCTCATATGGTTCCAAATCATGTCGTGAATGCAAATGTCCCTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAGGCGTTCATGGGTAGCAGGCCTCCAAAAGCAACTCCGTTGAGTATGGTGGCCCATAGTCAAAAGTTTGGGGATACTTTTGCTTTAGGCAATCCCTCAAAGTCCTCTACTTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGAAAATGATTTTGTCACCCCAAGATCTCGTGGCAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCAAGAGTTCGTGCAACCCCCAGCATAAAGAATAGTGTAGCAACAACAGATTCTTATAGGGCCTCTGTGACCTCATCATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGAGTCTAATCAAGGGGCTTTAAAACGCCGAAGCTCAGTTTTAGATGATGAAATAGGATCTGTTGGTCCTATTCGAAGAATTCGCCATAAATCCAATCTCCTTTTCCCAAAAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGTTAGTGGAATTGGTTCCGAGACTTATCAGCATTTGCAGTCCACAAAAGTTCATCCATTTTCGTCCACTGCTGGGAAGGCACCTTATTCAAGTGAGACCAAGCGTAATTTGTCCAAAATGTCTGCAGAGTCTGAAAATGATAGGACACCTAGTTCAAGTTTCCCTCAAATTCCCCTCAGGTCTAGTGAGATGGCCTTAAAAATCTTAGAGCAGCTTGATAAATTGACCCCTCCAAAGGAAAAATCTTCGGAACTAAAGTTGCATAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGAAGTCTGGAAGATGTGGATTCGGCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGGCCGTGATCTTACTTCGAAAAAGAACGATAAGTTTGAGGATAGTAGTTTGTTAAAATCTGAAGTACCCAGTGATAAATCTATTTCTACAGGTGGTGGCGTAGGTTCTTCAGTGCCTTCAAAGGATACTGTATCTAGTTCTGGTCTGCAGGTTTCATTTGTTGGCCCATCCTCACTAACGAAATGTGCGTTCCAGATGAGTGTACAAGAGGATTTTGTGGATATGGATGATGAAGAATATTCTAATGGGCCAGTTGCTGCTAAATCGTTTGAGAGGCGAGAAAAAGTTGATGACTCATTAGTGGCGGTGGGTAAGCCGAGTGATAATGAAGCCATCATAGTCGATAAACCTCAGGCTTCAATTCAGGCTAAACCCTCCACTGTCTCTGAAATGAAGAAAATAAATGACCAAGCAAAATCTGATATTCCTGTGACTACTGAAAAGAGTTCCATTTTTTCCTTTCCAACAGCATCTCCATCTAGCACTACAGCCACTGTGATAGAACCGGAATCAACCACGAGACCTGAAAAAATTGCTTTCTCTGAGGTACCAAAAGCAGCTGTTGCCCCTATATTTGGCTTTGGAGAAAAGTTTCCATCACAGAAGGATCCGGTTTTTTCTTCTCCCACCTTTACGTTTGGAAACAAGGTTACCACCTCAACAAATGAACAAAATGCTGTTCCTGCGGTAACTTCTGAAGGCAATGTTGCACCTACTTTACAAGCTTCTGCTCCTACCACATTTAAATTTGGAGATAAAGCTACATTTCCTATTCCAGCAAGTACCACCACCGAAAATGGAAATAGTGAGGCCGGGTCTCCGTTTAAGTTTGCATCTTCTTTAGTTAACGAAAAAGAAGGTGCTAAAGCAGGCAGTGCTTCAGTTTTTAAATCTGAGAGTTCTAGCAGCAGCATCTTGTCATTTGGAGTTCCTAAAGAGTTGATGTCGGAGAAAGCTGGCGATAAGAAGAGTTCAAGTGCCGGACTCTCTGTTGGCACTTCTGGGAATTTGCTTTTGTCATCTGTCTCATCAACACCAACTCCCAGTTTGTTTTCTTTTAGCTCCCCTACCACTAATTCAAATCTTATTAACGGATCTCTTGGTTCCACCCCATCTACTTTTCCCTCCCCATCCAACACCTTTCCTAGTAATATAACAAATCAAAATTCATCCATCAAACCGTCTCTCAATGCTGCCACTAGCAATAGCGAACCCGTCACCACTACTAGTCTTTCTACGTCTTCTCCTATGCCATCTTTTTCAGCTGCGCCAATTTTCAAGTTTGGGAGCTCCAGTGTTCCTTCAACTTCAGCACCGAATGGAGCTGGATCAGTAGAAACCAAGACCAAGCAAGAGACGACACCCTTTGGCAATGTAAGTGGCATTTCTCCGAGCGACACATCTGCTGCTAAAGTATTTAGTACTGGAAGCAGTGTTTTTCAATTTGGAGCTGCGTCTACTACTTCAGATTCTAATAAAGAACCAGAAAAGTCAACCTTCGCTCCGGTCAGTGTACCTTCATTTGGTGCTCCAGTTTTGCCTGCAAGTAGTGGGGTTGCTTCTTCTACTCAGAGTACACCTGTTTCGCCGTTCAGTTCATCATCTACATCATTTGGTTTGACAGGGAATACGGGTTTGGCCTCCGGTAATTCTTTGGTTGGTTCTTCAGCTCCCGCGTCTAATTTGTTCGCTTCAGGCGCCACTTTTGGTTTTGGTTCCTCCAGTTCTGCTAATAATTCAGTCAGCTCCGGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGGCATCCTCCGGGCCATCATTTTCTTCTGGATTCGGCTCAACTCCAACGGGAGGATTTTCCTTTGGCCTTGCATCTTCTTCCGCTGCTTCTAGTAGTGCCCCTATGCTCTTTGGATCATCGTCAACCGGTGCAGCATCAACAACTTCGATGTTCTCATTTACTTCAGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTTGGTAATTCTAATCATGGCTTCACCTTTGGTTCAACACCTCCTGCAAATAATGATCATGCAAATATGGAGGACAGCATGGCTGAGGATACCGTCCAGACAGTTGCATTGCCAACGCCTATGCCGAGTTTTGGGCAACAACCCCTTACGCCACCTCCATCATCAGGGTTCATGTTTGGTTCAACTGCCCCTTCTCCACTAGGAGCAAATCCTTTCCAGTTTGGTGGTAGCCAACAAAATGTATCTACCCCACAAAATCCCAATCCATTTCAGGCTTCGGGTAGCTTAGACTTCAATGCCAGTGCTGGCGGAAGCTTCTCACTAGGTGCTGGTGGTGGCGACAAATCGAACCGAAAATTCGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
Coding sequence (CDS)
ATGGCGACAGAGCGTGAGGAGGTTCGTTATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTCTCAGAAGGGCGCATACGACGCCGTATGATCGGCCGCCGGCTGCTCTGAGAAACTCTGCTGGAAAAGGATGGCTCTCTAAGCTTGTCGATCCGGCGCAGAAGCTCATCACCTCCAGTGCGCACAGGCTGTTTTCTAGCGTGTTTCGTAAACGCCTCCCCCCTCCGCCGCCGTCATTGCCAATTTATCGAGAGGCAAATGATGAGATGGAAATTAAGAACCAGGAAGAAGTTGCAGCTGATTCTCCTGGAACTCAAGAAGGGACTAATAATGATTTTGTTCCAAGCATCAATTCTAATAACATACATGGGGTGAGTGACCTCGAGAAAATTTTGAAGGAGAAGACCTTTACAAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGATGTTCCAAGTGGGGTTGAATCGAGAAAATTTGAAAAGGTCCCTTCAACACCTGTTATCAGTTATGACATACAGGAAGGGTCTCCAAAATTTCCAGCTCAAGAGAGAGTTAGGCCTCATATGGTTCCAAATCATGTCGTGAATGCAAATGTCCCTGATGAGGATGTTGCTTCACCTGCAGAGATTGCAAAGGCGTTCATGGGTAGCAGGCCTCCAAAAGCAACTCCGTTGAGTATGGTGGCCCATAGTCAAAAGTTTGGGGATACTTTTGCTTTAGGCAATCCCTCAAAGTCCTCTACTTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGAAAATGATTTTGTCACCCCAAGATCTCGTGGCAGATCTGCTCTATACAGTATGGCTCGAATGCCATATTCAAGAGTTCGTGCAACCCCCAGCATAAAGAATAGTGTAGCAACAACAGATTCTTATAGGGCCTCTGTGACCTCATCATCTCAGTCAGCATGGGAGCAAGGGAGACTTTTGGAGTCTAATCAAGGGGCTTTAAAACGCCGAAGCTCAGTTTTAGATGATGAAATAGGATCTGTTGGTCCTATTCGAAGAATTCGCCATAAATCCAATCTCCTTTTCCCAAAAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGTTAGTGGAATTGGTTCCGAGACTTATCAGCATTTGCAGTCCACAAAAGTTCATCCATTTTCGTCCACTGCTGGGAAGGCACCTTATTCAAGTGAGACCAAGCGTAATTTGTCCAAAATGTCTGCAGAGTCTGAAAATGATAGGACACCTAGTTCAAGTTTCCCTCAAATTCCCCTCAGGTCTAGTGAGATGGCCTTAAAAATCTTAGAGCAGCTTGATAAATTGACCCCTCCAAAGGAAAAATCTTCGGAACTAAAGTTGCATAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGAAGTCTGGAAGATGTGGATTCGGCTAAGTATTTGGAAAATGTTGAAGACATTCGGTCTAATGATGGCCGTGATCTTACTTCGAAAAAGAACGATAAGTTTGAGGATAGTAGTTTGTTAAAATCTGAAGTACCCAGTGATAAATCTATTTCTACAGGTGGTGGCGTAGGTTCTTCAGTGCCTTCAAAGGATACTGTATCTAGTTCTGGTCTGCAGGTTTCATTTGTTGGCCCATCCTCACTAACGAAATGTGCGTTCCAGATGAGTGTACAAGAGGATTTTGTGGATATGGATGATGAAGAATATTCTAATGGGCCAGTTGCTGCTAAATCGTTTGAGAGGCGAGAAAAAGTTGATGACTCATTAGTGGCGGTGGGTAAGCCGAGTGATAATGAAGCCATCATAGTCGATAAACCTCAGGCTTCAATTCAGGCTAAACCCTCCACTGTCTCTGAAATGAAGAAAATAAATGACCAAGCAAAATCTGATATTCCTGTGACTACTGAAAAGAGTTCCATTTTTTCCTTTCCAACAGCATCTCCATCTAGCACTACAGCCACTGTGATAGAACCGGAATCAACCACGAGACCTGAAAAAATTGCTTTCTCTGAGGTACCAAAAGCAGCTGTTGCCCCTATATTTGGCTTTGGAGAAAAGTTTCCATCACAGAAGGATCCGGTTTTTTCTTCTCCCACCTTTACGTTTGGAAACAAGGTTACCACCTCAACAAATGAACAAAATGCTGTTCCTGCGGTAACTTCTGAAGGCAATGTTGCACCTACTTTACAAGCTTCTGCTCCTACCACATTTAAATTTGGAGATAAAGCTACATTTCCTATTCCAGCAAGTACCACCACCGAAAATGGAAATAGTGAGGCCGGGTCTCCGTTTAAGTTTGCATCTTCTTTAGTTAACGAAAAAGAAGGTGCTAAAGCAGGCAGTGCTTCAGTTTTTAAATCTGAGAGTTCTAGCAGCAGCATCTTGTCATTTGGAGTTCCTAAAGAGTTGATGTCGGAGAAAGCTGGCGATAAGAAGAGTTCAAGTGCCGGACTCTCTGTTGGCACTTCTGGGAATTTGCTTTTGTCATCTGTCTCATCAACACCAACTCCCAGTTTGTTTTCTTTTAGCTCCCCTACCACTAATTCAAATCTTATTAACGGATCTCTTGGTTCCACCCCATCTACTTTTCCCTCCCCATCCAACACCTTTCCTAGTAATATAACAAATCAAAATTCATCCATCAAACCGTCTCTCAATGCTGCCACTAGCAATAGCGAACCCGTCACCACTACTAGTCTTTCTACGTCTTCTCCTATGCCATCTTTTTCAGCTGCGCCAATTTTCAAGTTTGGGAGCTCCAGTGTTCCTTCAACTTCAGCACCGAATGGAGCTGGATCAGTAGAAACCAAGACCAAGCAAGAGACGACACCCTTTGGCAATGTAAGTGGCATTTCTCCGAGCGACACATCTGCTGCTAAAGTATTTAGTACTGGAAGCAGTGTTTTTCAATTTGGAGCTGCGTCTACTACTTCAGATTCTAATAAAGAACCAGAAAAGTCAACCTTCGCTCCGGTCAGTGTACCTTCATTTGGTGCTCCAGTTTTGCCTGCAAGTAGTGGGGTTGCTTCTTCTACTCAGAGTACACCTGTTTCGCCGTTCAGTTCATCATCTACATCATTTGGTTTGACAGGGAATACGGGTTTGGCCTCCGGTAATTCTTTGGTTGGTTCTTCAGCTCCCGCGTCTAATTTGTTCGCTTCAGGCGCCACTTTTGGTTTTGGTTCCTCCAGTTCTGCTAATAATTCAGTCAGCTCCGGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGGCATCCTCCGGGCCATCATTTTCTTCTGGATTCGGCTCAACTCCAACGGGAGGATTTTCCTTTGGCCTTGCATCTTCTTCCGCTGCTTCTAGTAGTGCCCCTATGCTCTTTGGATCATCGTCAACCGGTGCAGCATCAACAACTTCGATGTTCTCATTTACTTCAGCTGCAACTGCTGCGTCGTCACAGCCTGCTTTTGGTAATTCTAATCATGGCTTCACCTTTGGTTCAACACCTCCTGCAAATAATGATCATGCAAATATGGAGGACAGCATGGCTGAGGATACCGTCCAGACAGTTGCATTGCCAACGCCTATGCCGAGTTTTGGGCAACAACCCCTTACGCCACCTCCATCATCAGGGTTCATGTTTGGTTCAACTGCCCCTTCTCCACTAGGAGCAAATCCTTTCCAGTTTGGTGGTAGCCAACAAAATGTATCTACCCCACAAAATCCCAATCCATTTCAGGCTTCGGGTAGCTTAGACTTCAATGCCAGTGCTGGCGGAAGCTTCTCACTAGGTGCTGGTGGTGGCGACAAATCGAACCGAAAATTCGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
Protein sequence
MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITSSAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINSNNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQEGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQKFGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSIKNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAESENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGGVGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERREKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFSFPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Homology
BLAST of CmaCh15G005350 vs. ExPASy Swiss-Prot
Match:
Q9CAF4 (Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 SV=1)
HSP 1 Score: 384.0 bits (985), Expect = 6.6e-105
Identity = 475/1396 (34.03%), Postives = 655/1396 (46.92%), Query Frame = 0
Query: 13 GRGGKFQKRPLRRAHTTPYDRPPAALRNSA-------GKGWLSKLVDPAQKLITSSAHRL 72
G GGKF+K RR+ TPYDRP ++RN+ G GWLSKLVDPAQ+LIT SA RL
Sbjct: 18 GTGGKFRKPTARRSQKTPYDRPTTSVRNAGLGGGDVRGGGWLSKLVDPAQRLITYSAQRL 77
Query: 73 FSSVFRKRL---------PPPPPSLPIYREANDEMEIKNQEEVAADSPGT----QEGTNN 132
F S+ RKRL P LP R N E ++ ++E+V+ S E TN
Sbjct: 78 FGSLSRKRLGSGETPLQSPEQQKQLP-ERGVNQETKVGHKEDVSNLSMKNGLIRMEDTNA 137
Query: 133 DFVPSINSNNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPST 192
P + G +DLEKIL+ KTFTR E+DRLT LL+S+ AD + E ++ E
Sbjct: 138 SVDPPKD-----GFTDLEKILQGKTFTRSEVDRLTTLLRSKAADSSTMNEEQRNE----- 197
Query: 193 PVISYDIQEGSPKFPAQERVRPH--------MVPNHVVNANVPDEDVASPAEIAKAFMGS 252
+ ++ P+ ER R H +V + DE +ASPA++AKA+MGS
Sbjct: 198 --VGMVVRHP----PSHERDRTHPDNGSMNTLVSTPPGSLRTLDECIASPAQLAKAYMGS 257
Query: 253 RPPKATPLSMVAHSQKFGDTFALGN----PSKSSTLSLVPRSPGNFDVENDFVTPRSRGR 312
RP + TP + Q + N P KS T+SLV + G +EN FVTPRSRGR
Sbjct: 258 RPSEVTPSMLGLRGQAGREDSVFLNRTPFPQKSPTMSLVTKPSGQRPLENGFVTPRSRGR 317
Query: 313 SALYSMARMPYSRVRATPSIKNSVATTDSYRASVTSSSQSAWEQGRLLESNQG---ALKR 372
SA+YSMAR PYSR +++ I S+ +S S WE+ S QG LKR
Sbjct: 318 SAVYSMARTPYSRPQSSVKI-----------GSLFQASPSKWEESLPSGSRQGFQSGLKR 377
Query: 373 RSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPF 432
RSSVLD++IGSVGP+RRIR KSN L + L+LP S + + V G E H
Sbjct: 378 RSSVLDNDIGSVGPVRRIRQKSN-LSSRSLALPVSESPLSVRANGGEKTTH--------- 437
Query: 433 SSTAGKAPYSSETKRNLSKMSAESENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKE 492
SK SAE P SSF +P +SSEMA KIL+QLDKL +E
Sbjct: 438 ----------------TSKDSAED----IPGSSFNLVPTKSSEMASKILQQLDKLVSTRE 497
Query: 493 KSSELKLHSVRNNSPMKLSPSMLHGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKND 552
K SP KLSPSML GPAL+SL++V++ K+L N+ + ++N D + +K +
Sbjct: 498 K------------SPSKLSPSMLRGPALKSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQE 557
Query: 553 KFEDSSLLKSEVPSDKSISTGGGVGSSVPSKDTVSSSGLQVSFVGPSSL-----TKCAFQ 612
+S + S+K+ G + SKD G V +SL K +F+
Sbjct: 558 ISRESVSREVLAQSEKTGDAVDGTSKTGSSKDQ-DMRGKGVYMPLTNSLEEHPPKKRSFR 617
Query: 613 MSVQEDFVDMDDE-EYSNGPVAAKSFERREKVDDSLVAVGKPSDNEAIIVDKPQASIQAK 672
MS EDF+++DD+ ++ P + +V+ S +++ I +KP +A
Sbjct: 618 MSAHEDFLELDDDLGAASTPCEVAEKQNAFEVEKSHISMP--------IGEKPLTPSEAM 677
Query: 673 PSTVSEMKKINDQAKSDIPVTTEKSSIFSFP-TASPSSTTATVIEPESTTRPEKIAFSEV 732
PST Q S+ + TE++ +FP A S A+ + EK + S
Sbjct: 678 PSTSYISNGDASQGTSNGSLETERNKFVAFPIEAVQQSNMASEPTSKFIQGTEKSSISSG 737
Query: 733 PKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQAS 792
+ E K P P +F T N+ + A L+ +
Sbjct: 738 KPTSEEKRIPLEE----PKKPAAVFPNISFSPPATGLLNQNSGASADIK-------LEKT 797
Query: 793 APTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSLVNEKEGAKAGSASVFKSESSSS 852
+ T F + P + T N S A S A +L A A + + S S +
Sbjct: 798 SSTAFGVSEAWAKPTESKKTFSNSASGAESSTSAAPTLNGSIFSAGANAVTPPPSNGSLT 857
Query: 853 SILSF--GVPKELMSEKAGDKKSSSAGLSVGTSGNLLLSSV-SSTPTPSLFSFSSPTTNS 912
S SF + GD S+ + + + + + +S + S + +SP +++
Sbjct: 858 SSPSFPPSISNIPSDNSVGDMPSTVQSFAATHNSSSIFGKLPTSNDSNSQSTSASPLSST 917
Query: 913 NLINGSLGSTPSTFPSPSNTFPSNITNQNSSIKPSL--NAATSNSEPVTTTSLSTSSPMP 972
+ G + F +P+ + S ++ + +K + N +T + + ST
Sbjct: 918 SPF--KFGQPAAPFSAPAVSESSGQISKETEVKNATFGNTSTFKFGGMASADQSTGIVFG 977
Query: 973 SFSA----APIFKFGSSSV-------PST---SAPNGAGSVETKTKQETTPFGNVSGISP 1032
+ SA P F FGSSSV PST SAP +GS+ +TP S IS
Sbjct: 978 AKSAENKSRPGFVFGSSSVVGGSTLNPSTAAASAPESSGSLIFGVTSSSTPGTETSKISA 1037
Query: 1033 SD---TSAAKVF--------------------STGSSVFQFGAASTTSDSNKEPEKSTFA 1092
S + VF STGSSVF F A S+ S ++ + + S
Sbjct: 1038 SSAATNTGNSVFGTSSFAFTSSGSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNLF 1097
Query: 1093 PVSVPSFGAPVLPASSGVASSTQSTPVSPFSS-SSTSFGLTGNTGLASGNSLVGSSAPAS 1152
G SG +STQS P SS S+ SFGL+GN+ LAS +S G S
Sbjct: 1098 GAGNAQTG----NTGSGTTTSTQSIPFQFGSSPSAPSFGLSGNSSLASNSSPFGFSKSEP 1157
Query: 1153 NLFASGATFGFGSSSSANNSVSSGAGTSSSFF--NWQA-----SSGPSFSSGF--GSTPT 1212
+F S +T SS N+S SS + SS F +WQA +SGP FSS F STPT
Sbjct: 1158 AVFTSVST---PQLSSTNSSASSSSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT 1217
Query: 1213 GGFSFGLASSSAASSSAPMLFGSSSTGAASTTSMFSFTSAATAASSQPA----------- 1272
FSFG +S++ SS+ +FG+S+ S + +F F S QP
Sbjct: 1218 -TFSFGGSSAATVSSTTTPIFGASTNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSL 1277
Query: 1273 FGNSNHGFTFGSTPPA----NNDHANMEDSMAEDTVQTVALPTPMPSFGQQPLT-PPPSS 1298
FGNS GF FG+ NN +MEDSMAEDT Q P FGQ ++ P P+
Sbjct: 1278 FGNSTPGFAFGAPNNGNGINNNQQVSMEDSMAEDTDQANRASMVAPMFGQAAVSMPQPNF 1309
BLAST of CmaCh15G005350 vs. ExPASy TrEMBL
Match:
A0A6J1K059 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)
HSP 1 Score: 2374.4 bits (6152), Expect = 0.0e+00
Identity = 1297/1297 (100.00%), Postives = 1297/1297 (100.00%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
Query: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS
Sbjct: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
Query: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of CmaCh15G005350 vs. ExPASy TrEMBL
Match:
A0A6J1JQT4 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111488998 PE=4 SV=1)
HSP 1 Score: 2368.6 bits (6137), Expect = 0.0e+00
Identity = 1297/1301 (99.69%), Postives = 1297/1301 (99.69%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSS----SILSFGVPKELMSEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSS SILSFGVPKELMSEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSILSFGVPKELMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
Query: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP
Sbjct: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
Query: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of CmaCh15G005350 vs. ExPASy TrEMBL
Match:
A0A6J1FKS9 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 2291.2 bits (5936), Expect = 0.0e+00
Identity = 1255/1297 (96.76%), Postives = 1267/1297 (97.69%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRR+HTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDEMEIKNQEEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKVHPFSS AGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKK DKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTA VIEPESTTRPEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE MSEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPS+SAP+G GSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLF SGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS+PMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPMLFG 1140
Query: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SS+TGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
TVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNPFQAS
Sbjct: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1260
Query: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of CmaCh15G005350 vs. ExPASy TrEMBL
Match:
A0A6J1FF52 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 2285.8 bits (5922), Expect = 0.0e+00
Identity = 1255/1301 (96.46%), Postives = 1267/1301 (97.39%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRR+HTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDEMEIKNQEEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKVHPFSS AGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKK DKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTA VIEPESTTRPEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSI----LSFGVPKELMSEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE MSEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPS+SAP+G GSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLF SGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS+P
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSP 1140
Query: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSS+TGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
DTVQTVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNP
Sbjct: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1260
Query: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of CmaCh15G005350 vs. ExPASy TrEMBL
Match:
A0A1S3C4Z3 (nuclear pore complex protein NUP1-like OS=Cucumis melo OX=3656 GN=LOC103496528 PE=4 SV=1)
HSP 1 Score: 1768.8 bits (4580), Expect = 0.0e+00
Identity = 1031/1312 (78.58%), Postives = 1117/1312 (85.14%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEV+YEGGRGGKFQKRP+RR+HTTPYDRPP ALRNSA KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFS+VFRKRLPPPPPS + REAN+EME +NQEEVAAD GTQEGTN FVPSINS
Sbjct: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
+N G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVESRKFE+VPSTPV S+ +Q
Sbjct: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
Query: 181 EGSPKFP--AQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHS 240
EGSPKFP +Q+ V PHM P HVVNANV DEDVASPAEIAKA+MGSRPPKATPLSM
Sbjct: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
Query: 241 QKFGDTFALGNPSKSSTLSLVPRSPGNFD-VENDFVTPRSRGRSALYSMARMPYSRVRAT 300
GNPSKSSTLSLVPRSPGNFD VEN FVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
Query: 301 PSIKNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRH 360
PSIKNS+ATTD+YRA+ +SSSQSAWEQG LL S QGALKRR+SVLDD++GSVGPIRR R
Sbjct: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
Query: 361 KSNLLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKM 420
KSN LFP GLSLPSSSTSIP SGI SET +HLQSTKVHPFSS GK YSSET+RN SK
Sbjct: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
Query: 421 SAESENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSP 480
SAES+N TPSSSFP+IPLRSSEMA KILEQLD LTPPKEKSSELKL SVRNNSPMKLSP
Sbjct: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
Query: 481 SMLHGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSIST 540
SMLHGPALRSLE+VDSAKYLENVE I+SND D TS+KNDKFE+SS KS VP+DKSIST
Sbjct: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
Query: 541 GGGVGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSF 600
GVGSSVP+KD S SG+QVSFVGPS TKCAFQMS EDFVDMD+E +SNGPVA KSF
Sbjct: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
Query: 601 ERREKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSS 660
E REKVDDSLV+V KP + EAI V K + SI+AKPS VS M KINDQ KSD+P TTEKS
Sbjct: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
Query: 661 IFSFPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPT 720
IFSFPT S S+TA V PES+ RPEK+A E+PKAA APIFGFGEK PSQK+ + PT
Sbjct: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
Query: 721 FTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSE 780
F FG+K TT TNEQNA+P VTSE N PT AS PTTFKFGDKA+F IPA+ TENGN
Sbjct: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
Query: 781 AGSPFKFASSLVNEKEGAK-AGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGL 840
AGS FKF S LVNEKEGA GSASVFK+E+SSSSI SFGVPKE MSEKAGD KSSS GL
Sbjct: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGD-KSSSPGL 840
Query: 841 SVGTSGNLLLSSVS---STPTPSLFSFSSPTTNSNLINGSLGS-TPSTFPSPSNTFPSNI 900
GTSGNL SS S STPTPSLFSFSSP+TNSNL NGSL S TPST P+P+ TF +N+
Sbjct: 841 IFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNV 900
Query: 901 TNQNSSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPST-----SAPN 960
T+QNSSIKPS AATSNSEPVT+TS SSPMPSFSAAPIFKFGSSSVPST SAP+
Sbjct: 901 TSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPS 960
Query: 961 GAGSVETKTKQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTF 1020
G GSVE KTK ETT FGN+SG+ PSDT+A KV STGSSVFQFGAASTTSD+NK P STF
Sbjct: 961 GVGSVEAKTKPETT-FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTF 1020
Query: 1021 APVSVPSFGAPVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPAS 1080
A ++P+FGAPV +SSG+ASSTQSTP F SSSTSFGLTGNTGLASG+SL GSSAPAS
Sbjct: 1021 AQNNIPAFGAPVSFSSSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSSAPAS 1080
Query: 1081 NLFASGATFGF-GSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLA 1140
N F SGATFG SSSSANNSVSS AGTSSSFFNWQ SS PSFS+GF STP+GGFSFGL+
Sbjct: 1081 NPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLS 1140
Query: 1141 SSSAASSSAPMLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPA-NN 1200
SSS+AS+SAPM+FGSSSTG AS SMFSFTSAA+A +SQPAFGNSN+ FTFGSTPPA NN
Sbjct: 1141 SSSSASNSAPMVFGSSSTG-ASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNN 1200
Query: 1201 DHANMEDSMAEDTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQ 1260
+ A+MEDSMAEDTVQT +PMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQ
Sbjct: 1201 EQASMEDSMAEDTVQTA---SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQ 1260
Query: 1261 QNVSTPQNPNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
QNV PQNP+PFQASGSLDFNASAGGSFSLGAGGGDKSNRK+VKVKSKSRKK
Sbjct: 1261 QNV--PQNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
BLAST of CmaCh15G005350 vs. NCBI nr
Match:
XP_022992758.1 (nuclear pore complex protein NUP1-like isoform X2 [Cucurbita maxima])
HSP 1 Score: 2374.4 bits (6152), Expect = 0.0e+00
Identity = 1297/1297 (100.00%), Postives = 1297/1297 (100.00%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
Query: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS
Sbjct: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
Query: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of CmaCh15G005350 vs. NCBI nr
Match:
XP_022992757.1 (nuclear pore complex protein NUP1-like isoform X1 [Cucurbita maxima])
HSP 1 Score: 2368.6 bits (6137), Expect = 0.0e+00
Identity = 1297/1301 (99.69%), Postives = 1297/1301 (99.69%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSS----SILSFGVPKELMSEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSS SILSFGVPKELMSEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSILSFGVPKELMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
Query: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP
Sbjct: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
Query: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of CmaCh15G005350 vs. NCBI nr
Match:
XP_022938795.1 (nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata])
HSP 1 Score: 2291.2 bits (5936), Expect = 0.0e+00
Identity = 1255/1297 (96.76%), Postives = 1267/1297 (97.69%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRR+HTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDEMEIKNQEEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKVHPFSS AGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKK DKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTA VIEPESTTRPEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE MSEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPS+SAP+G GSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLF SGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS+PMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSPMLFG 1140
Query: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SS+TGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
TVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNPFQAS
Sbjct: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1260
Query: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of CmaCh15G005350 vs. NCBI nr
Match:
XP_022938794.1 (nuclear pore complex protein NUP1-like isoform X1 [Cucurbita moschata])
HSP 1 Score: 2285.8 bits (5922), Expect = 0.0e+00
Identity = 1255/1301 (96.46%), Postives = 1267/1301 (97.39%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRPLRR+HTTPYDRPP ALRNS GKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDEMEIKNQEEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HV+NANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKVHPFSS AGKAPYSSETKRNLSKMSAE
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKMSAE 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKK DKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPV+AKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTA VIEPESTTRPEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSI----LSFGVPKELMSEKAGDKKSSSAGL 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE MSEKAGDKKSSSAGL
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSSSAGL 840
Query: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN
Sbjct: 841 SVGTSGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQN 900
Query: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKT 960
SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPS+SAP+G GSVETKT
Sbjct: 901 SSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKT 960
Query: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFG 1020
KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFG
Sbjct: 961 KQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFG 1020
Query: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATF 1080
APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLF SGATF
Sbjct: 1021 APVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFTSGATF 1080
Query: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAP 1140
GFGSSSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS+P
Sbjct: 1081 GFGSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSSSP 1140
Query: 1141 MLFGSSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAE 1200
MLFGSS+TGAASTTSMFSFTSAATAA SQPAFG SNHGFTFGSTPPANNDHANMEDSMAE
Sbjct: 1141 MLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPANNDHANMEDSMAE 1200
Query: 1201 DTVQTVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNP 1260
DTVQTVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNP
Sbjct: 1201 DTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNP 1260
Query: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 FQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of CmaCh15G005350 vs. NCBI nr
Match:
KAG7016358.1 (Nuclear pore complex protein NUP1 [Cucurbita argyrosperma subsp. argyrosperma])
HSP 1 Score: 2284.6 bits (5919), Expect = 0.0e+00
Identity = 1254/1297 (96.68%), Postives = 1268/1297 (97.76%), Query Frame = 0
Query: 1 MATEREEVRYEGGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITS 60
MATEREEVRYEGGRGGKFQKRPLRR+HTTPYDRPP ALRNSAGKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPLRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSSVFRKRLPPPPPSLPIYREANDEMEIKNQEEVAADSPGTQEGTNNDFVPSINS 120
SAHRLFSSVFRKRLPPPPPSLPI REANDE EIKN EEVAAD PGTQEGTNNDFVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDETEIKNLEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPSTPVISYDIQ 180
NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE V STPVISYDIQ
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPAQERVRPHMVPNHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
EGSPKFPAQE VRPHMVP HVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK
Sbjct: 181 EGSPKFPAQEGVRPHMVPTHVVNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHSQK 240
Query: 241 FGDTFALGNPSKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
FGDTFALGNP+KSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI
Sbjct: 241 FGDTFALGNPTKSSTLSLVPRSPGNFDVENDFVTPRSRGRSALYSMARMPYSRVRATPSI 300
Query: 301 KNSVATTDSYRASVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
KNSVATTDSYRA+VTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN
Sbjct: 301 KNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSN 360
Query: 361 LLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAE 420
LLFPKGLSLPSSSTSIPVSGIGSET QHLQSTKV+PFSSTAGKAPYSSETKRNL KMSA
Sbjct: 361 LLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVYPFSSTAGKAPYSSETKRNLFKMSAV 420
Query: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML
Sbjct: 421 SENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSPSML 480
Query: 481 HGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKNDKFEDSSLLKSEVPSDKSISTGGG 540
HGPALRSLEDVDSAKYLENVEDI SNDGRDLTSKKNDKFEDSSLLKS+VPSDKSISTGGG
Sbjct: 481 HGPALRSLEDVDSAKYLENVEDIWSNDGRDLTSKKNDKFEDSSLLKSKVPSDKSISTGGG 540
Query: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR
Sbjct: 541 VGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVAAKSFERR 600
Query: 601 EKVDDSLVAVGKPSDNEAIIVDKPQASIQAKPSTVSEMKKINDQAKSDIPVTTEKSSIFS 660
EKVDDSLVAVGKPSD EAI VDKPQASIQAKPS VSEMKKINDQAKSD+PVTTEKSSIFS
Sbjct: 601 EKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSSIFS 660
Query: 661 FPTASPSSTTATVIEPESTTRPEKIAFSEVPKAAVAPIFGFGEKFPSQKDPVFSSPTFTF 720
FPTASPSSTTA +IEPESTTRPEKIA SEVPKAA APIFGFGEK PSQKDPVFSSPTFTF
Sbjct: 661 FPTASPSSTTANMIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPTFTF 720
Query: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTTTENGNSEAGS 780
GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPAST TENGNSEAGS
Sbjct: 721 GNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSEAGS 780
Query: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSILSFGVPKELMSEKAGDKKSSSAGLSVGT 840
PFKFASSLVNEKEGAKAGSASVFKSESSSSS LSFGVPKE +SEKAGDKKSSSAGLSVGT
Sbjct: 781 PFKFASSLVNEKEGAKAGSASVFKSESSSSSTLSFGVPKESISEKAGDKKSSSAGLSVGT 840
Query: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK
Sbjct: 841 SGNLLLSSVSSTPTPSLFSFSSPTTNSNLINGSLGSTPSTFPSPSNTFPSNITNQNSSIK 900
Query: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSTSAPNGAGSVETKTKQET 960
PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPS+SAP+G GSVETKTKQET
Sbjct: 901 PSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSSSAPSGVGSVETKTKQET 960
Query: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKEPEKSTFAPVSVPSFGAPVL 1020
TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNK+PEKSTFAPVSVPSFGAPVL
Sbjct: 961 TPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTFAPVSVPSFGAPVL 1020
Query: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPASNLFASGATFGFGS 1080
PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGN+LVGSSAPASNLF SGATFGFGS
Sbjct: 1021 PASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNTLVGSSAPASNLFTSGATFGFGS 1080
Query: 1081 SSSANNSVSSGAGTSSSFFNWQASSGPSFSSGFGSTPTGGFSFGLASSSAASSSAPMLFG 1140
SSSANNSVSSGAGTSSSFFNWQASS PSFSSGFGSTPTGGFSFGLASSSAASSS PMLFG
Sbjct: 1081 SSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLASSSAASSS-PMLFG 1140
Query: 1141 SSSTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
SS+TGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ
Sbjct: 1141 SSTTGAASTTSMFSFTSAATAASSQPAFGNSNHGFTFGSTPPANNDHANMEDSMAEDTVQ 1200
Query: 1201 TVALPTPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVSTPQNPNPFQAS 1260
TVA PTPMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQQNV TPQNPNPFQAS
Sbjct: 1201 TVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQQNVPTPQNPNPFQAS 1260
Query: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1298
GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK
Sbjct: 1261 GSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1296
BLAST of CmaCh15G005350 vs. TAIR 10
Match:
AT3G10650.1 (BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.1); Has 61042 Blast hits to 31782 proteins in 2093 species: Archae - 202; Bacteria - 16480; Metazoa - 16017; Fungi - 12552; Plants - 1653; Viruses - 629; Other Eukaryotes - 13509 (source: NCBI BLink). )
HSP 1 Score: 384.0 bits (985), Expect = 4.7e-106
Identity = 475/1396 (34.03%), Postives = 655/1396 (46.92%), Query Frame = 0
Query: 13 GRGGKFQKRPLRRAHTTPYDRPPAALRNSA-------GKGWLSKLVDPAQKLITSSAHRL 72
G GGKF+K RR+ TPYDRP ++RN+ G GWLSKLVDPAQ+LIT SA RL
Sbjct: 18 GTGGKFRKPTARRSQKTPYDRPTTSVRNAGLGGGDVRGGGWLSKLVDPAQRLITYSAQRL 77
Query: 73 FSSVFRKRL---------PPPPPSLPIYREANDEMEIKNQEEVAADSPGT----QEGTNN 132
F S+ RKRL P LP R N E ++ ++E+V+ S E TN
Sbjct: 78 FGSLSRKRLGSGETPLQSPEQQKQLP-ERGVNQETKVGHKEDVSNLSMKNGLIRMEDTNA 137
Query: 133 DFVPSINSNNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEKVPST 192
P + G +DLEKIL+ KTFTR E+DRLT LL+S+ AD + E ++ E
Sbjct: 138 SVDPPKD-----GFTDLEKILQGKTFTRSEVDRLTTLLRSKAADSSTMNEEQRNE----- 197
Query: 193 PVISYDIQEGSPKFPAQERVRPH--------MVPNHVVNANVPDEDVASPAEIAKAFMGS 252
+ ++ P+ ER R H +V + DE +ASPA++AKA+MGS
Sbjct: 198 --VGMVVRHP----PSHERDRTHPDNGSMNTLVSTPPGSLRTLDECIASPAQLAKAYMGS 257
Query: 253 RPPKATPLSMVAHSQKFGDTFALGN----PSKSSTLSLVPRSPGNFDVENDFVTPRSRGR 312
RP + TP + Q + N P KS T+SLV + G +EN FVTPRSRGR
Sbjct: 258 RPSEVTPSMLGLRGQAGREDSVFLNRTPFPQKSPTMSLVTKPSGQRPLENGFVTPRSRGR 317
Query: 313 SALYSMARMPYSRVRATPSIKNSVATTDSYRASVTSSSQSAWEQGRLLESNQG---ALKR 372
SA+YSMAR PYSR +++ I S+ +S S WE+ S QG LKR
Sbjct: 318 SAVYSMARTPYSRPQSSVKI-----------GSLFQASPSKWEESLPSGSRQGFQSGLKR 377
Query: 373 RSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSGIGSETYQHLQSTKVHPF 432
RSSVLD++IGSVGP+RRIR KSN L + L+LP S + + V G E H
Sbjct: 378 RSSVLDNDIGSVGPVRRIRQKSN-LSSRSLALPVSESPLSVRANGGEKTTH--------- 437
Query: 433 SSTAGKAPYSSETKRNLSKMSAESENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKE 492
SK SAE P SSF +P +SSEMA KIL+QLDKL +E
Sbjct: 438 ----------------TSKDSAED----IPGSSFNLVPTKSSEMASKILQQLDKLVSTRE 497
Query: 493 KSSELKLHSVRNNSPMKLSPSMLHGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKND 552
K SP KLSPSML GPAL+SL++V++ K+L N+ + ++N D + +K +
Sbjct: 498 K------------SPSKLSPSMLRGPALKSLQNVEAPKFLGNLPEKKAN-SPDSSYQKQE 557
Query: 553 KFEDSSLLKSEVPSDKSISTGGGVGSSVPSKDTVSSSGLQVSFVGPSSL-----TKCAFQ 612
+S + S+K+ G + SKD G V +SL K +F+
Sbjct: 558 ISRESVSREVLAQSEKTGDAVDGTSKTGSSKDQ-DMRGKGVYMPLTNSLEEHPPKKRSFR 617
Query: 613 MSVQEDFVDMDDE-EYSNGPVAAKSFERREKVDDSLVAVGKPSDNEAIIVDKPQASIQAK 672
MS EDF+++DD+ ++ P + +V+ S +++ I +KP +A
Sbjct: 618 MSAHEDFLELDDDLGAASTPCEVAEKQNAFEVEKSHISMP--------IGEKPLTPSEAM 677
Query: 673 PSTVSEMKKINDQAKSDIPVTTEKSSIFSFP-TASPSSTTATVIEPESTTRPEKIAFSEV 732
PST Q S+ + TE++ +FP A S A+ + EK + S
Sbjct: 678 PSTSYISNGDASQGTSNGSLETERNKFVAFPIEAVQQSNMASEPTSKFIQGTEKSSISSG 737
Query: 733 PKAAVAPIFGFGEKFPSQKDPVFSSPTFTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQAS 792
+ E K P P +F T N+ + A L+ +
Sbjct: 738 KPTSEEKRIPLEE----PKKPAAVFPNISFSPPATGLLNQNSGASADIK-------LEKT 797
Query: 793 APTTFKFGDKATFPIPASTTTENGNSEAGSPFKFASSLVNEKEGAKAGSASVFKSESSSS 852
+ T F + P + T N S A S A +L A A + + S S +
Sbjct: 798 SSTAFGVSEAWAKPTESKKTFSNSASGAESSTSAAPTLNGSIFSAGANAVTPPPSNGSLT 857
Query: 853 SILSF--GVPKELMSEKAGDKKSSSAGLSVGTSGNLLLSSV-SSTPTPSLFSFSSPTTNS 912
S SF + GD S+ + + + + + +S + S + +SP +++
Sbjct: 858 SSPSFPPSISNIPSDNSVGDMPSTVQSFAATHNSSSIFGKLPTSNDSNSQSTSASPLSST 917
Query: 913 NLINGSLGSTPSTFPSPSNTFPSNITNQNSSIKPSL--NAATSNSEPVTTTSLSTSSPMP 972
+ G + F +P+ + S ++ + +K + N +T + + ST
Sbjct: 918 SPF--KFGQPAAPFSAPAVSESSGQISKETEVKNATFGNTSTFKFGGMASADQSTGIVFG 977
Query: 973 SFSA----APIFKFGSSSV-------PST---SAPNGAGSVETKTKQETTPFGNVSGISP 1032
+ SA P F FGSSSV PST SAP +GS+ +TP S IS
Sbjct: 978 AKSAENKSRPGFVFGSSSVVGGSTLNPSTAAASAPESSGSLIFGVTSSSTPGTETSKISA 1037
Query: 1033 SD---TSAAKVF--------------------STGSSVFQFGAASTTSDSNKEPEKSTFA 1092
S + VF STGSSVF F A S+ S ++ + + S
Sbjct: 1038 SSAATNTGNSVFGTSSFAFTSSGSSMVGGVSASTGSSVFGFNAVSSASATSSQSQASNLF 1097
Query: 1093 PVSVPSFGAPVLPASSGVASSTQSTPVSPFSS-SSTSFGLTGNTGLASGNSLVGSSAPAS 1152
G SG +STQS P SS S+ SFGL+GN+ LAS +S G S
Sbjct: 1098 GAGNAQTG----NTGSGTTTSTQSIPFQFGSSPSAPSFGLSGNSSLASNSSPFGFSKSEP 1157
Query: 1153 NLFASGATFGFGSSSSANNSVSSGAGTSSSFF--NWQA-----SSGPSFSSGF--GSTPT 1212
+F S +T SS N+S SS + SS F +WQA +SGP FSS F STPT
Sbjct: 1158 AVFTSVST---PQLSSTNSSASSSSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT 1217
Query: 1213 GGFSFGLASSSAASSSAPMLFGSSSTGAASTTSMFSFTSAATAASSQPA----------- 1272
FSFG +S++ SS+ +FG+S+ S + +F F S QP
Sbjct: 1218 -TFSFGGSSAATVSSTTTPIFGASTNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSL 1277
Query: 1273 FGNSNHGFTFGSTPPA----NNDHANMEDSMAEDTVQTVALPTPMPSFGQQPLT-PPPSS 1298
FGNS GF FG+ NN +MEDSMAEDT Q P FGQ ++ P P+
Sbjct: 1278 FGNSTPGFAFGAPNNGNGINNNQQVSMEDSMAEDTDQANRASMVAPMFGQAAVSMPQPNF 1309
BLAST of CmaCh15G005350 vs. TAIR 10
Match:
AT5G20200.1 (nucleoporin-related )
HSP 1 Score: 90.9 bits (224), Expect = 8.2e-18
Identity = 147/581 (25.30%), Postives = 243/581 (41.82%), Query Frame = 0
Query: 12 GGRGGKFQKRPLRRAHTTPYDRPPAALRNSAGKGWLSKLVDPAQKLITSSAHRLFSSVFR 71
GG GGK +++ RR TPY RP + W+S++VDPA ++I+ A R+ F
Sbjct: 22 GGVGGKLKRQSARRHAATPYSRP--TQNQVQRRPWISRIVDPAYRIISGGATRILPYFFS 81
Query: 72 KRLPPPPPSLPIYREANDEME--------------IKNQEEVAADSPGTQEGTNN----D 131
P + P + + E I N+ E A+ G GT N +
Sbjct: 82 NAASAPALAAPPEDQNQHQGELQNNPQDNDPSVTPISNKPEPASIEVGGPSGTANVNEGN 141
Query: 132 FVPSINS------NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFE 191
F S N+ +S+LE++++ KTF++ EIDRL E++ SR D+P +
Sbjct: 142 FSISAQRRGKAALNDDVAISELERLMEGKTFSQAEIDRLIEMISSRAIDLPDVKRDERNL 201
Query: 192 KVPSTPVISYDIQEGSPK-----FPAQERV-----------RPHMVPNHVV--NANVPDE 251
++P ++EG+ K A+E + P + ++ + DE
Sbjct: 202 EIP--------LREGAKKNMSLFDKAKEPIGGKDANSEIWATPTPLAKSIILDGDKIRDE 261
Query: 252 DVASPAEIAKAFMGSRPPKATPLSMVAHSQK--FGDTFALGNPSKSSTLSLVPRS-PG-N 311
SPAE+AKA+MG + ++ VA ++K + +G S +S S PG
Sbjct: 262 VGLSPAELAKAYMGGQTSSSSSQGFVARNEKDCLDRSMLVGKSSLASPSSKPSACWPGIK 321
Query: 312 FDVENDFVTPRSRGRS-ALYSMARMPYSR-VRATPSIKNSVATTDS--YRASVTSSSQSA 371
++ F TP+SR S L + R PYSR + + K DS + +++ S SQS
Sbjct: 322 SSEQSGFATPQSRRESYGLQNFPRTPYSRTILSNSKSKLMQLQNDSSKHLSNLQSPSQSV 381
Query: 372 WEQ-GRLLESNQGALKRRSSVLDDEIGSVGPIRRIRHKSNLLFPKGLSLPSSSTSIPVSG 431
+ G+L + G G GP RR R + S PS
Sbjct: 382 ERRYGQLSKGRDG-------------GLFGPSRRTRQSATPSMVSPYSRPSR-------- 441
Query: 432 IGSETYQHLQSTKVHPFSSTAGKAPYSSETKRNLSKMSAESENDRTPSSSFPQIPLRSSE 491
G+ +++ K SS AG++ Y S ++ E+E +P SS+
Sbjct: 442 -GASRFENSAIMK----SSEAGESSYLSRSQITTYGKHKEAEVGTL------TVPTHSSQ 501
Query: 492 MALKILEQLDKL---TPPKEKSSELKLHSVRNNSPMKLSPSMLHGPALRSLEDVDSAKYL 539
+A IL+ L++ + PK K++ELKL + P + +++ SAK
Sbjct: 502 IARTILDHLERTQSQSTPKNKTAELKL-ATSWRHPQSSKTVEKSSSDVTNVKKDGSAKLH 547
The following BLAST results are available for this feature:
Match Name | E-value | Identity | Description | |
Q9CAF4 | 6.6e-105 | 34.03 | Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 S... | [more] |
Match Name | E-value | Identity | Description | |
A0A6J1K059 | 0.0e+00 | 100.00 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita maxima OX=3661 GN... | [more] |
A0A6J1JQT4 | 0.0e+00 | 99.69 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita maxima OX=3661 GN... | [more] |
A0A6J1FKS9 | 0.0e+00 | 96.76 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A6J1FF52 | 0.0e+00 | 96.46 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A1S3C4Z3 | 0.0e+00 | 78.58 | nuclear pore complex protein NUP1-like OS=Cucumis melo OX=3656 GN=LOC103496528 P... | [more] |
Match Name | E-value | Identity | Description | |
XP_022992758.1 | 0.0e+00 | 100.00 | nuclear pore complex protein NUP1-like isoform X2 [Cucurbita maxima] | [more] |
XP_022992757.1 | 0.0e+00 | 99.69 | nuclear pore complex protein NUP1-like isoform X1 [Cucurbita maxima] | [more] |
XP_022938795.1 | 0.0e+00 | 96.76 | nuclear pore complex protein NUP1-like isoform X2 [Cucurbita moschata] | [more] |
XP_022938794.1 | 0.0e+00 | 96.46 | nuclear pore complex protein NUP1-like isoform X1 [Cucurbita moschata] | [more] |
KAG7016358.1 | 0.0e+00 | 96.68 | Nuclear pore complex protein NUP1 [Cucurbita argyrosperma subsp. argyrosperma] | [more] |
Match Name | E-value | Identity | Description | |
AT3G10650.1 | 4.7e-106 | 34.03 | BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.... | [more] |
AT5G20200.1 | 8.2e-18 | 25.30 | nucleoporin-related | [more] |