Sequences
The following sequences are available for this feature:
Gene sequence (with intron)
Legend: five_prime_UTRexonCDSpolypeptidethree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
TCCGAATAAAAACCCTAATTTGCTCAATACCTTACTTTTCTTTCTCCCCCTTTCAACAAATTTTCCTCTCTATTCCGCCATTGAAGAGAGAAAGCCCTCAACTCTGTGTTGTTAATGGCGACAGAGCGTGAGGAGGTTCAATATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTATTAGAAGGTCTCATACCACGCCCTATGATCGGCCGCCGACTGCTCTTAGGAACTCTGCTGCTAAAGGATGGCTTTCTAAGCTTGTCGATCCTGCGCAGAAGCTAATTACTTCCAGCGCCCATAGGCTTTTTTCTACTGTCTTTCGTAAACGCCTTCCCCCTCCGCCGCCGTCATTTTCACTTTCTCGAGGTTTTTTTTTCTTCTTCTTCTTGTTTTTAATTGCAAAAATTGTTTTTTGGGGTTTTTGTTTTACGTATCTTTTTCTGCTTGCTCGTTTAATTTTAGAGGGTGTCGCCTGAAGATATCGTTGATATTATTGTTTTAAATTTTGATTTTTTTGTTCGCGAGGGAGTTTTCATGACCGTGGGGTTTTAATCCTTGTCTTGGATGAAACTGGATGTATCATTTCGTATGGTTTTGGGTTAGTTGTAGCTCTTATTTTTTGATTTAGGGCTTCATTTATTTAAATATCATTGCTTTACGTGGTTCTGTGCTCTATGCTTTTGAAATATGTCAGAGTGGAGGTTTCCATGCCTGCTCGTCGAATTATATTGAGTTTGCCTGGAATGTTGTGTTTTTCCGTTGCTTGGATGTCATTAAGAGTATTTAAGAATTGCCACTGTAAAAAGATATTTTTTGTCTCATATATTTTAGCTTAAAGCCAAGGCCGAGGGCTATGTGAATGTTGCATTGTGATTCGTGCTACCCCTTGAACCATCTGTGTGAAACGAAACAGAAAGAGTCCTTGAAGATATTTCTAGAGCTTAGAAAAACTCAAAACTCTTGGAAAGTATTTGTTTTAGCTTCCACTTGGTCTTCTTGCATTGCGATTCATGCTACCCCTTAAACCATCTGTGTGAAACGAAACAGAAAGAGTCCTTGAAGATATTTCTAGAGCTTAGAAAACTCAAAACTCTTGGAAAGAAAATTTGTTTTAGCTTCCACTTGGTCTTCTTGTATTCACTGTGTTTCCTCAATTAGAGCCCATTAGAAGTCCTTTCCACTGTTACCCTTGAGCCCTTTTCTGTATATTAATTTTAACCAATGGATGGAAGTGTTAATCTAATAAACATAATATATCTAAAGTAAATTATGGTAATAAATTAATAATAAGCTATAACAATGCATCACCAGTTGTTTAGAAGCCAGCTTATGATAACACGTAAACAGCAGAATTCTTTTTCTTATTATGTTGGTTATTTTGTTATTTATCATTCAAAATTGTTTTGCTGAACAAGGATTCTATACAATCGTTTTTAAGATTTAAAACTGAAAATTGTTTATAAACAATTGGTTGTGCTCTCAAGCATTTTGATCTCTTATTAATTTTTTCTTTTCTATGAAAGTAACATGTAAGATTTTGAATTATATCAATGTTGAATCGTTGATAACCATTTAGGAAGCAGTGAAACACTATGCCATTATCTTATCATGTATTTTGGAGTAGATACTGTTGCGCTTGCATTGACTTTTGACTTGGGGACAGGTGCTATGATGTGTTGATACGTACTAAATAGTCACAAGATAGTGTGGCTGTGGCATAAATTTTTCATTTGATATTTAGTTTTCTTCTTAATCTTTAACCTTTTTTCTCCCATTTTATACTTCCAGAGGCTAATGAAGAGATGGAACATAGGAATCAGGAAGAAGTTGCAGCTGTAAGTGTTGTCTGTTATGGGTTTTGATTATCGATAATATTTGCATCTGCATCTTGTATTTTTGTTTTAAAATCTAATTCTGCTTTTGATTAAAAATACAACACACCATCAATGTGTTACCACCTTGGTGTGCATGCTTGTTAGGCATCATTATTTTCCTATTGCAGACATTGTGAGTATTTTTTGTTGCCTTTCCTCTTTCTTTTAACTAATCAACATTTTCTTTTCTTTCAGATTTGACGTTAACAAGTTGTTTTAAACTGTTCATTCCTTAAAAGACATGATGCCAATGTTAGCACTAGTAGCTGACATAAAGCTATTTATGTTTGCAAATGCATTAGGTTTCTCATCATTGAAGTGAAACTGCCTTAAAAAATCTGATGCAAAATCAGATGCTTTTGTGCAACTGTAGTCTTAACTTCTGTCAGCATTTTCTGAATTTTTAATTATTCTTCAGGATCCGTCTGGAACTCAAGAAGGGACTAATGTCGGTTTTGTTCCAAGCATCAATTCTAGTAACACCCAAGGGTTGAGTGACCTTGAGAAAATTTTGAAGGAGAAGACCTTTTCTAGGTAAGTACTTGAGTGTCTGTTGGTCAAGTTATTTTTAGTCACTCACCTCAATTCTATTTGAAGTTTTGCCTAGTTTTGGTTGGTTGCTTTTTTTTTTTTGTCTGTTAGTTTTTAACTCAGGGAAATGTATAACAAATTAGCACATATTGCAATTTGTAGCATGGTAAGAAGTTACGATATAGTGCGAAATGTATAAACCACAATGTTGCTACGATATACCATGTCAACTTTAACCTTTGGGACAGAAATTTGATTTCATTTTCTATATATTTATTTTAAGCAAGATAAGGATTTAATGTTTAATGTGTCAAATGCTAACCACTTCACAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGACGTTCCAAGTGGAGTTGAATCGAGGAAATTTGAACAGGTCCCTTCAACCCCTGTTACCAGTCATGGATTGCAGGAAGGATCTCCAAAATTTCCAACTCAGAGTCAGGATGGAGTTAGCCCGCATATGGCTCCAACTCATGTTGTGAATGCAAATGTAAGAATTTCTCCGTTTATGCTTTTTTGCCGTTTTGGTTTCAGTATTGGTTGATGCTTTGTGCTTATCTTCCGCTGGTTGTTCACACTGAAAACTGTACTTCATGCTTTTGATCTTATTGTCGTTTGGATAATCATTTCAGGTCCTCGATGAGGATGTTGCTTCACCTGCTGAGATTGCAAAAGCATACATGGGCAGCAGACCTCCAAAAGCAACTCCGTTGAGTATGGCAGGCAATCCTTCGAAATCCTCTACCTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGTTGAAAATGGTTTTGTCACGCCGAGATCTCGTGGTAGATCTGCCCTATACAGCATGGCTCGAGTTCCATATTCCAGAGTTCGTGCAACCCCCAGCATAAAGGTTTGTACTCTAATGAAATACATCTGTTTTATTTTTTGATTACTTTATAGCTCATGTATTTATTAGCTTTTTCCCTCTCTGGTTTGTTCCTCAGAATAGTATAGCCACAACAGATGCTTACAGGGCCACAACATCCTCATCATCTCAGTCAGCATGGGAGCAAGGGGGACTTTTGGGGTCTAAACAAGGAGTATGATTTGTGAAAATGTTCTTTTATAAAATGTTGTATTATTGAGTGAACCTATCAGATCATGTTATTTTATCTAATTATTTTTTCTGTAGGCTTTGAAACGCCGAAACTCAGTTTTAGATGATGATATGGGATCTGTTGGTCCTATCCGAAGAACTCGTCAGAAATCCAATCACCTATTCCCAACAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGCAAGTGGCATTCGTTCGGAGACTGCTCGGCATTTGCAGTCTACAAAAGTACATCCATTTTCGTCTAATGGTGGGAAGCCACTTTATTCAAGTGAGACACAGCGTAATTTCTCCAAAACGTCTGCAGAGTCCAAAAATGCTATGACACCTAGTTCAAGTTTTCCTCGAATTCCCCTCAGGTCAAGTGAGATGGCATCAAAAATATTAGAGCAGCTTGATATATTGACCCCTCCAAAGGAAAAATCTTCGGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGGAGCCTGGAAAATGTGGATTCAGCTAAGTATTTGGAAAATGTTGAAGGCATTCAGTCTAACGATGCCTGTGATCCTACTTCTCAAAAGAATGATAAGTTCGAGGAAAGTAGTCCGTCAAAATCTAATGTACCCAATGATAAATCTATTTCTACCAGTGATGGTGTAGGTTCTTCTGTTCCTACTAAGGATATCGGATCTGGTTCTGGTATGCAAGTTTCATTTGTTGGTCCTTCCGTACAAACAAAATGTGCCTTCCAGATGAGTGCACATGAGGTATGTAATTTTCTACCTTCCAGTTTATTCAATGGGTCAATCCTATCATGTTTCTATCTTTAAATTTATCCTCGTTTCCAGATTTCCCAATTAAATAGATGAAAAGAATACTAATTGGGATGGATGAGTATATTTCTCTCAGCACCCAGCATTTCCATCTTAAATTAGTAAATTACTTATCGACCATCAAATATCTTTCCATTCCCCTTGAAGTTTTTCATTCTTCATATTTTTTACATGCACCCGCACCCGAATAAGAAGGTTTCAAAGAATATCACGATAGAAGTTGTAAAAAAAGTGTATCATTATGTCTGTCTGTTACAAAGCCTCTTTGGTTTAATTTTCAGTTATCTATTTTTTTTTGCTTGGATTTTGTGGATCTTGATGTCCACTATCTATATGTTCCTTGAAAACCTTCCAAGTTGCAATAATTATGGATTGTCTCTCTTTTGTTAGGATTTTGTGGATATGGATGAAGAAGGATTTTCTAATGGACCAGTAGCTGATAAATCGTTTGAGATGCGAGAAAAAGTTGATGACTCATTAGTGTCTGTGAGTAAGCCGAAGAATACTGAAGCCATTACAGTAGTTAAATCGAAGCCTTCAATTGAGGCTAAACCATCTGTGGTATCTGTAATGAACAAAATAAATGACCAAGGAAAATCTGATGTTCCCACGACTACTGAAAAGAGTCCCATTTTTTCCTTTCCAACAACATCTTCACCTAGCAGTACAGCCAACGTGAAGGGTCCTGAATCAAGCTTGAGACCTGAAAAAGTTGCTTCACCCGAGTTACCAAAAGCAGCCACTGCCCCTATTTTTGGCTTTGGAGAAAAGTCGCCTTCACAGAAGGAAACATTGTCTCAACCCCCCACCTTTGCCTTTGGAAGCAAGGCTACCACAACGAATGAACAAAATGCTATTCCTGTTGTAACTTCAGAAGCCAACACCGAACCAACTAAACATGCTTCTACTCCTACCACCTTTAAATTTGGAGACAAAGCTTCGTTTTCTATTCCAGCAAATGCCGCTACAGAAAATGGAAATAAGAGTGCGGGGTCTCTATTTAAGTTCACATCACCTTTGGTTAACGAAAAAGAAGGTGCTAATGTTGGCGGTAGTGCTTCAGTTTTTAAAGCAGAGAATTCTAGCAGCAGGTCAGTTTGCTTGTTACCGTTGTCACTTTGAAGTTGGAGAATGTTTGCTTTGTTTGCACTTTTATCATTGTAGGGGTATGTTTCTATTATTAGATTATGTGAAATGCATGATAAATTGATTATAATCGTTGGTGTTCCAATTTGGTTTGAAGATGCTCCGTTGATTTTAATTGTTTTGAGAAAACTGGGATACCTATTCTTTAAGCTGTATACTCCTGATTCCTGAATGCTCCCACTTTACATCTTAAATTAAATTTTAGTTTGAAAGGACTTTCCATCTAATTAAGTTACTTGTGAACGGTGCTCAAGAATTCTGTTATTTTGTTTAATGTGATATATCTATCAGTTTCTTTATTATGATTTGGCCTTGACTTTTACAATTGAGGCACTTTTCCTTAAGCTTTTTGACTGTTTGTTGATTGCATTACTCCCTCTTTTGTGTTTGAGCTATTTTTAGGTTAGCGTAGGCAGTCTTCATCTAAACATGCCTAGATTTATATGAAGCTAATTGATTTAAGACAATGTTGATAAATGGAGCTGTTTTTCTTGTGATCTCTTTCTCAGCTTTAGTTTCTCTTGTAGAGTAGATACTTTGTTGGAAATAGAAACACTAGAGCATACATTTCTGTGTACCTGTATCTTTTTCTTTTACTGATTCAAGAATTTTCATTTGGTTTTTCATGTTAGGTTACGTCAACATTATCTCAGGGTTACGTGAGTGTGTGTATTAAAAAAAATTATATGCTTTCTATGGGGTGAGAAAATTGTTGTGCATCAACTTAGATATGCTTATGGCTCTGATTGGGCTTTAGGACATTTGAAATATTAAGATATCCTTTTAATTGAAATTTCCCTCGTCCATCTTCCAAGGTTGAAGGGGCAGTCTGTCTGTTTCTAGGTTTTAAAGATACTTGTGCTTTACAAAATGTATTAGTATCTGATGTTTTGGACGGTTTTAATTGCAGCATACCATCATTTGGAGTTCCAAAAGAGTCCATGTCAGAGAAAGCTGGTGATAAGAGTTCAAGTCCTGGTCTTATATTTGGTACATCTGGGAATTTGTTTTCGTCATCTGACTCAACATCAACATCAACACCAACTCCGAGTTTGTTTTCTTTTAGCTCCCCTAGCACTAATTCAAATCTCAACAACGGATCTCTTGTTTCTATTACTCCATCTACGTTGCCAACTCCAGCCACCACCTTTTCTAATAATGTAACAAGTCAGAATTCATCCATCAAACCTTCTTCCATTGCTGCCACTAGCAACAGTGAACCTGTCACTTCTACGAGTCCTCCTATGTCCTCTCCTATGCCATCCTTTTCAGCTGCACCAATTTTTAAATTTGGAAGCTCTAGTGTTCCATCTACTTCTGCTTCAGCTCTATCAGCACCAAGTGGAGTTGGATCCGTAGAAGCCAAGACCAAGCCAGAGACAACCTTCGGCAATTTAAGTGGCCTTCCTCCAAGTGACACAGCTGCCGTTAAAGTTGCTAGTACTGGAAGCAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATGCCAATAAAGGACCAGCAAATTCAACTTTTGCTCAAAACAACATTCCTGCATTTGGTGCTCCGGTTTCATTTTCTAGTAGCGGGCTTGCATCATCTACTCAGAGTACACCTGCTTTGCAATTCAGTTCATCTACGTCATTTGGTTTGACTGGGAATACGGGTTTGGCATCTGGCAGTTCTCTATTTGGTTCTTCAGCTCCAGCATCTAATCCGTTCACTTCCGGTGCTACTTTTGGGCTTGCTTCCTCCAGTTCTTCTGCTAACAATTCTGTCAGCTCCAGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGCCTTCCTCAACACCATCGTTTTCTACTGGCTTCAGCTCAACTCCAAGCGGAGGATTCTCATTTGGTCTTTCGTCATCATCTTCTGCTTCTAATAGTGCTCCTATGGTCTTTGGATCATCATCAACCGGTGCATCGCCAGCCTCTATGTTCTCATTTACTTCAGCTGCAAGTGCGACGACGTCACAACCTGCTTTTGGTAATTCTAATAATGCCTTCACTTTTGGTTCAACTCCTCCTGCTAATAATAATGAGCAAGCAAGTATGGAGGATAGCATGGCTGAAGATACCGTCCAGACAGCATCGCCTATGCCTAGTTTCGGGCAACAGCCCCTCACACCACCTCCATCGTCAGGGTTTATGTTCGGTTCAACAGCTCCATCTCCGCTAGGAGCAAATCCTTTTCAATTCGGTGGTAGCCAGCAAAATGTACCACAGAATCCCTCCCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCAGGAGGGAGCTTCTCATTAGGTGCTGGTGGCGGTGACAAATCAAACCGAAAATACGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAGTAGGAATCAAGAGAGAAGGTATTCGGTTTTCTTTTCTTTTTCTTTTTTTTTGTGTTTCTATATCCCAGTTATTTTTCATCTAGGAAAAAAAATTATACTACCATCTCCGTCACATCGATGACTGGAAAGAGGAGGGGTGGAGGGGTAGGGTATCATTTGTCACCTGGATTGTTTGATTTCGGCATGATACAGGGAAGCGTTAAAGCCAAGAATTGTTGGTTTTCGATCTTCCAGTTAAACGAACGGTTCGGTTGGCAAAATTTTTCGTGGTTTGATTGGTGGGAGCATAAGTTGAGAAATTTTGTAATAGCTAATTAGCCAAATGGAAGAACATTCTGTGTACTGTAGTTAAGAAGTAAGTGTAGTCTGTGAATGTTTTTGAGGTAACAATCATCTTCTTCTATTGTGCTATGGACTCAGTTTTCCTGTAATCTTTTATTTGTATTATAACAACAACAAAGGAAATATATGCTGTTGTCCAAGGGAGCATCATTTGTT
mRNA sequence
TCCGAATAAAAACCCTAATTTGCTCAATACCTTACTTTTCTTTCTCCCCCTTTCAACAAATTTTCCTCTCTATTCCGCCATTGAAGAGAGAAAGCCCTCAACTCTGTGTTGTTAATGGCGACAGAGCGTGAGGAGGTTCAATATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTATTAGAAGGTCTCATACCACGCCCTATGATCGGCCGCCGACTGCTCTTAGGAACTCTGCTGCTAAAGGATGGCTTTCTAAGCTTGTCGATCCTGCGCAGAAGCTAATTACTTCCAGCGCCCATAGGCTTTTTTCTACTGTCTTTCGTAAACGCCTTCCCCCTCCGCCGCCGTCATTTTCACTTTCTCGAGAGGCTAATGAAGAGATGGAACATAGGAATCAGGAAGAAGTTGCAGCTGATCCGTCTGGAACTCAAGAAGGGACTAATGTCGGTTTTGTTCCAAGCATCAATTCTAGTAACACCCAAGGGTTGAGTGACCTTGAGAAAATTTTGAAGGAGAAGACCTTTTCTAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGACGTTCCAAGTGGAGTTGAATCGAGGAAATTTGAACAGGTCCCTTCAACCCCTGTTACCAGTCATGGATTGCAGGAAGGATCTCCAAAATTTCCAACTCAGAGTCAGGATGGAGTTAGCCCGCATATGGCTCCAACTCATGTTGTGAATGCAAATGTCCTCGATGAGGATGTTGCTTCACCTGCTGAGATTGCAAAAGCATACATGGGCAGCAGACCTCCAAAAGCAACTCCGTTGAGTATGGCAGGCAATCCTTCGAAATCCTCTACCTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGTTGAAAATGGTTTTGTCACGCCGAGATCTCGTGGTAGATCTGCCCTATACAGCATGGCTCGAGTTCCATATTCCAGAGTTCGTGCAACCCCCAGCATAAAGAATAGTATAGCCACAACAGATGCTTACAGGGCCACAACATCCTCATCATCTCAGTCAGCATGGGAGCAAGGGGGACTTTTGGGGTCTAAACAAGGAGCTTTGAAACGCCGAAACTCAGTTTTAGATGATGATATGGGATCTGTTGGTCCTATCCGAAGAACTCGTCAGAAATCCAATCACCTATTCCCAACAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGCAAGTGGCATTCGTTCGGAGACTGCTCGGCATTTGCAGTCTACAAAAGTACATCCATTTTCGTCTAATGGTGGGAAGCCACTTTATTCAAGTGAGACACAGCGTAATTTCTCCAAAACGTCTGCAGAGTCCAAAAATGCTATGACACCTAGTTCAAGTTTTCCTCGAATTCCCCTCAGGTCAAGTGAGATGGCATCAAAAATATTAGAGCAGCTTGATATATTGACCCCTCCAAAGGAAAAATCTTCGGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGGAGCCTGGAAAATGTGGATTCAGCTAAGTATTTGGAAAATGTTGAAGGCATTCAGTCTAACGATGCCTGTGATCCTACTTCTCAAAAGAATGATAAGTTCGAGGAAAGTAGTCCGTCAAAATCTAATGTACCCAATGATAAATCTATTTCTACCAGTGATGGTGTAGGTTCTTCTGTTCCTACTAAGGATATCGGATCTGGTTCTGGTATGCAAGTTTCATTTGTTGGTCCTTCCGTACAAACAAAATGTGCCTTCCAGATGAGTGCACATGAGGATTTTGTGGATATGGATGAAGAAGGATTTTCTAATGGACCAGTAGCTGATAAATCGTTTGAGATGCGAGAAAAAGTTGATGACTCATTAGTGTCTGTGAGTAAGCCGAAGAATACTGAAGCCATTACAGTAGTTAAATCGAAGCCTTCAATTGAGGCTAAACCATCTGTGGTATCTGTAATGAACAAAATAAATGACCAAGGAAAATCTGATGTTCCCACGACTACTGAAAAGAGTCCCATTTTTTCCTTTCCAACAACATCTTCACCTAGCAGTACAGCCAACGTGAAGGGTCCTGAATCAAGCTTGAGACCTGAAAAAGTTGCTTCACCCGAGTTACCAAAAGCAGCCACTGCCCCTATTTTTGGCTTTGGAGAAAAGTCGCCTTCACAGAAGGAAACATTGTCTCAACCCCCCACCTTTGCCTTTGGAAGCAAGGCTACCACAACGAATGAACAAAATGCTATTCCTGTTGTAACTTCAGAAGCCAACACCGAACCAACTAAACATGCTTCTACTCCTACCACCTTTAAATTTGGAGACAAAGCTTCGTTTTCTATTCCAGCAAATGCCGCTACAGAAAATGGAAATAAGAGTGCGGGGTCTCTATTTAAGTTCACATCACCTTTGGTTAACGAAAAAGAAGGTGCTAATGTTGGCGGTAGTGCTTCAGTTTTTAAAGCAGAGAATTCTAGCAGCAGCATACCATCATTTGGAGTTCCAAAAGAGTCCATGTCAGAGAAAGCTGGTGATAAGAGTTCAAGTCCTGGTCTTATATTTGGTACATCTGGGAATTTGTTTTCGTCATCTGACTCAACATCAACATCAACACCAACTCCGAGTTTGTTTTCTTTTAGCTCCCCTAGCACTAATTCAAATCTCAACAACGGATCTCTTGTTTCTATTACTCCATCTACGTTGCCAACTCCAGCCACCACCTTTTCTAATAATGTAACAAGTCAGAATTCATCCATCAAACCTTCTTCCATTGCTGCCACTAGCAACAGTGAACCTGTCACTTCTACGAGTCCTCCTATGTCCTCTCCTATGCCATCCTTTTCAGCTGCACCAATTTTTAAATTTGGAAGCTCTAGTGTTCCATCTACTTCTGCTTCAGCTCTATCAGCACCAAGTGGAGTTGGATCCGTAGAAGCCAAGACCAAGCCAGAGACAACCTTCGGCAATTTAAGTGGCCTTCCTCCAAGTGACACAGCTGCCGTTAAAGTTGCTAGTACTGGAAGCAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATGCCAATAAAGGACCAGCAAATTCAACTTTTGCTCAAAACAACATTCCTGCATTTGGTGCTCCGGTTTCATTTTCTAGTAGCGGGCTTGCATCATCTACTCAGAGTACACCTGCTTTGCAATTCAGTTCATCTACGTCATTTGGTTTGACTGGGAATACGGGTTTGGCATCTGGCAGTTCTCTATTTGGTTCTTCAGCTCCAGCATCTAATCCGTTCACTTCCGGTGCTACTTTTGGGCTTGCTTCCTCCAGTTCTTCTGCTAACAATTCTGTCAGCTCCAGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGCCTTCCTCAACACCATCGTTTTCTACTGGCTTCAGCTCAACTCCAAGCGGAGGATTCTCATTTGGTCTTTCGTCATCATCTTCTGCTTCTAATAGTGCTCCTATGGTCTTTGGATCATCATCAACCGGTGCATCGCCAGCCTCTATGTTCTCATTTACTTCAGCTGCAAGTGCGACGACGTCACAACCTGCTTTTGGTAATTCTAATAATGCCTTCACTTTTGGTTCAACTCCTCCTGCTAATAATAATGAGCAAGCAAGTATGGAGGATAGCATGGCTGAAGATACCGTCCAGACAGCATCGCCTATGCCTAGTTTCGGGCAACAGCCCCTCACACCACCTCCATCGTCAGGGTTTATGTTCGGTTCAACAGCTCCATCTCCGCTAGGAGCAAATCCTTTTCAATTCGGTGGTAGCCAGCAAAATGTACCACAGAATCCCTCCCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCAGGAGGGAGCTTCTCATTAGGTGCTGGTGGCGGTGACAAATCAAACCGAAAATACGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAGTAGGAATCAAGAGAGAAGGTATTCGGTTTTCTTTTCTTTTTCTTTTTTTTTGTGTTTCTATATCCCAGTTATTTTTCATCTAGGAAAAAAAATTATACTACCATCTCCGTCACATCGATGACTGGAAAGAGGAGGGGTGGAGGGGTAGGGTATCATTTGTCACCTGGATTGTTTGATTTCGGCATGATACAGGGAAGCGTTAAAGCCAAGAATTGTTGGTTTTCGATCTTCCAGTTAAACGAACGGTTCGGTTGGCAAAATTTTTCGTGGTTTGATTGGTGGGAGCATAAGTTGAGAAATTTTGTAATAGCTAATTAGCCAAATGGAAGAACATTCTGTGTACTGTAGTTAAGAAGTAAGTGTAGTCTGTGAATGTTTTTGAGGTAACAATCATCTTCTTCTATTGTGCTATGGACTCAGTTTTCCTGTAATCTTTTATTTGTATTATAACAACAACAAAGGAAATATATGCTGTTGTCCAAGGGAGCATCATTTGTT
Coding sequence (CDS)
ATGGCGACAGAGCGTGAGGAGGTTCAATATGAAGGAGGAAGAGGTGGGAAGTTCCAGAAAAGGCCTATTAGAAGGTCTCATACCACGCCCTATGATCGGCCGCCGACTGCTCTTAGGAACTCTGCTGCTAAAGGATGGCTTTCTAAGCTTGTCGATCCTGCGCAGAAGCTAATTACTTCCAGCGCCCATAGGCTTTTTTCTACTGTCTTTCGTAAACGCCTTCCCCCTCCGCCGCCGTCATTTTCACTTTCTCGAGAGGCTAATGAAGAGATGGAACATAGGAATCAGGAAGAAGTTGCAGCTGATCCGTCTGGAACTCAAGAAGGGACTAATGTCGGTTTTGTTCCAAGCATCAATTCTAGTAACACCCAAGGGTTGAGTGACCTTGAGAAAATTTTGAAGGAGAAGACCTTTTCTAGATTTGAGATTGATCGCTTGACTGAACTTCTGAAATCAAGAGTTGCTGACGTTCCAAGTGGAGTTGAATCGAGGAAATTTGAACAGGTCCCTTCAACCCCTGTTACCAGTCATGGATTGCAGGAAGGATCTCCAAAATTTCCAACTCAGAGTCAGGATGGAGTTAGCCCGCATATGGCTCCAACTCATGTTGTGAATGCAAATGTCCTCGATGAGGATGTTGCTTCACCTGCTGAGATTGCAAAAGCATACATGGGCAGCAGACCTCCAAAAGCAACTCCGTTGAGTATGGCAGGCAATCCTTCGAAATCCTCTACCTTATCTCTTGTGCCAAGGTCTCCTGGAAATTTTGATGTTGTTGAAAATGGTTTTGTCACGCCGAGATCTCGTGGTAGATCTGCCCTATACAGCATGGCTCGAGTTCCATATTCCAGAGTTCGTGCAACCCCCAGCATAAAGAATAGTATAGCCACAACAGATGCTTACAGGGCCACAACATCCTCATCATCTCAGTCAGCATGGGAGCAAGGGGGACTTTTGGGGTCTAAACAAGGAGCTTTGAAACGCCGAAACTCAGTTTTAGATGATGATATGGGATCTGTTGGTCCTATCCGAAGAACTCGTCAGAAATCCAATCACCTATTCCCAACAGGTTTGAGTTTACCAAGCAGTTCCACTTCTATTCCAGCAAGTGGCATTCGTTCGGAGACTGCTCGGCATTTGCAGTCTACAAAAGTACATCCATTTTCGTCTAATGGTGGGAAGCCACTTTATTCAAGTGAGACACAGCGTAATTTCTCCAAAACGTCTGCAGAGTCCAAAAATGCTATGACACCTAGTTCAAGTTTTCCTCGAATTCCCCTCAGGTCAAGTGAGATGGCATCAAAAATATTAGAGCAGCTTGATATATTGACCCCTCCAAAGGAAAAATCTTCGGAACTAAAGCTGCTTAGTGTGAGGAATAACTCACCCATGAAGTTATCACCATCAATGTTGCATGGGCCAGCTCTTAGGAGCCTGGAAAATGTGGATTCAGCTAAGTATTTGGAAAATGTTGAAGGCATTCAGTCTAACGATGCCTGTGATCCTACTTCTCAAAAGAATGATAAGTTCGAGGAAAGTAGTCCGTCAAAATCTAATGTACCCAATGATAAATCTATTTCTACCAGTGATGGTGTAGGTTCTTCTGTTCCTACTAAGGATATCGGATCTGGTTCTGGTATGCAAGTTTCATTTGTTGGTCCTTCCGTACAAACAAAATGTGCCTTCCAGATGAGTGCACATGAGGATTTTGTGGATATGGATGAAGAAGGATTTTCTAATGGACCAGTAGCTGATAAATCGTTTGAGATGCGAGAAAAAGTTGATGACTCATTAGTGTCTGTGAGTAAGCCGAAGAATACTGAAGCCATTACAGTAGTTAAATCGAAGCCTTCAATTGAGGCTAAACCATCTGTGGTATCTGTAATGAACAAAATAAATGACCAAGGAAAATCTGATGTTCCCACGACTACTGAAAAGAGTCCCATTTTTTCCTTTCCAACAACATCTTCACCTAGCAGTACAGCCAACGTGAAGGGTCCTGAATCAAGCTTGAGACCTGAAAAAGTTGCTTCACCCGAGTTACCAAAAGCAGCCACTGCCCCTATTTTTGGCTTTGGAGAAAAGTCGCCTTCACAGAAGGAAACATTGTCTCAACCCCCCACCTTTGCCTTTGGAAGCAAGGCTACCACAACGAATGAACAAAATGCTATTCCTGTTGTAACTTCAGAAGCCAACACCGAACCAACTAAACATGCTTCTACTCCTACCACCTTTAAATTTGGAGACAAAGCTTCGTTTTCTATTCCAGCAAATGCCGCTACAGAAAATGGAAATAAGAGTGCGGGGTCTCTATTTAAGTTCACATCACCTTTGGTTAACGAAAAAGAAGGTGCTAATGTTGGCGGTAGTGCTTCAGTTTTTAAAGCAGAGAATTCTAGCAGCAGCATACCATCATTTGGAGTTCCAAAAGAGTCCATGTCAGAGAAAGCTGGTGATAAGAGTTCAAGTCCTGGTCTTATATTTGGTACATCTGGGAATTTGTTTTCGTCATCTGACTCAACATCAACATCAACACCAACTCCGAGTTTGTTTTCTTTTAGCTCCCCTAGCACTAATTCAAATCTCAACAACGGATCTCTTGTTTCTATTACTCCATCTACGTTGCCAACTCCAGCCACCACCTTTTCTAATAATGTAACAAGTCAGAATTCATCCATCAAACCTTCTTCCATTGCTGCCACTAGCAACAGTGAACCTGTCACTTCTACGAGTCCTCCTATGTCCTCTCCTATGCCATCCTTTTCAGCTGCACCAATTTTTAAATTTGGAAGCTCTAGTGTTCCATCTACTTCTGCTTCAGCTCTATCAGCACCAAGTGGAGTTGGATCCGTAGAAGCCAAGACCAAGCCAGAGACAACCTTCGGCAATTTAAGTGGCCTTCCTCCAAGTGACACAGCTGCCGTTAAAGTTGCTAGTACTGGAAGCAGTGTTTTTCAATTTGGAGCTGCATCTACTACTTCAGATGCCAATAAAGGACCAGCAAATTCAACTTTTGCTCAAAACAACATTCCTGCATTTGGTGCTCCGGTTTCATTTTCTAGTAGCGGGCTTGCATCATCTACTCAGAGTACACCTGCTTTGCAATTCAGTTCATCTACGTCATTTGGTTTGACTGGGAATACGGGTTTGGCATCTGGCAGTTCTCTATTTGGTTCTTCAGCTCCAGCATCTAATCCGTTCACTTCCGGTGCTACTTTTGGGCTTGCTTCCTCCAGTTCTTCTGCTAACAATTCTGTCAGCTCCAGTGCTGGTACTAGTTCTAGCTTCTTTAACTGGCAGCCTTCCTCAACACCATCGTTTTCTACTGGCTTCAGCTCAACTCCAAGCGGAGGATTCTCATTTGGTCTTTCGTCATCATCTTCTGCTTCTAATAGTGCTCCTATGGTCTTTGGATCATCATCAACCGGTGCATCGCCAGCCTCTATGTTCTCATTTACTTCAGCTGCAAGTGCGACGACGTCACAACCTGCTTTTGGTAATTCTAATAATGCCTTCACTTTTGGTTCAACTCCTCCTGCTAATAATAATGAGCAAGCAAGTATGGAGGATAGCATGGCTGAAGATACCGTCCAGACAGCATCGCCTATGCCTAGTTTCGGGCAACAGCCCCTCACACCACCTCCATCGTCAGGGTTTATGTTCGGTTCAACAGCTCCATCTCCGCTAGGAGCAAATCCTTTTCAATTCGGTGGTAGCCAGCAAAATGTACCACAGAATCCCTCCCCATTCCAGGCTTCTGGTAGCTTAGACTTCAATGCCAGTGCAGGAGGGAGCTTCTCATTAGGTGCTGGTGGCGGTGACAAATCAAACCGAAAATACGTGAAAGTTAAAAGCAAATCAAGAAAGAAGTAG
Protein sequence
MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITSSAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINSSNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQEGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETTFGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFSSSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSSSTGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK
Homology
BLAST of IVF0026719 vs. ExPASy Swiss-Prot
Match:
Q9CAF4 (Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 SV=1)
HSP 1 Score: 398.3 bits (1022), Expect = 3.3e-109
Identity = 506/1393 (36.32%), Postives = 686/1393 (49.25%), Query Frame = 0
Query: 13 GRGGKFQKRPIRRSHTTPYDRPPTALRNSA-------AKGWLSKLVDPAQKLITSSAHRL 72
G GGKF+K RRS TPYDRP T++RN+ GWLSKLVDPAQ+LIT SA RL
Sbjct: 18 GTGGKFRKPTARRSQKTPYDRPTTSVRNAGLGGGDVRGGGWLSKLVDPAQRLITYSAQRL 77
Query: 73 FSTVFRKRL--------PPPPPSFSLSREANEEMEHRNQEEVA--ADPSG--TQEGTNVG 132
F ++ RKRL P R N+E + ++E+V+ + +G E TN
Sbjct: 78 FGSLSRKRLGSGETPLQSPEQQKQLPERGVNQETKVGHKEDVSNLSMKNGLIRMEDTNAS 137
Query: 133 FVPSINSSNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTP 192
P G +DLEKIL+ KTF+R E+DRLT LL+S+ AD + E ++ E
Sbjct: 138 VDPP-----KDGFTDLEKILQGKTFTRSEVDRLTTLLRSKAADSSTMNEEQRNE---VGM 197
Query: 193 VTSHGLQEGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATP 252
V H + T +G + T + LDE +ASPA++AKAYMGSRP + TP
Sbjct: 198 VVRH--PPSHERDRTHPDNGSMNTLVSTPPGSLRTLDECIASPAQLAKAYMGSRPSEVTP 257
Query: 253 --LSMAGN--------------PSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSM 312
L + G P KS T+SLV + P +ENGFVTPRSRGRSA+YSM
Sbjct: 258 SMLGLRGQAGREDSVFLNRTPFPQKSPTMSLVTK-PSGQRPLENGFVTPRSRGRSAVYSM 317
Query: 313 ARVPYSRVRATPSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQG---ALKRRNSVLD 372
AR PYSR +++ I + +S S WE+ GS+QG LKRR+SVLD
Sbjct: 318 ARTPYSRPQSSVKI-----------GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLD 377
Query: 373 DDMGSVGPIRRTRQKSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGK 432
+D+GSVGP+RR RQKSN L L+LP S + + +NGG
Sbjct: 378 NDIGSVGPVRRIRQKSN-LSSRSLALPVSESPLSV-------------------RANGG- 437
Query: 433 PLYSSETQRNFSKTSAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELK 492
E + SK SAE P SSF +P +SSEMASKIL+QLD K
Sbjct: 438 -----EKTTHTSKDSAED----IPGSSFNLVPTKSSEMASKILQQLD------------K 497
Query: 493 LLSVRNNSPMKLSPSMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESS 552
L+S R SP KLSPSML GPAL+SL+NV++ K+L N+ ++N D + QK + ES
Sbjct: 498 LVSTREKSPSKLSPSMLRGPALKSLQNVEAPKFLGNLPEKKANSP-DSSYQKQEISRESV 557
Query: 553 PSKSNVPNDKSISTSDGVGSSVPTKDIG-SGSGMQVSFVGPSVQ---TKCAFQMSAHEDF 612
+ ++K+ DG + +KD G G+ + + K +F+MSAHEDF
Sbjct: 558 SREVLAQSEKTGDAVDGTSKTGSSKDQDMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDF 617
Query: 613 VDMDEE-GFSNGP--VADK--SFEMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSV 672
+++D++ G ++ P VA+K +FE+ + +S P + +T PS EA PS
Sbjct: 618 LELDDDLGAASTPCEVAEKQNAFEVEKS------HISMPIGEKPLT-----PS-EAMPST 677
Query: 673 VSVMNKINDQGKSDVPTTTEKSPIFSFP-------TTSSPSSTANVKGPE----SSLRP- 732
+ N QG S+ TE++ +FP +S ++ ++G E SS +P
Sbjct: 678 SYISNGDASQGTSNGSLETERNKFVAFPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPT 737
Query: 733 --EKVASPELPK--AATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNEQNAIPVVTS 792
EK E PK AA P F SP L+Q + K T ++ S
Sbjct: 738 SEEKRIPLEEPKKPAAVFPNISF---SPPATGLLNQNSGASADIKLEKT---SSTAFGVS 797
Query: 793 EANTEPTKHASTPTTFKFGDKAS-----------FSIPANAAT-ENGNKSAGSLFKFTSP 852
EA +PT+ T + G ++S FS ANA T N S S F
Sbjct: 798 EAWAKPTESKKTFSNSASGAESSTSAAPTLNGSIFSAGANAVTPPPSNGSLTSSPSFPPS 857
Query: 853 LVNEKEGANVGGSASV---FKAENSSSSIPSFGV-----PKESMSEKAGDKSSSPGLIFG 912
+ N +VG S F A ++SSSI FG S S A SS+ FG
Sbjct: 858 ISNIPSDNSVGDMPSTVQSFAATHNSSSI--FGKLPTSNDSNSQSTSASPLSSTSPFKFG 917
Query: 913 TSGNLFSS---SDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNV 972
FS+ S+S+ + + + + +T S G + S ST + N
Sbjct: 918 QPAAPFSAPAVSESSGQISKETEVKNATFGNT-STFKFGGMASADQSTGIVFGAKSAENK 977
Query: 973 TSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPS 1032
+ SS+ S P T+ ++ P S + IF SSS P T S +SA S
Sbjct: 978 SRPGFVFGSSSVVGGSTLNPSTA-----AASAPESSGSLIFGVTSSSTPGTETSKISASS 1037
Query: 1033 GVGSVEAKTKPETTFGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFA 1092
+ ++F S S ASTGSSVF F A S+ S ++ + A
Sbjct: 1038 AATNTGNSVFGTSSFAFTSS--GSSMVGGVSASTGSSVFGFNAVSSAS----ATSSQSQA 1097
Query: 1093 QNNIPAFGAPVSFSSSGLASSTQSTPALQFSSS---TSFGLTGNTGLASGSSLFGSSAPA 1152
N A A + SG +STQS P QF SS SFGL+GN+ LAS SS FG S
Sbjct: 1098 SNLFGAGNAQTGNTGSGTTTSTQSIP-FQFGSSPSAPSFGLSGNSSLASNSSPFGFSKSE 1157
Query: 1153 SNPFTSGATFGLASSSSSANNSVSSSA---GTSSSFFNWQPSSTPSFSTGF--SSTPSGG 1212
FTS +T L+S++SSA++S + S+ GTS N P+S P FS+ F SSTP+
Sbjct: 1158 PAVFTSVSTPQLSSTNSSASSSSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-T 1217
Query: 1213 FSFGLSSSSSASNSAPMVFGSSSTGA-SPASMFSFTSAASATTSQPAFGNSN--NAFTFG 1272
FSFG SS+++ S++ +FG+S+ SP+ +F F S T QP FGNS + FG
Sbjct: 1218 FSFGGSSAATVSSTTTPIFGASTNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFG 1277
Query: 1273 STPPA------------NNNEQASMEDSMAEDTVQ---TASPMPSFGQQPLT-PPPSSGF 1291
++ P NNN+Q SMEDSMAEDT Q + P FGQ ++ P P+ F
Sbjct: 1278 NSTPGFAFGAPNNGNGINNNQQVSMEDSMAEDTDQANRASMVAPMFGQAAVSMPQPNFAF 1309
BLAST of IVF0026719 vs. ExPASy TrEMBL
Match:
A0A1S3C4Z3 (nuclear pore complex protein NUP1-like OS=Cucumis melo OX=3656 GN=LOC103496528 PE=4 SV=1)
HSP 1 Score: 2349.3 bits (6087), Expect = 0.0e+00
Identity = 1290/1290 (100.00%), Postives = 1290/1290 (100.00%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS
Sbjct: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ
Sbjct: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP
Sbjct: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
Query: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA
Sbjct: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
Query: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL
Sbjct: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
Query: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS
Sbjct: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
Query: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE
Sbjct: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
Query: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD
Sbjct: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
Query: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS
Sbjct: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
Query: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS
Sbjct: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
Query: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE
Sbjct: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
Query: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN
Sbjct: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
Query: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS
Sbjct: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
Query: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA
Sbjct: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
Query: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT
Sbjct: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
Query: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS
Sbjct: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
Query: 1021 SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS 1080
SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS
Sbjct: 1021 SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS 1080
Query: 1081 SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS 1140
SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS
Sbjct: 1081 SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS 1140
Query: 1141 STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA 1200
STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA
Sbjct: 1141 STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA 1200
Query: 1201 SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA 1260
SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA
Sbjct: 1201 SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA 1260
Query: 1261 SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK
Sbjct: 1261 SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
BLAST of IVF0026719 vs. ExPASy TrEMBL
Match:
A0A5A7SNY9 (Nuclear pore complex protein NUP1-like OS=Cucumis melo var. makuwa OX=1194695 GN=E5676_scaffold304G001170 PE=4 SV=1)
HSP 1 Score: 2349.3 bits (6087), Expect = 0.0e+00
Identity = 1290/1290 (100.00%), Postives = 1290/1290 (100.00%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS
Sbjct: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ
Sbjct: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP
Sbjct: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
Query: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA
Sbjct: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
Query: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL
Sbjct: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
Query: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS
Sbjct: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
Query: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE
Sbjct: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
Query: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD
Sbjct: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
Query: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS
Sbjct: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
Query: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS
Sbjct: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
Query: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE
Sbjct: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
Query: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN
Sbjct: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
Query: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS
Sbjct: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
Query: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA
Sbjct: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
Query: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT
Sbjct: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
Query: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS
Sbjct: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
Query: 1021 SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS 1080
SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS
Sbjct: 1021 SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS 1080
Query: 1081 SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS 1140
SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS
Sbjct: 1081 SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS 1140
Query: 1141 STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA 1200
STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA
Sbjct: 1141 STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA 1200
Query: 1201 SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA 1260
SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA
Sbjct: 1201 SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA 1260
Query: 1261 SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK
Sbjct: 1261 SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
BLAST of IVF0026719 vs. ExPASy TrEMBL
Match:
A0A0A0K9E4 (Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_6G046360 PE=4 SV=1)
HSP 1 Score: 2164.8 bits (5608), Expect = 0.0e+00
Identity = 1203/1291 (93.18%), Postives = 1228/1291 (95.12%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATERE+VQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLS LVDPA KLI S
Sbjct: 1 MATEREDVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSNLVDPAHKLINS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
+AH LFSTVFRKRLPPPPPSF LSREAN+EMEHRNQEEVAADPSGTQEGTN+GFVPSINS
Sbjct: 61 TAHWLFSTVFRKRLPPPPPSFPLSREANDEMEHRNQEEVAADPSGTQEGTNIGFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+NTQGLSDLEKIL EKTFSRFEIDRLTELLKSRVADVP GVESRKFEQVPSTPVTSHG+Q
Sbjct: 121 NNTQGLSDLEKILNEKTFSRFEIDRLTELLKSRVADVPRGVESRKFEQVPSTPVTSHGIQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
EGSPK PTQSQDGVSPHMA THVV ANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP
Sbjct: 181 EGSPKLPTQSQDGVSPHMATTHVVTANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
Query: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
KSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIAT DA
Sbjct: 241 LKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATADA 300
Query: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
YR+TT SSSQSAWEQG LLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLF T L L
Sbjct: 301 YRSTTPSSSQSAWEQGRLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFSTSLGL 360
Query: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
PSSSTSI ASGI SETARHLQSTKVHPFSSNGGKPLYS+E QRNFSK +AESKNAMTPSS
Sbjct: 361 PSSSTSIRASGIGSETARHLQSTKVHPFSSNGGKPLYSNEIQRNFSKMTAESKNAMTPSS 420
Query: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
SFP+IPLRSSEMASKILEQLD LTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE
Sbjct: 421 SFPQIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
Query: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
+VDSAKYLENVEGI+SNDA D TSQKNDKFEESSPSK NVPNDKSIST DGVGSSV TKD
Sbjct: 481 DVDSAKYLENVEGIRSNDARDLTSQKNDKFEESSPSKFNVPNDKSISTGDGVGSSVSTKD 540
Query: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
GSGSGMQVSFVGPS+QTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEM+ KVDDSLVS
Sbjct: 541 AGSGSGMQVSFVGPSIQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMQGKVDDSLVS 600
Query: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
VSKPKNTE ITV KSK SIEAKP VVSVMNKINDQGKSDVP+TTEKSPIFSFPT SSPS
Sbjct: 601 VSKPKNTEVITVDKSKASIEAKPFVVSVMNKINDQGKSDVPSTTEKSPIFSFPTASSPSI 660
Query: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
TANVKG ESSLRPEKVASPELPKAATAPIFGFGEKSPSQKE S PPTFAFGSKATTTNE
Sbjct: 661 TANVKGTESSLRPEKVASPELPKAATAPIFGFGEKSPSQKEAGSHPPTFAFGSKATTTNE 720
Query: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
QN I VVTSEAN EPT+ AS PTTFKFGDKASF IPANAATENGNKSAGSLFKF SPLVN
Sbjct: 721 QNTIHVVTSEANVEPTQQASPPTTFKFGDKASFPIPANAATENGNKSAGSLFKFASPLVN 780
Query: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
EKEGANVGGSASVFKAENSSSSIPSFGVPKES+SEKAGDKSSSPGLIFGTSGN FSSS S
Sbjct: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESISEKAGDKSSSPGLIFGTSGNFFSSSVS 840
Query: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
TSTSTPTPSLFSFS+PSTNSNLNNGSLVS TPSTLPTPATTFSNNVTSQNSS+KPS AA
Sbjct: 841 TSTSTPTPSLFSFSTPSTNSNLNNGSLVSTTPSTLPTPATTFSNNVTSQNSSVKPSFSAA 900
Query: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
TSNSEPV+STSPP SSPMPSFSAAPIFKFGSSSVPSTSA ALSAPS VGSVE KTKPETT
Sbjct: 901 TSNSEPVSSTSPPTSSPMPSFSAAPIFKFGSSSVPSTSAPALSAPSVVGSVETKTKPETT 960
Query: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
FGNLSG P SDT+AVKVASTG+SVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS
Sbjct: 961 FGNLSGFPASDTSAVKVASTGNSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
Query: 1021 SSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSS 1080
SSGLA STQSTPALQF SSSTSFGLT NTGLASGSSLFGSSAPASNPFTSGATFGLASSS
Sbjct: 1021 SSGLALSTQSTPALQFSSSSTSFGLTRNTGLASGSSLFGSSAPASNPFTSGATFGLASSS 1080
Query: 1081 SSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGS 1140
SSA+NSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGS
Sbjct: 1081 SSASNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGS 1140
Query: 1141 SSTGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQT 1200
SSTGA ASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDT+QT
Sbjct: 1141 SSTGAPSASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTIQT 1200
Query: 1201 ASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFN 1260
ASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQF GSQQN+PQNPSPFQASGSLDFN
Sbjct: 1201 ASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFSGSQQNLPQNPSPFQASGSLDFN 1260
Query: 1261 ASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
ASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK
Sbjct: 1261 ASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
BLAST of IVF0026719 vs. ExPASy TrEMBL
Match:
A0A6J1FKS9 (nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 1763.4 bits (4566), Expect = 0.0e+00
Identity = 1035/1312 (78.89%), Postives = 1121/1312 (85.44%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRP+RRSHTTPYDRPP ALRNS KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFS+VFRKRLPPPPPS +SREAN+EME +NQEEVAADP GTQEGTN FVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+N G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVESRKFE V STPV S+ +Q
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
EGSPKFP +Q+GV PHM PTHV+NANV DEDVASPAEIAKA+MGSRPPKATPLSM
Sbjct: 181 EGSPKFP--AQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHS 240
Query: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
GNPSKSSTLSLVPRSPGNFD VEN FVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 QKFGDTFALGNPSKSSTLSLVPRSPGNFD-VENDFVTPRSRGRSALYSMARMPYSRVRAT 300
Query: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
PSIKNS+ATTD+YRAT +SSSQSAWEQG LL S QGALKRR+SVLDD++GSVGPIRR R
Sbjct: 301 PSIKNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRH 360
Query: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
KSN LFP GLSLPSSSTSIP SGI SET++HLQSTKVHPFSS GK YSSET+RN SK
Sbjct: 361 KSNLLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKM 420
Query: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
SAES+N TPSSSFP+IPLRSSEMA KILEQLD LTPPKEKSSELKL SVRNNSPMKLSP
Sbjct: 421 SAESENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSP 480
Query: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
SMLHGPALRSLE+VDSAKYLENVE I+SND D TS+K DKFE+SS KS VP+DKSIST
Sbjct: 481 SMLHGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSIST 540
Query: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
GVGSSVP+KD S SG+QVSFVGPS TKCAFQMS EDFVDMD+E +SNGPV+ KSF
Sbjct: 541 GGGVGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSF 600
Query: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
E REKVDDSLV+V KP +TEAITV K + SI+AKPS VS M KINDQ KSDVP TTEKS
Sbjct: 601 ERREKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSS 660
Query: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
IFSFPT S S+TANV PES+ RPEK+AS E+PKAA APIFGFGEK PSQK+ + PT
Sbjct: 661 IFSFPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPT 720
Query: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
F FG+K TT TNEQNA+P VTSE N PT AS PTTFKFGDKA+F IPA+ ATENGN
Sbjct: 721 FTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSE 780
Query: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGD-KSSSPGL 840
AGS FKF S LVNEKEGA GSASVFK+E+SSSS SFGVPKESMSEKAGD KSSS GL
Sbjct: 781 AGSPFKFASSLVNEKEGAK-AGSASVFKSESSSSSTLSFGVPKESMSEKAGDKKSSSAGL 840
Query: 841 IFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNV 900
GTSGNL SS S STPTPSLFSFSSP+TNSNL NGSL S TPST P+P+ TF +N+
Sbjct: 841 SVGTSGNLLLSSVS---STPTPSLFSFSSPTTNSNLINGSLGS-TPSTFPSPSNTFPSNI 900
Query: 901 TSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPS 960
T+QNSSIKPS AATSNSEPVT+TS SSPMPSFSAAPIFKFGSSSVPS+ SAPS
Sbjct: 901 TNQNSSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS-----SAPS 960
Query: 961 GVGSVEAKTKPETT-FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTF 1020
GVGSVE KTK ETT FGN+SG+ PSDT+A KV STGSSVFQFGAASTTSD+NK P STF
Sbjct: 961 GVGSVETKTKQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPEKSTF 1020
Query: 1021 AQNNIPAFGAPVSFSSSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSSAPAS 1080
A ++P+FGAPV +SSG+ASSTQSTP F SSSTSFGLTGNTGLASG+SL GSSAPAS
Sbjct: 1021 APVSVPSFGAPVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSSAPAS 1080
Query: 1081 NPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLS 1140
N FTSGATFG SSSSANNSVSS AGTSSSFFNWQ SS PSFS+GF STP+GGFSFGL+
Sbjct: 1081 NLFTSGATFGF-GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFSFGLA 1140
Query: 1141 SSSSASNSAPMVFGSSSTG-ASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNN 1200
SSS+AS+S+PM+FGSS+TG AS SMFSFTSAA+A SQPAFG SN+ FTFGSTPPA NN
Sbjct: 1141 SSSAASSSSPMLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPPA-NN 1200
Query: 1201 EQASMEDSMAEDTVQTA---SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQ 1260
+ A+MEDSMAEDTVQT +PMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQFGGSQ
Sbjct: 1201 DHANMEDSMAEDTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQFGGSQ 1260
Query: 1261 QNV--PQNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
QNV PQNP+PFQASGSLDFNASAGGSFSLGAGGGDKSNRK+VKVKSKSRKK
Sbjct: 1261 QNVPTPQNPNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1297
BLAST of IVF0026719 vs. ExPASy TrEMBL
Match:
A0A6J1FF52 (nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111444902 PE=4 SV=1)
HSP 1 Score: 1758.4 bits (4553), Expect = 0.0e+00
Identity = 1035/1316 (78.65%), Postives = 1121/1316 (85.18%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATERE V YEGGRGGKFQKRP+RRSHTTPYDRPP ALRNS KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREGVHYEGGRGGKFQKRPLRRSHTTPYDRPPIALRNSNGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFS+VFRKRLPPPPPS +SREAN+EME +NQEEVAADP GTQEGTN FVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPISREANDEMEIKNQEEVAADPPGTQEGTNNDFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+N G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVESRKFE V STPV S+ +Q
Sbjct: 121 NNIHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESRKFEMVSSTPVISYDIQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
EGSPKFP +Q+GV PHM PTHV+NANV DEDVASPAEIAKA+MGSRPPKATPLSM
Sbjct: 181 EGSPKFP--AQEGVRPHMVPTHVLNANVPDEDVASPAEIAKAFMGSRPPKATPLSMVAHS 240
Query: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
GNPSKSSTLSLVPRSPGNFD VEN FVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 QKFGDTFALGNPSKSSTLSLVPRSPGNFD-VENDFVTPRSRGRSALYSMARMPYSRVRAT 300
Query: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
PSIKNS+ATTD+YRAT +SSSQSAWEQG LL S QGALKRR+SVLDD++GSVGPIRR R
Sbjct: 301 PSIKNSVATTDSYRATVTSSSQSAWEQGRLLESNQGALKRRSSVLDDEIGSVGPIRRIRH 360
Query: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
KSN LFP GLSLPSSSTSIP SGI SET++HLQSTKVHPFSS GK YSSET+RN SK
Sbjct: 361 KSNLLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSPAGKAPYSSETKRNLSKM 420
Query: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
SAES+N TPSSSFP+IPLRSSEMA KILEQLD LTPPKEKSSELKL SVRNNSPMKLSP
Sbjct: 421 SAESENDRTPSSSFPQIPLRSSEMALKILEQLDKLTPPKEKSSELKLHSVRNNSPMKLSP 480
Query: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
SMLHGPALRSLE+VDSAKYLENVE I+SND D TS+K DKFE+SS KS VP+DKSIST
Sbjct: 481 SMLHGPALRSLEDVDSAKYLENVEDIRSNDGRDLTSKKKDKFEDSSLLKSKVPSDKSIST 540
Query: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
GVGSSVP+KD S SG+QVSFVGPS TKCAFQMS EDFVDMD+E +SNGPV+ KSF
Sbjct: 541 GGGVGSSVPSKDTVSSSGLQVSFVGPSSLTKCAFQMSVQEDFVDMDDEEYSNGPVSAKSF 600
Query: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
E REKVDDSLV+V KP +TEAITV K + SI+AKPS VS M KINDQ KSDVP TTEKS
Sbjct: 601 ERREKVDDSLVAVGKPSDTEAITVDKPQASIQAKPSPVSEMKKINDQAKSDVPVTTEKSS 660
Query: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
IFSFPT S S+TANV PES+ RPEK+AS E+PKAA APIFGFGEK PSQK+ + PT
Sbjct: 661 IFSFPTASPSSTTANVIEPESTTRPEKIASSEVPKAAAAPIFGFGEKLPSQKDPVFSSPT 720
Query: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
F FG+K TT TNEQNA+P VTSE N PT AS PTTFKFGDKA+F IPA+ ATENGN
Sbjct: 721 FTFGNKVTTSTNEQNAVPAVTSEGNVAPTLQASAPTTFKFGDKATFPIPASTATENGNSE 780
Query: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSSIP----SFGVPKESMSEKAGD-KSS 840
AGS FKF S LVNEKEGA GSASVFK+E+SSSS SFGVPKESMSEKAGD KSS
Sbjct: 781 AGSPFKFASSLVNEKEGAK-AGSASVFKSESSSSSFNCSTLSFGVPKESMSEKAGDKKSS 840
Query: 841 SPGLIFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTF 900
S GL GTSGNL SS S STPTPSLFSFSSP+TNSNL NGSL S TPST P+P+ TF
Sbjct: 841 SAGLSVGTSGNLLLSSVS---STPTPSLFSFSSPTTNSNLINGSLGS-TPSTFPSPSNTF 900
Query: 901 SNNVTSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASAL 960
+N+T+QNSSIKPS AATSNSEPVT+TS SSPMPSFSAAPIFKFGSSSVPS+
Sbjct: 901 PSNITNQNSSIKPSLNAATSNSEPVTTTSLSTSSPMPSFSAAPIFKFGSSSVPSS----- 960
Query: 961 SAPSGVGSVEAKTKPETT-FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPA 1020
SAPSGVGSVE KTK ETT FGN+SG+ PSDT+A KV STGSSVFQFGAASTTSD+NK P
Sbjct: 961 SAPSGVGSVETKTKQETTPFGNVSGISPSDTSAAKVFSTGSSVFQFGAASTTSDSNKQPE 1020
Query: 1021 NSTFAQNNIPAFGAPVSFSSSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSS 1080
STFA ++P+FGAPV +SSG+ASSTQSTP F SSSTSFGLTGNTGLASG+SL GSS
Sbjct: 1021 KSTFAPVSVPSFGAPVLPASSGVASSTQSTPVSPFSSSSTSFGLTGNTGLASGNSLVGSS 1080
Query: 1081 APASNPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFS 1140
APASN FTSGATFG SSSSANNSVSS AGTSSSFFNWQ SS PSFS+GF STP+GGFS
Sbjct: 1081 APASNLFTSGATFGF-GSSSSANNSVSSGAGTSSSFFNWQASSAPSFSSGFGSTPTGGFS 1140
Query: 1141 FGLSSSSSASNSAPMVFGSSSTG-ASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPP 1200
FGL+SSS+AS+S+PM+FGSS+TG AS SMFSFTSAA+A SQPAFG SN+ FTFGSTPP
Sbjct: 1141 FGLASSSAASSSSPMLFGSSTTGAASTTSMFSFTSAATAAPSQPAFGTSNHGFTFGSTPP 1200
Query: 1201 ANNNEQASMEDSMAEDTVQTA---SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQF 1260
A NN+ A+MEDSMAEDTVQT +PMPSFGQQPLTPPPSSGF+FGSTAPSPLGANPFQF
Sbjct: 1201 A-NNDHANMEDSMAEDTVQTVASPTPMPSFGQQPLTPPPSSGFVFGSTAPSPLGANPFQF 1260
Query: 1261 GGSQQNV--PQNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
GGSQQNV PQNP+PFQASGSLDFNASAGGSFSLGAGGGDKSNRK+VKVKSKSRKK
Sbjct: 1261 GGSQQNVPTPQNPNPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1301
BLAST of IVF0026719 vs. NCBI nr
Match:
XP_008456625.1 (PREDICTED: nuclear pore complex protein NUP1-like [Cucumis melo] >XP_008456626.1 PREDICTED: nuclear pore complex protein NUP1-like [Cucumis melo] >KAA0031726.1 nuclear pore complex protein NUP1-like [Cucumis melo var. makuwa] >TYK11787.1 nuclear pore complex protein NUP1-like [Cucumis melo var. makuwa])
HSP 1 Score: 2345 bits (6076), Expect = 0.0
Identity = 1290/1290 (100.00%), Postives = 1290/1290 (100.00%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS
Sbjct: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ
Sbjct: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP
Sbjct: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
Query: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA
Sbjct: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
Query: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL
Sbjct: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
Query: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS
Sbjct: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
Query: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE
Sbjct: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
Query: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD
Sbjct: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
Query: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS
Sbjct: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
Query: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS
Sbjct: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
Query: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE
Sbjct: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
Query: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN
Sbjct: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
Query: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS
Sbjct: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
Query: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA
Sbjct: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
Query: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT
Sbjct: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
Query: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS
Sbjct: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
Query: 1021 SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS 1080
SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS
Sbjct: 1021 SSGLASSTQSTPALQFSSSTSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSSS 1080
Query: 1081 SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS 1140
SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS
Sbjct: 1081 SANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGSS 1140
Query: 1141 STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA 1200
STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA
Sbjct: 1141 STGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQTA 1200
Query: 1201 SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA 1260
SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA
Sbjct: 1201 SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFNA 1260
Query: 1261 SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK
Sbjct: 1261 SAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
BLAST of IVF0026719 vs. NCBI nr
Match:
XP_011656578.1 (nuclear pore complex protein NUP1 [Cucumis sativus] >XP_031742754.1 nuclear pore complex protein NUP1 [Cucumis sativus] >KGN46058.1 hypothetical protein Csa_005234 [Cucumis sativus])
HSP 1 Score: 2160 bits (5597), Expect = 0.0
Identity = 1203/1291 (93.18%), Postives = 1228/1291 (95.12%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATERE+VQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLS LVDPA KLI S
Sbjct: 1 MATEREDVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSNLVDPAHKLINS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
+AH LFSTVFRKRLPPPPPSF LSREAN+EMEHRNQEEVAADPSGTQEGTN+GFVPSINS
Sbjct: 61 TAHWLFSTVFRKRLPPPPPSFPLSREANDEMEHRNQEEVAADPSGTQEGTNIGFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+NTQGLSDLEKIL EKTFSRFEIDRLTELLKSRVADVP GVESRKFEQVPSTPVTSHG+Q
Sbjct: 121 NNTQGLSDLEKILNEKTFSRFEIDRLTELLKSRVADVPRGVESRKFEQVPSTPVTSHGIQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
EGSPK PTQSQDGVSPHMA THVV ANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP
Sbjct: 181 EGSPKLPTQSQDGVSPHMATTHVVTANVLDEDVASPAEIAKAYMGSRPPKATPLSMAGNP 240
Query: 241 SKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATTDA 300
KSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIAT DA
Sbjct: 241 LKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRATPSIKNSIATADA 300
Query: 301 YRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSL 360
YR+TT SSSQSAWEQG LLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLF T L L
Sbjct: 301 YRSTTPSSSQSAWEQGRLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFSTSLGL 360
Query: 361 PSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKTSAESKNAMTPSS 420
PSSSTSI ASGI SETARHLQSTKVHPFSSNGGKPLYS+E QRNFSK +AESKNAMTPSS
Sbjct: 361 PSSSTSIRASGIGSETARHLQSTKVHPFSSNGGKPLYSNEIQRNFSKMTAESKNAMTPSS 420
Query: 421 SFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
SFP+IPLRSSEMASKILEQLD LTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE
Sbjct: 421 SFPQIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLE 480
Query: 481 NVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSISTSDGVGSSVPTKD 540
+VDSAKYLENVEGI+SNDA D TSQKNDKFEESSPSK NVPNDKSIST DGVGSSV TKD
Sbjct: 481 DVDSAKYLENVEGIRSNDARDLTSQKNDKFEESSPSKFNVPNDKSISTGDGVGSSVSTKD 540
Query: 541 IGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVS 600
GSGSGMQVSFVGPS+QTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEM+ KVDDSLVS
Sbjct: 541 AGSGSGMQVSFVGPSIQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMQGKVDDSLVS 600
Query: 601 VSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSPIFSFPTTSSPSS 660
VSKPKNTE ITV KSK SIEAKP VVSVMNKINDQGKSDVP+TTEKSPIFSFPT SSPS
Sbjct: 601 VSKPKNTEVITVDKSKASIEAKPFVVSVMNKINDQGKSDVPSTTEKSPIFSFPTASSPSI 660
Query: 661 TANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNE 720
TANVKG ESSLRPEKVASPELPKAATAPIFGFGEKSPSQKE S PPTFAFGSKATTTNE
Sbjct: 661 TANVKGTESSLRPEKVASPELPKAATAPIFGFGEKSPSQKEAGSHPPTFAFGSKATTTNE 720
Query: 721 QNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKSAGSLFKFTSPLVN 780
QN I VVTSEAN EPT+ AS PTTFKFGDKASF IPANAATENGNKSAGSLFKF SPLVN
Sbjct: 721 QNTIHVVTSEANVEPTQQASPPTTFKFGDKASFPIPANAATENGNKSAGSLFKFASPLVN 780
Query: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLIFGTSGNLFSSSDS 840
EKEGANVGGSASVFKAENSSSSIPSFGVPKES+SEKAGDKSSSPGLIFGTSGN FSSS S
Sbjct: 781 EKEGANVGGSASVFKAENSSSSIPSFGVPKESISEKAGDKSSSPGLIFGTSGNFFSSSVS 840
Query: 841 TSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVTSQNSSIKPSSIAA 900
TSTSTPTPSLFSFS+PSTNSNLNNGSLVS TPSTLPTPATTFSNNVTSQNSS+KPS AA
Sbjct: 841 TSTSTPTPSLFSFSTPSTNSNLNNGSLVSTTPSTLPTPATTFSNNVTSQNSSVKPSFSAA 900
Query: 901 TSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSGVGSVEAKTKPETT 960
TSNSEPV+STSPP SSPMPSFSAAPIFKFGSSSVPSTSA ALSAPS VGSVE KTKPETT
Sbjct: 901 TSNSEPVSSTSPPTSSPMPSFSAAPIFKFGSSSVPSTSAPALSAPSVVGSVETKTKPETT 960
Query: 961 FGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
FGNLSG P SDT+AVKVASTG+SVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS
Sbjct: 961 FGNLSGFPASDTSAVKVASTGNSVFQFGAASTTSDANKGPANSTFAQNNIPAFGAPVSFS 1020
Query: 1021 SSGLASSTQSTPALQFSSS-TSFGLTGNTGLASGSSLFGSSAPASNPFTSGATFGLASSS 1080
SSGLA STQSTPALQFSSS TSFGLT NTGLASGSSLFGSSAPASNPFTSGATFGLASSS
Sbjct: 1021 SSGLALSTQSTPALQFSSSSTSFGLTRNTGLASGSSLFGSSAPASNPFTSGATFGLASSS 1080
Query: 1081 SSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGS 1140
SSA+NSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGS
Sbjct: 1081 SSASNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSSSSASNSAPMVFGS 1140
Query: 1141 SSTGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTVQT 1200
SSTGA ASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDT+QT
Sbjct: 1141 SSTGAPSASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQASMEDSMAEDTIQT 1200
Query: 1201 ASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVPQNPSPFQASGSLDFN 1260
ASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQF GSQQN+PQNPSPFQASGSLDFN
Sbjct: 1201 ASPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFSGSQQNLPQNPSPFQASGSLDFN 1260
Query: 1261 ASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
ASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK
Sbjct: 1261 ASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1291
BLAST of IVF0026719 vs. NCBI nr
Match:
XP_038884354.1 (nuclear pore complex protein NUP1-like isoform X2 [Benincasa hispida])
HSP 1 Score: 1917 bits (4966), Expect = 0.0
Identity = 1105/1308 (84.48%), Postives = 1171/1308 (89.53%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATEREEV+YEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSA KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFS+VFRKRLPPPPPS LSREAN+EME+RNQEEVAADP TQEGTNV FVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPLSREANDEMENRNQEEVAADPPVTQEGTNVDFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+NT G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVES K EQVPSTPV S+G Q
Sbjct: 121 NNTHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESGKLEQVPSTPVISYGKQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
EG PKFP QSQDGVSPHM THVV+ANVLDEDVASPAEIAKAYMGSRPPKATPLSMA
Sbjct: 181 EGCPKFPAQSQDGVSPHMVSTHVVSANVLDEDVASPAEIAKAYMGSRPPKATPLSMASHS 240
Query: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
GNPSKS TLSL+PRSPGNFDV ENGFVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 QKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRGRSALYSMARMPYSRVRAT 300
Query: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
PSIKNS+ATTDAYRAT SSSSQSAW QG LLGS+QGALKRRNSVLDD+MGSVGPIRR R
Sbjct: 301 PSIKNSVATTDAYRAT-SSSSQSAWGQGRLLGSEQGALKRRNSVLDDEMGSVGPIRRIRH 360
Query: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
KSNHLFP GLSLPSSSTSIP SGI SET++HLQSTKVHPFSS GGK LYSSET+RN SK
Sbjct: 361 KSNHLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSTGGKGLYSSETKRNLSKM 420
Query: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
SAES+N M PSSSFP+IPLRSSEMASKILEQLD LTPPKEKSSELKLLSVRNNSP KLSP
Sbjct: 421 SAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPSKLSP 480
Query: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
SMLHGPALRSLE+VDSAKYLENVEGI+SNDACD TS+KNDKFEESSP K VPNDKSIST
Sbjct: 481 SMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKNDKFEESSPLKFKVPNDKSIST 540
Query: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
+GVGSSVP + + SGSG QVSFVGPS+QTKCAFQMSAHEDFVDMDEEG+SNGPVAD S
Sbjct: 541 GNGVGSSVPKETV-SGSGQQVSFVGPSLQTKCAFQMSAHEDFVDMDEEGYSNGPVADISI 600
Query: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
E +EKV+ SLV+VSKP NTEAITV K + SIEAKP VS MNKINDQGKSDVP TTEKSP
Sbjct: 601 ERQEKVN-SLVAVSKPNNTEAITVDKPQASIEAKPPTVSAMNKINDQGKSDVPVTTEKSP 660
Query: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
IFSFPTTSSPS TANV GPES++RPEK+AS E+PKAAT PIFGFGEK PSQKE +S PT
Sbjct: 661 IFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTPIFGFGEKFPSQKEAVSFAPT 720
Query: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
FAF +K TT TNEQNAIPVVTSE N +PT+ AS PTTFKFGDKA+F IPANAATENGNK+
Sbjct: 721 FAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKFGDKATFPIPANAATENGNKN 780
Query: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSSIPSFGVPKESMSEKAGDKSSSPGLI 840
GS F SPLVNEKEGA GGSASVFKAE+SSSSIPSFGVPKESMSEKAGDKSSS G
Sbjct: 781 EGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSIPSFGVPKESMSEKAGDKSSSAGFA 840
Query: 841 FGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNVT 900
GTSG+LFSSS STS STPT LFSFSSPSTNSNLNNGSLVS TPS PTPATTFSNN+T
Sbjct: 841 VGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLNNGSLVSTTPS-FPTPATTFSNNIT 900
Query: 901 SQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPSG 960
+QNSSIKPS AA SNSEPVT+TS P SS MPSFSAAPI KFGSSSVPSTSA ALSAPSG
Sbjct: 901 NQNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSAAPISKFGSSSVPSTSAPALSAPSG 960
Query: 961 VGSVEAKTKPETTFGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFAQ 1020
VGS+E+KTK ETTFGNLSG+PPSD +AVKV+STGSSVFQFGAAST SD+NK PANSTF
Sbjct: 961 VGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSSVFQFGAASTPSDSNKRPANSTFTP 1020
Query: 1021 NNIPAFGAPVSFSSSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSSAPASNP 1080
+N+P FGA S SSGLASSTQSTP LQF SSSTSFGLTGNTGLASGSSLFGSSAPASN
Sbjct: 1021 SNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSFGLTGNTGLASGSSLFGSSAPASNL 1080
Query: 1081 FTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFGLSSS 1140
F SG TFGLASSSSS NNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTP+GGFSFGLSSS
Sbjct: 1081 FASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPTGGFSFGLSSS 1140
Query: 1141 SSASNSAPMVFGSSSTGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANNNEQA 1200
S+ASNSAP++FGSSSTG+ SMFSFTSAA+ATTSQPAFGNSN+ FTFGSTPPANN +QA
Sbjct: 1141 SAASNSAPVLFGSSSTGSLTPSMFSFTSAATATTSQPAFGNSNHGFTFGSTPPANN-DQA 1200
Query: 1201 SMEDSMAEDTVQTA-SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQNVP- 1260
+MEDSMAEDTVQT SPMPSFGQQPLTPPPSSGF+FGSTAP PLGA+PFQFGGSQQNVP
Sbjct: 1201 NMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFVFGSTAP-PLGASPFQFGGSQQNVPT 1260
Query: 1261 --QNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
NPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRK+VKVKSKSRKK
Sbjct: 1261 PQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1300
BLAST of IVF0026719 vs. NCBI nr
Match:
XP_038884353.1 (nuclear pore complex protein NUP1-like isoform X1 [Benincasa hispida])
HSP 1 Score: 1911 bits (4951), Expect = 0.0
Identity = 1105/1312 (84.22%), Postives = 1171/1312 (89.25%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATEREEV+YEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSA KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFS+VFRKRLPPPPPS LSREAN+EME+RNQEEVAADP TQEGTNV FVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPLSREANDEMENRNQEEVAADPPVTQEGTNVDFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+NT G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVES K EQVPSTPV S+G Q
Sbjct: 121 NNTHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESGKLEQVPSTPVISYGKQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
EG PKFP QSQDGVSPHM THVV+ANVLDEDVASPAEIAKAYMGSRPPKATPLSMA
Sbjct: 181 EGCPKFPAQSQDGVSPHMVSTHVVSANVLDEDVASPAEIAKAYMGSRPPKATPLSMASHS 240
Query: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
GNPSKS TLSL+PRSPGNFDV ENGFVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 QKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRGRSALYSMARMPYSRVRAT 300
Query: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
PSIKNS+ATTDAYRAT SSSSQSAW QG LLGS+QGALKRRNSVLDD+MGSVGPIRR R
Sbjct: 301 PSIKNSVATTDAYRAT-SSSSQSAWGQGRLLGSEQGALKRRNSVLDDEMGSVGPIRRIRH 360
Query: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
KSNHLFP GLSLPSSSTSIP SGI SET++HLQSTKVHPFSS GGK LYSSET+RN SK
Sbjct: 361 KSNHLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSTGGKGLYSSETKRNLSKM 420
Query: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
SAES+N M PSSSFP+IPLRSSEMASKILEQLD LTPPKEKSSELKLLSVRNNSP KLSP
Sbjct: 421 SAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPSKLSP 480
Query: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
SMLHGPALRSLE+VDSAKYLENVEGI+SNDACD TS+KNDKFEESSP K VPNDKSIST
Sbjct: 481 SMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKNDKFEESSPLKFKVPNDKSIST 540
Query: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
+GVGSSVP + + SGSG QVSFVGPS+QTKCAFQMSAHEDFVDMDEEG+SNGPVAD S
Sbjct: 541 GNGVGSSVPKETV-SGSGQQVSFVGPSLQTKCAFQMSAHEDFVDMDEEGYSNGPVADISI 600
Query: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
E +EKV+ SLV+VSKP NTEAITV K + SIEAKP VS MNKINDQGKSDVP TTEKSP
Sbjct: 601 ERQEKVN-SLVAVSKPNNTEAITVDKPQASIEAKPPTVSAMNKINDQGKSDVPVTTEKSP 660
Query: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
IFSFPTTSSPS TANV GPES++RPEK+AS E+PKAAT PIFGFGEK PSQKE +S PT
Sbjct: 661 IFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTPIFGFGEKFPSQKEAVSFAPT 720
Query: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
FAF +K TT TNEQNAIPVVTSE N +PT+ AS PTTFKFGDKA+F IPANAATENGNK+
Sbjct: 721 FAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKFGDKATFPIPANAATENGNKN 780
Query: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSS----IPSFGVPKESMSEKAGDKSSS 840
GS F SPLVNEKEGA GGSASVFKAE+SSSS IPSFGVPKESMSEKAGDKSSS
Sbjct: 781 EGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSFNCSIPSFGVPKESMSEKAGDKSSS 840
Query: 841 PGLIFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFS 900
G GTSG+LFSSS STS STPT LFSFSSPSTNSNLNNGSLVS TPS PTPATTFS
Sbjct: 841 AGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLNNGSLVSTTPS-FPTPATTFS 900
Query: 901 NNVTSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALS 960
NN+T+QNSSIKPS AA SNSEPVT+TS P SS MPSFSAAPI KFGSSSVPSTSA ALS
Sbjct: 901 NNITNQNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSAAPISKFGSSSVPSTSAPALS 960
Query: 961 APSGVGSVEAKTKPETTFGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANS 1020
APSGVGS+E+KTK ETTFGNLSG+PPSD +AVKV+STGSSVFQFGAAST SD+NK PANS
Sbjct: 961 APSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSSVFQFGAASTPSDSNKRPANS 1020
Query: 1021 TFAQNNIPAFGAPVSFSSSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSSAP 1080
TF +N+P FGA S SSGLASSTQSTP LQF SSSTSFGLTGNTGLASGSSLFGSSAP
Sbjct: 1021 TFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSFGLTGNTGLASGSSLFGSSAP 1080
Query: 1081 ASNPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFG 1140
ASN F SG TFGLASSSSS NNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTP+GGFSFG
Sbjct: 1081 ASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPTGGFSFG 1140
Query: 1141 LSSSSSASNSAPMVFGSSSTGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANN 1200
LSSSS+ASNSAP++FGSSSTG+ SMFSFTSAA+ATTSQPAFGNSN+ FTFGSTPPANN
Sbjct: 1141 LSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATTSQPAFGNSNHGFTFGSTPPANN 1200
Query: 1201 NEQASMEDSMAEDTVQTA-SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQ 1260
+QA+MEDSMAEDTVQT SPMPSFGQQPLTPPPSSGF+FGSTAP PLGA+PFQFGGSQQ
Sbjct: 1201 -DQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFVFGSTAP-PLGASPFQFGGSQQ 1260
Query: 1261 NVP---QNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
NVP NPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRK+VKVKSKSRKK
Sbjct: 1261 NVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1304
BLAST of IVF0026719 vs. NCBI nr
Match:
XP_038884355.1 (nuclear pore complex protein NUP1-like isoform X3 [Benincasa hispida])
HSP 1 Score: 1900 bits (4921), Expect = 0.0
Identity = 1102/1312 (83.99%), Postives = 1167/1312 (88.95%), Query Frame = 0
Query: 1 MATEREEVQYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITS 60
MATEREEV+YEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSA KGWLSKLVDPAQKLITS
Sbjct: 1 MATEREEVRYEGGRGGKFQKRPIRRSHTTPYDRPPTALRNSAGKGWLSKLVDPAQKLITS 60
Query: 61 SAHRLFSTVFRKRLPPPPPSFSLSREANEEMEHRNQEEVAADPSGTQEGTNVGFVPSINS 120
SAHRLFS+VFRKRLPPPPPS LSREAN+EME+RNQEEVAADP TQEGTNV FVPSINS
Sbjct: 61 SAHRLFSSVFRKRLPPPPPSLPLSREANDEMENRNQEEVAADPPVTQEGTNVDFVPSINS 120
Query: 121 SNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTPVTSHGLQ 180
+NT G+SDLEKILKEKTF+RFEIDRLTELLKSRVADVPSGVES K EQVPSTPV S+G Q
Sbjct: 121 NNTHGVSDLEKILKEKTFTRFEIDRLTELLKSRVADVPSGVESGKLEQVPSTPVISYGKQ 180
Query: 181 EGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATPLSMA--- 240
EG PKFP QSQDGVSPHM THVV LDEDVASPAEIAKAYMGSRPPKATPLSMA
Sbjct: 181 EGCPKFPAQSQDGVSPHMVSTHVV----LDEDVASPAEIAKAYMGSRPPKATPLSMASHS 240
Query: 241 ---------GNPSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSMARVPYSRVRAT 300
GNPSKS TLSL+PRSPGNFDV ENGFVTPRSRGRSALYSMAR+PYSRVRAT
Sbjct: 241 QKFGDGFSLGNPSKSPTLSLMPRSPGNFDV-ENGFVTPRSRGRSALYSMARMPYSRVRAT 300
Query: 301 PSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQ 360
PSIKNS+ATTDAYRAT SSSSQSAW QG LLGS+QGALKRRNSVLDD+MGSVGPIRR R
Sbjct: 301 PSIKNSVATTDAYRAT-SSSSQSAWGQGRLLGSEQGALKRRNSVLDDEMGSVGPIRRIRH 360
Query: 361 KSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGKPLYSSETQRNFSKT 420
KSNHLFP GLSLPSSSTSIP SGI SET++HLQSTKVHPFSS GGK LYSSET+RN SK
Sbjct: 361 KSNHLFPKGLSLPSSSTSIPVSGIGSETSQHLQSTKVHPFSSTGGKGLYSSETKRNLSKM 420
Query: 421 SAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELKLLSVRNNSPMKLSP 480
SAES+N M PSSSFP+IPLRSSEMASKILEQLD LTPPKEKSSELKLLSVRNNSP KLSP
Sbjct: 421 SAESENDMIPSSSFPQIPLRSSEMASKILEQLDKLTPPKEKSSELKLLSVRNNSPSKLSP 480
Query: 481 SMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESSPSKSNVPNDKSIST 540
SMLHGPALRSLE+VDSAKYLENVEGI+SNDACD TS+KNDKFEESSP K VPNDKSIST
Sbjct: 481 SMLHGPALRSLEDVDSAKYLENVEGIRSNDACDLTSKKNDKFEESSPLKFKVPNDKSIST 540
Query: 541 SDGVGSSVPTKDIGSGSGMQVSFVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSF 600
+GVGSSVP + + SGSG QVSFVGPS+QTKCAFQMSAHEDFVDMDEEG+SNGPVAD S
Sbjct: 541 GNGVGSSVPKETV-SGSGQQVSFVGPSLQTKCAFQMSAHEDFVDMDEEGYSNGPVADISI 600
Query: 601 EMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSVVSVMNKINDQGKSDVPTTTEKSP 660
E +EKV+ SLV+VSKP NTEAITV K + SIEAKP VS MNKINDQGKSDVP TTEKSP
Sbjct: 601 ERQEKVN-SLVAVSKPNNTEAITVDKPQASIEAKPPTVSAMNKINDQGKSDVPVTTEKSP 660
Query: 661 IFSFPTTSSPSSTANVKGPESSLRPEKVASPELPKAATAPIFGFGEKSPSQKETLSQPPT 720
IFSFPTTSSPS TANV GPES++RPEK+AS E+PKAAT PIFGFGEK PSQKE +S PT
Sbjct: 661 IFSFPTTSSPSITANVIGPESNMRPEKIASSEVPKAATTPIFGFGEKFPSQKEAVSFAPT 720
Query: 721 FAFGSKATT-TNEQNAIPVVTSEANTEPTKHASTPTTFKFGDKASFSIPANAATENGNKS 780
FAF +K TT TNEQNAIPVVTSE N +PT+ AS PTTFKFGDKA+F IPANAATENGNK+
Sbjct: 721 FAFVNKITTSTNEQNAIPVVTSEGNVQPTQQASAPTTFKFGDKATFPIPANAATENGNKN 780
Query: 781 AGSLFKFTSPLVNEKEGANVGGSASVFKAENSSSS----IPSFGVPKESMSEKAGDKSSS 840
GS F SPLVNEKEGA GGSASVFKAE+SSSS IPSFGVPKESMSEKAGDKSSS
Sbjct: 781 EGSPL-FASPLVNEKEGAKEGGSASVFKAESSSSSFNCSIPSFGVPKESMSEKAGDKSSS 840
Query: 841 PGLIFGTSGNLFSSSDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFS 900
G GTSG+LFSSS STS STPT LFSFSSPSTNSNLNNGSLVS TPS PTPATTFS
Sbjct: 841 AGFAVGTSGSLFSSSVSTSISTPTSGLFSFSSPSTNSNLNNGSLVSTTPS-FPTPATTFS 900
Query: 901 NNVTSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALS 960
NN+T+QNSSIKPS AA SNSEPVT+TS P SS MPSFSAAPI KFGSSSVPSTSA ALS
Sbjct: 901 NNITNQNSSIKPSFNAAASNSEPVTTTSLPTSSLMPSFSAAPISKFGSSSVPSTSAPALS 960
Query: 961 APSGVGSVEAKTKPETTFGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANS 1020
APSGVGS+E+KTK ETTFGNLSG+PPSD +AVKV+STGSSVFQFGAAST SD+NK PANS
Sbjct: 961 APSGVGSIESKTKQETTFGNLSGIPPSDLSAVKVSSTGSSVFQFGAASTPSDSNKRPANS 1020
Query: 1021 TFAQNNIPAFGAPVSFSSSGLASSTQSTPALQF-SSSTSFGLTGNTGLASGSSLFGSSAP 1080
TF +N+P FGA S SSGLASSTQSTP LQF SSSTSFGLTGNTGLASGSSLFGSSAP
Sbjct: 1021 TFTPSNVPTFGASFSPVSSGLASSTQSTPVLQFNSSSTSFGLTGNTGLASGSSLFGSSAP 1080
Query: 1081 ASNPFTSGATFGLASSSSSANNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPSGGFSFG 1140
ASN F SG TFGLASSSSS NNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTP+GGFSFG
Sbjct: 1081 ASNLFASGPTFGLASSSSSVNNSVSSSAGTSSSFFNWQPSSTPSFSTGFSSTPTGGFSFG 1140
Query: 1141 LSSSSSASNSAPMVFGSSSTGASPASMFSFTSAASATTSQPAFGNSNNAFTFGSTPPANN 1200
LSSSS+ASNSAP++FGSSSTG+ SMFSFTSAA+ATTSQPAFGNSN+ FTFGSTPPANN
Sbjct: 1141 LSSSSAASNSAPVLFGSSSTGSLTPSMFSFTSAATATTSQPAFGNSNHGFTFGSTPPANN 1200
Query: 1201 NEQASMEDSMAEDTVQTA-SPMPSFGQQPLTPPPSSGFMFGSTAPSPLGANPFQFGGSQQ 1260
+QA+MEDSMAEDTVQT SPMPSFGQQPLTPPPSSGF+FGSTAP PLGA+PFQFGGSQQ
Sbjct: 1201 -DQANMEDSMAEDTVQTVTSPMPSFGQQPLTPPPSSGFVFGSTAP-PLGASPFQFGGSQQ 1260
Query: 1261 NVP---QNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKYVKVKSKSRKK 1290
NVP NPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRK+VKVKSKSRKK
Sbjct: 1261 NVPTPQNNPSPFQASGSLDFNASAGGSFSLGAGGGDKSNRKFVKVKSKSRKK 1300
BLAST of IVF0026719 vs. TAIR 10
Match:
AT3G10650.1 (BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.1); Has 61042 Blast hits to 31782 proteins in 2093 species: Archae - 202; Bacteria - 16480; Metazoa - 16017; Fungi - 12552; Plants - 1653; Viruses - 629; Other Eukaryotes - 13509 (source: NCBI BLink). )
HSP 1 Score: 398.3 bits (1022), Expect = 2.4e-110
Identity = 506/1393 (36.32%), Postives = 686/1393 (49.25%), Query Frame = 0
Query: 13 GRGGKFQKRPIRRSHTTPYDRPPTALRNSA-------AKGWLSKLVDPAQKLITSSAHRL 72
G GGKF+K RRS TPYDRP T++RN+ GWLSKLVDPAQ+LIT SA RL
Sbjct: 18 GTGGKFRKPTARRSQKTPYDRPTTSVRNAGLGGGDVRGGGWLSKLVDPAQRLITYSAQRL 77
Query: 73 FSTVFRKRL--------PPPPPSFSLSREANEEMEHRNQEEVA--ADPSG--TQEGTNVG 132
F ++ RKRL P R N+E + ++E+V+ + +G E TN
Sbjct: 78 FGSLSRKRLGSGETPLQSPEQQKQLPERGVNQETKVGHKEDVSNLSMKNGLIRMEDTNAS 137
Query: 133 FVPSINSSNTQGLSDLEKILKEKTFSRFEIDRLTELLKSRVADVPSGVESRKFEQVPSTP 192
P G +DLEKIL+ KTF+R E+DRLT LL+S+ AD + E ++ E
Sbjct: 138 VDPP-----KDGFTDLEKILQGKTFTRSEVDRLTTLLRSKAADSSTMNEEQRNE---VGM 197
Query: 193 VTSHGLQEGSPKFPTQSQDGVSPHMAPTHVVNANVLDEDVASPAEIAKAYMGSRPPKATP 252
V H + T +G + T + LDE +ASPA++AKAYMGSRP + TP
Sbjct: 198 VVRH--PPSHERDRTHPDNGSMNTLVSTPPGSLRTLDECIASPAQLAKAYMGSRPSEVTP 257
Query: 253 --LSMAGN--------------PSKSSTLSLVPRSPGNFDVVENGFVTPRSRGRSALYSM 312
L + G P KS T+SLV + P +ENGFVTPRSRGRSA+YSM
Sbjct: 258 SMLGLRGQAGREDSVFLNRTPFPQKSPTMSLVTK-PSGQRPLENGFVTPRSRGRSAVYSM 317
Query: 313 ARVPYSRVRATPSIKNSIATTDAYRATTSSSSQSAWEQGGLLGSKQG---ALKRRNSVLD 372
AR PYSR +++ I + +S S WE+ GS+QG LKRR+SVLD
Sbjct: 318 ARTPYSRPQSSVKI-----------GSLFQASPSKWEESLPSGSRQGFQSGLKRRSSVLD 377
Query: 373 DDMGSVGPIRRTRQKSNHLFPTGLSLPSSSTSIPASGIRSETARHLQSTKVHPFSSNGGK 432
+D+GSVGP+RR RQKSN L L+LP S + + +NGG
Sbjct: 378 NDIGSVGPVRRIRQKSN-LSSRSLALPVSESPLSV-------------------RANGG- 437
Query: 433 PLYSSETQRNFSKTSAESKNAMTPSSSFPRIPLRSSEMASKILEQLDILTPPKEKSSELK 492
E + SK SAE P SSF +P +SSEMASKIL+QLD K
Sbjct: 438 -----EKTTHTSKDSAED----IPGSSFNLVPTKSSEMASKILQQLD------------K 497
Query: 493 LLSVRNNSPMKLSPSMLHGPALRSLENVDSAKYLENVEGIQSNDACDPTSQKNDKFEESS 552
L+S R SP KLSPSML GPAL+SL+NV++ K+L N+ ++N D + QK + ES
Sbjct: 498 LVSTREKSPSKLSPSMLRGPALKSLQNVEAPKFLGNLPEKKANSP-DSSYQKQEISRESV 557
Query: 553 PSKSNVPNDKSISTSDGVGSSVPTKDIG-SGSGMQVSFVGPSVQ---TKCAFQMSAHEDF 612
+ ++K+ DG + +KD G G+ + + K +F+MSAHEDF
Sbjct: 558 SREVLAQSEKTGDAVDGTSKTGSSKDQDMRGKGVYMPLTNSLEEHPPKKRSFRMSAHEDF 617
Query: 613 VDMDEE-GFSNGP--VADK--SFEMREKVDDSLVSVSKPKNTEAITVVKSKPSIEAKPSV 672
+++D++ G ++ P VA+K +FE+ + +S P + +T PS EA PS
Sbjct: 618 LELDDDLGAASTPCEVAEKQNAFEVEKS------HISMPIGEKPLT-----PS-EAMPST 677
Query: 673 VSVMNKINDQGKSDVPTTTEKSPIFSFP-------TTSSPSSTANVKGPE----SSLRP- 732
+ N QG S+ TE++ +FP +S ++ ++G E SS +P
Sbjct: 678 SYISNGDASQGTSNGSLETERNKFVAFPIEAVQQSNMASEPTSKFIQGTEKSSISSGKPT 737
Query: 733 --EKVASPELPK--AATAPIFGFGEKSPSQKETLSQPPTFAFGSKATTTNEQNAIPVVTS 792
EK E PK AA P F SP L+Q + K T ++ S
Sbjct: 738 SEEKRIPLEEPKKPAAVFPNISF---SPPATGLLNQNSGASADIKLEKT---SSTAFGVS 797
Query: 793 EANTEPTKHASTPTTFKFGDKAS-----------FSIPANAAT-ENGNKSAGSLFKFTSP 852
EA +PT+ T + G ++S FS ANA T N S S F
Sbjct: 798 EAWAKPTESKKTFSNSASGAESSTSAAPTLNGSIFSAGANAVTPPPSNGSLTSSPSFPPS 857
Query: 853 LVNEKEGANVGGSASV---FKAENSSSSIPSFGV-----PKESMSEKAGDKSSSPGLIFG 912
+ N +VG S F A ++SSSI FG S S A SS+ FG
Sbjct: 858 ISNIPSDNSVGDMPSTVQSFAATHNSSSI--FGKLPTSNDSNSQSTSASPLSSTSPFKFG 917
Query: 913 TSGNLFSS---SDSTSTSTPTPSLFSFSSPSTNSNLNNGSLVSITPSTLPTPATTFSNNV 972
FS+ S+S+ + + + + +T S G + S ST + N
Sbjct: 918 QPAAPFSAPAVSESSGQISKETEVKNATFGNT-STFKFGGMASADQSTGIVFGAKSAENK 977
Query: 973 TSQNSSIKPSSIAATSNSEPVTSTSPPMSSPMPSFSAAPIFKFGSSSVPSTSASALSAPS 1032
+ SS+ S P T+ ++ P S + IF SSS P T S +SA S
Sbjct: 978 SRPGFVFGSSSVVGGSTLNPSTA-----AASAPESSGSLIFGVTSSSTPGTETSKISASS 1037
Query: 1033 GVGSVEAKTKPETTFGNLSGLPPSDTAAVKVASTGSSVFQFGAASTTSDANKGPANSTFA 1092
+ ++F S S ASTGSSVF F A S+ S ++ + A
Sbjct: 1038 AATNTGNSVFGTSSFAFTSS--GSSMVGGVSASTGSSVFGFNAVSSAS----ATSSQSQA 1097
Query: 1093 QNNIPAFGAPVSFSSSGLASSTQSTPALQFSSS---TSFGLTGNTGLASGSSLFGSSAPA 1152
N A A + SG +STQS P QF SS SFGL+GN+ LAS SS FG S
Sbjct: 1098 SNLFGAGNAQTGNTGSGTTTSTQSIP-FQFGSSPSAPSFGLSGNSSLASNSSPFGFSKSE 1157
Query: 1153 SNPFTSGATFGLASSSSSANNSVSSSA---GTSSSFFNWQPSSTPSFSTGF--SSTPSGG 1212
FTS +T L+S++SSA++S + S+ GTS N P+S P FS+ F SSTP+
Sbjct: 1158 PAVFTSVSTPQLSSTNSSASSSSTMSSPLFGTSWQAPNSSPNSGPVFSSSFTTSSTPT-T 1217
Query: 1213 FSFGLSSSSSASNSAPMVFGSSSTGA-SPASMFSFTSAASATTSQPAFGNSN--NAFTFG 1272
FSFG SS+++ S++ +FG+S+ SP+ +F F S T QP FGNS + FG
Sbjct: 1218 FSFGGSSAATVSSTTTPIFGASTNNTPSPSPIFGFGSTPPTTPQQPVFGNSGTPSQSLFG 1277
Query: 1273 STPPA------------NNNEQASMEDSMAEDTVQ---TASPMPSFGQQPLT-PPPSSGF 1291
++ P NNN+Q SMEDSMAEDT Q + P FGQ ++ P P+ F
Sbjct: 1278 NSTPGFAFGAPNNGNGINNNQQVSMEDSMAEDTDQANRASMVAPMFGQAAVSMPQPNFAF 1309
BLAST of IVF0026719 vs. TAIR 10
Match:
AT5G20200.1 (nucleoporin-related )
HSP 1 Score: 84.0 bits (206), Expect = 9.9e-16
Identity = 195/785 (24.84%), Postives = 314/785 (40.00%), Query Frame = 0
Query: 12 GGRGGKFQKRPIRRSHTTPYDRPPTALRNSAAKGWLSKLVDPAQKLITSSAHRLFSTVFR 71
GG GGK +++ RR TPY RP + W+S++VDPA ++I+ A R+ F
Sbjct: 22 GGVGGKLKRQSARRHAATPYSRP--TQNQVQRRPWISRIVDPAYRIISGGATRILPYFFS 81
Query: 72 KRLPPPPPSFSLSREANEEMEHR------------------NQEEVAA----DPSGTQEG 131
P +L+ ++ +H+ N+ E A+ PSGT
Sbjct: 82 NAASAP----ALAAPPEDQNQHQGELQNNPQDNDPSVTPISNKPEPASIEVGGPSGTANV 141
Query: 132 TNVGFVPSINSSNTQGLSD------LEKILKEKTFSRFEIDRLTELLKSRVADVPSGVES 191
F S L+D LE++++ KTFS+ EIDRL E++ SR D+P
Sbjct: 142 NEGNFSISAQRRGKAALNDDVAISELERLMEGKTFSQAEIDRLIEMISSRAIDLPDVKRD 201
Query: 192 RKFEQVPSTPVTSHGLQ-EGSPKFPTQSQDGVSPHMA-PTHVVNANVLDEDV------AS 251
+ ++P + K P +D S A PT + + +LD D S
Sbjct: 202 ERNLEIPLREGAKKNMSLFDKAKEPIGGKDANSEIWATPTPLAKSIILDGDKIRDEVGLS 261
Query: 252 PAEIAKAYMGSRPPKAT-------------PLSMAGNPSKSSTLSLVPRS--PGNFDVVE 311
PAE+AKAYMG + ++ SM S ++ S P + PG +
Sbjct: 262 PAELAKAYMGGQTSSSSSQGFVARNEKDCLDRSMLVGKSSLASPSSKPSACWPGIKSSEQ 321
Query: 312 NGFVTPRSRGRS-ALYSMARVPYSRVRATPSIKNSIA---TTDAYRATTSSSSQSAWEQG 371
+GF TP+SR S L + R PYSR + S + + + + S SQS +
Sbjct: 322 SGFATPQSRRESYGLQNFPRTPYSRTILSNSKSKLMQLQNDSSKHLSNLQSPSQSVERRY 381
Query: 372 GLLGSKQGALKRRNSVLDDDMGSVGPIRRTRQKSNHLFPTGLSLPSSSTSIPASGIRSET 431
G L + D G GP RRTRQ + + S PS S R E
Sbjct: 382 GQLSKGR------------DGGLFGPSRRTRQSATPSMVSPYSRPSRGAS------RFEN 441
Query: 432 ARHLQSTKVHPFSSNGGKPLYSSETQ-RNFSKTSAESKNAMTPSSSFPRIPLRSSEMASK 491
+ ++ SS G+ Y S +Q + K +T +P SS++A
Sbjct: 442 SAIMK-------SSEAGESSYLSRSQITTYGKHKEAEVGTLT-------VPTHSSQIART 501
Query: 492 ILEQLD---ILTPPKEKSSELKLLSVRNNSPMKLSPSMLHGPALRSLENVDSAKYLENVE 551
IL+ L+ + PK K++ELKL + + P + +++ SAK E+++
Sbjct: 502 ILDHLERTQSQSTPKNKTAELKLATSWRH-PQSSKTVEKSSSDVTNVKKDGSAKLHEDIQ 561
Query: 552 GIQSNDACDPTSQKNDKFEESSPSKSNVPN--DKSISTSDGVGSSVPTKDIGSGSGMQVS 611
I S +Q + + + + ++ N +K+ S ++G+ G G+ +Q
Sbjct: 562 NIFSQ------NQPSSVLKPPATTTGDIQNGMNKTASATNGIFRGTQAASSG-GNALQYE 621
Query: 612 FVGPSVQTKCAFQMSAHEDFVDMDEEGFSNGPVADKSFEMREKVDDSLVSVSKPKNTEAI 671
F P K + S H DE G S+ D + + ++ KP +
Sbjct: 622 FGKP----KGSLSRSMH------DELGTSS---QDAAKAVPYSFGGETANLPKPPSHSLG 681
Query: 672 TVVKSKPSIE-AKPSVVSVMNKINDQG------KSDVPTTTEKSPIFSFPTTSSPSSTAN 722
PSI AKP + ++ G SD T++E + P T+SP A+
Sbjct: 682 NNKPVLPSISVAKPFQKWAVPSGSNAGFTFPVSSSDGTTSSEPTTPSIMPFTTSP-PVAS 741
The following BLAST results are available for this feature:
Match Name | E-value | Identity | Description | |
Q9CAF4 | 3.3e-109 | 36.32 | Nuclear pore complex protein NUP1 OS=Arabidopsis thaliana OX=3702 GN=NUP1 PE=1 S... | [more] |
Match Name | E-value | Identity | Description | |
A0A1S3C4Z3 | 0.0e+00 | 100.00 | nuclear pore complex protein NUP1-like OS=Cucumis melo OX=3656 GN=LOC103496528 P... | [more] |
A0A5A7SNY9 | 0.0e+00 | 100.00 | Nuclear pore complex protein NUP1-like OS=Cucumis melo var. makuwa OX=1194695 GN... | [more] |
A0A0A0K9E4 | 0.0e+00 | 93.18 | Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_6G046360 PE=4 SV=1 | [more] |
A0A6J1FKS9 | 0.0e+00 | 78.89 | nuclear pore complex protein NUP1-like isoform X2 OS=Cucurbita moschata OX=3662 ... | [more] |
A0A6J1FF52 | 0.0e+00 | 78.65 | nuclear pore complex protein NUP1-like isoform X1 OS=Cucurbita moschata OX=3662 ... | [more] |
Match Name | E-value | Identity | Description | |
XP_008456625.1 | 0.0 | 100.00 | PREDICTED: nuclear pore complex protein NUP1-like [Cucumis melo] >XP_008456626.1... | [more] |
XP_011656578.1 | 0.0 | 93.18 | nuclear pore complex protein NUP1 [Cucumis sativus] >XP_031742754.1 nuclear pore... | [more] |
XP_038884354.1 | 0.0 | 84.48 | nuclear pore complex protein NUP1-like isoform X2 [Benincasa hispida] | [more] |
XP_038884353.1 | 0.0 | 84.22 | nuclear pore complex protein NUP1-like isoform X1 [Benincasa hispida] | [more] |
XP_038884355.1 | 0.0 | 83.99 | nuclear pore complex protein NUP1-like isoform X3 [Benincasa hispida] | [more] |
Match Name | E-value | Identity | Description | |
AT3G10650.1 | 2.4e-110 | 36.32 | BEST Arabidopsis thaliana protein match is: nucleoporin-related (TAIR:AT5G20200.... | [more] |
AT5G20200.1 | 9.9e-16 | 24.84 | nucleoporin-related | [more] |