MS012719 (gene) Bitter gourd (TR) v1

Overview
NameMS012719
Typegene
OrganismMomordica charantia cv. TR (Bitter gourd (TR) v1)
DescriptionPentatricopeptide repeat-containing protein
Locationscaffold63: 2935042 .. 2982379 (+)
RNA-Seq ExpressionMS012719
SyntenyMS012719
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: CDSpolypeptide
Hold the cursor over a type above to highlight its positions in the sequence below.
TTCCCCCGTCTGGTTTTTCAACAGGTTAAGTACCCCAACCCGTTCCTTTGGACTGCTATGATTCGCGGGTACGCTCTTCAAGGACCCTTCTCTGAGTCTGTTAACTTGTATACTAGAATGAGGAGGGATGGCGTCAGTCCTGTTTCGTTTACGTTTTCGGCGCTTTTTAAGGCCTGTGGTGCTGTTCTCGATTTGGGTTTGGGTAGGCAGGTGCATGCCCAGACGATTCTGATTGGGGGATTTGCTTCTGATTTGTATGTGGGGAATACAATGATTGATATGTATGCGAAATGTGGGTTTTTGAGTTGTGGGCGGAAGGTGTTCGATGAAATGTCTGAGAGAGATGTGGTTTCTTGGACTGAGCTGATTGTGGCGTATGCTAAGTTTGGGGATATGGAATCTGCCAGTGGCCTGTTTGATGGATTGCCTGTGAAGGATATGGTGGCGTGGACGGCAATGGTCACTGGTTATGCCCAAAATGCTAGGCCAAAGGAGGCATTGGAGTATTTTCAAAAAATGCAGGATGTAGGTATGGAGACCGATGAAGTTACATTGGTTGGTGTTGTCTCCGCCTGTGCACAGTTGGGTGCAATTAAATACGCCAACTGGATTAGAGATATTGCTGAAAAATCAGGTTTTGGGCCTTCTGAAAATGTAGTTGTGGGATCTGCTCTTATTGATATGTATTCAAAATGTGGGAGTCCTGATGAGGCGCATAAGGTTTTTGAAGTAATGCAGGAAAGAAACGTATTTTCATATAGTTCAATGATTGTGGGATATGCTATGCACGGTCGTGCTCATTCAGCTTTACAATTGTTTCATGAGATGTTGAAGACTGAGATTAGGCCGAATAAGGTTACCTTTATCGGGGTGCTTACAGCCTGCAGCCATGCCGGTATGGTTGAACAAGGTCGGCAGCTGTTTGCTAAGATGGAGAAGTATTTTAGTGTAGCTCCTTCACCCGATCACTATGCATGTATGGTAGATCTCCTCGGTCGAGCTGGATGTTTAGAAGAAGCTCTTGAACTCATTGAAACCATGCCAATGGATCCCCATGGAGGTGTATGGGGAGCACTACTTGGAGCATGCCGCATCCATGGGAATCCTGACATTGCTCAGATAGCTGCCAGCCAATTATTTGAGCTCGAACCAGATGGTATTGGGAACTACATTTTGCTATCGAACATATATGCATCGGCGGGAAGGTGGGAAGAAGTTTCAAAACTGAGGAGAGTAATGAGAGAAAAAGGTCTAAAGAAGAATCCTGGCTGCAGCTGGTTTGAAGGTAAGAAGGGGGAAATTCACGAGTTCTTTGCAGGTGATACGACTCATCCTCGGTCAAATGAGATAAAACAAGCCTTGGAGCATCTCCTGGAAAGACTAAGAGCTCATGGATACAAGCCAAACTTGAGTTCTGTGCCTTATGACTTGACTGATGATGAAAAGAAACGGATACTGATGAGTCATAGTGAAAAGCTTGCATTGGCATATGGGCTATTAAGTACTGATGCTGGTGACACCATTAAGATAATGAAAAACCTTAGGATATGCGAGGATTGCCACACTGTCATGTGTGCTGCATCCGAGATCACAGGAAGGGAGATCATTATCAGAGATAACATGAGATTTCATCATTTCCACAACGGGACTTGTTCTTGTGGTAACTTCTGGTGATCCAAGCCAAATCCTCCGAATTCCTTCGAATGCCACATTGTGGACCAATGTCATACATCCTGACGTGTCCAAATTCTCACACCTATGGTTACAGTTGCTCAGAAAGGGAACTGGAGTCGCTATCTCAGGTCATTTCTTTTGACTCTGTTGTTCAGAACCTATGACAATGTCGCGAGCTTTTTCTTAGCTGAAAGAGTAACTCTCACTTGTTAAGGATCGACAGCAAAAGGTGCAGAAATTTGGAAAACCGTTGTGGTCATGTAAGTTTGCACAGTGATTGGAAACCGAGAATGAAAATGGAAGCTTCAGCAATGTGACGCCCATCATCGTGTATTATAAAGTATAAAATAAGGTTATTTTGATTTAGTTGTGTGGAGATAGCCCCAGCCCCGATGTTATGCACTCAGAAATGGGACATCCAAAGATAGAAGACTGCCATCAAATAAGCATCAAGGTTAGAGGATCCGAGTTCTCTCTTTCTTTTTGATCCTTCATGCTCGTATACATGTAGAATCCATCTCATTTAGTATTTTTCTTTTTGTTTCATCAATACATGAGTTGCCTAATTTAATTCCATAAGGAGATTAGATGCAAATGCAGGCTTAACTAAATATTGGAAAATGATCCGAGATTTTATGATTTGGTATCTCAGTGATATTCAAACTTCTCCCACACGTGAGAATTTGGATTGTTGATTTTCTTGTTGTCCATGAGATCTTGACACGTAAATAACTATACTTTTGAGAATTTTCTTTGTTGTCAAGTCCTCACGAGGCAAACAGGCATATATGGAAGATGGGACATAGTTGCCATAAAGCTCGTAATAACATAAATTACTAAAAGAAAGTCAAAACCACAATCCATAAATTACTTAATACACACACCCAGGCCATACAGCCATAACATCCCTTATTATTTAGTCACAGCAGCTGAGCTCTATGTAAGCTGCCATATACGAAGATCAGAAAGCTAAAACTTTATTAATACATTACATAAACATAATATATATAAACATGGGAGGCCAGCCAGCTCAGTGATGTCCTCCTGGCAGCTTCTCCTTGATCTTCTCCATTATTCCCTTCTTCTCCTGATACCCACCGCTGCCGTACTCCGCCGACCCGTAACCGCCGGGTGTGGTGGTTGACGCTGCGTGCGACTGCTGCTGAGGGTCGTGATGACCCGGCAGCTTCTCCTTTATTTTCTCTTTCAGCCCCTTCTTCCTCCTCCCTCCATGCCCATCATCTTCCGACTGCAATTTTTCAAACCACCCACAACCAAATCAAATCAAATAATGCATCATTGCATTGCACTTTTCGTTTCTATTTTTATTCCTCGATGGAAACCTGTAAATATTAGTAAGAGAAAGGAGAAACAAAGACGGGCTTACCGAGCTGGAACTGGAGCTTCCAGATCGACGAAGTACCCCTTGATGCTCCTTATGTTGGTGGTGTCCTCCGCCGTAACCGGTGCCACCATATCCACCAGCCTCATACGTGGCCCCACCGGTGCCTATCGGGTTACCAAACTCGTCGGTCCGGCGAACCGGGTTACCATACTGATCAGTCTGGCGAAATTCATCAGTCCGGCGAAGTGGGTCGCCGTACTGTCCCACTCCCGTGTCGGAGATCACGTTGCCGTACTCATCAGTCCGGCGAATCGGGTTGCCGTACTGATCGGTTCCAGATTGTGCACCGTACTGGTTCTGGTAATGTGCCATTTTTTGAAACACCCAAAAAAAAAAACAGAGATGAAGTCAAGAAAACTACAGATGGATAAGTTTCGAAATCTTAGTGAGGTTGGAGGTTGGAGACAGTGTGGATTAAATAGAGAGCGAAAGAAGATCAAGCTTAGAGAAACTCGTGAGGTTAATTCGACACGTGGATTTGGATGCCACGTGGGGGGTGATGGCGGGGACAGGTGTGAGGGTTTATGTCGGCAAATGGAGATTAGGGTTTTTCTTTTGGTGCGATGTTGGGGATGGCTCACTTTGACAAGTGGACTGATTTTATTGGATGTTAGAAGGCTAGGTCGTGATGTGTTTTGAGATTATACTTCTGAAAGAAAGTTTGTTTGATATATAAAATGGAAATCGGATGAACTCACCACTAAAAGTTTAACTAGTTGTGTTTGAATACGAAATGTTAAGTTGGGATTCACAAAGCTCGTACTCGGTACACTGATATGCCAATTACTTGTAAAATAGAATAGTCAATATACAAATATGGTCTATAATCGAAAGAGATAAATGTTGTGCATACCTTGAGTGAAGAGTGAGGATCTCTTTTTATAGAGGCGAATTCTCGACAAGTTTTCAACAGCACTCTAACGGTTCTCGAATTGTTTGGAAAATGTGGTACCTTGTCGAAAAATATTCTCATTGTCTTTTTGTGCCTACGAATGTTCTTAAAGGTCGGTTTATATCTTATGAAGGTTGACTAGATGGTGATATGTTGTTTAGCTCTGCTTTCGCTGTCGAGCTGGACTTGAACCAATCTGAAATGTTCATTTGGCTCTTTCTAATAATCATGGAGAAAATAATCTCTCGTATCGACATGTGGCAGGTGGTAATTTACCTCAAGTAAGTTTGAATAAAATTAAATGATTCGTTCTTCAACGATTAAAATAACCTTTTATTTTTAAAATTAAGTTATACGGACTAGAAATCGAAGATTGGGTCAAATGTAAATCTGACAAGTTCATTTAGAATAATTCAGAAAGTAGATCTCTCCCTCGTTAAAAAATTTATGTCCTTCTCCTTCCCTTTCTCTCTTTTGATTTTTCCAAATCAATTTTTTGTAAAAAGAATAATTCAGGTAGTCTAACTTCTACCCAATGATCAATGATGTCTTCACCCACGATTGGCTTCGCCATCTCTAGAGATAGATCTAACAACGTAAACTCACACTCAAAATCGGCGAGTTCCCTCTCCAAAAATGGATCTAGTAAACTCACGTTTATCTATCTCGTTCTTAGATCCACTCTTAATTAATGAGAGAGTATTTATTACCTATATTTTTCTTCAATAAGATGAGTGAGAATTAGAGGGTAAGTAAGAAAAAGAGTGCGCGAGTAGGAAGCGAGAGCGAGAAACAAGGAGAGAGTGGGAATCAACGAGAAAGGAGAGAGCAAAGAAGAGCAAAAGTGATAGAATGAAAGATGAAACGGAGAGATAATCCTTTTCTATTTCTACACCATAATAGCTACTTTTCGATGTAGCTTTTTAAAAAAGTAAATAATTTTTAAATAAGATACTTTTTAAATTTGAAAATAAAATACTTCTTAAATTTAAGGAAAAAATACATTTTTTGTCCAACACTTTTGGTCACTCAAGTTTGAAATATATGCCTATTTAATCCTTAAAATTATAATATTGACATCTTTGATCCCTAAAACTTAAGGAATGGTTTTAAATAGTCCTTAAATTTACTCTGACGGTTAGTTGTGGCGGCTAAATGGATGATTTGATAAAAATATATTAATTTAATATAATAGTCGTGGTTTGTATTTTGCTTTGTCTTCCTCTCTTCTTCCCCCCTTGGAAAGCTTTACCTTTTGCAAACCGTCCATGTCGGTGATGGTCATCTTGGCCGTCTTGGAGTCTCGGCAAGGCTCGCCGTCGGGGGCCATATCCATAGAGTAACCAAGTAAATTGGAGGTAAAATTCCGCTCAAATTCAGCTGAAAACCAATCAGAACTAGACCCCATCAAAATCATCCACCGCTTCATCTTCACTCCAACGAGATTTAATGGAATCTTGTGCGGCGGAACCAAGTTCGATAAAGACAGACTTCAAGTAATTTTGGGGTTTGTCGGAGATGAATTGGTTGAAATTGGAATCTTCTGTGGGTACACTCTGATGGGCAATCGTGAAATTGGAAGAAACAGAGGAAATTTTACGGGAAGCTCCAAGTTTTGAGGAAGGTTTTAATGGTACACCATGGATGATCAAAATAGCCAACGTACTTGGAAAATCAACGCCGCTATAACCCCAAATCGATAATGCAACAAAGGAGAAGTTGGAAACCATGGATTTGATGTCACCGGAATCAACCCCTTTCCGGCATCTGTAGATGACGAAAAAAACCCACAGAAGAAATAACCCAACCATCGGAAAAAAAATCCCATTTTTCTCTCTTGAAGAAAAAGAAATTGACGATAAAGTTCTCTCCATTCTTAAAGCTGTTCCCATGACAAGGATAGGAACGACCGAGTGTGGCAGCAACTTTCACCGAGGATGGGGGAGAATGAGAGCGGAAGACAAAGCAAAATAGAAACCAAGACTATAATATTAAATTAATATATTTTTACCAAATCATCCCTTTAACCGCCCCATCATCTCAAAGTTAGCCAAAATTTAGAACCATTTTTTGAACCTTTTTTTTTCGGACAACTGCCTGACCTATAACATTCGGTGTCCAAAAACACATAAAAATTACTAATTTTAAAGGTATATTTTGAAACTTTAGGGATCAAAGATACGTCTCTCAAACCTTAGGGACTAAAAATGTATGTTAGACTAAAAATATATTTTTTCCGGAACTTAAGATAAAATTACTGATATTAAAAGAGATTGAGATTTATTTCTTTTTTTTTAAATGTTGGGTTACTTCCCTCTCTTCCCCTTCTTTTTATTTATTTAATTTATTTTTCTTCAAAAAACAATATATTTATTTATTTTATTTTATTTTTGTTAATAAACAACATATCGATTTATTTTTCTTATTACAACAATATATCTGAGAGAATTCAATTTATGAATCTCGTTTTAGTCTCACCCAACTCAATTTGAATATTGAAAAAAAATTAAAATGAGTCAGGTAAGATTTTTTTTTTTAATTTACTTTCTCACTGTAAAATTTAGTAGTAATTAATTTTTTTTCCTTTGAAACCAAAAAATACTGCAGAACAAAAACACTTAATGTTAGAGTGGTGACCACGCATCATCATCCCAAATGATAGAGAAACAATTAGAAATGGTACATTTGGCCAATAAAATAGTTTGACTGTTCAGAGAACTAGTATATAAATAAATTTTAGCCTGCTAAACATTTTCTCTAAAGTCACAGCATCATCAACCCTATTCAATGATGTCGGAAGAGACTCCTCAATTAATAAAGGTATCTTGTCAATTATCGCACTCCTATGGAAATAATTGTCTACGTTGTCTTATTCGACACCATGACAAATAAGGAAGGATTAGGTAAATTTTCCAAATCATGTTGGTCAATAATTTCAATACAATTAAGACTGATACCCTCCTTAAATTCCAAAAGGAAATTTGAACCGATCATCGCTACACCTCTGTCGTTGTCCATCTTTTGCTCCATCTTCCTTGCCTTGGACCATGGAAGTTTCTAAACCAGGATGCCATGAGATAAAGAGTCATAACAAGAGATAGCATGTAATGCGAACAATGATGTGTCTGATAACTCTTCAAAACATCCAGATGTTTAATAACTCTTCAAAACGTTCAGATGACGAAGCCACGGACCATACATAACAATGCTTCTTTTGGTTTAGTCACAAAAACCAGCAAAGAAGGATCCTTCTTTCTGCCTCCACAAAAACCAGCATTGGTCCACGGGTTCGAAATCAGTAGCCTAGATTTGTTAAGCTTGGGATTTTTATGTTGGGGTATTGTGTAGGCTAGGTTTGAATAGCGTGTATTTGGGGTAGAGGGTTGGAAAGCGTGGTTTATTTTTAGCAATGATTTATATTTAGCAAAAGGTTAAATATAGGATATAATCTAATTAAATTTATAGAAAATTTGTTTTAGGTCTGGTCACATCAATCAATTTGTTTGGGATCATGTCTTCTCAAGACTCCCTGTTGAAAGAAGAAATTTACTGTCTATCCATTTTGAAATTTGCATTTCTTAATTTATATATTTTTCAACCATAATTTGAATTTCTGCCTCTCATCCTCGTGGACTTATATGGGATTAGTTTCAATTAACTCTTCCCTATCTCCCTCAACATTTCTATTATTTTATATTTCTTATTTCTCAATTTTAATTTTTGCATTATTTGTTATTTTAAAGTTAATAATTTAAACAAATTCTTTTAAATTTGTATAGTTCTTTTTTAAATTACTAGATATTCAAATATTTCTACTCATATTTACACTAAAATTATTTCGTGATTGAAATGGTTGAATTTTAGTTTAGTTAAGCTTTATTTAAAATTTCATTTATTTATTAACTAAACTATTTATATACTAAAATTATTTCGTGATTGAAATGGTTGAATTTTAGTTTAGTTAAGCTTTATTTAAAATTTCATTTATTTATTAACTAAACTATTTATAAGTGCTCGTGATTTCCACAAATATTTACAAAATTTTTGCCAACATCAATACGTACTTTGTAAAATTGGGAGTTCAATATTTTCTTCGATATCGACATTTTAAATCTTACTTTAAATATATTTTTTATTATAATTCAACTTATAACATGATTAAACCACATGATTAAACTCTAATTTTCATCAGTTATTTATAAAAATAATATCGACATTTTAAATCTTTTTAAATATATTTTTTTATTATAACTCAACTTATAACATGATTAAACTCTAATTTTCATCAGTTATTTATAAAAGTAAAATTTTTATTGACATCGGTATTTCAATTTAAATATTACTTACATGTTTAGATATGATGATTAAAAATTATCAATTGTAACCTAAAAGATATGATGACTAATCAAATTAAGGTTATAATGACTAACCCAATTACTAACACATTTGAACTCTCATTTAATAATTTAAATAACTTATATTAATTTCCATAATTAACACATTTCTTCGGATATTCCCCTCCATTAATATTCCATCAATTAATATTTCATCAATTAATATTTCAAAACCTGGATAAACAAGACATTTAAAAAGAAAAAAAATATTATAAAAAAGGAAAAAAATTGTTTTCATGAAGAAATAAATAATAAAACGGTGTAAACAGACCAAATTAATCTTCTATACCTCTACTAGAAAGAGAGAAAAGAATGGCAGGTCTTTCATGAACAAATTGATTAAGAAATATATTCTTAATTTAAACACACTATTAAAATGAAAGATATAATAATAATAAAAGCGGCATGTGTGAGAATTCAAAATAATAGTCCCAAAAAAATTACAGTAATAAAAAAGGTATAGATTTATCGGTGAGAATTCAAAATAGGTGCCTGCTTAGGCTCAAGTTGGTTATATAGTAAGATTTTAAAAAGGGAAAAAATCTTTGATTTCTTAAAGTTAAACTATTGAATATTTGACAATTAAGCACAAAAATGGAATAAAAAGTAAAACAAAATTATAAAAAACAAGTAACCAACAGTGAAAATTCATTAGTACTCAAACTAGGAAACAAAAAATTACTGTATACAGACTGGTACACGCACACCCACCACCTTTCGCTTATTCTTCAGCTCACACATATTATTTATATAATTAAAAGCAAAGCGAAATGGCCTCAGTGGTGCCCTCCCGGCAGCTTCTCCTTGATCTTCTCCATCATCCCCTTCTTCTCACGACCCCCGCCCTGCTCCGCCGCCGGGTACCCCGTCGTCGCCGCCCTTTGGCTATCATGATGAAACATTCCCTGTCCCTGATCGCCCCCCCTATGCTGCTGCGTCTGTCCACCGGTCCCAGCGGTTCGCCCGGCCGGGTCTCCCACGCCGTACGGATCGGTGTCGCGCAATTCGCCGGTCCGGCGGAGCGGGTCCACGAACTGGCCCGACTCCGGGATCACGTTCCCGTATTCGTCGGTCTGCCGAATCGGGTTGCCGTATTCGTCGGTTCCGGATTGCACGCCGTACGGATTCTGGTAATGTGCCATTTTCTTTTCCCTTTTTCCGAAAGTGAAAATTGAGAGGAAATTAGTTGAATAAATATAGAGGGAAATTGTTAGCGGATAATATTTGAGGAAATTCGTGTGTGGAATTAGGGGAATACACGTTCTAAACGAAGGCCTTCATTTTGACACGTACAACGCCACGTGGCCGTCAACGAGCAAGGGCCACGTGTGAGATTTGTTTATGACGGCAATGATGACTAGGCGTAGCCTACTCGGGGATAAAATAACAGGACTCCAAAATTCTATTTTTACCCATACTAACTCAATTTTAACCTTCATTTCCATTTCATGATTTAAAATTTAAACTTTTTACTTAGGTAACTTGTGGAATGGATTGGAATGGATTGGAATGGATATATCCTCGAGGGGTGAAGTTTACAATTTTTTTCCGACTATTTTTACGAGTATTAATATTTTGAGAATCAAAGATAATGGGCCGCCCAGCCCATCAACATTCATATTTTAAACTGGGCTTGGTCCGATTTTTAAGTTTTGTGAACCGTTTGATGTGATTAAACCTAACAATAGAGTGTATGCTAAAAGATAAGATAATCCGATTAAAGGATTGATTAATTACATTATATATTGTAAAATATTTTTCATAAATTGGAACTTTAAAGTAGGAAATAAATAAAAAATTAGTGTACTAAACTAAAATAACAAAAAAAAATTTACAATTACATGTTACATACTAAATTCAAAATTTAACAAACAAATCTTAAATTAAAACGATCTAAAATCATATATAAGGTTGAAAAAAATCACATGTAATAATGTGCAAATTCAATATTCAAAAAACAAATTGAGAAAAAGCTTAAATTAAAACGAATTCCAAATCAAATCTAGGATTGACAAATGTACCAAAAATAGAAAAACAGAGGAAAAAAAAATCATGTCTACGTTTGAAAATGTTTTTTTTTATACCTAAGTTTGGAAAATGTTAGTTGTATTATTAGAAATATAGTTTCTCTTTAAATTTTGAAAATTGAAAATTTAAGAAGATTTGTTTTTCATATTTGTATGCAAATGGAGGTCGAAAAAGGAAAAAGAAACATGATAGAATCTACCTAAAATTCGGTTTGGCCATATATTGAATTTATGGAAATTTTTGCCATTTTTCATTTCTTTAGTGTAAATATAAACATCCCTCTAAACTTTGGGCGCGAGTCATGATCAAATAAAAAAGAGAGAGAATTAAACAAAATTGAAAGGAAAAATAATAAATTCATCCCCTCTCTTTCTATTCTCATTGAATTGATTAAGACATGACATAATGGTTAAGATATATATTTTCAATTAACATATTGAAGGTTCAAATTTTTACCACCATATATTTTTAACTTAAAAAAATACTCCAAAAAAAAAGAAGTTCCAATTNNNNNNTGTAATTTTATAAAATTAATCACACTTGAGAGAGACAGGTAGCCGGCCCTCACTCTCTGTTATTCAATAATATCATTATTTTTAGTATTAATGTTTGACATTCAGATCTACGCAAAATTAAATATCCCTCTTCTATATTAATTTTAACACTATTGTTTGACATTACTATATATTTAATCCTTCAACTACTTTTTCCCATAATTTTATCTAAGGAAGATGTTGCTGAACAAAAAGCTTTTAGCAATTTTTGTTATTAATTTTCTCTAATCTAAAGGTTTGTTATTACTTTTTTAATACTTTAAAAATGCTTCAAGATCAGTCATTAGAGTGCACTCAACAAATACTTTATCACGTAATGTTTAAGTTTGATTTTGAATTTAAAAATTATTTTTATGTTACGTGATCCAATATATGAGTGTGGATTATTTTTAGGGATGAGAAAAGTGTTTTTGATTTCACTAAAAATCCCAATGTAACTTCAATTATGAATTTGGGATGTCTTTTGAAAAAACTATTTTTTGTTTTTCGGAAATTTCAAAAGGTGTTTTCAATTCAATTAAAATCACTTTTTACTCCTCTTTAAAATTGTAATAGAAAGGTACGATCAAAAACATTGATACACTTTTGAGATATATTGATTTAATCTTATCGTATAACATTGGGTGCCGAGAAACACATAAAAATTAATTGGTAAGGTAGGAGGTCATTGTGTAAATCTATTCCCAATGTCTCATATCGATCAGGGATAGGGAAGATTTTTTAGTATTTAAGTAAAACCACGATTTCATCTACGTACGTCAGACATTTTAGACATACCTAAAATAGACAATGTTGCTAAACTTTTTCAACAATGCCATCCATACAAGACATTTTAAACATAATTTAAAAGTAAATCATATACTCAAAGTAGACAGTACCGCTAATTTTTTTAATATAAAGTTTTGTTCATTATTGTAATGAGAGAAAAAAAAATGAGTGGCAAGGAAAAGGACCATGATCAGAATTTGGTTTTGCATCATCCTCTCAATAATGTCAAAAAAACAATTGATAATTGGAATCAGATTTTGTTTTATTGTTCCTCCACTAGGCATGCCCAATTATTCCAGTTTGTTCCTTTACCTAATACTTGTACAGACAGAATTCCTTTCATTTTCTCAGGAAACAAACACAATTTTCAAGTTTTAATATATATATTTCCATGAAAAATCCAAGCCAAGAGCATCCCTTGCCAACCAATTATGACCAAATAACAATGTTATCTTTTTCTTCCCTCTCTCCCTCCAATAATGCTCATTTTTTTAGGTCTCTCCCTCTTGGTACAAAATGGACCATTGAGAATTAAAAGTGGGAAATTATCTTTTCAAAAAGAAATCTTTTAAAGAAAGAAAATAGTAACTTTTTTAAAATATTATAATTTCACCTCATATATGAATTTGTTCCAAAGGATAAATGATGTCTTCGCACCTAAGTTATATTCGAGTTGTCATATATTATTTTATTTTATAGGGTAAGAAAATAAATTCTTACTAATTATTAATCAAATTAATAGCTCTTATTTATAATATCCTATTTTTATCCAACATTGTCTTTTTTAACATGGTGGTATCACTTTTAAATTCAGATGACATTTTACCACTGACCACAATTCAATCATCTATCCATTCTTCATCTCGGTCATCTGATAGATGGTTGCAATCTCTCAATTTTGATCTTAATTTTCTCTGAATCAATTAAAAATTTTCAATTGAGAAAATGGGTAAGGGGAGAAGGGATGGGCACTCCATCTTTCAAATACTTTTTTTTCTTAATCATCATTAAAGGTACATTGATTACATTTCAAAAGGGTAGATATCCACATTACACAAAAGACCAAGTACCAATAATAATAATAATATGATGAAACCCCACCATGGTTTTGGTTTGCTCTCCCTTTCAGCACATAAACATGTCACCAGCCGCCATGATTGGCTGGTTGAGAAAGGGGAATCCCCACGAATCAACAAACCCATCAATGCCACAAATTTCATCATGATCTTGTTCAGTTTCAAACAGATTTCTGGTGCTGGAGTTTATGAAGCTCGTGATTTCGTTTAGCGAGTCCAATCTGTGGCGGAGCTCCGCCATCTGGGCCCGGAGAACCGAGTTCTCCGCCTCCAGATTCCGGTAAAGCTGGGTGGTGAAATTGATGTTGACGGTGATTTGCTCATTCTCCGATCTGATTTGGGCCACCTGAACCGTCAGATCGTCCAGCTGTTTCTGCTTCCGCATCCTCGACCGGCGGGCCGATTCCCGATTCGATATCATTCTCTTCCTCTTCCTCTGATCCACGATTTGCCGCAGATCTTCGTCAGAGCTCGGAGATCCCAATGAACTTCCTACCGGAGAAGCCATGGAAACCGGCCGTGCCTCAGCCAGAGAGAAACAGAGCAATATTTTTTTTTGTGAAGAAGGGGGTGAAATTCGATATGGGTTTTGCTCGAAATGGCACGAATTGAGGAACCCAGATGATGATTTCAGCGATGAATCGAAAGATCTGGAGATGAGAAATTGGGATCTGGGGGCCGGGCTAGTTCATGAGAAAACGTAGAACCAGTAGAGGAAAACGACGGAGAAGGATTGGACGAGATGGGTACGGCGGCGGAGAGCGGAGTTTATGATGAAACCAGAGAGAAGAACCTCACTGACTACTGGAGACATGAATCCGAAGAATCAAAGAAACAGAATGGAAGCATTAAAACACCTGAAAATTTTCTCGGGAAAACGTGGGAAAGGCAGAGAAAAAACAGAGAGGGAAATTGAAAGAGGAAACGGAGAGGAGAGGTTTAGGGAAGAAATGGTGGTGGATTTTTATAGACCAGAAACGCCCATTGGAAATGGATAGAATAATCAGGAAAATGGAGGAAGCTGCTGCGTTGCATCACAAAAGATTAAACAAAGGAAATAAATTTTTGAATGGATAGCTTTGTATTTTATTCTACAATATTGTGAATAGTTTATTCTCATCCTAATAATTTTGTACTCCCATCATAAATCTTGATACAATTAATTAATAAATATATGAATCACGCCATCACAAGTTTGACAATCGGTGAAATTTTACTAAATTATAGACGCATTTGTTGATGCATGATAAGTGATACGTTAGGTAATTTGGAGGGGAATCGGACATGACATGGACTATCGAGCTATCTGCAAATAAAATCTACATTGGTGTGATTCTTGATTAGAAATTAGTCCAAGATGTATTGTCGTGTCTAAATTACCTAGAATACAAGAGATTGTATACTTTTGAGAATATAGAATTTCGTCGCATATCTTAGAGAATGTAGGACTCTGTTATTCCTACAAAATGAGCATTAGGAATTGTGTCTTTGTCATAACAACGGTCGTATATGTTATTTAATAGATTTTCTCATGGCAATCAGAAGATCTTTCAACAGTAGAATCGTCATTCTATCGAATATTAGTGAATTTTCTACCAATCACAGACTCTCAGATTTAGGCTAACCTCTGCTTCAATAGACATAGACCCTTCATCCTCTTCTTCGGTAGGTCCAAGTTGAAGCTATAATACATGTGTCCTAGCAGGTGAGGGCCACTAGTTGCACTTGGAATAACCTCCCTGTTGGGTTTGTAAATGGAATGCAAACAAGGTCTCACGTTGGCTAGGTGAGGTAGTGATGTATGATATATAAATGAGGATAATTATATTAGTGTGAAAAAAATCTGTGAGGGTTTCATCCATACTAACAAAGTAAAGTCTCACATTGTCTAGAAAATTGAGTGATCCATAGTATAGATACTACTTAGGGTACCGTTGTCCTCAACTCTCCCAATAATATTAAAAATTTTGAAGTGTAAAAAATAAATTAAAACTATATCTAAACTATTAGAATGAAATTGAAATTTTAGAATCCTATAGATTAAATTGAAATCCAAACTTAAAAAAGATTTAAATTGATAATTTGAATTATGCTAAATTTGTTGCTACACTTTAAAAAACTATTTGACAGCTAAGGTTCGGTGGTCAGAAATTGATTAAAAAAAAGTGGTTGGAAAAGTTTAGGAGTGGAAATGGGAGTCATCTCATGTTCACGAGCACGCGCAAAATGCTGCTCACGAACTGAAATTGCCAGACCTACATTTAAGACTTTTTTTTTCTTACAAAAAAAAAATGATATAATATAATAAAATAAAGTATCATAATTTTTTTAACTTGCTTAAGCTTTGATTAAGGTGCTAAGCAAAACTTTATTCCAATTTTATAATGCTTTTGCTAGTATGACAATAACATTTCGTTGTCAAATGTCAAATGAGAATTTCATTAATTCACGTCTCTAAGAGACAAAAAGATCCTTTCAAAATTAAATTAGCCCATCCACGTTAATTAAATATTAAAATTTAAATAATCTCTCGAGAAAATTATTTTTAATGTGGATTAAATGAAATTGACTTTTTTCAAGACGATGATTTCTAACATTTTTTTAAGTAATAAAATATGAGTATAGTTTTAACAAAAAAATATTACAATAGTAAAAATGGTTTCAAAATAATAATAATAATTTTAAAAATAATTGTAAATATATTAAAAATTAAAATAAGGGTAAATCAATGATTGTTATTATTATAGTTAATAAATATAAAGGTTATTCTTTGTTTTACATAAATCAATGATTTCCTTTTCAAAAAGAATATATAAATGAATGATTGTTACGTAAAATAAAATAAATTGATTTATTATCAATAAATTTATGAATGGTTAATAATTACTTTAAAAGTAAATACTATATATATTTTTAAAATATCATATTTGTCAATTACTTACGTAATCAAGGGCGGATCTATCCTCTAAATAAGTAAATAGTATATGTTGTTTAACATAGATGGACCATTGGCATTCTTCCCACCGTGAAAGTTTGTACTGTCCTTGGTCCCGAGATAAAAATTACAACAATTATCCAATGTACAAATTGATACATACATATTGCTAAATTCACACTTAACATTGATATTTTGTATTATATTTATATGTATTTGGATCCGCCCCTATATAATATAATATCTCAATAAAAAATATTTTATAAAATAGAGCTATCCATTTAACTTTTCCTGATTGAAATTCAACCTAATTGACGCATGCATACCCAATCCTCTATCCCTTTCCATTTTTTAAAAAAAAAAGTGTCCTCTCCAAATATTTTTGGCTTTTATCTGTTAGTCTAAAAGATGTATTATCCACTATTGTAGTATTGAGATGATTTTTTGAAGGTTTAAATTACAATTTTCGTATTGGATTTTTATATAATAAGTTCTTTAACTTTAAAAAGTGTCTAACACGTCTATAAATTTTAAAATATCTAATAAATCTCTAAAATTTCAATTTTGTTTCTAACATATCTCTTATATATTTGAATTTTTCAAAATTAATAATCTATTAAACAAAAAATTGAAAGTTTAATGATTTATTAGACACTTTTTAAAATTCAAGAACCAATTAAACACAAAATTATAAGCTGAATGACTTATTAGACACTTGCTAAAGTTGAAGAACCTATTAGACACGAAACTTAAAAGTTTCGAAACTAAACTTATAATTTAAACTTTTGAATTTGTTTTTTTAGTATAACATTTTGAATATTGTTGTTCAAGAAATAATTTATTTTTTATAATATTCTAGTGTTCCTTTAAAACGGTTTCTTATAAGAGACTTCTTTTTTTCTTTTTTTTAATAATTCTTATAAGAGACTTGTTACTAGCATTGTAGTAAAAATAATGCAATGCTCGTAAACAATCTGAACGAAAATACGCAAAAATTCTTGCTGTTGAATAAACAATTTTATTTAAGTTGTATTGATTTATTATTTTAAATAACAAGTAAACTTATTTATCTAAAATATTATAAAAGAACAATTAAGCTTCTAGATTTATTTTTTCTCGAAAAAAAAAATGTAGATTTATATTTATTTCACTATTGGTGCTATACACAAACTCCTTTTATTTTATTTCACTAATGGAATATTCTTCATGGGAGATGCTAATATTCGCTTTATGTTTAGATAGAAATTAGATATAACATCCGTAGTTGTAACTTTTCATCCAAACCCACTCCCTAAGGAGAGCAAATAGTTATTTTTAAAAATTCACTTTTAATCCAATTCCAACACACTCAATCCCCCACCACATAATTTTATACAAAAAAATTAAGTTGATTGAATTGAATTAAGTTGAAGTTTAAAATTTTAATTTCAATAAACTAGGTTATAAAAATTTTATAATTGAGTGAAAAGATTAAAGACAAAAATTAAAAACTTGACTAAAAGTTAACTAATAAATGATTCAATATTTATTCAACAAAAGATTTAAAATTCGTTATAAAATACCAACATGAGCATAGCTCAACTTATTAAAGTATCTATTTCCGACTAACCAGTCGTGAGTTCGAATTTCTTCTCCAATATGTTGTACTAAAAAAATATGACTTCAAAATCATGTTCAGATTTAATCTAAAATATTTAAACCCAACATTAAAATCCAACGGTAGAAAAATATCTAAATTGACATGATCATAGGATATTTTATTTGTAATGCTTAAAAAAAATTCAAAAAAACAACACCAATCATTCCAAAGGTAGATGGTTAGATTTTCTACACCTTGTAATTGTTGCGCTCAAGAAAAAAAATAGAAAATAACAAAAGGTAGAGCCATAAATTTTCCTATGGAGGAACAATATTTTACATTTTAACTTTTTATATATATAATCGGTGCATTCTCAAATTTAAAGATGGATAAGTTGGAGAAAATTTTTTAAAAAGATATTTGAGATGAACCAGTGGGTGATCGTCCAATTCCTTCCTCCTTCGTTCACCTTCTAGAAAAACATCCTAAAAGTTATCTCGCTTGGTCACAAAATCACACATAGAGTCACGAATCTTTAAAGAAAAGTAAAAAGTTAAACTAAACCAAACCACCTCAATTGACTAGCCAAGTAAAAAAGAAGAAAAATAATTTTCTTAAAAAAAGTTTGAAAGTGAGATTTTGAGGTATTATTGAAAAGCTTTATATTGCCAAATATTTATTTGAAGTTTGGGACATGTTTAAAGCATTATCCATTTAGAGCTGCCAAGCTATCAATTTTAAGAAGCTCACTAATTTTGAAAACAATTAATTAATATGGGCCCCAAAAGGGCAAAAGGGAGAGAGGGTTGGATAAAGTTGGAGATGGTGGACCAATAGGAGCCCCCCATGGGTTTGTTTGGTGGCCATTGGATTTAGACAATCAGAACTTTTCTTCAACTTGGTCCAATTCCTTTTTTTTTTCAAGTATGTTTTTACTCTATTTTCTAATTCTCCAAATGGCTGCATCCATTGATTTGACAAAGCTAATTTCCACATTATCAAAGATTAATGATTTCAGTGTCAAGATATGCTCATACTTTTCTTAAATCAGAAATTAAAAAATTTAATTAATACCTCATATTTTTTCTCACCTATAAATATTAATTGGAAAGTAAATCACACAATAGAACTGCCCGCCTCCCATTTAATTTTTGACCAAGTTTACATTGAATTTTTTTTTATTTAACAAACATTTTTCTCTCTTAATTCTAGTCTATATGAGATTTTTGCCGTTCATTATTTTTAACTACAATAAATTAAAAACTAACTTGAATACAACTCATCAAAAAATAAAAAAATTTAAATTCACACCTCATATATTATTGATGTTAAACCAAACAACCTGACTTAAAAAAAGAAACTTTTTTGGAAGAATGATTTTCTTTTCACTAAAATTTAGTGCACTTTGTGATGAGTATTCACACACTCAATCGTCAGGAGAAAAGAGAAAAAGCTTCAAGGATGTCAAATTCATCAACATGAAGTAAAGGTATATATATATATATATATATATATAAATCATTCATATATATTATATTTTTTAATTTTTTGTCCAAAGAAAAAGATTAAATTTTAAGCATCAGATAATTTGTTGGGTTTATAAGGAAAATGCAAACAATAAAGTCTCACATTGACCCGAGAAGGAAGTGATCATAGATATATAAGATAGAACAATCATCTCCATTGGTACGAGACATTGTATAGATATGGAGTGGCTTACTATTTTAATGGGTTGATTTTGCTTGTTTTGCAAATATTATCTATGGTTTTAAATTTTATGTTTAAATCTAGTTAGAGTCTTAATTTTAGAGTTTTTTTTTTGTCCCAAAATTATAAACTTTCAAAGTTACAATTATTAATTTAGTCTTGTAAATTTTACCATGTCCCAATATTTGTTGATGCAATAACTTACTCTCCTACTTATTGTCAGGTTAAATTATTGTTCGCTGTCTAATCAATATGTGTCTTTATTGATATTTGACTAACTATATTGGAGGGACCTGATTTTTTTTTCAAGTCTAGACAGACAAAGTAGAAAAAATATAGGGTTAATTTGTAATTTAACCGTTTATGTTGATTTTAAGGATCTTTTGTCAACATTAAATTCATAATGAAGATTAGAGAAATTGAAATGGATCCATGGCACCTATATTGCCTTCTTTATATGTGGAATACTTGCGGCAACAGAGGAAAAAAAAAGGTAAAATGTTTACTGAGTTTTGACTCCTTTTTTTTAATACCAAAGTGAAATAGGAGATTTCAACCATTAACTTTAAGAAAAAAAGTAGATGTTATTTTCTCTTATTTTACTAACTTCAACTAAATGCTTCTATAAACTTTATAAAAGAAAACTATATCTCGACTTCATGAAGAATATGACGATTAAATGATAAAATTAAGTCTCCAAAATTTGAATTTAGTGTCGGTTGGTTAATTAATTCCTAAAATTTCAAATGAATACTTTAGTCCTAAAATTTGAAAAAATATTTTAAATAGTTCTCAAGTTAAAATTGACCATTAGTCAACCAACGGCATTGAATTTTAAATGATGAAAGGACATGTACACTTGGTGCGACAGCAAAAGATAGGGTGCACGGTAAAAATTAAGAGGTCGCCGATCAATTTAACTTATGAATCACTAAAATATCTATTTTGAAGCTTTACCATATAAACATTAAACTTTAAAAAAGAAGTGTGCATCTCGCTCCAAATTTATTATTATTATTATTATTTATTAGTATAACATGTTGGTTGGAGAATCGAACTATGCTTGCTTTGGCACCCAAATTTATTATTGATTAGCAATTAGGGAGATAAAAATATTTTAGGCTTATTTATAGTATTCTTTTTATACTCCAACTAGTTCAACATAGCATGCTATGCCTCCTGCCACATTTAAAACAGTTAATTTGGCCCACTATACTAAACTAAATAAACTTATAATATTAGCACAACTACACCTACCAACTTGAAATTAAAAATATTCTAACATTTTTATTTGGATCTCTTATTTTGGTAATTCTTAAAGCTCACATAAAACCTCCGATCTTTTAATCAAGTTTTAGTCAACAATTGAGCTATATCACATAAAAATTACATTAATAAAAAAGATGACCAAGAATTACTCAGAAAAATTTTGACCACGCACTGGATTTAGAATCCGCGAAAGAAGATAAGTTTTCCAAAAGATGGTTAAACGATCAGAAATGACAAGTTTGACCAATAAAACGACTTACATGTTTAAAGAACGAGAAATATGAATCAAATTCAGTCCACAAAACATATTTTTCAAAGTCACAACATCCTCCATTTTATTATCGGAGATACTCCTCAATTAATAGAGTATCGAACAGATATTTGAAGCATCGATATCTTTAAGTCAAATCGTATGAGTCTCATGATTGAGCATTTCGGTCTTCATTAATGGCTGAAGATTGATATCAAATATTTAAAAGATGGTGTGTAAAATTTGGCGGCTAAGCTGTGGATGGCCACATTCATTGAATTGTTTTAAAAGTCGGTTCCAATGTGAGAAGATTTCCTAAGATTTCTAAAGTTAATGTTTTTATAATTCTTAGCCCTTTTGACTTTGTTGCATTCTTGTCTCCCAAACCCAGCTTCACTCACACGTGATATGCTTAGGGAATACGGACTAATTGCAACAAATTGCACCAACAGAGAAAAAAACAAAACAAAACAAAACAAATTATGACTTAATATGATGATCAAATTTATAATATTTAGCAAATACAATTTTAATGGGAAAAAAAACTTTTGGTTAAAATTCAAGGGTTGATGAAATTTTGAAGTTTGACCATCTATCTTGAAGCTTTCAATTATCATTTATCGTTTTTTGTTTCAATTCTTCATCGTTTCTGTTCGAAGCTTTCTTGAATTTTATTAATTTTCTAAAAAATCGATATAATAACGTTATTTCCTGTGGCACGCAGTAGCTCAACATTTTCATCGACAACAAGGAATATTGGTTTTCTTGACATTTTATCTGACGGCACGCAGTACTTAATATATTAAAACAACATATACCAAAAAAAAAAAAAAAATACTTCATATCAATAATTTCATATTATTTACAATACTATAAGCTATCCATAAAACAGTCCTATTAAAGTATTATTTAACATTATAAAGAAAACATATACTCAAAATACACTTTATATCAATAACTTCGAGTCATTCATAACACTTAAGTTGACTTTAACATTATACCAAAAATATACTCCATATGAGTAACTTTATATCATTCATAACAGTGTAAGTTGTCCACAAAACAATATCGATATTATTTAAGCATATACCTAAAATATACTTGATATTATTAAATTCAGATCAAACATAACACCGCAAACTGCCTAGAATATTATTTAATATTACAAAGTATTTGTAGTATATACCTAAAATATATTCGATAAGATGGTAATCTGGCTAGAAAACGAAGAGAGAAGTGGTCGACAACAGTTGAGCCAGAACGACGTGTAGTTGATGAGGTCACCAGACTTGGAGTCTGCTTCGAGATCTAGAAAAAGCTCCCCATAATGTTTTCGTTGGAAAAAGTGAAAATATTTTTGTCCAACACTTTTGGGGACATTGTAAGATGGGATGCCAAAATGTACTCATCCCGATCTAAAATATAACTCAATTAGCAAAGTTCATGGGCTTATTATCTATCGGAGGCCCAGCCCAAGCCTAACTCCAAACAGTGTTTAGGCTTGTTGGACATAGGTCAAAGTCTAAGGCTGTCTTTTTGGGCCGAATCGAATTAGTCATCTCATGAGTTTGAACTTTTTTTTTTTCTAAACACAACAATAAGTGGAGTGACGATTCGAACCCATAACCCAATTGATCTTAGTTCAAGTTGACATGATGAGTTTGAACTTGAATTATATTATAAACCATATTTTTATTAGTTACCGATGATTTACCGTATGGTATTACTAACAACATTTTGTTAAATGATTTCATTATATAATAATACTGATTAAAAAGACGCACAATGGTAAAATTTTAATATTTACATATTAGGAATATAATTTAATTAATGTTCAGCTATAAAGTGTGTGTATATATATAAAACTACAACATATAGAGTAGAGATAATTGGAGGAAAGTATCCGAGTTATGTTAAGTTAACAATATTCAATATATTAAGACAAAAATAACAATTAACAGCCAAAGCGAGCATAGTTTAGCGATAATTGACATATATCTCTAAATAAGAAGTTGTGAGTTCGATCTCTCACCCCTACATGTTGTACTTTGAAAAAAAACATTAATTTTAGATAAATGTTAAGAAAAAGCTCATTATGTTAACGGAATAAGCATGGCATGCATTTAATATTTATTTTTAAAAAATGTCAACTTTATTTTTATAACATAAAATTAAGCTTTTAATTTAAGTTTGATTTCAAACCTGCTATTTTTAAAAATTTCAAAGTTTATTTTATATTTAAAAATACATATTCATTTTATGCCATTTATATAAATATTTTTTTTTCCGCAAACCAGGGTGTGACATGACTTTACCTCTCCCAAAATTGAAACAGAATTAAATTTGAACAAAAAATGTTGATGGTAGGAAGAAGAGGGATCAACAATTTCTTACACAACAACAAAACTATGAACATCACCGAAATTCCACATATTGGAACCCAAGAAAGGCTTCTCCAAATTCAAATATTTTTTTGATTCTGATGAATAAAATGCCAAACATTCATCACCAGTACAAAAAAAAAAATACCTTAGACCCTTTCTGGATCATCAAAATACTATTCATAGTTATATTTACAAGTTGGAAGAAAGGCCGAAATCGTCTCAATGCGCTAATACCGCTATCGAAAGCTCTCGAAGCTACACTGATGAACTCATAACATCAGATTCCAGCATCTCAAAAACTATAGAAATGGACTGAATCATTTTTGGAGTGGAGGCGCCTTCGGAGAGAAGAATACCTCAAGAATAGGCTGAGACAGCTTCAGGATGGTAGTAGAGCATCTCATTCAACATCAACTCTCTGATCTTTTGCTCCCCGAGTGTTTCGTCTATGTCGAGAGTGAGGGGCACCTGGACAGGAGGGATGAACTTCGGGTCGTACAGCCCCGACATGTATGGATGTTGAAGTGCTTCGACAACAGTAATTCTCTTTGTGGGATCGAACACAAGCATCTTCTGCAACAAGTCTATAGCTAAAGGATCAGCGTGTGGATACAGATGTGAAAGGTGTATTCCCCTTGTAAAGGGCAGCGACTTGATGTACTTTCTGGCCTTTACATTGTCGATGAACTCAATATCCGCTTCCTGTGGACTACCAAGGATGTTGATGATTAACTTGAGTTGGTTGAGGCACTCTGTCCCCGGGAAAATTGGTTTCCGACCCAGAATCTCAGCAAAGATGCATCCCACAGACCAGACATCAATGGAGGTCCCATAGTTGTCACTGCATAGGAGAAGCTCTGGTGCGCGATACCAGCGAGTAACAACGTATTCAGTCATGAACTGGCCACTGCCTATGCCTGTTCGTGCCAACCCGAAATCACATATCTTCAGATCGCAATTAGCATTAACGAGGAGGTTCCCGGGCTTCAAGTCTCGGTGAAGAATGTTAGCTGAATGGAGATACTCCAAGCCGCAAAGCAACTGTAATATATAAAAAGAAATGTCTTAATCAGACCTCAGAGCTTAGTAAGGCATCACATTTAACACACACATATACATATAAATCAGCTTGATCTTAAACATCCATTTCATCGGACATGTTTCGAATCGAAACCGAAAGGGTAGAGCTACATCAAGCCTCAGAAATTCAGCTCAAGCGAGTGAAAGAAGATTATGAAGTTTTCATGAAAATCACTGAAACAAGTATGATATTCAAAAACAGTGTGTTAGTATAAGGAAAAGAAAACAAAATCATTCACAAACATGCTTTTTCTTTTTCCTATTTCCAAGTTTATACTTCTTCAAAATGTCAATTGTCTGATAAAATACATAAACACCATATCTTGAATGAGCTTTTCTAATCAGTAAAAAGCAGAGTAAAATTGAGAAGAAAAACTAAGATGAAAAGAGAGAACCCAGAGAAGAGAAGACGAGTAATCCAAACCTGAAAGATAAAATACTTGCAATGGTCATTGGAGAGGGGCTGAGAGGATTTGATAATCTGATGAAGATCCGTATCCATGAGCTCGTAAACCAAATAAACATCCTTAAAGTTTTTTGTATGGATCGGCATCATGACATCCTTCAAAGCAATCACGTTATCGTGCCTTATGTGCCTGAGAAGCATCAGTTCCCTCAGCGTTCTCGTGGCGTCGATGCGATTCTCAAACACATTGTTGATCTTCTTGATCGCCACTTTCTCGTTCGTCTCTCGGTTGATCGAAGAACACACCACGCCGTACGCTCCTCTCCCGATCGGCTTGATCGGAACGTACTTCGTATCGATTTCAAACAGAGTCTGCCACATTGTGAAATAATGCTTCCCCATTTCCCTGATTCCGCTCGGTCCCTCCACGAATGTGGCCATATTCCTTCAAATCCCACAGATACGTAATTGATCAATCGCTAATTCCGCAACACACACATTAATCACAACGACGCGAAAAGGGGTTTTTCAAAAATCCGCTGAAGTAAGAAAACGGAGTAAAAATCGGGGAAAATTTATAACAAAATAGGAGAAATTGCAGAAGAGAAAAGGGTTTCAGAACTGATCCTTACTTGTTGCCGCAATTCTTCAGCCTTCAGAAAAGAGAAATTCTCTCAACGACGATCTCTTCCCAATTCCGTGCACGTTTTGGAGATCACCCACCGATCATCCAAATGTCAAGGCTCGTGGCTTTCGTCAGAAAGGGGGTCTTGATGAAGCAACGAAATTCGGGGAAAATTGATCGACCCAGAAAAAGAAAAAGCTCACCCACCACCAGAAAGGGGCAAAGAAAGCGAAAGAAAGCGCTGAGAATCTCAGTGGGAGAAGAGAAGCATTGGGGTTTGAGAAACAGAAGAATCAATCAATCAATCAGAAGAAATTTGAAGTTGAGGAAGATGAGAGAGAGGAGAAAAGGGAAAAAAGTTGGAAGAATGGGGGAGGGAAATTGATGGCTACGAAGCCCACGCGGGCTTTATACACTACACGCCCCACTCTGGCGCGCACTCCGTCTCACACTTCTACAAGGAAAGTTTTTACCTTTTCCAGTTTGAAGTAGGAAAAGGAAAGTTTTTTTAATTAACTGAGTTTTGATGATCACGTTTGATTAATTCTTACATTTCGAATGTTTGCATTACAATATTTTTTTTCCTTTTTAATTCTTAAAGTTAACCTACATAAATTTGAAAAAAGAAATATATTGATTTCCTTCGTTATTAGTGTTAGGTCAGCTGTATTTAGAAATAAAATGTTTTATTATTATTAATTAATATTAGAAAAATATTTGTATGTTTATCGATAAATATTTATCTTGTGCCAACTGCTATTAAGTTCTCGATAAATAGAAAAGAGAAATAAATAAAGTGAGACTTTTTCTTTTATATTTCAAAATAATAAGAAGTTGTCAAAATTTTAGTGGTGATCAGTAGAAAGATGATACTCAAATATTGTTCTTGATATTATTGACTAAAAAAATGATGGGAAAAATGGGCATTTGAAAAATAAAATACTTAGGTTGTGATTGATGACAGATGAGAATCTATCTCTTCTCACTACCATTAAAAAATTGAAAAATTGATAATTTTTTAAAATATTCTTTGTTTTTTTAAGTATAAAATATGATCAAAGTATTTTTATTTGAACCAAATAGGTTCTTGCAGCCCATAAAATAGATCTACTTTCAAAATGAGATACGTTACACGTGCTACTTTATTCTATTCATTTGGGTTACTAGATTTTTGTTTTCTATTTTTAAAATTAAACCTATCCAACGCAACTTCCATTTTATATATCTACATTTTAAAAACAAGCTCAAAATATAAGCCCTTTAAAGCTAAAAAAATTAGGTTTTAAATTTTGTTTTCGGTGTTAAAATTTGGGTAAGGATTTAAACGTGTTGATAATAAAATTAAAAAACACAATTTTAAAAATAAAAAAAGTAAAAAAAGAATAATGGGACCTAAATAATAAAGGCTCAGTTCATCAGGCTGAATGAGAGTAGTTTAGAGTATGGAGTTAGGCTGAAGTTGCCAAAAATTTAGTTAAGTTAAAGCTTAATGATAATTGGAGCAAGAAGGCCACAAAAGGAAAGTTTGTTTAAGCTTTTTAATGATTTAATGAAGCTTCAAGTAATTGCCCTTTTACAAGCAATCCTTTCATTCATTGATTCCAAATACTAAAATCTTCCGTATCTTCAAAGGAACCCATTATTCACCTTTTTCTTCTTTTTCTTATCCACAAACCCTTTCTTAATTTCTCCTCTTTTCCATTTTTCTAATTTCTCCTTCTATTTTTACCTAATTCCTTTTTCGTACCAATAACTTACCCAAACTAAAAAAAACCAGGTTCGCTGTTTGTTGATATAACAATAAATGTCGGATATAGAGATTTGAATGTCGAATATTGAGAGAATAGCTTATATATTTTTAAGACCGAGTTATGCTCATGTTGACAATATAAAGACTAAATTTGGATGATGTTTTCACAATATCTATAACTATTTATTGTATGGATTTTATTTTTGAGTTGTAATTATGTTGATTGCTGGAAAAGTATGAACTTCTTATCTTACAAGAAACTCTTACATCATCAAGAATATTTCACAGTAACCATAACACTTATTTTTACTGTAGATGAAGCATTCTGCGCCATAAACTATTTGAAGTATACATTTTTTTTAATACATGCGTTTTCATTTGGGTATAGAAGTTCGGTCATTTGTTGTAAACCATTATTAGGAAAGGAAAAAAAAACTAAATGACAATAGTTGATACTATTTTGAGTAATTCTCAATTTAGTGTTTCAGTATTTTAAAACTTTCCATTATAATGTATTGAAAATTCTAAATTAGGTTCTTAAAATATGTTAAGAGAAAGTTTGCGTCTCACTCAATTTATTAACATATTTAGACATGTATGCATGCCATATAAACATATTATTTAGAACATATATGGATTTTAAAGGTAGACGAGTTGAATTTATGTGTCCAATAATATCCGCTATGTTCATATGTTCAAACATACTAATAAAACAAGGATTTTTTATTAATGTACTTTTTTTACAAAAGTGCTTAATTGAAAATTTAAACTAAATTAAGGACCAAATTAGTATTTGCCTAAAAGAATTAGTGATTATTGGGTGTATCTTGAGAAAAGAAAAAAAAAGTTTAAATATTATTTTGGTCATTCTAATTTTGACTTTGATTCATTTTGGTCAATTACTCTCAATTTCTATTTGTTTTAGTTATTATACTTTCACAATATTAATATTTTTATTTTGGTCATTGTAAGATAAAAATAAAAATGAAATAATCAAATAGTCCATTTTTTAAAATACAAAAACTAAAATATTAAAAGCGACCCAAATCAATTAAAATATACGAAAATAGTATTTAAAACAAAATAGAGAATATTATTGGAATTGCTTGGGTAAATACCCACCATAATGTTAAGGGAAGTTGAAAATGATTTCCAATTATTTGGCAGAAACACGGATTGCGATGAACATTTTTTGCTAACAAACTTACCATCACTAATTTTAATGATGGCACTTTTATTTTTTTCACTCTTTTTCCGGTAAAGACCAAATTGAAATTTGAAAGGGAAAGTATGTGGGTCCCATCGTCCACGTGTAAAGAAAATTTCAAAAATATTCCACGAATGAAAAAATTAAAAAAGGTGTTTTTATAGCTACCCATAATTAATGCCATTTGCTATTATATTCATCATATCCATTTTGACGAGAGAGTTGAAAAGAACTCACTCGTCATTATCAATTTCTATGGCTGACGTGTCGTTATCTGATTCGACCTCCTGGCCTCCGGTGGCGTTTTGCGCATCTTGTACTTTCTGGAGAGTGCATGAATCAATTTATTTCTACATATATTATGTGGATTTTTGGTTTTGCTTTTTGTAATAAATTAATTTGACCACGTGGCTTGTGATTGTATTTTTTCTTTTTAAAAGTTAAACACATTTGATAATATTCAGATATTCTTTTGTTTTGAAAATAGTTATAATATTAAGAGTGTTAGTATTAACCAGCCGTATTAAAAATTATGAAGTTTGTTAGTAATAACACGTGTCACAATACAACCACTCTTATGTAGCGAAAGCAATAGATGTTAAGAAATTAGACATTAGATAATTTTTCATGAAATCGGAAACATGAGTCCAAACATGAACTTTGTCAAAATTTAACCACAATATAAACTTTAAAACACACAAAATTTAAATAAATAAATTAATATGGTCTCAACCGGTTATCTCTCGTTCTCCCTTTCTAAAAATTAAACCCACACATAAAAACTACTTATCTCGTTTGTAATGGACTAAAGTCCCACATTGAGTAGATGGAAAGAATGATTATGTGTATATAAGTCAGCGATATCATTTTATTAATACGACAGCTCTTTTGAGTATTCAAAAGGGATTAATGTCAAATTGGACGGTATTTCAAACTATTATAAAAATGTGGAGACTACTTCAAGCTAAATGTCCAAGAAGATTGGTAGCGACTATCCCGATTTTCAATTTTATAACATTTTCTAATCATACTTTTCATGTCAGTAAAGAATGTGAAAATTGGCCTATGATAAGTTTGAGCATGACATGATCATGTGTAAGCAAGCATAAATTTTAAGAAACAAAAGCGTAATTGATCATACGGGTTTGGTCTCGAAGTGATTGTGAAGAGAGATAGCAAGAGTGATGTCATGAATAATTGATCCACATTTTGGCTACGCCAAAAGCAAACCAAAAAGTAAAAGAAAGGTGACAGAAAATGAAATAGTAAAAAAAGGGAGGTGAATTAGGCAGAGGTTAGAGTCGAATCCAAGTCACAAAATGGAGAGATTTTGGGGAATCAGATTCTGTTGGCTTTGCTTACACCGCAATGCATGCAATGTATAGTAAAATGGATATAATTTTGAGCCCAAAAACAACAAAATTCTTGTCTTTGTATTTTTGGTGCGCCAAAGCAAAAGCAAAAGCAGGCCTCTAATTCCCTCTCAACGTGCCCACAGGTGGCCTCTTTGCCGCCTCCTCCTGCTTTGAATATTTCTTACCTTCTAATCACTCATATACATTATACACTACACCTCCACACAAAACCAAAAAATGTTTACCTTGTCCAAAATATTATTCTTTTTTCGATTTTCGTGAGTGTTCGGCCCAACTTGCACACACTTAGACTAATCTCATAGATGGTCATCATGGATTTGAATACATTCCCTCTAAATCCTTTTGATTTAATTAGCTTAGTTGGTTCGTTTGAACAAATGAGGCACTTATGACGGTTAACATTATACTCTTCTTGGATTTTGTAAAGATTAAATTACAAATTTAGTTAACTGAATTTTTGGAGTTTTATCTAATTGATTCTTTGAAATTAAAGAAAAAAGTATTTGATATATGTTCTTGAACTTTTAATTTTGGGTCGAATAGATTTTTGATCTTTTGAACATTTTTAGAATTTAGAGACTTATTGGGGTATAAAATTGAAAGTTCAGGAACTCTTGGATAGTAATATTTTTTAAAGTATAAAAGATTTATTGAAAGTTTAGAAGCTTATTAGATACTTTTTAAAGTTCAAAGAACAATTAAACAAAAACTTGAAAGATTTTGTAACTTAAATATATTCTTAATGGTTGATACACATGATAATTTAAGTTAAATTGCATATCAAAGCTAAGTATATAGAGCTTGTTAAGACGGGGTAATATTGAATCTATATATATTTAAAAAATGATAAAGTTTAACTGCAAATTTACTCACTCAACTTTAATAGTTGTATAAATTTAATTTGATTTTCCAAACTAAAAATTACCATGTACGCATCTTGAACTTTTGAGTTTGATTCTAACAAGTCTAAATGATTAATATATCTAAATATTTATATGCATGTTGATTGAATTAATAAGTGGCGATTTTGCGACACAATGAAGAAGTAGGTAAGTTCGAATAAACTAGGGGTAGATGGGTGAGAAATTTGATGGTGGGAATTTTTAATTTGTTGTTATTATACATTATTGATTAATAATTGATTAACTCAATTTAGATAAAACATTGACTACTTTTTCAATTATTGTAATTCTTGAAATTACTATATCTACAAATGCTCCTATAATAATGTTTTTTTTTCCTCCGTTGATTATATGGCCTAACCCTAACCCTAATAGCCCCTGCCCACTTGCCCTTTTTTTTTTCCCTTTTAAAAAAGAAATTAAAAATTTTCATTGCTATTTTCCTCTGGTCAGCTTTTGTACCATTTTATTCCTTCGTGTGGTAAAGACAATGGATTGATTTTGATTTGGTCGATTTCAATTCCTTTGATTTGTCACTTTCCCGTCAGCCTAAATTCATGGAATTGGGAATGGGGGAATCCATTGCACTTGAATTTTAAGCCACCGCCAATAACTACCTTTTTTCTTTCCTACGAAACTTATGATTAATAATGCAAATATAACCGATGGTCTTGAACATAGGTTATCTGATTAGGTATTAATATTGTTAGGGCAGAAAATTATCTTTTCTACGTGGAGGACAGAGAAAGCTGCAAGTGTCGGATTAGGTCTTACCTAAGAACTATCTCGTACATATTCGACTTGTCATACTCAACCACAAAACGCAATGGAGATGTCTACTAGTAGCCTGAACATCATTCAAATTTGATCTTAGGCACCCGACATATCCAACCTTTGAACTGACACATATAATTAACTGTCTGTCGTACCCCAGCCTATAAATAGGAGAGCCACACCTTCACATATCGCATTCTATTTCGAACTCCCTATTAAGTTCGAGTTTAAACTCAATTAAACGTCGGAGTGTTTGCATATTTTGTGCAGGTCATTCCTCATTTGTACGTTCAAACAATATATTACACCTGTCTAGATTTGACCCGAGACTTAATTTTATTACATAAACAAATATCTTTACTTATAAGTTTACATTAAAAATAAAACATAAATACTTTTCTTTAATTTTTTTCCTTAGATTTTCTTTTTATCATTGTAGTTGACTCAATAATTAAGCTTATTGAAGTCTAATGTCTCAACTTTGATTAGTAGTCAAATTAATAGCCTCAATTGTGAATAGCTAAAATAGTTTTTTGATTGGACAAGAGTACTTTTTGGGTATTAGTTTTTGCTTTTTTTAAATTAGTTTTGACATTTTATTGCTGAGTTTTTTTACATGTTTATTATTATTTTGTTAATTTTGTGTAGTTTCCATGATTAAGTTTAAACACATTTCTATATAATTAATTTGAATTTTGAGTATTTTTTGTTTGGTTGAATTTTGGGTATACATATATATATATATTGGAATGTCAAAAACTAAACATGGAGTCCTACACTTATACTTTTTCAGCTGGCCCTAAACTCAAGATGTGAGTGAGGCCCATTAACACATACCCAAAAATCAATTTAGACCAAATTCAACTAGTTCCATTCCATTTTAATTTATTCTAACAAAAAAAAAAAAAATTTTACTTTGCATTTGTAAAACTGAATTGTAAACATCAAGCATTACCTAAATAACATAAAACAAATATGCAGTTTCGAATGTTGCAAAAATTTAAAAATTTTACAAAAATAACATAATTCAAATCAAACTCAAATAAGAACGGTCACATTTATACTATATTTTAAAAAATTGAAGAGTTTTGACATTTTATTTAAAATACATATTGAATTTATGTTATGGAGGCAACTTTCTTTAATTTCTTCTGTGAAAAATAGTTAGATATTCATTGACGAGGATCTATGCTAGGCACACCATCATTACATATTTGACAACTAAAAAAAAGAAATATAAAAATAGAGGATTTTTCTAAAAAAATGAAAAAAAAAATTAACTGTCAATTTTTTAATCACGATCTACCTAAAATATGAAGACCCAAATATATCTTTTATTTACTTATTTATATTAGATTCAATAAATAATTAAATCTTATTAGTGGTTAAATAGTATTAGTGGGGAGAGTTGTAGTGATTGCCACCAACTCTTTTGCAAGGGACCCATACTATTTGACTACTAAAAACACAAAAATTGATACTTTATAGGCGCTGATTAGTAGTAGTTTCTACCTACTTTTGTATTTGTCTTTTAATGGGTAGAATCAGCAGAGCAATGAAAATACAACACACTATAAAATCAATAAAAGCTCTTTCTAAAAAAACAATATTAGAAGAGTATTTCTGTATTCTAAACCATAGTTTTCTTTTTTTTTGTATCTATTTAATTAAGCTAGCAACTAATAATTAATCTTCCTTCCCTTAACAAACTTCCTTCTTGAAACTCTAGTTGGCACCTTCTTCTTGGGTTGTAATTTCAATCTCTTAGGCGCCTGCGTTTCATCGCCATTAACGACATTATTATTATTATTATTATCTGCGGCGCCATTGACATTATTGTGGTGCTCCTCCTCCACCTTCTTCCTCTTGAGCATGTTGACGAGGCCCTGGAGGGAGACGTCGGCGTGTTCGGTGGTCATCAATTCCTCGGCGATCTGGGCGGGGGTGACGTGGGTTTGGGCCAGGAGGGCCTCGATCTCCGGGAAGAGGCGGTGGGGGGAGTGGATCTGGAGGTAGTTGGCGGCCAGAAGCTTGAAGGCGTGGAAACTGCAGAAGGACATGTGGATGTGCATGTCCATGCGCCCCGGCCGGAGCAGCGCCGGGTCCAACCGATCCTTGTGGTTCGTCGTCAACACGATGATCCTCTCGTCGCCACAGCTTGACCATAGCCCGTCTATGAAGTTTAAAAGCCCTGACAGCGTCAACTGCAAAACAAACAAAACAAAAAATTATTTTTTCTAACTTAAATATTTAAATTTTTTATATTATATTAACAAAACGTTTATATGTGTTGTAGAAAAAAAAATTAGAAACAATAATGATAAACAAGAAATTAAACTTGATTTGATCATTTCTAAAATTTCTATACAATTTTATAAATGTTTCTTAAAAATAAGAAGTAAGAAAAGGCCCCATTATTAAAGTGGGAACGATACCAAAAGGGTCGTGGATAGTTAAAATTTGGTTTTGGTTATACTAAAAATTTCGCAACATATTCATAATCGTGCCATTTATCTATAAAGCAATTAATAACATAATAATAGCAAAGACTAAAAAAGTTATTTTAAAAATTCGTGGACTAAAATCGGTATTTTAAAAGTTCATGTAAAAAAATAAATTTAAACAAATAACTTTAAAATTTTGTAGTCTGGCTAATTAAAACAACTTTTTAAATTATATATTATGATGTTTTTGTTAAGTATTTTTTAGTTTTGATTTTTTTAAATGTTTCACTAAGTATTAATCTCGAAACCCAGAGTTTGATATTATTTGAAATAGAGCTAAGTTAATTAATCCAATAATTACTGGAAGATAACAAAATTAAAAGAAAAAGGTACAAAAAGCAATTTGTTTGTTTTTCTTTTTGTTAGTTCATATGAAAAGCAAAAGTCAGTATTGTACTCCACTCCAAATAAAATGATAATATATATATATATATATATATATGCGAACTTATCTACTCAAAGATATTTAATATTTATAAGTTTTTGAATGTCCAATATAATAGTTTCACGTGATTGTTCCTTTAAAATTGGACTAATTATGGGTAAAGTTGGCTTACACTTTCACAATTATATATACATATGTATATTACATGTAGAACAAGATAAAGGGAAAAAAAGGGATTAATATTGTATAATTAATCAACTTTATCCTCCACTAATCTAATAAGACTCCCTTTTTTGTCACACTTTTGAGAGCACTTTCCCTATATAAAATAAATAAACGTGAAGTTGGCTAAGATTAAAAGGATGGTTAAGGCTTGAACTATAAAAGTTTAAAAAGAAGAAGTGACTTGCATTGTTTGAGAAAACAAAGAAATACCTTACTTATATATTTCCTCTACAAAGGAGAAAACAAATTAAAAAAAAAACGAATTCATTATTAGCAAAAGCGTAGTAAAAACAAGATGCTCGACAACTTAATTTTTTCGTCTTAGATTTTAATATTTCTAATTTCAATTAAGCCCGATTAAAAAGATTGTTCTCACGTATCTCCGAGAAATTACAAAATAATGAGATTTCAGGGGGAAGAAAAACAAATGTTCTAGTTCTGTTTGGGGAGATTTATTCAAAAATTGATCTCGGGCATTTAAATTTCTAAATCAATTTAATTAGTAACCCATATCTACTGGTCGGTAGGAATCTTTTTTTTGCTACCTTTCTATTAGTCTTTAAGAATTATTTTTAAATTAAAAAAAAATTAACATGTGCATAATTAAACGATAATTGTATGTATCTCGAAGTCCGAAGTTCGATCACCCGAAAAGAGAAATGAAATGGAGCGGCTGACCTGAATTTCGGCGGAGTGGGAGGGCGGCCAATCGCCGAGGCGGCGGTCCGGCAGCTCGACCGTGCAATCAATATCCTCGATCACCAAAATGGAGCGATTCCCGGTGGTCAACAGCAGCTTCCTGAGATCGGAATCCTGCATCACATTGGCGAGCTGCAGATCATAAATATCAAACTTCAAGTAATTGGCCATGGCCGCAATCAAGCTGGATTTGCCGGTCCCCGGCGGGCCGTAGAGCAAATAGCCCCTCTTCCACGCCCTCCCCACCCTCTTGTAAAACTCCTTCCTCTTGACGAACCTGTCCAGATCCTCCATCACCGCCCTCTTCAGCTCCGCCTCCATCGCCACCGTCTCGAACGTCGCCGGATGCTCCAGATTGACGGCCTCCCACTTCCCGCTGTAGCAGCCGGAGCTGCTCATGGTGTGCATTTTGAGAGCCCTGGATTCGTTCTTGATGGCGGCGGCGCGATCGAGGAGGTGGGGGATGTAGGATCGGAGGATTTTTTGGTAGTGGGTTTTGTGGAATTGGAGCTCGAAGTAGCGGCGCTCTGTTCTGCCGCCCGGAAACAGAGCGTTGTTGTTGGGGGTGTTGCTGGATTTGTCGTGGTCGTGGGAATTGAAGGTCCACAGGAGCTCGATGCCGTCGAAGGAATCCACCAATTTCTCGCCCTTTTCGAGGCGGAGGGTGGGGGATTTGTCTTTGGGGGATTTGGTGATGCGGAGGCGCGCGGTGGCCGGAGTGATTTTCGTCGACAGGTACGTCTCGGCGGCGTCGTAGATTTGGTTGGGGGACATGCCGGAGGATTCTTCGATCAGGAGGGTCAGGAGAGGGGAGGAGGAATTGAAGAGGCGGCGGACAGCGGCGGCGATGTAAGACCGGATCGGGCCGGGGATCAGGTCGTTGGCCATTGATCGGAACAGCATTAGGGAGCCGGCCATTGACGCGTAAGCCGAGAATAATGACTGTGGAGACGGCATTTCTTTGCTCGAAAACATGGCGCTGCGGCGGTGGCGGCGGCGCTCCGATCAAACTTCCGGGGAGGGAGTTTTCGGTGGAGGGGTTGGTTTGAAAGTTCTGCAACGAAGAACGAACTTGGCTACATCAAGAGTGTGTGTGATGTGAGGAGAGTGTACTTTAAAATCATAGATGTATAATTTTATAAATAAAGAATGTCTAAAATTTAAATGGAAAAATAAAAAATAAAAATCTGTTCCATAAAATATTTTCCTTATAGAAATATGTCGTTGGTGATTTTAGATAAAGAAAATATCTCTATAAAAAACTAAGAGCAGAAGATAGATCTTATCAACTATGGTCTAAGTACAATTATTTTCCATTTAGATAGGTATATGAAAAATATTTACATACTTACTCCGAGGAGTTTGACCATGACTATAATTTGCCAACTCTTTATTTAAAAAAGAAAAAATTTTATTTTCTTCTTTTATTTGTCAAAAATTTAATAGTGGATAACAAAAAGATTAGTACTCATCAATAAAGAAAAAACTTGGATTCCAATAAGAAATTAATAATACGTCCACATGGTTCCATAATATGATGACAAGCCCTTGCTATTGTTTTTTTTTTTATAATTATTTTATTAAAACTTATATAATCACATAATTTATTTTAGTTTTTTTAAGTGGTTTCAAGACTCTTCTACCATCTTTCTCTCTCCCTAAATCGTCTCACCTCCTTTTTCTCTCTTCTTCCTCCCCTAACTTGATGCAGAACTCATATTTGGTCGAAAGAAGAAAAAAATTTTAGCAACTTAGAATCTAATGTTCAAGCTTTTTCAATTACATCCATTTGTAAAAAATGGCTACGAACAAAAAGCTACAAAAGTCTCCATTAAAATTAGAAGGAAGACACGTAATGAAATAATAGAGGAGAAAAAAAATTATATCATGTTATGCGACTTCTCGACAATCATTTAATTTGTGAAGATGTATTTCATTTTTATCATGTAAATTTGAGTTGCATCATCAAGTTAAAAAAATTGAGATGAATAAGGGAGTAGGGAGGAGGAGGTTACGGCACTGAATTCAAGTTGAGAAAAAAAAAATAGAGACGAAGAAGAAAAAGTAGCCGAGAAGTAGTAGGGAGAATAATCGTCCAACCAGTTTTAAAAAATTTAAACATATCTTGGTGAAATTTTTCAATATCAACGTACTTATGCGGTTAAGATGTATAACTCCTTGCTTTGATATTGGAAGTTGAAATCCTCACTTTAAGTAAACTACTTAAATCCGTTAAAGTGAAAAATAAATAAATAAATAAAGACACGTGGACCAAAAAGCTTCAATTTAAAATATTAATGTGCTTTTGTTTTTATTTTTGCATTTTTTTAATACAACAATTATGGAAGGTAGGAATTTGAACAGAAGAAATATATATTTTTTGTAAAGGCATGTTGAAACTATGCCAATGTTGGTCTTTGCTAGTATTATAGGTAAATTTAGAGTCTACCATGGTAAATAACTCTCACTTTAAAACACGTGTCTGGGTCTCAGTTCAGACAATCTAAAGAAAAATGAGATAGGCTAAATCACCTATGATCAGTCTAACGGAAACTCAGCTCCATGTCGAATATGGAAAAAGCATATGTCACCGACACAAAATCCACTGTCTATATATGATGCAAAAATGGCAGAACCACGCTTCCCAAAACTCCCTTGTAAAACATAGAATCGTCCCTTTAAAGTATACATAATCAAGTATCGCATAGTTAGGTACTTAACTTGAGTGAGTAGGTGTCCACTACAAATATGAAACTGAAGTGTCACATAGTCTAGAATCCAACCTCAACAAATGGGTTTATAATTTAATATTGAAACCATTATTTTTCGAGAGAGTTCGCCACAGTTGGTTGGAAAATAGGAGAGAAGAAGAAAAAGAAAGAGAGTGGAGAGGAAGAGTGGGAATCCCATTGTACTTTGACATCAGAATTCAGAGTCCAGAGAGGAAGAGCCAATGGGCAATGTTTGGCCCTCACTTTAATGGCATCCTTTTCTTCTGCTTTTTCTTCTCATTAAAGTGCTTTCTGATTGTGATTACTATTTTAGTTCAGTTTTTAGAGAGAGAGAGAGAGAGAGCTATAAAATTAAAATGTCATTTTCTACCCCTGCCCCACAAACAGCTAGCTACTTTTGGTTCCTGACTTGGTCCAATATATGAAAAAATACATTTTTGTGTTTGTTTAATTTTTTTGGAGCATAAGACTGAATAATAATTGAGTTTTTTTGTTTGTGATGGACCAATTTAAGAAAAGAAAATTGTTTGAGTTGGTTTGGTTTACCCCCCAAAAAAGTTTCAATTTGGTATTGGTTTTGGCTAAAAACCAACTCAAATTTATATGCACTATAGAAAAATTTCAACTAATTTATCACAATTGCCTCTCTGTGAATTTATTTAGGTTTAATGATCGAGTAAAATTTGTCGTTTAGTTTTAGTGGATCATCAATTTCTCATAAAAATAAAAGTCATTGGTTAATCACAAAATAGTATTATGAATATCAAGATGAAAACGACAAAAATAAACTATCACGATGAAATATACACAATTTGTTCATTTATTTATAGTATATTTAAAAATAAACTATCAAATTCTTCCATAAAAGAACCAATTAAGCAAATGGTTGAGAAGAAATGAATTTCATTGATGGAAGAGTTAAATGAAATGTAACAAATAATATTTGAGTGACATATTTACGTGTCTGAATAGGTTAATAAAATTATTTAATNAAGAAACATGGAAGATATCTGGAAATTCTAAAAGGGAAAAGAGAGGTACAGTTTTTGATGCCAATTCAATGAATGTTGGCTTCCATTCTCTTTTTAGTCAATTTTCAGAAACTATCTCTCATTCTCAACAAACAAACAAAAATTTAAAATAATGCTCCAGAAATTTAAAGGCCGAATGTGGCCAGCCAGACTTTATTATCACTTCCTAAAAGTCTTCTTTCAAAAAAGAAAGAAAAGAAAATCTTTTGAGGAAGGTGAGATTGTGAACGATTATTTTTGCCAGTGTGGAGTTTCCATGTGCGGTTTTAGAGGTCAATAATTGAAGAGATAGATGTATCATGTAAAAAGGATGGGTGTATCCCAAAAATCTAATCTACCTAACTCATCGGTACAGTTTGAGTTAGATTATAAATTTGTTTTTTACTCAATCTCCGATTCAAATAAATGAAAACTTTAAGAATTGAGTTGGTTCACTAGTTCATCTAAAATAAATTTGAGTTGAATGGTAACCACATAACCACACGGGACGGTAACAAGATTCAACTAGCTGGCCACGCTTCTTTGAGAACGATTTTTTCCTCAATTTGAAACCAGGTTCTGTAAGTCCAAATACACCTAAGGCAAGTCCAAAAGAAGATTTCCTCCTCCACCATTGGACATGGGAGGCTGTCCTTTTAACTTGAAATTATTATTTTTTTTTACTTTTTTTTAGAGAAAATAATTTCTTTTACTTGTGATAAAACAATATAAATTTATTTTATTTTATTTCATTCAATACTCTAATTGCTCAATAATTCTTTAAAGATTAGTTATTCTCCAACAACTTTTAAAAATATATTTTCAAAGTCTTTTTAGTCTAATTTTTTTTGTCACACAATATTTTACCGGAATAATTTGAGTCAAACTCAATCCAAACATTATTTAGTAAAGATTATTTAGGTTAGAATTAAAATTTAGTCTAAAAAATATTTGAACTCAATTCAATCCCACCCTCGAAAGGAACTTGGAGAAATCAACAAATAAACCTTATTGGTAGGTCAAAGTCTTTATTCAAGTCGAGGCATCAAGCAATATAAAATTTGCATTAGTTTACTAAATTCGCGTGCGCTAATGTTTGACACTTTACAGGATTATGACTTCACTTTCGGCGTTCTTGGACGGAAAAGGACTAGTGGAAAGCAACTAAAATAAATATATAGTTTCTTTTATTCTATTAATTTGGTTCAATTTTACATTTGTTTTTTGTAGTCTTTAATTTCGTTTCAATTTGTTTTTATTATGGTTCTATATGATTTAAGCAAATCTCACAAATTACCCTTATTATGCAACTTAAGTTTTCTAATTATGTGGTAATAAGGTGGTGTTTTGCATTTTACTGACTTAGAAGTTAGGGTAAAAAACAGATAAACAACAGCTTAGAGATTATTTGTGAGGTTTAATTTAATCCATTAAAGCTATAGTGACTAAAAATTGAAATTAAGTTTAAATGATAATGATCAAATTAATAATTTAACCTCATTCATATAAAACTTCAAGTGGTATTATGTTTTCTATTTAGTAGCAATGAGTTGGTGGTTTGTATTTAATGGTGGTGTTAGAATTTAAGGTCATGCGAAAGAAAAAGAAAAAATGATGAGCTTTTGAGCTATTTTTGCTATTCATTTTTAAACCATCGCCATATAAGTGATTGTCTAGTTGTTACCAATACTTGTCATGTATTTCGAAAAGTTATGTTCGTCATTGTTCAATTTACGACTCAACAACCCATGTCAATTTTCATCACTTGTTTTATGGATAAAATTTTTAGGGGCACATTTGATTCAGTTCTAAAAGTCATGTGAAAAATGAGTTTTTGAAAACTTAAAGATATCTCGAATAGTTTAGTCTAATTTTCGAGCACTTAAAAATTTAGTGGTATCATAGTAATAGTCACATACTCTAAAGTGATCTTAAAATTATATATTTTTTTAAGAAGTTAACGAATTTATAAATAACTTCACAATAATTTGAATATTTTGCAACTCCCACTAATGTTAATACCAACAATTTTTTTTAAATCATTATTTATATAGAATTATTTACAAAATAATTTGGAAAACAAGTCCGCAATTCCACGTGAATCGTGAAGTCCTACCTTAAAATTTAATTACAACTTAAGACATACTTTTCCCATAAATTTGATAACTCAATATTTTTTATTCACGAGGTTTTGACTTAAATGTCATTCTCATCCTTGGCAGTAATCCTTCTGCACGTTTTAAGTTGTGAGGGCAAAATTGTAATTTCGCAAAGATGACATCAGCAGAGAGCAGTTTTTTCCCTCTCTGGTTATGGGCTCGATTTCAGAGGCCCAATAAAAAGTGGGCCATTTTTACACCAAAAGCCCTTACATTATGAAGCAGATTTAAGCCCAAACTTGGGGGTCCTGGACCTCCTGGTTCTGGGTATCGAAACGACGCCGTATCAATGGTTATCTACTACTCCTGTCTGAATGCAAATCGCGAAGAAACGAGCTATCAACAACCACTGTAACAATCTGATTCGCTTCCTCGCTGGAGCTCCGACGATGGAGCTAGCGTTACAGGCGCCGGCGACTCTTCCCCGGAGCAAATTCCACACTCCTCCCTACTCCTATTCTAACGCTATTTTCACTTCCCGGCCCGAGAAGCAAACCTCATTCTCTCAATTTTCCCAGAGCATTTTCCGCGAAGCCCACTCCCCATTCCGATTCCGACCCAGAACGCGGAGTTCCGTGTTTAAGGACCAATTGGTTAGCATTAGCGATGATGAGTTCGTTGAAGAAGGAGACATAGATGGGGAAGAGACGAGCTCTTCGTACTCCGATGATGAGCCATCGTTCTTGTCTCTTAATGAGAAGCCTGATAGGAATTTGACGTTGCTCGACGACTACGAGATGGAGGAGCTTGGATATGCCTGCGACCGTAACCATAGAAGCGGTTTGTTTACTTCTCGCTCTCTATCTCTGTCCCTCTTGTTCTGTTGAGAGAGAAATTGGAATTGTGAGTGGTTATTGATGAAATTTCAGGATATGTGGCTCTGCTAGGGAAGCCGAATGTTGGGAAGAGTACTCTTGTAAACCAATTGATAGGGCAAAAGCTGTCCATTGTTACGGATAAACCTCAAACGACGAGGCACCGGATTCTGGGTATATGTTCTGGGCCAGAGTATCAGGTTTGATTTTACTCATTATTGATTAGAATATACTTATTTTAGAGCTCAAATAGCTTGTTAAAGTTCAGATTGGTATGAAATTTAAGAGGCTGAAAAATATTTTAGTTGGATTGAAAAATTTTCATGTCCAAAAGTGATTTTGAAAATTCTGATAATACCTACATATGTGAATGCGGCTACAAACATGCTTGCCATTACCACCCAAAATCATCCAGTTTGAAGTGAGTTATCAGTACTTTTGAAAAAAGTCAAAAGTACTTCTAGTTCTAACAATTTGTGAGAAAATACTTGTGGGGTGTTTTTAGCTCAAGTGCTGGTTAGAGAAGCTCTTAAAGCACTTTTGAGAATGTAGAACAAAATTTTAAAGTGCACACGTTATACCATATTTATGTGGTTAATCACTTCCTGTAGGTGATACTTTATGACACACCTGGTGTCATTGAAAAGAAAATGCACAAATTGGATTCCATGATGATGAAGAATGTGCGCAGCGCCGCCATTAATGCAGACTGTGTTTTGGTTGTCGTTGATGCATGTAAAGCGCCTCAAAAAGTATGTTATCTCGAGTTCAGAATTGCTTTTGAATGTGTGGTTTTGTTTTCTTTTCCTAGATTTACATTTGTTTCTTTTATTTGGGATTGTAGATTGATGAGGTGTTGGAAGAAGGTGTCGGAGACCTCAAAGAAATGCCTCCCACCTTGCTGGTTTTGAATAAAAAAGATCTGATCAAACCAGGTGAAATTGCAAAAAAACTTGAGGTCAGAACTCATTGCTTGATGTTTTTCTAGGTGTGTTCGAGTAGACTCATTTAAAAAAACTCCTTTCTTACACTTTATTTTTTTAAATTTTGTTTTGCCTCAAAGAAATCTCTTGTCTTTCAGTGGTTCGAGAAATTTACTAATGTTGATGAAGTTATACCTGTGAGCGCCAAGTATGGCCATGGGATGGAAGATGTGAAGGAATGGATACTTTCGAAACTCCCTCTTGGGCCAGCTTATTATCCAAAGGTATGTACCTAGTGAAGCCTTTTTTATCTCGTTACGCTTTACATCTGAGAATAGGCCATAATGATTAATATTTAAACCCATTTGAAAATTGAAATATTTGGACACTGGAGACTTGAAAATTTTCATTTTATATTGTTCTGTTTGTAGCTGATAATCTTTTGGTGTCCTACTAATGAGATTGCACCATTATCATATCAATTGGTTCATAGAAAGTGGTATATAACCATGCTTCTCGTTATTTTAGCAATTTGATGCAACTTGTTAAAAAATGCCACTTCTCTATGTTCCAGGGCAATATACATATTGACTTCATGTTTCATTTTCTTCCCTATGCAATCTGAACGCTTTTTCTGATAGTTAATATAAGTCTCTTACAGTCAGCTATAAGTGTACCAGGAGTTGATATGGATTATGGATAGTACTTTCATCTCAGTTAAAAATCCTTGACAACTTGTTTTTAACTGTCAGTAAATAATCTGGCTTATTACCAAATTGAATTTAGCCTATGTCCATACTTTTATCATGGTCAACATGTCCTGATTGGTGTAGAAGAAAGTCAAGATTATGATTAAGATTTCTAATATAATACAAGAGTGAAATATCAGGAATTGGTAGTGGCTTTGAAGCTGGATAGTTTGTTGATATTATGTTGGATCTATTCATTGAGGAACGTCTTTTTGATTTGATTATACGGTTACAATTTTTCTTACAATAGAATCTAATACTTCCAGGTATTATAGTCAAACTACTTCTCAACCTATCCCATTGATGTATAAACATTCCCTCCTCTTTAAGACCTGTAATTTTTTGAAAAACTTTAGTCTTTTCATTCATAATTGGATTAATAGAAAACCTTTACCTTGTTTCTTTTGAGTTTTCAGGACATAGTCAGTGAGCATCCAGAAAGGTTTTTTGTTTCTGAAATTGTCAGAGAAAAGATATTTATGCAATACCGCAATGAAGTTCCTTATGCATGTCAGGTGCATAACTCTACTATTTTTATTTTTCGTTTTCTTTTTCATTATCAATTATTAATAGTCTTGAAAAGAATTTCTAAATACTAGAATTTTGTCCTTGAAACTCTCCAGGTGAATGTGGTGAGCTACAAGAGTAGACCAGGTGCCAAAGATTTTATTCAAGCGGAAATTGTTGTGGAGAAAAATTCTCAGAAAATCATTCTCATCGGGAAGGTAAGTAGTTATGATAGACATAGGCCATCTTGTAAGTTTTAGTAATATAGTGGTTCATGAGTCTAAAGCATCCAATGATTTATAATATCAGTGCTCCCGGTTGACTAAATTAAACAGTTTTCTGAAGGCCTCTAGGATAATTTCGAGAACTTTCATGCTGCATACTTCCTTTATTCAATGATGAATTTTTCTTCATAAATAATTCTTTAATGTTGTTGGACCTTACATCATGACGTGACTCACAAGTAGTAACCATATTCCTATGGTTTCTGGAAAATCTCCCCCAACACTGCGATCTGATTCTTCACAGGAAGGAAAGGCTCTGAAACTCCTCGCGACAGCAGCTCGCCTCGATATAGAAGATTTCTTACAGAAGAAAGTCTATCTCGAGGTACCATTTCTTACTTCTTATCGCCCTGTGATTGCAAAGATGCTCGTTGATGTATTAATTGTGTTGCCACTGCTGAGCCAGTCTACTTGAATGCATTCAGTTGTGGTTTATCCTGCCTCAAAAGGTATGTCTTAAACAAAATCATGCTTGAACACTGAACAGGTTGAAGTTAAAGTGAGAGAAAATTGGCGGCAAGATGAAGGGCTCTTGAAGCACTATGGCTATGAAGGAAGAATTCGAGCATTGTAGTGTGGAGAATGAGATGGACTTATTTGTTAGGAATCTGCTGACAAGTAGTAAGATGGTTAGTGGTATCAATTGTGTAACTTTGTAGATTTTTTTCCCATCAATTGATTGTGATTTTGTTTGGGTGTCATAAATGGAATGGAATCACCAATGCTGTCATCATAAACCCTAAATTCTAAATCCATAGCCACAAACTTAACAACTTAAAATTGGAAAGATGGGTAGAATGAGAGTGTGTTTGAAAATGATCGGTAGAATTAGTGATTTCGAAAAAAGAGATTTAAGTATAATTTACTTTTCAAAATCACCATCTAAGTAATATCTTAAAAATCAATTTAAAGCGATTTTGAATTTTCATAAAATCTATTTTTTAATTTGTCTAAGAGATTTAAGTATAATTTATTTTTCAAAATCACCATCCAAGTAATATCTTAAAAATCAATTTAAAGTGATTTTGAACTTTTATAAAATCTATTTTTTAATTTGTCGAACAGGATGGTTTTGACCATGACAAATGCCAAAATCACCATCAAACTATAATTCATGGGGTGGGCCTTTGATATTCATATGAAAAAATGGCGAGCCGGTAAAAAAAAAATGTAAACATGAGATTATTTCAAATTCCTACTAAAATAAATCGACTTAAAATATATTTTGCTTGCAGGCTCCAAATTTTATGCGACACTTGTCTTTATTTTATCCGGGAACCAACTCTCTTGTCCAATCATTGCTCGTTAGCCACCGATTCGAATATAGCTTAGTAGATAAAACATCGATTATTTTTTTTAACGTTGAAAGTTGAATACCTGATGCTGCAATTGTTGCAATTGTTGAACTAAAATAAAATAAGGAGAAAAAGAAAAAGTCCTTGTTGGTCCAATATGTGTTTAACGGTCTTGATGAACGGTATTTGATAAGAATAGCAGATCACGAAATTCAGTTCAATTTCAAATCTATTATATCTTAAATTCTAGAGGAGCAAAGACAGCCTTGGGAGTGTTTGTCTCCTAGTTTTTTGGTGGGGGATTTGAATTACTCTTAAGTTTGATTACGCTCCAAAAAAAAAACATGGTCGAAGCGCAATGTCTCTGAAGGCCAGTTCGTCCCAAATGTCCGAGCAATGCGTTCCCTAATCAAACCTCTGTATATTGGTAACCCCTTTTCTGGATTTTGTATTCCCATTTCGTTTTCCTCTCTTTCTGCTTTGAACCCACGCACCAGCTCCTTCAATTCCCGTTATTCCGATAGCTTCTGCTCCGGCACCCACCACCTGTTCGACGAATTGCCCCAAAGAGACGTTTCCTCGCTCAATTCCCTTCTCACTTCCTATGTGCGTGATTACCGCCACTCGGACGCATGGTCTCTCTTCCGTCGAATGCACCGCTCTTGCTCTGCTCTCACTGCCCACACTCTCACCGCTGCCTTGGCCGCATGCTCCGCATTACCCACCTCCGAGTACGGCGCCCAAGTTCATGGCTTGATCATCAAAATCGGTACGTACTCGGGAACTGTTACTAAAACTGCGATCTTGGACATGTACTCCAAGTGTGGGGTTCTTGATGGCTCTGTTAAGGTTTTTGATGAGATGGAGTTGAAGGACGTGGTCGCGTGGAATGCGTTGTTGTCAAGCTTTTTGAGGGAGGGTCTTGCCGGAGAAGCACTACATGTGTTTGAAGAAATGAAGAGGGAAAAAGTGGAGTATAGTGAGTTTACTTTGTGTTCTGTGCTTAAAGCTTGTGGGGCTTTGAAAGCTTTTCGGCAGGGTAAGCAAGTTCATGGGGTAGTTGTTGTGATGGACAGAGATATGCTTGTTTTGGGTACTGCCTTGGTTGATTTCTACTCTAGTGTTGGGTGCATGAGTGAAGCCATGAAAGTTTACACTAGTTTAAGCTGTAGAAAGGATGATGCCATGGTAAATTCTTTGATTTCTGGGTGTGTTAGGAATAAAAATTATGCAGAGGCGTTGTCATTGATGAGCAAGATGAGACCGAATGCAATTGCACTAACAAGCGCCCTGGCCGCTTGCTCTGAGAATTCAGATTTATGGATAGGGAAGCAGATTCACTGTGTTTCAGTCCGTCATGGTTTGACATCCAACGCCCAATTATGCAATGTTTTGCTGGATATGTATGCTAAATGTGGGAAAGTTTTGAATGCTCGAACTGTGTTCAATCGAATGTGTCATAAGGATGTGATATCATGGACCAGCATGATTCAAGCATATGGAAGTCACGGAGATGGGATAAAAGCTTTTGAACTATTCAAGATGATGGTAGAGGGAAGAACGGGAGTCTTGCCAAATTCAGTCACGTTTCTTTCTGTCTTATCCGCCTGTGGGCACTCGGGGCTGGTGGAACAGGGACGAAAGTGTTTTTATTTGGCAAAGGAGAATTATAGTTCATATCTGGGTCCGGAACACTATGCCTGCTTCATAGATATGTTAGGCCGAGCTGGTAGGATCGATGAAGTTTGGAGTCTGTTCCATGATATGGAGACGTGTGGTGTTAAGATAACTTCAAAAATATGGGCTGCATTACTTAATGCTTGTAGTCATATCCAAGATGTTTCAAGGGGTGAGTTTGCTGCCAAAAAACTCCTTCAACTGGATCCCAACAAGGCAGGAAATTACGTGCTGTCATCAAATTTTTATGCTTCGATTGGGAAGTGGGATTCAGTAGATGAATTAAGAAGAATAATGAGGGCAAAAGGACTGACTAAGGAAGCTGGGAATAGCTTGGTC

mRNA sequence

TTCCCCCGTCTGGTTTTTCAACAGGTTAAGTACCCCAACCCGTTCCTTTGGACTGCTATGATTCGCGGGTACGCTCTTCAAGGACCCTTCTCTGAGTCTGTTAACTTGTATACTAGAATGAGGAGGGATGGCGTCAGTCCTGTTTCGTTTACGTTTTCGGCGCTTTTTAAGGCCTGTGGTGCTGTTCTCGATTTGGGTTTGGGTAGGCAGGTGCATGCCCAGACGATTCTGATTGGGGGATTTGCTTCTGATTTGTATGTGGGGAATACAATGATTGATATGTATGCGAAATGTGGGTTTTTGAGTTGTGGGCGGAAGGTGTTCGATGAAATGTCTGAGAGAGATGTGGTTTCTTGGACTGAGCTGATTGTGGCGTATGCTAAGTTTGGGGATATGGAATCTGCCAGTGGCCTGTTTGATGGATTGCCTGTGAAGGATATGGTGGCGTGGACGGCAATGGTCACTGGTTATGCCCAAAATGCTAGGCCAAAGGAGGCATTGGAGTATTTTCAAAAAATGCAGGATGTAGGTATGGAGACCGATGAAGTTACATTGGTTGGTGTTGTCTCCGCCTGTGCACAGTTGGGTGCAATTAAATACGCCAACTGGATTAGAGATATTGCTGAAAAATCAGGTTTTGGGCCTTCTGAAAATGTAGTTGTGGGATCTGCTCTTATTGATATGTATTCAAAATGTGGGAGTCCTGATGAGGCGCATAAGGTTTTTGAAGTAATGCAGGAAAGAAACGTATTTTCATATAGTTCAATGATTGTGGGATATGCTATGCACGGTCGTGCTCATTCAGCTTTACAATTGTTTCATGAGATGTTGAAGACTGAGATTAGGCCGAATAAGGTTACCTTTATCGGGGTGCTTACAGCCTGCAGCCATGCCGGTATGGTTGAACAAGGTCGGCAGCTGTTTGCTAAGATGGAGAAGTATTTTAGTGTAGCTCCTTCACCCGATCACTATGCATGTATGGTAGATCTCCTCGGTCGAGCTGGATGTTTAGAAGAAGCTCTTGAACTCATTGAAACCATGCCAATGGATCCCCATGGAGACGTTTCCTCGCTCAATTCCCTTCTCACTTCCTATGTGCGTGATTACCGCCACTCGGACGCATGGTCTCTCTTCCGTCGAATGCACCGCTCTTGCTCTGCTCTCACTGCCCACACTCTCACCGCTGCCTTGGCCGCATGCTCCGCATTACCCACCTCCGAGTACGGCGCCCAAGTTCATGGCTTGATCATCAAAATCGGTACGTACTCGGGAACTGTTACTAAAACTGCGATCTTGGACATGTACTCCAAGTGTGGGGTTCTTGATGGCTCTGTTAAGGTTTTTGATGAGATGGAGTTGAAGGACGTGGTCGCGTGGAATGCGTTGTTGTCAAGCTTTTTGAGGGAGGGTCTTGCCGGAGAAGCACTACATGTGTTTGAAGAAATGAAGAGGGAAAAAGTGGAGTATAGTGAGTTTACTTTGTGTTCTGTGCTTAAAGCTTGTGGGGCTTTGAAAGCTTTTCGGCAGGGTAAGCAAGTTCATGGGGTAGTTGTTGTGATGGACAGAGATATGCTTGTTTTGGGTACTGCCTTGGTTGATTTCTACTCTAGTGTTGGGTGCATGAGTGAAGCCATGAAAGTTTACACTAGTTTAAGCTGTAGAAAGGATGATGCCATGGTAAATTCTTTGATTTCTGGGTGTGTTAGGAATAAAAATTATGCAGAGGCGTTGTCATTGATGAGCAAGATGAGACCGAATGCAATTGCACTAACAAGCGCCCTGGCCGCTTGCTCTGAGAATTCAGATTTATGGATAGGGAAGCAGATTCACTGTGTTTCAGTCCGTCATGGTTTGACATCCAACGCCCAATTATGCAATGTTTTGCTGGATATGTATGCTAAATGTGGGAAAGTTTTGAATGCTCGAACTGTGTTCAATCGAATGTGTCATAAGGATGTGATATCATGGACCAGCATGATTCAAGCATATGGAAGTCACGGAGATGGGATAAAAGCTTTTGAACTATTCAAGATGATGGTAGAGGGAAGAACGGGAGTCTTGCCAAATTCAGTCACGTTTCTTTCTGTCTTATCCGCCTGTGGGCACTCGGGGCTGGTGGAACAGGGACGAAAGTGTTTTTATTTGGCAAAGGAGAATTATAGTTCATATCTGGGTCCGGAACACTATGCCTGCTTCATAGATATGTTAGGCCGAGCTGGTAGGATCGATGAAGTTTGGAGTCTGTTCCATGATATGGAGACGTGTGGTGTTAAGATAACTTCAAAAATATGGGCTGCATTACTTAATGCTTGTAGTCATATCCAAGATGTTTCAAGGGGTGAGTTTGCTGCCAAAAAACTCCTTCAACTGGATCCCAACAAGGCAGGAAATTACGTGCTGTCATCAAATTTTTATGCTTCGATTGGGAAGTGGGATTCAGTAGATGAATTAAGAAGAATAATGAGGGCAAAAGGACTGACTAAGGAAGCTGGGAATAGCTTGGTC

Coding sequence (CDS)

TTCCCCCGTCTGGTTTTTCAACAGGTTAAGTACCCCAACCCGTTCCTTTGGACTGCTATGATTCGCGGGTACGCTCTTCAAGGACCCTTCTCTGAGTCTGTTAACTTGTATACTAGAATGAGGAGGGATGGCGTCAGTCCTGTTTCGTTTACGTTTTCGGCGCTTTTTAAGGCCTGTGGTGCTGTTCTCGATTTGGGTTTGGGTAGGCAGGTGCATGCCCAGACGATTCTGATTGGGGGATTTGCTTCTGATTTGTATGTGGGGAATACAATGATTGATATGTATGCGAAATGTGGGTTTTTGAGTTGTGGGCGGAAGGTGTTCGATGAAATGTCTGAGAGAGATGTGGTTTCTTGGACTGAGCTGATTGTGGCGTATGCTAAGTTTGGGGATATGGAATCTGCCAGTGGCCTGTTTGATGGATTGCCTGTGAAGGATATGGTGGCGTGGACGGCAATGGTCACTGGTTATGCCCAAAATGCTAGGCCAAAGGAGGCATTGGAGTATTTTCAAAAAATGCAGGATGTAGGTATGGAGACCGATGAAGTTACATTGGTTGGTGTTGTCTCCGCCTGTGCACAGTTGGGTGCAATTAAATACGCCAACTGGATTAGAGATATTGCTGAAAAATCAGGTTTTGGGCCTTCTGAAAATGTAGTTGTGGGATCTGCTCTTATTGATATGTATTCAAAATGTGGGAGTCCTGATGAGGCGCATAAGGTTTTTGAAGTAATGCAGGAAAGAAACGTATTTTCATATAGTTCAATGATTGTGGGATATGCTATGCACGGTCGTGCTCATTCAGCTTTACAATTGTTTCATGAGATGTTGAAGACTGAGATTAGGCCGAATAAGGTTACCTTTATCGGGGTGCTTACAGCCTGCAGCCATGCCGGTATGGTTGAACAAGGTCGGCAGCTGTTTGCTAAGATGGAGAAGTATTTTAGTGTAGCTCCTTCACCCGATCACTATGCATGTATGGTAGATCTCCTCGGTCGAGCTGGATGTTTAGAAGAAGCTCTTGAACTCATTGAAACCATGCCAATGGATCCCCATGGAGACGTTTCCTCGCTCAATTCCCTTCTCACTTCCTATGTGCGTGATTACCGCCACTCGGACGCATGGTCTCTCTTCCGTCGAATGCACCGCTCTTGCTCTGCTCTCACTGCCCACACTCTCACCGCTGCCTTGGCCGCATGCTCCGCATTACCCACCTCCGAGTACGGCGCCCAAGTTCATGGCTTGATCATCAAAATCGGTACGTACTCGGGAACTGTTACTAAAACTGCGATCTTGGACATGTACTCCAAGTGTGGGGTTCTTGATGGCTCTGTTAAGGTTTTTGATGAGATGGAGTTGAAGGACGTGGTCGCGTGGAATGCGTTGTTGTCAAGCTTTTTGAGGGAGGGTCTTGCCGGAGAAGCACTACATGTGTTTGAAGAAATGAAGAGGGAAAAAGTGGAGTATAGTGAGTTTACTTTGTGTTCTGTGCTTAAAGCTTGTGGGGCTTTGAAAGCTTTTCGGCAGGGTAAGCAAGTTCATGGGGTAGTTGTTGTGATGGACAGAGATATGCTTGTTTTGGGTACTGCCTTGGTTGATTTCTACTCTAGTGTTGGGTGCATGAGTGAAGCCATGAAAGTTTACACTAGTTTAAGCTGTAGAAAGGATGATGCCATGGTAAATTCTTTGATTTCTGGGTGTGTTAGGAATAAAAATTATGCAGAGGCGTTGTCATTGATGAGCAAGATGAGACCGAATGCAATTGCACTAACAAGCGCCCTGGCCGCTTGCTCTGAGAATTCAGATTTATGGATAGGGAAGCAGATTCACTGTGTTTCAGTCCGTCATGGTTTGACATCCAACGCCCAATTATGCAATGTTTTGCTGGATATGTATGCTAAATGTGGGAAAGTTTTGAATGCTCGAACTGTGTTCAATCGAATGTGTCATAAGGATGTGATATCATGGACCAGCATGATTCAAGCATATGGAAGTCACGGAGATGGGATAAAAGCTTTTGAACTATTCAAGATGATGGTAGAGGGAAGAACGGGAGTCTTGCCAAATTCAGTCACGTTTCTTTCTGTCTTATCCGCCTGTGGGCACTCGGGGCTGGTGGAACAGGGACGAAAGTGTTTTTATTTGGCAAAGGAGAATTATAGTTCATATCTGGGTCCGGAACACTATGCCTGCTTCATAGATATGTTAGGCCGAGCTGGTAGGATCGATGAAGTTTGGAGTCTGTTCCATGATATGGAGACGTGTGGTGTTAAGATAACTTCAAAAATATGGGCTGCATTACTTAATGCTTGTAGTCATATCCAAGATGTTTCAAGGGGTGAGTTTGCTGCCAAAAAACTCCTTCAACTGGATCCCAACAAGGCAGGAAATTACGTGCTGTCATCAAATTTTTATGCTTCGATTGGGAAGTGGGATTCAGTAGATGAATTAAGAAGAATAATGAGGGCAAAAGGACTGACTAAGGAAGCTGGGAATAGCTTGGTC

Protein sequence

FPRLVFQQVKYPNPFLWTAMIRGYALQGPFSESVNLYTRMRRDGVSPVSFTFSALFKACGAVLDLGLGRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWTELIVAYAKFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARPKEALEYFQKMQDVGMETDEVTLVGVVSACAQLGAIKYANWIRDIAEKSGFGPSENVVVGSALIDMYSKCGSPDEAHKVFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEMLKTEIRPNKVTFIGVLTACSHAGMVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGCLEEALELIETMPMDPHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEAGNSLV
Homology
BLAST of MS012719 vs. NCBI nr
Match: XP_022136826.1 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Momordica charantia] >XP_022136827.1 pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Momordica charantia] >XP_022136829.1 pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Momordica charantia])

HSP 1 Score: 891.3 bits (2302), Expect = 6.2e-255
Identity = 452/492 (91.87%), Postives = 452/492 (91.87%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWS-------LFRRMHRSCSALTAHTLTAALAACSAL 410
           P  DVSSLNSLLTSYVRDYRHSDAWS                                  
Sbjct: 56  PQRDVSSLNSLLTSYVRDYRHSDAWSXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 115

Query: 411 PTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL 470
              EYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL
Sbjct: 116 XXXEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL 175

Query: 471 SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRD 530
           SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRD
Sbjct: 176 SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRD 235

Query: 531 MLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKM 590
           MLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDD MVNSLISGCVRNKNYAEALSLMSKM
Sbjct: 236 MLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDVMVNSLISGCVRNKNYAEALSLMSKM 295

Query: 591 RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNART 650
           RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNART
Sbjct: 296 RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNART 355

Query: 651 VFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHS 710
           VFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHS
Sbjct: 356 VFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHS 415

Query: 711 GLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKI 770
           GLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKI
Sbjct: 416 GLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKI 475

Query: 771 WAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRA 830
           WAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRA
Sbjct: 476 WAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRA 535

Query: 831 KGLTKEAGNSLV 836
           KGLTKEAGNSLV
Sbjct: 536 KGLTKEAGNSLV 547

BLAST of MS012719 vs. NCBI nr
Match: XP_022984423.1 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 [Cucurbita maxima] >XP_022984424.1 pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 [Cucurbita maxima])

HSP 1 Score: 850.1 bits (2195), Expect = 1.6e-242
Identity = 415/485 (85.57%), Postives = 452/485 (93.20%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+ SL SLLTSYVR +RHSDAWSLFR+MHRSCS LTAHTLTAALAACSALPTS+YG 
Sbjct: 57  PQRDIPSLTSLLTSYVRGHRHSDAWSLFRQMHRSCSPLTAHTLTAALAACSALPTSDYGQ 116

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
           QVHGLIIK GTYSG VTKTAILDMYSKCG+LD SVKVF+EMELKDVVAWNALLSSFLREG
Sbjct: 117 QVHGLIIKTGTYSGIVTKTAILDMYSKCGLLDHSVKVFEEMELKDVVAWNALLSSFLREG 176

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
           LAG+AL+VFEEMKREKVEYSEFTLCSVLKAC ALK F+ GKQVHG+VVVMDRDMLVLGT+
Sbjct: 177 LAGKALNVFEEMKREKVEYSEFTLCSVLKACAALKDFQLGKQVHGMVVVMDRDMLVLGTS 236

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           LVDFYSSVGC+SEAMKVYTSL+C KDD M+NSLISGCV NK Y EA SLMSKMRPNAIAL
Sbjct: 237 LVDFYSSVGCISEAMKVYTSLNCTKDDIMLNSLISGCVVNKKYEEAFSLMSKMRPNAIAL 296

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           TSALAACSENSDLWIGKQIHC  VRHG+ SN QLCN LLDMYAKCGK+ NAR VF+ M H
Sbjct: 297 TSALAACSENSDLWIGKQIHCALVRHGMASNTQLCNTLLDMYAKCGKISNARIVFDEMRH 356

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           +DV+SW+SMIQAYGSHGDG+KAFELFKMMV+G+TGVLPNSVTFLSVLSACGHSGLVEQG+
Sbjct: 357 RDVVSWSSMIQAYGSHGDGLKAFELFKMMVDGKTGVLPNSVTFLSVLSACGHSGLVEQGQ 416

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNA 770
           +CFYLAKE YSSYLGPEHYACFID+LGRAG+I+EVWS+FHDME CGVKITSK+WAALLNA
Sbjct: 417 ECFYLAKERYSSYLGPEHYACFIDILGRAGKIEEVWSVFHDMEMCGVKITSKLWAALLNA 476

Query: 771 CSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEA 830
           CSH QDVSRGEFAAK+LL+L+PNKAGN+VL+SNFYASIGKW+SVDELRRIM  KGL+KEA
Sbjct: 477 CSHNQDVSRGEFAAKRLLRLEPNKAGNFVLASNFYASIGKWNSVDELRRIMWEKGLSKEA 536

Query: 831 GNSLV 836
           GNSLV
Sbjct: 537 GNSLV 541

BLAST of MS012719 vs. NCBI nr
Match: KAG7015318.1 (Pentatricopeptide repeat-containing protein, mitochondrial [Cucurbita argyrosperma subsp. argyrosperma])

HSP 1 Score: 849.7 bits (2194), Expect = 2.1e-242
Identity = 416/485 (85.77%), Postives = 450/485 (92.78%), Query Frame = 0

Query: 351  PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
            P  D+ SL S+LTSYVR +RHSDAWSLFR+MHRSCS +TAHTLTAALAACSALPTS+YG 
Sbjct: 530  PQRDIPSLTSILTSYVRGHRHSDAWSLFRQMHRSCSPVTAHTLTAALAACSALPTSDYGQ 589

Query: 411  QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
            QVHGLIIK GTYSG VTKTAILDMYSKCG+LD SVKVF+EMELKDVVAWNALLSSFLREG
Sbjct: 590  QVHGLIIKTGTYSGIVTKTAILDMYSKCGLLDHSVKVFEEMELKDVVAWNALLSSFLREG 649

Query: 471  LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
            LAGEAL+VFEEMKREKVE SEFTLCSVLKAC ALK F+ GKQVHG+VVVMDRDMLVLGTA
Sbjct: 650  LAGEALNVFEEMKREKVECSEFTLCSVLKACAALKDFQLGKQVHGMVVVMDRDMLVLGTA 709

Query: 531  LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
            LVDFYSSVGC+SEAMKVYTSL C KDD M+NSLISGC  NK Y EA SLMSKMRPNAIAL
Sbjct: 710  LVDFYSSVGCISEAMKVYTSLDCIKDDIMLNSLISGCFVNKKYEEAFSLMSKMRPNAIAL 769

Query: 591  TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
            TSALAACSENSDLWIGKQIHC  VRHG+TSN QLCN LLDMYAKCGK+LNAR VF+ M H
Sbjct: 770  TSALAACSENSDLWIGKQIHCALVRHGMTSNTQLCNTLLDMYAKCGKILNARIVFDEMRH 829

Query: 651  KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
            +DV+SW+SMIQAYGSHGDG+KAFELFKMM++GRTGVLPNSVTFLSVLSACGHSGLVEQG+
Sbjct: 830  RDVVSWSSMIQAYGSHGDGLKAFELFKMMLDGRTGVLPNSVTFLSVLSACGHSGLVEQGQ 889

Query: 711  KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNA 770
            +CFYLAKE YSSYL PEHYACFID+LGRAG+I+EVWS+FHDME CGVKITSK+WAALLNA
Sbjct: 890  ECFYLAKERYSSYLAPEHYACFIDILGRAGKIEEVWSVFHDMEMCGVKITSKLWAALLNA 949

Query: 771  CSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEA 830
            CSH QDVSRGEFAAK+LL+LDPNKAGN+VL+SNFYASIGKWDSVDELRRIM  KGL+KEA
Sbjct: 950  CSHNQDVSRGEFAAKRLLRLDPNKAGNFVLASNFYASIGKWDSVDELRRIMWEKGLSKEA 1009

Query: 831  GNSLV 836
            GNSLV
Sbjct: 1010 GNSLV 1014

BLAST of MS012719 vs. NCBI nr
Match: XP_023552813.1 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Cucurbita pepo subsp. pepo] >XP_023552814.1 pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Cucurbita pepo subsp. pepo] >XP_023552815.1 pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Cucurbita pepo subsp. pepo] >XP_023552816.1 pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Cucurbita pepo subsp. pepo])

HSP 1 Score: 842.8 bits (2176), Expect = 2.5e-240
Identity = 413/485 (85.15%), Postives = 448/485 (92.37%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+ SL SLLTSYVR +RHSDAWSLFR+MHRSCS LTAHTLTAALAACSALPTS+YG 
Sbjct: 57  PRRDIPSLTSLLTSYVRGHRHSDAWSLFRQMHRSCSPLTAHTLTAALAACSALPTSDYGQ 116

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
           QVHGLIIK GTYSG VTKTAILDMYSKCG+LD SV+VF+EMELKDVVAWNALLSSFLREG
Sbjct: 117 QVHGLIIKTGTYSGIVTKTAILDMYSKCGLLDHSVQVFEEMELKDVVAWNALLSSFLREG 176

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
           LAG+AL+VFEEMKREKVE SEFTLCSVLKAC  LK F+ GKQVHG+VVVMDRDMLVLGTA
Sbjct: 177 LAGKALNVFEEMKREKVECSEFTLCSVLKACAVLKDFQLGKQVHGMVVVMDRDMLVLGTA 236

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           LVDFYS+VGC+SEAMKVYTSL C KDD M+NSLISGCV NK Y EA SLMSKMRPNAIAL
Sbjct: 237 LVDFYSTVGCISEAMKVYTSLDCIKDDIMLNSLISGCVVNKQYEEAFSLMSKMRPNAIAL 296

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           TSALAACSENSDLWIGKQIHC  VRHG+TSN QLCN LLDMYAKCGK+ NAR VF+ M H
Sbjct: 297 TSALAACSENSDLWIGKQIHCALVRHGMTSNTQLCNTLLDMYAKCGKISNARIVFDEMRH 356

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           +DV+SW+SMIQAYGSHGDG+KAFELFKMM++GRTGVLPNSVTFLSVLSACGHSGLVEQG+
Sbjct: 357 RDVVSWSSMIQAYGSHGDGLKAFELFKMMLDGRTGVLPNSVTFLSVLSACGHSGLVEQGQ 416

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNA 770
           +CFYLAKE YSSYL PEHYACFID+LGRAG+I+EVWS+FHDME CGVKITSK+WAALLNA
Sbjct: 417 ECFYLAKERYSSYLAPEHYACFIDILGRAGKIEEVWSVFHDMEMCGVKITSKLWAALLNA 476

Query: 771 CSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEA 830
           CSH QDVSRGEFAAK+LL+LDPNKAGN+VL+SNFYASIGKWDSV ELRRIM  KGL+KEA
Sbjct: 477 CSHNQDVSRGEFAAKRLLRLDPNKAGNFVLASNFYASIGKWDSVGELRRIMWEKGLSKEA 536

Query: 831 GNSLV 836
           GNSLV
Sbjct: 537 GNSLV 541

BLAST of MS012719 vs. NCBI nr
Match: XP_038901893.1 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Benincasa hispida])

HSP 1 Score: 839.0 bits (2166), Expect = 3.7e-239
Identity = 418/502 (83.27%), Postives = 453/502 (90.24%), Query Frame = 0

Query: 336 CLEEALELIETMPMD--PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTL 395
           C  E L  +     D  P  D+ SLNSLL S+VR YRHSDAWSLF RMHRS SALTAHTL
Sbjct: 70  CYSEGLCSLARQLFDELPQRDIPSLNSLLISFVRGYRHSDAWSLFCRMHRS-SALTAHTL 129

Query: 396 TAALAACSALPTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMEL 455
           TAALAACSALPTS YG QVHGLIIK  TYSG +TKTAILDMYSKCG+LD SVKVF+EME+
Sbjct: 130 TAALAACSALPTSGYGQQVHGLIIKSDTYSGIITKTAILDMYSKCGLLDDSVKVFEEMEV 189

Query: 456 KDVVAWNALLSSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQV 515
           +DVVAWNALLSSFLREGLA EAL+VFEEMKREKV +SEFTLCSVLKAC ALK FR GKQV
Sbjct: 190 RDVVAWNALLSSFLREGLAEEALNVFEEMKREKVVFSEFTLCSVLKACAALKDFRLGKQV 249

Query: 516 HGVVVVMDRDMLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNY 575
           HGVVVVMDRD+LVLGTALVDFYSSVGC+SEAMKVYTSL+CRKDD M+NSLISGCV+NK Y
Sbjct: 250 HGVVVVMDRDILVLGTALVDFYSSVGCISEAMKVYTSLNCRKDDIMLNSLISGCVKNKKY 309

Query: 576 AEALSLMSKMRPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYA 635
            EA SLMSKMRPNAIALTSALAACSENSDLW G+QIHCV VRHG  SN  LCN+LLDMYA
Sbjct: 310 EEAFSLMSKMRPNAIALTSALAACSENSDLWRGRQIHCVLVRHGFASNTLLCNILLDMYA 369

Query: 636 KCGKVLNARTVFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTF 695
           KCGK+LNA+TVF+ MCHKDV+SW+SMIQAYGSHGDG+KAFELFKMMVEGRTGVLPNSVTF
Sbjct: 370 KCGKILNAQTVFDGMCHKDVVSWSSMIQAYGSHGDGLKAFELFKMMVEGRTGVLPNSVTF 429

Query: 696 LSVLSACGHSGLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDME 755
           LSVLSACGHSGLV+QG++ FYLAKE +SSYLGPEHYAC ID+LGRAG+IDEVWS F+DME
Sbjct: 430 LSVLSACGHSGLVQQGQESFYLAKEKFSSYLGPEHYACIIDILGRAGKIDEVWSTFNDME 489

Query: 756 TCGVKITSKIWAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDS 815
            CGVKITSK+WAA+LNACSH QDVSRGEFAAKKLLQ+D  KAGNYVL+SNFYASIGKWDS
Sbjct: 490 MCGVKITSKVWAAVLNACSHNQDVSRGEFAAKKLLQMDSKKAGNYVLASNFYASIGKWDS 549

Query: 816 VDELRRIMRAKGLTKEAGNSLV 836
           VDE+RRIMRAKGLTKEAGNSLV
Sbjct: 550 VDEMRRIMRAKGLTKEAGNSLV 570

BLAST of MS012719 vs. ExPASy Swiss-Prot
Match: Q9FJY9 (Pentatricopeptide repeat-containing protein At5g66500, mitochondrial OS=Arabidopsis thaliana OX=3702 GN=PCMP-E38 PE=2 SV=1)

HSP 1 Score: 545.4 bits (1404), Expect = 1.1e-153
Identity = 270/486 (55.56%), Postives = 356/486 (73.25%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+SSLNS L+S++R    +D  +LF ++HR+   L++HT T  L ACS L   E G 
Sbjct: 45  PQRDLSSLNSQLSSHLRSGNPNDTLALFLQIHRASPDLSSHTFTPVLGACSLLSYPETGR 104

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
           QVH L+IK G  +GT++KTA++DMYSK G L  SV+VF+ +E KD+V+WNALLS FLR G
Sbjct: 105 QVHALMIKQGAETGTISKTALIDMYSKYGHLVDSVRVFESVEEKDLVSWNALLSGFLRNG 164

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
              EAL VF  M RE+VE SEFTL SV+K C +LK  +QGKQVH +VVV  RD++VLGTA
Sbjct: 165 KGKEALGVFAAMYRERVEISEFTLSSVVKTCASLKILQQGKQVHAMVVVTGRDLVVLGTA 224

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           ++ FYSSVG ++EAMKVY SL+   D+ M+NSLISGC+RN+NY EA  LMS+ RPN   L
Sbjct: 225 MISFYSSVGLINEAMKVYNSLNVHTDEVMLNSLISGCIRNRNYKEAFLLMSRQRPNVRVL 284

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           +S+LA CS+NSDLWIGKQIHCV++R+G  S+++LCN L+DMY KCG+++ ART+F  +  
Sbjct: 285 SSSLAGCSDNSDLWIGKQIHCVALRNGFVSDSKLCNGLMDMYGKCGQIVQARTIFRAIPS 344

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           K V+SWTSMI AY  +GDG+KA E+F+ M E  +GVLPNSVTFL V+SAC H+GLV++G+
Sbjct: 345 KSVVSWTSMIDAYAVNGDGVKALEIFREMCEEGSGVLPNSVTFLVVISACAHAGLVKEGK 404

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHD-METCGVKITSKIWAALLN 770
           +CF + KE Y    G EHY CFID+L +AG  +E+W L    ME     I   IW A+L+
Sbjct: 405 ECFGMMKEKYRLVPGTEHYVCFIDILSKAGETEEIWRLVERMMENDNQSIPCAIWVAVLS 464

Query: 771 ACSHIQDVSRGEFAAKKLL-QLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTK 830
           ACS   D++RGE+ A++L+ +  P  A  YVL SNFYA++GKWD V+ELR  ++ KGL K
Sbjct: 465 ACSLNMDLTRGEYVARRLMEETGPENASIYVLVSNFYAAMGKWDVVEELRGKLKNKGLVK 524

Query: 831 EAGNSL 835
            AG+SL
Sbjct: 525 TAGHSL 530

BLAST of MS012719 vs. ExPASy Swiss-Prot
Match: Q9FFG8 (Pentatricopeptide repeat-containing protein At5g44230 OS=Arabidopsis thaliana OX=3702 GN=PCMP-H17 PE=2 SV=1)

HSP 1 Score: 469.9 bits (1208), Expect = 5.9e-131
Identity = 224/356 (62.92%), Postives = 280/356 (78.65%), Query Frame = 0

Query: 1   FPRLVFQQVKYPNPFLWTAMIRGYALQGPFSESVNLYTRMRRDGVSPVSFTFSALFKACG 60
           + R V + V++ NPFLWTA+IRGYA++G F E++ +Y  MR++ ++PVSFTFSAL KACG
Sbjct: 101 YARRVIEPVQFRNPFLWTAVIRGYAIEGKFDEAIAMYGCMRKEEITPVSFTFSALLKACG 160

Query: 61  AVLDLGLGRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWT 120
            + DL LGRQ HAQT  + GF   +YVGNTMIDMY KC  + C RKVFDEM ERDV+SWT
Sbjct: 161 TMKDLNLGRQFHAQTFRLRGFCF-VYVGNTMIDMYVKCESIDCARKVFDEMPERDVISWT 220

Query: 121 ELIVAYAKFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARPKEALEYFQKMQDVGMET 180
           ELI AYA+ G+ME A+ LF+ LP KDMVAWTAMVTG+AQNA+P+EALEYF +M+  G+  
Sbjct: 221 ELIAAYARVGNMECAAELFESLPTKDMVAWTAMVTGFAQNAKPQEALEYFDRMEKSGIRA 280

Query: 181 DEVTLVGVVSACAQLGAIKYANWIRDIAEKSGFGPSENVVVGSALIDMYSKCGSPDEAHK 240
           DEVT+ G +SACAQLGA KYA+    IA+KSG+ PS++VV+GSALIDMYSKCG+ +EA  
Sbjct: 281 DEVTVAGYISACAQLGASKYADRAVQIAQKSGYSPSDHVVIGSALIDMYSKCGNVEEAVN 340

Query: 241 VFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEML-KTEIRPNKVTFIGVLTACSHAG 300
           VF  M  +NVF+YSSMI+G A HGRA  AL LFH M+ +TEI+PN VTF+G L ACSH+G
Sbjct: 341 VFMSMNNKNVFTYSSMILGLATHGRAQEALHLFHYMVTQTEIKPNTVTFVGALMACSHSG 400

Query: 301 MVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGCLEEALELIETMPMDPHGDV 356
           +V+QGRQ+F  M + F V P+ DHY CMVDLLGR G L+EALELI+TM ++PHG V
Sbjct: 401 LVDQGRQVFDSMYQTFGVQPTRDHYTCMVDLLGRTGRLQEALELIKTMSVEPHGGV 455


HSP 2 Score: 183.3 bits (464), Expect = 1.1e-44
Identity = 122/421 (28.98%), Postives = 209/421 (49.64%), Query Frame = 0

Query: 429 TAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREGLAGEALHVFEEMKREKVE 488
           TA++  Y+  G  D ++ ++  M  +++   +   S+ L+     + L++  +   +   
Sbjct: 118 TAVIRGYAIEGKFDEAIAMYGCMRKEEITPVSFTFSALLKACGTMKDLNLGRQFHAQTFR 177

Query: 489 YSEF-------TLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTALVDFYSSVGCM 548
              F       T+  +   C ++   R+      V   M    ++  T L+  Y+ VG M
Sbjct: 178 LRGFCFVYVGNTMIDMYVKCESIDCARK------VFDEMPERDVISWTELIAAYARVGNM 237

Query: 549 SEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKM-----RPNAIALTSALAA 608
             A +++ SL   KD     ++++G  +N    EAL    +M     R + + +   ++A
Sbjct: 238 ECAAELFESLP-TKDMVAWTAMVTGFAQNAKPQEALEYFDRMEKSGIRADEVTVAGYISA 297

Query: 609 CSENSDLWIGKQIHCVSVRHGL--TSNAQLCNVLLDMYAKCGKVLNARTVFNRMCHKDVI 668
           C++        +   ++ + G   + +  + + L+DMY+KCG V  A  VF  M +K+V 
Sbjct: 298 CAQLGASKYADRAVQIAQKSGYSPSDHVVIGSALIDMYSKCGNVEEAVNVFMSMNNKNVF 357

Query: 669 SWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGRKCFY 728
           +++SMI    +HG   +A  LF  MV  +T + PN+VTF+  L AC HSGLV+QGR+ F 
Sbjct: 358 TYSSMILGLATHGRAQEALHLFHYMVT-QTEIKPNTVTFVGALMACSHSGLVDQGRQVFD 417

Query: 729 LAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNACSHI 788
              + +      +HY C +D+LGR GR+ E   L   ++T  V+    +W ALL AC   
Sbjct: 418 SMYQTFGVQPTRDHYTCMVDLLGRTGRLQEALEL---IKTMSVEPHGGVWGALLGACRIH 477

Query: 789 QDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEAGNSL 836
            +    E AA+ L +L+P+  GNY+L SN YAS G W  V  +R++++ KGL K    S 
Sbjct: 478 NNPEIAEIAAEHLFELEPDIIGNYILLSNVYASAGDWGGVLRVRKLIKEKGLKKTPAVSW 527

BLAST of MS012719 vs. ExPASy Swiss-Prot
Match: Q9SS83 (Pentatricopeptide repeat-containing protein At3g09040, mitochondrial OS=Arabidopsis thaliana OX=3702 GN=PCMP-E88 PE=2 SV=1)

HSP 1 Score: 426.8 bits (1096), Expect = 5.7e-118
Identity = 267/867 (30.80%), Postives = 437/867 (50.40%), Query Frame = 0

Query: 17  WTAMIRGYALQGPFSESVNLYTRMRRDGVSPVSFTFSALFKACGAVLDLGLGRQVHAQTI 76
           W +M+  Y+  G   + +  +  +  + + P  FTFS +   C    ++  GRQ+H   I
Sbjct: 128 WNSMLSMYSSIGKPGKVLRSFVSLFENQIFPNKFTFSIVLSTCARETNVEFGRQIHCSMI 187

Query: 77  LIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWTELIVAYAK-------- 136
            + G   + Y G  ++DMYAKC  +S  R+VF+ + + + V WT L   Y K        
Sbjct: 188 KM-GLERNSYCGGALVDMYAKCDRISDARRVFEWIVDPNTVCWTCLFSGYVKAGLPEEAV 247

Query: 137 ---------------------------FGDMESASGLFDGLPVKDMVAWTAMVTGYAQNA 196
                                       G ++ A  LF  +   D+VAW  M++G+ +  
Sbjct: 248 LVFERMRDEGHRPDHLAFVTVINTYIRLGKLKDARLLFGEMSSPDVVAWNVMISGHGKRG 307

Query: 197 RPKEALEYFQKMQDVGMETDEVTLVGVVSACA-----QLGAIKYANWIRDIAEKSGFGPS 256
               A+EYF  M+   +++   TL  V+SA        LG + +A  I+        G +
Sbjct: 308 CETVAIEYFFNMRKSSVKSTRSTLGSVLSAIGIVANLDLGLVVHAEAIK-------LGLA 367

Query: 257 ENVVVGSALIDMYSKCGSPDEAHKVFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEM 316
            N+ VGS+L+ MYSKC   + A KVFE ++E+N   +++MI GYA +G +H  ++LF +M
Sbjct: 368 SNIYVGSSLVSMYSKCEKMEAAAKVFEALEEKNDVFWNAMIRGYAHNGESHKVMELFMDM 427

Query: 317 LKTEIRPNKVTFIGVLTACSHAGMVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGC 376
             +    +  TF  +L+ C+ +  +E G Q  + + K   +A +      +VD+  + G 
Sbjct: 428 KSSGYNIDDFTFTSLLSTCAASHDLEMGSQFHSIIIKK-KLAKNLFVGNALVDMYAKCGA 487

Query: 377 LEEALELIETMPMDPHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAA 436
           LE+A ++ E M      D  + N+++ SYV+D   S+A+ LF+RM+          L + 
Sbjct: 488 LEDARQIFERM---CDRDNVTWNTIIGSYVQDENESEAFDLFKRMNLCGIVSDGACLAST 547

Query: 437 LAACSALPTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDV 496
           L AC+ +     G QVH L +K G      T ++++DMYSKCG++  + KVF  +    V
Sbjct: 548 LKACTHVHGLYQGKQVHCLSVKCGLDRDLHTGSSLIDMYSKCGIIKDARKVFSSLPEWSV 607

Query: 497 VAWNALLSSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGV 556
           V+ NAL++ + +  L  EA+ +F+EM    V  SE T  ++++AC   ++   G Q HG 
Sbjct: 608 VSMNALIAGYSQNNLE-EAVVLFQEMLTRGVNPSEITFATIVEACHKPESLTLGTQFHGQ 667

Query: 557 VVV--MDRDMLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYA 616
           +       +   LG +L+  Y +   M+EA  +++ LS  K   +   ++SG  +N  Y 
Sbjct: 668 ITKRGFSSEGEYLGISLLGMYMNSRGMTEACALFSELSSPKSIVLWTGMMSGHSQNGFYE 727

Query: 617 EALSLMSKMR-----PNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLL 676
           EAL    +MR     P+     + L  CS  S L  G+ IH +        +    N L+
Sbjct: 728 EALKFYKEMRHDGVLPDQATFVTVLRVCSVLSSLREGRAIHSLIFHLAHDLDELTSNTLI 787

Query: 677 DMYAKCGKVLNARTVFNRMCHK-DVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLP 736
           DMYAKCG +  +  VF+ M  + +V+SW S+I  Y  +G    A ++F  M +    ++P
Sbjct: 788 DMYAKCGDMKGSSQVFDEMRRRSNVVSWNSLINGYAKNGYAEDALKIFDSMRQSH--IMP 847

Query: 737 NSVTFLSVLSACGHSGLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSL 796
           + +TFL VL+AC H+G V  GRK F +    Y      +H AC +D+LGR G + E    
Sbjct: 848 DEITFLGVLTACSHAGKVSDGRKIFEMMIGQYGIEARVDHVACMVDLLGRWGYLQEADDF 907

Query: 797 FHDMETCGVKITSKIWAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASI 836
              +E   +K  +++W++LL AC    D  RGE +A+KL++L+P  +  YVL SN YAS 
Sbjct: 908 ---IEAQNLKPDARLWSSLLGACRIHGDDIRGEISAEKLIELEPQNSSAYVLLSNIYASQ 967

BLAST of MS012719 vs. ExPASy Swiss-Prot
Match: Q9FWA6 (Pentatricopeptide repeat-containing protein At3g02330, mitochondrial OS=Arabidopsis thaliana OX=3702 GN=PCMP-E90 PE=2 SV=2)

HSP 1 Score: 413.7 bits (1062), Expect = 5.0e-114
Identity = 260/818 (31.78%), Postives = 411/818 (50.24%), Query Frame = 0

Query: 45  VSPVSFT-FSALFKACGAVLDLGLGRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSC 104
           V+ VS T FS +FK C     L LG+Q HA  ++I GF    +V N ++ +Y        
Sbjct: 43  VNSVSTTNFSFVFKECAKQGALELGKQAHAH-MIISGFRPTTFVLNCLLQVYTNSRDFVS 102

Query: 105 GRKVFDEMSERDVVSWTELIVAYAKFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARP 164
              VFD+M  RDVVSW ++I  Y+K  DM  A+  F+ +PV+D+V+W +M++GY QN   
Sbjct: 103 ASMVFDKMPLRDVVSWNKMINGYSKSNDMFKANSFFNMMPVRDVVSWNSMLSGYLQNGES 162

Query: 165 KEALEYFQKMQDVGMETDEVTLVGVVSACAQLGAIKYANWIRDIAEKSGFGPSENVVVGS 224
            +++E F  M   G+E D  T   ++  C+ L        I  I  +   G   +VV  S
Sbjct: 163 LKSIEVFVDMGREGIEFDGRTFAIILKVCSFLEDTSLGMQIHGIVVR--VGCDTDVVAAS 222

Query: 225 ALIDMYSKCGSPDEAHKVFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEMLKTEIRP 284
           AL+DMY+K     E+ +VF+ + E+N  S+S++I G   +     AL+ F EM K     
Sbjct: 223 ALLDMYAKGKRFVESLRVFQGIPEKNSVSWSAIIAGCVQNNLLSLALKFFKEMQKVNAGV 282

Query: 285 NKVTFIGVLTACSHAGMVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGCLEEALEL 344
           ++  +  VL +C+    +  G QL A   K    A      A + D+  +   +++A  L
Sbjct: 283 SQSIYASVLRSCAALSELRLGGQLHAHALKSDFAADGIVRTATL-DMYAKCDNMQDAQIL 342

Query: 345 IETMPMDPHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSAL 404
            +      + +  S N+++T Y ++     A  LF R+  S       +L+    AC+ +
Sbjct: 343 FDN---SENLNRQSYNAMITGYSQEEHGFKALLLFHRLMSSGLGFDEISLSGVFRACALV 402

Query: 405 PTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL 464
                G Q++GL IK           A +DMY KC  L  + +VFDEM  +D V+WNA++
Sbjct: 403 KGLSEGLQIYGLAIKSSLSLDVCVANAAIDMYGKCQALAEAFRVFDEMRRRDAVSWNAII 462

Query: 465 SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMD-R 524
           ++  + G   E L +F  M R ++E  EFT  S+LKAC    +   G ++H  +V     
Sbjct: 463 AAHEQNGKGYETLFLFVSMLRSRIEPDEFTFGSILKACTG-GSLGYGMEIHSSIVKSGMA 522

Query: 525 DMLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMV-------------------NSL 584
               +G +L+D YS  G + EA K+++    R + +                     NS+
Sbjct: 523 SNSSVGCSLIDMYSKCGMIEEAEKIHSRFFQRANVSGTMEELEKMHNKRLQEMCVSWNSI 582

Query: 585 ISGCVRNKNYAEALSLMSKM-----RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGL 644
           ISG V  +   +A  L ++M      P+     + L  C+  +   +GKQIH   ++  L
Sbjct: 583 ISGYVMKEQSEDAQMLFTRMMEMGITPDKFTYATVLDTCANLASAGLGKQIHAQVIKKEL 642

Query: 645 TSNAQLCNVLLDMYAKCGKVLNARTVFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKM 704
            S+  +C+ L+DMY+KCG + ++R +F +   +D ++W +MI  Y  HG G +A +LF+ 
Sbjct: 643 QSDVYICSTLVDMYSKCGDLHDSRLMFEKSLRRDFVTWNAMICGYAHHGKGEEAIQLFER 702

Query: 705 MVEGRTGVLPNSVTFLSVLSACGHSGLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGR 764
           M+     + PN VTF+S+L AC H GL+++G + FY+ K +Y       HY+  +D+LG+
Sbjct: 703 MI--LENIKPNHVTFISILRACAHMGLIDKGLEYFYMMKRDYGLDPQLPHYSNMVDILGK 762

Query: 765 AGRIDEVWSLFHDMETCGVKITSKIWAALLNACS-HIQDVSRGEFAAKKLLQLDPNKAGN 824
           +G++     L  +M     +    IW  LL  C+ H  +V   E A   LL+LDP  +  
Sbjct: 763 SGKVKRALELIREMP---FEADDVIWRTLLGVCTIHRNNVEVAEEATAALLRLDPQDSSA 822

Query: 825 YVLSSNFYASIGKWDSVDELRRIMRAKGLTKEAGNSLV 836
           Y L SN YA  G W+ V +LRR MR   L KE G S V
Sbjct: 823 YTLLSNVYADAGMWEKVSDLRRNMRGFKLKKEPGCSWV 847

BLAST of MS012719 vs. ExPASy Swiss-Prot
Match: Q7XJN6 (Pentatricopeptide repeat-containing protein At2g40720 OS=Arabidopsis thaliana OX=3702 GN=PCMP-E26 PE=3 SV=1)

HSP 1 Score: 411.0 bits (1055), Expect = 3.2e-113
Identity = 276/848 (32.55%), Postives = 432/848 (50.94%), Query Frame = 0

Query: 11  YPNPFLWTAMIRGYALQGPFSESVNLYTRMRRDGVSPV---SFTFSALFKACGAVLDLGL 70
           Y +P    + IR    +G + ++++LY+  + DG SP     FTF +L KAC A+ +L  
Sbjct: 21  YISPASINSGIRALIQKGEYLQALHLYS--KHDGSSPFWTSVFTFPSLLKACSALTNLSY 80

Query: 71  GRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWTELIVAYA 130
           G+ +H   +++ G+  D ++  ++++MY KCGFL    +VFD  S+              
Sbjct: 81  GKTIHGSVVVL-GWRYDPFIATSLVNMYVKCGFLDYAVQVFDGWSQSQ------------ 140

Query: 131 KFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARPKEALEYFQKMQDVGMETDEVTLVG 190
                        G+  +D+  W +M+ GY +  R KE +  F++M   G+  D  +L  
Sbjct: 141 ------------SGVSARDVTVWNSMIDGYFKFRRFKEGVGCFRRMLVFGVRPDAFSLSI 200

Query: 191 VVSACAQLGAIK-------YANWIRDIAEKSGFGPSENVVVGSALIDMYSKCGSPDEAHK 250
           VVS   + G  +       +   +R+  +   F       + +ALIDMY K G   +A +
Sbjct: 201 VVSVMCKEGNFRREEGKQIHGFMLRNSLDTDSF-------LKTALIDMYFKFGLSIDAWR 260

Query: 251 VF-EVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEMLKTEIRPNKVTFIGVLTACSHAG 310
           VF E+  + NV  ++ MIVG+   G   S+L L+       ++    +F G L ACS + 
Sbjct: 261 VFVEIEDKSNVVLWNVMIVGFGGSGICESSLDLYMLAKNNSVKLVSTSFTGALGACSQSE 320

Query: 311 MVEQGRQLFAKMEKYFSVAPSPDHYAC--MVDLLGRAGCLEEALELIETMPMDPHGDVSS 370
               GRQ+   + K   +    D Y C  ++ +  + G + EA E + +  +D   ++  
Sbjct: 321 NSGFGRQIHCDVVK---MGLHNDPYVCTSLLSMYSKCGMVGEA-ETVFSCVVDKRLEI-- 380

Query: 371 LNSLLTSYV-RDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGAQVHGLI 430
            N+++ +Y   DY +S A  LF  M +      + TL+  ++ CS L    YG  VH  +
Sbjct: 381 WNAMVAAYAENDYGYS-ALDLFGFMRQKSVLPDSFTLSNVISCCSVLGLYNYGKSVHAEL 440

Query: 431 IKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREGLAGEAL 490
            K    S +  ++A+L +YSKCG    +  VF  ME KD+VAW +L+S   + G   EAL
Sbjct: 441 FKRPIQSTSTIESALLTLYSKCGCDPDAYLVFKSMEEKDMVAWGSLISGLCKNGKFKEAL 500

Query: 491 HVFEEMK--REKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLV-LGTALVD 550
            VF +MK   + ++     + SV  AC  L+A R G QVHG ++     + V +G++L+D
Sbjct: 501 KVFGDMKDDDDSLKPDSDIMTSVTNACAGLEALRFGLQVHGSMIKTGLVLNVFVGSSLID 560

Query: 551 FYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEA------LSLMSKMRPNA 610
            YS  G    A+KV+TS+S     A  NS+IS C    N  E       L L   + P++
Sbjct: 561 LYSKCGLPEMALKVFTSMSTENMVAW-NSMIS-CYSRNNLPELSIDLFNLMLSQGIFPDS 620

Query: 611 IALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNR 670
           +++TS L A S  + L  GK +H  ++R G+ S+  L N L+DMY KCG    A  +F +
Sbjct: 621 VSITSVLVAISSTASLLKGKSLHGYTLRLGIPSDTHLKNALIDMYVKCGFSKYAENIFKK 680

Query: 671 MCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVE 730
           M HK +I+W  MI  YGSHGD I A  LF  M   + G  P+ VTFLS++SAC HSG VE
Sbjct: 681 MQHKSLITWNLMIYGYGSHGDCITALSLFDEM--KKAGESPDDVTFLSLISACNHSGFVE 740

Query: 731 QGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAAL 790
           +G+  F   K++Y      EHYA  +D+LGRAG ++E +S    M    ++  S IW  L
Sbjct: 741 EGKNIFEFMKQDYGIEPNMEHYANMVDLLGRAGLLEEAYSFIKAMP---IEADSSIWLCL 800

Query: 791 LNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLT 836
           L+A     +V  G  +A+KLL+++P +   YV   N Y   G  +   +L  +M+ KGL 
Sbjct: 801 LSASRTHHNVELGILSAEKLLRMEPERGSTYVQLINLYMEAGLKNEAAKLLGLMKEKGLH 820

BLAST of MS012719 vs. ExPASy TrEMBL
Match: A0A6J1C6I6 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial OS=Momordica charantia OX=3673 GN=LOC111008432 PE=4 SV=1)

HSP 1 Score: 891.3 bits (2302), Expect = 3.0e-255
Identity = 452/492 (91.87%), Postives = 452/492 (91.87%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWS-------LFRRMHRSCSALTAHTLTAALAACSAL 410
           P  DVSSLNSLLTSYVRDYRHSDAWS                                  
Sbjct: 56  PQRDVSSLNSLLTSYVRDYRHSDAWSXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX 115

Query: 411 PTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL 470
              EYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL
Sbjct: 116 XXXEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL 175

Query: 471 SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRD 530
           SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRD
Sbjct: 176 SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRD 235

Query: 531 MLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKM 590
           MLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDD MVNSLISGCVRNKNYAEALSLMSKM
Sbjct: 236 MLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDVMVNSLISGCVRNKNYAEALSLMSKM 295

Query: 591 RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNART 650
           RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNART
Sbjct: 296 RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNART 355

Query: 651 VFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHS 710
           VFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHS
Sbjct: 356 VFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHS 415

Query: 711 GLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKI 770
           GLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKI
Sbjct: 416 GLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKI 475

Query: 771 WAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRA 830
           WAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRA
Sbjct: 476 WAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRA 535

Query: 831 KGLTKEAGNSLV 836
           KGLTKEAGNSLV
Sbjct: 536 KGLTKEAGNSLV 547

BLAST of MS012719 vs. ExPASy TrEMBL
Match: A0A6J1JAF9 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 OS=Cucurbita maxima OX=3661 GN=LOC111482726 PE=4 SV=1)

HSP 1 Score: 850.1 bits (2195), Expect = 7.7e-243
Identity = 415/485 (85.57%), Postives = 452/485 (93.20%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+ SL SLLTSYVR +RHSDAWSLFR+MHRSCS LTAHTLTAALAACSALPTS+YG 
Sbjct: 57  PQRDIPSLTSLLTSYVRGHRHSDAWSLFRQMHRSCSPLTAHTLTAALAACSALPTSDYGQ 116

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
           QVHGLIIK GTYSG VTKTAILDMYSKCG+LD SVKVF+EMELKDVVAWNALLSSFLREG
Sbjct: 117 QVHGLIIKTGTYSGIVTKTAILDMYSKCGLLDHSVKVFEEMELKDVVAWNALLSSFLREG 176

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
           LAG+AL+VFEEMKREKVEYSEFTLCSVLKAC ALK F+ GKQVHG+VVVMDRDMLVLGT+
Sbjct: 177 LAGKALNVFEEMKREKVEYSEFTLCSVLKACAALKDFQLGKQVHGMVVVMDRDMLVLGTS 236

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           LVDFYSSVGC+SEAMKVYTSL+C KDD M+NSLISGCV NK Y EA SLMSKMRPNAIAL
Sbjct: 237 LVDFYSSVGCISEAMKVYTSLNCTKDDIMLNSLISGCVVNKKYEEAFSLMSKMRPNAIAL 296

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           TSALAACSENSDLWIGKQIHC  VRHG+ SN QLCN LLDMYAKCGK+ NAR VF+ M H
Sbjct: 297 TSALAACSENSDLWIGKQIHCALVRHGMASNTQLCNTLLDMYAKCGKISNARIVFDEMRH 356

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           +DV+SW+SMIQAYGSHGDG+KAFELFKMMV+G+TGVLPNSVTFLSVLSACGHSGLVEQG+
Sbjct: 357 RDVVSWSSMIQAYGSHGDGLKAFELFKMMVDGKTGVLPNSVTFLSVLSACGHSGLVEQGQ 416

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNA 770
           +CFYLAKE YSSYLGPEHYACFID+LGRAG+I+EVWS+FHDME CGVKITSK+WAALLNA
Sbjct: 417 ECFYLAKERYSSYLGPEHYACFIDILGRAGKIEEVWSVFHDMEMCGVKITSKLWAALLNA 476

Query: 771 CSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEA 830
           CSH QDVSRGEFAAK+LL+L+PNKAGN+VL+SNFYASIGKW+SVDELRRIM  KGL+KEA
Sbjct: 477 CSHNQDVSRGEFAAKRLLRLEPNKAGNFVLASNFYASIGKWNSVDELRRIMWEKGLSKEA 536

Query: 831 GNSLV 836
           GNSLV
Sbjct: 537 GNSLV 541

BLAST of MS012719 vs. ExPASy TrEMBL
Match: A0A0A0KUI3 (Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_4G046580 PE=4 SV=1)

HSP 1 Score: 837.4 bits (2162), Expect = 5.2e-239
Identity = 413/486 (84.98%), Postives = 448/486 (92.18%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+ SLNSLLTSYVR  R SDAWSLF RMHRS S LTAHTLTA LAACSALPTS+YG 
Sbjct: 53  PQTDIPSLNSLLTSYVRGCRQSDAWSLFSRMHRSFSPLTAHTLTAVLAACSALPTSQYGQ 112

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
            VHGLIIK G YSG VTKTAILDMYSKCG+LD SVKVF+EME++DVVAWN+LLSSFLREG
Sbjct: 113 LVHGLIIKTGAYSGIVTKTAILDMYSKCGLLDDSVKVFEEMEMRDVVAWNSLLSSFLREG 172

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
           LA EAL+VFEEMKREKVE+SEFTLCSVLKAC AL+ +R GKQVHGVVVVM+RDMLVLGTA
Sbjct: 173 LAEEALNVFEEMKREKVEFSEFTLCSVLKACAALEDYRLGKQVHGVVVVMNRDMLVLGTA 232

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           LVDFYSSVGC+SEA+KVYTSL+CRKDD ++NSLISGCVRNK Y EA SLMSKMRPNAIAL
Sbjct: 233 LVDFYSSVGCISEAVKVYTSLNCRKDDIILNSLISGCVRNKRYEEAFSLMSKMRPNAIAL 292

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           TSAL ACSENSDLWIGKQIHCVSVRHGLTSN QLCN+LLDMYAKCGKVLNAR VF+ MCH
Sbjct: 293 TSALHACSENSDLWIGKQIHCVSVRHGLTSNTQLCNILLDMYAKCGKVLNARAVFDGMCH 352

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           K+V+SW+SMIQ YGSHGDG+KAFELFK+MVEGRTGVLPNSVTFLSVLSACGHSGLV+QG+
Sbjct: 353 KNVVSWSSMIQTYGSHGDGLKAFELFKIMVEGRTGVLPNSVTFLSVLSACGHSGLVQQGQ 412

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNA 770
           +CFYLAKE YSS LGPEHYACFID+LGRAG+IDEVWSLFHDME CGVKITSKIWAA+LNA
Sbjct: 413 ECFYLAKEKYSSCLGPEHYACFIDVLGRAGKIDEVWSLFHDMEMCGVKITSKIWAAVLNA 472

Query: 771 CSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTK-E 830
           C+H QDVSRGEFAAKKLLQLDPNKAGNYVL+SNFYASIGKWDSVDELRR+M+AKGL K E
Sbjct: 473 CNHNQDVSRGEFAAKKLLQLDPNKAGNYVLASNFYASIGKWDSVDELRRLMKAKGLRKLE 532

Query: 831 AGNSLV 836
              SL+
Sbjct: 533 KAQSLL 538

BLAST of MS012719 vs. ExPASy TrEMBL
Match: A0A6J1EN39 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 OS=Cucurbita moschata OX=3662 GN=LOC111435866 PE=4 SV=1)

HSP 1 Score: 837.0 bits (2161), Expect = 6.7e-239
Identity = 412/482 (85.48%), Postives = 446/482 (92.53%), Query Frame = 0

Query: 354 DVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGAQVH 413
           D+ SL SLL+SYVR +RHSDAWSLFR+MHRSCS +TAHTLTAALAACSAL TS+YG QVH
Sbjct: 60  DIPSLTSLLSSYVRGHRHSDAWSLFRQMHRSCSPVTAHTLTAALAACSALLTSDYGQQVH 119

Query: 414 GLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREGLAG 473
           GLIIK GTYSG VTKTAILDMYSKCG+LD SVKVF+EMELKDVVAWN LLSSFLREGLAG
Sbjct: 120 GLIIKTGTYSGIVTKTAILDMYSKCGLLDHSVKVFEEMELKDVVAWNTLLSSFLREGLAG 179

Query: 474 EALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTALVD 533
           EAL+VFEEMKREKVE SEFTLCSVLKAC ALK F+ GKQVHG+VVVMDRDMLVLGTALVD
Sbjct: 180 EALNVFEEMKREKVECSEFTLCSVLKACAALKDFQLGKQVHGMVVVMDRDMLVLGTALVD 239

Query: 534 FYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIALTSA 593
           FYSSVGC+SEAMKVYTSL C KDD M+NSLISGC  NK Y EA SLMSKMRPNAIALTSA
Sbjct: 240 FYSSVGCISEAMKVYTSLDCIKDDIMLNSLISGCFVNKKYEEAFSLMSKMRPNAIALTSA 299

Query: 594 LAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCHKDV 653
           LAACSENSDLWIGKQIHC  VRHG+TSN QLCN LLDMYAKCGK+LNAR VF+ M H+DV
Sbjct: 300 LAACSENSDLWIGKQIHCALVRHGMTSNTQLCNTLLDMYAKCGKILNARIVFDEMRHRDV 359

Query: 654 ISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGRKCF 713
           +SW+SMIQAYGSHGDG+KAFELFKMM++GRTGVLPNSVTFLSVLSACGHSGLVEQG++CF
Sbjct: 360 VSWSSMIQAYGSHGDGLKAFELFKMMLDGRTGVLPNSVTFLSVLSACGHSGLVEQGQECF 419

Query: 714 YLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNACSH 773
           YLAKE YSSYL PEHYACFID+LGRAG+I+EVWS+FHDME  GVKITSK+WAALLNACSH
Sbjct: 420 YLAKERYSSYLAPEHYACFIDILGRAGKIEEVWSVFHDMEMRGVKITSKLWAALLNACSH 479

Query: 774 IQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEAGNS 833
            QDVSRGEFAAK+LL+LDPNKAGN+VL+SNFYASIGKWDSVDELRRIM  KGL+KEAGNS
Sbjct: 480 NQDVSRGEFAAKRLLRLDPNKAGNFVLASNFYASIGKWDSVDELRRIMWEKGLSKEAGNS 539

Query: 834 LV 836
           LV
Sbjct: 540 LV 541

BLAST of MS012719 vs. ExPASy TrEMBL
Match: A0A1S3BTV7 (pentatricopeptide repeat-containing protein At5g66500, mitochondrial OS=Cucumis melo OX=3656 GN=LOC103493206 PE=4 SV=1)

HSP 1 Score: 830.1 bits (2143), Expect = 8.2e-237
Identity = 410/486 (84.36%), Postives = 445/486 (91.56%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+ SLN  LTSYVR  R SDAWSLF RMHRS S LTAHTLTA LAACSALPTSEYG 
Sbjct: 52  PQTDIPSLNCRLTSYVRSCRQSDAWSLFCRMHRSFSPLTAHTLTAVLAACSALPTSEYGR 111

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
            VHGLIIK G Y G VTKTAILDMYSKCG+LD SVKVF+EME++DVVAWN+LLSSFLREG
Sbjct: 112 LVHGLIIKTGAYPGIVTKTAILDMYSKCGLLDDSVKVFEEMEMRDVVAWNSLLSSFLREG 171

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
           LA EAL+VF EMKREK+E+SEFTLCSVLKAC AL+ FR GKQVHGVVVVM+RDMLVLGTA
Sbjct: 172 LAEEALNVFVEMKREKMEFSEFTLCSVLKACAALEDFRLGKQVHGVVVVMNRDMLVLGTA 231

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           LVDFYSSVGC+SEAMKVYTSL+CRKDD M+NSLISGCVRNK Y EALSLMSKMRPNAIAL
Sbjct: 232 LVDFYSSVGCISEAMKVYTSLNCRKDDIMLNSLISGCVRNKRYEEALSLMSKMRPNAIAL 291

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           TSAL ACSENSDLWIGKQIHCVS+R GLTSN QLCN+LLDMYAKCGKVLNARTVF+ MCH
Sbjct: 292 TSALHACSENSDLWIGKQIHCVSIRRGLTSNTQLCNILLDMYAKCGKVLNARTVFDGMCH 351

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           K+V+SW+SMIQ YGSHGDG+KAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLV+QG+
Sbjct: 352 KNVVSWSSMIQTYGSHGDGLKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVQQGQ 411

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNA 770
           +CFYLAKE YSS LGPEHYACFID+LGRAG+ID+VWSLFHDMETCGVK+TS+IWAA+LNA
Sbjct: 412 ECFYLAKEKYSSCLGPEHYACFIDVLGRAGKIDDVWSLFHDMETCGVKVTSEIWAAVLNA 471

Query: 771 CSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTK-E 830
           CSH QDV+RGEFAA+KLLQLDPNKAGN+VL+SNFYASIGKWDSVDELRRIM AKGL K E
Sbjct: 472 CSHNQDVTRGEFAAQKLLQLDPNKAGNFVLASNFYASIGKWDSVDELRRIMNAKGLRKLE 531

Query: 831 AGNSLV 836
              SL+
Sbjct: 532 KARSLL 537

BLAST of MS012719 vs. TAIR 10
Match: AT5G66500.1 (Tetratricopeptide repeat (TPR)-like superfamily protein )

HSP 1 Score: 545.4 bits (1404), Expect = 7.8e-155
Identity = 270/486 (55.56%), Postives = 356/486 (73.25%), Query Frame = 0

Query: 351 PHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGA 410
           P  D+SSLNS L+S++R    +D  +LF ++HR+   L++HT T  L ACS L   E G 
Sbjct: 45  PQRDLSSLNSQLSSHLRSGNPNDTLALFLQIHRASPDLSSHTFTPVLGACSLLSYPETGR 104

Query: 411 QVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREG 470
           QVH L+IK G  +GT++KTA++DMYSK G L  SV+VF+ +E KD+V+WNALLS FLR G
Sbjct: 105 QVHALMIKQGAETGTISKTALIDMYSKYGHLVDSVRVFESVEEKDLVSWNALLSGFLRNG 164

Query: 471 LAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTA 530
              EAL VF  M RE+VE SEFTL SV+K C +LK  +QGKQVH +VVV  RD++VLGTA
Sbjct: 165 KGKEALGVFAAMYRERVEISEFTLSSVVKTCASLKILQQGKQVHAMVVVTGRDLVVLGTA 224

Query: 531 LVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKMRPNAIAL 590
           ++ FYSSVG ++EAMKVY SL+   D+ M+NSLISGC+RN+NY EA  LMS+ RPN   L
Sbjct: 225 MISFYSSVGLINEAMKVYNSLNVHTDEVMLNSLISGCIRNRNYKEAFLLMSRQRPNVRVL 284

Query: 591 TSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNRMCH 650
           +S+LA CS+NSDLWIGKQIHCV++R+G  S+++LCN L+DMY KCG+++ ART+F  +  
Sbjct: 285 SSSLAGCSDNSDLWIGKQIHCVALRNGFVSDSKLCNGLMDMYGKCGQIVQARTIFRAIPS 344

Query: 651 KDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGR 710
           K V+SWTSMI AY  +GDG+KA E+F+ M E  +GVLPNSVTFL V+SAC H+GLV++G+
Sbjct: 345 KSVVSWTSMIDAYAVNGDGVKALEIFREMCEEGSGVLPNSVTFLVVISACAHAGLVKEGK 404

Query: 711 KCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHD-METCGVKITSKIWAALLN 770
           +CF + KE Y    G EHY CFID+L +AG  +E+W L    ME     I   IW A+L+
Sbjct: 405 ECFGMMKEKYRLVPGTEHYVCFIDILSKAGETEEIWRLVERMMENDNQSIPCAIWVAVLS 464

Query: 771 ACSHIQDVSRGEFAAKKLL-QLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTK 830
           ACS   D++RGE+ A++L+ +  P  A  YVL SNFYA++GKWD V+ELR  ++ KGL K
Sbjct: 465 ACSLNMDLTRGEYVARRLMEETGPENASIYVLVSNFYAAMGKWDVVEELRGKLKNKGLVK 524

Query: 831 EAGNSL 835
            AG+SL
Sbjct: 525 TAGHSL 530

BLAST of MS012719 vs. TAIR 10
Match: AT5G44230.1 (Pentatricopeptide repeat (PPR) superfamily protein )

HSP 1 Score: 469.9 bits (1208), Expect = 4.2e-132
Identity = 224/356 (62.92%), Postives = 280/356 (78.65%), Query Frame = 0

Query: 1   FPRLVFQQVKYPNPFLWTAMIRGYALQGPFSESVNLYTRMRRDGVSPVSFTFSALFKACG 60
           + R V + V++ NPFLWTA+IRGYA++G F E++ +Y  MR++ ++PVSFTFSAL KACG
Sbjct: 101 YARRVIEPVQFRNPFLWTAVIRGYAIEGKFDEAIAMYGCMRKEEITPVSFTFSALLKACG 160

Query: 61  AVLDLGLGRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWT 120
            + DL LGRQ HAQT  + GF   +YVGNTMIDMY KC  + C RKVFDEM ERDV+SWT
Sbjct: 161 TMKDLNLGRQFHAQTFRLRGFCF-VYVGNTMIDMYVKCESIDCARKVFDEMPERDVISWT 220

Query: 121 ELIVAYAKFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARPKEALEYFQKMQDVGMET 180
           ELI AYA+ G+ME A+ LF+ LP KDMVAWTAMVTG+AQNA+P+EALEYF +M+  G+  
Sbjct: 221 ELIAAYARVGNMECAAELFESLPTKDMVAWTAMVTGFAQNAKPQEALEYFDRMEKSGIRA 280

Query: 181 DEVTLVGVVSACAQLGAIKYANWIRDIAEKSGFGPSENVVVGSALIDMYSKCGSPDEAHK 240
           DEVT+ G +SACAQLGA KYA+    IA+KSG+ PS++VV+GSALIDMYSKCG+ +EA  
Sbjct: 281 DEVTVAGYISACAQLGASKYADRAVQIAQKSGYSPSDHVVIGSALIDMYSKCGNVEEAVN 340

Query: 241 VFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEML-KTEIRPNKVTFIGVLTACSHAG 300
           VF  M  +NVF+YSSMI+G A HGRA  AL LFH M+ +TEI+PN VTF+G L ACSH+G
Sbjct: 341 VFMSMNNKNVFTYSSMILGLATHGRAQEALHLFHYMVTQTEIKPNTVTFVGALMACSHSG 400

Query: 301 MVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGCLEEALELIETMPMDPHGDV 356
           +V+QGRQ+F  M + F V P+ DHY CMVDLLGR G L+EALELI+TM ++PHG V
Sbjct: 401 LVDQGRQVFDSMYQTFGVQPTRDHYTCMVDLLGRTGRLQEALELIKTMSVEPHGGV 455


HSP 2 Score: 183.3 bits (464), Expect = 7.8e-46
Identity = 122/421 (28.98%), Postives = 209/421 (49.64%), Query Frame = 0

Query: 429 TAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREGLAGEALHVFEEMKREKVE 488
           TA++  Y+  G  D ++ ++  M  +++   +   S+ L+     + L++  +   +   
Sbjct: 118 TAVIRGYAIEGKFDEAIAMYGCMRKEEITPVSFTFSALLKACGTMKDLNLGRQFHAQTFR 177

Query: 489 YSEF-------TLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLVLGTALVDFYSSVGCM 548
              F       T+  +   C ++   R+      V   M    ++  T L+  Y+ VG M
Sbjct: 178 LRGFCFVYVGNTMIDMYVKCESIDCARK------VFDEMPERDVISWTELIAAYARVGNM 237

Query: 549 SEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEALSLMSKM-----RPNAIALTSALAA 608
             A +++ SL   KD     ++++G  +N    EAL    +M     R + + +   ++A
Sbjct: 238 ECAAELFESLP-TKDMVAWTAMVTGFAQNAKPQEALEYFDRMEKSGIRADEVTVAGYISA 297

Query: 609 CSENSDLWIGKQIHCVSVRHGL--TSNAQLCNVLLDMYAKCGKVLNARTVFNRMCHKDVI 668
           C++        +   ++ + G   + +  + + L+DMY+KCG V  A  VF  M +K+V 
Sbjct: 298 CAQLGASKYADRAVQIAQKSGYSPSDHVVIGSALIDMYSKCGNVEEAVNVFMSMNNKNVF 357

Query: 669 SWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVEQGRKCFY 728
           +++SMI    +HG   +A  LF  MV  +T + PN+VTF+  L AC HSGLV+QGR+ F 
Sbjct: 358 TYSSMILGLATHGRAQEALHLFHYMVT-QTEIKPNTVTFVGALMACSHSGLVDQGRQVFD 417

Query: 729 LAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAALLNACSHI 788
              + +      +HY C +D+LGR GR+ E   L   ++T  V+    +W ALL AC   
Sbjct: 418 SMYQTFGVQPTRDHYTCMVDLLGRTGRLQEALEL---IKTMSVEPHGGVWGALLGACRIH 477

Query: 789 QDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLTKEAGNSL 836
            +    E AA+ L +L+P+  GNY+L SN YAS G W  V  +R++++ KGL K    S 
Sbjct: 478 NNPEIAEIAAEHLFELEPDIIGNYILLSNVYASAGDWGGVLRVRKLIKEKGLKKTPAVSW 527

BLAST of MS012719 vs. TAIR 10
Match: AT3G09040.1 (Pentatricopeptide repeat (PPR) superfamily protein )

HSP 1 Score: 426.8 bits (1096), Expect = 4.0e-119
Identity = 267/867 (30.80%), Postives = 437/867 (50.40%), Query Frame = 0

Query: 17  WTAMIRGYALQGPFSESVNLYTRMRRDGVSPVSFTFSALFKACGAVLDLGLGRQVHAQTI 76
           W +M+  Y+  G   + +  +  +  + + P  FTFS +   C    ++  GRQ+H   I
Sbjct: 128 WNSMLSMYSSIGKPGKVLRSFVSLFENQIFPNKFTFSIVLSTCARETNVEFGRQIHCSMI 187

Query: 77  LIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWTELIVAYAK-------- 136
            + G   + Y G  ++DMYAKC  +S  R+VF+ + + + V WT L   Y K        
Sbjct: 188 KM-GLERNSYCGGALVDMYAKCDRISDARRVFEWIVDPNTVCWTCLFSGYVKAGLPEEAV 247

Query: 137 ---------------------------FGDMESASGLFDGLPVKDMVAWTAMVTGYAQNA 196
                                       G ++ A  LF  +   D+VAW  M++G+ +  
Sbjct: 248 LVFERMRDEGHRPDHLAFVTVINTYIRLGKLKDARLLFGEMSSPDVVAWNVMISGHGKRG 307

Query: 197 RPKEALEYFQKMQDVGMETDEVTLVGVVSACA-----QLGAIKYANWIRDIAEKSGFGPS 256
               A+EYF  M+   +++   TL  V+SA        LG + +A  I+        G +
Sbjct: 308 CETVAIEYFFNMRKSSVKSTRSTLGSVLSAIGIVANLDLGLVVHAEAIK-------LGLA 367

Query: 257 ENVVVGSALIDMYSKCGSPDEAHKVFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEM 316
            N+ VGS+L+ MYSKC   + A KVFE ++E+N   +++MI GYA +G +H  ++LF +M
Sbjct: 368 SNIYVGSSLVSMYSKCEKMEAAAKVFEALEEKNDVFWNAMIRGYAHNGESHKVMELFMDM 427

Query: 317 LKTEIRPNKVTFIGVLTACSHAGMVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGC 376
             +    +  TF  +L+ C+ +  +E G Q  + + K   +A +      +VD+  + G 
Sbjct: 428 KSSGYNIDDFTFTSLLSTCAASHDLEMGSQFHSIIIKK-KLAKNLFVGNALVDMYAKCGA 487

Query: 377 LEEALELIETMPMDPHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAA 436
           LE+A ++ E M      D  + N+++ SYV+D   S+A+ LF+RM+          L + 
Sbjct: 488 LEDARQIFERM---CDRDNVTWNTIIGSYVQDENESEAFDLFKRMNLCGIVSDGACLAST 547

Query: 437 LAACSALPTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDV 496
           L AC+ +     G QVH L +K G      T ++++DMYSKCG++  + KVF  +    V
Sbjct: 548 LKACTHVHGLYQGKQVHCLSVKCGLDRDLHTGSSLIDMYSKCGIIKDARKVFSSLPEWSV 607

Query: 497 VAWNALLSSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGV 556
           V+ NAL++ + +  L  EA+ +F+EM    V  SE T  ++++AC   ++   G Q HG 
Sbjct: 608 VSMNALIAGYSQNNLE-EAVVLFQEMLTRGVNPSEITFATIVEACHKPESLTLGTQFHGQ 667

Query: 557 VVV--MDRDMLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYA 616
           +       +   LG +L+  Y +   M+EA  +++ LS  K   +   ++SG  +N  Y 
Sbjct: 668 ITKRGFSSEGEYLGISLLGMYMNSRGMTEACALFSELSSPKSIVLWTGMMSGHSQNGFYE 727

Query: 617 EALSLMSKMR-----PNAIALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLL 676
           EAL    +MR     P+     + L  CS  S L  G+ IH +        +    N L+
Sbjct: 728 EALKFYKEMRHDGVLPDQATFVTVLRVCSVLSSLREGRAIHSLIFHLAHDLDELTSNTLI 787

Query: 677 DMYAKCGKVLNARTVFNRMCHK-DVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLP 736
           DMYAKCG +  +  VF+ M  + +V+SW S+I  Y  +G    A ++F  M +    ++P
Sbjct: 788 DMYAKCGDMKGSSQVFDEMRRRSNVVSWNSLINGYAKNGYAEDALKIFDSMRQSH--IMP 847

Query: 737 NSVTFLSVLSACGHSGLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSL 796
           + +TFL VL+AC H+G V  GRK F +    Y      +H AC +D+LGR G + E    
Sbjct: 848 DEITFLGVLTACSHAGKVSDGRKIFEMMIGQYGIEARVDHVACMVDLLGRWGYLQEADDF 907

Query: 797 FHDMETCGVKITSKIWAALLNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASI 836
              +E   +K  +++W++LL AC    D  RGE +A+KL++L+P  +  YVL SN YAS 
Sbjct: 908 ---IEAQNLKPDARLWSSLLGACRIHGDDIRGEISAEKLIELEPQNSSAYVLLSNIYASQ 967

BLAST of MS012719 vs. TAIR 10
Match: AT3G02330.1 (Pentatricopeptide repeat (PPR) superfamily protein )

HSP 1 Score: 413.7 bits (1062), Expect = 3.5e-115
Identity = 260/818 (31.78%), Postives = 411/818 (50.24%), Query Frame = 0

Query: 45  VSPVSFT-FSALFKACGAVLDLGLGRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSC 104
           V+ VS T FS +FK C     L LG+Q HA  ++I GF    +V N ++ +Y        
Sbjct: 43  VNSVSTTNFSFVFKECAKQGALELGKQAHAH-MIISGFRPTTFVLNCLLQVYTNSRDFVS 102

Query: 105 GRKVFDEMSERDVVSWTELIVAYAKFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARP 164
              VFD+M  RDVVSW ++I  Y+K  DM  A+  F+ +PV+D+V+W +M++GY QN   
Sbjct: 103 ASMVFDKMPLRDVVSWNKMINGYSKSNDMFKANSFFNMMPVRDVVSWNSMLSGYLQNGES 162

Query: 165 KEALEYFQKMQDVGMETDEVTLVGVVSACAQLGAIKYANWIRDIAEKSGFGPSENVVVGS 224
            +++E F  M   G+E D  T   ++  C+ L        I  I  +   G   +VV  S
Sbjct: 163 LKSIEVFVDMGREGIEFDGRTFAIILKVCSFLEDTSLGMQIHGIVVR--VGCDTDVVAAS 222

Query: 225 ALIDMYSKCGSPDEAHKVFEVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEMLKTEIRP 284
           AL+DMY+K     E+ +VF+ + E+N  S+S++I G   +     AL+ F EM K     
Sbjct: 223 ALLDMYAKGKRFVESLRVFQGIPEKNSVSWSAIIAGCVQNNLLSLALKFFKEMQKVNAGV 282

Query: 285 NKVTFIGVLTACSHAGMVEQGRQLFAKMEKYFSVAPSPDHYACMVDLLGRAGCLEEALEL 344
           ++  +  VL +C+    +  G QL A   K    A      A + D+  +   +++A  L
Sbjct: 283 SQSIYASVLRSCAALSELRLGGQLHAHALKSDFAADGIVRTATL-DMYAKCDNMQDAQIL 342

Query: 345 IETMPMDPHGDVSSLNSLLTSYVRDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSAL 404
            +      + +  S N+++T Y ++     A  LF R+  S       +L+    AC+ +
Sbjct: 343 FDN---SENLNRQSYNAMITGYSQEEHGFKALLLFHRLMSSGLGFDEISLSGVFRACALV 402

Query: 405 PTSEYGAQVHGLIIKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALL 464
                G Q++GL IK           A +DMY KC  L  + +VFDEM  +D V+WNA++
Sbjct: 403 KGLSEGLQIYGLAIKSSLSLDVCVANAAIDMYGKCQALAEAFRVFDEMRRRDAVSWNAII 462

Query: 465 SSFLREGLAGEALHVFEEMKREKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMD-R 524
           ++  + G   E L +F  M R ++E  EFT  S+LKAC    +   G ++H  +V     
Sbjct: 463 AAHEQNGKGYETLFLFVSMLRSRIEPDEFTFGSILKACTG-GSLGYGMEIHSSIVKSGMA 522

Query: 525 DMLVLGTALVDFYSSVGCMSEAMKVYTSLSCRKDDAMV-------------------NSL 584
               +G +L+D YS  G + EA K+++    R + +                     NS+
Sbjct: 523 SNSSVGCSLIDMYSKCGMIEEAEKIHSRFFQRANVSGTMEELEKMHNKRLQEMCVSWNSI 582

Query: 585 ISGCVRNKNYAEALSLMSKM-----RPNAIALTSALAACSENSDLWIGKQIHCVSVRHGL 644
           ISG V  +   +A  L ++M      P+     + L  C+  +   +GKQIH   ++  L
Sbjct: 583 ISGYVMKEQSEDAQMLFTRMMEMGITPDKFTYATVLDTCANLASAGLGKQIHAQVIKKEL 642

Query: 645 TSNAQLCNVLLDMYAKCGKVLNARTVFNRMCHKDVISWTSMIQAYGSHGDGIKAFELFKM 704
            S+  +C+ L+DMY+KCG + ++R +F +   +D ++W +MI  Y  HG G +A +LF+ 
Sbjct: 643 QSDVYICSTLVDMYSKCGDLHDSRLMFEKSLRRDFVTWNAMICGYAHHGKGEEAIQLFER 702

Query: 705 MVEGRTGVLPNSVTFLSVLSACGHSGLVEQGRKCFYLAKENYSSYLGPEHYACFIDMLGR 764
           M+     + PN VTF+S+L AC H GL+++G + FY+ K +Y       HY+  +D+LG+
Sbjct: 703 MI--LENIKPNHVTFISILRACAHMGLIDKGLEYFYMMKRDYGLDPQLPHYSNMVDILGK 762

Query: 765 AGRIDEVWSLFHDMETCGVKITSKIWAALLNACS-HIQDVSRGEFAAKKLLQLDPNKAGN 824
           +G++     L  +M     +    IW  LL  C+ H  +V   E A   LL+LDP  +  
Sbjct: 763 SGKVKRALELIREMP---FEADDVIWRTLLGVCTIHRNNVEVAEEATAALLRLDPQDSSA 822

Query: 825 YVLSSNFYASIGKWDSVDELRRIMRAKGLTKEAGNSLV 836
           Y L SN YA  G W+ V +LRR MR   L KE G S V
Sbjct: 823 YTLLSNVYADAGMWEKVSDLRRNMRGFKLKKEPGCSWV 847

BLAST of MS012719 vs. TAIR 10
Match: AT2G40720.1 (Tetratricopeptide repeat (TPR)-like superfamily protein )

HSP 1 Score: 411.0 bits (1055), Expect = 2.3e-114
Identity = 276/848 (32.55%), Postives = 432/848 (50.94%), Query Frame = 0

Query: 11  YPNPFLWTAMIRGYALQGPFSESVNLYTRMRRDGVSPV---SFTFSALFKACGAVLDLGL 70
           Y +P    + IR    +G + ++++LY+  + DG SP     FTF +L KAC A+ +L  
Sbjct: 21  YISPASINSGIRALIQKGEYLQALHLYS--KHDGSSPFWTSVFTFPSLLKACSALTNLSY 80

Query: 71  GRQVHAQTILIGGFASDLYVGNTMIDMYAKCGFLSCGRKVFDEMSERDVVSWTELIVAYA 130
           G+ +H   +++ G+  D ++  ++++MY KCGFL    +VFD  S+              
Sbjct: 81  GKTIHGSVVVL-GWRYDPFIATSLVNMYVKCGFLDYAVQVFDGWSQSQ------------ 140

Query: 131 KFGDMESASGLFDGLPVKDMVAWTAMVTGYAQNARPKEALEYFQKMQDVGMETDEVTLVG 190
                        G+  +D+  W +M+ GY +  R KE +  F++M   G+  D  +L  
Sbjct: 141 ------------SGVSARDVTVWNSMIDGYFKFRRFKEGVGCFRRMLVFGVRPDAFSLSI 200

Query: 191 VVSACAQLGAIK-------YANWIRDIAEKSGFGPSENVVVGSALIDMYSKCGSPDEAHK 250
           VVS   + G  +       +   +R+  +   F       + +ALIDMY K G   +A +
Sbjct: 201 VVSVMCKEGNFRREEGKQIHGFMLRNSLDTDSF-------LKTALIDMYFKFGLSIDAWR 260

Query: 251 VF-EVMQERNVFSYSSMIVGYAMHGRAHSALQLFHEMLKTEIRPNKVTFIGVLTACSHAG 310
           VF E+  + NV  ++ MIVG+   G   S+L L+       ++    +F G L ACS + 
Sbjct: 261 VFVEIEDKSNVVLWNVMIVGFGGSGICESSLDLYMLAKNNSVKLVSTSFTGALGACSQSE 320

Query: 311 MVEQGRQLFAKMEKYFSVAPSPDHYAC--MVDLLGRAGCLEEALELIETMPMDPHGDVSS 370
               GRQ+   + K   +    D Y C  ++ +  + G + EA E + +  +D   ++  
Sbjct: 321 NSGFGRQIHCDVVK---MGLHNDPYVCTSLLSMYSKCGMVGEA-ETVFSCVVDKRLEI-- 380

Query: 371 LNSLLTSYV-RDYRHSDAWSLFRRMHRSCSALTAHTLTAALAACSALPTSEYGAQVHGLI 430
            N+++ +Y   DY +S A  LF  M +      + TL+  ++ CS L    YG  VH  +
Sbjct: 381 WNAMVAAYAENDYGYS-ALDLFGFMRQKSVLPDSFTLSNVISCCSVLGLYNYGKSVHAEL 440

Query: 431 IKIGTYSGTVTKTAILDMYSKCGVLDGSVKVFDEMELKDVVAWNALLSSFLREGLAGEAL 490
            K    S +  ++A+L +YSKCG    +  VF  ME KD+VAW +L+S   + G   EAL
Sbjct: 441 FKRPIQSTSTIESALLTLYSKCGCDPDAYLVFKSMEEKDMVAWGSLISGLCKNGKFKEAL 500

Query: 491 HVFEEMK--REKVEYSEFTLCSVLKACGALKAFRQGKQVHGVVVVMDRDMLV-LGTALVD 550
            VF +MK   + ++     + SV  AC  L+A R G QVHG ++     + V +G++L+D
Sbjct: 501 KVFGDMKDDDDSLKPDSDIMTSVTNACAGLEALRFGLQVHGSMIKTGLVLNVFVGSSLID 560

Query: 551 FYSSVGCMSEAMKVYTSLSCRKDDAMVNSLISGCVRNKNYAEA------LSLMSKMRPNA 610
            YS  G    A+KV+TS+S     A  NS+IS C    N  E       L L   + P++
Sbjct: 561 LYSKCGLPEMALKVFTSMSTENMVAW-NSMIS-CYSRNNLPELSIDLFNLMLSQGIFPDS 620

Query: 611 IALTSALAACSENSDLWIGKQIHCVSVRHGLTSNAQLCNVLLDMYAKCGKVLNARTVFNR 670
           +++TS L A S  + L  GK +H  ++R G+ S+  L N L+DMY KCG    A  +F +
Sbjct: 621 VSITSVLVAISSTASLLKGKSLHGYTLRLGIPSDTHLKNALIDMYVKCGFSKYAENIFKK 680

Query: 671 MCHKDVISWTSMIQAYGSHGDGIKAFELFKMMVEGRTGVLPNSVTFLSVLSACGHSGLVE 730
           M HK +I+W  MI  YGSHGD I A  LF  M   + G  P+ VTFLS++SAC HSG VE
Sbjct: 681 MQHKSLITWNLMIYGYGSHGDCITALSLFDEM--KKAGESPDDVTFLSLISACNHSGFVE 740

Query: 731 QGRKCFYLAKENYSSYLGPEHYACFIDMLGRAGRIDEVWSLFHDMETCGVKITSKIWAAL 790
           +G+  F   K++Y      EHYA  +D+LGRAG ++E +S    M    ++  S IW  L
Sbjct: 741 EGKNIFEFMKQDYGIEPNMEHYANMVDLLGRAGLLEEAYSFIKAMP---IEADSSIWLCL 800

Query: 791 LNACSHIQDVSRGEFAAKKLLQLDPNKAGNYVLSSNFYASIGKWDSVDELRRIMRAKGLT 836
           L+A     +V  G  +A+KLL+++P +   YV   N Y   G  +   +L  +M+ KGL 
Sbjct: 801 LSASRTHHNVELGILSAEKLLRMEPERGSTYVQLINLYMEAGLKNEAAKLLGLMKEKGLH 820

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
XP_022136826.16.2e-25591.87pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Momordica ... [more]
XP_022984423.11.6e-24285.57pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 ... [more]
KAG7015318.12.1e-24285.77Pentatricopeptide repeat-containing protein, mitochondrial [Cucurbita argyrosper... [more]
XP_023552813.12.5e-24085.15pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Cucurbita ... [more]
XP_038901893.13.7e-23983.27pentatricopeptide repeat-containing protein At5g66500, mitochondrial [Benincasa ... [more]
Match NameE-valueIdentityDescription
Q9FJY91.1e-15355.56Pentatricopeptide repeat-containing protein At5g66500, mitochondrial OS=Arabidop... [more]
Q9FFG85.9e-13162.92Pentatricopeptide repeat-containing protein At5g44230 OS=Arabidopsis thaliana OX... [more]
Q9SS835.7e-11830.80Pentatricopeptide repeat-containing protein At3g09040, mitochondrial OS=Arabidop... [more]
Q9FWA65.0e-11431.78Pentatricopeptide repeat-containing protein At3g02330, mitochondrial OS=Arabidop... [more]
Q7XJN63.2e-11332.55Pentatricopeptide repeat-containing protein At2g40720 OS=Arabidopsis thaliana OX... [more]
Match NameE-valueIdentityDescription
A0A6J1C6I63.0e-25591.87pentatricopeptide repeat-containing protein At5g66500, mitochondrial OS=Momordic... [more]
A0A6J1JAF97.7e-24385.57pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 ... [more]
A0A0A0KUI35.2e-23984.98Uncharacterized protein OS=Cucumis sativus OX=3659 GN=Csa_4G046580 PE=4 SV=1[more]
A0A6J1EN396.7e-23985.48pentatricopeptide repeat-containing protein At5g66500, mitochondrial isoform X1 ... [more]
A0A1S3BTV78.2e-23784.36pentatricopeptide repeat-containing protein At5g66500, mitochondrial OS=Cucumis ... [more]
Match NameE-valueIdentityDescription
AT5G66500.17.8e-15555.56Tetratricopeptide repeat (TPR)-like superfamily protein [more]
AT5G44230.14.2e-13262.92Pentatricopeptide repeat (PPR) superfamily protein [more]
AT3G09040.14.0e-11930.80Pentatricopeptide repeat (PPR) superfamily protein [more]
AT3G02330.13.5e-11531.78Pentatricopeptide repeat (PPR) superfamily protein [more]
AT2G40720.12.3e-11432.55Tetratricopeptide repeat (TPR)-like superfamily protein [more]
InterPro
Analysis Name: InterPro Annotations of Bitter gourd (TR) v1
Date Performed: 2021-10-25
IPR TermIPR DescriptionSourceSource TermSource DescriptionAlignment
IPR011990Tetratricopeptide-like helical domain superfamilyGENE3D1.25.40.10Tetratricopeptide repeat domaincoord: 413..506
e-value: 1.3E-17
score: 65.7
coord: 3..77
e-value: 6.7E-9
score: 37.3
coord: 609..708
e-value: 8.3E-23
score: 82.7
coord: 507..608
e-value: 3.3E-11
score: 44.8
coord: 105..199
e-value: 2.2E-22
score: 81.3
IPR011990Tetratricopeptide-like helical domain superfamilyGENE3D1.25.40.10Tetratricopeptide repeat domaincoord: 200..316
e-value: 3.6E-27
score: 97.6
coord: 317..412
e-value: 1.0E-12
score: 50.2
IPR011990Tetratricopeptide-like helical domain superfamilySUPERFAMILY48452TPR-likecoord: 607..793
IPR002885Pentatricopeptide repeatPFAMPF01535PPRcoord: 729..757
e-value: 9.9E-4
score: 19.2
coord: 117..140
e-value: 0.026
score: 14.8
coord: 559..584
e-value: 2.9E-4
score: 20.9
coord: 89..115
e-value: 4.4E-4
score: 20.3
coord: 357..384
e-value: 0.013
score: 15.7
coord: 324..348
e-value: 0.016
score: 15.4
coord: 148..177
e-value: 6.5E-6
score: 26.1
IPR002885Pentatricopeptide repeatTIGRFAMTIGR00756TIGR00756coord: 148..181
e-value: 1.2E-5
score: 23.1
coord: 89..117
e-value: 2.0E-4
score: 19.3
coord: 16..47
e-value: 9.5E-5
score: 20.3
coord: 729..760
e-value: 1.2E-6
score: 26.3
coord: 251..284
e-value: 5.7E-7
score: 27.3
coord: 560..584
e-value: 4.5E-4
score: 18.2
coord: 357..384
e-value: 0.0012
score: 16.8
coord: 625..652
e-value: 0.0018
score: 16.3
coord: 224..250
e-value: 2.0E-4
score: 19.3
coord: 457..489
e-value: 3.3E-6
score: 24.9
coord: 654..681
e-value: 6.2E-5
score: 20.9
IPR002885Pentatricopeptide repeatPFAMPF13041PPR_2coord: 454..501
e-value: 1.1E-11
score: 44.8
coord: 12..59
e-value: 2.0E-7
score: 31.1
coord: 651..700
e-value: 9.7E-9
score: 35.3
coord: 248..296
e-value: 7.6E-10
score: 38.8
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 13..47
score: 11.509422
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 725..759
score: 9.755614
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 652..686
score: 9.426776
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 354..384
score: 8.780059
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 218..248
score: 9.350046
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 455..489
score: 11.366925
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 249..283
score: 12.013642
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 84..118
score: 9.492543
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 146..180
score: 11.103854
IPR002885Pentatricopeptide repeatPROSITEPS51375PPRcoord: 556..590
score: 9.021208
NoneNo IPR availablePANTHERPTHR47925OS01G0913400 PROTEIN-RELATEDcoord: 568..833
coord: 3..60
coord: 122..198
NoneNo IPR availablePANTHERPTHR47925OS01G0913400 PROTEIN-RELATEDcoord: 356..567
coord: 221..345
NoneNo IPR availablePANTHERPTHR47925:SF41SUBFAMILY NOT NAMEDcoord: 51..130
coord: 3..60
NoneNo IPR availablePANTHERPTHR47925OS01G0913400 PROTEIN-RELATEDcoord: 51..130
NoneNo IPR availablePANTHERPTHR47925:SF41SUBFAMILY NOT NAMEDcoord: 356..567
coord: 122..198
NoneNo IPR availablePANTHERPTHR47925:SF41SUBFAMILY NOT NAMEDcoord: 568..833
NoneNo IPR availablePANTHERPTHR47925:SF41SUBFAMILY NOT NAMEDcoord: 221..345

Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
MS012719.1MS012719.1mRNA


GO Annotation
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
molecular_function GO:0005515 protein binding