Sed0010455 (gene) Chayote v1

Overview
NameSed0010455
Typegene
OrganismSechium edule (Chayote v1)
Descriptionarabinogalactan protein 31
LocationLG04: 11892197 .. 11896824 (-)
RNA-Seq ExpressionSed0010455
SyntenySed0010455
Sequences
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: exonfive_prime_UTRpolypeptideCDSthree_prime_UTR
Hold the cursor over a type above to highlight its positions in the sequence below.
GAAGATGGTGAACAAAATACATCCTCCACACGTTTTTCCTCCCCTTCCTCCTCTTGGTATATGTTCATCCTTATTTTTTATTCCTTAAATATTCCTTTAATATTCGTGATGTATGCTAACTTGATTGTACAAGATGATGTCTATTATAAAAATTTGTTAACATTAATATATTTTTTGATATATTAACAATATTTATTTATCTTAAGTTTGTAGTTGTGGAGATTAAAAATCCTTTTGTTCCTCCCACTTCCCCTCTTCCTCCTGCTATGTTTATTTAAACTTCCTTAAATACCGCTTTAATATTCGTGATATTAGTATATTTAACTTGATTGTATAAGATGATGCTCATTATCAATTTGTTAACATGAACATATTTCTTAATATATTAATAATAGTTATTTTCTTATTTTTGTGCTTATAGATATTGAATTTCCTTTTATTTCTCTCATTTATCCTTTTTCTCTCCATATGTTCATCCTTATTTTTAATTCCTTAAATATTCTTTTGATAATCGAGATTAGTATGTTTAACTTGTTTGTATAAGAAGACGTTCATAATCAAAATTTATTAACATGAATGATTTAGTAATCTTGAATGTATCTATCAAATTTGTTAATCTTGAATGTATCTATCAAATTTGTTAATCTTGAATGTATTTGTTAATATATTAACAATAGTTATCTTCTTATATTTGTAGTTATAGAGATTAAACCTCTTCTTATTCCTCCCATTTGTCTTCCTGCACTTCCTCCAAGTATGTTCATCTTTATTTTTAATTACTTAAATATCTGTCTCTTCAATATCCATGATATCTATACGTTTAACTTCATTATATAAGATGATGTCCATTATCAAAATCTATTAACATGAACGTATTTGTCAATATATGAACAAAAGTTATTTTCTTATTATTGTAGTTGAGATTAAACCTACTTATATTCCTCCCATTTCTCTTCCTCACCCTCTTCTTCCCCGTATGTTCATCCTTACTCTCAATTCCTTTAATCTTCATGATGAATATGTTTAACTTGAATGTATAAGATGATATCCGTCATCAAAATTTGTTAACATGAATGTATTTGTTAATATATTAACAATAGTTATCTTCTTCTGTTTGTAGTTGTAAAGATTAAACCACCTTTTATTCCTCTTATTTCTCTTTTTTCCCTTCTCCTCCTGCTATGTTTATTTAAAATTCCTTGAATATTGCTTTCATATTCGTGATATTAGTATGTTTAACTTGATTGTATAAGATGGTGTCCATTATCCAAATTTGTTAACATGAATGTTTTTGTTAATATATTAATAATAGTTATTTTCTTATTTTTATCCTTATAGATATTGAACCTCATTTTATTCCTCTCATTTGTCCACTTTCTCTCTCCATGTTCATCTTTGTTTTTAATTCCCTTAAATATTCCTTTCTTAATCGTGATCAGTATGTTTAACTTGATTGTATGCGATAATGTTCATAATCAAAATTTGTTAATAAGAATGTTTTTGTTAATATGTTAACAATAGTTCTTTCTTTTTTTTTTTTTTTTTTTTTTGCAATTGAGATTGAACCTCCTTATATTCCTCCTATTTCTCCTCCTCCAGGTATGTTCATCCTTATTTTTAATTTCTTCAAAATCTTTGATCAATATGTATGACTTTGGTATTAGATGACGTTTCTTATTAAAATTTGTTAGCATGATGTATTTGTTAATATATTAATAATAGGTATCTTCTTATATTTGTAGTTATAAAGATGAAACCTCCTCTCATTCCCTCTATTTGTCTTCCTACACTTCCTCCAAGTATGTTCATATTTATTTTTAACTACTTAAATATGTCTCTTCAATATCCATGATATCAATACGTTTAACTTAATTATATAAGATGATGTCCATTGTCAAAACTTTTAACATGAATGTATTTCTTAATATATTAACACTAGTTATTTTCTCATTTTTGTAGTTGAAATTAAACTTCCTCATATTCCTCCCATTTCTCTTCATCACCGCATGTTCATCTTTATTTTTAATTCCTTTAATCTTCATGATCAATATGTATAACTTGATTGTATAAGATAATGCCCGTTATCAAAATTTGTAACATAAATTTATTTATTAATATATTAACAATATTTTTCTTCTTATATTTGTAGTTATAGAAATTGAACCTCTTCTTATATCTCCCGTTTCCTCTCTTTCCCTTCTCCTCCTGCTATGTTTTTTTAAAATTCCTTAAATATCACTTTCATATTCGTGATATTAGTATGGTTAACTTGATTGTATAAGATGATGTCCATTATCAAAATTTGTTAACATGAATGTATTTGTTAATATATTAATAATAGTTATTTTCTTATTTTAGTCCTTTAGATAGTGAACATCATTAATTCTTTCATTTCTCCAATTTCTCTCTGCATGTCATCCTTGTTTTTAATTCCTTAAATATTCCTTTCTTAATCGTGATCAGTATGTTTAACTTGATTGTATGCGATGATGTTCATAATCAAAATTTGTTAACAAGATTGTTTTTGTTAATATGTTAAGAATAGTTATTTTCTTTTTCTTTTTTTTTTGCAGTTGAGATTGAACCTCCTTATATTCCTCCCATTTCTCCTCCTCCGAGTATGTTCATCCTTATTTTTAATTTCTTCAATATATGTGATCAATATGTTTGACTTTGTATTAGATGACATTTCTTATTAGAATTTGTTAACATGAATGTATTTGTTAATATATTAATCATAGTTATCTTTTTATGTTTGTATTTATAGAGATCAAACTTCCTCACATTCCTCCCATTTATCTTCCTACACTTCCTCCAAGTATGTTCATATTTATTTTTAACTACTTAAATATATGTCTCTTCAATATCCATGATATCAATATGTTTAACTTAATTATATAAGATGATGTCCATTGTCAAAACTTGTTAACATGAATGTATTTCTTAATATATTAACACTAGTTATTTTCTCATTCTTGTAGTTGAGATTAAACCTTCTCATATTCCTCACATTTCTCTTCATCAGCTCATGTTCATCTTTATTTTTAATTCCTTTAATCTTCATGATCAATATGTTTAACTTGATTGTATAAGATGATGTCCGTATCAAATTTGTTAGCATAAATGTATTTGTTAATATATTAACAATAGTTTTCTTCTAATGTTTGTAGTTATGGAGATTAAACCTCCTCTTATTTCCTCTCTTTCCCTCTTCCTCGTGGAATATTTATTTTAAATTCCTTAAATATTGCTTTAATATTCGTGATATTAGTTTGTTTAACTTGATTGTATATGATGATGCCCATTATTAAAATTTGTTAGCATGAATGTATTTGTTAATATATTTATAATAGTTATTTTCTCAATTTTGTACTTATAGATATTGAAACTCATTTTATTCCTCTCATTTGTCCTCTTTCTCTCTGCATGTTCATCCTTATTTTGAATTAAATGTTCCTTTGATAATCGTGATCAGTATGTTTGACTTGATTGTATACGATGATGTTCATAATAAAAATTTGTTAACAAGAAAGTTTTTGTTAATATGTTAACAATAGTTATTTCTCTTTTTTGCAGTTGAGATTGAACCTCCTTATATTCCTCCCATTTCTCCTCCTCCTGGTATGTTCATCCTTATTTTTAATTTCTTCAATATCTATGATCAATATGTTTGACTTTTGTATTAGATGACGTTTCTTATTAAAATTTGTTAACATGAATGTATTTGTTAATATATTAACAATAGTTATCTTCTTATATTTATAGTTATAGAGATTAAACCGCCTTTTATTCCCTCCATTTGTCTTTCTACACTTCCTCTAAGTATGTTCATATTTATTTTTAACTACTTAAATATATGTCTCTTAAATATCCATGATATCAATACGTTTAACTTAATTATATAAGATGATGTTCATTATCAAAATTTGTTAACATGAATGTATTTCTTAATATATTAACACTAGTTATTTTCTCATTTTTGTAGTTGAGATTAAACCTCCTCATATTCCTCCCATTTCTCTTCATCACCCCATGTTCATCTTTATTTTTAATTCCTTTAATCTTCATGATCTGGTTTCAAAAAAAAAATCTTCATGATCAATATGTTTAACTTGATTGTATAAGATGATATCTGTTATCAAAATTTGTTAATATGAATGTATTTGTTAATAAATTAACAATAGTTATCTTCTTATTTTATAGTTGTAGAAATTAAACGTCCTTTTATTCCTCCGAGTTTTCTTCCTCCTTCTCCCGATATGTTCATCTTTATTTTTAATTTCTTAAATATCCCTTTAATATTCATGATATCATTACGTTTAACTTGATTGTATAAGAGATGTCCACTATCAAAATTTGTTAACATGAATGTATTTGTTAATATGTTAACAATAGTTTTTTTTCTTATTTTTTGTAGTTTGTGGAGAAACAAATTTGACCTCAAATTCTTGATGTTATACTCGATATCTCTACCGTGATCATTATGTCAAAGTACACCCAATAACATATGGATCACAAGTGATTGTAATGGGTTAGAGTGTGCATGAGAGAGTGTATGTATATATTAGAGTTATATGCAGGATGTATGCTTACATATAACTTAAATTAATGAAATAAAGATATTCATC

mRNA sequence

GAAGATGGTGAACAAAATACATCCTCCACACGTTTTTCCTCCCCTTCCTCCTCTTGTTATAGAGATTAAACCTCTTCTTATTCCTCCCATTTGTCTTCCTGCACTTCCTCCAATTATAAAGATGAAACCTCCTCTCATTCCCTCTATTTGTCTTCCTACACTTCCTCCAATTGAGATTGAACCTCCTTATATTCCTCCCATTTCTCCTCCTCCGAAGATCAAACTTCCTCACATTCCTCCCATTTATCTTCCTACACTTCCTCCAATTGAGATTGAACCTCCTTATATTCCTCCCATTTCTCCTCCTCCTGTTTGTGGAGAAACAAATTTGACCTCAAATTCTTGATGTTATACTCGATATCTCTACCGTGATCATTATGTCAAAGTACACCCAATAACATATGGATCACAAGTGATTGTAATGGGTTAGAGTGTGCATGAGAGAGTGTATGTATATATTAGAGTTATATGCAGGATGTATGCTTACATATAACTTAAATTAATGAAATAAAGATATTCATC

Coding sequence (CDS)

ATGGTGAACAAAATACATCCTCCACACGTTTTTCCTCCCCTTCCTCCTCTTGTTATAGAGATTAAACCTCTTCTTATTCCTCCCATTTGTCTTCCTGCACTTCCTCCAATTATAAAGATGAAACCTCCTCTCATTCCCTCTATTTGTCTTCCTACACTTCCTCCAATTGAGATTGAACCTCCTTATATTCCTCCCATTTCTCCTCCTCCGAAGATCAAACTTCCTCACATTCCTCCCATTTATCTTCCTACACTTCCTCCAATTGAGATTGAACCTCCTTATATTCCTCCCATTTCTCCTCCTCCTGTTTGTGGAGAAACAAATTTGACCTCAAATTCTTGA

Protein sequence

MVNKIHPPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPIEIEPPYIPPISPPPKIKLPHIPPIYLPTLPPIEIEPPYIPPISPPPVCGETNLTSNS
Homology
BLAST of Sed0010455 vs. NCBI nr
Match: XP_038888460.1 (vegetative cell wall protein gp1-like [Benincasa hispida])

HSP 1 Score: 62.0 bits (149), Expect = 3.8e-06
Identity = 57/109 (52.29%), Postives = 67/109 (61.47%), Query Frame = 0

Query: 7   PPHVFPPLPPLV----IEIKPLLIPPICLPALPPI----IKMKPPLIPSICLPTLPPIEI 66
           PP   PPLPPL     I + PL  PPI LP LPPI    I++ P  +P I LP LPPI +
Sbjct: 106 PPIRLPPLPPLTPLPPIRLSPL--PPIRLPPLPPIRLPPIRLSP--LPPIRLPPLPPIRL 165

Query: 67  EPPYIPPISPPPKIKLPHIPPIYLPTLPPIEIEPPYIPPISPPPVCGET 108
            P  IPP++P P I+LP +PPI LP LPPI I PP IP   PPP   +T
Sbjct: 166 PP--IPPLTPLPPIRLPPLPPIRLPPLPPI-ILPPIIPLRPPPPTIPQT 207

BLAST of Sed0010455 vs. NCBI nr
Match: MBP7492944.1 (cadherin-like domain-containing protein [Rhodoferax sp.])

HSP 1 Score: 57.8 bits (138), Expect = 7.2e-05
Identity = 40/107 (37.38%), Postives = 67/107 (62.62%), Query Frame = 0

Query: 1   MVNKIHPPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPI--EI 60
           ++  + PP V P  PP+V  ++P ++PP+  P +PP+   +PP++P +  P +PP+   +
Sbjct: 52  VIPPVVPPVVPPVEPPVVPPVEPPVVPPVEPPVVPPV---EPPVVPPVVPPVVPPVVPPV 111

Query: 61  EPPYIPPISPP--PKIKLPHIPPIYLPTLPPI--EIEPPYIPPISPP 102
           EPP +PP+ PP  P +  P +PP+  P  PP+   +EPP +PP+ PP
Sbjct: 112 EPPVVPPVVPPVEPPVVPPVVPPVVPPVAPPVVPPVEPPVVPPVVPP 155

BLAST of Sed0010455 vs. NCBI nr
Match: MWV48015.1 (DUF3494 domain-containing protein [Rathayibacter sp. VKM Ac-2803])

HSP 1 Score: 55.5 bits (132), Expect = 3.6e-04
Identity = 41/101 (40.59%), Postives = 61/101 (60.40%), Query Frame = 0

Query: 7   PPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPI--EIEPPYIP 66
           PP   P  PP++  + P +IPP+  P +PP+I   PP+IP +  P +PP+   + PP IP
Sbjct: 357 PPVTPPTTPPVIPPVTPPVIPPVTPPVIPPVI---PPVIPPVVPPVIPPVIPPVTPPVIP 416

Query: 67  PISPP--PKIKLPHIPPIYLPTLPPI--EIEPPYIPPISPP 102
           P+ PP  P +  P  PP+  P +PP+   + PP IPP++PP
Sbjct: 417 PVIPPVIPPVIPPVTPPVIPPVIPPVTPPVTPPVIPPVTPP 454

BLAST of Sed0010455 vs. NCBI nr
Match: KAG0558437.1 (hypothetical protein KC19_10G028200 [Ceratodon purpureus])

HSP 1 Score: 54.3 bits (129), Expect = 7.9e-04
Identity = 45/110 (40.91%), Postives = 66/110 (60.00%), Query Frame = 0

Query: 7   PPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLP--TLPPIEIEPPYIP 66
           PP V  P PP  + + P+++PP+  P LPP+    PPL+P + LP  TLPP+ + P  +P
Sbjct: 171 PPPVSTPPPPPPVVLPPVVLPPVLPPTLPPV--ALPPLLPPVSLPPVTLPPVVLPPVALP 230

Query: 67  PISPP---PKIKLPHI--PPIYLP------TLPPIEIEPPYIPPISPPPV 104
           PI PP   P + LP +  PP+ LP      TLPP+ + P  +PP++ PP+
Sbjct: 231 PILPPVTLPPVSLPPVTLPPVTLPPILPPVTLPPVSLPPVTLPPVTLPPI 278

BLAST of Sed0010455 vs. NCBI nr
Match: KAG0558440.1 (hypothetical protein KC19_10G028500 [Ceratodon purpureus])

HSP 1 Score: 54.3 bits (129), Expect = 7.9e-04
Identity = 45/110 (40.91%), Postives = 66/110 (60.00%), Query Frame = 0

Query: 7   PPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLP--TLPPIEIEPPYIP 66
           PP V  P PP  + + P+++PP+  P LPP+    PPL+P + LP  TLPP+ + P  +P
Sbjct: 170 PPPVSTPPPPPPVVLPPVVLPPVLPPTLPPV--ALPPLLPPVSLPPVTLPPVVLPPVALP 229

Query: 67  PISPP---PKIKLPHI--PPIYLP------TLPPIEIEPPYIPPISPPPV 104
           PI PP   P + LP +  PP+ LP      TLPP+ + P  +PP++ PP+
Sbjct: 230 PILPPVTLPPVSLPPVTLPPVTLPPILPPVTLPPVSLPPVTLPPVTLPPI 277

BLAST of Sed0010455 vs. ExPASy TrEMBL
Match: A0A7K1VHR7 (DUF3494 domain-containing protein OS=Rathayibacter sp. VKM Ac-2803 OX=2609256 GN=GRS96_01845 PE=3 SV=1)

HSP 1 Score: 55.5 bits (132), Expect = 1.7e-04
Identity = 41/101 (40.59%), Postives = 61/101 (60.40%), Query Frame = 0

Query: 7   PPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPI--EIEPPYIP 66
           PP   P  PP++  + P +IPP+  P +PP+I   PP+IP +  P +PP+   + PP IP
Sbjct: 357 PPVTPPTTPPVIPPVTPPVIPPVTPPVIPPVI---PPVIPPVVPPVIPPVIPPVTPPVIP 416

Query: 67  PISPP--PKIKLPHIPPIYLPTLPPI--EIEPPYIPPISPP 102
           P+ PP  P +  P  PP+  P +PP+   + PP IPP++PP
Sbjct: 417 PVIPPVIPPVIPPVTPPVIPPVIPPVTPPVTPPVIPPVTPP 454

BLAST of Sed0010455 vs. ExPASy TrEMBL
Match: A0A7X9Z6C4 (Chaplin OS=Streptomyces sp. RLA2-12 OX=2721242 GN=HEP83_23515 PE=4 SV=1)

HSP 1 Score: 53.5 bits (127), Expect = 6.5e-04
Identity = 43/106 (40.57%), Postives = 61/106 (57.55%), Query Frame = 0

Query: 7   PPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPIEIEPPYIPPI 66
           PP V P  PP V    P  +PP   P +PP+    PP +P    PT+PP  + PP +PP+
Sbjct: 144 PPTVPPTTPPTVPPTTPPTVPPTTPPTVPPV---TPPTVPPTTPPTVPP--VTPPTVPPV 203

Query: 67  SPP--PKIKLPHIPPIYLPTLPPIEIEPPYIPPISPPPVCGETNLT 111
           +PP  P +  P +PP+  PT+PP  + PP +PP++PP V   T +T
Sbjct: 204 TPPTVPPVTPPTVPPVTPPTVPP--VTPPTVPPVTPPTVPPVTPVT 242

BLAST of Sed0010455 vs. TAIR 10
Match: AT1G28290.1 (arabinogalactan protein 31 )

HSP 1 Score: 42.4 bits (98), Expect = 2.9e-04
Identity = 40/101 (39.60%), Postives = 55/101 (54.46%), Query Frame = 0

Query: 5   IHPPHVFPPLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPIEIEPPYIP 64
           ++PP   P  PP    +KP + PP   P  PP    KPP+ P +  PT  P  ++PP  P
Sbjct: 124 VYPPTKAPVKPPTKPPVKPPVYPPTKAPVKPP---TKPPVKPPVYPPTKAP--VKPPTKP 183

Query: 65  PISPP--PKIKLPHIPPIYLPTLPPIE--IEPPYIPPISPP 102
           P+ PP  P  K P  PP+Y PT  P++  + PP  PP++PP
Sbjct: 184 PVKPPVSPPAKPPVKPPVYPPTKAPVKPPVSPPTKPPVTPP 219

BLAST of Sed0010455 vs. TAIR 10
Match: AT1G28290.2 (arabinogalactan protein 31 )

HSP 1 Score: 42.0 bits (97), Expect = 3.8e-04
Identity = 42/101 (41.58%), Postives = 53/101 (52.48%), Query Frame = 0

Query: 6   HPPHVFP-PLPPLVIEIKPLLIPPICLPALPPIIKMKPPLIPSICLPTLPPIEIEPPYIP 65
           H PH  P P PP    +KP +  P+  PA PP+   KPP+ P    P  PP   +PP  P
Sbjct: 56  HHPHPHPHPHPPAKSPVKPPVKAPVSPPAKPPV---KPPVYPPTKAPVKPP--TKPPVKP 115

Query: 66  PISPP--PKIKLPHIPPIYLPTLPPIE--IEPPYIPPISPP 102
           P+SPP  P +K P  PP   P  PP +  ++PP  PP  PP
Sbjct: 116 PVSPPAKPPVKPPVYPPTKAPVKPPTKPPVKPPVYPPTKPP 151

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
XP_038888460.13.8e-0652.29vegetative cell wall protein gp1-like [Benincasa hispida][more]
MBP7492944.17.2e-0537.38cadherin-like domain-containing protein [Rhodoferax sp.][more]
MWV48015.13.6e-0440.59DUF3494 domain-containing protein [Rathayibacter sp. VKM Ac-2803][more]
KAG0558437.17.9e-0440.91hypothetical protein KC19_10G028200 [Ceratodon purpureus][more]
KAG0558440.17.9e-0440.91hypothetical protein KC19_10G028500 [Ceratodon purpureus][more]
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
A0A7K1VHR71.7e-0440.59DUF3494 domain-containing protein OS=Rathayibacter sp. VKM Ac-2803 OX=2609256 GN... [more]
A0A7X9Z6C46.5e-0440.57Chaplin OS=Streptomyces sp. RLA2-12 OX=2721242 GN=HEP83_23515 PE=4 SV=1[more]
Match NameE-valueIdentityDescription
AT1G28290.12.9e-0439.60arabinogalactan protein 31 [more]
AT1G28290.23.8e-0441.58arabinogalactan protein 31 [more]
Relationships

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Sed0010455.1Sed0010455.1mRNA