Cp4.1LG04g00050 (gene) Cucurbita pepo (Zucchini)

NameCp4.1LG04g00050
Typegene
OrganismCucurbita pepo (Cucurbita pepo (Zucchini))
DescriptionUnknown protein
LocationCp4.1LG04 : 2143557 .. 2148155 (-)
The following sequences are available for this feature:

Gene sequence (with intron)

Legend: CDS
Hold the cursor over a type above to highlight its positions in the sequence below.
GATTCTTCTTTACCATCCTTGACTTCTGTAACTTCAAGTTCTCGTTTTTCAACTGCTTCCGAACCTGTCTCTTTTGCTCTCACCTCCTCAGATTCAGTCACAGGAGAACCTTCATCTGGAAGCTTTGTGTTGCTGGGAGGTACGAACTCACTAATCTTTTTTGCTATAACTTCTGATTCTTTCTCAGGTGGAACTTCATTTGGTTGCTTCTGGTTCTTGGAAGGTTCAATGGATTCACTAGTGTCTTTTTCCGCCACGACTTCTAATTCTTTCTCGGGTTGAACTTCAATGAGCAACTCACTTTCCTTCGGAACTTCTACAGATTCACTAATGTTTTCTTCTATGACTTCCATTGATTCTTGCACTGGCTGTACTTCAGTTGCATGTTCCTTTGTCTTAGGAAGGTTTGTGGGCTCAGTAATCTCTTTTTCCACCACTAGTGGATGAACTCCAATGGGCTGCTCCTTTTCTGTCGGAAGTTCAACTACTTCAGTTATTTCTTTTTCAATCACCTCTGCCTGTTCTGCTAAAAGAACTTCAACCGGCCCTTCTTTCTTGGAAGGTTCAGCAGACAATTCTGGAACACAAGTTGTCTCTGGTTTCTTCCTCAGCTCTTTGTCTATACTGACAAATTCTTTAGCTTGTTGTTCCTGTTCTAAGCCCTTATCAGAATCTTCTATAAGGTTACATTTAGCCACCTGACTAACTGAAACTTGTTCATCACTTTCCACTGCATATTGCGCCTCTTCTTCTTGGGGTTTTCCTTCCTCAATGGGTGGGTTAATGTCATCTTCAGAAGCCAATGTCTTCTCATCTTTTATATTTTCAACCTCCACGTCAGTTTCTTGAACGGTCAGCTCAGGTAATTCTCTCACATTTTCCTGTACTTTAATTGCTTCGGGTTCTTGTTTCTCAACTTCTTCAGAACCTGTGGAATCACTGGTCTCTTTTCCCTTCACTTCTCCAGATTCTGTAACTGGAAAATCTTCCTCTACCTGCTCCTTGTTCTTTAGAGGTTCAAAGGATGCACTAGTCTCTTTTGCTATGACTTCTGATGATTCTTTCTGGGAAAGAACTGGATCTAGCTGCTCCTTGTTGTTGGGAGGTTCAATGGATTCATTAGTGCCTTTTGGTACGACTTCCAAGTCTTTCACTGGATGAACTTCGGTTAACAACTCATTTTCCTTGGAAAGTTCAACAGTTTCACTAATCTTCTCTGCAGTCACTTCCCTCGATTCATGAGCTGGATGAACGAGTTCTGTGGGTTCAGTAATTTCTCTTTCTGTCACTTCTCCTGATTCTTTTTGGCGGTCAACTTCAACGGGCTGCTCCTTTTCTGTTGGAGGTTCAAATGTTTCAATAATTTCTTTTGTGATAATTTCTACTTGTTCTTCTTCTGTAAGAACCTCATTAGTCTGCTCTTCTTTTTTGAGAGGTTCAACGAATAAGTCTGGAACAAGACTTGTCTCTGGTTCCTCCCTTGGTTCATTGTCTACGCTGACACATTCTTTAGCTGGAGGCTCCTCTTTTAGTCTCTTACCAGATTCTGTCATTGGAAAACCTTCATCTGCCTGCTCGTTGTTCTTAGGAGGGTCAAAGGATGCACTAACCTCTGGTGCTATAACTTCTACTAATTCTTTCTGGGAAATAACGTCATCTGATTGCTCCTTATTCTTGAGAGCCTCAATGGATTCACTTGTCTCTTTTGCTATCACTACCGGATGCTCATTTTCTGTTAAAGGTTCAACCGTTTCAGTAACTTGTTCTGCAACCACCTCGCTTATCTCTTTTGCTATCACTACTGGTAGCACCTTTTCTGTTGGAGATTCAACCGTTTCACTAACTTCTTTTGTGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGCTACCTCTACTGATAGCTCCTTTTCTGTTGGAGATTCAACCGTTTCAGTAACTTCTTTTGCGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTCTTCGGTTGGTGGTTCAATCGTTTCAACTGTTTCGGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGCTACCACTACTGATAGCTCCTTTTCTGTTGGAGGTTCAACCATTTCAGTAACTTCTTTTGCGACCACCTCACTTATCTCTTTTGTTATCACCACGGGTTGCTCCATTTCTGTTGGAGGTTCGACTGTTTCACTAACTTTTTCTGCAACAACCTCAATCATCTCTTTTGCTATCACCACGGGTTGGTCCTTCTCTATTGGAGGTTCAACCGTTTCATCTGGCTCAGTAACTTTCTCTGCAACCACCTCGCTCATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGAAGGTTCAATCGTTTCAATAACTTCTTCTGCAACCACCTCACTTATCTCTTTTGCTGTCACTACTGGTAGCACCTTTCCTGTTGTAACTGTTTCAGTAACTTCCTTTGGGATAACCTCACTTATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGGAGGTTCAATTGTTGCAGTAACTTCTTCTGCTACCAGATCAATTCTCTCATTTGCTATCACTGCTGGCTGCTCCTTTCCGATCGGAGGTTCAATGATTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTGTCACTGAAACAACCTCAATTGGCTGCGCTTCTTTCTTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCGCATCAATTCTCTCTTTTGCTATCGCTGCTGGCTGCTCCTTTTGCATTGGAGGTTCAAGGGTTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTTTCACTGAAACAGCCTCAATTGGCTGCGCTTCTTTCTTTGGTGGTTCTACAGATTTTTCTGGAAGACTAATTGTCTCTGGTTCCTCCTCTGGCTCTTTCTCCACACTTTCAAACTCTGTAGCTGGTTGCTCTTTTTCTGGGCTCTTAACAGAGTCTTCTATAGGACCAGATTCAGCCACCTGACCTACTGAATCTTGTTTATCACTTCCCTCTTCCTGGATTTTCCCTTCAATTGATGGGCCATGGTCATCTCCAGATGCTAATGGCTTCTCATCTTTCACGGTTTCAGCCTCGGCATGAGTGTCAAGAACTTGTTTAGTTATTTCAGATAACTCTCCTGTACCATCCTTCACTTCAATGATCTCCTTTTCTTGTTTCTCAACTTCTTCAGAACCCAATGTGGAATCATTGGCTTCTTTTTTGTTCTCTTCTCCAGATTCTGTCGCTGAAAAGCTTTCATCTGCCTGCTCCTTGTTCTTGTGAGGTTCAAATAATACGCTAACCTCTTCTACCATAACTTCAACTGATTCTTTCTGGGAAATAACTTCAACCGGCTGCTCCTCATTCTTGAGAGGTTCGATGGATTCATTTGTCTCTTTTTCTTTCGCTACTAGTTCTTTTGGTTGATGAACTTCAACTAGCAATTCACTTTCCTGGGGAACTTCTACAGATTCACTAATCTTTGTTTCAATCACCTCTCTTGATTCTTGCGCTGGTTCAACTTCAGATGCCTGCTCCTTTTCCTTGGGAACTTCTTTTGCTTTCACTTCTTCCAATCCTTTGATTGGATGAACTTCGGCTGGCTGCTTCTCTTCTGCTGGAGGTTCAACTGTTTCAACAATTTCTTTTGCAACCGCCTCTATTGGTTCTTCCGCTGGAACAACCTCTATCGGCTGAGCTTCTTTCTTTGCTGGTTCAACGGATTCTTCTGGAACACCAGCTTCTGGTTCCTTGTCTGGTTCTTTCTCTACACTGACGCATTCTGTTGCCAGTTCCTCATTTGCCTCTGCTGGGCCCTTACCTGAGTCTACAACAACTGATAATTCTGGATTATCAATAATCTGTGGCTTCTTCTCTTCTACTTCAACAGGCGCAGTTAAAGTTTCAACTTTTTCTGCGGCTTCTGTTGCAGACTGTACAGCGGCACCTGGTTTCTCTTTTCCTTGACTGTCAACCGTATCGTCTGATGATTCATCCTCTAACTTTGGAAGGCCCACAGCCTCTAATGGTTGCTCTTCTACTTTTTGTGCAGTTGGCTGCTCTTCTGGTGGGCTCTTAACATTGTCAGCTGCATCAAACTCCTTTATACTCCTCTCCAAGAACGCAATTACTGGCAGCTCTGTTGCTTCTCCTCCAACCGGTTCAGCTGATGGGCTCTCCTCAGCAACAGAGGTCACTACCTCTGCGACAAAAGGTGATTCTTTTTCCACCTTCACAGTGTCTTGAATTGATAGACCAACAACAGGATCTTCATCTCTTTTTTTCACCTCAATAACAGGAGGCTCAACCTGAATATCCACTTCTTTTTCTTCTGTCGTGGACAAAGTACTATCTGGAATATGTACGTTGTCAGCTTTGCCTTTCTCTTTGTCGTCTTCTACAGTTTCTTGTGGTGAAGAGACATTTATCTGTTCCATTTGTACTGTTTCACTACTTAACTTCACCATTTTCTACAGTACAAGAAAAATTAAC

mRNA sequence

GATTCTTCTTTACCATCCTTGACTTCTGTAACTTCAAGTTCTCGTTTTTCAACTGCTTCCGAACCTGTCTCTTTTGCTCTCACCTCCTCAGATTCAGTCACAGGAGAACCTTCATCTGGAAGCTTTGTGTTGCTGGGAGGTTCAACGAATAAGTCTGGAACAAGACTTGTCTCTGGTTCCTCCCTTGGTTCATTGTCTACGCTGACACATTCTTTAGCTGGAGGCTCCTCTTTTAGTCTCTTACCAGATTCTGTCATTGGAAAACCTTCATCTGCCTGCTCGTTGTTCTTAGGAGGGTCAAAGGATGCACTAACCTCTGGTGCTATAACTTCTACTAATTCTTTCTGGGAAATAACGTCATCTGATTGCTCCTTATTCTTGAGAGCCTCAATGGATTCACTTGTCTCTTTTGCTATCACTACCGGATGCTCATTTTCTGTTAAAGGTTCAACCGTTTCAGTAACTTGTTCTGCAACCACCTCGCTTATCTCTTTTGCTATCACTACTGGTAGCACCTTTTCTGTTGGAGATTCAACCGTTTCACTAACTTCTTTTGTGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGCTACCTCTACTGATAGCTCCTTTTCTGTTGGAGATTCAACCGTTTCAGTAACTTCTTTTGCGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTCTTCGGTTGGTGGTTCAATCGTTTCAACTGTTTCGGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGCTACCACTACTGATAGCTCCTTTTCTGTTGGAGGTTCAACCATTTCAGTAACTTCTTTTGCGACCACCTCACTTATCTCTTTTGTTATCACCACGGGTTGCTCCATTTCTGTTGGAGGTTCGACTGTTTCACTAACTTTTTCTGCAACAACCTCAATCATCTCTTTTGCTATCACCACGGGTTGGTCCTTCTCTATTGGAGGTTCAACCGTTTCATCTGGCTCAGTAACTTTCTCTGCAACCACCTCGCTCATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGAAGGTTCAATCGTTTCAATAACTTCTTCTGCAACCACCTCACTTATCTCTTTTGCTGTCACTACTGGTAGCACCTTTCCTGTTGTAACTGTTTCAGTAACTTCCTTTGGGATAACCTCACTTATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGGAGGTTCAATTGTTGCAGTAACTTCTTCTGCTACCAGATCAATTCTCTCATTTGCTATCACTGCTGGCTGCTCCTTTCCGATCGGAGGTTCAATGATTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTGTCACTGAAACAACCTCAATTGGCTGCGCTTCTTTCTTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCGCATCAATTCTCTCTTTTGCTATCGCTGCTGGCTGCTCCTTTTGCATTGGAGGTTCAAGGGTTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTTTCACTGAAACAGCCTCAATTGGCTGCGCTTCTTTCTTTGGTGGTTCTACAGATTTTTCTGGAAGACTAATTGTCTCTGGTTCCTCCTCTGGCTCTTTCTCCACACTTTCAAACTCTGTAGCTGGCGCAGTTAAAGTTTCAACTTTTTCTGCGGCTTCTGTTGCAGACTGTACAGCGGCACCTGTTGGCTGCTCTTCTGGTGGGCTCTTAACATTGTCAGCTGCATCAAACTCCTTTATACTCCTCTCCAAGAACGCAATTACTGGCAGCTCTGTTGCTTCTCCTCCAACCGGTTCAGCTGATGGGCTCTCCTCAGCAACAGAGGTCACTACCTCTGCGACAAAAGTTTCTTGTGGTGAAGAGACATTTATCTGTTCCATTTGTACTGTTTCACTACTTAACTTCACCATTTTCTACAGTACAAGAAAAATTAAC

Coding sequence (CDS)

GATTCTTCTTTACCATCCTTGACTTCTGTAACTTCAAGTTCTCGTTTTTCAACTGCTTCCGAACCTGTCTCTTTTGCTCTCACCTCCTCAGATTCAGTCACAGGAGAACCTTCATCTGGAAGCTTTGTGTTGCTGGGAGGTTCAACGAATAAGTCTGGAACAAGACTTGTCTCTGGTTCCTCCCTTGGTTCATTGTCTACGCTGACACATTCTTTAGCTGGAGGCTCCTCTTTTAGTCTCTTACCAGATTCTGTCATTGGAAAACCTTCATCTGCCTGCTCGTTGTTCTTAGGAGGGTCAAAGGATGCACTAACCTCTGGTGCTATAACTTCTACTAATTCTTTCTGGGAAATAACGTCATCTGATTGCTCCTTATTCTTGAGAGCCTCAATGGATTCACTTGTCTCTTTTGCTATCACTACCGGATGCTCATTTTCTGTTAAAGGTTCAACCGTTTCAGTAACTTGTTCTGCAACCACCTCGCTTATCTCTTTTGCTATCACTACTGGTAGCACCTTTTCTGTTGGAGATTCAACCGTTTCACTAACTTCTTTTGTGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTTTTCTGTTGGTGGTTCAATCGTTTCAACTGTTTCAGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGCTACCTCTACTGATAGCTCCTTTTCTGTTGGAGATTCAACCGTTTCAGTAACTTCTTTTGCGACCACCTCGCCCATCTCTTTTGCTGCCACTACTTGTTGCTCCTCTTCGGTTGGTGGTTCAATCGTTTCAACTGTTTCGGTAACTTGTTCTGCAACCACATCATTTATCTCTTTTGCTACCACTACTGATAGCTCCTTTTCTGTTGGAGGTTCAACCATTTCAGTAACTTCTTTTGCGACCACCTCACTTATCTCTTTTGTTATCACCACGGGTTGCTCCATTTCTGTTGGAGGTTCGACTGTTTCACTAACTTTTTCTGCAACAACCTCAATCATCTCTTTTGCTATCACCACGGGTTGGTCCTTCTCTATTGGAGGTTCAACCGTTTCATCTGGCTCAGTAACTTTCTCTGCAACCACCTCGCTCATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGAAGGTTCAATCGTTTCAATAACTTCTTCTGCAACCACCTCACTTATCTCTTTTGCTGTCACTACTGGTAGCACCTTTCCTGTTGTAACTGTTTCAGTAACTTCCTTTGGGATAACCTCACTTATCTCTTTTGCTATCACTACTGGTTGCTCCTTTTCTGTTGGAGGTTCAATTGTTGCAGTAACTTCTTCTGCTACCAGATCAATTCTCTCATTTGCTATCACTGCTGGCTGCTCCTTTCCGATCGGAGGTTCAATGATTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTGTCACTGAAACAACCTCAATTGGCTGCGCTTCTTTCTTTGGAGGTTCAATTGTTTCAGTAACTTCTTCTGCTACCGCATCAATTCTCTCTTTTGCTATCGCTGCTGGCTGCTCCTTTTGCATTGGAGGTTCAAGGGTTTCAATAACTTCTTTTGCAACCACCTCTTCTGGTTTTTTCACTGAAACAGCCTCAATTGGCTGCGCTTCTTTCTTTGGTGGTTCTACAGATTTTTCTGGAAGACTAATTGTCTCTGGTTCCTCCTCTGGCTCTTTCTCCACACTTTCAAACTCTGTAGCTGGCGCAGTTAAAGTTTCAACTTTTTCTGCGGCTTCTGTTGCAGACTGTACAGCGGCACCTGTTGGCTGCTCTTCTGGTGGGCTCTTAACATTGTCAGCTGCATCAAACTCCTTTATACTCCTCTCCAAGAACGCAATTACTGGCAGCTCTGTTGCTTCTCCTCCAACCGGTTCAGCTGATGGGCTCTCCTCAGCAACAGAGGTCACTACCTCTGCGACAAAAGTTTCTTGTGGTGAAGAGACATTTATCTGTTCCATTTGTACTGTTTCACTACTTAACTTCACCATTTTCTACAGTACAAGAAAAATTAAC

Protein sequence

DSSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGSSLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITSSDCSLFLRASMDSLVSFAITTGCSFSVKGSTVSVTCSATTSLISFAITTGSTFSVGDSTVSLTSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFATSTDSSFSVGDSTVSVTSFATTSPISFAATTCCSSSVGGSIVSTVSVTCSATTSFISFATTTDSSFSVGGSTISVTSFATTSLISFVITTGCSISVGGSTVSLTFSATTSIISFAITTGWSFSIGGSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSVTSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSAASVADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTTSATKVSCGEETFICSICTVSLLNFTIFYSTRKIN
BLAST of Cp4.1LG04g00050 vs. TrEMBL
Match: E3C8V9_9LACO (LPXTG-motif cell wall anchor domain protein OS=Lactobacillus oris PB013-T2-3 GN=sraP PE=4 SV=1)

HSP 1 Score: 70.5 bits (171), Expect = 9.1e-09
Identity = 191/661 (28.90%), Postives = 353/661 (53.40%), Query Frame = 1

Query: 2    SSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGSS 61
            S+  S +  TS+S   +AS   S + ++S S++   S+ +   +  ST+ S +  +S S+
Sbjct: 1471 SASTSASMSTSTSASMSASTSASLSASTSASISASTSASTSASMSASTSASISASMSASA 1530

Query: 62   LGSLS-TLTHSLAGGSSFSL---LPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWE 121
              S S +++ S++  +S S    +  S     S++ S  +  S  A TS +++++ S   
Sbjct: 1531 SASTSVSISVSISASTSASTSASMSASTSASASASISASMSASTSASTSASVSASTSAST 1590

Query: 122  ITSSDCSLFLRASMDSLVSFAITTGCSFSVKGST-VSVTCSATTSLISFAITTGSTFSVG 181
             TS+  S  +  S  +  S + +T  S S   ST +S + SA+TS    +I+T ++ S+ 
Sbjct: 1591 STSTSASTSVSISASTSASMSASTSASISASTSTSMSASTSASTSA---SISTSTSASIS 1650

Query: 182  DSTVSLTSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFATSTDSSFSVGD 241
             ST +  S  T++  S + +T  S S   S  ++VS + SA+TS     TST +S S   
Sbjct: 1651 ASTSASLSASTSASASASTSTSLSASTSASTSASVSASISASTS-----TSTSASTSAST 1710

Query: 242  ST-VSVTSFATTSPISFAATTCCSSSVGGSIVSTVSVTCSATTS-FISFATTTDSSFSVG 301
            ST +S ++ A+TS  + A+T   S+S+  S+ +++S + SA+TS F S + ++  S SV 
Sbjct: 1711 STSISASASASTSASTSAST---STSISASMSASMSTSMSASTSAFTSASLSSSMSASVS 1770

Query: 302  GSTISVTSFATTSLISFVITTGCSISVGGSTVSLTFSA----TTSIISFAITTGWSFSIG 361
             ST +  S +T++  S  I+   S S   ST + T ++    T++  S +I+   S S+ 
Sbjct: 1771 ASTSASLSASTSASTSASISASTSASTSASTSASTSASVSVSTSASTSASISASTSASVS 1830

Query: 362  GSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVT 421
             ST +S S +FSA+TS  + A  +  + +   + +S ++S + S  + A  + ST   V+
Sbjct: 1831 SSTSASTSASFSASTSASTSASVSASTSASTSASMSASTSTSISASTSASVSASTSASVS 1890

Query: 422  VSVTSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISIT 481
             S TS  I++  S +I+T  S S   S  A TS++T + +S +I+A  S     S+ + T
Sbjct: 1891 AS-TSASISASTSASISTSISASASASFSASTSASTSASVSASISASTSASTSASISAST 1950

Query: 482  SFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSF 541
            S +T++S   + + SI  AS    +  S+++S +AS  S +I+A  S  +  S  + TS 
Sbjct: 1951 SASTSASVSASTSASIS-ASTSASTSASISASMSAS-TSASISASTSASMSASMSTSTSA 2010

Query: 542  ATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSAAS 601
            +T++S   + +AS+  ++    ST  S    +S S+S S S  S S + +  +S  ++AS
Sbjct: 2011 STSASTSASNSASMSAST--SASTSASTSASISASTSASMSA-STSASTSASISASTSAS 2070

Query: 602  VADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTTSA 652
            ++  T+A V  S+   ++ SA++++   +S ++ + S+ AS    ++  +S++T  +TSA
Sbjct: 2071 MSVSTSASVSASASASMSASASASTSASIS-SSTSASTSASTSASTSTSISASTSASTSA 2113

BLAST of Cp4.1LG04g00050 vs. TrEMBL
Match: F0I8I2_STRSA (Cell wall surface anchor family protein OS=Streptococcus sanguinis SK115 GN=HMPREF9382_0971 PE=4 SV=1)

HSP 1 Score: 62.4 bits (150), Expect = 2.5e-06
Identity = 193/667 (28.94%), Postives = 340/667 (50.97%), Query Frame = 1

Query: 9    SVTSSSRFST-ASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGSSLGSLST 68
            SV++S+  ST AS   S + ++S SV+   S+ +   +  ST+ S +  VS S+  S S 
Sbjct: 1299 SVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASASASTSA 1358

Query: 69   LTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITSSDCSLFL 128
               +    S+ +    SV    S++ S  +  S  A TS +++++ S    TS+  S   
Sbjct: 1359 SVSASTSASTSA----SVSASTSASTSASVSASASASTSASVSASTS--ASTSASVSAST 1418

Query: 129  RASMDSLVSFAITTGCSFSVKGST-------VSVTCSATTSLISFAITTGSTF-SVGDST 188
             AS  + VS + +   S SV  ST       VS + SA+TS    A T+ ST  SV  ST
Sbjct: 1419 SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1478

Query: 189  VSLTSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSF-ISFATSTDSSFSVGDST 248
             + TS   ++  S + +   S S   S  ++VS + SA+TS  +S +TS  +S SV  ST
Sbjct: 1479 SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1538

Query: 249  VSVTSFATTSPISFAATTCCSSSVGGSIVSTVSV-TCSATTSFISFATTTDSSFSVGGST 308
             + TS + ++  S + +   S+S   S  ++VS  T ++T++ +S +T+  +S SV  ST
Sbjct: 1539 SASTSASVSASASASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1598

Query: 309  ISVTSFATTSLISFVITTGCSISVGGST---VSLTFSATTSI-ISFAITTGWSFSIGGST 368
             + TS + ++ +S   +   S S   ST   VS + SA+TS  +S + +   S S+  ST
Sbjct: 1599 SASTSASVSASMSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1658

Query: 369  VSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSV 428
             +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST   V+ S 
Sbjct: 1659 STSTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1718

Query: 429  ---TSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISIT 488
               TS  +++  S + +   S S   S  A  S++T +  S +++A  S     S+ + T
Sbjct: 1719 SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1778

Query: 489  SFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSF 548
            S +T++S  V+ +TS   ++    S+   TS++T++ +S + +A  S  +  S  + TS 
Sbjct: 1779 SASTSAS--VSASTSASTSA----SVSESTSASTSASVSASESASTSASVSASTSASTSA 1838

Query: 549  ATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSAAS 608
            + ++S   + +AS+  ++    S   S     S S+S S ST S S + +V  ST ++ S
Sbjct: 1839 SVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST-SASTSASVSASTSASTS 1898

Query: 609  VADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTTSA 658
             +   +     S+    + SA++++ +  S++A T +SV++  + S     SA+E  +++
Sbjct: 1899 ASVSASTSASTSASVSASTSASTSASVSASESASTSASVSASTSASTSASVSASESASTS 1952

BLAST of Cp4.1LG04g00050 vs. TrEMBL
Match: J4X8N7_9STRE (Serine-rich repeat adhesion glycoprotein (Fragment) OS=Streptococcus sp. AS14 GN=HMPREF1150_1873 PE=4 SV=1)

HSP 1 Score: 62.4 bits (150), Expect = 2.5e-06
Identity = 187/666 (28.08%), Postives = 342/666 (51.35%), Query Frame = 1

Query: 2    SSLPSLTSVTSSSRFST-ASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGS 61
            +S  +  SV++S+  ST AS   S + ++S SV+   S+ +   +  ST+ S +  VS S
Sbjct: 876  TSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAS 935

Query: 62   SLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITS 121
            +  S S    +    S+ +    SV    S++ S  +  S  A TS +++++ S    TS
Sbjct: 936  TSASTSASVSASTSASTSA----SVSASTSASTSASVSASTSASTSASVSASTS--ASTS 995

Query: 122  SDCSLFLRASMDSLVSFAITTGCSFSVKGST---VSVTCSATTSLISFAITTGSTFSVGD 181
            +  S    AS  + VS + +   S SV  ST    S + SA+TS  + A  + ST +   
Sbjct: 996  ASVSASTSASTSASVSASTSASMSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1055

Query: 182  STVSL-TSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSF-ISFATSTDSSFSVG 241
            ++VS  TS  T++ +S +A+   S SV  S  ++VS + SA+TS  +S +TS  +S SV 
Sbjct: 1056 ASVSASTSASTSASVSASASASTSASVSASTSASVSASTSASTSASVSASTSASTSASVS 1115

Query: 242  DSTVSVTSFATTSPISFAATTCCSSSVGGSIVSTVSV-TCSATTSFISFATTTDSSFSVG 301
             ST + TS + ++  S + +   S+S+  S  ++VS  T ++T++ +S +T+  +S SV 
Sbjct: 1116 ASTSASTSASVSASTSASTSASVSASISASTSASVSASTSASTSASVSASTSASTSASVS 1175

Query: 302  GSTISVTSFATTSLISFVITTGCSISVGGST---VSLTFSATTSI-ISFAITTGWSFSIG 361
             ST + TS + ++  S   +   S S   ST   VS + SA+TS  +S + +   S S+ 
Sbjct: 1176 ASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVS 1235

Query: 362  GSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVT 421
             ST +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST   V+
Sbjct: 1236 ASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVS 1295

Query: 422  VSVTSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISIT 481
             S      ++  S +++   S S   S+ A TS++T + +S + +A  S  +  S  + T
Sbjct: 1296 AST-----SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSAST 1355

Query: 482  SFATTSSGFVTETTSIGC--ASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSIT 541
            S + ++S   + + S+    ++    S+ + TS++T++ +S + +A  S  +  S  + T
Sbjct: 1356 SASVSASTSASTSASVSASTSASMSASVSASTSASTSASVSASTSASTSASVSASTSAST 1415

Query: 542  SFATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSA 601
            S + ++S   + +AS+  ++    S   S     S S+S S ST S S + +V  ST ++
Sbjct: 1416 SASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST-SASTSASVSASTSAS 1475

Query: 602  ASVADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTT 655
             S +   +     S+    + SA++++ +  S +A T +SV++  + S     SA+E  +
Sbjct: 1476 TSASISASTSASTSASTSASTSASTSASVSASTSASTSASVSASESASTSASVSASESAS 1529

BLAST of Cp4.1LG04g00050 vs. TrEMBL
Match: F0FS71_STRSA (KxYKxGKxW signal domain protein OS=Streptococcus sanguinis SK678 GN=srpA PE=4 SV=1)

HSP 1 Score: 62.0 bits (149), Expect = 3.2e-06
Identity = 193/669 (28.85%), Postives = 341/669 (50.97%), Query Frame = 1

Query: 2    SSLPSLTSVTSSSRFST-ASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGS 61
            +S  +  SV++S+  ST AS   S + ++S SV+   S+ +   +  ST+ S +  VS S
Sbjct: 800  TSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAS 859

Query: 62   SLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITS 121
            +    ST T +    S+ +    SV    S++ S  +  S  A TS +++++ S    TS
Sbjct: 860  T----STSTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTS--ASTS 919

Query: 122  SDCSLFLRASMDSLVSFAITTGCSFSVKGST---VSVTCSATTSLISFAITTGSTFSVGD 181
            +  S    AS  + VS + +   S SV  ST    S + SA+TS  + A  + ST +   
Sbjct: 920  ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 979

Query: 182  STVSLTSFVTTSP---ISFAATTCCSFSVGGSIVSTVSV---TCSATTSFISFATSTDSS 241
            ++VS ++  +TS     S +A+T  S S   S  ++ SV   T ++T++ +S +TS  +S
Sbjct: 980  ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1039

Query: 242  FSVGDSTVSVTSFATTSPISFAATTCCSSSVGGSIVSTVSVTCSATTS-FISFATTTDSS 301
             SV  ST + TS + ++  S + +   S+S   S  S+VS + SA+TS  +S +T+  +S
Sbjct: 1040 ASVSASTSASTSASVSASTSASTSASVSASTSASTSSSVSASTSASTSASVSASTSASTS 1099

Query: 302  FSVGGSTISVTSFATTSLISFVITTGCSISVGGST---VSLTFSATTSI-ISFAITTGWS 361
             SV  ST + TS + ++  S   +   S S   ST   VS + SA+TS  +S + +   S
Sbjct: 1100 ASVSASTSASTSASVSASASASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1159

Query: 362  FSIGGSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTF 421
             S+  ST +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST 
Sbjct: 1160 ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1219

Query: 422  PVVTVSV---TSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIG 481
              V+ S    TS  +++  S + +   S S   S  A  S++T +  S +++A  S    
Sbjct: 1220 ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1279

Query: 482  GSMISITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGS 541
             S+ + TS +T+SS   +E+ S         S+ + TS++T++ +S + +A  S  +  S
Sbjct: 1280 ASVSASTSASTSSSAKASESAST------SASVSASTSASTSASVSASTSASTSASVSAS 1339

Query: 542  RVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKV 601
              + TS + ++S   + +AS+  ++    S   S     S S+S S ST S S + +V  
Sbjct: 1340 ASASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST-SASTSASVSA 1399

Query: 602  STFSAASVADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSV-ASPPTGSADGLSS 652
            ST ++ S +   +     S+    + SA++++ +  S++A T SS  AS    ++  +S+
Sbjct: 1400 STSASTSASVSASESASTSASVSASTSASTSASVSASESASTSSSAKASESASTSASVSA 1455

BLAST of Cp4.1LG04g00050 vs. NCBI nr
Match: gi|311094565|gb|EFQ52870.1| (LPXTG-motif cell wall anchor domain protein [Lactobacillus oris PB013-T2-3])

HSP 1 Score: 70.5 bits (171), Expect = 1.3e-08
Identity = 191/661 (28.90%), Postives = 353/661 (53.40%), Query Frame = 1

Query: 2    SSLPSLTSVTSSSRFSTASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGSS 61
            S+  S +  TS+S   +AS   S + ++S S++   S+ +   +  ST+ S +  +S S+
Sbjct: 1471 SASTSASMSTSTSASMSASTSASLSASTSASISASTSASTSASMSASTSASISASMSASA 1530

Query: 62   LGSLS-TLTHSLAGGSSFSL---LPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWE 121
              S S +++ S++  +S S    +  S     S++ S  +  S  A TS +++++ S   
Sbjct: 1531 SASTSVSISVSISASTSASTSASMSASTSASASASISASMSASTSASTSASVSASTSAST 1590

Query: 122  ITSSDCSLFLRASMDSLVSFAITTGCSFSVKGST-VSVTCSATTSLISFAITTGSTFSVG 181
             TS+  S  +  S  +  S + +T  S S   ST +S + SA+TS    +I+T ++ S+ 
Sbjct: 1591 STSTSASTSVSISASTSASMSASTSASISASTSTSMSASTSASTSA---SISTSTSASIS 1650

Query: 182  DSTVSLTSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSFISFATSTDSSFSVGD 241
             ST +  S  T++  S + +T  S S   S  ++VS + SA+TS     TST +S S   
Sbjct: 1651 ASTSASLSASTSASASASTSTSLSASTSASTSASVSASISASTS-----TSTSASTSAST 1710

Query: 242  ST-VSVTSFATTSPISFAATTCCSSSVGGSIVSTVSVTCSATTS-FISFATTTDSSFSVG 301
            ST +S ++ A+TS  + A+T   S+S+  S+ +++S + SA+TS F S + ++  S SV 
Sbjct: 1711 STSISASASASTSASTSAST---STSISASMSASMSTSMSASTSAFTSASLSSSMSASVS 1770

Query: 302  GSTISVTSFATTSLISFVITTGCSISVGGSTVSLTFSA----TTSIISFAITTGWSFSIG 361
             ST +  S +T++  S  I+   S S   ST + T ++    T++  S +I+   S S+ 
Sbjct: 1771 ASTSASLSASTSASTSASISASTSASTSASTSASTSASVSVSTSASTSASISASTSASVS 1830

Query: 362  GSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVT 421
             ST +S S +FSA+TS  + A  +  + +   + +S ++S + S  + A  + ST   V+
Sbjct: 1831 SSTSASTSASFSASTSASTSASVSASTSASTSASMSASTSTSISASTSASVSASTSASVS 1890

Query: 422  VSVTSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISIT 481
             S TS  I++  S +I+T  S S   S  A TS++T + +S +I+A  S     S+ + T
Sbjct: 1891 AS-TSASISASTSASISTSISASASASFSASTSASTSASVSASISASTSASTSASISAST 1950

Query: 482  SFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSF 541
            S +T++S   + + SI  AS    +  S+++S +AS  S +I+A  S  +  S  + TS 
Sbjct: 1951 SASTSASVSASTSASIS-ASTSASTSASISASMSAS-TSASISASTSASMSASMSTSTSA 2010

Query: 542  ATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSAAS 601
            +T++S   + +AS+  ++    ST  S    +S S+S S S  S S + +  +S  ++AS
Sbjct: 2011 STSASTSASNSASMSAST--SASTSASTSASISASTSASMSA-STSASTSASISASTSAS 2070

Query: 602  VADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTTSA 652
            ++  T+A V  S+   ++ SA++++   +S ++ + S+ AS    ++  +S++T  +TSA
Sbjct: 2071 MSVSTSASVSASASASMSASASASTSASIS-SSTSASTSASTSASTSTSISASTSASTSA 2113

BLAST of Cp4.1LG04g00050 vs. NCBI nr
Match: gi|325690013|gb|EGD32017.1| (cell wall surface anchor family protein [Streptococcus sanguinis SK115])

HSP 1 Score: 62.4 bits (150), Expect = 3.6e-06
Identity = 193/667 (28.94%), Postives = 340/667 (50.97%), Query Frame = 1

Query: 9    SVTSSSRFST-ASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGSSLGSLST 68
            SV++S+  ST AS   S + ++S SV+   S+ +   +  ST+ S +  VS S+  S S 
Sbjct: 1299 SVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASASASTSA 1358

Query: 69   LTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITSSDCSLFL 128
               +    S+ +    SV    S++ S  +  S  A TS +++++ S    TS+  S   
Sbjct: 1359 SVSASTSASTSA----SVSASTSASTSASVSASASASTSASVSASTS--ASTSASVSAST 1418

Query: 129  RASMDSLVSFAITTGCSFSVKGST-------VSVTCSATTSLISFAITTGSTF-SVGDST 188
             AS  + VS + +   S SV  ST       VS + SA+TS    A T+ ST  SV  ST
Sbjct: 1419 SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1478

Query: 189  VSLTSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSF-ISFATSTDSSFSVGDST 248
             + TS   ++  S + +   S S   S  ++VS + SA+TS  +S +TS  +S SV  ST
Sbjct: 1479 SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1538

Query: 249  VSVTSFATTSPISFAATTCCSSSVGGSIVSTVSV-TCSATTSFISFATTTDSSFSVGGST 308
             + TS + ++  S + +   S+S   S  ++VS  T ++T++ +S +T+  +S SV  ST
Sbjct: 1539 SASTSASVSASASASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1598

Query: 309  ISVTSFATTSLISFVITTGCSISVGGST---VSLTFSATTSI-ISFAITTGWSFSIGGST 368
             + TS + ++ +S   +   S S   ST   VS + SA+TS  +S + +   S S+  ST
Sbjct: 1599 SASTSASVSASMSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1658

Query: 369  VSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVTVSV 428
             +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST   V+ S 
Sbjct: 1659 STSTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1718

Query: 429  ---TSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISIT 488
               TS  +++  S + +   S S   S  A  S++T +  S +++A  S     S+ + T
Sbjct: 1719 SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST 1778

Query: 489  SFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSITSF 548
            S +T++S  V+ +TS   ++    S+   TS++T++ +S + +A  S  +  S  + TS 
Sbjct: 1779 SASTSAS--VSASTSASTSA----SVSESTSASTSASVSASESASTSASVSASTSASTSA 1838

Query: 549  ATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSAAS 608
            + ++S   + +AS+  ++    S   S     S S+S S ST S S + +V  ST ++ S
Sbjct: 1839 SVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST-SASTSASVSASTSASTS 1898

Query: 609  VADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTTSA 658
             +   +     S+    + SA++++ +  S++A T +SV++  + S     SA+E  +++
Sbjct: 1899 ASVSASTSASTSASVSASTSASTSASVSASESASTSASVSASTSASTSASVSASESASTS 1952

BLAST of Cp4.1LG04g00050 vs. NCBI nr
Match: gi|400184455|gb|EJO18696.1| (serine-rich repeat adhesion glycoprotein, partial [Streptococcus sp. AS14])

HSP 1 Score: 62.4 bits (150), Expect = 3.6e-06
Identity = 187/666 (28.08%), Postives = 342/666 (51.35%), Query Frame = 1

Query: 2    SSLPSLTSVTSSSRFST-ASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGS 61
            +S  +  SV++S+  ST AS   S + ++S SV+   S+ +   +  ST+ S +  VS S
Sbjct: 876  TSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAS 935

Query: 62   SLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITS 121
            +  S S    +    S+ +    SV    S++ S  +  S  A TS +++++ S    TS
Sbjct: 936  TSASTSASVSASTSASTSA----SVSASTSASTSASVSASTSASTSASVSASTS--ASTS 995

Query: 122  SDCSLFLRASMDSLVSFAITTGCSFSVKGST---VSVTCSATTSLISFAITTGSTFSVGD 181
            +  S    AS  + VS + +   S SV  ST    S + SA+TS  + A  + ST +   
Sbjct: 996  ASVSASTSASTSASVSASTSASMSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1055

Query: 182  STVSL-TSFVTTSPISFAATTCCSFSVGGSIVSTVSVTCSATTSF-ISFATSTDSSFSVG 241
            ++VS  TS  T++ +S +A+   S SV  S  ++VS + SA+TS  +S +TS  +S SV 
Sbjct: 1056 ASVSASTSASTSASVSASASASTSASVSASTSASVSASTSASTSASVSASTSASTSASVS 1115

Query: 242  DSTVSVTSFATTSPISFAATTCCSSSVGGSIVSTVSV-TCSATTSFISFATTTDSSFSVG 301
             ST + TS + ++  S + +   S+S+  S  ++VS  T ++T++ +S +T+  +S SV 
Sbjct: 1116 ASTSASTSASVSASTSASTSASVSASISASTSASVSASTSASTSASVSASTSASTSASVS 1175

Query: 302  GSTISVTSFATTSLISFVITTGCSISVGGST---VSLTFSATTSI-ISFAITTGWSFSIG 361
             ST + TS + ++  S   +   S S   ST   VS + SA+TS  +S + +   S S+ 
Sbjct: 1176 ASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVS 1235

Query: 362  GSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTFPVVT 421
             ST +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST   V+
Sbjct: 1236 ASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVS 1295

Query: 422  VSVTSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIGGSMISIT 481
             S      ++  S +++   S S   S+ A TS++T + +S + +A  S  +  S  + T
Sbjct: 1296 AST-----SASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSAST 1355

Query: 482  SFATTSSGFVTETTSIGC--ASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGSRVSIT 541
            S + ++S   + + S+    ++    S+ + TS++T++ +S + +A  S  +  S  + T
Sbjct: 1356 SASVSASTSASTSASVSASTSASMSASVSASTSASTSASVSASTSASTSASVSASTSAST 1415

Query: 542  SFATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKVSTFSA 601
            S + ++S   + +AS+  ++    S   S     S S+S S ST S S + +V  ST ++
Sbjct: 1416 SASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST-SASTSASVSASTSAS 1475

Query: 602  ASVADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSVASPPTGSADGLSSATEVTT 655
             S +   +     S+    + SA++++ +  S +A T +SV++  + S     SA+E  +
Sbjct: 1476 TSASISASTSASTSASTSASTSASTSASVSASTSASTSASVSASESASTSASVSASESAS 1529

BLAST of Cp4.1LG04g00050 vs. NCBI nr
Match: gi|324995461|gb|EGC27373.1| (KxYKxGKxW signal domain protein [Streptococcus sanguinis SK678])

HSP 1 Score: 62.0 bits (149), Expect = 4.6e-06
Identity = 193/669 (28.85%), Postives = 341/669 (50.97%), Query Frame = 1

Query: 2    SSLPSLTSVTSSSRFST-ASEPVSFALTSSDSVTGEPSSGSFVLLGGSTNKSGTRLVSGS 61
            +S  +  SV++S+  ST AS   S + ++S SV+   S+ +   +  ST+ S +  VS S
Sbjct: 800  TSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAS 859

Query: 62   SLGSLSTLTHSLAGGSSFSLLPDSVIGKPSSACSLFLGGSKDALTSGAITSTNSFWEITS 121
            +    ST T +    S+ +    SV    S++ S  +  S  A TS +++++ S    TS
Sbjct: 860  T----STSTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTS--ASTS 919

Query: 122  SDCSLFLRASMDSLVSFAITTGCSFSVKGST---VSVTCSATTSLISFAITTGSTFSVGD 181
            +  S    AS  + VS + +   S SV  ST    S + SA+TS  + A  + ST +   
Sbjct: 920  ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 979

Query: 182  STVSLTSFVTTSP---ISFAATTCCSFSVGGSIVSTVSV---TCSATTSFISFATSTDSS 241
            ++VS ++  +TS     S +A+T  S S   S  ++ SV   T ++T++ +S +TS  +S
Sbjct: 980  ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1039

Query: 242  FSVGDSTVSVTSFATTSPISFAATTCCSSSVGGSIVSTVSVTCSATTS-FISFATTTDSS 301
             SV  ST + TS + ++  S + +   S+S   S  S+VS + SA+TS  +S +T+  +S
Sbjct: 1040 ASVSASTSASTSASVSASTSASTSASVSASTSASTSSSVSASTSASTSASVSASTSASTS 1099

Query: 302  FSVGGSTISVTSFATTSLISFVITTGCSISVGGST---VSLTFSATTSI-ISFAITTGWS 361
             SV  ST + TS + ++  S   +   S S   ST   VS + SA+TS  +S + +   S
Sbjct: 1100 ASVSASTSASTSASVSASASASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1159

Query: 362  FSIGGSTVSSGSVTFSATTSLISFAITTGCSFSVEGSIVSITSSATTSLISFAVTTGSTF 421
             S+  ST +S S + SA+TS  + A  +  + +   + VS ++SA+TS    A T+ ST 
Sbjct: 1160 ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1219

Query: 422  PVVTVSV---TSFGITSLISFAITTGCSFSVGGSIVAVTSSATRSILSFAITAGCSFPIG 481
              V+ S    TS  +++  S + +   S S   S  A  S++T +  S +++A  S    
Sbjct: 1220 ASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSASTSASTS 1279

Query: 482  GSMISITSFATTSSGFVTETTSIGCASFFGGSIVSVTSSATASILSFAIAAGCSFCIGGS 541
             S+ + TS +T+SS   +E+ S         S+ + TS++T++ +S + +A  S  +  S
Sbjct: 1280 ASVSASTSASTSSSAKASESAST------SASVSASTSASTSASVSASTSASTSASVSAS 1339

Query: 542  RVSITSFATTSSGFFTETASIGCASFFGGSTDFSGRLIVSGSSSGSFSTLSNSVAGAVKV 601
              + TS + ++S   + +AS+  ++    S   S     S S+S S ST S S + +V  
Sbjct: 1340 ASASTSASVSASTSASTSASVSASTSASTSASVSASTSASTSASVSAST-SASTSASVSA 1399

Query: 602  STFSAASVADCTAAPVGCSSGGLLTLSAASNSFILLSKNAITGSSV-ASPPTGSADGLSS 652
            ST ++ S +   +     S+    + SA++++ +  S++A T SS  AS    ++  +S+
Sbjct: 1400 STSASTSASVSASESASTSASVSASTSASTSASVSASESASTSSSAKASESASTSASVSA 1455

The following BLAST results are available for this feature:
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
E3C8V9_9LACO9.1e-0928.90LPXTG-motif cell wall anchor domain protein OS=Lactobacillus oris PB013-T2-3 GN=... [more]
F0I8I2_STRSA2.5e-0628.94Cell wall surface anchor family protein OS=Streptococcus sanguinis SK115 GN=HMPR... [more]
J4X8N7_9STRE2.5e-0628.08Serine-rich repeat adhesion glycoprotein (Fragment) OS=Streptococcus sp. AS14 GN... [more]
F0FS71_STRSA3.2e-0628.85KxYKxGKxW signal domain protein OS=Streptococcus sanguinis SK678 GN=srpA PE=4 SV... [more]
Match NameE-valueIdentityDescription
Match NameE-valueIdentityDescription
gi|311094565|gb|EFQ52870.1|1.3e-0828.90LPXTG-motif cell wall anchor domain protein [Lactobacillus oris PB013-T2-3][more]
gi|325690013|gb|EGD32017.1|3.6e-0628.94cell wall surface anchor family protein [Streptococcus sanguinis SK115][more]
gi|400184455|gb|EJO18696.1|3.6e-0628.08serine-rich repeat adhesion glycoprotein, partial [Streptococcus sp. AS14][more]
gi|324995461|gb|EGC27373.1|4.6e-0628.85KxYKxGKxW signal domain protein [Streptococcus sanguinis SK678][more]
GO Assignments
This gene is annotated with the following GO terms.
Category Term Accession Term Name
biological_process GO:0008150 biological_process
cellular_component GO:0005575 cellular_component
molecular_function GO:0003674 molecular_function

The following mRNA feature(s) are a part of this gene:

Feature NameUnique NameType
Cp4.1LG04g00050.1Cp4.1LG04g00050.1mRNA


The following gene(s) are orthologous to this gene:
GeneOrthologueOrganismBlock
Cp4.1LG04g00050CmoCh11G012490Cucurbita moschata (Rifu)cmocpeB130
The following gene(s) are paralogous to this gene:

None