RU2804665C2 - Compositions and methods of gene editing - Google Patents
Compositions and methods of gene editing Download PDFInfo
- Publication number
- RU2804665C2 RU2804665C2 RU2020137717A RU2020137717A RU2804665C2 RU 2804665 C2 RU2804665 C2 RU 2804665C2 RU 2020137717 A RU2020137717 A RU 2020137717A RU 2020137717 A RU2020137717 A RU 2020137717A RU 2804665 C2 RU2804665 C2 RU 2804665C2
- Authority
- RU
- Russia
- Prior art keywords
- sequence
- seq
- aspects
- present
- amino acid
- Prior art date
Links
Abstract
Description
Перекрестная ссылка на связанные приложенияCross-reference to related applications
[0001] Данная заявка испрашивает приоритет по отношению к патентной заявке США № 62/660023, поданной 19 апреля 2018 г., раскрытие которой включено в данный документ посредством ссылки в полном объеме. [0001]This The application claims priority to U.S. Patent Application No. 62/660023, filed April 19, 2018, the disclosure of which is incorporated herein by reference in its entirety.
ЗАЯВЛЕНИЕ ОТНОСИТЕЛЬНО ПРАВ НА ИЗОБРЕТЕНИЯ, СОЗДАННЫЕ НА ОСНОВЕ ФЕДЕРАЛЬНО СПОНСИРОВАННОЙ НАУЧНО-ИССЛЕДОВАТЕЛЬСКОЙ РАБОТЫSTATEMENT REGARDING RIGHTS TO INVENTIONS RESULTING FROM FEDERALLY SPONSORED RESEARCH WORK
[0002] Данное изобретение создано при поддержке Правительства США согласно гранту № HR0011-17-2-0043, присужденному Министерством обороны, Агентством перспективных исследовательских проектов Министерства обороны США, и согласно гранту № R01 DA036858, присужденному Национальным институтом здравоохранения. Правительство США имеет определенные права на данное изобретение. [0002] This invention is supported by the United States Government under Grant No. HR0011-17-2-0043 awarded by the Department of Defense, Defense Advanced Research Projects Agency, and under Grant No. R01 DA036858 awarded by the National Institutes of Health. The US Government has certain rights to this invention.
УРОВЕНЬ ТЕХНИКИBACKGROUND OF THE ART
[0003] Несмотря на то, что редактирование генома считается многообещающим терапевтическим подходом к лечению заболеваний, оно сопряжено с неотъемлемыми рисками из-за потенциальной генотоксичности, связанной с двухцепочечными разрывами (ДЦР). Кроме того, редактирование генома часто связано с эффектом «все или ничего» для целевого гена (т.е. оно вызывает полный нокаут). В отличие от этого целенаправленная инженерия эпигенома не несет риска генотоксичности, вызванной ДЦР; кроме того, она дает возможность создать более дифференцированный эффект на экспрессию генов и, таким образом, обеспечить функционирование от полного сайленсинга до менее выраженного эффекта. [0003] Although genome editing is considered a promising therapeutic approach for treating diseases, it carries inherent risks due to potential genotoxicity associated with double-strand breaks (DSBs). In addition, genome editing is often associated with an all-or-nothing effect on the target gene (i.e., it causes a complete knockout). In contrast, targeted epigenome engineering does not carry the risk of DSB-induced genotoxicity; in addition, it makes it possible to create a more differentiated effect on gene expression and, thus, provide functioning from complete silencing to a less pronounced effect.
[0004] В данном документе представлены решения для этих и других потребностей в данной области техники. [0004] This document provides solutions to these and other needs in the art.
КРАТКОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯBRIEF DESCRIPTION OF THE INVENTION
[0005] В одном аспекте данного изобретения представлен слитый белок, включающий в себя фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, домен, связанный с боксом (домен KRAB), и домен метилтрансферазы ДНК. В одном аспекте данного изобретения представлен слитый белок любой из последовательностей SEQ ID NO: 1-15. [0005] In one aspect of the present invention, there is provided a fusion protein comprising a nuclease-deficient RNA-guided DNA endonuclease enzyme box-linked domain (KRAB domain), and DNA methyltransferase domain. In one aspect of the present invention, a fusion protein of any of the sequences of SEQ ID NO: 1-15 is provided.
[0006] В одном аспекте данного изобретения представлена последовательность нуклеиновой кислоты, кодирующая слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами. [0006] In one aspect of the present invention, there is provided a nucleic acid sequence encoding a fusion protein as described herein, inclusive of embodiments and aspects thereof.
[0007] В одном аспекте данного изобретения представлен комплекс, включающий в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, и полинуклеотид, включающий в себя (1) нацеленную на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности, и (2) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность. [0007] In one aspect of the present invention, there is provided a complex including a fusion protein as described herein, inclusive of embodiments and aspects thereof, and a polynucleotide including (1) a DNA targeting sequence that is complementary to the target polynucleotide sequence and (2) a binding sequence for a nuclease-deficient RNA-directed DNA endonuclease enzyme, wherein the nuclease-deficient RNA-directed DNA endonuclease enzyme is linked to the polynucleotide through the binding sequence.
[0008] В одном аспекте данного изобретения представлен вектор, включающий в себя последовательность нуклеиновой кислоты слитого белка, как описано в данном документе, включительно с его вариантами реализации и аспектами. [0008] In one aspect of the present invention, there is provided a vector including a nucleic acid sequence of a fusion protein as described herein, inclusive of embodiments and aspects thereof.
[0009] В одном аспекте данного изобретения представлена клетка, включающая в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, нуклеиновую кислоту, как описано в данном документе, включительно с ее вариантами реализации и аспектами, комплекс, как описано в данном документе, включительно с его вариантами реализации и аспектами, или вектор, как описано в данном документе, включительно с его вариантами реализации и аспектами. [0009] In one aspect of the present invention, there is provided a cell including a fusion protein as described herein, inclusive of embodiments and aspects thereof, a nucleic acid as described herein, inclusive of embodiments and aspects thereof, a complex, as described herein, inclusive of embodiments and aspects thereof, or a vector, as described herein, inclusive of embodiments and aspects thereof.
[0010] В одном аспекте данного изобретения представлен способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включая доставку первого полинуклеотида, кодирующего слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, содержащую целевую нуклеиновую кислоту, и доставку в клетку второго полинуклеотида, который включает в себя (i) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (ii) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. Без намерения быть связанными какой-либо теорией, считается, что указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. Таким образом, в аспектах данного изобретения указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0010] In one aspect of the present invention, there is provided a method for silencing a target nucleic acid sequence in a cell, including delivering a first polynucleotide encoding a fusion protein as described herein, inclusive of embodiments and aspects thereof, into a cell containing the target nucleic acid, and delivery into the cell of a second polynucleotide that includes (i) a DNA targeting sequence that is complementary to the target nucleic acid sequence, and (ii) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease. Without intending to be bound by any theory, the fusion protein is believed to cause silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence . Thus, in aspects of the present invention, the fusion protein causes silencing of a target nucleic acid sequence in a cell by methylating chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into chromatin containing the target nucleic acid sequence.
[0011] В одном аспекте данного изобретения представлен способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включая доставку комплекса, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, содержащую целевую нуклеиновую кислоту, при этом указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке. Без намерения быть связанными какой-либо теорией, считается, что указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. Таким образом, в аспектах данного изобретения указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0011] In one aspect of the present invention, there is provided a method for silencing a target nucleic acid sequence in a cell, including delivering a complex as described herein, inclusive of embodiments and aspects thereof, into a cell containing the target nucleic acid, wherein said complex causes silencing sequences of a target nucleic acid in a cell. Without intending to be bound by any theory, the complex is believed to cause silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence. Thus, in aspects of the present invention, the complex causes silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence.
КРАТКОЕ ОПИСАНИЕ ГРАФИЧЕСКИХ МАТЕРИАЛОВBRIEF DESCRIPTION OF GRAPHIC MATERIALS
[0012] На Фиг. 1A-1F описано конструирование белка «все в одном» для длительного генного сайленсинга. На Фиг. 1A представлено схематическое изображение белка «все в одном» (SEQ ID NO: 1) согласно данному изобретению, который содержит домен KRAB, слитый с -N-концом dCas9 (SEQ ID NO: 23), отделенный с помощью линкера GGSGGGS (SEQ ID NO: 17), и Dnmt3A - Dnmt3L на С-конце dCas9 (отделенный с помощью линкера EASGSGRASPGIPGSTR (SEQ ID NO: 19)). На Фиг. 1В представлены схематические изображения слитых с dCas9 эпигенетических модуляторов, протестированных на постоянный генный сайленсинг. Белок dCas9 - KRAB адаптирован из Gilbert et al., Cell 2013 для применения с технологией интерференции CRISPR (CRISPRi). Слитый белок dCas9 - Dnmt3A - Dnmt3L адаптирован из Stepper et al., Nucleic Acids Research, 2016. Авторы данного изобретения сконструировали новый белок «все в одном», который объединяет домен KRAB (SEQ ID NO: 16), dCas9 (D10A, H208A), Dnmt3A - Dnmt3L (SEQ ID NO: 33; где Dnmt3A представляет собой SEQ ID NO: 26 и Dnmt3L представляет собой SEQ ID NO: 28) в один полипептид. На Фиг. 1C представлены схематические изображения чувствительного к метилированию репортера GFP (адаптировано из Stelzer et al., Cell 2015), который был использован для оценки длительного сайленсинга, вызванного с помощью белка «все в одном». На Фиг. 1D-1E представлена диаграмма и результаты экспериментального рабочего процесса по технологии мутагенеза «hit-and-run» в клетках HEK293T, экспрессирующих репортер GFP, представленный на Фиг. 3. На Фиг. 1D показано, что в клетки были котрансфицированы плазмиды, одна из которых кодировала белок «hit-and-run», а другая плазмида кодировала егРНК. На Фиг. 1E показаны результаты анализа по технологии мутагенеза «hit-and-run», с сортировкой клеток, которые были котрансфицированы одновременно плазмидой «все в одном» и плазмидой егРНК. На Фиг. 1F показано, что результаты сайленсинга репортера GFP зависят от последовательности егРНК. [0012] In FIG. 1A-1F describe all-in-one protein design for long-term gene silencing. In FIG. 1A is a schematic representation of an all-in-one protein (SEQ ID NO: 1) of the present invention that contains a KRAB domain fused to the -N terminus of dCas9 (SEQ ID NO: 23) separated by a GGSGGGS linker (SEQ ID NO : 17), and Dnmt3A - Dnmt3L at the C-terminus of dCas9 (separated using the linker EASGSGRASPGIPGSTR (SEQ ID NO: 19)). In FIG. Figure 1B shows schematic representations of dCas9-fused epigenetic modulators tested for permanent gene silencing. The dCas9 - KRAB protein is adapted from Gilbert et al., Cell 2013 for use with CRISPR interference (CRISPRi) technology. The dCas9 - Dnmt3A - Dnmt3L fusion protein is adapted from Stepper et al., Nucleic Acids Research, 2016. We have designed a new all-in-one protein that combines the KRAB domain (SEQ ID NO: 16), dCas9 (D10A, H208A) , Dnmt3A - Dnmt3L (SEQ ID NO: 33; where Dnmt3A is SEQ ID NO: 26 and Dnmt3L is SEQ ID NO: 28) into one polypeptide. In FIG. Figure 1C shows schematic representations of a methylation-sensitive GFP reporter (adapted from Stelzer et al., Cell 2015) that was used to evaluate long-term silencing induced by the all-in-one protein. In FIG. 1D-1E shows a diagram and results of an experimental hit-and-run mutagenesis workflow in HEK293T cells expressing the GFP reporter shown in FIG. 3. In FIG. Figure 1D shows that plasmids were cotransfected into cells, one of which encoded the hit-and-run protein, and the other plasmid encoded the egRNA. In FIG. Figure 1E shows the results of a hit-and-run mutagenesis assay, sorting cells that were cotransfected with both the all-in-one plasmid and the segRNA plasmid. In FIG. Figure 1F shows that the results of GFP reporter silencing depend on the egRNA sequence.
[0013] На Фиг. 2A-2F описан длительный сайленсинг эндогенных генов. На Фиг. 2A-2C представлены репрезентативные данные проточной цитометрии, полученные через 22 суток после трансфекции с последующим воздействием на гены (CD29, CD81, CD151), направленным на долгосрочный сайленсинг с использованием белка «все в одном». В квадранте IV представлены клетки, которые отключили соответствующий ген, на что указывает процент клеток с отключенным геном (т.е. 45%, 66% и 53%, соответственно). На Фиг. 2D представлена количественная оценка сайленсинга генов CD29, CD81 и CD151 с помощью трех различных егРНК. На Фиг. 2E представлена количественная оценка сайленсинга двух или трех генов одновременно, чтобы показать, что белок «все в одном» может быть мультиплексирован путем совместной доставки молекул егРНК, нацеленных на разные гены. На Фиг. 2F представлен график, который описывает момент времени, взятый через 9 месяцев после трансфекции белка «все в одном» и егРНК, нацеленной на ген CLTA, и который означает, что большинство клеток стабильно отключили ген CLTA. [0013] In FIG. 2A-2F describe long-term silencing of endogenous genes. In FIG. 2A-2C show representative flow cytometry data obtained 22 days after transfection followed by targeting genes (CD29, CD81, CD151) for long-term silencing using an all-in-one protein. Quadrant IV represents cells that have turned off the corresponding gene, as indicated by the percentage of cells with the gene turned off (i.e., 45%, 66%, and 53%, respectively). In FIG. Figure 2D shows a quantitative assessment of the silencing of the CD29, CD81 and CD151 genes using three different egRNAs. In FIG. Figure 2E quantifies the silencing of two or three genes simultaneously to show that an all-in-one protein can be multiplexed by co-delivering egRNA molecules targeting different genes. In FIG. 2F is a graph that describes a time point taken 9 months after transfection of the all-in-one protein and segRNA targeting the CLTA gene, which indicates that the majority of cells have stably silenced the CLTA gene.
[0014] На Фиг. 3A-3I описан долгосрочный сайленсинг эндогенных генов. На Фиг. 3A-3C показано, что собранные клетки утратили экспрессию CD29 (Фиг. 3A), CD81 (Фиг. 3B) и CD151 (Фиг. 3C) через тридцать шесть суток после трансфекции, как определено по их профилям экспрессии РНК. Фиг. 3D-3F представляют собой вулканные диаграммы, показывающие, что целевые гены CD29 (Фиг. 3D), CD81 (Фиг. 3E) и CD151 (Фиг. 3F) являются единственным значимым генным нокдауном для каждого эксперимента, что свидетельствует о высокой специфичности генного сайленсинга. На Фиг. 3G-3I представлена количественная оценка уровней транскриптов CD151 (Фиг. 3G), CD81 (Фиг. 3H) и CD29 (Фиг. 3I), демонстрирующая нокдаун более 96% каждого из целевых генов. [0014] In FIG. 3A-3I describe long-term silencing of endogenous genes. In FIG. 3A-3C show that the harvested cells lost expression of CD29 (Figure 3A), CD81 (Figure 3B) and CD151 (Figure 3C) thirty-six days post-transfection, as determined by their RNA expression profiles. Fig. 3D-3F are volcano plots showing that the target genes CD29 (Figure 3D), CD81 (Figure 3E) and CD151 (Figure 3F) are the only significant gene knockdown for each experiment, indicating the high specificity of gene silencing. In FIG. Figures 3G-3I show quantification of CD151 (Figure 3G), CD81 (Figure 3H), and CD29 (Figure 3I) transcript levels, demonstrating >96% knockdown of each target gene.
[0015] На Фиг. 4A-4H описан долгосрочный сайленсинг генов в различных линиях клеток млекопитающих. Фиг. 4A - 4F представляют собой графики проточной цитометрии, показывающие экспрессию синего флуоресцентного белка (СФБ, англ. «BFP») (который слит с белком «все в одном») в HeLa (цервикальные клетки) (Фиг. 4A), U2OS (клетки костной ткани) (Фиг. 4B) и в индуцированных плюрипотентных стволовых клетках человека (иПСК) (Фиг. 4С). Фиг. 4D-4F представляют собой нетрансфицированные контроли для Фиг. 4A-4C, соответственно. На Фиг. 4G показано, что был достигнут стабильный сайленсинг эндогенных генов в клетках HeLa и U2OS, измеренный через 18 суток после трансфекции белком «все в одном». На Фиг. 4A-4F по оси x отложен СФБ (слитый с белком «все в одном»), а по оси y - mCherry. На Фиг. 4H показано, что сайленсинг генов был обнаружен через 14 суток после трансфекции с помощью метода кПЦР в линиях клеток гепатоцитов AML12 мыши при нацеливании на Pcsk9, Npc1, Spcs1 и Cd81. [0015] In FIG. 4A-4H describe long-term gene silencing in various mammalian cell lines. Fig. 4A - 4F are flow cytometry plots showing the expression of blue fluorescent protein (BFP) (which is fused to an all-in-one protein) in HeLa (cervical cells) (Figure 4A), U2OS (bone cells tissue) (Figure 4B) and in human induced pluripotent stem cells (iPSCs) (Figure 4C). Fig. 4D-4F represent untransfected controls for Fig. 4A-4C, respectively. In FIG. 4G shows that stable silencing of endogenous genes was achieved in HeLa and U2OS cells, measured 18 days after transfection with the all-in-one protein. In FIG. 4A-4F, the x-axis is SFB (all-in-one protein fusion) and the y-axis is mCherry. In FIG. 4H shows that gene silencing was detected 14 days post-transfection by qPCR in mouse AML12 hepatocyte cell lines when targeting Pcsk9, Npc1, Spcs1 and Cd81.
[0016] На Фиг. 5 представлены схемы слитых белков p76, p90 - p102 и p112, которые соответствуют последовательностям SEQ ID NO: 1-15, соответственно. [0016] In FIG. 5 shows diagrams of the fusion proteins p76, p90 - p102 and p112, which correspond to the sequences of SEQ ID NO: 1-15, respectively.
[0017] На Фиг. 6A-6E описаны действия по генному сайленсингу вариантов белка «все в одном». На Фиг. 6A-6B показаны результаты генного сайленсинга через 18 суток после трансфекции слитых белков последовательностей SEQ ID NO: 1-15, трансфицированных в клетки HEK293T для целенаправленного подавления гена CLTA. Форматы dCas9 - KRAB и dCas9 - Dnmt3A - Dnmt3L продемонстрировали кратковременную и более низкую эффективность длительного сайленсинга. На Фиг. 6C-6D представлено сравнение последовательностей SEQ ID NO: 1 (p76) и SEQ ID NO: 15 (p112) в сайленсинге эндогенного гена HIST2H2BE (H2B) (Фиг. 6C) и синтетического репортерного гена Snrpn-GFP (Фиг. 6D), стабильно экспрессируемых в клетках HEK293T. На Фиг. 6E представлен график экспрессии белков (пунктирные линии) p76 и p112 в течение периода времени в 50 суток для выключения гена HIST2H2BE (H2B). Уровни белка измеряли с помощью метода проточной цитометрии для детектирования СФБ, который экспрессируется совместно с белком «все в одном». [0017]In FIG. 6A-6E steps for gene silencing of all-in-one protein variants are described. In FIG. 6A-6B show the results of gene silencing 18 days after transfection of fusion proteins of SEQ ID NOs: 1-15 transfected into HEK293T cells to specifically silence the CLTA gene. The dCas9 - KRAB and dCas9 - Dnmt3A - Dnmt3L formats demonstrated short-term and lower long-term silencing efficiency. In FIG. 6C-6D show a comparison of SEQ ID NO: 1 (p76) and SEQ ID NO: 15 (p112) in the silencing of the endogenous HIST2H2BE (H2B) gene (Fig. 6C) and the synthetic reporter gene Snrpn-GFP (Fig. 6D), stable expressed in HEK293T cells. In FIG. 6E shows a graph of protein expression (dashed lines) of p76 and p112 over a 50-day period to silence the HIST2H2BE (H2B) gene. Protein levels were measured using a flow cytometry method to detect SBF, which is co-expressed with the all-in-one protein.
[0018] На Фиг. 7A-7B представлены вестерн-блоты вариантов белка «все в одном». На Фиг. 7А представлен анализ по методу вестерн-блоттинг вариантов белка «все в одном» p76 и p90 - p102 с использованием антитела против Steptococcus pyogenes Cas9. Верхняя полоса соответствует полноразмерному белку, а полосы меньшего размера отображают продукты протеолиза белков «все в одном». На Фиг. 7В представлен анализ по методу вестерн-блоттинг вариантов белка «все в одном» с целью обнаружения свободного Dnmt3A, который отщепляется от слитого белка. [0018] In FIG. 7A-7B show Western blots of all-in-one protein variants. In FIG. 7A shows Western blot analysis of all-in-one protein variants p76 and p90 - p102 using the anti- Steptococcus pyogenes Cas9 antibody. The top band represents the full-length protein, and the smaller bands represent the proteolysis products of the all-in-one proteins. In FIG. 7B shows a Western blot analysis of all-in-one protein variants to detect free Dnmt3A that is cleaved from the fusion protein.
[0019] На Фиг. 8A-8E описан объединенный скрининг для определения оптимальных егРНК. На Фиг. 8A представлена схема объединенного скрининга для определения оптимальных егРНК, которые приводят к долгосрочному сайленсингу генов. На Фиг. 8B-8E представлены гистограммы проточной цитометрии, показывающие процент клеток, подвергающихся сайленсингу генов через четыре недели после трансфекции. Были использованы четыре клеточные линии HEK293T, каждая с различным геном с меткой GFP, включительно с CLTA (Фиг. 8B), VIM (Фиг. 8C), HIST2H2BE (H2B) (Фиг. 8D) и RAB11A (Фиг. 8E). [0019] In FIG. 8A-8E describe a pooled screen to identify optimal egRNAs. In FIG. Figure 8A presents a scheme for a pooled screen to identify optimal egRNAs that lead to long-term gene silencing. In FIG. 8B-8E are flow cytometry histograms showing the percentage of cells undergoing gene silencing four weeks after transfection. Four HEK293T cell lines were used, each with a different GFP-tagged gene, including CLTA (Figure 8B), VIM (Figure 8C), HIST2H2BE (H2B) (Figure 8D), and RAB11A (Figure 8E).
[0020] На Фиг. 9A-9D представлены карты функциональности егРНК в сайте начала транскрипции целевого гена, включительно с CLTA (Фиг. 9A), H2B (Фиг. 9B), RAB11 (Фиг. 9C) и VIM (Фиг. 9D). Сайт начала транскрипции (СНТ, англ. «TSS») и островок CpG аннотированы над каждым графиком. Каждая точка отображает собой одну егРНК, а ее эффективность в долгосрочном генном сайленсинге отображено как изменение в log2-кратном содержании егРНК. Степень заполнения нуклеосом (нижний график) нанесена на графики по сигналу от МНазы (микрококковая нуклеаза, англ. «MNase»). [0020] In FIG. 9A-9D show maps of egRNA functionality at the transcription start site of the target gene, including CLTA (Fig. 9A), H2B (Fig. 9B), RAB11 (Fig. 9C), and VIM (Fig. 9D). The transcription start site (TSS) and CpG island are annotated above each graph. Each dot represents one egRNA, and its effectiveness in long-term gene silencing is displayed as a change in log2-fold egRNA content. The degree of nucleosome occupancy (lower graph) is plotted against the signal from MNase (micrococcal nuclease, English “MNase”).
[0021] На Фиг. 10A-10E описаны функциональные егРНК для длительного сайленсинга генов. На Фиг. 10А представлен рабочий процесс объединенного скрининга в клетках HEK293T для определения оптимальных положений нацеливания егРНК для белка «все в одном», адаптированный из предыдущего рицинового скрининга на биочипах высокой плотности в клетках K562 для определения оптимальных егРНК для dCas9 - KRAB (Gilbert, Horlbeck et al., Cell 2014). На Фиг. 10B-10E представлены репрезентативные графики, показывающие фенотипы роста для четырех генов, включительно с ARL1 (Фиг. 10B), EIF6 (Фиг. 10C), SMC3 (Фиг. 10D), HEATR1 (Фиг. 10E), из существующих наборов данных для dCas9 - KRAB/ CRISPRi в клетках K562 (Gilbert, Horlbeck et al., 2014), и с белком «все в одном» (нижний график). Каждая точка отображает собой егРНК. СНТ и аннотированный островок CpG показаны для каждого гена. [0021]In FIG. 10A-10E Functional egRNAs for long-term gene silencing have been described. In FIG. 10A shows a pooled screening workflow in HEK293T cells to determine optimal segRNA targeting positions for an all-in-one protein, adapted from a previous high-density ricin bioarray screen in K562 cells to identify optimal segRNAs for dCas9 - KRAB (Gilbert, Horlbeck et al. , Cell 2014). In FIG. 10B-10E are representative plots showing growth phenotypes for four genes, including ARL1 (Figure 10B), EIF6 (Figure 10C), SMC3 (Figure 10D), HEATR1 (Figure 10E), from existing data sets for dCas9 - KRAB/ CRISPRi in K562 cells (Gilbert, Horlbeck et al., 2014), and with the all-in-one protein (lower graph). Each dot represents an egRNA. The CNT and annotated CpG island are shown for each gene.
[0022] На Фиг. 11A-11B представлено сравнение фенотипов роста и позиционирования нуклеосом (по сигналу от МНазы) для VPS53 (Фиг. 11A) и VPS54 (Фиг. 11B), которое показывает расположение функциональных егРНК в областях, лишенных нуклеосом. [0022] In FIG. 11A-11B are a comparison of the growth and nucleosome positioning phenotypes (as signaled by MNase) for VPS53 (Fig. 11A) and VPS54 (Fig. 11B), which shows the location of functional egRNAs in regions lacking nucleosomes.
[0023] На Фиг. 12A-12C показана доставка белка «все в одном» посредством экспрессии мРНК. На Фиг. 12A показана транскрипция in vitro двух вариантов белка «все в одном» (p102 и p112), а также показан полноразмерный синтез каждой конструкции. На Фиг. 12B представлен график проточной цитометрии, показывающий экспрессию p102 и p112 через одни сутки после трансфекции мРНК в клетки HEK293T. На Фиг. 12С представлена динамика сайленсинга эндогенного гена CLTA в клетках HEK293T после трансфекции мРНК, экспрессирующей варианты p102 и p112 белка «все в одном». [0023] In FIG. 12A-12C show all-in-one protein delivery via mRNA expression. In FIG. 12A shows in vitro transcription of two all-in-one protein variants (p102 and p112) and also shows full-length synthesis of each construct. In FIG. 12B is a flow cytometry graph showing the expression of p102 and p112 one day after transfection of the mRNA into HEK293T cells. In FIG. Figure 12C shows the dynamics of endogenous CLTA gene silencing in HEK293T cells after transfection with mRNA expressing all-in-one protein variants p102 and p112.
[0024] На Фиг. 13A-13G описана контролируемая экспрессия белка «все в одном» с помощью доксициклиновой индукции. На Фиг. 13A представлены графики проточной цитометрии, показывающие индуцированную экспрессию белка «все в одном» путем добавления доксициклина в клетки K562, которые стабильно кодируют белок «все в одном» под действием промотора, индуцируемого доксициклином. Пунктирная линия отображает базовую медианную флуоресценцию СФБ без введения доксициклина. На Фиг. 13B представлены вестерн-блоты клеток, направленные на детекцию экспрессии белка «все в одном» до и после обработки доксициклином. На Фиг. 13C-13F представлены графики проточной цитометрии для нокдауна генов CD81 (Фиг. 13C- 13D) и CD151 (Фиг. 13E-13F) через 14 суток после обработки доксициклином клеток K562. На Фиг. 13G представлена количественная оценка нокдауна генов CD81 и CD151 через 14 суток после обработки доксициклином или без обработки доксициклином. [0024] In FIG. 13A-13G describe controlled expression of an all-in-one protein using doxycycline induction. In FIG. 13A are flow cytometry plots showing the induced expression of the all-in-one protein by addition of doxycycline in K562 cells that stably encode the all-in-one protein under the influence of a doxycycline-inducible promoter. The dotted line represents the baseline median fluorescence of SPB without doxycycline administration. In FIG. 13B shows Western blots of cells to detect all-in-one protein expression before and after doxycycline treatment. In FIG. 13C-13F show flow cytometry plots for knockdown of the CD81 (FIGS. 13C-13D) and CD151 (FIGS. 13E-13F) genes 14 days after doxycycline treatment of K562 cells. In FIG. 13G presents a quantitative assessment of the knockdown of the CD81 and CD151 genes 14 days after treatment with doxycycline or without treatment with doxycycline.
ПОДРОБНОЕ ОПИСАНИЕ СУЩНОСТИ ИЗОБРЕТЕНИЯDETAILED DESCRIPTION OF THE INVENTION
[0025] Описанная в данном документе технология позволяет, среди прочего, обеспечить постоянный сайленсинг генов в клетках млекопитающих без образования двухцепочечных разрывов ДНК в геноме хозяина. В вариантах реализации данного изобретения центральный компонент представляет собой одиночную полипептидную цепь, состоящую из каталитически неактивного Cas9 (dCas9), слитого с Dnmt3A, Dnmt3L, и доменом KRAB (в данном документе указанный центральный компонент именуется как «белок «все в одном»»). Указанный слитый белок, представленный в данном документе, может быть направлен на конкретный сайт в геноме млекопитающего с использованием единой гидовой РНК (егРНК), и может приводить к метилированию ДНК и (или) вносить репрессивные хроматиновые маркеры в этот сайт. В вариантах реализации данного изобретения результатом является сайленсинг гена, который наследуется при последующих делениях клеток. В вариантах реализации данного изобретения слитый белок, представленный в данном документе (и егРНК), экспрессируются только кратковременно, минуя использование способов вирусной доставки для индукции постоянного сайленсинга. [0025] The technology described herein allows, among other things, permanent gene silencing in mammalian cells without the formation of DNA double-strand breaks in the host genome. In embodiments of the present invention, the core component is a single polypeptide chain consisting of catalytically inactive Cas9 (dCas9) fused to Dnmt3A, Dnmt3L, and a KRAB domain (herein referred to as the “all-in-one protein”). The fusion protein provided herein can be targeted to a specific site in the mammalian genome using a single guide RNA (sgRNA), and can result in DNA methylation and/or introduce repressive chromatin markers at that site. In embodiments of the present invention, the result is gene silencing, which is inherited through subsequent cell divisions. In embodiments of the present invention, the fusion protein provided herein (and egRNA) are expressed only transiently, bypassing the use of viral delivery methods to induce permanent silencing.
[0026] В вариантах реализации данного изобретения слитые белки, представленные в данном документе, обеспечивают надежный долгосрочный или постоянный сайленсинг экспрессии эндогенных генов посредством редактирования эпигенома, а не генома. Возможно как нацеливание на оба аллеля гена, так и селективное нацеливание на один патогенный аллель. В вариантах реализации данного изобретения преимущество слитого белка, представленного в данном документе, состоит в том, что эпигенетическое редактирование является обратимым и, следовательно, по своей природе более безопасным, чем редактирование генома. Таким образом, в вариантах реализации данного изобретения слитый белок, представленный в данном документе, полезен в профилактических целях. Например, сайленсинг гена может обеспечить острую защиту от инфекции/ биологического токсина, а затем сайленсинг может быть обращен вспять после отсутствия риска инфекции или интоксикации. Таким образом, в вариантах реализации данного изобретения слитый белок, представленный в данном документе, обладает полезными свойствами в ситуации, при которой вирус или токсин проникает в клетку посредством взаимодействия с белком, который требуется для долговременной функции органа или для гомеостаза. В вариантах реализации данного изобретения слитый белок, представленный в данном документе, полезен в терапевтических средствах, основанных на редактировании генома. [0026] In embodiments of the present invention, the fusion proteins provided herein provide robust long-term or permanent silencing of endogenous gene expression through editing of the epigenome rather than the genome. It is possible to target both alleles of a gene or to selectively target one pathogenic allele. In embodiments of the present invention, an advantage of the fusion protein provided herein is that epigenetic editing is reversible and therefore inherently safer than genome editing. Thus, in embodiments of the present invention, the fusion protein provided herein is useful for prophylactic purposes. For example, gene silencing may provide acute protection against infection/biological toxin, and then silencing may be reversed once there is no risk of infection or toxicity. Thus, in embodiments of the present invention, the fusion protein provided herein has beneficial properties in a situation in which a virus or toxin enters a cell through interaction with a protein that is required for long-term organ function or homeostasis. In embodiments of the present invention, the fusion protein provided herein is useful in genome editing-based therapeutics.
[0027] В вариантах реализации данного изобретения постоянный сайленсинг гена в клетках млекопитающих может быть достигнут с помощью двух компонентов: одной полипептидной цепи, состоящей из dCas9, слитого с тремя эпигенетическими модуляторами, и единой гидовой РНК, которая направляет белок в конкретный сайт в геноме хозяина. В вариантах реализации данного изобретения компоненты экспрессируются в клетке-хозяине только кратковременно, что снижает токсичность и нецелевые явления. [0027] In embodiments of the present invention, permanent gene silencing in mammalian cells can be achieved using two components: a single polypeptide chain consisting of dCas9 fused to three epigenetic modulators, and a single guide RNA that directs the protein to a specific site in the host genome . In embodiments of the present invention, the components are expressed only transiently in the host cell, thereby reducing toxicity and off-target effects.
[0028] В вариантах реализации данного изобретения слитый белок, представленный в данном документе, не вызывает разрывов ДНК в клетке-хозяине для обеспечения постоянного генного сайленсинга. В вариантах реализации данного изобретения эпигенетические метки, которые добавляются к представляющему интерес геномному сайту, являются обратимыми, что позволяет удалять любые нецелевые явления, которые могут произойти. [0028] In embodiments of the present invention, the fusion protein provided herein does not cause DNA breaks in the host cell to ensure permanent gene silencing. In embodiments of the present invention, the epigenetic marks that are added to the genomic site of interest are reversible, allowing the removal of any off-target events that may occur.
[0029] Определения [0029] Definitions
[0030] Несмотря на то, что в данном документе показаны и описаны различные варианты реализации и аспекты данного изобретения, для специалистов в данной области техники будет очевидно, что такие варианты реализации и аспекты представлены только в качестве примера. Многочисленные вариации, изменения и замены теперь будут очевидны специалистам в данной области техники без отклонения от данного изобретения. Следует понимать, что при практическом применении изобретения могут использоваться различные альтернативы описанным в данном документе вариантам реализации данного изобретения. [0030] Although various embodiments and aspects of the present invention are shown and described herein, those skilled in the art will appreciate that such embodiments and aspects are presented by way of example only. Numerous variations, changes and substitutions will now be apparent to those skilled in the art without departing from the present invention. It should be understood that various alternatives to the embodiments of the invention described herein may be used in the practice of the invention.
[0031] Заголовки разделов, используемые в данном документе, предназначены только для организационных целей и не должны толковаться как ограничивающие описанный объект данного изобретения. Все документы или части документов, процитированные в данной заявке, включая, помимо прочего, патенты, заявки на патенты, статьи, книги, руководства и научные трактаты, настоящим полностью включены в данное описание посредством ссылки в полном объеме для любых целей. [0031] The section headings used herein are for organizational purposes only and should not be construed as limiting the described subject matter of the present invention. All documents or portions of documents cited in this application, including, but not limited to, patents, patent applications, articles, books, manuals and scientific treatises, are hereby incorporated by reference in their entirety for all purposes.
[0032] Если не указано иное, все технические и научные термины, употребляемые в данном документе, имеют значение, обычно понятное специалисту в области техники, к которой принадлежит данное изобретение. Следующие ссылки предоставляют специалисту общее определение многих терминов, употребляемых в данном изобретении: Singleton et al., Dictionary of Microbiology and Molecular Biology (2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); и Hale & Marham, The Harper Collins Dictionary of Biology (1991). В контексте данного документа нижеследующие термины имеют приписываемые им значения, если не указано иное. [0032] Unless otherwise specified, all technical and scientific terms used herein have the meaning commonly understood by one skilled in the art to which this invention belongs. The following references provide one skilled in the art with a general definition of many of the terms used in this invention: Singleton et al., Dictionary of Microbiology and Molecular Biology ( 2nd ed. 1994); The Cambridge Dictionary of Science and Technology (Walker ed., 1988); The Glossary of Genetics, 5th Ed., R. Rieger et al. (eds.), Springer Verlag (1991); and Hale & Marham, The Harper Collins Dictionary of Biology (1991). As used in this document, the following terms have the meanings ascribed to them unless otherwise noted.
[0033] Использование единственного или множественного числа в данном описании и в последующей формуле изобретения следует традиционному подходу в патентах, означающему «по меньшей мере один», за исключением ситуации, когда в конкретном случае из контекста ясно, что термин предназначен в этом конкретном случае для обозначения конкретно одного и только одного. Аналогичным образом, термин «содержащий» является неограничивающим, и не исключает дополнительных элементов, функций, компонентов и т.д. Литературные источники, указанные в данном документе, прямо включены в данный документ посредством ссылки во всем их объеме, если не указано иное. [0033] The use of singular or plural in this specification and in the following claims follows the traditional approach in patents to mean “at least one”, unless in a particular instance it is clear from the context that the term is intended in that particular instance to denoting one thing and one thing only. Likewise, the term “comprising” is non-limiting and does not exclude additional elements, functions, components, etc. Literary sources cited herein are expressly incorporated herein by reference in their entirety unless otherwise noted.
[0034] Термины «содержать», «включать» и «иметь», а также их производные употребляются в контексте данного документа взаимозаменяемо как широкие неограничивающие термины. Например, при употреблении терминов «содержащий», «включающий» или «имеющий» подразумевается, что какой бы элемент ни содержался, был включен или имелся, это не единственный элемент, охватываемый подлежащим предложения, содержащим соответствующий указанный выше глагол. [0034] The terms “comprise”, “include” and “have”, as well as their derivatives, are used interchangeably in the context of this document as broad, non-limiting terms. For example, when using the terms “containing,” “including,” or “having,” it is implied that whatever element is contained, included, or had is not the only element covered by the subject of the sentence containing the corresponding verb above.
[0035] Термин «нуклеиновая кислота» относится к нуклеотидам (например, дезоксирибонуклеотидам или рибонуклеотидам) и их полимерам в одноцепочечной, двухцепочечной или многоцепочечной форме, или к их комплементам. Термины «полинуклеотид», «олигонуклеотид», «олиго» и тому подобное относятся в обычном и общепринятом смысле к линейной последовательности нуклеотидов. Термин «нуклеотид» относится в обычном и общепринятом смысле к отдельной единице полинуклеотида, то есть к мономеру. Нуклеотиды могут быть рибонуклеотидами, дезоксирибонуклеотидами или их модифицированными версиями. Примеры полинуклеотидов, предусмотренных в данном документе, включают одно- и двухцепочечную ДНК, одно- и двухцепочечную РНК, и гибридные молекулы, содержащие смеси одно- и двухцепочечных ДНК и РНК. Примеры нуклеиновых кислот, например полинуклеотидов, предусмотренных в данном документе, включают, но не ограничиваются ими, любой тип РНК, например мРНК, миРНК, микроРНК, егРНК и гидовую РНК, а также любой тип ДНК, например геномную ДНК, плазмидную ДНК и миникольцевую ДНК, и любые их фрагменты. В аспектах данного изобретения нуклеиновая кислота представляет собой информационную РНК. В некоторых аспектах данного изобретения информационная РНК представляет собой информационный рибонуклеопротеин (РНП). Термин «дуплекс», используемый в данном документе в контексте полинуклеотидов, относится, в обычном и общепринятом смысле, к двухцепочечности. Нуклеиновые кислоты могут быть линейными или разветвленными. Например, нуклеиновые кислоты могут представлять собой линейную цепь нуклеотидов или нуклеиновые кислоты могут быть разветвленными, например, так, что нуклеиновые кислоты содержат одно или несколько плеч или разветвлений нуклеотидов. Необязательно, разветвленные нуклеиновые кислоты многократно разветвлены с образованием структур более высокого порядка, таких как дендримеры и тому подобное. [0035] The term "nucleic acid" refers to nucleotides (eg, deoxyribonucleotides or ribonucleotides) and polymers thereof in single-stranded, double-stranded or multistranded form, or their complements. The terms "polynucleotide", "oligonucleotide", "oligo" and the like refer in the ordinary and accepted sense to a linear sequence of nucleotides. The term "nucleotide" refers in the ordinary and accepted sense to a single unit of polynucleotide, that is, a monomer. Nucleotides may be ribonucleotides, deoxyribonucleotides, or modified versions thereof. Examples of polynucleotides provided herein include single- and double-stranded DNA, single- and double-stranded RNA, and hybrid molecules containing mixtures of single- and double-stranded DNA and RNA. Examples of nucleic acids, such as polynucleotides, provided herein include, but are not limited to, any type of RNA, such as mRNA, miRNA, microRNA, segRNA, and guide RNA, and any type of DNA, such as genomic DNA, plasmid DNA, and minicircular DNA. , and any fragments thereof. In aspects of the present invention, the nucleic acid is messenger RNA. In some aspects of the present invention, the messenger RNA is a messenger ribonucleoprotein (RNP). The term "duplex" as used herein in the context of polynucleotides refers, in the usual and accepted sense, to double-strandedness. Nucleic acids can be linear or branched. For example, nucleic acids may be a linear chain of nucleotides, or nucleic acids may be branched, such that the nucleic acids contain one or more nucleotide arms or branches. Optionally, branched nucleic acids are branched multiple times to form higher order structures such as dendrimers and the like.
[0036] В контексте данного документа термины «нуклеиновая кислота», «молекула нуклеиновой кислоты», «олигомер нуклеиновой кислоты», «олигонуклеотид», «последовательность нуклеиновой кислоты», «фрагмент нуклеиновой кислоты» и «полинуклеотид» употребляются взаимозаменяемо и предназначены для включения, но не ограничиваясь ими, полимерной формы нуклеотидов, ковалентно связанных вместе, которые могут иметь различную длину, либо дезоксирибонуклеотидов, либо рибонуклеотидов, или их аналогов, производных или модификаций. Различные полинуклеотиды могут иметь разные трехмерные структуры и могут выполнять разнообразные функции, известные или неизвестные. Неограничивающие примеры полинуклеотидов включают в себя ген, фрагмент гена, экзон, интрон, межгенную ДНК (включая, без ограничения, гетерохроматическую ДНК), информационную РНК (иРНК), транспортную РНК, рибосомную РНК, рибозим, кДНК, рекомбинантный полинуклеотид, разветвленный полинуклеотид, плазмиду, вектор, выделенную ДНК последовательности, выделенную РНК последовательности, егРНК, гидовую РНК, зонд нуклеиновой кислоты и праймер. Полинуклеотиды, используемые в способах согласно данному изобретению, могут содержать природные последовательности нуклеиновых кислот и их варианты, искусственные последовательности нуклеиновых кислот, или комбинацию таких последовательностей. [0036] As used herein, the terms “nucleic acid,” “nucleic acid molecule,” “nucleic acid oligomer,” “oligonucleotide,” “nucleic acid sequence,” “nucleic acid fragment,” and “polynucleotide” are used interchangeably and are intended to include , but not limited to, a polymeric form of nucleotides covalently linked together, which may be of varying lengths, either deoxyribonucleotides or ribonucleotides, or analogs, derivatives or modifications thereof. Different polynucleotides may have different three-dimensional structures and may perform a variety of functions, known or unknown. Non-limiting examples of polynucleotides include a gene, gene fragment, exon, intron, intergenic DNA (including, without limitation, heterochromatic DNA), messenger RNA (mRNA), transfer RNA, ribosomal RNA, ribozyme, cDNA, recombinant polynucleotide, branched-chain polynucleotide, plasmid , vector, isolated DNA sequence, isolated RNA sequence, sgRNA, guide RNA, nucleic acid probe and primer. The polynucleotides used in the methods of this invention may contain natural nucleic acid sequences and variants thereof, artificial nucleic acid sequences, or a combination of such sequences.
[0037] Полинуклеотид обычно состоит из определенной последовательности четырех нуклеотидных оснований: аденина (А); цитозина (С); гуанина (G); и тимина (T) (урацила (U) вместо тимина (T), когда полинуклеотид представляет собой РНК). Таким образом, термин «полинуклеотидная последовательность» представляет собой алфавитное представление полинуклеотидной молекулы; альтернативно, этот термин может применяться к самой молекуле полинуклеотида. Такое алфавитное представление может вводиться в базы данных на компьютере, имеющем центральный процессор, и иметь биоинформационное применение, такое как использование в функциональной геномике и поиск гомологий. Полинуклеотиды могут необязательно включать в себя один или несколько нестандартных нуклеотидов, нуклеотидных аналогов и (или) модифицированных нуклеотидов. [0037] A polynucleotide typically consists of a specific sequence of four nucleotide bases: adenine (A); cytosine (C); guanine (G); and thymine (T) (uracil (U) instead of thymine (T) when the polynucleotide is RNA). Thus, the term "polynucleotide sequence" is an alphabetical representation of a polynucleotide molecule; alternatively, the term may apply to the polynucleotide molecule itself. Such an alphabetical representation can be entered into databases on a computer having a central processing unit and have bioinformatic applications such as use in functional genomics and homology searches. Polynucleotides may optionally include one or more non-standard nucleotides, nucleotide analogs and/or modified nucleotides.
[0038] Нуклеиновые кислоты, включая, например, нуклеиновые кислоты с фосфотиоатным остовом, могут включать в себя один или несколько реактивных фрагментов. Употребляемый в контексте данного документа термин «реактивный фрагмент» охватывает собой любую группу, способную реагировать с другой молекулой, например, нуклеиновой кислотой или полипептидом, посредством ковалентных, нековалентных или других взаимодействий. В качестве примера нуклеиновая кислота может включать в себя фрагмент, реакционноспособный по отношению к аминокислоте, который вступает в реакцию с аминокислотой на белке или полипептиде посредством ковалентного, нековалентного или другого взаимодействия. [0038] Nucleic acids, including, for example, nucleic acids with a phosphorothioate backbone, may include one or more reactive moieties. As used herein, the term “reactive moiety” includes any group capable of reacting with another molecule, such as a nucleic acid or polypeptide, through covalent, non-covalent or other interactions. By way of example, a nucleic acid may include an amino acid-reactive moiety that reacts with an amino acid on a protein or polypeptide through a covalent, non-covalent, or other interaction.
[0039] Термины также охватывают нуклеиновые кислоты, содержащие известные аналоги нуклеотидов или модифицированные остатки или связи основной цепи, которые являются синтетическими, встречающимися в природе и не встречающимися в природе, которые имеют такие же связывающие свойства, что и референсная нуклеиновая кислота, и которые метаболизируются аналогично референсным нуклеотидам. Примеры таких аналогов включают, но не ограничиваются ими, производные фосфодиэфиров, включая, например, фосфорамидат, фосфородиамидат, фосфоротиоат (также известный как фосфотиоат, содержащий посредством двойной связи серу, которая заместила кислород в фосфате), фосфородитиоат, фосфонокарбоновые кислоты, фосфонокарбоксилаты, фосфоноуксусные кислоты, фосфоноформовую кислоту, метилфосфонатные, борфосфонатные или O-метилфосфорамидитные связи (см. Eckstein, Oligonucleotides and Analogues: A Practical Approach, Oxford University Press), а также модификации нуклеотидных оснований, такие как 5-метилцитидин или псевдоуридин; и остовы и связи пептидных нуклеиновых кислот. Другие аналоги нуклеиновых кислот включают в себя нуклеиновые кислоты с положительным остовом; неионные остовы, модифицированные сахара и не рибозные остовы (например, фосфородиамидатные морфолиновые олигонукледотиды или закрытые нуклеиновые кислоты (ЗНК, англ. «LNA»), как известно в данной области техники), включая те, что описаны в патентах США № 5235033 и № 5034506, а также в Главах 6 и 7 из ASC Symposium Series 580, Carbohydrate Modifications in Antisense Research, Sanghui & Cook, eds. Нуклеиновые кислоты, содержащие один или несколько карбоциклических сахаров, также включены в одно определение нуклеиновых кислот. Модификации рибозофосфатного остова могут осуществляться по разным причинам, например, для повышения стабильности и периода полужизни таких молекул в физиологической среде или в качестве зондов на биочипе. Могут быть приготовлены смеси встречающихся в природе нуклеиновых кислот и аналогов; альтернативно могут быть приготовлены смеси различных аналогов нуклеиновых кислот и смеси встречающихся в природе нуклеиновых кислот и аналогов. В аспектах данного изобретения межнуклеотидные связи в ДНК представляют собой фосфодиэфирные связи, производные фосфодиэфирных связей, или их комбинацию. [0039] The terms also include nucleic acids containing known nucleotide analogues or modified backbone residues or linkages that are synthetic, naturally occurring and non-naturally occurring, that have the same binding properties as the reference nucleic acid, and that are metabolized similar to reference nucleotides. Examples of such analogues include, but are not limited to, phosphodiester derivatives, including, for example , phosphoramidate, phosphorodiamidate, phosphorothioate (also known as phosphorothioate containing, through a double bond, sulfur that has replaced the oxygen in the phosphate), phosphorodithioate, phosphonocarboxylic acids, phosphonocarboxylates, phosphonoacetic acids , phosphonoformic acid, methylphosphonate, borophosphonate or O-methylphosphoramidite linkages (see Eckstein, Oligonucleotides and Analogues: A Practical Approach, Oxford University Press), and modifications of nucleotide bases such as 5-methylcytidine or pseudouridine; and peptide nucleic acid backbones and linkages. Other nucleic acid analogues include positive-backbone nucleic acids; nonionic backbones, modified sugars, and non-ribose backbones (e.g., phosphorodiamidate morpholine oligonucleotides or locked nucleic acids (LNAs) as known in the art), including those described in US Pat. No. 5,235,033 and US Pat. No. 5,034,506 , and in Chapters 6 and 7 of ASC Symposium Series 580, Carbohydrate Modifications in Antisense Research, Sanghui & Cook, eds. Nucleic acids containing one or more carbocyclic sugars are also included in one definition of nucleic acids. Modifications to the ribose phosphate backbone can be made for a variety of reasons, such as to improve the stability and half-life of such molecules in a physiological environment or as probes on a biochip. Mixtures of naturally occurring nucleic acids and analogues can be prepared; alternatively, mixtures of various nucleic acid analogs and mixtures of naturally occurring nucleic acids and analogs can be prepared. In aspects of the present invention, the internucleotide linkages in the DNA are phosphodiester linkages, derivatives of phosphodiester linkages, or a combination thereof.
[0040] Нуклеиновые кислоты могут включать в себя неспецифические последовательности. Употребляемый в контексте данного документа термин «неспецифическая последовательность» относится к последовательности нуклеиновой кислоты, которая содержит серию остатков, не предназначенных для комплементарности любой другой последовательности нуклеиновой кислоты, или только частично комплементарных ей. В качестве примера, неспецифическая последовательность нуклеиновой кислоты представляет собой последовательность остатков нуклеиновой кислоты, которая не функционирует как ингибирующая нуклеиновая кислота при контакте с клеткой или организмом. [0040] Nucleic acids may include non-specific sequences. As used herein, the term “non-specific sequence” refers to a nucleic acid sequence that contains a series of residues not intended to be complementary to, or only partially complementary to, any other nucleic acid sequence. By way of example, a nonspecific nucleic acid sequence is a sequence of nucleic acid residues that does not function as an inhibitory nucleic acid upon contact with a cell or organism.
[0041] Термин «комплементарный» или «комплементарность» относится к способности нуклеиновой кислоты образовывать с другой последовательностью нуклеиновой кислоты водородную связь (водородные связи) либо традиционного типа по Уотсону-Крику, либо других нетрадиционных типов. Например, последовательность A - G - T комплементарна последовательности T - C - A. Процент комплементарности указывает процент остатков в молекуле нуклеиновой кислоты, которые могут образовывать водородные связи (например, спаривание оснований по Уотсону-Крику) со второй последовательностью нуклеиновой кислоты (например, 5, 6, 7, 8, 9, 10 из 10 являются комплементарными на 50%, 60%, 70%, 80%, 90% и 100%, соответственно). Термин «совершенно комплементарный» означает, что все смежные остатки последовательности нуклеиновой кислоты будут связываться водородными связями с тем же числом смежных остатков во второй последовательности нуклеиновой кислоты. Употребляемый в контексте данного документа термин «по существу комплементарный» относится к степени комплементарности, которая составляет по меньшей мере 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98%, 99% или 100% в участке из 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40, 45, 50 или более нуклеотидов, или относится к двум нуклеиновым кислотам, которые гибридизуются в жестких условиях (т.е. в жестких условиях гибридизации). [0041] The term “complementary” or “complementarity” refers to the ability of a nucleic acid to form hydrogen bond(s) of either conventional Watson-Crick type or other non-traditional types with another nucleic acid sequence. For example, the sequence A - G - T is complementary to the sequence T - C - A. Percent complementarity indicates the percentage of residues in a nucleic acid molecule that can form hydrogen bonds (e.g., Watson-Crick base pairing) with a second nucleic acid sequence (e.g., 5 , 6, 7, 8, 9, 10 out of 10 are 50%, 60%, 70%, 80%, 90% and 100% complementary, respectively). The term “perfectly complementary” means that all contiguous residues of a nucleic acid sequence will hydrogen bond to the same number of contiguous residues in a second nucleic acid sequence. As used herein, the term “substantially complementary” refers to a degree of complementarity that is at least 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 97%, 98% , 99% or 100% in the area of 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 30, 35, 40 , 45, 50 or more nucleotides, or refers to two nucleic acids that hybridize under stringent conditions (ie, stringent hybridization conditions).
[0042] Фраза «жесткие условия гибридизации» относится к условиям, при которых зонд будет гибридизоваться со своей целевой подпоследовательностью, обычно в сложной смеси нуклеиновых кислот, но не с другими последовательностями. Жесткие условия зависят от последовательности и будут разными в разных обстоятельствах. Более длинные последовательности специфически гибридизуются при более высоких температурах. Подробное руководство по гибридизации нуклеиновых кислот можно найти в Tijssen, Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Probes, “Overview of principles of hybridization and the strategy of nucleic acid assays” (1993). Обычно выбираются жесткие условия, которые примерно на 5-10°C ниже, чем температура точки плавления (Tпл) для конкретной последовательности при определенной ионной силе и pH. Tпл представляет собой такую температуру (при определенной ионной силе, pH и концентрации нуклеиновых кислот), при которой 50% зондов, комплементарных мишени, гибридизуются с последовательностью-мишенью при равновесном состоянии (так как последовательности-мишени присутствуют в избытке, то при Tпл 50% зондов заняты при равновесном состоянии). Жесткие условия также могут быть достигнуты путем добавления дестабилизирующих агентов, таких как формамид. Для селективной или специфической гибридизации положительный сигнал должен по крайней мере в два раза превышать фон, предпочтительно - в 10 раз выше фоновой гибридизации. Примеры жестких условий гибридизации могут быть следующими: 50% формамид, 5x ССР (стандартный солевой раствор, англ. «SSC») и 1% ДСН, инкубирование при температуре 42°C, или 5x ССР, 1% ДСН, инкубирование при температуре 65°C, с промывкой в 0,2x ССР и 0,1% ДСН при температуре 65°C. [0042] The phrase “stringent hybridization conditions” refers to the conditions under which a probe will hybridize to its target subsequence, typically in a complex mixture of nucleic acids, but not to other sequences. The stringent conditions depend on the sequence and will be different in different circumstances. Longer sequences hybridize specifically at higher temperatures. A detailed guide to nucleic acid hybridization can be found in Tijssen, Techniques in Biochemistry and Molecular Biology - Hybridization with Nucleic Probes, “Overview of principles of hybridization and the strategy of nucleic acid assays” (1993). Typically, stringent conditions are selected that are approximately 5-10°C lower than the melting point temperature (Tm) for a particular sequence at a particular ionic strength and pH. Tm is the temperature (at a certain ionic strength, pH and nucleic acid concentration) at which 50% of the probes complementary to the target hybridize with the target sequence at equilibrium (since the target sequences are present in excess, then at Tm 50% probes are occupied at equilibrium). Harsh conditions can also be achieved by adding destabilizing agents such as formamide. For selective or specific hybridization, the positive signal must be at least twice the background, preferably 10 times the background hybridization. Examples of stringent hybridization conditions may be: 50% formamide, 5x SSC and 1% SDS, incubated at 42°C, or 5x SSR, 1% SDS, incubated at 65°C C, with a wash in 0.2x SCP and 0.1% SDS at 65°C.
[0043] Нуклеиновые кислоты, которые не гибридизуются друг с другом в жестких условиях, все же по существу идентичны, если полипептиды, которые кодируются ими, по существу идентичны. Это происходит, например, когда создается копия нуклеиновой кислоты с использованием максимальной вырожденности кодонов, разрешенной генетическим кодом. В таких случаях нуклеиновые кислоты обычно гибридизуются в умеренно жестких условиях гибридизации. Примеры «умеренно жестких условий гибридизации» включают в себя гибридизацию в буфере, содержащем 40% формамида, 1 М NaCl, 1% ДСН при температуре 37°C и промывку в 1X ССР при температуре 45°C. Положительная гибридизация представляет собой такую, которая по меньшей мере вдвое превышает фоновую гибридизацию. Рядовой специалист в данной области техники легко поймет, что можно использовать альтернативные условия гибридизации и промывки для обеспечения условий похожей жесткости. Дополнительные рекомендации по определению параметров гибридизации представлены в многочисленных ссылках, например, Current Protocols in Molecular Biology, ed. Ausubel, et al., см. выше. [0043] Nucleic acids that do not hybridize to each other under stringent conditions are still substantially identical if the polypeptides they encode are substantially identical. This occurs, for example, when a copy of a nucleic acid is made using the maximum codon degeneracy allowed by the genetic code. In such cases, the nucleic acids are typically hybridized under moderately stringent hybridization conditions. Examples of “moderately stringent hybridization conditions” include hybridization in a buffer containing 40% formamide, 1 M NaCl, 1% SDS at 37°C and a wash in 1X SCP at 45°C. Positive hybridization is one that is at least twice the background hybridization. One of ordinary skill in the art will readily appreciate that alternative hybridization and washing conditions can be used to provide conditions of similar stringency. Additional guidance on determining hybridization parameters is provided in numerous references, for example, Current Protocols in Molecular Biology, ed. Ausubel, et al., supra.
[0044] Термин «ген» означает сегмент ДНК, участвующий в производстве белка; он включает в себя области, предшествующие и следующие за кодирующей областью (лидирующую и отстающую), а также промежуточные последовательности (интроны) между отдельными кодирующими сегментами (экзонами). Лидирующая и отстающая области, так же как и интроны, включают в себя регуляторные элементы, которые необходимы во время транскрипции и трансляции гена. Кроме того, «белковый генный продукт» представляет собой белок, экспрессируемый конкретным геном. [0044] The term "gene" means a segment of DNA involved in the production of a protein; it includes the regions preceding and following the coding region (leading and lagging), as well as intermediate sequences (introns) between individual coding segments (exons). Leading and lagging regions, as well as introns, include regulatory elements that are required during gene transcription and translation. In addition, a “protein gene product” is a protein expressed by a particular gene.
[0045] Слово «экспрессия» или «экспрессируемый», используемое в контексте данного документа по отношению к гену, означает продукт транскрипции и (или) трансляции этого гена. Уровень экспрессии молекулы ДНК в клетке может быть определен либо на основании количества соответствующей иРНК, которая присутствует в клетке, либо на основании количества белка, кодируемого этой ДНК, продуцируемого клеткой. Уровень экспрессии некодирующих молекул нуклеиновых кислот (например, егРНК) может быть определен стандартными методами ПЦР или нозерн-блоттингом, хорошо известными в данной области техники. См. Sambrook et al., 1989 Molecular Cloning: A Laboratory Manual, 18.1-18.88. [0045] The word "expression" or "expressed" as used herein in relation to a gene means the product of transcription and/or translation of that gene. The level of expression of a DNA molecule in a cell can be determined either based on the amount of corresponding mRNA that is present in the cell or based on the amount of protein encoded by that DNA produced by the cell. The level of expression of non-coding nucleic acid molecules (eg, egRNA) can be determined by standard PCR or Northern blotting methods well known in the art. See Sambrook et al., 1989 Molecular Cloning: A Laboratory Manual, 18.1-18.88.
[0046] Термин «регуляторная последовательность транскрипции», употребляемый в контексте данного документа, относится к сегменту ДНК, который способен повышать или понижать транскрипцию (например, экспрессию) конкретного гена в организме. Неограничивающие примеры регуляторных последовательностей транскрипции включают в себя промоторы, энхансеры и сайленсеры. [0046] The term “transcription regulatory sequence” as used herein refers to a segment of DNA that is capable of increasing or decreasing transcription (eg, expression) of a particular gene in an organism. Non-limiting examples of transcriptional regulatory sequences include promoters, enhancers, and silencers.
[0047] Термины «сайт начала транскрипции» и «сайт инициации транскрипции» могут употребляться взаимозаменяемо для обозначения в контексте данного документа 5'-конца последовательности гена (например, последовательности ДНК), где РНК-полимераза (например, ДНК-направленная РНК-полимераза) начинает синтез транскрипта РНК. Сайт начала транскрипции может быть первым нуклеотидом транскрибируемой последовательности ДНК, где РНК-полимераза начинает синтезировать транскрипт РНК. Квалифицированный специалист в данной области техники может определить сайт начала транскрипции с помощью рутинных экспериментов и анализа, например, путем выполнения анализа по «прерванной транскрипции», или с помощью определений в соответствии с базой данных FANTOM5. [0047] The terms "transcription start site" and "transcription start site" may be used interchangeably to refer, as used herein, to the 5' end of a gene sequence (e.g., DNA sequence) where the RNA polymerase (e.g., DNA-directed RNA polymerase ) begins the synthesis of the RNA transcript. The transcription start site may be the first nucleotide of the transcribed DNA sequence where RNA polymerase begins to synthesize the RNA transcript. One skilled in the art can determine the transcription start site through routine experimentation and analysis, for example, by performing an “interrupted transcription” analysis, or by using definitions in accordance with the FANTOM5 database.
[0048] Термин «промотор», употребляемый в контексте данного документа, относится к области ДНК, которая инициирует транскрипцию конкретного гена. Промоторы обычно расположены рядом с сайтом начала транскрипции гена, выше гена и на одной и той же цепи ДНК (т.е. в положении 5' на смысловой цепи ДНК). Промоторы могут иметь длину от около 100 до около 1000 пар оснований. [0048] The term "promoter" as used herein refers to a region of DNA that initiates transcription of a particular gene. Promoters are typically located near the transcription start site of a gene, upstream of the gene, and on the same DNA strand (i.e., position 5' on the sense DNA strand). Promoters can be from about 100 to about 1000 base pairs in length.
[0049] Термин «энхансер», употребляемый в контексте данного документа, относится к области ДНК, которая может быть связана белками (например, факторами транскрипции) для увеличения вероятности того, что произойдет транскрипция гена. Энхансеры могут иметь длину от около 50 до около 1500 пар оснований. Энхансеры могут быть расположены ниже или выше сайта инициации транскрипции, который они регулируют, и могут находиться на расстоянии нескольких сотен пар оснований от сайта инициации транскрипции. [0049] The term "enhancer" as used herein refers to a region of DNA that can be bound by proteins (eg, transcription factors) to increase the likelihood that transcription of a gene will occur. Enhancers can range in length from about 50 to about 1500 base pairs. Enhancers can be located downstream or upstream of the transcription start site they regulate and can be several hundred base pairs away from the transcription start site.
[0050] Термин «сайленсер», употребляемый в контексте данного документа, относится к последовательности ДНК, которая способна связывать факторы регуляции транскрипции, известные как репрессоры, тем самым отрицательно влияя на транскрипцию гена. Последовательности сайленсеров ДНК могут быть обнаружены во многих различных положениях по всей длине ДНК, включая, но не ограничиваясь этим, перед целевым геном, в отношении которого они действуют путем подавления транскрипции гена (например, вызывая сайленсинг экспрессии гена). [0050] The term "silencer" as used herein refers to a DNA sequence that is capable of binding transcription regulatory factors known as repressors, thereby negatively affecting the transcription of a gene. DNA silencer sequences can be found at many different positions along the length of DNA, including, but not limited to, upstream of the target gene at which they act by inhibiting gene transcription (eg, causing silencing of gene expression).
[0051] Термин «гидовая РНК» или «гРНК», употребляемый в контексте данного документа, относится к любой полинуклеотидной последовательности, имеющей достаточную комплементарность с целевой полинуклеотидной последовательностью для гибридизации с целевой последовательностью и прямого последовательность-специфичного связывания комплекса CRISPR с целевой последовательностью. В аспектах данного изобретения степень комплементарности между гидовой последовательностью и соответствующей ей целевой последовательностью при оптимальном выравнивании с использованием подходящего алгоритма выравнивания составляет около или более чем около 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97,5%, 99%, или более. [0051] The term “guide RNA” or “gRNA” as used herein refers to any polynucleotide sequence having sufficient complementarity to a target polynucleotide sequence to hybridize to the target sequence and directly bind the CRISPR complex to the target sequence in a sequence-specific manner. In aspects of the present invention, the degree of complementarity between a guide sequence and its corresponding target sequence when optimally aligned using a suitable alignment algorithm is about or greater than about 50%, 60%, 75%, 80%, 85%, 90%, 95%, 97 .5%, 99%, or more.
[0052] В вариантах реализации данного изобретения полинуклеотид (например, гРНК) представляет собой одноцепочечную рибонуклеиновую кислоту. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 или более остатков нуклеиновой кислоты. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину от 10 до 30 остатков нуклеиновой кислоты. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину 20 остатков нуклеиновой кислоты. В аспектах данного изобретения длина полинуклеотида (например, гРНК) может составлять по меньшей мере 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 или более остатков нуклеиновой кислоты или остатков сахара в длину. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину от 5 до 50, от 10 до 50, от 15 до 50, от 20 до 50, от 25 до 50, от 30 до 50, от 35 до 50, от 40 до 50, от 45 до 50, от 5 до 75, от 10 до 75, от 15 до 75, 20 до 75, от 25 до 75, от 30 до 75, от 35 до 75, от 40 до 75, от 45 до 75, от 50 до 75, от 55 до 75, от 60 до 75, от 65 до 75, от 70 до 75, от 5 до 100, от 10 до 100, От 15 до 100, от 20 до 100, от 25 до 100, от 30 до 100, от 35 до 100, от 40 до 100, от 45 до 100, от 50 до 100, от 55 до 100, от 60 до 100, от 65 до 100, от 70 до 100, 75 до 100, от 80 до 100, от 85 до 100, от 90 до 100, от 95 до 100 или более остатков. В аспектах данного изобретения полинуклеотид (например, гРНК) имеет длину от 10 до 15, от 10 до 20, от 10 до 30, от 10 до 40 или от 10 до 50 остатков. [0052] In embodiments of the present invention, the polynucleotide (eg, gRNA) is a single-stranded ribonucleic acid. In aspects of the present invention, the polynucleotide (eg, gRNA) is 10, 20, 30, 40, 50, 60, 70, 80, 90, 100 or more nucleic acid residues in length. In aspects of the present invention, the polynucleotide (eg, gRNA) has a length of from 10 to 30 nucleic acid residues. In aspects of the present invention, the polynucleotide (eg, gRNA) is 20 nucleic acid residues in length. In aspects of the invention, the length of the polynucleotide (e.g., gRNA) may be at least 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21, 22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32, 33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43, 44, 45, 46, 47, 48, 49, 50, 51, 52, 53, 54, 55, 56, 57, 58, 59, 60, 61, 62, 63, 64, 65, 66, 67, 68, 69, 70, 71, 72, 73, 74, 75, 76, 77, 78, 79, 80, 81, 82, 83, 84, 85, 86, 87, 88, 89, 90, 91, 92, 93, 94, 95, 96, 97, 98, 99, 100 or more nucleic acid residues or sugar residues in length. In aspects of the invention, the polynucleotide (e.g., gRNA) has a length of 5 to 50, 10 to 50, 15 to 50, 20 to 50, 25 to 50, 30 to 50, 35 to 50, 40 to 50, from 45 to 50, from 5 to 75, from 10 to 75, from 15 to 75, 20 to 75, from 25 to 75, from 30 to 75, from 35 to 75, from 40 to 75, from 45 to 75 , from 50 to 75, from 55 to 75, from 60 to 75, from 65 to 75, from 70 to 75, from 5 to 100, from 10 to 100, from 15 to 100, from 20 to 100, from 25 to 100 , from 30 to 100, from 35 to 100, from 40 to 100, from 45 to 100, from 50 to 100, from 55 to 100, from 60 to 100, from 65 to 100, from 70 to 100, 75 to 100, 80 to 100, 85 to 100, 90 to 100, 95 to 100 or more residues. In aspects of the present invention, the polynucleotide (eg, gRNA) has a length of 10 to 15, 10 to 20, 10 to 30, 10 to 40, or 10 to 50 residues.
[0053] Термин «аминокислота» относится к встречающимся в природе и синтетическим аминокислотам, а также к аналогам аминокислот и миметикам аминокислот, которые действуют аналогично встречающимся в природе аминокислотам. Встречающиеся в природе аминокислоты представляют собой такие аминокислоты, которые кодируются генетическим кодом, а также те аминокислоты, которые позже модифицируются, например, гидроксипролин, γ-карбоксиглутамат и О-фосфосерин. Аналоги аминокислот относятся к соединениям, которые имеют ту же базовую химическую структуру, что и встречающиеся в природе аминокислоты, то есть α-углерод, связанный с водородом, карбоксильную группу, аминогруппу и группу R, например, гомосерин, норлейцин, сульфоксид метионина, метилсульфоний метионина. Такие аналоги имеют модифицированные группы R (например, норлейцин) или модифицированные пептидные остовы, но сохраняют ту же базовую химическую структуру, что и встречающаяся в природе аминокислота. Миметики аминокислот относятся к химическим соединениям, которые имеют структуру, отличную от общей химической структуры аминокислоты, но которые действуют путем, похожим на таковой для встречающихся в природе аминокислот. Термины «не встречающаяся в природе аминокислота» и «неприродная аминокислота» относятся к аналогам аминокислот, синтетическим аминокислотам и миметикам аминокислот, которые не встречаются в природе. [0053] The term “amino acid” refers to naturally occurring and synthetic amino acids, as well as amino acid analogs and amino acid mimetics, which act similarly to naturally occurring amino acids. Naturally occurring amino acids are those amino acids that are encoded by the genetic code, as well as those amino acids that are later modified, such as hydroxyproline, γ-carboxyglutamate, and O-phosphoserine. Amino acid analogues refer to compounds that have the same basic chemical structure as naturally occurring amino acids, i.e., an α-carbon bonded to a hydrogen, a carboxyl group, an amino group, and an R group, e.g., homoserine, norleucine, methionine sulfoxide, methionine methylsulfonium . Such analogues have modified R groups (eg, norleucine) or modified peptide backbones, but retain the same basic chemical structure as the naturally occurring amino acid. Amino acid mimetics refer to chemical compounds that have a structure different from the general chemical structure of an amino acid, but that act in a manner similar to that of naturally occurring amino acids. The terms “non-naturally occurring amino acid” and “non-naturally occurring amino acid” refer to amino acid analogues, synthetic amino acids and amino acid mimetics that do not occur in nature.
[0054] Аминокислоты могут обозначаться в данном документе либо их общеизвестными трехбуквенными символами, либо однобуквенными символами, рекомендованными Комиссией по биохимической номенклатуре IUPAC-IUB. Нуклеотиды также могут обозначаться их общепринятыми однобуквенными кодами. [0054] Amino acids may be designated herein by either their commonly known three-letter symbols or the single-letter symbols recommended by the IUPAC-IUB Commission on Biochemical Nomenclature. Nucleotides may also be designated by their common single-letter codes.
[0055] Термины «полипептид», «пептид» и «белок» употребляются в контексте данного документа взаимозаменяемо для обозначения полимера из аминокислотных остатков, при этом полимер, в аспектах данного изобретения, может быть конъюгирован с фрагментом, который не состоит из аминокислот. Данные термины применяются к аминокислотным полимерам, в которых один или несколько аминокислотных остатков являются искусственным химическим миметиком соответствующей встречающейся в природе аминокислоты, а также к встречающимся в природе аминокислотным полимерам и не встречающимся в природе аминокислотным полимерам. Термин «слитый белок» относится к химерному белку, кодирующему две или более отдельных белковых последовательностей, которые рекомбинантно экспрессируются как единый фрагмент. [0055] The terms "polypeptide", "peptide" and "protein" are used interchangeably herein to refer to a polymer of amino acid residues, wherein the polymer, in aspects of the present invention, may be conjugated to a moiety that is not composed of amino acids. These terms apply to amino acid polymers in which one or more amino acid residues are an artificial chemical mimetic of the corresponding naturally occurring amino acid, as well as to naturally occurring amino acid polymers and non-naturally occurring amino acid polymers. The term "fusion protein" refers to a chimeric protein encoding two or more separate protein sequences that are recombinantly expressed as a single fragment.
[0056] Термин «консервативно модифицированные варианты» применяется к последовательностям как аминокислот, так и нуклеиновых кислот. Что касается конкретных последовательностей нуклеиновых кислот, «консервативно модифицированные варианты» относятся к тем нуклеиновым кислотам, которые кодируют идентичные или практически идентичные аминокислотные последовательности. Из-за вырожденности генетического кода любой данный белок будет кодироваться рядом последовательностей нуклеиновых кислот. Например, все кодоны GCA, GCC, GCG и GCU кодируют аминокислоту аланин. Таким образом, в каждом положении, в котором аланин определяется кодоном, этот кодон может быть изменен на любой из соответствующих описанных кодонов без изменения кодируемого полипептида. Такие вариации нуклеиновой кислоты представляют собой «молчащие вариации», которые представляют собой один из видов консервативно модифицированных вариаций. Каждая последовательность нуклеиновой кислоты в данном документе, которая кодирует полипептид, также описывает все возможные молчащие вариации нуклеиновой кислоты. Специалист поймет, что каждый кодон в нуклеиновой кислоте (за исключением AUG, который обычно является единственным кодоном для метионина, и TGG, который обычно является единственным кодоном для триптофана) может быть модифицирован с образованием функционально идентичной молекулы. Соответственно, присутствие каждой молчащей вариации нуклеиновой кислоты, кодирующей полипептид, подразумевается в каждой описанной последовательности. [0056]The term "conservatively modified options" applies to both amino acid and nucleic acid sequences. With respect to specific nucleic acid sequences, “conservatively modified variants” refer to those nucleic acids that encode identical or substantially identical amino acid sequences. Due to the degeneracy of the genetic code, any given protein will be encoded by a number of nucleic acid sequences. For example, the codons GCA, GCC, GCG, and GCU all code for the amino acid alanine. Thus, at each position at which alanine is specified by a codon, that codon can be changed to any of the corresponding codons described without changing the encoded polypeptide. Such nucleic acid variations are “silent variations,” which are a type of conservatively modified variation. Each nucleic acid sequence herein that encodes a polypeptide also describes all possible silent variations of the nucleic acid. One skilled in the art will appreciate that every codon in a nucleic acid (except AUG, which is typically the only codon for methionine, and TGG, which is typically the only codon for tryptophan) can be modified to form a functionally identical molecule. Accordingly, the presence of each silent variation of the nucleic acid encoding the polypeptide is implied in each sequence described.
[0057] Что касается аминокислотных последовательностей, специалист в данной области техники поймет, что отдельные замены, делеции или добавления к последовательности нуклеиновой кислоты, пептида, полипептида или белка, которые изменяют, добавляют или удаляют одну аминокислоту или небольшой процент аминокислот в кодируемой последовательность, создают тем самым «консервативно модифицированный вариант», в котором изменение приводит к замене аминокислоты на химически подобную аминокислоту. Таблицы консервативных замен, содержащие функционально похожие аминокислоты, хорошо известны в данной области техники. Такие консервативно модифицированные варианты дополняют и не исключают полиморфные варианты, межвидовые гомологи и аллели из данного описания. Каждая из следующих восьми групп содержит аминокислоты, которые являются консервативными заменами друг друга: (1) аланин (A), глицин (G); (2) аспарагиновая кислота (D), глутаминовая кислота (E); (3) аспарагин (N), глутамин (Q); (4) аргинин (R), лизин (K); (5) изолейцин (I), лейцин (L), метионин (M), валин (V); (6) фенилаланин (F), тирозин (Y), триптофан (W); (7) серин (S), треонин (T); и (8) цистеин (C), метионин (M) (см., например, Creighton, Proteins (1984)). [0057] With respect to amino acid sequences, one skilled in the art will understand that single substitutions, deletions, or additions to a nucleic acid, peptide, polypeptide, or protein sequence that alter, add, or delete one amino acid or a small percentage of amino acids in the encoded sequence create thereby a “conservatively modified variant” in which the change results in the replacement of an amino acid with a chemically similar amino acid. Conservative substitution tables containing functionally similar amino acids are well known in the art. Such conservatively modified variants are in addition to and do not exclude polymorphic variants, interspecific homologs and alleles from this description. Each of the following eight groups contains amino acids that are conservative substitutions for each other: (1) alanine (A), glycine (G); (2) aspartic acid (D), glutamic acid (E); (3) asparagine (N), glutamine (Q); (4) arginine (R), lysine (K); (5) isoleucine (I), leucine (L), methionine (M), valine (V); (6) phenylalanine (F), tyrosine (Y), tryptophan (W); (7) serine (S), threonine (T); and (8) cysteine (C), methionine (M) (see, for example, Creighton, Proteins (1984)).
[0058] «Процент идентичности последовательностей» определяется путем сравнения двух оптимально выровненных последовательностей в окне сравнения, при этом часть полинуклеотидной или полипептидной последовательности в окне сравнения может включать в себя добавления или делеции (т.е. гэпы) по сравнению с референсной последовательностью (которая не содержит добавлений или делеций) для оптимального выравнивания двух последовательностей. Указанный процент рассчитывается путем определения количества положений, в которых идентичное основание нуклеиновой кислоты или аминокислотный остаток встречается в обеих последовательностях, чтобы получить количество совпадающих положений, путем деления количества совпадающих положений на общее количество положений в окне сравнения и умножением результата на 100, чтобы получить процент идентичности последовательностей. [0058] "Percentage sequence identity" is determined by comparing two optimally aligned sequences in the comparison window, wherein a portion of the polynucleotide or polypeptide sequence in the comparison window may include additions or deletions (i.e., gaps) compared to the reference sequence (which contains no additions or deletions) for optimal alignment of two sequences. This percentage is calculated by determining the number of positions at which an identical nucleic acid base or amino acid residue occurs in both sequences to obtain the number of matching positions, dividing the number of matching positions by the total number of positions in the comparison window and multiplying the result by 100 to obtain the percent identity sequences.
[0059] Термины «идентичный» или процент «идентичности» в контексте двух или более нуклеиновых кислот или полипептидных последовательностей относятся к двум или более последовательностям или подпоследовательностям, которые являются одинаковыми или имеют определенный процент аминокислотных остатков или нуклеотидов, которые являются одинаковыми (т.е. идентичность составляет около 60%, предпочтительно 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или более высокая идентичность в указанной области при сравнении и выравнивании для максимального соответствия в окне сравнения или в назначенной области) при измерении с использованием алгоритмов сравнения последовательностей BLAST или BLAST 2.0 с параметрами по умолчанию, которые описаны ниже, или путем ручного выравнивания и визуального осмотра (см., например, веб-сайт NCBI ncbi.nlm.nih.gov/BLAST/ или ему подобные). Такие последовательности далее именуются «по существу идентичными». Данное определение также относится или может применяться к комплементу тестовой последовательности. Данное определение также включает последовательности с делециями и (или) добавлениями, а также последовательности с заменами. Как описано ниже, предпочтительные алгоритмы могут учитывать гэпы и тому подобное. Предпочтительно, идентичность существует в области, длина которой составляет, по меньшей мере, около 25 аминокислот или нуклеотидов, или, более предпочтительно, в области, длина которой составляет 50-100 аминокислот или нуклеотидов. [0059] The terms “identical” or percentage of “identity” in the context of two or more nucleic acid or polypeptide sequences refer to two or more sequences or subsequences that are the same or have a certain percentage of amino acid residues or nucleotides that are the same (i.e. .identity is about 60%, preferably 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% or better identity in the specified region when compared and aligned for maximum match in the comparison window or in the assigned region) when measured using the BLAST or BLAST 2.0 sequence comparison algorithms with the default parameters described below, or by manual alignment and visual inspection (see, for example, the NCBI website ncbi.nlm.nih.gov/BLAST/ or similar). Such sequences are hereinafter referred to as "substantially identical". This definition also applies or may apply to the complement of the test sequence. This definition also includes sequences with deletions and/or additions, as well as sequences with substitutions. As described below, preferred algorithms may take into account gaps and the like. Preferably, the identity exists in a region that is at least about 25 amino acids or nucleotides in length, or more preferably in a region that is 50-100 amino acids or nucleotides in length.
[0060] «Положение» аминокислоты или нуклеотидного основания обозначается числом, которое последовательно идентифицирует каждую аминокислоту (или нуклеотидное основание) в референсной последовательности на основе ее положения относительно N-конца (или 5'-конца). Из-за делеций, вставок, усечений, слияний и тому подобного, которые необходимо учитывать при определении оптимального выравнивания, в целом номер аминокислотного остатка в тестовой последовательности, определяемый простым подсчетом от N-конца, не обязательно будет тем же, что и номер соответствующего положения в референсной последовательности. Например, в случае, когда вариант имеет делецию относительно выровненной референсной последовательности, в этом варианте в сайте делеции не будет аминокислоты, которая соответствует положению в референсной последовательности. Если имеется вставка в выровненной референсной последовательности, эта вставка не будет соответствовать нумерованному положению аминокислоты в референсной последовательности. В случае усечения или слияния могут быть отрезки аминокислот либо в референсной, либо в выровненной последовательности, которые не соответствуют какой-либо аминокислоте в соответствующей последовательности. [0060] The "position" of an amino acid or nucleotide base is designated by a number that sequentially identifies each amino acid (or nucleotide base) in the reference sequence based on its position relative to the N-terminus (or 5'-end). Due to deletions, insertions, truncations, fusions and the like that must be taken into account when determining the optimal alignment, in general the amino acid residue number in the test sequence, determined by simple counting from the N terminus, will not necessarily be the same as the corresponding position number in the reference sequence. For example, in the case where a variant has a deletion relative to an aligned reference sequence, the variant will not have an amino acid at the deletion site that corresponds to a position in the reference sequence. If there is an insertion in an aligned reference sequence, that insertion will not correspond to the numbered amino acid position in the reference sequence. In the case of truncation or fusion, there may be stretches of amino acids in either the reference or aligned sequence that do not match any amino acid in the corresponding sequence.
[0061] Термины «пронумерованная со ссылкой на» или «соответствующая» при использовании в контексте нумерации конкретной аминокислотной или полинуклеотидной последовательности относятся к нумерации остатков указанной референсной последовательности, когда данная аминокислотная или полинуклеотидная последовательность сравнивается с референсной последовательностью. [0061] The terms “numbered by reference to” or “corresponding to” when used in the context of numbering a particular amino acid or polynucleotide sequence refer to the numbering of residues of the specified reference sequence when the amino acid or polynucleotide sequence is compared to the reference sequence.
[0062] Для конкретных белков, описанных в данном документе (например, KRAB, dCas9, Dnmt3A, Dnmt3L), названный белок включает в себя любую из встречающихся в природе форм белка, либо варианты или гомологи, которые сохраняют активность названного белка (например, в пределах по меньшей мере 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с нативным белком). В аспектах данного изобретения варианты или гомологи по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с формой, встречающейся в природе. В аспектах данного изобретения белок представляет собой белок, идентифицированный с помощью ссылки на его последовательность в NCBI. В аспектах данного изобретения белок представляет собой белок, идентифицированный с помощью ссылки на его последовательность в NCBI, или по функциональному фрагменту такой последовательности, или по ее гомологу. [0062] For the specific proteins described herein (e.g., KRAB, dCas9, Dnmt3A, Dnmt3L), the named protein includes any of the naturally occurring forms of the protein, or variants or homologues that retain the activity of the named protein (e.g., in within at least 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% or 100% activity compared to the native protein). In aspects of the invention, the variants or homologues are at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical in amino acid sequence over the entire length of the sequence, or over a region of sequence (e.g., over a contiguous region of 50, 100, 150, or 200 amino acids in length) compared to form found in nature. In aspects of the present invention, the protein is a protein identified by reference to its sequence in NCBI. In aspects of the present invention, a protein is a protein identified by reference to its NCBI sequence, or a functional fragment of such a sequence, or a homologue thereof.
[0063] Термин «домен, связанный с боксом » или «домен KRAB», употребляемый в контексте данного документа, относится к категории доменов, репрессирующих транскрипцию, которые присутствуют примерно в 400 человеческих факторах транскрипции, основанных на белке «цинковые пальцы». Домены KRAB обычно включают в себя от около 45 до около 75 аминокислотных остатков. Описание доменов KRAB, включительно с их функцией и применением, можно найти, например, в Ecco, G., Imbeault, M., Trono, D., KRAB zinc finger proteins, Development 144, 2017; Lambert et al. The human transcription factors, Cell 172, 2018; Gilbert et al., Cell (2013); и Gilbert et al., Cell (2014), все из которых включены в данный документ посредством ссылки в полном объеме. В аспектах данного изобретения домен KRAB представляет собой домен KRAB Kox 1. В аспектах данного изобретения домен KRAB включает в себя последовательность, изложенную в SEQ ID NO: 16. В аспектах данного изобретения домен KRAB представляет собой последовательность с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 16. В аспектах данного изобретения домен KRAB включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 16. [0063] The term "box-related domain" " or "KRAB domain", as used herein, refers to a category of transcription repressive domains that are present in approximately 400 human zinc finger protein-based transcription factors. KRAB domains typically comprise from about 45 to about 75 amino acid residues. A description of the KRAB domains, including their function and application, can be found, for example, in Ecco, G., Imbeault, M., Trono, D., KRAB zinc finger proteins, Development 144, 2017; Lambert et al. The human transcription factors, Cell 172, 2018; Gilbert et al., Cell (2013); and Gilbert et al., Cell (2014), all of which are incorporated herein by reference in their entirety. In aspects of the present invention, the KRAB domain is a Kox 1 KRAB domain. In aspects of the present invention, the KRAB domain includes the sequence set forth in SEQ ID NO: 16. In aspects of the present invention, the KRAB domain is the sequence set forth in SEQ ID NO: 16. In aspects of the present invention, the KRAB domain includes an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 16. In aspects of the present invention, the KRAB domain includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 16. In aspects of the present invention, the KRAB domain includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 16. In aspects of the present invention, the KRAB domain includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 16. In aspects of the present invention, the KRAB domain includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 16. % identical to the sequence of SEQ ID NO: 16. In aspects of the present invention, the KRAB domain includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 16.
[0064] Термин «метилтрансфераза ДНК», употребляемый в контексте данного документа, относится к ферменту, который катализирует перенос метильной группы на ДНК. Неограничивающие примеры метилтрансфераз ДНК включают в себя Dnmt1, Dnmt3A, Dnmt3B и Dnmt3L. В аспектах данного изобретения метилтрансфераза ДНК представляет собой бактериальную цитозин-метилтрансферазу и (или) бактериальную нецитозин-метилтрансферазу. В зависимости от конкретной метилтрансферазы ДНК метилируются разные участки ДНК. Например, Dnmt3A для метилирования обычно нацелен на динуклеотиды CpG. Посредством метилирования ДНК метилтрансферазы ДНК могут изменять активность сегмента ДНК (например, экспрессию гена) без изменения последовательности ДНК. В аспектах данного изобретения метилирование ДНК приводит к репрессии транскрипции гена и (или) модуляции факторов транскрипции, чувствительных к метилированию, или CTCF. Как описано в данном документе, слитые белки могут включать в себя одну или несколько (например, две) метилтрансфераз ДНК. Когда метилтрансфераза ДНК включена как часть слитого белка, метилтрансфераза ДНК может называться «доменом метилтрансферазы ДНК». В аспектах данного изобретения домен метилтрансферазы ДНК включает в себя одну или несколько метилтрансфераз ДНК. В аспектах данного изобретения домен метилтрансферазы ДНК включает в себя две метилтрансферазы ДНК. В аспектах данного изобретения домен метилтрансферазы ДНК представляет собой Dnmt3A. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК представляет собой Dnmt3L. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения домен метилтрансферазы ДНК включает в себя Dnmt3A и Dnmt3L. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 33. Описание структуры домена Dnmt3A-3L и его применения можно найти, например, в Siddique et al, Targeted methylation and gene silencing of VEGF-A in human cells by using a designed Dnmt3a-Dnmt3L single-chain fusion protein with increased DNA methylation activity, J. Mol. Biol. 425, 2013, и в Stepper et al, Efficient targeted DNA methylation with chimeric dCas9-Dnmt3a-Dnmt3L methyltransferase, Nucleic Acids Res. 45, 2017, которые полностью и для всех целей включены в данный документ посредством ссылки. [0064] The term "DNA methyltransferase" as used herein refers to an enzyme that catalyzes the transfer of a methyl group to DNA. Non-limiting examples of DNA methyltransferases include Dnmt1, Dnmt3A, Dnmt3B and Dnmt3L. In aspects of the present invention, the DNA methyltransferase is a bacterial cytosine methyltransferase and/or a bacterial nocytosine methyltransferase. Depending on the specific DNA methyltransferase, different parts of the DNA are methylated. For example, Dnmt3A typically targets CpG dinucleotides for methylation. Through DNA methylation, DNA methyltransferases can change the activity of a segment of DNA (such as gene expression) without changing the DNA sequence. In aspects of the present invention, DNA methylation results in repression of gene transcription and/or modulation of methylation-sensitive transcription factors, or CTCFs. As described herein, fusion proteins may include one or more (eg, two) DNA methyltransferases. When a DNA methyltransferase is included as part of a fusion protein, the DNA methyltransferase may be referred to as a “DNA methyltransferase domain.” In aspects of the present invention, a DNA methyltransferase domain includes one or more DNA methyltransferases. In aspects of the present invention, the DNA methyltransferase domain includes two DNA methyltransferases. In aspects of the present invention, the DNA methyltransferase domain is Dnmt3A. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70 %, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98%, is 99% or 100% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 26. In aspects of this of the invention, the DNA methyltransferase domain has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 26 In aspects of the present invention, the DNA methyltransferase domain is Dnmt3L. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence of SEQ ID NO: 28. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70 %, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98%, is 99% or 100% identical to the sequence of SEQ ID NO: 28. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 28. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 28. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 28. In aspects of this of the invention, the DNA methyltransferase domain has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 28. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 28 In aspects of the present invention, the DNA methyltransferase domain includes Dnmt3A and Dnmt3L. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence of SEQ ID NO: 33. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70 %, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98%, is 99% or 100% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 33. In aspects of this of the invention, the DNA methyltransferase domain has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 33 A description of the structure of the Dnmt3A-3L domain and its application can be found, for example, in Siddique et al, Targeted methylation and gene silencing of VEGF-A in human cells by using a designed Dnmt3a-Dnmt3L single-chain fusion protein with increased DNA methylation activity, J. Mol. Biol. 425, 2013, and in Stepper et al, Efficient targeted DNA methylation with chimeric dCas9-Dnmt3a-Dnmt3L methyltransferase, Nucleic Acids Res. 45, 2017, which are incorporated herein by reference in their entirety and for all purposes.
[0065] Белки «Dnmt3A», «Dnmt3a», «ДНК (цитозин-5)-метилтрансфераза 3A» или «метилтрансфераза ДНК 3a», указанные в данном документе, включают в себя любую из рекомбинантных или встречающихся в природе форм фермента Dnmt3A, либо его варианты или гомологи, которые сохраняют активность фермента Dnmt3A (например, в пределах по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Dnmt3A). В аспектах данного изобретения варианты или гомологи по меньшей мере на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Dnmt3A, встречающимся в природе. В аспектах данного изобретения белок Dnmt3A по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q9Y6K1, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения полипептид Dnmt3A кодируется последовательностью нуклеиновой кислоты, идентифицированной по референсной последовательности NCBI с номером доступа NM_022552, по гомологам или по функциональным фрагментам последовательности с данным номером доступа. В аспектах данного изобретения Dnmt3A включает в себя последовательность, изложенную в SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A представляет собой последовательность, изложенную в SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения домен метилтрансферазы ДНК имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 26. В аспектах данного изобретения Dnmt3A имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 26. [0065] The "Dnmt3A", "Dnmt3a", "DNA (cytosine-5) methyltransferase 3A" or "DNA methyltransferase 3a" proteins referred to herein include any of the recombinant or naturally occurring forms of the Dnmt3A enzyme, or variants or homologs thereof that retain Dnmt3A enzyme activity (e.g., to the extent of at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92% , 93%, 94%, 95%, 96%, 97%, 98%, 99% or 100% activity compared to Dnmt3A). In aspects of the present invention, variants or homologs are at least 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical in amino acid sequence over the entire length of the sequence, or at a portion of the sequence ( e.g., over a contiguous stretch of 50, 100, 150, or 200 amino acids in length) compared to the naturally occurring Dnmt3A protein. In aspects of the present invention, the Dnmt3A protein is substantially identical to the protein identified by UniProt accession number Q9Y6K1, or a variant or homolog substantially identical to the protein of that accession number. In aspects of the present invention, the Dnmt3A polypeptide is encoded by a nucleic acid sequence identified by the NCBI reference sequence accession number NM_022552, homologs, or functional fragments of the sequence with this accession number. In aspects of the present invention, Dnmt3A includes the sequence set forth in SEQ ID NO: 26. In aspects of the present invention, Dnmt3A comprises the sequence set forth in SEQ ID NO: 26. In aspects of the present invention, Dnmt3A has an amino acid sequence that is at least 50 %, by 55%, by 60%, by 65%, by 70%, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, is 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 75% identical to SEQ ID NO: 26. identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, the DNA methyltransferase domain has an amino acid sequence that is at least is at least 85% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, Dnmt3A has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 26. In aspects of the present invention, Dnmt3A has an amino acid sequence that is at least at least 95% identical to the sequence with SEQ ID NO: 26.
[0066] Белок «Dnmt3L», «ДНК (цитозин-5)-метилтрансфераза 3L» или «метилтрансфераза ДНК 3L», указанный в данном документе, включает в себя любую из рекомбинантных или встречающихся в природе форм фермента Dnmt3L, либо варианты или гомологи, которые сохраняют активность фермента Dnmt3L (например, в пределах по меньшей мере 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Dnmt3L). В аспектах данного изобретения варианты или гомологи по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Dnmt3L, встречающимся в природе. В аспектах данного изобретения белок Dnmt3L по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q9CWR8, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения белок Dnmt3L идентичен белку, идентифицированному по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 75% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 80% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 85% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 95% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9CWR8. [0066] The “Dnmt3L” protein, “DNA (cytosine-5) methyltransferase 3L” or “DNA methyltransferase 3L” as defined herein includes any of the recombinant or naturally occurring forms of the Dnmt3L enzyme, or variants or homologs, that retain Dnmt3L enzyme activity (e.g., within the range of at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, 99% or 100% activity compared to Dnmt3L). In aspects of the invention, the variants or homologues are at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical in amino acid sequence along the entire length of the sequence, or at a portion of the sequence (e.g. on a contiguous stretch of 50, 100, 150, or 200 amino acids in length) compared to the naturally occurring Dnmt3L protein. In aspects of the present invention, the Dnmt3L protein is substantially identical to the protein identified by UniProt accession number Q9CWR8, or a variant or homolog substantially identical to the protein of that accession number. In aspects of the present invention, the Dnmt3L protein is identical to the protein identified by UniProt accession number Q9CWR8. In aspects of the present invention, the Dnmt3L protein sequence is at least 75% identical to the amino acid sequence of the protein identified by UniProt accession number Q9CWR8. In aspects of the present invention, the Dnmt3L protein sequence is at least 80% identical to the amino acid sequence of the protein identified by UniProt accession number Q9CWR8. In aspects of the present invention, the Dnmt3L protein sequence is at least 85% identical to the amino acid sequence of the protein identified by UniProt accession number Q9CWR8. In aspects of the present invention, the Dnmt3L protein sequence is at least 95% identical to the amino acid sequence of the protein identified by UniProt accession number Q9CWR8.
[0067] В аспектах данного изобретения белок Dnmt3L по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q9UJW, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения белок Dnmt3L идентичен белку, идентифицированному по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 50% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 55% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 60% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 65% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 70% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 75% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 80% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 85% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 90% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения последовательность белка Dnmt3L по меньшей мере на 95% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt Q9UJW. В аспектах данного изобретения полипептид Dnmt3L кодируется последовательностью нуклеиновой кислоты, идентифицированной по референсной последовательности NCBI с номером доступа NM_001081695, либо по гомологам или по функциональным фрагментам последовательности с данным номером доступа. В аспектах данного изобретения Dnmt3L включает в себя последовательность, изложенную в SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L представляет собой последовательность, изложенную в SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 50% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 55% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 60% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 65% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 97% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 28. В аспектах данного изобретения Dnmt3L имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 28. [0067] In aspects of the present invention, the Dnmt3L protein is substantially identical to the protein identified by UniProt accession number Q9UJW, or a variant or homologue substantially identical to the protein of that accession number. In aspects of the present invention, the Dnmt3L protein is identical to the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 50% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 55% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 60% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 65% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 70% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 75% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 80% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 85% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 90% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L protein sequence is at least 95% identical to the amino acid sequence of the protein identified by UniProt accession number Q9UJW. In aspects of the present invention, the Dnmt3L polypeptide is encoded by a nucleic acid sequence identified from the NCBI reference sequence accession number NM_001081695, or from homologs or functional fragments of the sequence with this accession number. In aspects of the present invention, Dnmt3L includes the sequence set forth in SEQ ID NO: 28. In aspects of the present invention, Dnmt3L comprises the sequence set forth in SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 50 %, by 55%, by 60%, by 65%, by 70%, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, is 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 50% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 55% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 60% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 65% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 97% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 75% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 80% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 85% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 90% identical to the sequence with SEQ ID NO: 28. In aspects of the present invention, Dnmt3L has an amino acid sequence that is at least 95% identical to the sequence with SEQ ID NO: 28.
[0068] Термин «РНК-направляемая эндонуклеаза ДНК» и ему подобные термины относятся в обычном и общепринятом смысле к ферменту, который расщепляет фосфодиэфирную связь в полинуклеотидной цепи ДНК, при этом распознаванию фосфодиэфирной связи способствует отдельная последовательность РНК (например, единая гидовая РНК). [0068] The term “RNA-guided DNA endonuclease” and similar terms refer in the ordinary and accepted sense to an enzyme that cleaves a phosphodiester bond in a polynucleotide chain of DNA, wherein recognition of the phosphodiester bond is facilitated by a separate RNA sequence (e.g., a single guide RNA).
[0069] Термин «эндонуклеаза CRISPR класса II» относится к эндонуклеазам, которые обладают такой же эндонуклеазной активностью, как Cas9, и участвуют в системе CRISPR класса II. Примером системы CRISPR класса II является локус CRISPR типа II из Streptococcus pyogenes SF370, который содержит кластер из четырех генов - Cas9, Cas1, Cas2 и Csn1, а также два некодирующих элемента РНК - tracrРНК и характерный массив повторяющихся последовательностей (прямые повторы), разделенных короткими отрезками неповторяющихся последовательностей (спейсеры, около 30 п.о. каждый). Фермент Cpf1 относится к предполагаемой системе CRISPR-Cas типа V. Системы как типа II, так и типа V включены в класс II системы CRISPR-Cas. [0069] The term “class II CRISPR endonuclease” refers to endonucleases that have the same endonuclease activity as Cas9 and participate in the class II CRISPR system. An example of a class II CRISPR system is the type II CRISPR locus from Streptococcus pyogenes SF370, which contains a cluster of four genes - Cas9, Cas1, Cas2 and Csn1, as well as two non-coding RNA elements - tracrRNA and a characteristic array of repeated sequences (direct repeats) separated by short segments of non-repeating sequences (spacers, about 30 bp each). The Cpf1 enzyme belongs to the putative type V CRISPR-Cas system. Both type II and type V systems are included in class II of the CRISPR-Cas system.
[0070] «Последовательность ядерной локализации», или «сигнал ядерной локализации», или «СЯЛ» (англ. «NLS») представляет собой пептид, который направляет белки в ядро. В аспектах данного изобретения СЯЛ включает в себя пять основных положительно заряженных аминокислот. СЯЛ может располагаться в любом месте пептидной цепи. В аспектах данного изобретения СЯЛ представляет собой СЯЛ, полученный от SV40. В аспектах данного изобретения СЯЛ включает в себя последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ представляет собой последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность с SEQ ID NO: 25. [0070] A "nuclear localization sequence" or "nuclear localization signal" or "NLS" is a peptide that targets proteins to the nucleus. In aspects of the present invention, SNL includes five basic positively charged amino acids. SNL can be located anywhere in the peptide chain. In aspects of the present invention, the SNL is an SV40-derived SNL. In aspects of the present invention, the SNL includes the sequence set forth in SEQ ID NO: 25. In aspects of the present invention, the SNL is the sequence set forth in SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 50 %, by 55%, by 60%, by 65%, by 70%, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, is 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 75% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 80% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 85% identical with the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 90% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 95% identical with the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has the amino acid sequence of SEQ ID NO: 25.
[0071] Термин «клетка», употребляемый в контексте данного документа, относится к клетке, выполняющей метаболическую или другую функцию, достаточную для сохранения или репликации ее геномной ДНК. Клетка может быть идентифицирована с помощью методов, которые хорошо известны в данной области техники, включая, например, наличие неповрежденной мембраны, окрашивание определенным красителем, способность производить потомство или, в случае гаметы, способность объединяться со второй гаметой для производства жизнеспособного потомства. Клетки могут включать в себя прокариотические и эукариотические клетки. Прокариотические клетки включают в себя, но не ограничиваются ими, бактерии. Эукариотические клетки включают в себя, но не ограничиваются ими, дрожжевые клетки и клетки, полученные из растений и животных, например, клетки млекопитающих, насекомых (например, Spodoptera) и человека. Клетки могут быть применимы, когда они от природы являются неприлипающими, или были обработаны так, чтобы не прилипать к поверхностям, например, путем трипсинизации. [0071] The term “cell” as used herein refers to a cell that performs a metabolic or other function sufficient to maintain or replicate its genomic DNA. A cell can be identified by methods that are well known in the art, including, for example, the presence of an intact membrane, staining with a particular dye, the ability to produce progeny, or, in the case of a gamete, the ability to combine with a second gamete to produce viable progeny. Cells may include prokaryotic and eukaryotic cells. Prokaryotic cells include, but are not limited to, bacteria. Eukaryotic cells include, but are not limited to, yeast cells and cells derived from plants and animals, such as mammalian, insect (eg, Spodoptera ) and human cells. Cells may be useful when they are naturally non-adherent or have been treated so as not to adhere to surfaces, for example by trypsinization.
[0072] Термин «вектор», употребляемый в контексте данного документа, относится к молекуле нуклеиновой кислоты, способной переносить другую нуклеиновую кислоту, с которой она была связана. Одним из типов вектора является «плазмида», которая относится к линейной или кольцевой двухцепочечной петле ДНК, в которую могут быть лигированы дополнительные сегменты ДНК. Другой тип вектора представляет собой вирусный вектор, в котором дополнительные сегменты ДНК могут быть лигированы в вирусный геном. Определенные векторы способны к автономной репликации в клетке-хозяине, в которую они введены (например, бактериальные векторы, имеющие бактериальную точку начала репликации, и эписомальные векторы млекопитающих). Другие векторы (например, неэписомные векторы млекопитающих) интегрируются в геном клетки-хозяина после введения в клетку-хозяина и, таким образом, реплицируются вместе с геномом хозяина. Более того, определенные векторы способны управлять экспрессией генов, с которыми они функционально связаны. Такие векторы именуются в данном документе «векторами экспрессии». В общем, векторы экспрессии, используемые в технологиях рекомбинантных ДНК, часто находятся в форме плазмид. В данном документе термины «плазмида» и «вектор» могут употребляться взаимозаменяемо, поскольку плазмида является наиболее часто используемой формой вектора. Тем не менее, данное изобретение предназначено для включения других форм векторов экспрессии, таких как вирусные векторы (например, ретровирусы с дефектом репликации, аденовирусы и аденоассоциированные вирусы), которые выполняют эквивалентные функции. Кроме того, некоторые вирусные векторы способны нацеливаться на конкретный тип клеток либо специфично, либо неспецифично. Неспособные к репликации вирусные векторы, или вирусные векторы с дефектом репликации, относятся к вирусным векторам, которые способны инфицировать свои клетки-мишени и доставлять свою вирусную нагрузку, но затем не могут продолжить типичный литический путь, который приводит к лизису и гибели клеток. [0072] The term “vector” as used herein refers to a nucleic acid molecule capable of carrying another nucleic acid to which it has been linked. One type of vector is a "plasmid", which refers to a linear or circular double-stranded loop of DNA into which additional DNA segments can be ligated. Another type of vector is a viral vector, in which additional DNA segments can be ligated into the viral genome. Certain vectors are capable of autonomous replication in the host cell into which they are introduced (eg, bacterial vectors having a bacterial origin of replication and mammalian episomal vectors). Other vectors (eg, non-episomal mammalian vectors) are integrated into the host cell genome after introduction into the host cell and thus replicate along with the host genome. Moreover, certain vectors are capable of controlling the expression of genes to which they are functionally associated. Such vectors are referred to herein as “expression vectors.” In general, expression vectors used in recombinant DNA technologies are often in the form of plasmids. In this document, the terms "plasmid" and "vector" may be used interchangeably, since plasmid is the most commonly used form of vector. However, the present invention is intended to include other forms of expression vectors, such as viral vectors (eg, replication-defective retroviruses, adenoviruses and adeno-associated viruses) that perform equivalent functions. In addition, some viral vectors are capable of targeting a specific cell type either specifically or nonspecifically. Replication-incompetent viral vectors, or replication-defective viral vectors, refer to viral vectors that are able to infect their target cells and deliver their viral load, but then fail to continue the typical lytic pathway, which leads to cell lysis and death.
[0073] Термины «трансфекция», «трансдукция», «трансфицировать» или «трансдуцировать» могут употребляться взаимозаменяемо, и определяются как процесс введения молекулы нуклеиновой кислоты и (или) белка в клетку. Нуклеиновые кислоты могут быть введены в клетку с использованием невирусных методов или методов, основанных на вирусах. Молекула нуклеиновой кислоты может представлять собой последовательность, кодирующую полные белки или их функциональные части. Обычно вектор нуклеиновой кислоты содержит элементы, необходимые для экспрессии белка (например, промотор, сайт начала транскрипции и т. д.). Невирусные методы трансфекции включают в себя любой подходящий метод, в котором не используется вирусная ДНК или вирусные частицы в качестве системы доставки для введения молекулы нуклеиновой кислоты в клетку. Типичные методы невирусной трансфекции включают в себя инкапсуляцию наночастиц нуклеиновых кислот, которые кодируют слитый белок (например, липидные наночастицы, наночастицы золота и тому подобное), трансфекцию фосфатом кальция, липосомную трансфекцию, нуклеофекцию, сонопорацию, трансфекцию посредством теплового шока, трансфекцию посредством намагничивания и электропорацию. Что касается методов, основанных на вирусах, то любой пригодный вирусный вектор может быть использован в способах, описанных в данном документе. Примеры вирусных векторов включают, но не ограничиваются ими, ретровирусные, аденовирусные, лентивирусные и аденоассоциированные вирусные векторы. В аспектах данного изобретения молекулы нуклеиновой кислоты вводятся в клетку с использованием ретровирусного вектора в соответствии со стандартными процедурами, хорошо известными в данной области техники. Термины «трансфекция» или «трансдукция» также относятся к введению белков в клетку из внешней среды. Обычно трансдукция или трансфекция белка основывается на присоединении пептида или белка, способного пересекать клеточную мембрану, к представляющему интерес белку. См., например, Ford et al. (2001) Gene Therapy 8: 1-4, и Prochiantz (2007) Nat. Methods 4: 119-20. [0073] The terms "transfection", "transduction", "transfect" or "transduce" can be used interchangeably, and are defined as the process of introducing a nucleic acid molecule and/or protein into a cell. Nucleic acids can be introduced into a cell using non-viral or virus-based methods. The nucleic acid molecule may be a sequence encoding entire proteins or functional parts thereof. Typically, a nucleic acid vector contains elements necessary for protein expression (eg, promoter, transcription start site, etc.). Non-viral transfection methods include any suitable method that does not use viral DNA or viral particles as a delivery system to introduce a nucleic acid molecule into a cell. Typical non-viral transfection methods include encapsulation of nucleic acid nanoparticles that encode the fusion protein (eg, lipid nanoparticles, gold nanoparticles, and the like), calcium phosphate transfection, liposome transfection, nucleofection, sonoporation, heat shock transfection, magnetization transfection, and electroporation . With regard to virus-based methods, any suitable viral vector can be used in the methods described herein. Examples of viral vectors include, but are not limited to, retroviral, adenoviral, lentiviral, and adeno-associated viral vectors. In aspects of the present invention, nucleic acid molecules are introduced into a cell using a retroviral vector in accordance with standard procedures well known in the art. The terms "transfection" or "transduction" also refer to the introduction of proteins into a cell from the external environment. Typically, protein transduction or transfection relies on the attachment of a peptide or protein capable of crossing the cell membrane to the protein of interest. See, for example, Ford et al. (2001) Gene Therapy 8: 1-4, and Prochiantz (2007) Nat. Methods 4: 119-20.
[0074] Термин «пептидный линкер», употребляемый в контексте данного документа, представляет собой линкер, включающий в себя пептидный фрагмент. В вариантах реализации данного изобретения пептидный линкер представляет собой двухвалентный пептид, такой как аминокислотная последовательность, присоединенная на N-конце и C-конце к остатку соединения (например, слитый белок, представленный в данном документе). Пептидный линкер может быть пептидным фрагментом (двухвалентным пептидным фрагментом), который можно расщепить (например, полипептидом, расщепляемым P2A). Пептидный линкер в контексте данного документа также может взаимозаменяемо именоваться аминокислотным линкером. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 80 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 70 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 60 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 50 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 40 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 30 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 25 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от 1 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 19 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 18 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 17 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 16 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 15 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 14 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 13 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 12 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 11 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 10 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 9 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 8 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 7 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 6 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 5 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 4 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 2 до около 3 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 19 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 18 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 17 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 16 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 15 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 14 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 13 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 12 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 11 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 10 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 9 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 8 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 7 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 6 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 5 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 3 до около 4 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 10 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя от около 15 до около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 2 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 3 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 4 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 5 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 6 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 7 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 8 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 9 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 10 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 11 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 12 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 13 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 14 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 15 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 16 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 17 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 18 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 19 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 20 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 21 аминокислотного остатка. В аспектах данного изобретения пептидный линкер включает в себя около 22 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 23 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 24 аминокислотных остатков. В аспектах данного изобретения пептидный линкер включает в себя около 25 аминокислотных остатков. [0074] The term "peptide linker" as used herein is a linker including a peptide moiety. In embodiments of the present invention, the peptide linker is a divalent peptide, such as an amino acid sequence, attached at the N-terminus and C-terminus to the remainder of the compound (eg, a fusion protein provided herein). The peptide linker may be a peptide fragment (a divalent peptide fragment) that can be cleaved (eg, a P2A cleavable polypeptide). A peptide linker as used herein may also be interchangeably referred to as an amino acid linker. In aspects of the present invention, the peptide linker includes from 1 to about 80 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 70 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 60 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 50 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 40 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 30 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 25 amino acid residues. In aspects of the present invention, the peptide linker includes from 1 to about 20 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 20 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 19 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 18 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 17 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 16 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 15 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 14 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 13 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 12 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 11 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 10 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 9 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 8 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 7 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 6 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 5 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 4 amino acid residues. In aspects of the present invention, the peptide linker includes from about 2 to about 3 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 19 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 18 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 17 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 16 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 15 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 14 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 13 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 12 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 11 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 10 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 9 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 8 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 7 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 6 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 5 amino acid residues. In aspects of the present invention, the peptide linker includes from about 3 to about 4 amino acid residues. In aspects of the present invention, the peptide linker includes from about 10 to about 20 amino acid residues. In aspects of the present invention, the peptide linker includes from about 15 to about 20 amino acid residues. In aspects of the present invention, the peptide linker includes about 2 amino acid residues. In aspects of the present invention, the peptide linker includes about 3 amino acid residues. In aspects of the present invention, the peptide linker includes about 4 amino acid residues. In aspects of the present invention, the peptide linker includes about 5 amino acid residues. In aspects of the present invention, the peptide linker includes about 6 amino acid residues. In aspects of the present invention, the peptide linker includes about 7 amino acid residues. In aspects of the present invention, the peptide linker includes about 8 amino acid residues. In aspects of the present invention, the peptide linker includes about 9 amino acid residues. In aspects of the present invention, the peptide linker includes about 10 amino acid residues. In aspects of the present invention, the peptide linker includes about 11 amino acid residues. In aspects of the present invention, the peptide linker includes about 12 amino acid residues. In aspects of the present invention, the peptide linker includes about 13 amino acid residues. In aspects of the present invention, the peptide linker includes about 14 amino acid residues. In aspects of the present invention, the peptide linker includes about 15 amino acid residues. In aspects of the present invention, the peptide linker includes about 16 amino acid residues. In aspects of the present invention, the peptide linker includes about 17 amino acid residues. In aspects of the present invention, the peptide linker includes about 18 amino acid residues. In aspects of the present invention, the peptide linker includes about 19 amino acid residues. In aspects of the present invention, the peptide linker includes about 20 amino acid residues. In aspects of the present invention, the peptide linker includes about 21 amino acid residues. In aspects of the present invention, the peptide linker includes about 22 amino acid residues. In aspects of the present invention, the peptide linker includes about 23 amino acid residues. In aspects of the present invention, the peptide linker includes about 24 amino acid residues. In aspects of the present invention, the peptide linker includes about 25 amino acid residues.
[0075] В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 29. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 29. В аспектах данного изобретения пептидный линкер представляет собой полипептид XTEN. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 или 29. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 или 29. [0075] In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 17. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 17. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 18. In aspects of the present invention, the peptide linker is the sequence set forth in SEQ ID NO: 18. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 19. In aspects of the present invention the peptide linker is the sequence set forth in SEQ ID NO: 19. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 20. In aspects of the present invention, the peptide linker is the sequence set forth in SEQ ID NO: 20 In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 21. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 21. In aspects of the present invention, the peptide linker includes the sequence set forth in in SEQ ID NO: 22. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 22. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 27. In aspects of the present invention, the peptide linker is the sequence set forth in SEQ ID NO: 27. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 24. In aspects of the present invention, the peptide linker is the sequence set forth in SEQ ID NO: 24. B In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 29. In aspects of the present invention, the peptide linker is the sequence set forth in SEQ ID NO: 29. In aspects of the present invention, the peptide linker is an XTEN polypeptide. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27, or 29. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 or 29.
[0076] В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 29. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 или 29. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 17. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 18. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 19. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 20. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 21. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 22. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 29. [0076] In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 17. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 18. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 19. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence with SEQ ID NO: 20. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 21. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to sequence of SEQ ID NO: 22. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 24. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 24. % identical to the sequence of SEQ ID NO: 27. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 29. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least is 95% identical to the sequence of SEQ ID NO: 17, 18, 19, 20, 21, 22, 24, 27 or 29. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 17. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 18. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence with SEQ ID NO: 19. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 20. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to sequence of SEQ ID NO: 21. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 22. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 22. % identical to the sequence of SEQ ID NO: 24. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 27. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence with SEQ ID NO: 29.
[0077] Термины «XTEN», «линкер XTEN» или «полипептид XTEN» в контексте данного документа относятся к рекомбинантному полипептиду (например, неструктурированному рекомбинантному пептиду), не имеющему гидрофобных аминокислотных остатков. О разработке и использовании XTEN можно найти, например, в публикации Schellenberger et al., Nature Biotechnology 27, 1186-1190 (2009), которая полностью и для всех целей включена в данный документ посредством ссылки. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 32. [0077] The terms "XTEN", "XTEN linker" or "XTEN polypeptide" as used herein refer to a recombinant polypeptide (eg, an unstructured recombinant peptide) that does not have hydrophobic amino acid residues. The development and use of XTEN can be found, for example, in Schellenberger et al., Nature Biotechnology 27, 1186-1190 (2009), which is incorporated herein by reference in its entirety and for all purposes. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 32. In aspects of the present invention, the XTEN linker is the sequence set forth in SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% , is 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 31. In aspects of this invention of the invention, the XTEN linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97% , is 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 32. In aspects of this invention The XTEN linker of the invention has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 32.
[0078] «Детектируемый агент» или «детектируемый фрагмент» представляет собой композицию, которую можно детектировать соответствующими средствами, такими как спектроскопические, фотохимические, биохимические, иммунохимические, химические средства, магнитно-резонансная томография или другие физические средства. Например, пригодные реагенты для детекции включают в себя 18F, 32P, 33P, 45Ti, 47Sc, 52Fe, 59Fe, 62Cu, 64Cu, 67Cu, 67Ga, 68Ga, 77As, 86Y, 90Y. 89Sr, 89Zr, 94Tc, 94Tc, 99mTc, 99Mo, 105Pd, 105Rh, 111Ag, 111In, 123I, 124I, 125I, 131I, 142Pr, 143Pr, 149Pm, 153Sm, 154-1581Gd, 161Tb, 166Dy, 166Ho, 169Er, 175Lu, 177Lu, 186Re, 188Re, 189Re, 194Ir, 198Au, 199Au, 211At, 211Pb, 212Bi, 212Pb, 213Bi, 223Ra, 225Ac, Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb, Lu, 32P, флуорофор (например, флуоресцентные красители), электронно-плотные реагенты, ферменты (например, широко используемые в твердофазном ИФА), биотин, дигоксигенин, парамагнитные молекулы, парамагнитные наночастицы, сверхмалые суперпарамагнитные наночастицы оксида железа (англ. «USPIO»), агрегаты наночастиц USPIO, суперпарамагнитные наночастицы оксида железа (англ. «SPIO»), агрегаты наночастиц SPIO, монокристаллические наночастицы оксида железа, монокристаллический оксид железа, контрастные вещества на основе наночастиц, липосомы или другие средства доставки, содержащие молекулы хелата гадолиния («хелат Gd») молекулы, гадолиний, радиоизотопы, радионуклиды (например, углерод-11, азот-13, кислород-15, фтор-18, рубидий-82), фтордезоксиглюкоза (например, меченная фтором-18), любые излучающие гамма-лучи радионуклиды, излучающие позитроны радионуклиды, радиоактивно меченая глюкоза, радиоактивно меченная вода, радиоактивно меченый аммиак, биоколлоиды, микропузырьки (например, включительно с оболочками микропузырьков, содержащими альбумин, галактозу, липиды и (или) полимеры; включительно с газовым ядром микропузырьков, содержащим воздух, тяжелый газ (тяжелые газы), перфторуглерод, азот, октафторпропан, перфлексановые липидные микросферы, перфлутрен и т. д.), йодированные контрастные вещества (например, иогексол, йодиксанол, иоверсол, иопамидол, иоксилан, иопромид, диатризоат, метризоат, иоксаглат), сульфат бария, диоксид тория, золото, золотые наночастицы, агрегаты золотых наночастиц, флуорофоры, двухфотонные флуорофоры или гаптены и белки, или другие объекты, которые могут быть детектированы, например, путем включения радиоактивной метки в пептид или антитело, специфически реагирующие с целевым пептидом. [0078] A “detectable agent” or “detectable moiety” is a composition that can be detected by appropriate means, such as spectroscopic, photochemical, biochemical, immunochemical, chemical means, magnetic resonance imaging or other physical means. For example, suitable detection reagents include 18 F, 32 P, 33 P, 45 Ti, 47 Sc, 52 Fe, 59 Fe, 62 Cu, 64 Cu, 67 Cu, 67 Ga, 68 Ga, 77 As, 86 Y , 90 Y. 89 Sr, 89 Zr, 94 Tc, 94 Tc, 99m Tc, 99 Mo, 105 Pd, 105 Rh, 111 Ag, 111 In, 123 I, 124 I, 125 I, 131 I, 142 Pr, 143 Pr, 149 Pm, 153 Sm, 154-1581 Gd, 161 Tb, 166 Dy, 166 Ho, 169 Er, 175 Lu , 177 Lu, 186 Re, 188 Re, 189 Re, 194 Ir, 198 Au, 199 Au, 211 At, 211 Pb, 212 Bi, 212 Pb, 213 Bi, 223 Ra, 225 Ac, Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb, Lu, 32 P, fluorophore (e.g., fluorescent dyes), electron-dense reagents, enzymes (e.g., widely used in ELISA), biotin, digoxigenin, paramagnetic molecules, paramagnetic nanoparticles , ultra-small superparamagnetic iron oxide nanoparticles (USPIO), USPIO nanoparticle aggregates, superparamagnetic iron oxide nanoparticles (SPIO), SPIO nanoparticle aggregates, single-crystalline iron oxide nanoparticles, monocrystalline iron oxide, nanoparticle-based contrast agents, liposomes or other delivery vehicles containing gadolinium chelate molecules (“Gd chelate”) molecules, gadolinium, radioisotopes, radionuclides (e.g., carbon-11, nitrogen-13, oxygen-15, fluorine-18, rubidium-82), fluorodeoxyglucose (e.g., fluorine-18), any gamma-ray emitting radionuclides, positron-emitting radionuclides, radiolabeled glucose, radiolabeled water, radiolabeled ammonia, biocolloids, microbubbles (for example, including microbubble shells containing albumin, galactose, lipids and/or) polymers; inclusive of a gas core of microbubbles containing air, heavy gas(es), perfluorocarbon, nitrogen, octafluoropropane, perflexane lipid microspheres, perflutren, etc.), iodinated contrast agents (e.g. iohexol, iodixanol, ioversol, iopamidol, ioxilan, iopromide, diatrizoate, metrizoate, ioxaglate), barium sulfate, thorium dioxide, gold, gold nanoparticles, gold nanoparticle aggregates, fluorophores, two-photon fluorophores or haptens and proteins, or other objects that can be detected, for example, by incorporating a radiolabel into the peptide or antibody that specifically reacts with the target peptide.
[0079] Детектируемый фрагмент представляет собой одновалентный детектируемый агент или детектируемый агент, способный образовывать связь с другой композицией. В аспектах данного изобретения детектируемый агент представляет собой метку HA. В аспектах данного изобретения метка HA включает в себя последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения метка НА представляет собой последовательность, изложенную в SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения метка НА имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 24. В аспектах данного изобретения детектируемый агент представляет собой синий флуоресцентный белок (СФБ, англ. «BFP»). В аспектах данного изобретения СФБ включает в себя последовательность, изложенную в SEQ ID NO: 30. В аспектах данного изобретения СФБ представляет собой последовательность, изложенную в SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 30. В аспектах данного изобретения СФБ имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 30. [0079]The detectable moiety is a monovalent detectable agent or a detectable agent capable of forming a bond with another composition. In aspects of the present invention, the detectable agent is an HA tag. In aspects of the present invention, the HA tag includes the sequence set forth in SEQ ID NO: 24. In aspects of the present invention, the HA tag is the sequence set forth in SEQ ID NO: 24. In aspects of the present invention, the HA tag has an amino acid sequence that is at least is at least 80% identical to the sequence of SEQ ID NO: 24. In aspects of the present invention, the HA tag has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 24. In aspects of the present invention, the HA tag has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 24. In aspects of the present invention, the HA tag has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 24. In aspects of the present invention, the detectable agent is blue fluorescent protein (FBP, English "BFP"). In aspects of the present invention, SFB includes the sequence set forth in SEQ ID NO: 30. In aspects of the present invention, SFB is the sequence set forth in SEQ ID NO: 30. In aspects of the present invention, SFB has an amino acid sequence that is at least 80 % identical to the sequence of SEQ ID NO: 30. In aspects of the present invention, SFB has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 30. In aspects of the present invention, SFB has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 30. In aspects of the present invention, SFB has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 30.
[0080] Радиоактивные вещества (например, радиоизотопы), которые можно использовать в качестве агентов для визуализации и (или) маркировки в соответствии с аспектами данного изобретения, включают в себя, но не ограничиваются ими, 18F, 32P, 33P, 45Ti, 47Sc, 52Fe, 59Fe, 62Cu, 64Cu, 67Cu, 67Ga, 68Ga, 77As, 86Y, 90Y, 89Sr, 89Zr, 94Tc, 94Tc, 99mTc, 99Mo, 105Pd, 105Rh, 111Ag, 111In, 123I, 124I, 125I, 131I, 142Pr, 143Pr, 149Pm, 153Sm, 154-1581Gd, 161Tb, 166Dy, 166Ho, 169Er, 175Lu, 177Lu, 186Re, 188Re, 189Re, 194Ir, 198Au, 199Au, 211At, 211Pb, 212Bi, 212Pb, 213Bi, 223Ra и 225Ac. Парамагнитные ионы, которые могут использоваться в качестве дополнительных агентов для визуализации в соответствии с аспектами данного изобретения, включают в себя, но не ограничиваются ими, ионы переходных металлов и лантаноидных металлов (например, металлы с атомными номерами 21-29, 42, 43, 44 или 57-71). Эти металлы включают в себя ионы Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb и Lu. [0080] Radioactive substances (e.g., radioisotopes) that can be used as imaging and/or labeling agents in accordance with aspects of the present invention include, but are not limited to, 18 F, 32 P, 33 P, 45 Ti, 47 Sc , 52 Fe, 59 Fe, 62 Cu, 64 Cu, 67 Cu, 67 Ga, 68 Ga, 77 As, 86 Y, 90 Y, 89 Sr, 89 Zr, 94 Tc, 94 Tc, 99m Tc, 99 Mo, 105 Pd, 105 Rh, 111 Ag, 111 In, 123 I, 124 I, 125 I, 131 I, 142 Pr, 143 Pr, 149 Pm, 153 Sm, 154-1581 Gd, 161 Tb, 166 Dy, 166 Ho, 169 Er, 175 Lu, 177 Lu, 186 Re, 188 Re , 189 Re, 194 Ir, 198 Au, 199 Au, 211 At, 211 Pb, 212 Bi, 212 Pb, 213 Bi, 223 Ra and 225 Ac . Paramagnetic ions that can be used as additional imaging agents in accordance with aspects of this invention include, but are not limited to, transition metal and lanthanide metal ions (e.g., metals with atomic numbers 21-29, 42, 43, 44 or 57-71). These metal ions include Cr, V, Mn, Fe, Co, Ni, Cu, La, Ce, Pr, Nd, Pm, Sm, Eu, Gd, Tb, Dy, Ho, Er, Tm, Yb and Lu.
[0081] Термин «контактирование» употребляется в его простом, обычном значении и относится к процессу, позволяющему по крайней мере двум различным молекулам приблизиться друг к другу на достаточно близкое расстояние, чтобы реагировать, взаимодействовать или физически соприкасаться. Однако следует понимать, что конечный продукт реакции может быть получен непосредственно в результате реакции между добавленными реагентами, или из промежуточного продукта из одного или нескольких добавленных реагентов, которые могут быть получены в реакционной смеси. [0081]Term "contacting" is used in its simple, ordinary meaning and refers to the process of allowing at least two different molecules to come close enough to each other to react, interact, or physically touch. However, it should be understood that the final reaction product may be obtained directly from the reaction between the added reactants, or from an intermediate product of one or more added reactants that may be obtained in the reaction mixture.
[0082] Термин «контактирование» может включать в себя предоставление возможности двум молекулам реагировать, взаимодействовать или физически соприкасаться, где две молекулы могут представлять собой, например, слитый белок, как предусмотрено в данном документе, и последовательность нуклеиновой кислоты (например, последовательность целевой ДНК). [0082] The term "contacting" may include allowing two molecules to react, interact, or physically touch, where the two molecules may be, for example, a fusion protein as provided herein and a nucleic acid sequence (e.g., a target DNA sequence ).
[0083] Как определено в данном документе, термин «ингибирование», «ингибирует», «ингибирующий», «репрессия», «репрессирует», «сайленсинг», «вызывать сайленсинг» и тому подобное при употреблении в отношении композиции, представленной в данном документе (например, слитого белка, комплекса, нуклеиновой кислоты, вектора), относятся к отрицательному влиянию (например, снижению) активности (например, транскрипции) последовательности нуклеиновой кислоты (например, снижению транскрипции гена) относительно активности последовательности нуклеиновой кислоты (например, транскрипции гена) в отсутствие композиции (например, слитого белка, комплекса, нуклеиновой кислоты, вектора). В аспектах данного изобретения ингибирование относится к ослаблению заболевания или симптомов заболевания (например, онкологического заболевания). Таким образом, ингибирование включает, по крайней мере частично, частичное или полное блокирование активности (например, транскрипции) или уменьшение, предотвращение или задержку активности (например, транскрипции) последовательности нуклеиновой кислоты. Ингибированная активность (например, транскрипция) может составлять 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10% или меньше, чем активность в контроле. В аспектах данного изобретения ингибирование является 1,5-кратным, 2-кратным, 3-кратным, 4-кратным, 5-кратным, 10-кратным или более по сравнению с контролем. [0083] As defined herein, the term “inhibiting,” “inhibits,” “inhibiting,” “repressing,” “represses,” “silencing,” “silencing,” and the like when used in relation to a composition provided herein document (e.g., fusion protein, complex, nucleic acid, vector) refer to the negative effect (e.g., decrease) of the activity (e.g., transcription) of a nucleic acid sequence (e.g., decrease in gene transcription) relative to the activity of the nucleic acid sequence (e.g., gene transcription ) in the absence of a composition (eg, fusion protein, complex, nucleic acid, vector). In aspects of the present invention, inhibition refers to the attenuation of a disease or symptoms of a disease (eg, cancer). Thus, inhibition involves, at least in part, partially or completely blocking the activity (eg, transcription) or reducing, preventing or delaying the activity (eg, transcription) of a nucleic acid sequence. Inhibited activity (eg, transcription) may be 90%, 80%, 70%, 60%, 50%, 40%, 30%, 20%, 10%, or less than the activity in the control. In aspects of the present invention, the inhibition is 1.5-fold, 2-fold, 3-fold, 4-fold, 5-fold, 10-fold or more compared to the control.
[0084] «Контрольный» образец или значение относится к образцу, который служит референсом, обычно известным референсом, для сравнения с исследуемым образцом. Например, исследуемый образец может быть отобран из исследуемого условия, например, в присутствии исследуемого соединения, и сравнен с образцами из известных условий, например, в отсутствие исследуемого соединения (отрицательный контроль) или в присутствии известного соединения (положительный контроль). Контроль также может представлять собой среднее значение, полученное из ряда исследований или результатов. Специалист в данной области техники поймет, что контроли могут быть разработаны для оценки любого количества параметров. Например, можно разработать контроль для сравнения терапевтического эффекта на основе фармакологических данных (например, период полужизни) или терапевтических мер (например, сравнение побочных эффектов). Специалист в данной области техники поймет, какие контроли важны в определенной ситуации, и сможет анализировать данные на основе сравнений с контрольными значениями. Контроли также важны для определения значимости данных. Например, если значения для определенного параметра сильно различаются в контроле, то вариация в исследуемых образцах не будет считаться значимой. [0084] A “control” sample or value refers to a sample that serves as a reference, usually a known reference, for comparison with the test sample. For example, a test sample may be taken from a test condition, eg in the presence of a test compound, and compared with samples from known conditions, eg in the absence of a test compound (negative control) or in the presence of a known compound (positive control). A control may also be an average obtained from a number of studies or results. One skilled in the art will appreciate that controls can be designed to assess any number of parameters. For example, controls can be developed to compare therapeutic effect based on pharmacological data (eg, half-life) or therapeutic measures (eg, comparison of side effects). One skilled in the art will understand which controls are important in a particular situation and will be able to analyze data based on comparisons with control values. Controls are also important to determine the significance of the data. For example, if values for a particular parameter are very different in controls, then the variation in the test samples will not be considered significant.
[0085] Слитые белки [0085] Fusion proteins
[0086] В данном документе представлены, среди прочего, слитые белки, которые могут отключать гены навсегда (например, необратимо) и обратимо в клетках млекопитающих с использованием редактирования эпигенома на основе CRISPR. В вариантах реализации данного изобретения слитый белок включает в себя один полипептид, слитый из четырех белков (например, каталитически неактивного Cas9 (например, dCas9), домена KRAB, Dnmt3A и Dnmt3L), которые могут кратковременно экспрессироваться в клетках. Слитый белок может быть направлен в конкретный сайт в геноме млекопитающего с использованием полинуклеотида, комплементарного целевой последовательности нуклеиновой кислоты (например, последовательности ДНК), и который дополнительно включает в себя последовательность (т. е. связывающую последовательность), способную к связыванию со слитым белком. После правильного позиционирования, и без намерения быть связанным теорией, слитый белок добавляет маркеры метилирования ДНК и (или) репрессивные хроматиновые маркеры к целевой нуклеиновой кислоте, что приводит к сайленсингу гена, который наследуется при последующих делениях клеток. Таким образом, слитый белок может выполнять редактирование эпигенома, которое позволяет обойтись без создания двухцепочечных разрывов ДНК в геноме хозяина, что делает его безопасным и обратимым способом манипулирования геномом живого организма. [0086] Presented herein are, among other things, fusion proteins that can disable genes permanently (eg, irreversibly) and reversibly in mammalian cells using CRISPR-based epigenome editing. In embodiments of the present invention, the fusion protein includes a single polypeptide fused from four proteins (eg, catalytically inactive Cas9 (eg, dCas9), KRAB domain, Dnmt3A, and Dnmt3L) that can be transiently expressed in cells. The fusion protein can be directed to a specific site in the genome of a mammal using a polynucleotide that is complementary to the target nucleic acid sequence (eg, a DNA sequence) and which further includes a sequence (ie, a binding sequence) capable of binding to the fusion protein. Once correctly positioned, and without intending to be bound by theory, the fusion protein adds DNA methylation markers and/or repressive chromatin markers to the target nucleic acid, resulting in gene silencing that is inherited through subsequent cell divisions. Thus, the fusion protein can perform epigenome editing that bypasses the creation of DNA double-strand breaks in the host genome, making it a safe and reversible way to manipulate the genome of a living organism.
[0087] В вариантах реализации данного изобретения слитый белок содержит фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; домен KRAB и домен метилтрансферазы ДНК. В аспектах данного изобретения слитый белок содержит, в направлении от N-конца до C-конца, домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, и домен KRAB. В аспектах данного изобретения слитый белок содержит, в направлении от N-конца до C-конца, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, и домен метилтрансферазы ДНК. В вариантах реализации данного изобретения слитый белок дополнительно содержит один или несколько пептидных линкеров. В аспектах данного изобретения слитый белок дополнительно содержит одну или несколько детектируемых меток. В аспектах данного изобретения слитый белок дополнительно содержит одну или несколько последовательностей ядерной локализации. В аспектах данного изобретения слитый белок дополнительно содержит один или несколько пептидных линкеров, одну или несколько детектируемых меток, одну или несколько последовательностей ядерной локализации, или комбинацию двух или более из вышеперечисленных. Когда слитый белок содержит один или несколько пептидных линкеров, каждый из пептидных лайнеров может быть одинаковым или разными. Когда слитый белок содержит одну или несколько детектируемых меток, каждая из детектируемых меток может быть одинаковой или разной. В аспектах данного изобретения слитый белок содержит от 1 до 10 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 9 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 8 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 7 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 6 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 5 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 4 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 3 детектируемых меток. В аспектах данного изобретения слитый белок содержит от 1 до 2 детектируемых меток. В аспектах данного изобретения слитый белок содержит 1 детектируемую метку. В аспектах данного изобретения слитый белок содержит 2 детектируемых метки. В аспектах данного изобретения слитый белок содержит 3 детектируемых метки. В аспектах данного изобретения слитый белок содержит 4 детектируемых метки. В аспектах данного изобретения слитый белок содержит 5 детектируемых меток. [0087] In embodiments of the present invention, the fusion protein comprises a nuclease-deficient RNA-guided DNA endonuclease enzyme; KRAB domain and DNA methyltransferase domain. In aspects of the present invention, the fusion protein comprises, from N-terminus to C-terminus, a DNA methyltransferase domain, a nuclease-deficient RNA-guided DNA endonuclease enzyme, and a KRAB domain. In aspects of the present invention, the fusion protein comprises, from N-terminus to C-terminus, a nuclease-deficient RNA-guided DNA endonuclease enzyme, and a DNA methyltransferase domain. In embodiments of the present invention, the fusion protein further comprises one or more peptide linkers. In aspects of the present invention, the fusion protein further comprises one or more detectable tags. In aspects of the present invention, the fusion protein further comprises one or more nuclear localization sequences. In aspects of the present invention, the fusion protein further comprises one or more peptide linkers, one or more detectable tags, one or more nuclear localization sequences, or a combination of two or more of the above. When the fusion protein contains one or more peptide linkers, each of the peptide liners may be the same or different. When the fusion protein contains one or more detectable tags, each of the detectable tags may be the same or different. In aspects of the present invention, the fusion protein contains from 1 to 10 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 9 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 8 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 7 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 6 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 5 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 4 detectable tags. In aspects of the present invention, the fusion protein contains from 1 to 3 detectable tags. In aspects of the present invention, the fusion protein contains 1 to 2 detectable tags. In aspects of the present invention, the fusion protein contains 1 detectable tag. In aspects of the present invention, the fusion protein contains 2 detectable tags. In aspects of the present invention, the fusion protein contains 3 detectable tags. In aspects of the present invention, the fusion protein contains 4 detectable tags. In aspects of the present invention, the fusion protein contains 5 detectable tags.
[0088] В вариантах реализации данного изобретения слитый белок содержит структуру A - B - C, или B - A - C, или C - A - B, или C - B - A, или B - C - A, или A - C - B; где А представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК; и при этом компонент слева является N-концом, а компонент справа является C-концом. В аспектах данного изобретения слитый белок дополнительно содержит один или несколько пептидных линкеров и одну или несколько детектируемых меток. В аспектах данного изобретения каждый из A - B, B - A, B - C, C - B, A - C и C - A независимо связан друг с другом ковалентной связью, пептидным линкером, детектируемой меткой, последовательностью ядерной локализации или комбинацией двух или более из них. Пептидный линкер может быть любым известным в данной области техники (например, пептид, расщепляемый P2A, линкер XTEN и тому подобное). В аспектах данного изобретения слитый белок содержит другие компоненты, такие как детектируемые метки (например, метка НА, синий флуоресцентный белок и т.п.). [0088] In embodiments of the present invention, the fusion protein contains the structure A - B - C, or B - A - C, or C - A - B, or C - B - A, or B - C - A, or A - C - B; where A is an enzyme nuclease-deficient RNA-directed DNA endonuclease; B is a KRAB domain; C is a DNA methyltransferase domain; and wherein the component on the left is the N-terminus and the component on the right is the C-terminus. In aspects of the present invention, the fusion protein further comprises one or more peptide linkers and one or more detectable tags. In aspects of the present invention, A - B, B - A, B - C, C - B, A - C, and C - A are each independently linked to each other by a covalent bond, a peptide linker, a detectable tag, a nuclear localization sequence, or a combination of two or more of them. The peptide linker can be any known in the art (eg, P2A cleavable peptide, XTEN linker, and the like). In aspects of the present invention, the fusion protein contains other components, such as detectable tags (eg, HA tag, blue fluorescent protein, etc.).
[0089] В вариантах реализации данного изобретения слитый белок содержит структуру A - L1 - B - L2 - C, где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, L1 представляет собой ковалентную связь или пептидный линкер, и L2 представляет собой ковалентную связь или пептидный линкер; и где A находится на N-конце, а C находится на C-конце. В аспектах данного изобретения A ковалентно связан с B через пептидный линкер. В аспектах данного изобретения A ковалентно связан с B через ковалентную связь. В аспектах данного изобретения B ковалентно связан с C через пептидный линкер. В аспектах данного изобретения B ковалентно связан с C через ковалентную связь. Пептидный линкер может быть любым известным в данной области техники (например, пептид, расщепляемый P2A, линкер XTEN и тому подобное). В аспектах данного изобретения слитый белок содержит другие компоненты, такие как детектируемые метки, последовательности ядерной локализации и т.п. В аспектах данного изобретения L1 представляет собой ковалентную связь, пептидный линкер, детектируемую метку, последовательность ядерной локализации или их комбинацию. В аспектах данного изобретения L2 представляет собой ковалентную связь, пептидный линкер, детектируемую метку, последовательность ядерной локализации или их комбинацию. [0089] In embodiments of the present invention, the fusion protein comprises the structure A - L 1 - B - L 2 - C, wherein A is an enzyme nuclease-deficient RNA-guided DNA endonuclease; B is a KRAB domain, C is a DNA methyltransferase domain, L 1 is a covalent bond or peptide linker, and L 2 is a covalent bond or peptide linker; and where A is at the N-terminus and C is at the C-terminus. In aspects of the present invention, A is covalently linked to B through a peptide linker. In aspects of the present invention, A is covalently linked to B through a covalent bond. In aspects of the present invention, B is covalently linked to C through a peptide linker. In aspects of the present invention, B is covalently linked to C through a covalent bond. The peptide linker can be any known in the art (eg, P2A cleavable peptide, XTEN linker, and the like). In aspects of the present invention, the fusion protein contains other components, such as detectable tags, nuclear localization sequences, and the like. In aspects of the present invention, L 1 is a covalent bond, a peptide linker, a detectable tag, a nuclear localization sequence, or a combination thereof. In aspects of the present invention, L 2 is a covalent bond, a peptide linker, a detectable tag, a nuclear localization sequence, or a combination thereof.
[0090] В вариантах реализации данного изобретения слитый белок содержит структуру B - L1 - A - L2 - C, где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, L1 представляет собой ковалентную связь или пептидный линкер, и L2 представляет собой ковалентную связь или пептидный линкер; и где B находится на N-конце, а C находится на C-конце. В аспектах данного изобретения L1 представляет собой пептидный линкер. В аспектах данного изобретения L1 представляет собой ковалентную связь. В аспектах данного изобретения L2 представляет собой пептидный линкер. В аспектах данного изобретения L2 представляет собой ковалентную связь. Пептидный линкер может быть любым известным в данной области техники или описанным в данном документе (например, пептид, расщепляемый P2A, линкер XTEN и т.п.). В аспектах данного изобретения слитый белок содержит другие компоненты, такие как детектируемые метки. В аспектах данного изобретения L1 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или их комбинацию. В аспектах данного изобретения L2 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или их комбинацию. В аспектах данного изобретения слитый белок дополнительно содержит последовательность ядерной локализации. Иллюстративные слитые белки, содержащие структуру B - L1 - A - L2 - C, включают в себя p76, p90, p91, p92, p93, p94, p95, p96, p97, p98, p99, p100, p101 и p102 (Фиг. 5) [0090] In embodiments of the present invention, the fusion protein comprises the structure B - L 1 - A - L 2 - C, wherein A is an enzyme nuclease-deficient RNA-guided DNA endonuclease; B is a KRAB domain, C is a DNA methyltransferase domain, L 1 is a covalent bond or peptide linker, and L 2 is a covalent bond or peptide linker; and where B is at the N-terminus and C is at the C-terminus. In aspects of the present invention, L 1 is a peptide linker. In aspects of the present invention, L 1 represents a covalent bond. In aspects of the present invention, L 2 is a peptide linker. In aspects of this invention, L 2 represents a covalent bond. The peptide linker can be any known in the art or described herein (eg, P2A cleavable peptide, XTEN linker, etc.). In aspects of the present invention, the fusion protein contains other components, such as detectable tags. In aspects of the present invention, L 1 is a covalent bond, a peptide linker, a detectable label, or a combination thereof. In aspects of the present invention, L 2 is a covalent bond, a peptide linker, a detectable label, or a combination thereof. In aspects of the present invention, the fusion protein further comprises a nuclear localization sequence. Exemplary fusion proteins containing the B - L 1 - A - L 2 - C structure include p76, p90, p91, p92, p93, p94, p95, p96, p97, p98, p99, p100, p101 and p102 (Fig. . 5)
[0091] В вариантах реализации данного изобретения слитый белок содержит структуру B - L3 - A - L4 - C - L5 - D; где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, D отсутствует или D представляет собой одну или несколько детектируемых меток, L3 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L4 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L5 отсутствует или L5 представляет собой ковалентную связь или пептидный линкер; и где B находится на N-конце, а D находится на C-конце. В аспектах данного изобретения L3 представляет собой пептидный линкер. В аспектах данного изобретения L3 представляет собой ковалентную связь. В аспектах данного изобретения L3 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L3 содержит детектируемую метку. В аспектах данного изобретения L4 представляет собой пептидный линкер. В аспектах данного изобретения L4 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L4 представляет собой ковалентную связь. В аспектах данного изобретения L4 содержит обнаруживаемую метку. В аспектах данного изобретения L5 представляет собой пептидный линкер. В аспектах данного изобретения L5 представляет собой ковалентную связь. В аспектах данного изобретения D содержит один или множество детектируемых меток. В аспектах данного изобретения D содержит одну детектируемую метку. В аспектах данного изобретения D содержит две детектируемых метки. В аспектах данного изобретения D содержит три детектируемых метки. В аспектах данного изобретения D содержит множество детектируемых меток. D может быть любой детектируемой меткой, известной в данной области техники и (или) описанной в данной документе (например, меткой НА, синим флуоресцентным белком и т.п.). В аспектах данного изобретения L5 и D могут отсутствовать. Когда L3, L4, L5 и D содержат две или более детектируемых метки, каждая из детектируемых меток является одинаковой или разной. Пептидный линкер может быть любым, известным в данной области техники и (или) описанным в данном документе (например, пептид, расщепляемый P2A, линкер XTEN и т.п.). В аспектах данного изобретения слитый белок дополнительно содержит последовательность ядерной локализации. Иллюстративные слитые белки, содержащие структуру B - L3 - A - L4 - C - L5 - D, включают в себя p76, p90, p91, p92, p93, p94, p95, p96, p97, p98, p99, p100, p101 и p102, как показано на Фиг. 5. [0091] In embodiments of the present invention, the fusion protein comprises the structure B - L 3 - A - L 4 - C - L 5 - D; where A is an enzyme nuclease-deficient RNA-guided DNA endonuclease; B is a KRAB domain, C is a DNA methyltransferase domain, D is absent or D is one or more detectable tags, L 3 is a covalent bond, a peptide linker, a detectable tag or a combination of two or more of these, L 4 is a covalent a bond, a peptide linker, a detectable label, or a combination of two or more of them, L 5 is absent or L 5 is a covalent bond or peptide linker; and where B is at the N-terminus and D is at the C-terminus. In aspects of the present invention, L 3 is a peptide linker. In aspects of this invention, L 3 represents a covalent bond. In aspects of the present invention, L 3 contains a peptide linker and a detectable label. In aspects of the present invention, L 3 contains a detectable label. In aspects of the present invention, L 4 is a peptide linker. In aspects of the present invention, L 4 contains a peptide linker and a detectable label. In aspects of this invention, L 4 represents a covalent bond. In aspects of the present invention, L 4 contains a detectable label. In aspects of the present invention, L 5 is a peptide linker. In aspects of this invention, L 5 represents a covalent bond. In aspects of the present invention, D contains one or more detectable labels. In aspects of the present invention, D comprises a single detectable label. In aspects of the present invention, D contains two detectable labels. In aspects of the present invention, D contains three detectable labels. In aspects of the present invention, D contains a plurality of detectable labels. D may be any detectable label known in the art and/or described herein (eg, HA tag, blue fluorescent protein, etc.). In aspects of the present invention, L 5 and D may be absent. When L 3 , L 4 , L 5 and D contain two or more detectable marks, each of the detected marks is the same or different. The peptide linker can be any known in the art and/or described herein (eg, P2A cleavable peptide, XTEN linker, etc.). In aspects of the present invention, the fusion protein further comprises a nuclear localization sequence. Exemplary fusion proteins containing the structure B - L 3 - A - L 4 - C - L 5 - D include p76, p90, p91, p92, p93, p94, p95, p96, p97, p98, p99, p100, p101 and p102, as shown in FIG. 5.
[0092] В вариантах реализации данного изобретения слитый белок содержит структуру C - L3 - A - L4 - B - L5 - D, где A представляет собой фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК; B представляет собой домен KRAB, C представляет собой домен метилтрансферазы ДНК, D отсутствует или D содержит одну или несколько детектируемых меток, L3 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L4 представляет собой ковалентную связь, пептидный линкер, детектируемую метку или комбинацию двух или более из них, L5 отсутствует или L5 представляет собой ковалентную связь или пептидный линкер; и где C находится на N-конце, а D находится на C-конце. В аспектах данного изобретения L3 представляет собой пептидный линкер. В аспектах данного изобретения L3 представляет собой ковалентную связь. В аспектах данного изобретения L3 содержит детектируемую метку. В аспектах данного изобретения L3 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L4 представляет собой пептидный линкер. В аспектах данного изобретения L4 представляет собой ковалентную связь. В аспектах данного изобретения L4 содержит обнаруживаемую метку. В аспектах данного изобретения L4 содержит пептидный линкер и детектируемую метку. В аспектах данного изобретения L5 представляет собой пептидный линкер. В аспектах данного изобретения L5 представляет собой ковалентную связь. В аспектах данного изобретения D содержит один или множество детектируемых меток. В аспектах данного изобретения D содержит одну детектируемую метку. В аспектах данного изобретения D содержит две детектируемых метки. В аспектах данного изобретения D содержит три детектируемых метки. В аспектах данного изобретения D содержит множество детектируемых меток. D может быть любой детектируемой меткой, известной в данной области техники и (или) описанной в данной документе (например, меткой НА, синим флуоресцентным белком и т.п.). В аспектах данного изобретения L5 и D могут отсутствовать. Когда L3, L4, L5 и D содержат две или более детектируемых метки, каждая из детектируемых меток является одинаковой или разной. Пептидный линкер может быть любым, известным в данной области техники и (или) описанным в данном документе (например, пептид, расщепляемый P2A, линкер XTEN и т.п.). В аспектах данного изобретения слитый белок дополнительно содержит последовательность ядерной локализации. Иллюстративные слитые белки, содержащие структуру C - L3 - A - L4 - B - L5 - D, включают в себя p112, как показано на Фиг. 5. [0092] In embodiments of the present invention, the fusion protein comprises the structure C - L 3 - A - L 4 - B - L 5 - D, wherein A is an enzyme nuclease-deficient RNA-guided DNA endonuclease; B is a KRAB domain, C is a DNA methyltransferase domain, D is absent or D contains one or more detectable tags, L 3 is a covalent bond, a peptide linker, a detectable tag or a combination of two or more of these, L 4 is a covalent bond , a peptide linker, a detectable label, or a combination of two or more of them, L 5 is absent or L 5 is a covalent bond or a peptide linker; and where C is at the N-terminus and D is at the C-terminus. In aspects of the present invention, L 3 is a peptide linker. In aspects of this invention, L 3 represents a covalent bond. In aspects of the present invention, L 3 contains a detectable label. In aspects of the present invention, L 3 contains a peptide linker and a detectable label. In aspects of the present invention, L 4 is a peptide linker. In aspects of this invention, L 4 represents a covalent bond. In aspects of the present invention, L 4 contains a detectable label. In aspects of the present invention, L 4 contains a peptide linker and a detectable label. In aspects of the present invention, L 5 is a peptide linker. In aspects of this invention, L 5 represents a covalent bond. In aspects of the present invention, D contains one or more detectable labels. In aspects of the present invention, D comprises a single detectable label. In aspects of the present invention, D contains two detectable labels. In aspects of the present invention, D contains three detectable labels. In aspects of the present invention, D contains a plurality of detectable labels. D may be any detectable label known in the art and/or described herein (eg, HA tag, blue fluorescent protein, etc.). In aspects of the present invention, L 5 and D may be absent. When L 3 , L 4 , L 5 and D contain two or more detectable marks, each of the detected marks is the same or different. The peptide linker can be any known in the art and/or described herein (eg, P2A cleavable peptide, XTEN linker, etc.). In aspects of the present invention, the fusion protein further comprises a nuclear localization sequence. Exemplary fusion proteins containing the structure C - L 3 - A - L 4 - B - L 5 - D include p112, as shown in FIG. 5.
[0093] Термин «фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК» и тому подобные относятся в обычном и общепринятом смысле к РНК-направляемой эндонуклеазе ДНК (например, к мутантной форме встречающейся в природе РНК-направляемой эндонуклеазы ДНК), которая нацелена на специфическую фосфодиэфирную связь в полинуклеотиде ДНК, при этом распознаванию фосфодиэфирной связи способствует отдельная полинуклеотидная последовательность (например, последовательность РНК (например, единая гидовая РНК (егРНК)), но которая не способна расщеплять целевую фосфодиэфирную связь до значительной степени (например, отсутствует измеримый разрыв фосфодиэфирной связи в физиологических условиях). Нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, таким образом, сохраняет ДНК-связывающую способность (например, специфическое связывание с целевой последовательностью) при образовании комплекса с полинуклеотидом (например, егРНК), но не обладает значительной эндонуклеазной активностью (например, каким-либо детектируемым уровнем эндонуклеазной активности). В аспектах данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, ddCpf1, нуклеазо-дефицитный вариант Cas9, или нуклеазо-дефицитную эндонуклеазу CRISPR класса II. [0093] The term “enzyme nuclease-deficient RNA-guided DNA endonuclease” and the like refers in the ordinary and accepted sense to an RNA-guided DNA endonuclease (e.g., a mutant form of a naturally occurring RNA-guided DNA endonuclease) that targets a specific phosphodiester bond in a DNA polynucleotide where recognition of the phosphodiester bond is facilitated by a distinct polynucleotide sequence (e.g., an RNA sequence (e.g., single guide RNA (sgRNA))) but which is not capable of cleaving the target phosphodiester bond to a significant extent (e.g., there is no measurable cleavage of the phosphodiester bond under physiological conditions).The nuclease-deficient RNA-guided DNA endonuclease thus retains DNA-binding capacity (e.g., specific binding to a target sequence) when complexed with a polynucleotide (e.g., egRNA), but does not have significant endonuclease activity (e.g. , any detectable level of endonuclease activity). In aspects of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9, ddCpf1, a nuclease-deficient variant of Cas9, or a class II nuclease-deficient CRISPR endonuclease.
[0094] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9. Термины «dCas9» или «белок dCas9» в контексте данного документа относятся к белку Cas9, в котором оба каталитических сайта для эндонуклеазной активности являются дефектными или неактивными. В аспектах данного изобретения белок dCas9 имеет мутации в положениях, соответствующих D10A и H840A в Cas9 от S. pyogenes. В аспектах данного изобретения белок dCas9 лишен эндонуклеазной активности из-за точечных мутаций в обоих каталитических эндонуклеазных сайтах (RuvC и HNH) Cas9 дикого типа. Точечные мутации могут представлять собой D10A и H840A. В аспектах данного изобретения dCas9 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения dCas9 включает в себя аминокислотную последовательность с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 23. В аспектах данного изобретения dCas9 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 23. [0094] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9. The terms “dCas9” or “dCas9 protein” as used herein refer to a Cas9 protein in which both catalytic sites for endonuclease activity are defective or inactive. In aspects of the present invention, the dCas9 protein has mutations at positions corresponding to D10A and H840A in Cas9 from S. pyogenes . In aspects of the present invention, the dCas9 protein lacks endonuclease activity due to point mutations in both catalytic endonuclease sites (RuvC and HNH) of wild-type Cas9. Point mutations may be D10A and H840A. In aspects of the present invention, dCas9 has substantially no detectable endonuclease (eg, endodeoxyribonuclease) activity. In aspects of the present invention, dCas9 includes the amino acid sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has the amino acid sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has an amino acid sequence that is at least 50% 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , is 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 23. In aspects of the present invention, dCas9 has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 23.
[0095] Термины «связанный с CRISPR белок 9», «Cas9», «Csn1» или «белок Cas9» при употреблении в контексте данного документа включают в себя любую из рекомбинантных или встречающихся в природе форм эндонуклеазы Cas9, либо их варианты или гомологи, которые сохраняют эндонуклеазную активность фермента Cas9 (например, в пределах по меньшей мере 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Cas9). В некоторых аспектах данного изобретения варианты или гомологи по меньшей мере на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Cas9, встречающимся в природе. В аспектах данного изобретения белок Cas9 по существу идентичен белку, идентифицированному по регистрационному номеру UniProt Q99ZW2, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 75% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 80% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 85% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 90% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. В аспектах данного изобретения последовательность белка Cas9 по меньшей мере на 95% идентична аминокислотной последовательностью белка, идентифицированного по регистрационному номеру UniProt Q99ZW2. [0095] The terms “CRISPR-associated protein 9,” “Cas9,” “Csn1,” or “Cas9 protein,” as used herein, include any of the recombinant or naturally occurring forms of the Cas9 endonuclease, or variants or homologs thereof, that retain the endonuclease activity of the Cas9 enzyme (e.g., within the range of at least 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99%, or 100% activity compared to Cas9). In some aspects of the invention, variants or homologs are at least 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical in amino acid sequence over the entire length of the sequence, or at a region of the sequence (e.g., over a contiguous region of 50, 100, 150, or 200 amino acids in length) compared to the naturally occurring Cas9 protein. In aspects of the present invention, the Cas9 protein is substantially identical to the protein identified by UniProt accession number Q99ZW2, or a variant or homologue substantially identical to the protein of that accession number. In aspects of the present invention, the Cas9 protein sequence is at least 75% identical to the amino acid sequence of the protein identified by UniProt accession number Q99ZW2. In aspects of the present invention, the Cas9 protein sequence is at least 80% identical to the amino acid sequence of the protein identified by UniProt accession number Q99ZW2. In aspects of the present invention, the Cas9 protein sequence is at least 85% identical to the amino acid sequence of the protein identified by UniProt accession number Q99ZW2. In aspects of the present invention, the Cas9 protein sequence is at least 90% identical to the amino acid sequence of the protein identified by UniProt accession number Q99ZW2. In aspects of the present invention, the Cas9 protein sequence is at least 95% identical to the amino acid sequence of the protein identified by UniProt accession number Q99ZW2.
[0096] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой «ddCpf1» или «ddCas12a». Термины «Cpf1 с мертвой ДНКазой» или «ddCpf1» относятся к Cpf1 из Acidaminococcus sp. (AsCpf1), содержащему мутацию, которая приводит к инактивации ДНКазной активности в Cpf1. В аспектах данного изобретения ddCpf1 включает в себя мутацию E993A в домене RuvC AsCpf1. В аспектах данного изобретения ddCpf1 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения ddCpf1 включает в себя аминокислотную последовательность с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 34. В аспектах данного изобретения ddCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 34. [0096] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is “ddCpf1” or “ddCas12a”. The terms "DNase-dead Cpf1" or "ddCpf1" refer to Cpf1 from Acidaminococcus sp . (AsCpf1), containing a mutation that leads to inactivation of DNase activity in Cpf1. In aspects of the present invention, ddCpf1 includes the E993A mutation in the RuvC domain of AsCpf1. In aspects of the present invention, ddCpf1 has substantially no detectable endonuclease (eg, endodeoxyribonuclease) activity. In aspects of the present invention, ddCpf1 includes the amino acid sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has the amino acid sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has an amino acid sequence that is at least 50% 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , is 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 34. In aspects of the present invention, ddCpf1 has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 34.
[0097] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dLbCpf1. Термин «dLbCpf1» относится к мутированному Cpf1 из бактерии Lachnospiraceae ND2006 (LbCpf1), у которого отсутствует ДНКазная активность. В аспектах данного изобретения dLbCpf1 включает в себя мутацию D832A. В аспектах данного изобретения dLbCpf1 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения dLbCpf1 включает в себя аминокислотную последовательность с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 35. В аспектах данного изобретения dLbCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 35. [0097] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is dLbCpf1. The term "dLbCpf1" refers to mutated Cpf1 from the bacterium Lachnospiraceae ND2006 (LbCpf1), which lacks DNase activity. In aspects of the present invention, dLbCpf1 includes the D832A mutation. In aspects of the present invention, dLbCpf1 has substantially no detectable endonuclease (eg, endodeoxyribonuclease) activity. In aspects of the present invention, dLbCpf1 includes the amino acid sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has the amino acid sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has an amino acid sequence that is at least 50% 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , is 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 35. In aspects of the present invention, dLbCpf1 has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 35.
[0098] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dFnCpf1. Термин «dFnCpf1» относится к мутированному Cpf1 из Francisella novicida U112 (FnCpf1), у которого отсутствует ДНКазная активность. В аспектах данного изобретения dFnCpf1 включает в себя мутацию D917A. В аспектах данного изобретения dFnCpf1 по существу не обладает детектируемой эндонуклеазной (например, эндодезоксирибонуклеазной) активностью. В аспектах данного изобретения dFnCpf1 включает в себя аминокислотную последовательность с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 36. В аспектах данного изобретения dFnCpf1 имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 36. [0098] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is dFnCpf1. The term "dFnCpf1" refers to the mutated Cpf1 from Francisella novicida U112 (FnCpf1), which lacks DNase activity. In aspects of the present invention, dFnCpf1 includes the D917A mutation. In aspects of the present invention, dFnCpf1 has substantially no detectable endonuclease (eg, endodeoxyribonuclease) activity. In aspects of the present invention, dFnCpf1 includes the amino acid sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has the amino acid sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has an amino acid sequence that is at least 50% 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95% , is 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 36. In aspects of the present invention, dFnCpf1 has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 36.
[0099] Термин «Cpf1», или «белок Cpf1», употребляемый в контексте данного документа, включает в себя любую из рекомбинантных или встречающихся в природе форм эндонуклеазы Cpf1 (CRISPR из Prevotella и Francisella 1), или их вариантов или гомологов, которые сохраняют эндонуклеазную активность фермента Cpf1 (например, в пределах по меньшей мере 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% или 100% активности по сравнению с Cpf1). В аспектах данного изобретения варианты или гомологи по меньшей мере на 90%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентичны аминокислотной последовательности по всей длине последовательности, или на участке последовательности (например, на непрерывном участке длиной 50, 100, 150 или 200 аминокислот) по сравнению с белком Cpf1, встречающимся в природе. В аспектах данного изобретения белок Cpf1 по существу идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6, либо варианту или гомологу, по существу идентичному белку с данным регистрационным номером. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 75% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 80% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 85% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 90% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения белок Cpf1 идентичен белку, идентифицированному по регистрационному номеру UniProt U2UMQ6. В аспектах данного изобретения последовательность белка Cpf1 по меньшей мере на 95% идентична аминокислотной последовательности белка, идентифицированного по регистрационному номеру UniProt U2UMQ6. [0099] The term "Cpf1" or "Cpf1 protein" as used herein includes any of the recombinant or naturally occurring forms of the Cpf1 endonuclease (CRISPR from Prevotella and Francisella 1), or variants or homologues thereof that retain endonuclease activity of the Cpf1 enzyme (eg, within the range of at least 50%, 80%, 90%, 95%, 96%, 97%, 98%, 99% or 100% activity compared to Cpf1). In aspects of the present invention, variants or homologs are at least 90%, 95%, 96%, 97%, 98%, 99%, or 100% identical in amino acid sequence over the entire length of the sequence, or at a portion of the sequence ( e.g., over a contiguous stretch of 50, 100, 150, or 200 amino acids in length) compared to the naturally occurring Cpf1 protein. In aspects of the present invention, the Cpf1 protein is substantially identical to the protein identified by UniProt accession number U2UMQ6, or a variant or homolog substantially identical to the protein of that accession number. In aspects of the present invention, the Cpf1 protein is identical to the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein sequence is at least 75% identical to the amino acid sequence of the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein sequence is at least 80% identical to the amino acid sequence of the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein is identical to the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein sequence is at least 85% identical to the amino acid sequence of the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein is identical to the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein sequence is at least 90% identical to the amino acid sequence of the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein is identical to the protein identified by UniProt accession number U2UMQ6. In aspects of the present invention, the Cpf1 protein sequence is at least 95% identical to the amino acid sequence of the protein identified by UniProt accession number U2UMQ6.
[0100] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой нуклеазо-дефицитный вариант Cas9. Термин «нуклеазо-дефицитный вариант Cas9» относится к белку Cas9, имеющему одну или несколько мутаций, которые увеличивают его специфичность связывания с ППМ (англ. «PAM») по сравнению с Cas9 дикого типа, и, кроме того, имеющему мутации, которые делают белок неспособным к эндонуклеазной активности или имеющим серьезно нарушенную эндонуклеазную активность. Не ограничиваясь теорией, считается, что целевая последовательность должна быть связана с ППМ (примыкающий к протоспейсеру мотив); то есть представляет собой короткую последовательность, которая распознается комплексом CRISPR. Требования к точной последовательности и длине для ППМ различаются в зависимости от используемого фермента CRISPR, но ППМ обычно представляют собой последовательности из 2-5 пар оснований, смежные с протоспейсером (то есть с целевой последовательностью). Специфичность связывания нуклеазо-дефицитных вариантов Cas9 с ППМ может быть определена любым методом, известным в данной области техники. Описание и применение известных вариантов Cas9 можно найти, например, в Shmakov et al., Diversity and evolution of class 2 CRISPR-Cas systems. Nat. Rev. Microbiol. 15, 2017, и в Cebrian-Serrano et al, CRISPR-Cas orthologues and variants: optimizing the repertoire, specificity and delivery of genome engineering tools. Mamm. Genome 7-8, 2017, которые во всей своей полноте и для всех целей включены в данный документ посредством ссылки. Иллюстративные варианты Cas9 перечислены в Таблице 4 ниже. [0100] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is a nuclease-deficient variant of Cas9. The term “nuclease-deficient Cas9 variant” refers to a Cas9 protein that has one or more mutations that increase its PAM binding specificity compared to wild-type Cas9, and in addition has mutations that make a protein incapable of endonuclease activity or having seriously impaired endonuclease activity. Without being limited by theory, it is believed that the target sequence should be associated with a PPM (protospacer adjacent motif); that is, it is a short sequence that is recognized by the CRISPR complex. The exact sequence and length requirements for PPMs vary depending on the CRISPR enzyme used, but PPMs are typically 2-5 base pair sequences adjacent to the protospacer (i.e., the target sequence). The binding specificity of nuclease-deficient Cas9 variants to PPM can be determined by any method known in the art. A description and application of known Cas9 variants can be found, for example, in Shmakov et al., Diversity and evolution of class 2 CRISPR-Cas systems. Nat. Rev. Microbiol. 15, 2017, and in Cebrian-Serrano et al, CRISPR-Cas orthologues and variants: optimizing the repertoire, specificity and delivery of genome engineering tools. Mamm. Genome 7-8, 2017, which are incorporated herein by reference in their entirety and for all purposes. Exemplary Cas9 variants are listed in Table 4 below.
[0101] Таблица 4 [0101] Table 4
(Q695A, Q926A, N497A, R661A)SpCas9HF1
(Q695A, Q926A, N497A, R661A)
[0102] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой нуклеазо-дефицитную эндонуклеазу CRISPR класса II. Термин «нуклеазо-дефицитная эндонуклеаза CRISPR класса II», употребляемый в контексте данного документа, относится к любой эндонуклеазе CRISPR класса II, имеющей мутации, приводящие к снижению, нарушению или полной потере эндонуклеазной активности. [0102] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is a class II nuclease-deficient CRISPR endonuclease. The term “class II nuclease-deficient CRISPR endonuclease” as used herein refers to any class II CRISPR endonuclease that has mutations resulting in reduced, impaired, or complete loss of endonuclease activity.
[0103] В вариантах реализации данного изобретения домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. Термин «домен Dnmt3A-3L», употребляемый контексте данного документа, относится к белку, включающему в себя как Dnmt3A, так и Dnmt3L. В аспектах данного изобретения Dnmt3A и Dnmt3L ковалентно связаны. В некоторых аспектах данного изобретения Dnmt3A ковалентно связан с Dnmt3L через пептидный линкер. В аспектах данного изобретения пептидный линкер включает в себя последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер представляет собой последовательность, изложенную в SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения пептидный линкер имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 27. В аспектах данного изобретения домен Dnmt3A-3L включает в себя последовательность, изложенную в SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L представляет собой последовательность, изложенную в SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 33. В аспектах данного изобретения домен Dnmt3A-3L имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 33. [0103] In embodiments of the present invention, the DNA methyltransferase domain is a Dnmt3A-3L domain. The term “Dnmt3A-3L domain” as used herein refers to a protein comprising both Dnmt3A and Dnmt3L. In aspects of the present invention, Dnmt3A and Dnmt3L are covalently linked. In some aspects of the present invention, Dnmt3A is covalently linked to Dnmt3L via a peptide linker. In aspects of the present invention, the peptide linker includes the sequence set forth in SEQ ID NO: 27. In aspects of the present invention, the peptide linker is the sequence set forth in SEQ ID NO: 27. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least at least by 50%, by 55%, by 60%, by 65%, by 70%, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 27. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 27. In aspects of the present invention, the peptide linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 27. In aspects of the present invention, the Dnmt3A-3L domain includes the sequence, set forth in SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain is the sequence set forth in SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain has an amino acid sequence that is at least 50% %, by 60%, by 65%, by 70%, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain has an amino acid sequence that is at least 75% identical to the sequence with SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain has an amino acid sequence that is at least is 85% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 33. In aspects of the present invention, the Dnmt3A-3L domain has an amino acid sequence a sequence that is at least 95% identical to the sequence of SEQ ID NO: 33.
[0104] В вариантах реализации данного изобретения пептидный линкер представляет собой линкер XTEN. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 17 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 18 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 19 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 20 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 30 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 40 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 50 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 60 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 70 до около 80 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 70 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 60 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 50 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 40 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 35 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 30 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 25 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя от около 16 до около 20 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 16 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 17 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 18 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 19 аминокислотных остатков. В аспектах данного изобретения линкер XTEN включает в себя около 20 аминокислотных остатков. [0104] In embodiments of the present invention, the peptide linker is an XTEN linker. In aspects of the present invention, the XTEN linker includes from about 16 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 17 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 18 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 19 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 20 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 30 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 40 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 50 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 60 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 70 to about 80 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 70 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 60 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 50 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 40 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 35 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 30 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 25 amino acid residues. In aspects of the present invention, the XTEN linker includes from about 16 to about 20 amino acid residues. In aspects of the present invention, the XTEN linker includes about 16 amino acid residues. In aspects of the present invention, the XTEN linker includes about 17 amino acid residues. In aspects of the present invention, the XTEN linker includes about 18 amino acid residues. In aspects of the present invention, the XTEN linker includes about 19 amino acid residues. In aspects of the present invention, the XTEN linker includes about 20 amino acid residues.
[0105] В вариантах реализации данного изобретения линкер XTEN включает в себя последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 32. [0105] In embodiments of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker includes sequence set forth in SEQ ID NO: 32. In aspects of the present invention, the XTEN linker is the sequence set forth in SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96% , is 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 31 In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 31. : 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 32 In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 32. : 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 32.
[0106] Слитый белок может включать в себя аминокислотные последовательности, пригодные для нацеливания слитого белка на определенные области клетки (например, цитоплазму, ядро). Таким образом, в аспектах данного изобретения слитый белок дополнительно включает в себя пептид сигнала ядерной локализации (СЯЛ). В аспектах данного изобретения СЯЛ включает в себя последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ представляет собой последовательность, изложенную в SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98%, на 99% или на 100% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 25. В аспектах данного изобретения СЯЛ имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 25. [0106] The fusion protein may include amino acid sequences suitable for targeting the fusion protein to specific regions of the cell (eg, cytoplasm, nucleus). Thus, in aspects of the present invention, the fusion protein further includes a nuclear localization signal (NLS) peptide. In aspects of the present invention, the SNL includes the sequence set forth in SEQ ID NO: 25. In aspects of the present invention, the SNL is the sequence set forth in SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 50 %, by 55%, by 60%, by 65%, by 70%, by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, is 95%, 96%, 97%, 98%, 99%, or 100% identical to the sequence of SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 75% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 80% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 85% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 90% identical to the sequence with SEQ ID NO: 25. In aspects of the present invention, the SNL has an amino acid sequence that is at least 95% identical to the sequence with SEQ ID NO: 25.
[0107] В вариантах реализации данного изобретения слитый белок включает в себя в направлении от N-конца до C-конца домен KRAB, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен метилтрансферазы ДНК. [0107] In embodiments of the present invention, the fusion protein includes, in an N-terminal to C-terminal direction, a KRAB domain, a nuclease-deficient RNA-guided DNA endonuclease enzyme, and a DNA methyltransferase domain.
[0108] В вариантах реализации данного изобретения фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0108] In embodiments of the present invention, the nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9 and the DNA methyltransferase domain is Dnmt3A-3L domain.
[0109] В вариантах реализации данного изобретения dCas9 ковалентно связан с доменом KRAB через пептидный линкер, и при этом dCas9 ковалентно связан с доменом Dnmt3A-3L через пептидный линкер. [0109] In embodiments of the present invention, dCas9 is covalently linked to the KRAB domain via a peptide linker, and wherein dCas9 is covalently linked to the Dnmt3A-3L domain via a peptide linker.
[0110] В вариантах реализации данного изобретения пептидный линкер представляет собой линкер XTEN. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 31. В аспектах данного изобретения линкер XTEN включает в себя последовательность, изложенную SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN представляет собой последовательность, изложенную в SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 32. В аспектах данного изобретения линкер XTEN имеет аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 32. [0110] In embodiments of the present invention, the peptide linker is an XTEN linker. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker is the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least is at least 75% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 31. In aspects of the present invention, the XTEN linker has an amino acid sequence which is at least 95% identical to the sequence set forth in SEQ ID NO: 31. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: 32. In aspects of the present invention, the XTEN linker includes the sequence set forth in SEQ ID NO: : 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 90% identical to the sequence with SEQ ID NO: 32. In aspects of the present invention, the XTEN linker has an amino acid sequence that is at least 95% identical to the sequence with SEQ ID NO: 32.
[0111] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 1. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 2. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 3. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 4. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 5. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 6. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 7. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 8. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 9. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 10. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 11. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 12. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 13. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 14. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность с SEQ ID NO: 15. В аспектах данного изобретения слитый белок представляет собой аминокислотную последовательность с SEQ ID NO: 15. [0111] In embodiments of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein is an amino acid sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: : 2. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes the amino acid the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein is is the amino acid sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 7. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 7. In aspects of the present invention, the fusion protein is the protein includes the amino acid sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein is of the amino acid sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: : 12. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 12. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes the amino acid sequence of SEQ ID NO: 15. In aspects of the present invention, the fusion protein is the amino acid sequence of SEQ ID NO: 15.
[0112] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75%, на 80%, на 81%, на 82%, на 83%, на 84%, на 85%, на 86%, на 87%, на 88%, на 89%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 15. [0112] In embodiments of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86 %, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or is 99% identical to the sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes an amino acid a sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% sequence identical to SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98 % or 99% identical to the sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, by 84%, by 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96 %, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, by 82%, by 83%, by 84%, by 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94 %, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to SEQ ID NO: 5. by 80%, by 81%, by 82%, by 83%, by 84%, by 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92 %, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes an amino acid sequence, which is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90 %, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 7. In aspects of the present invention the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88 %, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence with SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86 %, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or is 99% identical to the sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84 %, by 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, is 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82 %, by 83%, by 84%, by 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, is 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80 %, by 81%, by 82%, by 83%, by 84%, by 85%, by 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 12. In aspects of the present invention, the fusion protein includes an amino acid sequence that at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, 87%, 88%, 89%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence with SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75%, 80%, 81%, 82%, 83%, 84%, 85%, 86%, by 87%, by 88%, by 89%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or by 99 % identical to the sequence with SEQ ID NO: 15.
[0113] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 75% идентична последовательности с SEQ ID NO: 15. [0113] In embodiments of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes an amino acid sequence, which is at least 75% identical to the sequence of SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence with SEQ ID NO: 7. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least is 75% identical to the sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes an amino acid a sequence that is at least 75% identical to the sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 12. In aspects of the present invention the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 75% identical to the sequence of SEQ ID NO: 15.
[0114] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 80% идентична последовательности с SEQ ID NO: 15. [0114] In embodiments of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes an amino acid sequence, which is at least 80% identical to the sequence of SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 7. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least is 80% identical to the sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes an amino acid a sequence that is at least 80% identical to the sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 12. In aspects of the present invention the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 80% identical to the sequence of SEQ ID NO: 15.
[0115] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 85% идентична последовательности с SEQ ID NO: 15. [0115] In embodiments of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes an amino acid sequence, which is at least 85% identical to the sequence of SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 7. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least is 85% identical to the sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes an amino acid a sequence that is at least 85% identical to the sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 12. In aspects of the present invention the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 85% identical to the sequence of SEQ ID NO: 15.
[0116] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 90% идентична последовательности с SEQ ID NO: 15. [0116] In embodiments of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes an amino acid sequence, which is at least 90% identical to the sequence of SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence with SEQ ID NO: 7. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least is 90% identical to the sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes an amino acid a sequence that is at least 90% identical to the sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 12. In aspects of the present invention the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 90% identical to the sequence of SEQ ID NO: 15.
[0117] В вариантах реализации данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 1. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 2. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 3. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 4. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 5. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 6. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 7. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 8. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 9. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 10. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 11. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 12. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 13. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 14. В аспектах данного изобретения слитый белок включает в себя аминокислотную последовательность, которая по меньшей мере на 95% идентична последовательности с SEQ ID NO: 15. [0117] In embodiments of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, or 15. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 1. In aspects of the present invention, the fusion protein includes an amino acid sequence, which is at least 95% identical to the sequence of SEQ ID NO: 2. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 3. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 4. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 5. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 6. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 7. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 8. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least is 95% identical to the sequence of SEQ ID NO: 9. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 10. In aspects of the present invention, the fusion protein includes an amino acid a sequence that is at least 95% identical to the sequence of SEQ ID NO: 11. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 12. In aspects of the present invention the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 13. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 14. In aspects of the present invention, the fusion protein includes an amino acid sequence that is at least 95% identical to the sequence of SEQ ID NO: 15.
[0118] Комплексы [0118] Complexes
[0119] Для того, чтобы слитый белок мог выполнять редактирование эпигенома, слитый белок взаимодействует с (например, нековалентно связан с) полинуклеотидом (например, егРНК), который комплементарен целевой полинуклеотидной последовательности (например, целевой последовательности ДНК, которая должна быть отредактирована) и, кроме того, включает в себя последовательность (т.е. последовательность связывания), с которой может связываться фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, как описано в данном документе. Путем образования такого комплекса, гибридный белок соответствующим образом позиционируется для выполнения редактирования эпигенома. Термин «комплекс» относится к композиции, которая включает в себя два или более компонента, при этом компоненты связываются вместе и образуют функциональную единицу. В аспектах данного изобретения описанный в данном документе комплекс включает в себя слитый белок, описанный в данном документе, и полинуклеотид, описанный в данном документе. Таким образом, в одном аспекте данного изобретения представлен слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, и полинуклеотид, включающий в себя: (1) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (2) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность (например, аминокислотную последовательность, способную связываться с нацеливающей последовательностью ДНК). [0119] In order for a fusion protein to perform epigenome editing, the fusion protein interacts with (eg, is non-covalently linked to) a polynucleotide (eg, segRNA) that is complementary to the target polynucleotide sequence (eg, the target DNA sequence to be edited) and further includes a sequence (ie, a binding sequence) to which a nuclease-deficient RNA-guided DNA endonuclease enzyme, as described herein, can bind. By forming such a complex, the fusion protein is appropriately positioned to perform epigenome editing. The term "complex" refers to a composition that includes two or more components, wherein the components bind together to form a functional unit. In aspects of the present invention, the complex described herein includes a fusion protein described herein and a polynucleotide described herein. Thus, in one aspect of the present invention there is provided a fusion protein as described herein, inclusive of its embodiments and aspects, and a polynucleotide comprising: (1) a DNA targeting sequence that is complementary to the target polynucleotide sequence; and (2) a binding sequence for a nuclease-deficient RNA-directed DNA endonuclease enzyme, wherein the nuclease-deficient RNA-directed DNA endonuclease enzyme is linked to the polynucleotide through a binding sequence (e.g., an amino acid sequence capable of binding to a DNA targeting sequence).
[0120] Нацеливающая на ДНК последовательность относится к полинуклеотиду, который включает в себя нуклеотидную последовательность, комплементарную целевой полинуклеотидной последовательности (ДНК или РНК). В аспектах данного изобретения нацеливающая на ДНК последовательность может быть единой молекулой РНК (одиночным полинуклеотидом РНК), которая может включать в себя «единую гидовую РНК» или «егРНК». В аспектах данного изобретения нацеливающая на ДНК последовательность включает в себя две молекулы РНК (например, соединенные вместе посредством гибридизации по месту связывающей последовательности (например, по месту dCas9-связывающей последовательности). В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% комплементарна целевой полинуклеотидной последовательности. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по меньшей мере на 50%, на 55%, на 60%, на 65%, на 70%, на 75%, на 80%, на 85%, на 90%, на 95%, на 96%, на 97%, на 98% или на 99% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 75% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 80% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 85% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 90% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) по крайней мере на 95% комплементарна последовательности клеточного гена. В аспектах данного изобретения нацеливающая на ДНК последовательность (например, егРНК) связывает последовательность клеточного гена. [0120] A DNA targeting sequence refers to a polynucleotide that includes a nucleotide sequence complementary to the target polynucleotide sequence (DNA or RNA). In aspects of the present invention, the DNA targeting sequence may be a single RNA molecule (single RNA polynucleotide), which may include a "single guide RNA" or "sgRNA". In aspects of the present invention, the DNA targeting sequence includes two RNA molecules (eg, joined together by hybridization at the site of a binding sequence (eg, at the site of a dCas9 binding sequence). In aspects of the present invention, the DNA targeting sequence (eg, egRNA) at at least 50%, 55%, 60%, 65%, 70%, 75%, 80%, 85%, 90%, 95%, 96%, 97%, is 98% or 99% complementary to the target polynucleotide sequence. In aspects of the present invention, the DNA targeting sequence (e.g., sgRNA) is at least 50%, 55%, 60%, 65%, 70%, 75 %, 80%, 85%, 90%, 95%, 96%, 97%, 98%, or 99% complementary to a cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (e.g., egRNA ) binds a cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sRNA) is at least 75% complementary to the cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sgRNA) is at least 80% complementary to the cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sRNA) binds a cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sgRNA) is at least 85% complementary to the cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sRNA) binds a cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sgRNA) is at least 90% complementary to the cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sRNA) binds a cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sgRNA) is at least 95% complementary to the cellular gene sequence. In aspects of the present invention, the DNA targeting sequence (eg, sRNA) binds a cellular gene sequence.
[0121] «Целевая полинуклеотидная последовательность», как предусмотрено в данном документе, представляет собой последовательность нуклеиновой кислоты, которая присутствует в клетке или экспрессируется ею, для которой сконструирована комплементарная направляющая последовательность (или нацеливающая на ДНК последовательность), при этом гибридизация между целевой последовательностью и направляющей последовательностью (или нацеливающей на ДНК последовательностью) способствует образованию комплекса CRISPR. Полная комплементарность не обязательно требуется при условии, что комплементарность достаточна, чтобы вызвать гибридизацию и способствовать образованию комплекса CRISPR. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой экзогенную последовательность нуклеиновой кислоты. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой эндогенную последовательность нуклеиновой кислоты. [0121] A "target polynucleotide sequence" as provided herein is a nucleic acid sequence that is present in or expressed by a cell for which a complementary targeting sequence (or DNA targeting sequence) is designed, wherein hybridization between the target sequence and guide sequence (or DNA targeting sequence) promotes the formation of the CRISPR complex. Full complementarity is not necessarily required as long as the complementarity is sufficient to induce hybridization and promote CRISPR complex formation. In aspects of the present invention, the target polynucleotide sequence is an exogenous nucleic acid sequence. In aspects of the present invention, the target polynucleotide sequence is an endogenous nucleic acid sequence.
[0122] Целевая полинуклеотидная последовательность может представлять собой любую область полинуклеотида (например, последовательность ДНК), подходящую для редактирования эпигенома. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть гена. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть транскрипционной регуляторной последовательности. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть промотора. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть энхансера. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой часть сайленсера. [0122] The target polynucleotide sequence can be any region of a polynucleotide (eg, a DNA sequence) suitable for epigenome editing. In aspects of the present invention, the target polynucleotide sequence is part of a gene. In aspects of the present invention, the target polynucleotide sequence is part of a transcriptional regulatory sequence. In aspects of the present invention, the target polynucleotide sequence is part of a promoter, enhancer, or silencer. In aspects of the present invention, the target polynucleotide sequence is part of a promoter. In aspects of the present invention, the target polynucleotide sequence is part of an enhancer. In aspects of the present invention, the target polynucleotide sequence is part of a silencer.
[0123] В вариантах реализации данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность гипометилированной нуклеиновой кислоты. Термин «последовательность гипометилированной нуклеиновой кислоты» употребляется в контексте данного документа в соответствии со стандартным значением в данной области техники и относится к потере или отсутствию метильных групп в 5-метилцитозиновом нуклеотиде (например, в CpG). Потеря или отсутствие метильных групп может быть относительно стандартного контроля. Гипометилирование может происходить, например, в стареющих клетках или при онкологическом заболевании (например, на ранних стадиях неоплазии) по сравнению с более молодой клеткой или нераковой клеткой, соответственно. Таким образом, комплекс может быть полезен для восстановления нормальных (например, незрелых или здоровых) уровней метилирования. [0123] In embodiments of the present invention, the target polynucleotide sequence is a hypomethylated nucleic acid sequence. The term “hypomethylated nucleic acid sequence” is used herein according to its standard meaning in the art and refers to the loss or absence of methyl groups on a 5-methylcytosine nucleotide (eg, a CpG). The loss or absence of methyl groups may be relative to the standard control. Hypomethylation may occur, for example, in aging cells or in cancer (eg, early stages of neoplasia) compared to a younger cell or non-cancerous cell, respectively. Thus, the complex may be useful in restoring normal (eg, immature or healthy) methylation levels.
[0124] В вариантах реализации данного изобретения целевая полинуклеотидная последовательность находится в пределах около 3000 пар оснований (п.о.), фланкирующих сайт начала транскрипции. В аспектах данного изобретения целевая полинуклеотидная последовательность находится в пределах около 3000, около 2900, около 2800, около 2700, около 2600, около 2500, около 2400, около 2300, около 2200, около 2100, около 2000, около 1900, около 1800, около 1700, около 1600, около 1500, около 1400, около 1300, около 1200, около 1100, около 1000, около 900, около 800, около 700, около 600, около 500, около 400, около 300, около 200 или около 100 пар оснований (п.о.), фланкирующих сайт начала транскрипции. [0124] In embodiments of the present invention, the target polynucleotide sequence is within about 3000 base pairs (bp) flanking the transcription start site. In aspects of the present invention, the target polynucleotide sequence is within about 3000, about 2900, about 2800, about 2700, about 2600, about 2500, about 2400, about 2300, about 2200, about 2100, about 2000, about 1900, about 1800, about 1700, about 1600, about 1500, about 1400, about 1300, about 1200, about 1100, about 1000, about 900, about 800, about 700, about 600, about 500, about 400, about 300, about 200 or about 100 pairs bases (bp) flanking the transcription start site.
[0125] В вариантах реализации данного изобретения целевая полинуклеотидная последовательность находится рядом с промоторной последовательностью, рядом с ней или внутри нее. В аспектах данного изобретения целевая полинуклеотидная последовательность находится внутри островка CpG. В аспектах данного изобретения известно, что целевая полинуклеотидная последовательность связана с заболеванием или патологическим состоянием, характеризующимся гипометилированием ДНК. [0125] In embodiments of the present invention, the target polynucleotide sequence is adjacent to, adjacent to, or within the promoter sequence. In aspects of the present invention, the target polynucleotide sequence is located within a CpG island. In aspects of the present invention, the target polynucleotide sequence is known to be associated with a disease or condition characterized by DNA hypomethylation.
[0126] В вариантах реализации данного изобретения иллюстративные целевые полинуклеотидные последовательности включают в себя последовательности, описанные в Таблицах 1 и 2. В аспектах данного изобретения целевая полинуклеотидная последовательность включает в себя последовательность с SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93 или 95. В аспектах данного изобретения целевая полинуклеотидная последовательность включает в себя аминокислотную последовательность, которая по меньшей мере на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93 или 95. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 95. [0126] In embodiments of the present invention, exemplary target polynucleotide sequences include those described in Tables 1 and 2. In aspects of the present invention, the target polynucleotide sequence includes the sequence of SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65, 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93 or 95. In aspects of the present invention, the target polynucleotide sequence includes an amino acid sequence that is at least 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to SEQ ID NO: 37, 39, 41, 43, 45, 47, 49, 51, 53, 55, 57, 59, 61, 63, 65 , 67, 69, 71, 73, 75, 77, 79, 81, 83, 85, 87, 89, 91, 93, or 95. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 37. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 39. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 41. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 43. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 45. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 47. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 49. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 51. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 53. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 55 In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 57. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 59. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 61. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 63. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 65. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: : 67. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 69. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 71. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 73. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 75. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 77. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 79. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 81. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 83. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 85. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 87. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 89. In aspects of the present invention, the target polynucleotide sequence is the sequence with SEQ ID NO: 91. In aspects of the present invention, the target polynucleotide sequence is the sequence with SEQ ID NO: 93. In aspects of the present invention, the target polynucleotide sequence is the sequence with SEQ ID NO: 95.
[0127] В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 75%, на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 95. [0127] In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 37. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 39. In aspects of the present invention, the target polynucleotide sequence at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98% or 99% identical to the sequence of SEQ ID NO: 41. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93% , is 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 43. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 45. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, is 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 47. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, is 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 49. In aspects of the present invention, the target polynucleotide sequence is at least by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or by 99 % identical to the sequence of SEQ ID NO: 51. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 53. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85 %, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 55. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, is 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 57. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, is 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 59. In aspects of the present invention, the target polynucleotide sequence is at least by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or by 99 % identical to the sequence of SEQ ID NO: 61. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 63. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85 %, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 65. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, is 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 67. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, is 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 69. In aspects of the present invention, the target polynucleotide sequence is at least by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or by 99 % identical to the sequence of SEQ ID NO: 71. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 73. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85 %, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 75. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, is 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 77. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, is 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 79. In aspects of the present invention, the target polynucleotide sequence is at least by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or by 99 % identical to the sequence of SEQ ID NO: 81. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 83. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85 %, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 85. In aspects of the invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94%, 95%, 96%, is 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 87. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, is 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 89. In aspects of the present invention, the target polynucleotide sequence is at least by 75%, by 80%, by 85%, by 90%, by 91%, by 92%, by 93%, by 94%, by 95%, by 96%, by 97%, by 98% or by 99 % identical to the sequence of SEQ ID NO: 91. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85%, 90%, 91%, 92%, 93%, 94 %, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 93. In aspects of the present invention, the target polynucleotide sequence is at least 75%, 80%, 85 %, 90%, 91%, 92%, 93%, 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence of SEQ ID NO: 95.
[0128] В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 90% идентична последовательности с SEQ ID NO: 95. [0128] In aspects of this invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 37. In aspects of this invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 39. In aspects of this of the invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 41. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 43. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 45. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 47. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 49. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 51. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 53. In aspects of the present invention the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 55. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 57. In aspects of the present invention, the target polynucleotide sequence is at least is 90% identical to the sequence of SEQ ID NO: 59. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 61. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 63. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 65. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 67. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 69. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 71. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 71. the sequence is at least 90% identical to the sequence of SEQ ID NO: 73. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 75. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 75. % identical to the sequence of SEQ ID NO: 77. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 79. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 81. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 83. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 85. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 87. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 89. In aspects of the present invention, the target polynucleotide sequence of is at least 90% identical to the sequence of SEQ ID NO: 91. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical to the sequence of SEQ ID NO: 93. In aspects of the present invention, the target polynucleotide sequence is at least 90% identical sequences with SEQ ID NO: 95.
[0129] В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 37. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 39. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 41. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 43. В аспектах данного изобретения целевая полинуклеотидная последовательность представляет собой последовательность с SEQ ID NO: 45. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 47. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 49. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 51. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 53. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 55. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 57. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 59. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 61. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 63. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 65. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 67. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 69. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 71. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 73. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 75. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 77. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 79. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 81. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 83. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 85. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 87. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 89. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 91. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 93. В аспектах данного изобретения целевая полинуклеотидная последовательность по меньшей мере на 95% идентична последовательности с SEQ ID NO: 95. [0129] In aspects of this invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 37. In aspects of this invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 39. In aspects of this of the invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 41. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 43. In aspects of the present invention, the target polynucleotide sequence is the sequence of SEQ ID NO: 45. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 47. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 49. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 51. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 53. In aspects of the present invention the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 55. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 57. In aspects of the present invention, the target polynucleotide sequence is at least is 95% identical to the sequence of SEQ ID NO: 59. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 61. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 63. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 65. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 67. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 69. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 71. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 71. the sequence is at least 95% identical to the sequence of SEQ ID NO: 73. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 75. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 75. % identical to the sequence of SEQ ID NO: 77. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 79. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 81. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 83. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 85. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 87. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 89. In aspects of the present invention, the target polynucleotide sequence of is at least 95% identical to the sequence of SEQ ID NO: 91. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 93. In aspects of the present invention, the target polynucleotide sequence is at least 95% identical to the sequence of SEQ ID NO: 93. sequences with SEQ ID NO: 95.
[0130] В вариантах реализации данного изобретения комплекс включает в себя dCas9, связанный с полинуклеотидом посредством связывания связывающей последовательности полинуклеотида и формирующий, таким образом, рибонуклеопротеидный комплекс. В аспектах данного изобретения связывающая последовательность образует шпилечную структуру. В аспектах данного изобретения связывающая последовательность составляет в длину 30-100 нуклеотидов, 35-50 нуклеотидов, 37-47 нуклеотидов или 42 нуклеотида. [0130] In embodiments of the present invention, the complex includes dCas9 associated with a polynucleotide by binding to a polynucleotide binding sequence, thereby forming a ribonucleoprotein complex. In aspects of the present invention, the binding sequence forms a hairpin structure. In aspects of the present invention, the binding sequence is 30-100 nucleotides, 35-50 nucleotides, 37-47 nucleotides, or 42 nucleotides in length.
[0131] В вариантах реализации данного изобретения связывающая последовательность (например, Cas9-связывающая последовательность) взаимодействует или связывается с белком Cas9 (например, с белком dCas9), и вместе они связываются с целевой полинуклеотидной последовательностью, которая распознается нацеливающей на ДНК последовательностью. Связывающая последовательность (например, Cas9-связывающая последовательность) включает в себя два комплементарных участка нуклеотидов, которые гибридизуются друг с другом с образованием дуплекса двухцепочечной РНК (дуплекс дцРНК). Эти два комплементарных участка нуклеотидов могут быть ковалентно связаны посредством промежуточных нуклеотидов, известных как линкеры или линкерные нуклеотиды (например, в случае одномолекулярного полинуклеотида), и гибридизоваться с образованием дуплекса двухцепочечной РНК (дуплекс дцРНК, или «Cas9-связывающая шпилька») связывающей последовательности (например, Cas9-связывающей последовательности), что приводит к формированию структуры стержень - петля. Альтернативно, в некоторых аспектах данного изобретения два комплементарных участка нуклеотидов могут не быть ковалентно связаны, а вместо этого удерживаются вместе посредством гибридизации между комплементарными последовательностями (например, в случае двухмолекулярного полинуклеотида). [0131] In embodiments of the present invention, a binding sequence (eg, a Cas9 binding sequence) interacts or binds to a Cas9 protein (eg, a dCas9 protein), and together they bind to a target polynucleotide sequence that is recognized by the DNA targeting sequence. A binding sequence (eg, a Cas9 binding sequence) includes two complementary stretches of nucleotides that hybridize to each other to form a double-stranded RNA duplex (dsRNA duplex). These two complementary stretches of nucleotides can be covalently linked through intermediate nucleotides known as linkers or linker nucleotides (for example, in the case of a single-molecule polynucleotide), and hybridize to form a double-stranded RNA duplex (dsRNA duplex, or "Cas9-binding hairpin") binding sequence ( for example, the Cas9-binding sequence), which leads to the formation of a stem-loop structure. Alternatively, in some aspects of the present invention, two complementary nucleotide regions may not be covalently linked, but instead are held together by hybridization between complementary sequences (eg, in the case of a two-molecule polynucleotide).
[0132] Связывающая последовательность (например, Cas9-связывающая последовательность) может иметь длину от 10 нуклеотидов до 100 нуклеотидов, например, от 10 нуклеотидов (нт) до 20 нт, от 20 нт до 30 нт, от 30 нт до 40 нт, от 40 нт до 50 нт, от 50 нт до 60 нт, от 60 нт до 70 нт, от 70 нт до 80 нт, от 80 нт до 90 нт или от 90 нт до 100 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нуклеотидов (нт) до 80 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 50 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 40 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 30 нт. В аспектах данного изобретения связывающая последовательность имеет длину от 37 нт до 47 нт (например, 42 нт). В аспектах данного изобретения связывающая последовательность имеет длину от 15 нт до 25 нт. [0132] The binding sequence (e.g., a Cas9 binding sequence) may be from 10 nucleotides to 100 nucleotides in length, e.g., 10 nucleotides (nt) to 20 nt, 20 nt to 30 nt, 30 nt to 40 nt, 40 nt to 50 nt, from 50 nt to 60 nt, from 60 nt to 70 nt, from 70 nt to 80 nt, from 80 nt to 90 nt or from 90 nt to 100 nt. In aspects of the present invention, the binding sequence is between 15 nucleotides (nt) and 80 nt in length. In aspects of the present invention, the binding sequence is between 15 nt and 50 nt in length. In aspects of the present invention, the binding sequence is between 15 nt and 40 nt in length. In aspects of the present invention, the binding sequence is between 15 nt and 30 nt in length. In aspects of the present invention, the binding sequence is between 37 nt and 47 nt in length (eg, 42 nt). In aspects of the present invention, the binding sequence is between 15 nt and 25 nt in length.
[0133] Дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) может иметь длину от 6 пар оснований (п.о.) до 50 п.о. Например, дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) может иметь длину от 6 п.о. до 40 п.о., от 6 п.о. до 30 п.о., от 6 п.о. до 25 п.о., от 6 п.о. до 20 п.о., от 6 п.о. до 15 п.о., от 8 п.о. до 40 п.о., от 8 п.о. до 30 п.о., от 8 п.о. до 25 п.о., от 8 п.о. до 20 п.о. или от 8 п.о. до 15 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 8 п.о. до 10 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 10 п.о. до 15 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 15 п.о. до 18 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 18 п.о. до 20 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 20 п.о. до 25 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 25 п.о. до 30 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 30 п.о. до 35 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 35 п.о. до 40 п.о. В аспектах данного изобретения дуплекс дцРНК связывающей последовательности (например, Cas9-связывающей последовательности) имеет длину от 40 п.о. до 50 п.о. [0133] The duplex of a dsRNA binding sequence (eg, a Cas9 binding sequence) can be from 6 base pairs (bp) to 50 bp in length. For example, a duplex of a dsRNA binding sequence (eg, a Cas9 binding sequence) can be as long as 6 bp. up to 40 bp, from 6 bp up to 30 bp, from 6 bp up to 25 bp, from 6 bp up to 20 bp, from 6 bp up to 15 bp, from 8 bp up to 40 bp, from 8 bp up to 30 bp, from 8 bp up to 25 bp, from 8 bp up to 20 p.o. or from 8 p.o. up to 15 p.o. In aspects of the present invention, the duplex dsRNA binding sequence (eg, Cas9 binding sequence) is between 8 bp in length. up to 10 p.o. In aspects of the present invention, the dsRNA duplex binding sequence (eg, Cas9 binding sequence) is between 10 bp in length. up to 15 p.o. In aspects of the present invention, the duplex dsRNA binding sequence (eg, Cas9 binding sequence) has a length of from 15 bp. up to 18 p.o. In aspects of the present invention, the duplex dsRNA binding sequence (eg, Cas9 binding sequence) has a length of from 18 bp. up to 20 p.o. In aspects of the present invention, the duplex dsRNA binding sequence (eg, Cas9 binding sequence) is between 20 bp in length. up to 25 p.o. In aspects of the present invention, the dsRNA duplex binding sequence (eg, Cas9 binding sequence) is between 25 bp in length. up to 30 p.o. In aspects of the present invention, the dsRNA duplex binding sequence (eg, Cas9 binding sequence) is between 30 bp in length. up to 35 p.o. In aspects of the present invention, the duplex dsRNA binding sequence (eg, Cas9 binding sequence) has a length of from 35 bp. up to 40 p.o. In aspects of the present invention, the duplex dsRNA binding sequence (eg, Cas9 binding sequence) is between 40 bp in length. up to 50 bp
[0134] В вариантах реализации данного изобретения иллюстративный полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя те полинуклеотиды, которые описаны в Таблицах 1 и 2 как егРНК. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92 или 94, или их соответствующие последовательности РНК. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность, которая по меньшей мере на 80%, на 85%, на 90%, на 91%, на 92%, на 93%, на 94%, на 95%, на 96%, на 97%, на 98% или на 99% идентична последовательности с SEQ ID NO: 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92 или 94, или их соответствующим последовательностям РНК. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 38. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 40. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 42. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 44. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 46. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 48. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 50. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 52. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 54. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 56. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 58. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 60. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 62. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 64. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 66. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 68. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 70. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 72. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 74. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 76. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 78. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 80. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 82. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 84. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 86. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 88. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 90. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 92. В аспектах данного изобретения полинуклеотид, который образует комплекс со слитым белком, описанным в данном документе, включает в себя последовательность с SEQ ID NO: 94. [0134] In embodiments of the present invention, an exemplary polynucleotide that forms a complex with a fusion protein described herein includes those polynucleotides described in Tables 1 and 2 as sgRNA. In aspects of the present invention, the polynucleotide that forms a complex with the fusion protein described herein includes the sequence of SEQ ID NO: 38, 40, 42, 44, 46, 48, 50, 52, 54, 56, 58, 60 , 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92, or 94, or their corresponding RNA sequences. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes a sequence that is at least 80%, 85%, 90%, 91%, 92%, 93% , 94%, 95%, 96%, 97%, 98%, or 99% identical to the sequence with SEQ ID NO: 38, 40, 42, 44, 46, 48, 50, 52, 54, 56 , 58, 60, 62, 64, 66, 68, 70, 72, 74, 76, 78, 80, 82, 84, 86, 88, 90, 92 or 94, or their corresponding RNA sequences. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 38. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 40. In aspects of the present invention, the polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 42. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein, described herein includes the sequence of SEQ ID NO: 44. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 46. In aspects of the present invention, the polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 48. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: : 50. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 52. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 54. In aspects of the present invention, the polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 56. In aspects of the present invention, the polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 58. In aspects of the invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 60. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 62. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes a sequence with SEQ ID NO: 64. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 66. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described in herein includes the sequence of SEQ ID NO: 68. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 70. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 72. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 74 In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 76. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes includes the sequence of SEQ ID NO: 78. In aspects of the present invention, the polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 80. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 82. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 84. In aspects of the present invention a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 86. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 86. NO: 88. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 90. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein , includes the sequence of SEQ ID NO: 92. In aspects of the present invention, a polynucleotide that forms a complex with a fusion protein described herein includes the sequence of SEQ ID NO: 94.
[0135] Нуклеиновые кислоты и векторы [0135] Nucleic acids and vectors
[0136] Слитый белок, описанный в данном документе, включительно с его вариантами реализации и аспектами, может быть представлен в виде последовательности нуклеиновой кислоты, кодирующей слитый белок. Таким образом, в одном аспекте данного изобретения представлена последовательность нуклеиновой кислоты, кодирующая слитый белок, описанный в данном документе, включительно с его вариантами реализации и аспектами. В одном аспекте данного изобретения представлена последовательность нуклеиновой кислоты, кодирующая слитый белок, описанный в данном документе (включая с нацеливающую на ДНК последовательность), включительно с его вариантами реализации и аспектами. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок, описанный в данном документе, включая слитые белки, имеющие аминокислотные последовательности с определенным % идентичности последовательностям, описанным в данном документе. В аспектах данного изобретения нуклеиновая кислота представляет собой РНК. В аспектах данного изобретения нуклеиновая кислота представляет собой информационную РНК. В аспектах данного изобретения информационная РНК представляет собой информационный РНП. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитые белки, описанные в данном документе, включительно с их вариантами реализации и аспектами. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 1. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 2. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 3. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 4. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 5. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 6. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 7. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 8. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 9. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 10. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 11. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 12. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 13. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 14. В аспектах данного изобретения последовательность нуклеиновой кислоты кодирует слитый белок с последовательностью SEQ ID NO: 15. [0136] The fusion protein described herein, including its embodiments and aspects, can be represented as a nucleic acid sequence encoding the fusion protein. Thus, in one aspect of the present invention there is provided a nucleic acid sequence encoding a fusion protein described herein, inclusive of its embodiments and aspects. In one aspect of the present invention, there is provided a nucleic acid sequence encoding a fusion protein described herein (including a DNA targeting sequence), inclusive of embodiments and aspects thereof. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein described herein, including fusion proteins having amino acid sequences with a certain % identity to the sequences described herein. In aspects of the present invention, the nucleic acid is RNA. In aspects of the present invention, the nucleic acid is messenger RNA. In aspects of the present invention, the messenger RNA is a messenger RNP. In aspects of the present invention, the nucleic acid sequence encodes the fusion proteins described herein, including their embodiments and aspects. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 1. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 2. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 3. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 4. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 5. In aspects of the present invention, the nucleic acid sequence encodes the fusion protein with the sequence SEQ ID NO: 6. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 7. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 8. In aspects of the present invention, the nucleic acid sequence acid encodes a fusion protein with the sequence SEQ ID NO: 9. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 10. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 11. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 12. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 13. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 13. 14. In aspects of the present invention, the nucleic acid sequence encodes a fusion protein with the sequence SEQ ID NO: 15.
[0137] Кроме того, предполагается, что последовательность нуклеиновой кислоты, кодирующая слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, может быть включена в вектор. Таким образом, в одном аспекте данного изобретения представлен вектор, включающий в себя последовательность нуклеиновой кислоты, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок, описанный в данном документе, включая слитые белки, имеющие аминокислотные последовательности с определенным % идентичности последовательностям, описанным в данном документе. В аспектах данного изобретения нуклеиновая кислота представляет собой информационную РНК. В аспектах данного изобретения информационная РНК представляет собой информационный РНП. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 1. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 2. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 3. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 4. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 5. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 6. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 7. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 8. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 9. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 10. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 11. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 12. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 13. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 14. В аспектах данного изобретения вектор содержит последовательность нуклеиновой кислоты, которая кодирует слитый белок с последовательностью SEQ ID NO: 15. [0137] It is further contemplated that a nucleic acid sequence encoding a fusion protein as described herein, inclusive of embodiments and aspects thereof, may be included in a vector. Thus, in one aspect of the present invention there is provided a vector including a nucleic acid sequence as described herein, inclusive of embodiments and aspects thereof. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein described herein, including fusion proteins having amino acid sequences with a certain % identity to the sequences described herein. In aspects of the present invention, the nucleic acid is messenger RNA. In aspects of the present invention, the messenger RNA is a messenger RNP. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 1. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 2. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 3. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 4. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 5. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 6. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 6. NO: 7. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 8. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 9. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 10. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 11. In aspects of the present invention, the vector contains a nucleic acid sequence acid that encodes a fusion protein with the sequence SEQ ID NO: 12. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 13. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes the fusion protein with the sequence SEQ ID NO: 14. In aspects of the present invention, the vector contains a nucleic acid sequence that encodes a fusion protein with the sequence SEQ ID NO: 15.
[0138] В вариантах реализации данного изобретения вектор дополнительно включает в себя полинуклеотид, при этом полинуклеотид включает в себя: (1) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (2) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. Таким образом, один или несколько векторов могут включать в себя все необходимые компоненты для выполнения редактирования эпигенома. [0138] In embodiments of the present invention, the vector further includes a polynucleotide, wherein the polynucleotide includes: (1) a DNA targeting sequence that is complementary to the target polynucleotide sequence; and (2) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease. Thus, one or more vectors may include all the necessary components to perform epigenome editing.
[0139] Клетки [0139] Cells
[0140] Композиции, описанные в данном документе, могут быть включены в клетку. Внутри клетки композиции, описанные в данном документе, включительно с их вариантами реализации и аспектами, могут выполнять редактирование эпигенома. Соответственно, в одном аспекте данного изобретения представлена клетка, которая включает в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, нуклеиновую кислоту, как описано в данном документе, включительно с ее вариантами реализации и аспектами, комплекс, как описано в данном документе, включительно с его вариантами реализации и аспектами, или вектор, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя нуклеиновую кислоту, как описано в данном документе, включительно с ее вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя комплекс, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения представлена клетка, которая включает в себя вектор, как описано в данном документе, включительно с его вариантами реализации и аспектами. В аспектах данного изобретения клетка представляет собой эукариотическую клетку. В аспектах данного изобретения клетка представляет собой клетку млекопитающего. [0140] The compositions described herein may be included in a cell. Within a cell, the compositions described herein, including their embodiments and aspects, can perform epigenome editing. Accordingly, in one aspect of the present invention there is provided a cell that includes a fusion protein as described herein, inclusive of embodiments and aspects thereof, a nucleic acid as described herein, inclusive of embodiments and aspects thereof, a complex, as described herein, inclusive of embodiments and aspects thereof, or a vector, as described herein, inclusive of embodiments and aspects thereof. In aspects of the present invention, there is provided a cell that includes a fusion protein as described herein, inclusive of embodiments and aspects thereof. In aspects of the present invention, there is provided a cell that includes a nucleic acid as described herein, inclusive of embodiments and aspects thereof. In aspects of the present invention, there is provided a cell that includes a complex as described herein, inclusive of embodiments and aspects thereof. In aspects of the present invention, there is provided a cell that includes a vector as described herein, inclusive of embodiments and aspects thereof. In aspects of the present invention, the cell is a eukaryotic cell. In aspects of the present invention, the cell is a mammalian cell.
[0141] Способы [0141] Methods
[0142] Предполагается, что композиции, описанные в данном документе, можно использовать для редактирования эпигенома, и более конкретно - для редактирования эпигенома, приводящего к репрессии или сайленсингу целевых последовательностей нуклеиновых кислот (например, генов). Без намерения быть связанными какой-либо теорией, сайленсинг может быть результатом метилирования и (или) введения репрессивных хроматиновых маркеров (например, моно-, ди- или триметилирование определенных гистонов (например, H3K9, H3K27), деацетилирование, ацетилирование, фосфорилирование, убиквитинирование) в хроматин, содержащий целевую последовательность нуклеиновой кислоты. Без намерения быть связанными какой-либо теорией, данный метод может быть использован для изменения эпигенетического состояния, например, путем закрытия хроматина посредством метилирования или введения репрессивных хроматиновых маркеров в хроматин, содержащий целевую последовательность нуклеиновой кислоты (например, ген). Без намерения быть связанными какой-либо теорией, предполагается, что слитый белок Dnmt3A-3L функционирует для добавления метильных меток в ДНК в сайтах CG, обнаруживаемых на островках CpG, а домен KRAB рекрутирует эпигенетические факторы, которые модифицируют гистоны путем введения репрессивных меток. Без намерения быть связанными какой-либо теорией, ДНК метилируется по нуклеотиду C в последовательностях CG, обнаруженных на островках CpG (т. е. добавляются метильные метки на нуклеотиде C в ДНК в сайтах CG, обнаруживаемых на островках CpG). [0142] It is contemplated that the compositions described herein can be used to edit the epigenome, and more specifically, to edit the epigenome resulting in the repression or silencing of target nucleic acid sequences (eg, genes). Without intending to be bound by theory, silencing may result from methylation and/or introduction of repressive chromatin markers (eg, mono-, di-, or trimethylation of certain histones (eg, H3K9, H3K27), deacetylation, acetylation, phosphorylation, ubiquitination) into chromatin containing the target nucleic acid sequence. Without intending to be bound by any theory, this method can be used to change the epigenetic state, for example, by closing chromatin through methylation or introducing repressive chromatin markers into chromatin containing a target nucleic acid sequence (eg, a gene). Without intending to be bound by any theory, it is proposed that the Dnmt3A-3L fusion protein functions to add methyl marks to DNA at CG sites found on CpG islands, and the KRAB domain recruits epigenetic factors that modify histones by introducing repressive marks. Without intending to be bound by any theory, DNA is methylated at the C nucleotide at CG sequences found on CpG islands (ie, adding methyl marks at the C nucleotide to DNA at CG sites found on CpG islands).
[0143] В одном аспекте данного изобретения представлен способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включая доставку первого полинуклеотида, кодирующего слитый белок, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, содержащую целевую нуклеиновую кислоту; и доставку в клетку второго полинуклеотида, который включает в себя (i) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (ii) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. Без намерения быть связанным какой-либо теорией, слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. Без намерения быть связанным какой-либо теорией, метилирование хроматина означает, что ДНК метилируется по нуклеотиду C в последовательностях CG, обнаруживаемых на островках CpG (т. е. добавляются метильные метки на нуклеотиде C в ДНК в сайтах CG, обнаруживаемых на островках CpG). В аспектах данного изобретения метилированной является последовательность, которая находится в пределах около 3000 пар оснований от последовательности целевой нуклеиновой кислоты. В аспектах данного изобретения метилированной является последовательность, которая находится в пределах около 3000, около 2900, около 2800, около 2700, около 2600, около 2500, около 2400, около 2300, около 2200, около 2100, около 2000, около 1900, около 1800, около 1700, около 1600, около 1500, около 1400, около 1300, около 1200, около 1100, около 1000, около 900, около 800, около 700, около 600, около 500, около 400, около 300, около 200 или около 100 пар оснований от последовательности целевой нуклеиновой кислоты. [0143] In one aspect of the present invention, there is provided a method for silencing a target nucleic acid sequence in a cell, including delivering a first polynucleotide encoding a fusion protein as described herein, inclusive of embodiments and aspects thereof, into a cell containing the target nucleic acid; and delivering into the cell a second polynucleotide that includes (i) a DNA targeting sequence that is complementary to the target nucleic acid sequence, and (ii) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease. Without intending to be bound by any theory, the fusion protein causes silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence. Without intending to be bound by any theory, chromatin methylation means that DNA is methylated at the C nucleotide at CG sequences found on CpG islands (ie, adding methyl marks at the C nucleotide to DNA at CG sites found on CpG islands). In aspects of the present invention, methylated is a sequence that is within about 3000 base pairs of the target nucleic acid sequence. In aspects of the invention, a sequence that is methylated is within about 3000, about 2900, about 2800, about 2700, about 2600, about 2500, about 2400, about 2300, about 2200, about 2100, about 2000, about 1900, about 1800 , about 1700, about 1600, about 1500, about 1400, about 1300, about 1200, about 1100, about 1000, about 900, about 800, about 700, about 600, about 500, about 400, about 300, about 200 or about 100 base pairs from the target nucleic acid sequence.
[0144] Термин «репрессивные хроматиновые маркеры», употребляемый в контексте данного документа, относится к модификациям, внесенным в хроматин, которые приводят к сайленсингу (например, снижению или ингибированию транскрипции) последовательности целевой нуклеиновой кислоты (например, гена). Примеры репрессивных хроматиновых маркеров включают в себя, но не ограничиваются ими, моно-, ди- и (или) триметилирование, ацетилирование/ деацетилирование, фосфорилирование и убиквитинирование гистонов (например, H3K9, H3K27, H3K79, H2BK5). [0144] The term “repressive chromatin markers” as used herein refers to modifications made to chromatin that result in silencing (eg, reduction or inhibition of transcription) of a target nucleic acid sequence (eg, a gene). Examples of repressive chromatin markers include, but are not limited to, histone mono-, di- and/or trimethylation, acetylation/deacetylation, phosphorylation and ubiquitination (eg, H3K9, H3K27, H3K79, H2BK5).
[0145] В вариантах реализации данного изобретения сайленсинг относится к полному подавлению транскрипции. В аспектах данного изобретения сайленсинг относится к значительному снижению транскрипции по сравнению с контрольными уровнями транскрипции. [0145] In embodiments of the present invention, silencing refers to the complete suppression of transcription. In aspects of the present invention, silencing refers to a significant reduction in transcription compared to control levels of transcription.
[0146] В вариантах реализации данного изобретения первый полинуклеотид содержится в первом векторе. В аспектах данного изобретения первый полинуклеотид содержится во втором векторе. В аспектах данного изобретения первый вектор и второй вектор одинаковы. В аспектах данного изобретения первый вектор отличается от второго вектора. [0146] In embodiments of the present invention, the first polynucleotide is contained in the first vector. In aspects of the present invention, the first polynucleotide is contained in a second vector. In aspects of the present invention, the first vector and the second vector are the same. In aspects of the present invention, the first vector is different from the second vector.
[0147] В вариантах реализации данного изобретения описанный в данном документе полинуклеотид доставляется в клетку любым способом, известным в данной области техники, например, путем трансфекции, электропорации или трансдукции. [0147] In embodiments of the present invention, a polynucleotide described herein is delivered into a cell by any method known in the art, for example, by transfection, electroporation, or transduction.
[0148] Альтернативно, в одном аспекте данного изобретения представлен способ, приводящий к сайленсингу последовательности целевой нуклеиновой кислоты в клетке, включая доставку комплекса, как описано в данном документе, включительно с его вариантами реализации и аспектами, в клетку, которая содержит целевую нуклеиновую кислоту. Без намерения быть связанными какой-либо теорией, комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0148] Alternatively, in one aspect of the present invention, a method is provided that results in silencing of a target nucleic acid sequence in a cell, including delivery of a complex as described herein, inclusive of embodiments and aspects thereof, into a cell that contains the target nucleic acid. Without intending to be bound by any theory, the complex causes silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence.
[0149] В вариантах реализации данного изобретения клетка представляет собой клетку млекопитающего. [0149] In embodiments of the present invention, the cell is a mammalian cell.
[0150] В вариантах реализации данного изобретения способ имеет специфичность, которая в 2 раза выше, чем специфичность к последовательности нецелевой нуклеиновой кислоты. В аспектах данного изобретения способ имеет специфичность, которая по меньшей мере в 2 раза (например, в 2, в 3, в 4, в 5, в 6, в 7, в 8, в 9, в 10, в 15, в 20, в 25 раз) выше, чем специфичность к последовательности нецелевой нуклеиновой кислоты. Методы определения специфичности хорошо известны в данной области техники и включают в себя, но не ограничиваются ими, секвенирование РНК, бисульфитное секвенирование, иммунопреципитацию хроматина, проточную цитометрию и количественную ПЦР. Таким образом, в аспектах данного изобретения специфичность определяется с помощью метода секвенирования РНК. В аспектах данного изобретения специфичность определяется с помощью метода бисульфитного секвенирования. В аспектах данного изобретения специфичность определяется с помощью метода иммунопреципитации хроматина. В аспектах данного изобретения специфичность определяется с помощью метода проточной цитометрии. В аспектах данного изобретения специфичность определяется с помощью метода количественной ПЦР. [0150] In embodiments of the present invention, the method has a specificity that is 2 times higher than the specificity for a non-target nucleic acid sequence. In aspects of the invention, the method has a specificity that is at least 2-fold (e.g., 2-fold, 3-fold, 4-fold, 5-fold, 6-fold, 7-fold, 8-fold, 9-fold, 10-fold, 15-fold, 20-fold). , 25 times) higher than the specificity for the non-target nucleic acid sequence. Methods for determining specificity are well known in the art and include, but are not limited to, RNA sequencing, bisulfite sequencing, chromatin immunoprecipitation, flow cytometry, and quantitative PCR. Thus, in aspects of the present invention, specificity is determined using an RNA sequencing method. In aspects of the present invention, specificity is determined using a bisulfite sequencing method. In aspects of the present invention, specificity is determined using a chromatin immunoprecipitation method. In aspects of the present invention, specificity is determined using flow cytometry. In aspects of the present invention, specificity is determined using a quantitative PCR method.
[0151] В аспектах данного изобретения комплекс доставляется в клетку любыми способами, известными в данной области техники, например, посредством доставки рибонуклеопротеина (РНП). [0151] In aspects of the present invention, the complex is delivered into the cell by any means known in the art, for example, through the delivery of ribonucleoprotein (RNP).
[0152] Варианты реализации изобретения N1 - N41 [0152] Embodiments N1 - N41
[0153] Вариант реализации изобретения N1. Слитый белок, содержащий фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, домен, связанный с боксом , и домен метилтрансферазы ДНК. [0153] Embodiment of the invention N1. Fusion protein containing the enzyme nuclease-deficient RNA-guided DNA endonuclease box-linked domain , and a DNA methyltransferase domain.
[0154] Вариант реализации изобретения N2. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, ddCpf1, нуклеазо-дефицитный вариант Cas9 или нуклеазо-дефицитную эндонуклеазу CRISPR класса II. [0154] Embodiment of the invention N2. The fusion protein of embodiment N1, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9, ddCpf1, a nuclease-deficient variant of Cas9, or a class II nuclease-deficient CRISPR endonuclease.
[0155] Вариант реализации изобретения N3. Слитый белок по варианту реализации изобретения N1 или N2, отличающийся тем, что указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0155] Embodiment of the invention N3. The fusion protein of embodiment N1 or N2, wherein said DNA methyltransferase domain is a Dnmt3A-3L domain.
[0156] Вариант реализации изобретения N4. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный слитый белок включает в себя, в направлении от N-конца до С-конца, домен метилтрансферазы ДНК, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен, связанный с боксом . [0156] Embodiment of the invention N4. The fusion protein of embodiment N1, wherein the fusion protein includes, from N-terminus to C-terminus, a DNA methyltransferase domain, an enzyme-deficient RNA-guided DNA endonuclease, and a box-linked domain .
[0157] Вариант реализации изобретения N5. Слитый белок по варианту реализации изобретения N4, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0157] Embodiment of the invention N5. The fusion protein of embodiment N4, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9 and said DNA methyltransferase domain is a Dnmt3A-3L domain.
[0158] Вариант реализации изобретения N6. Слитый белок по варианту реализации изобретения N5, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0158] Embodiment of the invention N6. The fusion protein of embodiment N5, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9 and said DNA methyltransferase domain is a Dnmt3A-3L domain.
[0159] Вариант реализации изобретения N7. Слитый белок по варианту реализации изобретения N6, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN. [0159] Embodiment of the invention N7. The fusion protein of embodiment N6, wherein said peptide linker is an XTEN linker.
[0160] Вариант реализации изобретения N8. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный слитый белок включает в себя, в направлении от N-конца до С-конца, домен, связанный с боксом , фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК и домен метилтрансферазы ДНК. [0160] Embodiment of the invention N8. The fusion protein of embodiment N1, wherein the fusion protein includes, in the N-terminal to C-terminal direction, a box-linked domain , a nuclease-deficient RNA-guided DNA endonuclease enzyme and a DNA methyltransferase domain.
[0161] Вариант реализации изобретения N9. Слитый белок по варианту реализации изобретения N8, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0161] Embodiment of the invention N9. The fusion protein of embodiment N8, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9 and said DNA methyltransferase domain is a Dnmt3A-3L domain.
[0162] Вариант реализации изобретения N10. Слитый белок по варианту реализации изобретения N9, отличающийся тем, что указанный dCas9 ковалентно связан с доменом Dnmt3A-3L через пептидный линкер, и при этом домен, связанный с боксом , ковалентно связан с dCas9 через пептидный линкер. [0162] Embodiment of the invention N10. The fusion protein of embodiment N9, wherein said dCas9 is covalently linked to the Dnmt3A-3L domain via a peptide linker, and wherein the domain is associated with the box , is covalently linked to dCas9 through a peptide linker.
[0163] Вариант реализации изобретения N11. Слитый белок по варианту реализации изобретения N10, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN. [0163] Embodiment of the invention N11. The fusion protein of embodiment N10, wherein said peptide linker is an XTEN linker.
[0164] Вариант реализации изобретения N12. Слитый белок по любому из вариантов реализации изобретения с N1 по N3, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом, связанным с боксом , через пептидный линкер. [0164] Embodiment of the invention N12. The fusion protein of any one of embodiments N1 to N3, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is covalently linked to a box-linked domain , via a peptide linker.
[0165] Вариант реализации изобретения N13. Слитый белок по любому из вариантов реализации с N1 по N3, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер. [0165] Embodiment of the invention N13. The fusion protein of any one of embodiments N1 to N3, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is covalently linked to a DNA methyltransferase domain through a peptide linker.
[0166] Вариант реализации изобретения N14. Слитый белок по любому из вариантов реализации с N1 по N3, отличающийся тем, что указанный домен, связанный с боксом , ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер. [0166] Embodiment of the invention N14. The fusion protein of any one of embodiments N1 to N3, characterized in that said box-linked domain , is covalently linked to the DNA methyltransferase domain via a peptide linker.
[0167] Вариант реализации изобретения N15. Слитый белок по любому из вариантов реализации с N12 по N14, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN. [0167] Embodiment of the invention N15. The fusion protein of any one of embodiments N12 to N14, wherein said peptide linker is an XTEN linker.
[0168] Вариант реализации изобретения N16. Слитый белок по варианту реализации изобретения N15, отличающийся тем, что указанный линкер XTEN содержит от около 16 до около 80 аминокислотных остатков. [0168] Embodiment of the invention N16. The fusion protein of embodiment N15, wherein said XTEN linker contains from about 16 to about 80 amino acid residues.
[0169] Вариант реализации изобретения N17. Слитый белок по любому из вариантов реализации с N1 по N16, дополнительно содержащий сигнальный пептид ядерной локализации. [0169] Embodiment of the invention N17. The fusion protein of any one of embodiments N1 to N16, further comprising a nuclear localization signal peptide.
[0170] Вариант реализации изобретения N18. Слитый белок по варианту реализации изобретения N1, отличающийся тем, что указанный слитый белок содержит аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 или 15. [0170] Embodiment of the invention N18. The fusion protein of embodiment N1, wherein said fusion protein contains an amino acid sequence with SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14 or 15.
[0171] Вариант реализации изобретения N19. Последовательность нуклеиновой кислоты, кодирующая слитый белок по любому из вариантов реализации изобретения с N1 по N18. [0171] Embodiment of the invention N19. A nucleic acid sequence encoding a fusion protein according to any one of embodiments N1 to N18.
[0172] Вариант реализации изобретения N20. Последовательность нуклеиновой кислоты по варианту реализации изобретения N19, отличающаяся тем, что указанная последовательность нуклеиновой кислоты представляет собой информационную РНК. [0172] Embodiment of invention N20. The nucleic acid sequence according to embodiment N19, characterized in that said nucleic acid sequence is messenger RNA.
[0173] Вариант реализации изобретения N21. Комплекс, содержащий: (i) слитый белок по любому из вариантов реализации изобретения с N1 по N18; и (ii) полинуклеотид, содержащий: (а) нацеливающую на ДНК последовательность, комплементарную целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность. [0173] Embodiment of invention N21. A complex comprising: (i) a fusion protein according to any one of embodiments N1 to N18; and (ii) a polynucleotide comprising: (a) a DNA targeting sequence complementary to the target polynucleotide sequence; and (b) a binding sequence for a nuclease-deficient RNA-guided DNA endonuclease enzyme, wherein the nuclease-deficient RNA-guided DNA endonuclease enzyme is linked to the polynucleotide through a binding sequence.
[0174] Вариант реализации изобретения N22. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть гена. [0174] Embodiment of invention N22. The complex according to embodiment N21, characterized in that said target polynucleotide sequence is part of a gene.
[0175] Вариант реализации изобретения N23. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть последовательности, регулирующей транскрипцию. [0175] Embodiment of invention N23. The complex according to embodiment N21, characterized in that said target polynucleotide sequence is part of a transcription regulatory sequence.
[0176] Вариант реализации изобретения N24. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера. [0176] Embodiment of invention N24. The complex according to embodiment N21, characterized in that said target polynucleotide sequence is part of a promoter, enhancer or silencer.
[0177] Вариант реализации изобретения N25. Комплекс по варианту реализации изобретения N21, отличающийся тем, что указанная целевая полинуклеотидная последовательность находится в пределах около 3000 п.о. и фланкирует сайт начала транскрипции. [0177] Embodiment of invention N25. The complex according to embodiment N21, characterized in that said target polynucleotide sequence is within about 3000 bp. and flanks the transcription start site.
[0178] Вариант реализации изобретения N26. Вектор, содержащий последовательность нуклеиновой кислоты по варианту реализации изобретения N19 или N20. [0178] Embodiment of invention N26. A vector containing a nucleic acid sequence according to embodiment N19 or N20.
[0179] Вариант реализации изобретения N27. Вектор по варианту реализации изобретения N26, дополнительно содержащий полинуклеотид, при этом полинуклеотид содержит: (а) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. [0179] Embodiment of invention N27. The vector of embodiment N26, further comprising a polynucleotide, wherein the polynucleotide contains: (a) a DNA targeting sequence that is complementary to the target polynucleotide sequence; and (b) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease.
[0180] Вариант реализации изобретения N28. Клетка, содержащая слитый белок по любому из вариантов реализации изобретения с N1 по N18; нуклеиновую кислоту по варианту реализации изобретения N19 или N20; комплекс по любому из вариантов реализации изобретения с N21 по N25, или вектор по варианту реализации изобретения N26 или N27. [0180] Embodiment of invention N28. A cell containing a fusion protein according to any one of embodiments N1 to N18; nucleic acid according to embodiment N19 or N20; the complex of any one of embodiments N21 to N25, or the vector of embodiment N26 or N27.
[0181] Вариант реализации изобретения N29. Клетка по варианту реализации изобретения N28, отличающаяся тем, что указанная клетка представляет собой эукариотическую клетку. [0181] Embodiment of invention N29. A cell according to embodiment N28, characterized in that said cell is a eukaryotic cell.
[0182] Вариант реализации изобретения N30. Клетка по варианту реализации изобретения N28, отличающаяся тем, что указанная клетка представляет собой клетку млекопитающего. [0182] Embodiment of the invention N30. A cell according to embodiment N28, characterized in that said cell is a mammalian cell.
[0183] Вариант реализации изобретения N31. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий: (i) доставку первого полинуклеотида, кодирующего слитый белок по любому из вариантов реализации изобретения с N1 по N18, в клетку, содержащую целевую нуклеиновую кислоту; и (ii) доставку в клетку второго полинуклеотида, который включает в себя (a) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (b) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. [0183] Embodiment of the invention N31. A method of silencing a target nucleic acid sequence in a cell, comprising: (i) delivering a first polynucleotide encoding the fusion protein of any one of embodiments N1 to N18 into a cell containing the target nucleic acid; and (ii) delivering into the cell a second polynucleotide that includes (a) a DNA targeting sequence that is complementary to the target nucleic acid sequence, and (b) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease.
[0184] Вариант реализации изобретения N32. Способ по варианту реализации изобретения N31, отличающийся тем, что указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0184] Embodiment of invention N32. The method according to embodiment N31, characterized in that said fusion protein causes silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence.
[0185] Вариант реализации изобретения N33. Способ по варианту реализации изобретения N31 или N32, отличающийся тем, что указанный первый полинуклеотид содержится в первом векторе. [0185] Embodiment of invention N33. The method according to embodiment N31 or N32, characterized in that said first polynucleotide is contained in a first vector.
[0186] Вариант реализации изобретения N34. Способ по любому из вариантов реализации изобретения с N31 по N33, отличающийся тем, что указанный первый полинуклеотид содержится во втором векторе. [0186] Embodiment of invention N34. The method according to any one of embodiments N31 to N33, characterized in that said first polynucleotide is contained in a second vector.
[0187] Вариант реализации изобретения N35. Способ по варианту реализации изобретения N34, отличающийся тем, что указанные первый вектор и второй вектор одинаковы. [0187] Embodiment of the invention N35. The method according to embodiment N34, characterized in that said first vector and second vector are the same.
[0188] Вариант реализации изобретения N36. Способ по варианту реализации изобретения N34, отличающийся тем, что указанный первый вектор отличается от второго вектора. [0188] Embodiment of invention N36. The method according to embodiment N34, characterized in that said first vector is different from the second vector.
[0189] Вариант реализации изобретения N37. Способ по варианту реализации изобретения N31, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего. [0189] Embodiment of invention N37. The method according to embodiment N31, characterized in that said cell is a mammalian cell.
[0190] Вариант реализации изобретения N38. Способ по варианту реализации изобретения N31, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты. [0190] Embodiment of invention N38. The method according to embodiment N31, characterized in that the specificity of this method is 2 times higher than the specificity with respect to the sequence of the non-target nucleic acid.
[0191] Вариант реализации изобретения N39. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий в себя доставку комплекса по любому из вариантов реализации изобретения с N21 по N25 в клетку, содержащую целевую нуклеиновую кислоту. [0191] Embodiment of invention N39. A method for silencing a target nucleic acid sequence in a cell, comprising delivering the complex according to any of embodiments N21 to N25 into a cell containing the target nucleic acid.
[0192] Вариант реализации изобретения N40. Способ по варианту реализации изобретения N39, отличающийся тем, что указанный комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0192] Embodiment of the invention N40. The method according to embodiment N39, characterized in that the complex causes silencing of the target nucleic acid sequence in the cell by methylation of the chromatin containing the target nucleic acid sequence and (or) by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence.
[0193] Вариант реализации изобретения N41. Способ по варианту реализации изобретения N39 или N40, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего. [0193] Embodiment of the invention N41. The method according to embodiment N39 or N40, characterized in that said cell is a mammalian cell.
[0194] Вариант реализации изобретения N42. Способ по любому из вариантов реализации с N39 по N41, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты. [0194] Embodiment of the invention N42. The method according to any of the embodiments from N39 to N41, characterized in that the specificity of this method is 2 times higher than the specificity with respect to the sequence of the non-target nucleic acid.
[0195] Варианты реализации изобретения с 1 по 36 [0195] Embodiments 1 to 36
[0196] Вариант реализации изобретения 1. Слитый белок, содержащий фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, домен, связанный с боксом (домен KRAB), и домен метилтрансферазы ДНК. [0196] Embodiment 1. A fusion protein containing a nuclease-deficient RNA-guided DNA endonuclease enzyme box-linked domain (KRAB domain), and DNA methyltransferase domain.
[0197] Вариант реализации изобретения 2. Слитый белок по варианту реализации изобретения 1, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, ddCpf1, нуклеазо-дефицитный вариант Cas9 или нуклеазо-дефицитную эндонуклеазу CRISPR класса II. [0197] Embodiment 2. The fusion protein of Embodiment 1, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9, ddCpf1, a nuclease-deficient Cas9 variant, or a class II nuclease-deficient CRISPR endonuclease.
[0198] Вариант реализации изобретения 3. Слитый белок по варианту реализации изобретения 1 или 2, отличающийся тем, что указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0198] Embodiment 3. The fusion protein of Embodiment 1 or 2, wherein said DNA methyltransferase domain is a Dnmt3A-3L domain.
[0199] Вариант реализации изобретения 4. Слитый белок по любому из вариантов реализации изобретения с 1 по 3, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом KRAB через пептидный линкер. [0199] Embodiment 4. The fusion protein of any one of Embodiments 1 to 3, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is covalently linked to a KRAB domain via a peptide linker.
[0200] Вариант реализации изобретения 5. Слитый белок по любому из вариантов реализации изобретения с 1 по 4, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер. [0200] Embodiment 5. The fusion protein of any one of Embodiments 1 to 4, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is covalently linked to a DNA methyltransferase domain through a peptide linker.
[0201] Вариант реализации изобретения 6. Слитый белок по любому из вариантов реализации изобретения с 1 по 5, отличающийся тем, что указанный домен KRAB ковалентно связан с доменом метилтрансферазы ДНК через пептидный линкер. [0201] Embodiment 6. The fusion protein of any one of Embodiments 1 to 5, wherein said KRAB domain is covalently linked to a DNA methyltransferase domain through a peptide linker.
[0202] Вариант реализации изобретения 7. Слитый белок по любому из вариантов реализации изобретения с 4 по 6, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN. [0202] Embodiment 7. The fusion protein of any one of Embodiments 4 to 6, wherein said peptide linker is an XTEN linker.
[0203] Вариант реализации изобретения 8. Слитый белок по варианту реализации изобретения 7, отличающийся тем, что указанный линкер XTEN содержит от около 16 до около 80 аминокислотных остатков. [0203] Embodiment 8. The fusion protein of Embodiment 7, wherein said XTEN linker contains from about 16 to about 80 amino acid residues.
[0204] Вариант реализации изобретения 9. Слитый белок по любому из вариантов реализации изобретения с 1 по 8, дополнительно содержащий сигнальный пептид ядерной локализации. [0204] Embodiment 9. The fusion protein of any one of Embodiments 1 to 8, further comprising a nuclear localization signal peptide.
[0205] Вариант реализации изобретения 10. Слитый белок по любому из вариантов реализации изобретения с 1 по 9, отличающийся тем, что указанный слитый белок содержит, в направлении от N-конца до C-конца, домен KRAB, фермент нуклеазо-дефицитную РНК-направляемую эндонуклеазу ДНК, и домен метилтрансферазы ДНК. [0205] Embodiment 10. The fusion protein of any one of Embodiments 1 to 9, wherein said fusion protein contains, in an N-terminal to C-terminal direction, a KRAB domain, an RNA nuclease-deficient enzyme. a directed DNA endonuclease, and a DNA methyltransferase domain.
[0206] Вариант реализации изобретения 11. Слитый белок по любому из вариантов реализации изобретения с 1 по 10, отличающийся тем, что указанный фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК представляет собой dCas9, а указанный домен метилтрансферазы ДНК представляет собой домен Dnmt3A-3L. [0206] Embodiment 11. The fusion protein of any one of Embodiments 1 to 10, wherein said nuclease-deficient RNA-guided DNA endonuclease enzyme is dCas9 and said DNA methyltransferase domain is a Dnmt3A-3L domain. .
[0207] Вариант реализации изобретения 12. Слитый белок по варианту реализации изобретения 11, отличающийся тем, что указанный dCas9 ковалентно связан с доменом KRAB через пептидный линкер, и при этом dCas9 ковалентно связан с доменом Dnmt3A-3L через пептидный линкер. [0207] Embodiment 12. The fusion protein of Embodiment 11, wherein the dCas9 is covalently linked to the KRAB domain via a peptide linker, and wherein the dCas9 is covalently linked to the Dnmt3A-3L domain via a peptide linker.
[0208] Вариант реализации изобретения 13. Слитый белок по варианту реализации изобретения 12, отличающийся тем, что указанный пептидный линкер представляет собой линкер XTEN. [0208] Embodiment 13. The fusion protein of Embodiment 12, wherein said peptide linker is an XTEN linker.
[0209] Вариант реализации изобретения 14. Слитый белок по любому из вариантов реализации изобретения с 1 по 13, отличающийся тем, что указанный слитый белок содержит аминокислотную последовательность с SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 12, 13, 14 или 15. [0209] Embodiment 14. The fusion protein of any one of Embodiments 1 to 13, wherein said fusion protein contains the amino acid sequence of SEQ ID NO: 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11 12, 13, 14 or 15.
[0210] Вариант реализации изобретения 15. Последовательность нуклеиновой кислоты, кодирующая слитый белок по любому из вариантов реализации изобретения с 1 по 14. [0210] Embodiment 15. A nucleic acid sequence encoding the fusion protein of any one of Embodiments 1 to 14.
[0211] Вариант реализации изобретения 16. Комплекс, содержащий: (i) слитый белок по любому из вариантов реализации изобретения с 1по 18; и (ii) полинуклеотид, содержащий: (а) нацеливающую на ДНК последовательность, комплементарную целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом фермент нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК связан с полинуклеотидом через связывающую последовательность. [0211] Embodiment 16. A complex comprising: (i) the fusion protein of any one of Embodiments 1 to 18; and (ii) a polynucleotide comprising: (a) a DNA targeting sequence complementary to the target polynucleotide sequence; and (b) a binding sequence for a nuclease-deficient RNA-guided DNA endonuclease enzyme, wherein the nuclease-deficient RNA-guided DNA endonuclease enzyme is linked to the polynucleotide through a binding sequence.
[0212] Вариант реализации изобретения 17. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть гена. [0212] Embodiment 17. The complex of Embodiment 21, wherein said target polynucleotide sequence is part of a gene.
[0213] Вариант реализации изобретения 18. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть последовательности, регулирующей транскрипцию. [0213] Embodiment 18. The complex of Embodiment 21, wherein said target polynucleotide sequence is part of a transcription regulatory sequence.
[0214] Вариант реализации изобретения 19. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой часть промотора, энхансера или сайленсера. [0214] Embodiment 19. The complex of Embodiment 21, wherein said target polynucleotide sequence is part of a promoter, enhancer, or silencer.
[0215] Вариант реализации изобретения 20. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность представляет собой гипометилированную последовательность нуклеиновой кислоты. [0215] Embodiment 20. The complex of Embodiment 21, wherein said target polynucleotide sequence is a hypomethylated nucleic acid sequence.
[0216] Вариант реализации изобретения 21. Комплекс по варианту реализации изобретения 21, отличающийся тем, что указанная целевая полинуклеотидная последовательность находится в пределах около 3000 п.о. и фланкирует сайт начала транскрипции. [0216] Embodiment 21. The complex of Embodiment 21, wherein said target polynucleotide sequence is within about 3000 bp. and flanks the transcription start site.
[0217] Вариант реализации изобретения 22. Вектор, содержащий последовательность нуклеиновой кислоты по варианту реализации изобретения 19. [0217] Embodiment 22. A vector containing the nucleic acid sequence of Embodiment 19.
[0218] Вариант реализации изобретения 23. Вектор по варианту реализации изобретения 26, дополнительно содержащий полинуклеотид, при этом полинуклеотид содержит: (а) нацеливающую на ДНК последовательность, которая комплементарна целевой полинуклеотидной последовательности; и (b) последовательность связывания для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК. [0218] Embodiment 23. The vector of Embodiment 26, further comprising a polynucleotide, wherein the polynucleotide comprises: (a) a DNA targeting sequence that is complementary to the target polynucleotide sequence; and (b) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease.
[0219] Вариант реализации изобретения 24. Клетка, содержащая слитый белок по любому из вариантов реализации изобретения с 1 по 14; нуклеиновую кислоту по варианту реализации изобретения 15; комплекс по любому из вариантов реализации изобретения с 16 по 21; или вектор по варианту реализации изобретения 22 или 23. [0219] Embodiment 24. A cell containing the fusion protein of any one of Embodiments 1 to 14; nucleic acid according to embodiment 15; complex according to any of the embodiments of the invention from 16 to 21; or a vector according to embodiment 22 or 23.
[0220] Вариант реализации изобретения 25. Клетка по варианту реализации изобретения 28, отличающаяся тем, что указанная клетка представляет собой эукариотическую клетку. [0220] Embodiment 25. The cell of Embodiment 28, wherein said cell is a eukaryotic cell.
[0221] Вариант реализации изобретения 26. Клетка по варианту реализации изобретения 28, отличающаяся тем, что указанная клетка представляет собой клетку млекопитающего. [0221] Embodiment 26. The cell of Embodiment 28, wherein said cell is a mammalian cell.
[0222] Вариант реализации изобретения 27. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий: (i) доставку первого полинуклеотида, кодирующего слитый белок по любому из вариантов реализации изобретения с 1 по 14, в клетку, содержащую целевую нуклеиновую кислоту; и (ii) доставку в клетку второго полинуклеотида, который включает в себя (a) нацеленную на ДНК последовательность, которая комплементарна последовательности целевой нуклеиновой кислоты, и (b) связывающую последовательность для фермента нуклеазо-дефицитная РНК-направляемая эндонуклеаза ДНК, при этом указанный слитый белок вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке путем метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и (или) путем введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0222] Embodiment 27. A method for silencing a target nucleic acid sequence in a cell, comprising: (i) delivering a first polynucleotide encoding the fusion protein of any one of Embodiments 1 to 14 to a cell containing the target nucleic acid; and (ii) delivering into the cell a second polynucleotide that includes (a) a DNA targeting sequence that is complementary to the target nucleic acid sequence, and (b) a binding sequence for the enzyme nuclease-deficient RNA-guided DNA endonuclease, wherein said fusion the protein causes silencing of a target nucleic acid sequence in a cell by methylating the chromatin containing the target nucleic acid sequence and/or by introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence.
[0223] Вариант реализации изобретения 28. Способ по варианту реализации изобретения 27, отличающийся тем, что указанный первый полинуклеотид содержится в первом векторе. [0223] Embodiment 28. The method of Embodiment 27, wherein said first polynucleotide is contained in a first vector.
[0224] Вариант реализации изобретения 29. Способ по варианту реализации изобретения 27, отличающийся тем, что указанный первый полинуклеотид содержится во втором векторе. [0224] Embodiment 29. The method of Embodiment 27, wherein said first polynucleotide is contained in a second vector.
[0225] Вариант реализации изобретения 30. Способ по варианту реализации изобретения 28 или 29, отличающийся тем, что указанные первый вектор и второй вектор одинаковы. [0225] Embodiment 30. The method of Embodiment 28 or 29, wherein said first vector and second vector are the same.
[0226] Вариант реализации изобретения 31. Способ по варианту реализации изобретения 28 или 29, отличающийся тем, что указанный первый вектор отличается от второго вектора. [0226] Embodiment 31. The method of Embodiment 28 or 29, wherein said first vector is different from the second vector.
[0227] Вариант реализации изобретения 32. Способ по любому из вариантов реализации изобретения с 27 по 31, отличающийся тем, что клетка представляет собой клетку млекопитающего. [0227] Embodiment 32. The method of any one of Embodiments 27 to 31, wherein the cell is a mammalian cell.
[0228] Вариант реализации изобретения 33. Способ по любому из вариантов реализации изобретения с 27 по 32, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты. [0228] Embodiment 33. The method according to any one of embodiments 27 to 32, wherein the specificity of the method is 2 times higher than the specificity with respect to the non-target nucleic acid sequence.
[0229] Вариант реализации изобретения 34. Способ сайленсинга последовательности целевой нуклеиновой кислоты в клетке, включающий в себя доставку комплекса по любому из вариантов реализации изобретения с 16 по 20 в клетку, содержащую целевую нуклеиновую кислоту, при этом комплекс вызывает сайленсинг последовательности целевой нуклеиновой кислоты в клетке посредством: (i) метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, (ii) введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты, или (iii) метилирования хроматина, содержащего последовательность целевой нуклеиновой кислоты, и введения репрессивных хроматиновых маркеров в хроматин, содержащий последовательность целевой нуклеиновой кислоты. [0229] Embodiment 34. A method for silencing a target nucleic acid sequence in a cell, comprising delivering the complex of any one of embodiments 16 to 20 to a cell containing the target nucleic acid, wherein the complex causes silencing of the target nucleic acid sequence in cell by: (i) methylating the chromatin containing the target nucleic acid sequence, (ii) introducing repressive chromatin markers into the chromatin containing the target nucleic acid sequence, or (iii) methylating the chromatin containing the target nucleic acid sequence and introducing repressive chromatin markers into chromatin containing the target nucleic acid sequence.
[0230] Вариант реализации изобретения 35. Способ по варианту реализации изобретения 34, отличающийся тем, что указанная клетка представляет собой клетку млекопитающего. [0230] Embodiment 35. The method of Embodiment 34, wherein said cell is a mammalian cell.
[0231] Вариант реализации изобретения 36. Способ по варианту реализации изобретения 34 или 35, отличающийся тем, что специфичность указанного способа в 2 раза выше, чем специфичность по отношению к последовательности нецелевой нуклеиновой кислоты. [0231] Embodiment 36. The method according to embodiment 34 or 35, wherein the specificity of the method is 2 times higher than the specificity with respect to the non-target nucleic acid sequence.
ПРИМЕРЫEXAMPLES
[0232] Варианты реализации изобретения и аспекты, указанные в данном документе, дополнительно проиллюстрированы следующими примерами. Примеры предназначены лишь для иллюстрации вариантов реализации изобретения и аспектов, и их не следует истолковывать как ограничение объема изобретения, указанного в данном документе. [0232] Embodiments of the invention and aspects set forth herein are further illustrated by the following examples. The examples are intended to illustrate embodiments and aspects of the invention only, and should not be construed as limiting the scope of the invention set forth herein.
[0233] Пример 1 [0233] Example 1
[0234] Слитые с dCas9 эпигенетические модуляторы протестированы на предмет постоянного сайленсинга генов. Исходная версия (В1, p76 (SEQ ID NO: 1)) белка «все в одном» (Фиг. 1A) содержит домен KRAB, слитый с -N-концом dCas9 (SEQ ID NO: 23), отделенный линкером GGSGGGS (SEQ ID NO: 17), и Dnmt3A - Dnmt3L на С-конце dCas9 (отделенные линкером EASGSGRASPGIPGSTR (SEQ ID NO: 19)). Еще один белок «все в одном», который объединил домен KRAB (SEQ ID NO: 16), dCas9 (D10A, H208A), Dnmt3A - Dnmt3L (SEQ ID NO: 33; где SEQ ID NO: 26 представляет собой Dnmt3A, а SEQ ID NO: 28 представляет собой Dnmt3L) в один полипептид (Фиг. 1B). Со ссылкой на Фиг. 1B, белок dCas9 - KRAB был адаптирован из Gilbert et al., Cell 2013, для применения с технологией интерференции CRISPR (CRISPRi), а слитый белок dCas9 - Dnmt3A - Dnmt3L был адаптирован из Stepper et al., Nucleic Acids Research, 2016. [0234] Epigenetic modulators fused to dCas9 have been tested for persistent gene silencing. The original version (B1, p76 (SEQ ID NO: 1)) of the all-in-one protein (Fig. 1A) contains a KRAB domain fused to the -N terminus of dCas9 (SEQ ID NO: 23), separated by a GGSGGGS linker (SEQ ID NO: 17), and Dnmt3A - Dnmt3L at the C terminus of dCas9 (separated by the linker EASGSGRASPGIPGSTR (SEQ ID NO: 19)). Another all-in-one protein that combined the domain KRAB (SEQ ID NO: 16), dCas9 (D10A, H208A), Dnmt3A - Dnmt3L (SEQ ID NO: 33; where SEQ ID NO: 26 is Dnmt3A and SEQ ID NO: 28 is Dnmt3L) into a single polypeptide (Figure 1B). With reference to FIG. 1B, the dCas9 - KRAB protein was adapted from Gilbert et al., Cell 2013, for use with CRISPR interference (CRISPRi) technology, and the dCas9 - Dnmt3A - Dnmt3L fusion protein was adapted from Stepper et al., Nucleic Acids Research, 2016.
[0235] Активность эпигенетического редактора В1 была протестирована на клетках HEK293T с использованием репортера GFP, чувствительного к метилированию ДНК (адаптированного из Stelzer et al., Cell 2015), для оценки длительного сайленсинга, вызываемого белком «все в одном» (Фиг. 1C). Универсальный хроматинраскрывающий элемент (УХЭ, англ. «UCOE») добавляли перед островком GAPDH CpG (CGI) для того, чтобы предотвратить фоновый сайленсинг лентивирусного вектора в клетках млекопитающих. Ген gfp отключается при метилировании GAPDH CGI. A, B и C обозначают положения, которые мы кодировали единой гидовой РНК (егРНК) для нацеливания в промоторе. Эти целевые последовательности и соответствующие последовательности егРНК перечислены в Таблице 1 ниже. В клетки котрансфицировали две плазмиды, одна из которых кодировала мутантный белок «hit-and-run», а другая плазмида кодировала егРНК (Фиг. 1D). Через двое суток после трансфекции были отсортированы клетки, которые экспрессируют белок «hit-and-run» и вектор, экспрессирующий егРНК. Флуоресценцию GFP оценивали с течением времени с помощью метода проточной цитометрии. Популяцию клеток, подвергающихся длительному сайленсингу репортера GFP, наблюдали в случае, когда белок «все в одном» экспрессируется с егРНК (Фиг. 1E). Количество клеток, подвергающихся длительному сайленсингу, было выше, чем при воздействии dCas9 - Dnmt3A - Dnmt3L (без домена KRAB). [0235] Epigenetic editor B1 activity was tested in HEK293T cells using a DNA methylation-sensitive GFP reporter (adapted from Stelzer et al., Cell 2015) to assess long-term silencing caused by the all-in-one protein (Figure 1C) . A universal chromatin opening element (UCOE) was added upstream of the GAPDH CpG island (CGI) to prevent background silencing of the lentiviral vector in mammalian cells. The gfp gene is switched off when GAPDH CGI is methylated. A, B, and C indicate the positions that we encoded for single guide RNA (sgRNA) targeting in the promoter. These target sequences and the corresponding egRNA sequences are listed in Table 1 below. Two plasmids were cotransfected into the cells, one encoding the hit-and-run mutant protein and the other plasmid encoding the egRNA (Fig. 1D). Two days after transfection, cells that express the hit-and-run protein and a vector expressing egRNA were sorted. GFP fluorescence was assessed over time using flow cytometry. A population of cells undergoing long-term silencing of the GFP reporter was observed when the all-in-one protein was expressed with egRNA ( Fig. 1E ). The number of cells undergoing long-term silencing was higher than when exposed to dCas9 - Dnmt3A - Dnmt3L (without the KRAB domain).
[0236] Таблица 1 [0236] Table 1
(SEQ ID NO: 37)ACTGCGGAAATTTGAGCGT
(SEQ ID NO: 37)
(SEQ ID NO: 38)ACGCTCAAATTTCCGCAGT
(SEQ ID NO: 38)
(SEQ ID NO: 39)AGGCAATGGCTGCACATGC
(SEQ ID NO: 39)
(SEQ ID NO: 40)GCATGTGCAGCCATTGCCT
(SEQ ID NO: 40)
(SEQ ID NO: 41)GACGCTTGGTTCTGAGGAG
(SEQ ID NO: 41)
(SEQ ID NO: 42)CTCCTCAGAACCAAGCGTC
(SEQ ID NO: 42)
[0237] Сайленсинг репортера GFP зависит от последовательности егРНК, при этом гидовая последовательность C вызывает самый высокий уровень сайленсинга среди трех протестированных последовательностей егРНК. Объединение егРНК, кодирующих различные последовательности, в единый пул не привело к значительному изменению в сайленсинге генов. [0237]Silencing The GFP reporter is egRNA sequence dependent, with guide sequence C causing the highest level of silencing among the three egRNA sequences tested. Combining egRNAs encoding different sequences into a single pool did not lead to a significant change in gene silencing.
[0238] Пример 2 [0238] Example 2
[0239] Три гена (CD29, CD81, CD151) были мишенями для долгосрочного сайленсинга с использованием слитого белка «hit-and-run». Все три белка локализованы на поверхности клетки, и нокдаун оценивали путем окрашивания клеток антителами на поверхности клетки с последующей проточной цитометрией. Репрезентативные данные проточной цитометрии, полученные через 22 суток после трансфекции, показаны на Фиг. 2A - 2C. Квадрант IV представляет клетки, которые отключили ген, на что указывает процент клеток с отключенным геном. Отсутствие клеток в квадрантах I и II означает, что белок «hit-and-run» (содержащий метку СФБ) больше не присутствует в клетках. На Фиг. 2D представлена количественная оценка сайленсинга генов CD29, CD81 и CD151 с помощью трех различных егРНК, вызванного с помощью трех различных последовательностей егРНК или пула всех трех егРНК. Целевые последовательности ДНК и их егРНК, используемые в этом эксперименте, обобщены в Таблице 2. [0239] Three genes (CD29, CD81, CD151) were targets for long-term silencing using a hit-and-run fusion protein. All three proteins are localized to the cell surface, and knockdown was assessed by staining cells with cell surface antibodies followed by flow cytometry. Representative flow cytometry data obtained 22 days after transfection are shown in Fig. 2A - 2C. Quadrant IV represents cells that have turned off the gene, as indicated by the percentage of cells with the gene turned off. The absence of cells in quadrants I and II means that the hit-and-run protein (containing the SFB tag) is no longer present in the cells. In FIG. Figure 2D shows a quantitative assessment of the silencing of the CD29, CD81 and CD151 genes by three different egRNAs, caused by three different egRNA sequences or a pool of all three egRNAs. The target DNA sequences and their sgRNAs used in this experiment are summarized in Table 2.
[0240] Таблица 2 [0240] Table 2
(SEQ ID NO: 43)TCCGGAAACGCATTCCTCT
(SEQ ID NO: 43)
(SEQ ID NO: 44)AGAGGAATCGGTTTCCGGA
(SEQ ID NO: 44)
(SEQ ID NO: 46)CCGGGCCGGGCTGACGCGG
(SEQ ID NO: 46)
(SEQ ID NO: 48)AGAGGGCCCAGCGGGAGTCG
(SEQ ID NO: 48)
(SEQ ID NO: 49)ccgttgcgcgctcgctctc
(SEQ ID NO: 49)
(SEQ ID NO: 50)gagagcgagcgcgcaacgg
(SEQ ID NO: 50)
(SEQ ID NO: 52)GGCCTGGCAGGATGCGCGG
(SEQ ID NO: 52)
(SEQ ID NO: 54)CCGAAACGCGCCAAGTTGG
(SEQ ID NO: 54)
(SEQ ID NO: 56)CCGGACTCGGACGCGTGGT
(SEQ ID NO: 56)
(SEQ ID NO: 57)TGCTCATTGTCCCTGGACA
(SEQ ID NO: 57)
(SEQ ID NO: 58)TGTCCAGGGACAATGAGCA
(SEQ ID NO: 58)
(SEQ ID NO: 59)GGACACCCTGCTCATTGTC
(SEQ ID NO: 59)
(SEQ ID NO: 60)GACAATGAGCAGGGTGTCC
(SEQ ID NO: 60)
[0241] Одновременно мишенями были два или три гена для того, чтобы показать, что белок «все в одном» может быть мультиплексирован путем совместной доставки егРНК, нацеленных на разные гены. НК егРНК относится к ненацеленному контролю егРНК. Результаты показаны на Фиг. 2E. [0241] Two or three genes were targeted simultaneously to show that an all-in-one protein could be multiplexed by co-delivering egRNAs targeting different genes. egRNA NC refers to the non-targeting control of egRNA. The results are shown in Fig. 2E.
[0242] Наблюдался генный сайленсинг в клетках, которые берут свое начало как единичный клон, и в большинстве клеток целевой ген CLTA оставался выключенным (37 из 39 клонов). График на Фиг. 2F представляет собой момент времени, взятый через 9 месяцев после трансфекции белка «все в одном» и егРНК, нацеленной на ген CLTA. [0242] Gene silencing was observed in cells that originated as a single clone, and in the majority of cells the target CLTA gene remained switched off (37 of 39 clones). Graph in Fig. 2F represents a time point taken 9 months after transfection of the all-in-one protein and egRNA targeting the CLTA gene.
[0243] Описанная в данном документе система может нацеливаться на любые гены в геномах млекопитающих, особенно на те, которые содержат островки CpG на промоторе гена. Dnmt3A - Dnmt3L канонически нацелен на динуклеотиды CpG. Примеры генов, на которые может быть нацелена указанная система, включают в себя, но не ограничиваются ими, CXCR4, CD4, CD8, CD45, PD-1, CLTA-4, TGFBR, TCRa, TCRb, B2M. [0243] The system described herein can target any genes in mammalian genomes, especially those that contain CpG islands at the gene promoter. Dnmt3A – Dnmt3L canonically targets CpG dinucleotides. Examples of genes that can be targeted by this system include, but are not limited to, CXCR4, CD4, CD8, CD45, PD-1, CLTA-4, TGFBR, TCRa, TCRb, B2M.
[0244] Пример 3 [0244] Example 3
[0245] Собирали клетки, которые утратили экспрессию ITGB1 (CD29), CD81 и CD151 через тридцать шесть суток после трансфекции, и анализировали их профили экспрессии РНК. Как показано на Фиг. 3A - 3C, был обнаружен успешный нокдаун целевых генов по сравнению с ненацеленным контролем егРНК. Фиг. 3D - 3F представляют собой вулканные диаграммы, показывающие, что нокдаун целевого гена является единственным значимым генным нокдауном для каждого эксперимента, что свидетельствует о высокой специфичности генного сайленсинга. Фиг. 3G - 3I представляют собой количественную оценку уровней транскриптов, показывающая более чем 96%-й нокдаун целевого гена. [0245] Cells that had lost expression of ITGB1 (CD29), CD81, and CD151 thirty-six days after transfection were collected and their RNA expression profiles were analyzed. As shown in FIG. 3A - 3C, successful knockdown of target genes was found compared to the untargeted egRNA control. Fig. 3D - 3F are volcano plots showing that target gene knockdown is the only significant gene knockdown for each experiment, indicating the high specificity of gene silencing. Fig. 3G to 3I are quantifications of transcript levels showing greater than 96% knockdown of the target gene.
[0246] Пример 4 [0246] Example 4
[0247] Белок «все в одном» можно трансфицировать и экспрессировать в линии HeLa (клетки шейки матки), U2OS (клетки кости) и индуцированных плюрипотентных стволовых клетках человека (ИПСК). Графики проточной цитометрии на Фиг. 4A - 4F показывают экспрессию СФБ, который слит с белком. Мишенями были три эндогенных гена в клетках HeLa и U2OS (т. е. CD29, CD81 и CD151). Как показано на Фиг. 4G, был обнаружен стабильный сайленсинг, измеренный через 18 суток после трансфекции. При нацеливании на Pcsk9, Npc1, Spcs1 и Cd81 был обнаружен сайленсинг генов в клеточных линиях гепатоцитов мышей AML12. Сайленсинг был обнаружен с помощью кПЦР через 14 суток после трансфекции, как показано на Фиг. 4H. Последовательности егРНК, использованные в данном эксперименте, приведены в Таблице 3. [0247] The all-in-one protein can be transfected and expressed in HeLa (cervical cells), U2OS (bone cells), and human induced pluripotent stem cells (iPSCs). Flow cytometry plots in Fig. 4A - 4F show expression of SFB, which is fused to the protein. The targets were three endogenous genes in HeLa and U2OS cells (i.e., CD29, CD81, and CD151). As shown in FIG. 4G, stable silencing was detected, measured 18 days after transfection. By targeting Pcsk9, Npc1, Spcs1 and Cd81, gene silencing was detected in AML12 mouse hepatocyte cell lines. Silencing was detected by qPCR 14 days after transfection, as shown in Fig. 4H. The sgRNA sequences used in this experiment are given in Table 3.
[0248] Таблица 3 [0248] Table 3
(от 5' к 3')Target sequence
(from 5' to 3')
(SEQ ID NO: 43)TCCGGAAACGCATTCCTCT
(SEQ ID NO: 43)
(SEQ ID NO: 44)AGAGGAATCGGTTTCCGGA
(SEQ ID NO: 44)
(SEQ ID NO: 61)ACCGGCAGCCTGCGCGTCC
(SEQ ID NO: 61)
(SEQ ID NO: 62)GGACGCGCAGGCTGCCCGGT
(SEQ ID NO: 62)
(SEQ ID NO: 63)CGATGGGCACCCACTGCTC
(SEQ ID NO: 63)
(SEQ ID NO: 64)GAGCAGTGGGTGCCCATCG
(SEQ ID NO: 64)
(SEQ ID NO: 65)CCTTCACGTGGACGCGCAG
(SEQ ID NO: 65)
(SEQ ID NO: 66)CTGCGCGTCCACGTGAAGG
(SEQ ID NO: 66)
(SEQ ID NO: 67)CGTGAAGGTGGAAGCCTTC
(SEQ ID NO: 67)
(SEQ ID NO: 68)GAAGGCTTCCACCTTCACG
(SEQ ID NO: 68)
(SEQ ID NO: 69)CTCCTTGGTCAGGCGCCCGG
(SEQ ID NO: 69)
(SEQ ID NO: 70)CCGGCGCCTGACCAAGGAG
(SEQ ID NO: 70)
(SEQ ID NO: 71)TGGTCAGGCGCGGTTCCG
(SEQ ID NO: 71)
(SEQ ID NO: 72)CGGAACCGGCGCCTGACCA
(SEQ ID NO: 72)
(SEQ ID NO: 73)TAGAGGTCGCTTCTCCTC
(SEQ ID NO: 73)
(SEQ ID NO: 74)GAGGAGAAGGCGACCTCTA
(SEQ ID NO: 74)
(SEQ ID NO: 75)CGACGCTCGGGTCGCGGTG
(SEQ ID NO: 75)
(SEQ ID NO: 76)CACCGCGACCCGAGCGTCG
(SEQ ID NO: 76)
(SEQ ID NO: 77)ATGCTGTCGCCGCGCGGGG
(SEQ ID NO: 77)
(SEQ ID NO: 78)CCCGCGGCGACAGCAT
(SEQ ID NO: 78)
(SEQ ID NO: 79)CTCACCCTCACCGGAGCCA
(SEQ ID NO: 79)
(SEQ ID NO: 80)TGGCTCCGGTGAGGGTGAG
(SEQ ID NO: 80)
(SEQ ID NO: 81)CCGCAAACTTTACTCCTTA
(SEQ ID NO: 81)
(SEQ ID NO: 82)TAAGGAGTAAAGTTTGCGG
(SEQ ID NO: 82)
(SEQ ID NO: 60)CTCGGAGACATCCGCTTCC
(SEQ ID NO: 60)
(SEQ ID NO: 60)GGAAGCGGATGTCTCCGAG
(SEQ ID NO: 60)
(SEQ ID NO: 83)CTCCTAAGATTGGCTTCAC
(SEQ ID NO: 83)
(SEQ ID NO: 84)GTGAAGCCAATCTAGGAG
(SEQ ID NO: 84)
(SEQ ID NO: 85)CCGGAGCCACTCCTAAGAT
(SEQ ID NO: 85)
(SEQ ID NO: 86)ATCTTAGGAGTGGCTCCGG
(SEQ ID NO: 86)
(SEQ ID NO: 87)TTCTCTACCTACGTCTCA
(SEQ ID NO: 87)
(SEQ ID NO: 88)TGAGACGTAGGGTAGAGAA
(SEQ ID NO: 88)
(SEQ ID NO: 89)TACGTCTCATTCTCCGCAA
(SEQ ID NO: 89)
(SEQ ID NO: 90)TTGCGGAGAATGAGACGTA
(SEQ ID NO: 90)
(SEQ ID NO: 91)GCTAGGCCTCCAGCCCTTC
(SEQ ID NO: 91)
(SEQ ID NO: 92)GAAGGGCTGGAGGCCTAGC
(SEQ ID NO: 92)
(SEQ ID NO: 93)ACAGGTGGCGCCGCAACTT
(SEQ ID NO: 93)
(SEQ ID NO: 94)AAGTTGCGGCGCCACCTGT
(SEQ ID NO: 94)
(SEQ ID NO: 95)AGCCGGAGGCGCGAGAGTC
(SEQ ID NO: 95)
(SEQ ID NO: 96)GACTCTCGCGCCTCCGGCT
(SEQ ID NO: 96)
[0249] Пример 5 [0249] Example 5
[0250] На Фиг. 5 представлена схема белковых конструкций «все в одном», которые были сконструированы и протестированы на предмет сайленсинга генов. Первоначальный формат (p76, В1) SEQ ID NO: 1 был модифицирован для кодирования линкеров XTEN (например, 16 аминокислот (SEQ ID NO: 31) или 80 аминокислот (SEQ ID NO: 32)) либо на N-конце, либо на С-конце dCas9 (SEQ ID NO: 29). Все векторы содержат метки HA (SEQ ID NO: 24) на С-конце dCas9. В аспектах данного изобретения используется промотор CAG, поскольку он обеспечивает хорошую экспрессию, например, в конструкциях p76 и p90-102, p112 (В2). Со ссылкой на Фиг. 5, белковые конструкции с p90 по p102 соответствуют последовательностям с SEQ ID NO: 2-14, соответственно, а белковые конструкции p112 соответствуют последовательности с SEQ ID NO: 15. [0250] In FIG. Figure 5 shows a diagram of the all-in-one protein constructs that were designed and tested for gene silencing. The original format (p76, B1) SEQ ID NO: 1 has been modified to encode XTEN linkers (e.g., 16 amino acids (SEQ ID NO: 31) or 80 amino acids (SEQ ID NO: 32)) at either the N-terminus or C -end of dCas9 (SEQ ID NO: 29). All vectors contain HA tags (SEQ ID NO: 24) at the C terminus of dCas9. Aspects of the present invention use the CAG promoter because it provides good expression, for example, in the p76 and p90-102, p112 (B2) constructs. With reference to FIG. 5, protein constructs p90 to p102 correspond to SEQ ID NO: 2-14, respectively, and protein constructs p112 correspond to SEQ ID NO: 15.
[0251] Пример 6 [0251] Example 6
[0252] Белковые конструкции, показанные на Фиг. 5, тестировали на предмет сайленсинга гена CLTA в клетках HEK293T в течение 18 суток после трансфекции (Фиг. 6A - 6B). Были обнаружены переменные уровни активности в сайленсинге генов, включая ряд вариантов с более устойчивым сайленсингом генов по сравнению с конструкцией p76 (В1), таких как p99 (SEQ ID NO: 11), p100 (SEQ ID NO: 12) и p112 (SEQ ID NO: 15). На Фиг. 6A и 6B показано, что конструкции dCas9 - KRAB и dCas9 - Dnmt3A - Dnmt3L продемонстрировали кратковременную и более низкую эффективность длительного сайленсинга. [0252] The protein constructs shown in FIG. 5 were tested for silencing of the CLTA gene in HEK293T cells for 18 days after transfection (Fig. 6A - 6B). Variable levels of gene silencing activity were found, including a number of variants with more robust gene silencing compared to the p76 (B1) construct, such as p99 (SEQ ID NO: 11), p100 (SEQ ID NO: 12) and p112 (SEQ ID NO: 15). In FIG. 6A and 6B show that the dCas9 - KRAB and dCas9 - Dnmt3A - Dnmt3L constructs demonstrated short-term and lower long-term silencing efficiencies.
[0253] p76 (SEQ ID NO: 1), p112 (SEQ ID NO: 15) тестировали на предмет сайленсинга эндогенного гена HIST2H2BE (H2B) и синтетического репортерного гена Snrpn-GFP, стабильно экспрессируемого в клетках HEK293T (Фиг. 6C - 6D). За клетками наблюдали в течение 50 суток после трансфекции. Вариант p112 поддерживал сайленсинг гена с более высокой эффективностью, чем конструкция p76 (В1). Слитые белки dCas9 - Dnmt3A - Dnmt3L и dCas9 - KRAB продемонстрировали кратковременную и более низкую эффективность длительного сайленсинга. На Фиг. 6E представлен график экспрессии белков p76 и p112 в течение 50 суток для выключения гена HIST2H2BE (H2B). Уровни белка измеряли с помощью метода проточной цитометрии для детектирования СФБ, который экспрессируется совместно с белком «все в одном». [0253] p76 (SEQ ID NO: 1), p112 (SEQ ID NO: 15) were tested for silencing of the endogenous HIST2H2BE (H2B) gene and the synthetic reporter gene Snrpn-GFP stably expressed in HEK293T cells (Fig. 6C - 6D) . The cells were observed for 50 days after transfection. The p112 variant supported gene silencing with higher efficiency than the p76 construct (B1). The dCas9 - Dnmt3A - Dnmt3L and dCas9 - KRAB fusion proteins showed short-term and lower long-term silencing efficiency. In FIG. Figure 6E shows a graph of p76 and p112 protein expression over 50 days to turn off the HIST2H2BE (H2B) gene. Protein levels were measured using a flow cytometry method to detect SBF, which is co-expressed with the all-in-one protein.
[0254] Пример 7 [0254] Example 7
[0255] Анализ по методу вестерн-блоттинга проводили с вариантами белков «все в одном» p76, p90 - p102 с использованием антитела против Steptococcus pyogenes Cas9. Со ссылкой на Фиг. 7А, верхняя полоса представляет собой полноразмерный белок, а полосы меньшего размера представляют собой продукты протеолиза белка «все в одном». Варианты, для которых наблюдается слабый протеолиз, такие как p99 (SEQ ID NO: 11), p100 (SEQ ID NO: 12) и p102 (SEQ ID NO: 14), демонстрируют более высокую эффективность генного сайленсинга. Варианты с высокими уровнями протеолиза, такие как p96 (SEQ ID NO: 8) и p97 (SEQ ID NO: 9), приводили к более низкой эффективности устойчивого генного сайленсинга. [0255] Western blot analysis was performed on all-in-one protein variants p76, p90 - p102 using the anti- Steptococcus pyogenes Cas9 antibody. With reference to FIG. 7A, the top band represents the full-length protein and the smaller bands represent the all-in-one protein proteolysis products. Variants that exhibit weak proteolysis, such as p99 (SEQ ID NO: 11), p100 (SEQ ID NO: 12) and p102 (SEQ ID NO: 14), show higher efficiency of gene silencing. Variants with high levels of proteolysis, such as p96 (SEQ ID NO: 8) and p97 (SEQ ID NO: 9), resulted in lower efficiency of sustained gene silencing.
[0256] Анализ по методу вестерн-блоттинга проводили с вариантами белков «все в одном» для обнаружения свободного Dnmt3A, который отщепляется от слитого белка. Как показано на Фиг. 7B, варианты, для которых наблюдался слабо детектируемый свободный Dnmt3 или он вообще отсутствовал, такие как p92 (SEQ ID NO: 4), p100 (SEQ ID NO: 12), p101 (SEQ ID NO: 13) и p102 (SEQ ID NO: 14), проявляли более высокую эффективность устойчивого генного сайленсинга по сравнению с вариантами с детектируемым отщепленным Dnmt3A, то есть p76 (SEQ ID NO: 1), p91 (SEQ ID NO: 3), p96 (SEQ ID NO: 8), p98 (SEQ ID NO: 10). [0256] Western blot analysis was performed with all-in-one protein variants to detect free Dnmt3A that is cleaved from the fusion protein. As shown in FIG. 7B, variants for which little or no free Dnmt3 was detected, such as p92 (SEQ ID NO: 4), p100 (SEQ ID NO: 12), p101 (SEQ ID NO: 13) and p102 (SEQ ID NO: : 14), exhibited a higher efficiency of stable gene silencing compared to variants with detectable cleaved Dnmt3A, i.e. p76 (SEQ ID NO: 1), p91 (SEQ ID NO: 3), p96 (SEQ ID NO: 8), p98 (SEQ ID NO: 10).
[0257] Пример 8 [0257] Example 8
[0258] Был проведен объединенный скрининг, как показано на Фиг. 8A, с целью определения оптимальных егРНК, которые приводят к долгосрочному сайленсингу генов. Использовали четыре клеточные линии HEK293T, каждая с различным геном с меткой GFP (CLTA, VIM, HIST2H2BE (H2B) и RAB11A). Тайлинг-библиотеки, состоящие из егРНК, охватывающих +/- 2,5 т.п.о. от сайта начала транскрипции (СНТ) каждого гена, стабильно экспрессировались в клетках путем доставки лентивирусов с последующей кратковременной экспрессией плазмидной ДНК, экспрессирующей белок «все в одном». Через четыре недели после трансфекции клетки, которые поддерживали сайленсинг генов, сортировали для идентификации конкретных егРНК. Фиг. 8B - 8E представляют собой гистограммы проточной цитометрии, показывающие процент клеток, подвергающихся генному сайленсингу через четыре недели после трансфекции. [0258] A pooled screening was performed as shown in FIG. 8A, with the aim of identifying optimal egRNAs that lead to long-term gene silencing. Four HEK293T cell lines were used, each with a different GFP-tagged gene (CLTA, VIM, HIST2H2BE (H2B), and RAB11A). Tiling libraries consisting of egRNAs spanning +/- 2.5 kb. from the transcription start site (TST) of each gene, were stably expressed in cells by delivery of lentiviruses followed by transient expression of plasmid DNA expressing the all-in-one protein. Four weeks after transfection, cells that supported gene silencing were sorted to identify specific egRNAs. Fig. 8B - 8E are flow cytometry histograms showing the percentage of cells undergoing gene silencing four weeks after transfection.
[0259] Фиг. 9A - 9D представляют собой карты функциональности егРНК в сайте начала транскрипции целевого гена (CLTA, H2B, RAB11, VIM). Сайт начала транскрипции (СНТ, англ. «TSS») и островок CpG аннотированы над каждым графиком. Каждая точка отображает собой одну егРНК, а ее эффективность в долгосрочном генном сайленсинге отображено как изменение в log2-кратном содержании егРНК. Степень заполнения нуклеосом (нижний график) нанесена на графики по сигналу от МНазы (микрококковая нуклеаза, англ. «MNase»). [0259] FIG. 9A - 9D are maps of egRNA functionality at the transcription start site of the target gene (CLTA, H2B, RAB11, VIM). The transcription start site (TSS) and CpG island are annotated above each graph. Each dot represents one egRNA, and its effectiveness in long-term gene silencing is displayed as a change in log2-fold egRNA content. The degree of nucleosome occupancy (lower graph) is plotted against the signal from MNase (micrococcal nuclease, English “MNase”).
[0260] Пример 9 [0260] Example 9
[0261] На Фиг. 10А представлен рабочий процесс объединенного скрининга в клетках HEK293T, проводимого с целью определения оптимальных положений нацеливания егРНК для белка «все в одном», адаптированный из предыдущего рицинового скрининга на биочипах высокой плотности в клетках K562 для определения оптимальных егРНК для dCas9 - KRAB (Gilbert, Horlbeck et al., Cell 2014). Сначала егРНК стабильно экспрессировали в клетках HEK293T путем доставки лентивирусов с последующей кратковременной трансфекцией плазмиды, кодирующей белок «все в одном» (День 0). Клетки, экспрессирующие белок «все в одном», сортировали (день 2) и позволяли им расти далее в течение трех суток. На 5-е сутки клетки рассаживали, и половину из них отбирали как образцы начального момента времени, а другую половину культивировали в течение еще десяти суток (День 15) как образцы конечного момента времени. Ростовой фенотип (γ) рассчитывается как log2 обогащения егРНК, деленный на количество удвоений клеток между T (начальное) и T (конечное). [0261] In FIG. 10A shows a pooled screening workflow in HEK293T cells to determine optimal segRNA targeting positions for an all-in-one protein, adapted from a previous high-density ricin biochip screen in K562 cells to identify optimal segRNAs for dCas9 - KRAB (Gilbert, Horlbeck et al., Cell 2014). First, egRNA was stably expressed in HEK293T cells by delivery of lentiviruses followed by transient transfection of a plasmid encoding the all-in-one protein (Day 0). Cells expressing the all-in-one protein were sorted (day 2) and allowed to grow further for three days. On Day 5, the cells were plated and half were collected as start-time samples and the other half were cultured for another ten days (Day 15) as end-point samples. Growth phenotype (γ) is calculated as log2 of segRNA enrichment divided by the number of cell doublings between T (initial) and T (final).
[0262] На Фиг. 10B - 10E представлены репрезентативные графики, демонстрирующие ростовые фенотипы для четырех генов (ARL1, EIF6, SMC3, HEATR1) из существующих наборов данных dCas9 - KRAB/ CRISPRi в клетках K562 (Gilbert, Horlbeck et al., 2014) и с белком «все в одном» (нижний график). Каждая точка отображает собой егРНК. СНТ и аннотированный островок CpG показаны для каждого гена. Функциональные егРНК, использующие белок «все в одном», охватывают более широкий диапазон, чем просто функциональные егРНК, что означает более широкий диапазон эффективного нацеливания. [0262] In FIG. 10B - 10E are representative plots showing growth phenotypes for four genes (ARL1, EIF6, SMC3, HEATR1) from existing dCas9 - KRAB/CRISPRi data sets in K562 cells (Gilbert, Horlbeck et al., 2014) and with the all-in protein one" (bottom graph). Each dot represents an egRNA. The CNT and annotated CpG island are shown for each gene. Functional egRNAs using an all-in-one protein cover a wider range than functional egRNAs alone, meaning a wider range of effective targeting.
[0263] Пример 10 [0263] Example 10
[0264] На Фиг. 11A - 11B представлено сравнение ростовых фенотипов и позиционирования нуклеосом (по сигналу от МНазы) для VPS53 и VPS54, и показано расположение функциональных егРНК в областях, лишенных нуклеосом. Более того, диапазон функциональных егРНК является более широким при использовании белка «все в одном» по сравнению с dCas9 - KRAB/ CRISPRi. [0264] In FIG. 11A - 11B compare growth phenotypes and nucleosome positioning (as signaled by MNase) for VPS53 and VPS54, and show the location of functional egRNAs in regions lacking nucleosomes. Moreover, the range of functional egRNAs is wider when using an all-in-one protein compared to dCas9 - KRAB/CRISPRi.
[0265] Пример 11 [0265] Example 11
[0266] Транскрипция in vitro двух вариантов «все в одном» (p102 (SEQ ID NO: 14) и p112 (SEQ ID NO: 15)) демонстрирует полноразмерный синтез каждой конструкции (Фиг. 12A). На Фиг. 12B представлен график проточной цитометрии, показывающий экспрессию p102 и p112 через одни сутки после трансфекции мРНК в клетки HEK293T. На Фиг. 12C показана сайленсинг эндогенного гена CLTA с течением времени в клетках HEK293T после трансфекции мРНК, экспрессирующей варианты p102 и p112 белка «все в одном». [0266] In vitro transcription of two all-in-one variants (p102 (SEQ ID NO: 14) and p112 (SEQ ID NO: 15)) demonstrates full-length synthesis of each construct (Figure 12A). In FIG. 12B is a flow cytometry graph showing the expression of p102 and p112 one day after transfection of the mRNA into HEK293T cells. In FIG. 12C shows silencing of the endogenous CLTA gene over time in HEK293T cells following transfection of mRNA expressing all-in-one protein variants p102 and p112.
[0267] Пример 12 [0267] Example 12
[0268] На Фиг. 13A представлены графики проточной цитометрии, показывающие индуцированную экспрессию белка «все в одном», полученную путем добавления доксициклина в клетки K562, которые стабильно кодируют белок «все в одном» под действием промотора, индуцируемого доксициклином. Экспрессию белка наблюдали в течение четырех суток после индукции доксициклином. Пунктирные линии на панелях на Фиг. 13А представляют собой базовую медианную флуоресценцию СФБ без введения доксициклина. Проводили вестерн-блоттинг клеток с целью выявления экспрессии белка «все в одном» до и после обработки доксициклином (Фиг. 13B). Присутствие белка «все в одном» не детектируется через 96 часов после индукции. Графики проточной цитометрии нокдауна CD81 и CD151 через 14 суток после обработки клеток K562 доксициклином представлены на Фиг. 13C - 13F. Показан процент клеток с отключенным целевым геном. Детектируемая экспрессия белка «все в одном» отсутствует, поскольку в квадрантах BFP+ нет клеток. Количественная оценка нокдауна CD81 и CD151 через 14 суток после обработки доксициклином или без обработки доксициклином представлена на Фиг. 13G. [0268] In FIG. 13A are flow cytometry plots showing the induced expression of the all-in-one protein obtained by adding doxycycline to K562 cells that stably encode the all-in-one protein under the influence of a doxycycline-inducible promoter. Protein expression was observed for four days after doxycycline induction. The dotted lines in the panels in FIG. 13A represents the baseline median fluorescence of SPB without doxycycline administration. Western blotting of the cells was performed to detect all-in-one protein expression before and after doxycycline treatment (Figure 13B). The presence of the all-in-one protein is not detected 96 hours after induction. Flow cytometry plots of CD81 and CD151 knockdown 14 days after treatment of K562 cells with doxycycline are presented in Fig. 13C - 13F. The percentage of cells with the target gene disabled is shown. There is no detectable all-in-one protein expression because there are no cells in the BFP+ quadrants. Quantification of CD81 and CD151 knockdown 14 days after doxycycline treatment or without doxycycline treatment is presented in Fig. 13G.
[0269] Список литературы [0269] References
[0270] Ecco et al, Development 144, 2017. Lambert et al., Cell 172, 2018. Siddique et al., J. Mol. Biol., 425, 2013. Stepper et al., Nucleic Acids Res., 45, 2017. Shmakov et al., Nat. Rev. Microbiol. 15, 2017. CCebrian-Serrano et al., Mamm. Genome 7-8, 2017. Pulecio et al., Cell Stem Cell 21, 2017. [0270] Ecco et al., Development 144, 2017. Lambert et al., Cell 172, 2018. Siddique et al., J. Mol. Biol., 425, 2013. Stepper et al., Nucleic Acids Res., 45, 2017. Shmakov et al., Nat. Rev. Microbiol. 15, 2017. CCebrian-Serrano et al., Mamm. Genome 7-8, 2017. Pulecio et al., Cell Stem Cell 21, 2017.
[0271] Неофициальный список последовательностей [0271] Unofficial sequence list
[0272] SEQ ID NO: 1 (p76 (последовательность белка «все в одном», версия 1): KRAB (жирный шрифт; из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив; остатки 612-912; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), СФБ (строчные буквы, подчеркивание)) [0272]SEQ ID NO: 1 (p76 (all-in-one protein sequence version 1): KRAB (bold; from Gilbert et al., Cell, 2013, 2014), linkers (underline), dCas9 (italics), HA tag (lowercase), SV40 SNL (lowercase, italics), Dnmt3A (bold, italics; residues 612-912; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016 ), 27 amino acid linker (underline, italics; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase letters, bold), SFB (lowercase letters, underlining))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln* DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0273] SEQ ID NO: 2 (p90 (KRAB - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014); линкеры (подчеркивание), dCas9 (курсив); метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (заглавные буквы, последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0273] SEQ ID NO: 2 (p90 (KRAB - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014); linkers (underline), dCas9 (italics); tag HA (lowercase), SV40 SAL (lowercase, italics), XTEN16 (capitals, 16 amino acid sequence), Dnmt3A (bold, italics; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPGSGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG SGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0274] SEQ ID NO: 3 (p91 (KRAB - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0274] SEQ ID NO: 3 (p91 (KRAB - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline), dCas9 (italics), HA tag (lowercase), SV40 SAL (lowercase, italics), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 linker amino acids (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0275] SEQ ID NO: 4 (p92 (KRAB - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0275] SEQ ID NO: 4 (p92 (KRAB - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline) , dCas9 (italics), HA tag (lowercase), SV40 SNL (lowercase, italics), XTEN16 (16 amino acid sequence), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al ., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB , 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPGSGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG SGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0276] SEQ ID NO: 5 (p93 (KRAB - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0276] SEQ ID NO: 5 (p93 (KRAB - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline), dCas9 (italics), HA tag (lowercase), SV40 SAL (lowercase, italics), XTEN80 (80 amino acid sequence), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underline, italics; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013 ; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPGGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0277] SEQ ID NO: 6 (p94 (KRAB - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0277] SEQ ID NO: 6 (p94 (KRAB - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline) , dCas9 (italics), HA tag (lowercase), SV40 SNL (lowercase, italics), XTEN80 (80 amino acid sequence), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al ., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB , 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPGGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGSGGGS MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0278] SEQ ID NO: 7 (p95 (KRAB - XTEN16 - dCas9 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0278] SEQ ID NO: 7 (p95 (KRAB - XTEN16 - dCas9 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline), XTEN16 (16 amino acid sequence), dCas9 (italics), HA tag (lowercase), SV40 SAL (lowercase, italics), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013 ; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP SGSETPGTSESATPES MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0279] SEQ ID NO: 8 (p96 (KRAB - XTEN16 - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт); BFP (строчные буквы, подчеркивание)) [0279] SEQ ID NO: 8 (p96 (KRAB - XTEN16 - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline) , XTEN16 (16 amino acid sequence), dCas9 (italics), HA tag (lowercase), SV40 SAL (lowercase, italics), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al ., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB , 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold); BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP SGSETPGTSESATPES MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0280] SEQ ID NO: 9 (p97 (KRAB - XTEN80 - dCas9 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (последовательность из 80 аминокислот), dCas9 (курсив); метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0280] SEQ ID NO: 9 (p97 (KRAB - XTEN80 - dCas9 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline), XTEN80 (80 amino acid sequence), dCas9 (italics); HA tag (lowercase), SV40 SAL (lowercase, italics), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013 ; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0281] SEQ ID NO: 10 (p98 (KRAB - XTEN80 - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0281] SEQ ID NO: 10 (p98 (KRAB - XTEN80 - dCas9 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline) , XTEN80 (80 amino acid sequence), dCas9 (italics), HA tag (lowercase), SV40 SAL (lowercase, italics), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013; Stepper et al ., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB , 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv EASGSGRASPGIPGSTR NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0282] SEQ ID NO: 11 (p99 (KRAB - XTEN16 - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), линкеры (подчеркивание), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0282] SEQ ID NO: 11 (p99 (KRAB - XTEN16 - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), XTEN16 (sequence from 16 amino acids), dCas9 (italic), HA tag (lowercase), linkers (underline), SV40 SAL (lowercase, italic), XTEN80 (lowercase, bold, italic, 80 amino acid sequence), Dnmt3A (bold , italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underlining, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016 ), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPG ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepseNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP SGSETPGTSESATPES MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepseNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0283] SEQ ID NO: 12 (p100 (KRAB - XTEN16 - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), XTEN16 (последовательность из 16 аминокислот), dCas9 (курсив), метка HA (строчные буквы), линкеры (подчеркивание), SV40 СЯЛ (строчные буквы, курсив), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0283] SEQ ID NO: 12 (p100 (KRAB - XTEN16 - dCas9 - XTEN80 - Dnmt3A - Dnmt3L - P2A - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), XTEN16 ( 16 amino acid sequence), dCas9 (italics), HA tag (lowercase), linkers (underline), SV40 SAL (lowercase, italics), XTEN80 (lowercase, bold, italics, 80 amino acid sequence), Dnmt3A ( bold, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR , 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), P2A peptide cleavage sequence (lowercase, bold), BFP (lowercase, underline) )
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPSGSETPGTSESATPESMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPG ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepseNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP SGSETPGTSESATPES MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepseNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0284] SEQ ID NO: 13 (p101 (KRAB - XTEN80 - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0284] SEQ ID NO: 13 (p101 (KRAB - XTEN80 - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline) , XTEN80 (lowercase, bold, italic, 80 amino acid sequence), dCas9 (italic), HA tag (lowercase), SV40 SAL (lowercase, italic), XTEN16 (16 amino acid sequence), Dnmt3A (bold , italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underlining, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016 ), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPGSGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG SGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0285] SEQ ID NO: 14 (p102 (KRAB - XTEN80 - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), XTEN16 (последовательность из 16 аминокислот), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), последовательность расщепления пептидом P2A (строчные буквы, жирный шрифт), BFP (строчные буквы, подчеркивание)) [0285] SEQ ID NO: 14 (p102 (KRAB - XTEN80 - dCas9 - XTEN16 - Dnmt3A - Dnmt3L - P2A - BFP): KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline) , XTEN80 (lowercase, bold, italic, 80 amino acid sequence), dCas9 (italic), HA tag (lowercase), SV40 SAL (lowercase, italic), XTEN16 (16 amino acid sequence), Dnmt3A (bold , italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), 27 amino acid linker (underlining, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016 ), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), peptide cleavage sequence P2A (lowercase, bold), BFP (lowercase, underline))
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRADypydvpdyaSGS pkkkrkv SPGSGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln * DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD SRAD ypydvpdya SGS pkkkrkv SPG SGSETPGTSESATPES NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL SRAD pkkkrkv GSG atnfsllkqagdveenpgp GSG atnfsllkqagdveenpgp selikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghkln *
[0286] SEQ ID NO: 15 (p112 (Dnmt3A - Dnmt3L - XTEN80 - dCas9 - BFP - KRAB); KRAB (жирный шрифт, из Gilbert et al., Cell, 2013, 2014), линкеры (подчеркивание), XTEN80 (строчные буквы, жирный шрифт, курсив, последовательность из 80 аминокислот), dCas9 (курсив), метка HA (строчные буквы), SV40 СЯЛ (строчные буквы, курсив), Dnmt3A (жирный шрифт, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), линкер из 27 аминокислот (подчеркивание, курсив, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (подчеркивание, жирный шрифт, из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), BFP (строчные буквы, подчеркивание)) [0286] SEQ ID NO: 15 (p112 (Dnmt3A - Dnmt3L - XTEN80 - dCas9 - BFP - KRAB); KRAB (bold, from Gilbert et al., Cell, 2013, 2014), linkers (underline), XTEN80 (lowercase letters, bold, italics, 80 amino acid sequence), dCas9 (italics), HA tag (lowercase), SV40 SAL (lowercase, italics), Dnmt3A (bold, italics, from Siddique et al., JMB, 2013 ; Stepper et al., NAR, 2016), 27 amino acid linker (underline, italics, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), Dnmt3L (underline, bold, from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016), BFP (lower case, underline))
NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD AypydvpdyaSLGSGS pkkkrkv ED pkkkrkv DGIGSGSNGSSGSselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianikttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghklnGGGGGMDAKSLTAWS RTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP * NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDK LELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV SSGNSNANSRGPSFSSGLVPLSLRGSH MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLV KNCLLLPLREYFKYFSQNSLPL ggpssgapppsggspagsptsteegtsesatpesgpgtstepsegsapgspagsptsteegtstepsegsapgtstepse MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGD AypydvpdyaSLGSGS pkkkrkv ED pkkkrkv DGIGSGSNGSSGSselikenmhmklymegtvdnhhfkctsegegkpyegtqtmrikvveggplpfafdilatsflygsktfinhtqgipdffkqsfpegftwervttyedggvltatqdtslqdgcliynvkirgvnftsngpvmqkktlgweaftetlypadgglegrndmalklvggshlianik ttyrskkpaknlkmpgvyyvdyrlerikeannetyveqhevavarycdlpsklghklnGGGGGMDAKSLTAWS RTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP *
[0287] SEQ ID NO: 16 (KRAB; из Gilbert et al., Cell, 2013, 2014) [0287] SEQ ID NO: 16 (KRAB; from Gilbert et al., Cell, 2013, 2014)
DAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEPDAKSLTAWSRTLVTFKDVFVDFTREEWKLLDTAQQIVYRNVMLENYKNLVSLGYQLTKPDVILRLEKGEEP
[0288] SEQ ID NO: 17 (линкер) [0288] SEQ ID NO: 17 (linker)
GGSGGGSGGSGGGS
[0289] SEQ ID NO: 18 (линкер) [0289] SEQ ID NO: 18 (linker)
SGSSGS
[0290] SEQ ID NO: 19 (линкер) [0290] SEQ ID NO: 19 (linker)
EASGSGRASPGIPGSTREASGSGRASPGIPGSTR
[0291] SEQ ID NO: 20 (линкер) [0291] SEQ ID NO: 20 (linker)
SRADSRAD
[0292] SEQ ID NO: 21 (линкер) [0292] SEQ ID NO: 21 (linker)
GSGGSG
[0293] SEQ ID NO: 22 (линкер [0293] SEQ ID NO: 22 (linker
SPGSPG
[0294] SEQ ID NO: 23 (dCas9) [0294] SEQ ID NO: 23 (dCas9)
MDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYNQLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLVKLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISGVEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERMKRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQFYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKLKSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLIHQSITGLYETRIDLSQLGGDMDKKYSIGLAIGTNSVGWAVITDEYKVPSKKFKVLGNTDRHSIKKNLIGALLFDSGETAEATRLKRTARRRYTRRKNRICYLQEIFSNEMAKVDDSFFHRLEESFLVEEDKKHERHPIFGNIVDEVAYHEKYPTIYHLRKKLVDSTDKADLRLIYLALAHMIKFRGHFLIEGDLNPDNSDVDKLFIQLVQTYN QLFEENPINASGVDAKAILSARLSKSRRLENLIAQLPGEKKNGLFGNLIALSLGLTPNFKSNFDLAEDAKLQLSKDTYDDDLDNLLAQIGDQYADLFLAAKNLSDAILLSDILRVNTEITKAPLSASMIKRYDEHHQDLTLLKALVRQQLPEKYKEIFFDQSKNGYAGYIDGGASQEEFYKFIKPILEKMDGTEELLV KLNREDLLRKQRTFDNGSIPHQIHLGELHAILRRQEDFYPFLKDNREKIEKILTFRIPYYVGPLARGNSRFAWMTRKSEETITPWNFEEVVDKGASAQSFIERMTNFDKNLPNEKVLPKHSLLYEYFTVYNELTKVKYVTEGMRKPAFLSGEQKKAIVDLLFKTNRKVTVKQLKEDYFKKIECFDSVEISG VEDRFNASLGTYHDLLKIIKDKDFLDNEENEDILEDIVLTLTLFEDREMIEERLKTYAHLFDDKVMKQLKRRRYTGWGRLSRKLINGIRDKQSGKTILDFLKSDGFANRNFMQLIHDDSLTFKEDIQKAQVSGQGDSLHEHIANLAGSPAIKKGILQTVKVVDELVKVMGRHKPENIVIEMARENQTTQKGQKNSRERM KRIEEGIKELGSQILKEHPVENTQLQNEKLYLYYLQNGRDMYVDQELDINRLSDYDVDAIVPQSFLKDDSIDNKVLTRSDKNRGKSDNVPSEEVVKKMKNYWRQLLNAKLITQRKFDNLTKAERGGLSELDKAGFIKRQLVETRQITKHVAQILDSRMNTKYDENDKLIREVKVITLKSKLVSDFRKDFQ FYKVREINNYHHAHDAYLNAVVGTALIKKYPKLESEFVYGDYKVYDVRKMIAKSEQEIGKATAKYFFYSNIMNFFKTEITLANGEIRKRPLIETNGETGEIVWDKGRDFATVRKVLSMPQVNIVKKTEVQTGGFSKESILPKRNSDKLIARKKDWDPKKYGGFDSPTVAYSVLVVAKVEKGKSKKL KSVKELLGITIMERSSFEKNPIDFLEAKGYKEVKKDLIIKLPKYSLFELENGRKRMLASAGELQKGNELALPSKYVNFLYLASHYEKLKGSPEDNEQKQLFVEQHKHYLDEIIEQISEFSKRVILADANLDKVLSAYNKHRDKPIREQAENIIHLFTLTNLGAPAAFKYFDTTIDRKRYTSTKEVLDATLI HQSITGLYETRIDLSQLGGD
[0295] SEQ ID NO: 24 (метка НА) [0295] SEQ ID NO: 24 (label HA)
YPYDVPDYAYPYDVPDYA
[0296] SEQ ID NO: 25 (SV40 СЯЛ) [0296] SEQ ID NO: 25 (SV40 SYAL)
PKKKRKVPKKKRKV
[0297] SEQ ID NO: 26 (Dnmt3A; остатки 612-912; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016) [0297] SEQ ID NO: 26 (Dnmt3A; residues 612-912; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016)
NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDK LELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACV
[0298] SEQ ID NO: 27 (линкер из 27 аминокислот; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016) [0298] SEQ ID NO: 27 (27 amino acid linker; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016)
SSGNSNANSRGPSFSSGLVPLSLRGSHSSGNSNANSRGPSFSSGLVPLSLRGSH
[0299] SEQ ID NO: 28 (Dnmt3L; из Siddique et al., JMB, 2013; Stepper et al., NAR, 2016) [0299] SEQ ID NO: 28 (Dnmt3L; from Siddique et al., JMB, 2013; Stepper et al., NAR, 2016)
MGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLV KNCLLLPLREYFKYFSQNSLPL
[0300] SEQ ID NO: 29 (последовательность расщепления пептидом P2A) [0300] SEQ ID NO: 29 (P2A peptide cleavage sequence)
ATNFSLLKQAGDVEENPGPATNFSLLKQAGDVEENPGP
[0301] SEQ ID NO: 30 (СФП, англ. «BFP») [0301] SEQ ID NO: 30 (SFP, English “BFP”)
SELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANIKTTYRSKKPAKNLKMPGVYYVDYRLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLN *SELIKENMHMKLYMEGTVDNHHFKCTSEGEGKPYEGTQTMRIKVVEGGPLPFAFDILATSFLYGSKTFINHTQGIPDFFKQSFPEGFTWERVTTYEDGGVLTATQDTSLQDGCLIYNVKIRGVNFTSNGPVMQKKTLGWEAFTETLYPADGGLEGRNDMALKLVGGSHLIANIKTTYRSKKPAKNLKMPGVYYVDY RLERIKEANNETYVEQHEVAVARYCDLPSKLGHKLN *
[0302] SEQ ID NO: 31 (XTEN16 (последовательность из 16 аминокислот)) [0302] SEQ ID NO: 31 (XTEN16 (16 amino acid sequence))
SGSETPGTSESATPESSGSETPGTSESATPES
[0303] SEQ ID NO: 32 (XTEN80 (последовательность из 80 аминокислот)) [0303] SEQ ID NO: 32 (XTEN80 (80 amino acid sequence))
GGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSEGGPSSGAPPPSGGSPAGSPTSTEEGTSESATPESGPGTSTEPSEGSAPGSPAGSPTSTEEGTSTEPSEGSAPGTSTEPSE
[0304] SEQ ID NO: 33 (домен Dnmt3A - Dnmt3L) [0304] SEQ ID NO: 33 (domain Dnmt3A - Dnmt3L)
NHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDKLELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGSTQPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPLNHDQEFDPPKVYPPVPAEKRKPIRVLSLFDGIATGLLVLKDLGIQVDRYIASEVCEDSITVGMVRHQGKIMYVGDVRSVTQKHIQEWGPFDLVIGGSPCNDLSIVNPARKGLYEGTGRLFFEFYRLLHDARPKEGDDRPFFWLFENVVAMGVSDKRDISRFLESNPVMIDAKEVSAAHRARYFWGNLPGMNRPLASTVNDK LELQECLEHGRIAKFSKVRTITTRSNSIKQGKDQHFPVFMNEKEDILWCTEMERVFGFPVHYTDVSNMSRLARQRLLGRSWSVPVIRHLFAPLKEYFACVSSGNSNANSRGPSFSSGLVPLSLRGSHMGPMEIYKTVSAWKRQPVRVLSLFRNIDKVLKSLGFLESGSGSGGGTLKYVEDVTNVVRRDVEKWGPFDLVYGST QPLGSSCDRCPGWYMFQFHRILQYALPRQESQRPFFWIFMDNLLLTEDDQETTTRFLQTEAVTLQDVRGRDYQNAMRVWSNIPGLKSKHAPLTPKEEEYLQAQVRSRSKLDAPKVDLLVKNCLLPLREYFKYFSQNSLPL
[0305] SEQ ID NO: 34 (ddAsCfp1) [0305] SEQ ID NO: 34 (ddAsCfp1)
MTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQDNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKEKVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYFPDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQAELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGYLSQVIHEIVDLMIHYQAVVVLANLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGKRIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRNMTQFEGFTNLYQVSKTLRFELIPQGKTLKHIQEQGFIEEDKARNDHYKELKPIIDRIYKTYADQCLQLVQLDWENLSAAIDSYRKEKTEETRNALIEEQATYRNAIHDYFIGRTDNLTDAINKRHAEIYKGLFKAELFNGKVLKQLGTVTTTEHENALLRSFDKFTTYFSGFYENRKNVFSAEDISTAIPHRIVQ DNFPKFKENCHIFTRLITAVPSLREHFENVKKAIGIFVSTSIEEVFSFPFYNQLLTQTQIDLYNQLLGGISREAGTEKIKGLNEVLNLAIQKNDETAHIIASLPHRFIPLFKQILSDRNTLSFILEEFKSDEEVIQSFCKYKTLLRNENVLETAEALFNELNSIDLTHIFISHKKLETISSALCDHWDTLRNALYERRISELTGKITKSAKE KVQRSLKHEDINLQEIISAAGKELSEAFKQKTSEILSHAHAALDQPLPTTLKKQEEKEILKSQLDSLLGLYHLLDWFAVDESNEVDPEFSARLTGIKLEMEPSLSFYNKARNYATKKPYSVEKFKLNFQMPTLASGWDVNKEKNNGAILFVKNGLYYLGIMPKQKGRYKALSFEPTEKTSEGFDKMYYDYF PDAAKMIPKCSTQLKAVTAHFQTHTTPILLSNNFIEPLEITKEIYDLNNPEKEPKKFQTAYAKKTGDQKGYREALCKWIDFTRDFLSKYTKTTSIDLSSLRPSSQYKDLGEYYAELNPLLYHISFQRIAEKEIMDAVETGKLYLFQIYNKDFAKGHHGKPNLHTLYWTGLFSPENLAKTSIKLNGQ AELFYRPKSRMKRMAHRLGEKMLNKKLKDQKTPIPDTLYQELYDYVNHRLSHDLSDEARALLPNVITKEVSHEIIKDRRFTSDKFFFHVPITLNYQAANSPSKFNQRVNAYLKEHPETPIIGIDRGERNLIYITVIDSTGKILEQRSLNTIQQFDYQKKLDNREKERVAARQAWSVVGTIKDLKQGY LSQVIHEIVDLMIHYQAVVVLANLNFGFKSKRTGIAEKAVYQQFEKMLIDKLNCLVLKDYPAEKVGGVLNPYQLTDQFTSFAKMGTQSGFLFYVPAPYTSKIDPLTGFVDPFVWKTIKNHESRKHFLEGFDFLHYDVKTGDFILHFKMNRNLSFQRGLPGFMPAWDIVFEKNETQFDAKGTPFIAGK RIVPVIENHRFTGRYRDLYPANELIALLEEKGIVFRDGSNILPKLLENDDSHAIDTMVALIRSVLQMRNSNAATGEDYINSPVRDLNGVCFDSRFQNPEWPMDADANGAYHIALKGQLLLNHLKESKDLKLQNGISNQDWLAYIQELRN
[0306] SEQ ID NO: 35 (ddLbCfp1) [0306] SEQ ID NO: 35 (ddLbCfp1)
MSKLEKFTNCYSLSKTLRFKAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLDRYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGNEGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSTSIAFRCINENLTRYISNMDIFEKVDAIFDKHEVQEIKEKILNSDYDVEDFFEGEFFNFVLTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDRESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNGPAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDRRKSFKKIGSFSLEQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVVAIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRNYVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKYAKCLQKIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIYKNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYREVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFKLLFDENNHGQIRLSGGAELFMRRASLKKEELVVHPANSPIANKNPDNPKKTTTLSYDVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIARGERNLLYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIENIKELKAGYISQVVHKICELVEKYDAVIALADLNSGFKNSRVKVEKQVYQKFEKMLIDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDPSTGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKKWKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCEQSDKAFYSSFMALMSLMLQMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQENAILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVKHMSKLEKFTNCYSLSKTLRFKAIPVGKTQENIDNKRLLVEDEKRAEDYKGVKKLLDRYYLSFINDVLHSIKLKNLNNYISLFRKKTRTEKENKELENLEINLRKEIAKAFKGNEGYKSLFKKDIIETILPEFLDDKDEIALVNSFNGFTTAFTGFFDNRENMFSEEAKSSTSIAFRCINENLTRYISNMDIFEKVDAIF DKHEVQEIKEKILNSDYDVEDFFEGEFFNFVLTQEGIDVYNAIIGGFVTESGEKIKGLNEYINLYNQKTKQKLPKFKPLYKQVLSDRESLSFYGEGYTSDEEVLEVFRNTLNKNSEIFSSIKKLEKLFKNFDEYSSAGIFVKNGPAISTISKDIFGEWNVIRDKWNAEYDDIHLKKKAVVTEKYEDDR RKSFKKIGSFSLEQLQEYADADLSVVEKLKEIIIQKVDEIYKVYGSSEKLFDADFVLEKSLKKNDAVVAIMKDLLDSVKSFENYIKAFFGEGKETNRDESFYGDFVLAYDILLKVDHIYDAIRNYVTQKPYSKDKFKLYFQNPQFMGGWDKDKETDYRATILRYGSKYYLAIMDKKYAKCLQ KIDKDDVNGNYEKINYKLLPGPNKMLPKVFFSKKWMAYYNPSEDIQKIYKNGTFKKGDMFNLNDCHKLIDFFKDSISRYPKWSNAYDFNFSETEKYKDIAGFYREVEEQGYKVSFESASKKEVDKLVEEGKLYMFQIYNKDFSDKSHGTPNLHTMYFKLLFDENNHGQIRLSGGAELFMRRASL KKEELVVHPANSPIANKNPDNPKKTTTLSYDVYKDKRFSEDQYELHIPIAINKCPKNIFKINTEVRVLLKHDDNPYVIGIARGERNLLYIVVVDGKGNIVEQYSLNEIINNFNGIRIKTDYHSLLDKKEKERFEARQNWTSIENIKELKAGYISQVVHKICELVEKYDAVIALADLNSGFKNSRVKVEKQ VYQKFEKMLIDKLNYMVDKKSNPCATGGALKGYQITNKFESFKSMSTQNGFIFYIPAWLTSKIDPSTGFVNLLKTKYTSIADSKKFISSFDRIMYVPEEDLFEFALDYKNFSRTDADYIKKWKLYSYGNRIRIFRNPKKNNVFDWEEVCLTSAYKELFNKYGINYQQGDIRALLCEQSDKAFYSSFMALMSLML QMRNSITGRTDVDFLISPVKNSDGIFYDSRNYEAQENAILPKNADANGAYNIARKVLWAIGQFKKAEDEKLDKVKIAISNKEWLEYAQTSVKH
[0307] SEQ ID NO: 36 (ddFnCfp1) [0307] SEQ ID NO: 36 (ddFnCfp1)
MYPYDVPDYASGSGMSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEALEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFYEQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHISQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGFRFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDGKGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDKICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNNMYPYDVPDYASGSGMSIYQEFVNKYSLSKTLRFELIPQGKTLENIKARGLILDDEKRAKDYKKAKQIIDKYHQFFIEEILSSVCISEDLLQNYSDVYFKLKKSDDDNLQKDFKSAKDTIKKQISEYIKDSEKFKNLFNQNLIDAKKGQESDLILWLKQSKDNGIELFKANSDITDIDEA LEIIKSFKGWTTYFKGFHENRKNVYSSNDIPTSIIYRIVDDNLPKFLENKAKYESLKDKAPEAINYEQIKKDLAEELTFDIDYKTSEVNQRVFSLDEVFEIANFNNYLNQSGITKFNTIIGGKFVNGENTKRKGINEYINLYSQQINDKTLKKYKMSVLFKQILSDTESKSFVIDKLEDDSDVVTTMQSFY EQIAAFKTVEEKSIKETLSLLFDDLKAQKLDLSKIYFKNDKSLTDLSQQVFDDYSVIGTAVLEYITQQIAPKNLDNPSKKEQELIAKKTEKAKYLSLETIKLALEEFNKHRDIDKQCRFEEILANFAAIPMIFDEIAQNKDNLAQISIKYQNQGKKDLLQASAEDDVKAIKDLLDQTNNLLHKLKIFHI SQSEDKANILDKDEHFYLVFEECYFELANIVPLYNKIRNYITQKPYSDEKFKLNFENSTLANGWDKNKEPDNTAILFIKDDKYYLGVMNKKNNKIFDDKAIKENKGEGYKKIVYKLLPGANKMLPKVFFSAKSIKFYNPSEDILRIRNHSTHTKNGSPQKGYEKFEFNIEDCRKFIDFYKQSISKHPEWKDFGF RFSDTQRYNSIDEFYREVENQGYKLTFENISESYIDSVVNQGKLYLFQIYNKDFSAYSKGRPNLHTLYWKALFDERNLQDVVYKLNGEAELFYRKQSIPKKITHPAKEAIANKNKDNPKKESVFEYDLIKDKRFTEDKFFFHCPITINFKSSGANKFNDEINLLLKEKANDVHILSIARGERHLAYYTLVDG KGNIIKQDTFNIIGNDRMKTNYHDKLAAIEKDRDSARKDWKKINNIKEMKEGYLSQVVHEIAKLVIEYNAIVVFEDLNFGFKRGRFKVEKQVYQKLEKMLIEKLNYLVFKDNEFDKTGGVLRAYQLTAPFETFKKMGKQTGIIYYVPAGFTSKICPVTGFVNQLYPKYESVSKSQEFFSKFDK ICYNLDKGYFEFSFDYKNFGDKAAKGKWTIASFGSRLINFRNSDKNHNWDTREVYPTKELEKLLKDYSIEYGHGECIKAAICGESDKKFFAKLTSVLNTILQMRNSKTGTELDYLISPVADVNGNFFDSRQAPKNMPQDADANGAYHIGLKGLMLLGRIKNNQEGKKLNLVIKNEEYFEFVQNRNN
--->--->
ПЕРЕЧЕНЬ ПОСЛЕДОВАТЕЛЬНОСТЕЙLIST OF SEQUENCES
<110> The Regents of the University of California<110> The Regents of the University of California
Chen, Jin Chen, Jin
Gilbert, Luke Gilbert, Luke
Nunez, James Nunez, James
Weissman, Jonathan Weissman, Jonathan
<120> Композиции и способы редактирования генов<120> Compositions and methods of gene editing
<130> 048536-620001WO<130> 048536-620001WO
<140> PCT/US2019/028377<140> PCT/US2019/028377
<141> 2019-04-19<141> 2019-04-19
<150> US 62/660,023<150> US 62/660,023
<151> 2018-04-19<151> 2018-04-19
<160> 96<160> 96
<170> PatentIn, версия 3.5<170> PatentIn, version 3.5
<210> 1<210> 1
<211> 2294<211> 2294
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 1<400> 1
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met AspLeu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp
65 70 75 8065 70 75 80
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly TrpLys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
85 90 9585 90 95
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys ValAla Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
100 105 110100 105 110
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly AlaLeu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
115 120 125115 120 125
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys ArgLeu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
130 135 140130 135 140
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr LeuThr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
145 150 155 160145 150 155 160
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe PheGln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
165 170 175165 170 175
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His GluHis Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
180 185 190180 185 190
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His GluArg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
195 200 205195 200 205
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser ThrLys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
210 215 220210 215 220
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met IleAsp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
225 230 235 240225 230 235 240
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp AsnLys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
245 250 255245 250 255
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn GlnSer Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
260 265 270260 265 270
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys AlaLeu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
275 280 285275 280 285
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu IleIle Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
290 295 300290 295 300
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu IleAla Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
305 310 315 320305 310 315 320
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp LeuAla Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
325 330 335325 330 335
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp AspAla Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
340 345 350340 345 350
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu PheLeu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
355 360 365355 360 365
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile LeuLeu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
370 375 380370 375 380
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met IleArg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
385 390 395 400385 390 395 400
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala LeuLys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
405 410 415405 410 415
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp GlnVal Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
420 425 430420 425 430
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln GluSer Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
435 440 445435 440 445
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly ThrGlu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
450 455 460450 455 460
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys GlnGlu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
465 470 475 480465 470 475 480
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly GluArg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
485 490 495485 490 495
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu LysLeu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
500 505 510500 505 510
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro TyrAsp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
515 520 525515 520 525
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met ThrTyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
530 535 540530 535 540
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val ValArg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
545 550 555 560545 550 555 560
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn PheAsp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
565 570 575565 570 575
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu LeuAsp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
580 585 590580 585 590
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr ValTyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
595 600 605595 600 605
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys LysThr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
610 615 620610 615 620
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val LysAla Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
625 630 635 640625 630 635 640
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser ValGln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
645 650 655645 650 655
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr TyrGlu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
660 665 670660 665 670
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluHis Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
675 680 685675 680 685
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu PheGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
690 695 700690 695 700
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His LeuGlu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
705 710 715 720705 710 715 720
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr GlyPhe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
725 730 735725 730 735
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys GlnTrp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
740 745 750740 745 750
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala AsnSer Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
755 760 765755 760 765
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys GluArg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
770 775 780770 775 780
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His GluAsp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
785 790 795 800785 790 795 800
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile LeuHis Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
805 810 815805 810 815
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg HisGln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
820 825 830820 825 830
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr ThrLys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
835 840 845835 840 845
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu GluGln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
850 855 860850 855 860
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val GluGly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
865 870 875 880865 870 875 880
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln AsnAsn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
885 890 895885 890 895
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu SerGly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
900 905 910900 905 910
Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspAsp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
915 920 925915 920 925
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly LysSer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
930 935 940930 935 940
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn TyrSer Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
945 950 955 960945 950 955 960
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe AspTrp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
965 970 975965 970 975
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys AlaAsn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
980 985 990980 985 990
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys HisGly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
995 1000 1005995 1000 1005
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp GluVal Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1010 1015 10201010 1015 1020
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerAsn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1025 1030 10351025 1030 1035
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys ValLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1040 1045 10501040 1045 1050
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu AsnArg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1055 1060 10651055 1060 1065
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu GluAla Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1070 1075 10801070 1075 1080
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg LysSer Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1085 1090 10951085 1090 1095
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala LysMet Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1100 1105 11101100 1105 1110
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu IleTyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1115 1120 11251115 1120 1125
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu ThrThr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1130 1135 11401130 1135 1140
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp PheAsn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1145 1150 11551145 1150 1155
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile ValAla Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1160 1165 11701160 1165 1170
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser IleLys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1175 1180 11851175 1180 1185
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys AspLeu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1190 1195 12001190 1195 1200
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val AlaTrp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1205 1210 12151205 1210 1215
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser LysTyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1220 1225 12301220 1225 1230
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met GluLys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1235 1240 12451235 1240 1245
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala LysArg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1250 1255 12601250 1255 1260
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro LysGly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1265 1270 12751265 1270 1275
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu AlaTyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1280 1285 12901280 1285 1290
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro SerSer Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1295 1300 13051295 1300 1305
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys LeuLys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1310 1315 13201310 1315 1320
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val GluLys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1325 1330 13351325 1330 1335
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser GluGln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1340 1345 13501340 1345 1350
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys ValPhe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1355 1360 13651355 1360 1365
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu GlnLeu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1370 1375 13801370 1375 1380
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly AlaAla Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1385 1390 13951385 1390 1395
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys ArgPro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1400 1405 14101400 1405 1410
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His GlnTyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1415 1420 14251415 1420 1425
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln LeuSer Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1430 1435 14401430 1435 1440
Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp TyrGly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr
1445 1450 14551445 1450 1455
Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser GlyAla Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly
1460 1465 14701460 1465 1470
Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn HisSer Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His
1475 1480 14851475 1480 1485
Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro AlaAsp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala
1490 1495 15001490 1495 1500
Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleGlu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
1505 1510 15151505 1510 1515
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val AspAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp
1520 1525 15301520 1525 1530
Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val GlyArg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly
1535 1540 15451535 1540 1545
Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val ArgMet Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg
1550 1555 15601550 1555 1560
Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp LeuSer Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu
1565 1570 15751565 1570 1575
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn ProVal Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro
1580 1585 15901580 1585 1590
Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe GluAla Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu
1595 1600 16051595 1600 1605
Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp AspPhe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp
1610 1615 16201610 1615 1620
Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly ValArg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val
1625 1630 16351625 1630 1635
Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro ValSer Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val
1640 1645 16501640 1645 1650
Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg TyrMet Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
1655 1660 16651655 1660 1665
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser ThrPhe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
1670 1675 16801670 1675 1680
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly ArgVal Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg
1685 1690 16951685 1690 1695
Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser AsnIle Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
1700 1705 17101700 1705 1710
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met AsnSer Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn
1715 1720 17251715 1720 1725
Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val PheGlu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe
1730 1735 17401730 1735 1740
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuGly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
1745 1750 17551745 1750 1755
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val IleAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile
1760 1765 17701760 1765 1770
Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val SerArg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser
1775 1780 17851775 1780 1785
Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1790 1795 18001790 1795 1800
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro MetGly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met
1805 1810 18151805 1810 1815
Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val ArgGlu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg
1820 1825 18301820 1825 1830
Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser LeuVal Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu
1835 1840 18451835 1840 1845
Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu LysGly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys
1850 1855 18601850 1855 1860
Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysTyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
1865 1870 18751865 1870 1875
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu GlyTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly
1880 1885 18901880 1885 1890
Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe HisSer Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His
1895 1900 19051895 1900 1905
Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg ProArg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro
1910 1915 19201910 1915 1920
Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp AspPhe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp
1925 1930 19351925 1930 1935
Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr LeuGln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu
1940 1945 19501940 1945 1950
Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val TrpGln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp
1955 1960 19651955 1960 1965
Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr ProSer Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro
1970 1975 19801970 1975 1980
Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysLys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
1985 1990 19951985 1990 1995
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu LeuLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu
2000 2005 20102000 2005 2010
Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu ProPro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro
2015 2020 20252015 2020 2025
Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser GlyLeu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly
2030 2035 20402030 2035 2040
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu GluAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
2045 2050 20552045 2050 2055
Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met LysAsn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys
2060 2065 20702060 2065 2070
Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys ThrLeu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr
2075 2080 20852075 2080 2085
Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met ArgSer Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg
2090 2095 21002090 2095 2100
Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp IleIle Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile
2105 2110 21152105 2110 2115
Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn HisLeu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His
2120 2125 21302120 2125 2130
Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu GlyThr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly
2135 2140 21452135 2140 2145
Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val LeuPhe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu
2150 2155 21602150 2155 2160
Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile TyrThr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr
2165 2170 21752165 2170 2175
Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro ValAsn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val
2180 2185 21902180 2185 2190
Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr LeuMet Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu
2195 2200 22052195 2200 2205
Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala LeuTyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu
2210 2215 22202210 2215 2220
Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr ThrLys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr
2225 2230 22352225 2230 2235
Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly ValTyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val
2240 2245 22502240 2245 2250
Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn AsnTyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn
2255 2260 22652255 2260 2265
Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr CysGlu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys
2270 2275 22802270 2275 2280
Asp Leu Pro Ser Lys Leu Gly His Lys Leu AsnAsp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
2285 22902285 2290
<210> 2<210> 2
<211> 2296<211> 2296
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 2<400> 2
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met AspLeu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp
65 70 75 8065 70 75 80
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly TrpLys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
85 90 9585 90 95
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys ValAla Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
100 105 110100 105 110
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly AlaLeu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
115 120 125115 120 125
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys ArgLeu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
130 135 140130 135 140
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr LeuThr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
145 150 155 160145 150 155 160
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe PheGln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
165 170 175165 170 175
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His GluHis Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
180 185 190180 185 190
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His GluArg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
195 200 205195 200 205
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser ThrLys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
210 215 220210 215 220
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met IleAsp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
225 230 235 240225 230 235 240
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp AsnLys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
245 250 255245 250 255
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn GlnSer Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
260 265 270260 265 270
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys AlaLeu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
275 280 285275 280 285
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu IleIle Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
290 295 300290 295 300
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu IleAla Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
305 310 315 320305 310 315 320
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp LeuAla Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
325 330 335325 330 335
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp AspAla Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
340 345 350340 345 350
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu PheLeu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
355 360 365355 360 365
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile LeuLeu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
370 375 380370 375 380
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met IleArg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
385 390 395 400385 390 395 400
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala LeuLys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
405 410 415405 410 415
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp GlnVal Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
420 425 430420 425 430
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln GluSer Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
435 440 445435 440 445
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly ThrGlu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
450 455 460450 455 460
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys GlnGlu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
465 470 475 480465 470 475 480
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly GluArg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
485 490 495485 490 495
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu LysLeu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
500 505 510500 505 510
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro TyrAsp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
515 520 525515 520 525
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met ThrTyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
530 535 540530 535 540
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val ValArg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
545 550 555 560545 550 555 560
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn PheAsp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
565 570 575565 570 575
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu LeuAsp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
580 585 590580 585 590
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr ValTyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
595 600 605595 600 605
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys LysThr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
610 615 620610 615 620
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val LysAla Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
625 630 635 640625 630 635 640
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser ValGln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
645 650 655645 650 655
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr TyrGlu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
660 665 670660 665 670
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluHis Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
675 680 685675 680 685
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu PheGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
690 695 700690 695 700
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His LeuGlu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
705 710 715 720705 710 715 720
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr GlyPhe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
725 730 735725 730 735
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys GlnTrp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
740 745 750740 745 750
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala AsnSer Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
755 760 765755 760 765
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys GluArg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
770 775 780770 775 780
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His GluAsp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
785 790 795 800785 790 795 800
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile LeuHis Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
805 810 815805 810 815
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg HisGln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
820 825 830820 825 830
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr ThrLys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
835 840 845835 840 845
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu GluGln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
850 855 860850 855 860
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val GluGly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
865 870 875 880865 870 875 880
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln AsnAsn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
885 890 895885 890 895
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu SerGly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
900 905 910900 905 910
Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspAsp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
915 920 925915 920 925
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly LysSer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
930 935 940930 935 940
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn TyrSer Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
945 950 955 960945 950 955 960
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe AspTrp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
965 970 975965 970 975
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys AlaAsn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
980 985 990980 985 990
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys HisGly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
995 1000 1005995 1000 1005
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp GluVal Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1010 1015 10201010 1015 1020
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerAsn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1025 1030 10351025 1030 1035
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys ValLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1040 1045 10501040 1045 1050
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu AsnArg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1055 1060 10651055 1060 1065
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu GluAla Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1070 1075 10801070 1075 1080
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg LysSer Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1085 1090 10951085 1090 1095
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala LysMet Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1100 1105 11101100 1105 1110
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu IleTyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1115 1120 11251115 1120 1125
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu ThrThr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1130 1135 11401130 1135 1140
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp PheAsn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1145 1150 11551145 1150 1155
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile ValAla Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1160 1165 11701160 1165 1170
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser IleLys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1175 1180 11851175 1180 1185
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys AspLeu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1190 1195 12001190 1195 1200
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val AlaTrp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1205 1210 12151205 1210 1215
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser LysTyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1220 1225 12301220 1225 1230
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met GluLys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1235 1240 12451235 1240 1245
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala LysArg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1250 1255 12601250 1255 1260
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro LysGly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1265 1270 12751265 1270 1275
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu AlaTyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1280 1285 12901280 1285 1290
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro SerSer Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1295 1300 13051295 1300 1305
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys LeuLys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1310 1315 13201310 1315 1320
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val GluLys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1325 1330 13351325 1330 1335
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser GluGln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1340 1345 13501340 1345 1350
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys ValPhe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1355 1360 13651355 1360 1365
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu GlnLeu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1370 1375 13801370 1375 1380
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly AlaAla Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1385 1390 13951385 1390 1395
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys ArgPro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1400 1405 14101400 1405 1410
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His GlnTyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1415 1420 14251415 1420 1425
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln LeuSer Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1430 1435 14401430 1435 1440
Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp TyrGly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr
1445 1450 14551445 1450 1455
Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly SerAla Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser
1460 1465 14701460 1465 1470
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu SerGly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1475 1480 14851475 1480 1485
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro ValAsn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val
1490 1495 15001490 1495 1500
Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe AspPro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp
1505 1510 15151505 1510 1515
Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile GlnGly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln
1520 1525 15301520 1525 1530
Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile ThrVal Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr
1535 1540 15451535 1540 1545
Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly AspVal Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp
1550 1555 15601550 1555 1560
Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro PheVal Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe
1565 1570 15751565 1570 1575
Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile ValAsp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val
1580 1585 15901580 1585 1590
Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu PheAsn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe
1595 1600 16051595 1600 1605
Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu GlyPhe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly
1610 1615 16201610 1615 1620
Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala MetAsp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met
1625 1630 16351625 1630 1635
Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser AsnGly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn
1640 1645 16501640 1645 1650
Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg AlaPro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala
1655 1660 16651655 1660 1665
Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu AlaArg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala
1670 1675 16801670 1675 1680
Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu HisSer Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His
1685 1690 16951685 1690 1695
Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr ArgGly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg
1700 1705 17101700 1705 1710
Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val PheSer Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
1715 1720 17251715 1720 1725
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu ArgMet Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg
1730 1735 17401730 1735 1740
Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met SerVal Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser
1745 1750 17551745 1750 1755
Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val ProArg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro
1760 1765 17701760 1765 1770
Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala CysVal Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys
1775 1780 17851775 1780 1785
Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser PheVal Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe
1790 1795 18001790 1795 1800
Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met GlySer Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly
1805 1810 18151805 1810 1815
Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln ProPro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro
1820 1825 18301820 1825 1830
Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu LysVal Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys
1835 1840 18451835 1840 1845
Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly ThrSer Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr
1850 1855 18601850 1855 1860
Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp ValLeu Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val
1865 1870 18751865 1870 1875
Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln ProGlu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro
1880 1885 18901880 1885 1890
Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe GlnLeu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln
1895 1900 19051895 1900 1905
Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser GlnPhe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln
1910 1915 19201910 1915 1920
Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr GluArg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu
1925 1930 19351925 1930 1935
Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala ValAsp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val
1940 1945 19501940 1945 1950
Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met ArgThr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg
1955 1960 19651955 1960 1965
Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro LeuVal Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu
1970 1975 19801970 1975 1980
Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser ArgThr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg
1985 1990 19951985 1990 1995
Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn CysSer Lys Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys
2000 2005 20102000 2005 2010
Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn SerLeu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser
2015 2020 20252015 2020 2025
Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val GlyLeu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly
2030 2035 20402030 2035 2040
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp ValSer Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
2045 2050 20552045 2050 2055
Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met HisGlu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His
2060 2065 20702060 2065 2070
Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe LysMet Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys
2075 2080 20852075 2080 2085
Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln ThrCys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr
2090 2095 21002090 2095 2100
Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala PheMet Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe
2105 2110 21152105 2110 2115
Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe IleAsp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile
2120 2125 21302120 2125 2130
Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe ProAsn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro
2135 2140 21452135 2140 2145
Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly GlyGlu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly
2150 2155 21602150 2155 2160
Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys LeuVal Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu
2165 2170 21752165 2170 2175
Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn GlyIle Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly
2180 2185 21902180 2185 2190
Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr GluPro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu
2195 2200 22052195 2200 2205
Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp MetThr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met
2210 2215 22202210 2215 2220
Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile LysAla Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys
2225 2230 22352225 2230 2235
Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met ProThr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro
2240 2245 22502240 2245 2250
Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu AlaGly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala
2255 2260 22652255 2260 2265
Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala ArgAsn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg
2270 2275 22802270 2275 2280
Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu AsnTyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
2285 2290 22952285 2290 2295
<210> 3<210> 3
<211> 2316<211> 2316
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 3<400> 3
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met AspLeu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp
65 70 75 8065 70 75 80
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly TrpLys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
85 90 9585 90 95
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys ValAla Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
100 105 110100 105 110
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly AlaLeu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
115 120 125115 120 125
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys ArgLeu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
130 135 140130 135 140
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr LeuThr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
145 150 155 160145 150 155 160
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe PheGln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
165 170 175165 170 175
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His GluHis Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
180 185 190180 185 190
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His GluArg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
195 200 205195 200 205
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser ThrLys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
210 215 220210 215 220
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met IleAsp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
225 230 235 240225 230 235 240
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp AsnLys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
245 250 255245 250 255
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn GlnSer Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
260 265 270260 265 270
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys AlaLeu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
275 280 285275 280 285
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu IleIle Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
290 295 300290 295 300
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu IleAla Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
305 310 315 320305 310 315 320
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp LeuAla Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
325 330 335325 330 335
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp AspAla Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
340 345 350340 345 350
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu PheLeu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
355 360 365355 360 365
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile LeuLeu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
370 375 380370 375 380
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met IleArg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
385 390 395 400385 390 395 400
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala LeuLys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
405 410 415405 410 415
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp GlnVal Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
420 425 430420 425 430
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln GluSer Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
435 440 445435 440 445
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly ThrGlu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
450 455 460450 455 460
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys GlnGlu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
465 470 475 480465 470 475 480
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly GluArg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
485 490 495485 490 495
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu LysLeu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
500 505 510500 505 510
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro TyrAsp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
515 520 525515 520 525
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met ThrTyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
530 535 540530 535 540
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val ValArg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
545 550 555 560545 550 555 560
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn PheAsp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
565 570 575565 570 575
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu LeuAsp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
580 585 590580 585 590
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr ValTyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
595 600 605595 600 605
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys LysThr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
610 615 620610 615 620
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val LysAla Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
625 630 635 640625 630 635 640
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser ValGln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
645 650 655645 650 655
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr TyrGlu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
660 665 670660 665 670
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluHis Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
675 680 685675 680 685
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu PheGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
690 695 700690 695 700
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His LeuGlu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
705 710 715 720705 710 715 720
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr GlyPhe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
725 730 735725 730 735
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys GlnTrp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
740 745 750740 745 750
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala AsnSer Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
755 760 765755 760 765
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys GluArg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
770 775 780770 775 780
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His GluAsp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
785 790 795 800785 790 795 800
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile LeuHis Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
805 810 815805 810 815
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg HisGln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
820 825 830820 825 830
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr ThrLys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
835 840 845835 840 845
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu GluGln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
850 855 860850 855 860
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val GluGly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
865 870 875 880865 870 875 880
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln AsnAsn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
885 890 895885 890 895
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu SerGly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
900 905 910900 905 910
Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspAsp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
915 920 925915 920 925
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly LysSer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
930 935 940930 935 940
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn TyrSer Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
945 950 955 960945 950 955 960
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe AspTrp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
965 970 975965 970 975
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys AlaAsn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
980 985 990980 985 990
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys HisGly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
995 1000 1005995 1000 1005
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp GluVal Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1010 1015 10201010 1015 1020
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerAsn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1025 1030 10351025 1030 1035
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys ValLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1040 1045 10501040 1045 1050
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu AsnArg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1055 1060 10651055 1060 1065
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu GluAla Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1070 1075 10801070 1075 1080
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg LysSer Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1085 1090 10951085 1090 1095
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala LysMet Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1100 1105 11101100 1105 1110
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu IleTyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1115 1120 11251115 1120 1125
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu ThrThr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1130 1135 11401130 1135 1140
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp PheAsn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1145 1150 11551145 1150 1155
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile ValAla Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1160 1165 11701160 1165 1170
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser IleLys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1175 1180 11851175 1180 1185
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys AspLeu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1190 1195 12001190 1195 1200
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val AlaTrp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1205 1210 12151205 1210 1215
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser LysTyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1220 1225 12301220 1225 1230
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met GluLys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1235 1240 12451235 1240 1245
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala LysArg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1250 1255 12601250 1255 1260
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro LysGly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1265 1270 12751265 1270 1275
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu AlaTyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1280 1285 12901280 1285 1290
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro SerSer Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1295 1300 13051295 1300 1305
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys LeuLys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1310 1315 13201310 1315 1320
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val GluLys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1325 1330 13351325 1330 1335
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser GluGln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1340 1345 13501340 1345 1350
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys ValPhe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1355 1360 13651355 1360 1365
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu GlnLeu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1370 1375 13801370 1375 1380
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly AlaAla Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1385 1390 13951385 1390 1395
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys ArgPro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1400 1405 14101400 1405 1410
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His GlnTyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1415 1420 14251415 1420 1425
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln LeuSer Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1430 1435 14401430 1435 1440
Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp TyrGly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr
1445 1450 14551445 1450 1455
Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser GlyAla Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly
1460 1465 14701460 1465 1470
Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn HisSer Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His
1475 1480 14851475 1480 1485
Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro AlaAsp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala
1490 1495 15001490 1495 1500
Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleGlu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
1505 1510 15151505 1510 1515
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val AspAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp
1520 1525 15301520 1525 1530
Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val GlyArg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly
1535 1540 15451535 1540 1545
Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val ArgMet Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg
1550 1555 15601550 1555 1560
Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp LeuSer Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu
1565 1570 15751565 1570 1575
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn ProVal Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro
1580 1585 15901580 1585 1590
Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe GluAla Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu
1595 1600 16051595 1600 1605
Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp AspPhe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp
1610 1615 16201610 1615 1620
Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly ValArg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val
1625 1630 16351625 1630 1635
Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro ValSer Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val
1640 1645 16501640 1645 1650
Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg TyrMet Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
1655 1660 16651655 1660 1665
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser ThrPhe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
1670 1675 16801670 1675 1680
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly ArgVal Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg
1685 1690 16951685 1690 1695
Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser AsnIle Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
1700 1705 17101700 1705 1710
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met AsnSer Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn
1715 1720 17251715 1720 1725
Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val PheGlu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe
1730 1735 17401730 1735 1740
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuGly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
1745 1750 17551745 1750 1755
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val IleAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile
1760 1765 17701760 1765 1770
Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val SerArg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser
1775 1780 17851775 1780 1785
Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1790 1795 18001790 1795 1800
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro MetGly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met
1805 1810 18151805 1810 1815
Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val ArgGlu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg
1820 1825 18301820 1825 1830
Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser LeuVal Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu
1835 1840 18451835 1840 1845
Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu LysGly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys
1850 1855 18601850 1855 1860
Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysTyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
1865 1870 18751865 1870 1875
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu GlyTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly
1880 1885 18901880 1885 1890
Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe HisSer Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His
1895 1900 19051895 1900 1905
Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg ProArg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro
1910 1915 19201910 1915 1920
Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp AspPhe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp
1925 1930 19351925 1930 1935
Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr LeuGln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu
1940 1945 19501940 1945 1950
Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val TrpGln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp
1955 1960 19651955 1960 1965
Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr ProSer Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro
1970 1975 19801970 1975 1980
Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysLys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
1985 1990 19951985 1990 1995
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu LeuLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu
2000 2005 20102000 2005 2010
Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu ProPro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro
2015 2020 20252015 2020 2025
Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser GlyLeu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly
2030 2035 20402030 2035 2040
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu GluAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
2045 2050 20552045 2050 2055
Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu LysAsn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
2060 2065 20702060 2065 2070
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu IleGln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile
2075 2080 20852075 2080 2085
Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val AspLys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp
2090 2095 21002090 2095 2100
Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro TyrAsn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr
2105 2110 21152105 2110 2115
Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly ProGlu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro
2120 2125 21302120 2125 2130
Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr GlyLeu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly
2135 2140 21452135 2140 2145
Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe PheSer Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe
2150 2155 21602150 2155 2160
Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr ThrLys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr
2165 2170 21752165 2170 2175
Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser LeuTyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu
2180 2185 21902180 2185 2190
Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val AsnGln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn
2195 2200 22052195 2200 2205
Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly TrpPhe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp
2210 2215 22202210 2215 2220
Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu GluGlu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu
2225 2230 22352225 2230 2235
Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His LeuGly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu
2240 2245 22502240 2245 2250
Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala LysIle Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys
2255 2260 22652255 2260 2265
Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu GluAsn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu
2270 2275 22802270 2275 2280
Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His GluArg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu
2285 2290 22952285 2290 2295
Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly HisVal Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His
2300 2305 23102300 2305 2310
Lys Leu AsnLys Leu Asn
23152315
<210> 4<210> 4
<211> 2318<211> 2318
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 4<400> 4
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met AspLeu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp
65 70 75 8065 70 75 80
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly TrpLys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
85 90 9585 90 95
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys ValAla Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
100 105 110100 105 110
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly AlaLeu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
115 120 125115 120 125
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys ArgLeu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
130 135 140130 135 140
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr LeuThr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
145 150 155 160145 150 155 160
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe PheGln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
165 170 175165 170 175
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His GluHis Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
180 185 190180 185 190
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His GluArg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
195 200 205195 200 205
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser ThrLys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
210 215 220210 215 220
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met IleAsp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
225 230 235 240225 230 235 240
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp AsnLys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
245 250 255245 250 255
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn GlnSer Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
260 265 270260 265 270
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys AlaLeu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
275 280 285275 280 285
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu IleIle Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
290 295 300290 295 300
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu IleAla Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
305 310 315 320305 310 315 320
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp LeuAla Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
325 330 335325 330 335
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp AspAla Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
340 345 350340 345 350
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu PheLeu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
355 360 365355 360 365
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile LeuLeu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
370 375 380370 375 380
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met IleArg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
385 390 395 400385 390 395 400
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala LeuLys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
405 410 415405 410 415
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp GlnVal Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
420 425 430420 425 430
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln GluSer Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
435 440 445435 440 445
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly ThrGlu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
450 455 460450 455 460
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys GlnGlu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
465 470 475 480465 470 475 480
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly GluArg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
485 490 495485 490 495
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu LysLeu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
500 505 510500 505 510
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro TyrAsp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
515 520 525515 520 525
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met ThrTyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
530 535 540530 535 540
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val ValArg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
545 550 555 560545 550 555 560
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn PheAsp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
565 570 575565 570 575
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu LeuAsp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
580 585 590580 585 590
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr ValTyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
595 600 605595 600 605
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys LysThr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
610 615 620610 615 620
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val LysAla Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
625 630 635 640625 630 635 640
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser ValGln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
645 650 655645 650 655
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr TyrGlu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
660 665 670660 665 670
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluHis Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
675 680 685675 680 685
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu PheGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
690 695 700690 695 700
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His LeuGlu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
705 710 715 720705 710 715 720
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr GlyPhe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
725 730 735725 730 735
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys GlnTrp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
740 745 750740 745 750
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala AsnSer Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
755 760 765755 760 765
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys GluArg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
770 775 780770 775 780
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His GluAsp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
785 790 795 800785 790 795 800
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile LeuHis Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
805 810 815805 810 815
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg HisGln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
820 825 830820 825 830
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr ThrLys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
835 840 845835 840 845
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu GluGln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
850 855 860850 855 860
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val GluGly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
865 870 875 880865 870 875 880
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln AsnAsn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
885 890 895885 890 895
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu SerGly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
900 905 910900 905 910
Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspAsp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
915 920 925915 920 925
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly LysSer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
930 935 940930 935 940
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn TyrSer Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
945 950 955 960945 950 955 960
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe AspTrp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
965 970 975965 970 975
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys AlaAsn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
980 985 990980 985 990
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys HisGly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
995 1000 1005995 1000 1005
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp GluVal Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1010 1015 10201010 1015 1020
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerAsn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1025 1030 10351025 1030 1035
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys ValLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1040 1045 10501040 1045 1050
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu AsnArg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1055 1060 10651055 1060 1065
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu GluAla Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1070 1075 10801070 1075 1080
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg LysSer Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1085 1090 10951085 1090 1095
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala LysMet Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1100 1105 11101100 1105 1110
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu IleTyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1115 1120 11251115 1120 1125
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu ThrThr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1130 1135 11401130 1135 1140
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp PheAsn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1145 1150 11551145 1150 1155
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile ValAla Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1160 1165 11701160 1165 1170
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser IleLys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1175 1180 11851175 1180 1185
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys AspLeu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1190 1195 12001190 1195 1200
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val AlaTrp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1205 1210 12151205 1210 1215
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser LysTyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1220 1225 12301220 1225 1230
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met GluLys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1235 1240 12451235 1240 1245
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala LysArg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1250 1255 12601250 1255 1260
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro LysGly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1265 1270 12751265 1270 1275
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu AlaTyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1280 1285 12901280 1285 1290
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro SerSer Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1295 1300 13051295 1300 1305
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys LeuLys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1310 1315 13201310 1315 1320
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val GluLys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1325 1330 13351325 1330 1335
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser GluGln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1340 1345 13501340 1345 1350
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys ValPhe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1355 1360 13651355 1360 1365
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu GlnLeu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1370 1375 13801370 1375 1380
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly AlaAla Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1385 1390 13951385 1390 1395
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys ArgPro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1400 1405 14101400 1405 1410
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His GlnTyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1415 1420 14251415 1420 1425
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln LeuSer Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1430 1435 14401430 1435 1440
Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp TyrGly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr
1445 1450 14551445 1450 1455
Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly SerAla Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser
1460 1465 14701460 1465 1470
Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu SerGly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1475 1480 14851475 1480 1485
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro ValAsn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val
1490 1495 15001490 1495 1500
Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe AspPro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp
1505 1510 15151505 1510 1515
Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile GlnGly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln
1520 1525 15301520 1525 1530
Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile ThrVal Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr
1535 1540 15451535 1540 1545
Val Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly AspVal Gly Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp
1550 1555 15601550 1555 1560
Val Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro PheVal Arg Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe
1565 1570 15751565 1570 1575
Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile ValAsp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val
1580 1585 15901580 1585 1590
Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu PheAsn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe
1595 1600 16051595 1600 1605
Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu GlyPhe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly
1610 1615 16201610 1615 1620
Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala MetAsp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met
1625 1630 16351625 1630 1635
Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser AsnGly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn
1640 1645 16501640 1645 1650
Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg AlaPro Val Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala
1655 1660 16651655 1660 1665
Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu AlaArg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala
1670 1675 16801670 1675 1680
Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu HisSer Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His
1685 1690 16951685 1690 1695
Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr ArgGly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg
1700 1705 17101700 1705 1710
Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val PheSer Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
1715 1720 17251715 1720 1725
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu ArgMet Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg
1730 1735 17401730 1735 1740
Val Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met SerVal Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser
1745 1750 17551745 1750 1755
Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val ProArg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro
1760 1765 17701760 1765 1770
Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala CysVal Ile Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys
1775 1780 17851775 1780 1785
Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser PheVal Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe
1790 1795 18001790 1795 1800
Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met GlySer Ser Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly
1805 1810 18151805 1810 1815
Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln ProPro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro
1820 1825 18301820 1825 1830
Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu LysVal Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys
1835 1840 18451835 1840 1845
Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly ThrSer Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr
1850 1855 18601850 1855 1860
Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp ValLeu Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val
1865 1870 18751865 1870 1875
Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln ProGlu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro
1880 1885 18901880 1885 1890
Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe GlnLeu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln
1895 1900 19051895 1900 1905
Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser GlnPhe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln
1910 1915 19201910 1915 1920
Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr GluArg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu
1925 1930 19351925 1930 1935
Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala ValAsp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val
1940 1945 19501940 1945 1950
Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met ArgThr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg
1955 1960 19651955 1960 1965
Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro LeuVal Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu
1970 1975 19801970 1975 1980
Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser ArgThr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg
1985 1990 19951985 1990 1995
Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn CysSer Lys Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys
2000 2005 20102000 2005 2010
Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn SerLeu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser
2015 2020 20252015 2020 2025
Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val GlyLeu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly
2030 2035 20402030 2035 2040
Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp ValSer Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val
2045 2050 20552045 2050 2055
Glu Glu Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser LeuGlu Glu Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu
2060 2065 20702060 2065 2070
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser GluLeu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu
2075 2080 20852075 2080 2085
Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly ThrLeu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr
2090 2095 21002090 2095 2100
Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly LysVal Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys
2105 2110 21152105 2110 2115
Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu GlyPro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly
2120 2125 21302120 2125 2130
Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe LeuGly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu
2135 2140 21452135 2140 2145
Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro AspTyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp
2150 2155 21602150 2155 2160
Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg ValPhe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val
2165 2170 21752165 2170 2175
Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp ThrThr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr
2180 2185 21902180 2185 2190
Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg GlySer Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly
2195 2200 22052195 2200 2205
Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr LeuVal Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu
2210 2215 22202210 2215 2220
Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly GlyGly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly
2225 2230 22352225 2230 2235
Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly SerLeu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser
2240 2245 22502240 2245 2250
His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys ProHis Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro
2255 2260 22652255 2260 2265
Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr ArgAla Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg
2270 2275 22802270 2275 2280
Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu GlnLeu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln
2285 2290 22952285 2290 2295
His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys LeuHis Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu
2300 2305 23102300 2305 2310
Gly His Lys Leu AsnGly His Lys Leu Asn
23152315
<210> 5<210> 5
<211> 2360<211> 2360
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 5<400> 5
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met AspLeu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp
65 70 75 8065 70 75 80
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly TrpLys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
85 90 9585 90 95
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys ValAla Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
100 105 110100 105 110
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly AlaLeu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
115 120 125115 120 125
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys ArgLeu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
130 135 140130 135 140
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr LeuThr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
145 150 155 160145 150 155 160
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe PheGln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
165 170 175165 170 175
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His GluHis Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
180 185 190180 185 190
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His GluArg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
195 200 205195 200 205
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser ThrLys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
210 215 220210 215 220
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met IleAsp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
225 230 235 240225 230 235 240
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp AsnLys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
245 250 255245 250 255
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn GlnSer Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
260 265 270260 265 270
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys AlaLeu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
275 280 285275 280 285
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu IleIle Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
290 295 300290 295 300
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu IleAla Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
305 310 315 320305 310 315 320
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp LeuAla Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
325 330 335325 330 335
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp AspAla Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
340 345 350340 345 350
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu PheLeu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
355 360 365355 360 365
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile LeuLeu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
370 375 380370 375 380
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met IleArg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
385 390 395 400385 390 395 400
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala LeuLys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
405 410 415405 410 415
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp GlnVal Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
420 425 430420 425 430
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln GluSer Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
435 440 445435 440 445
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly ThrGlu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
450 455 460450 455 460
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys GlnGlu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
465 470 475 480465 470 475 480
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly GluArg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
485 490 495485 490 495
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu LysLeu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
500 505 510500 505 510
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro TyrAsp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
515 520 525515 520 525
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met ThrTyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
530 535 540530 535 540
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val ValArg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
545 550 555 560545 550 555 560
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn PheAsp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
565 570 575565 570 575
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu LeuAsp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
580 585 590580 585 590
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr ValTyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
595 600 605595 600 605
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys LysThr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
610 615 620610 615 620
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val LysAla Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
625 630 635 640625 630 635 640
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser ValGln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
645 650 655645 650 655
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr TyrGlu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
660 665 670660 665 670
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluHis Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
675 680 685675 680 685
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu PheGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
690 695 700690 695 700
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His LeuGlu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
705 710 715 720705 710 715 720
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr GlyPhe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
725 730 735725 730 735
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys GlnTrp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
740 745 750740 745 750
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala AsnSer Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
755 760 765755 760 765
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys GluArg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
770 775 780770 775 780
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His GluAsp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
785 790 795 800785 790 795 800
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile LeuHis Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
805 810 815805 810 815
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg HisGln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
820 825 830820 825 830
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr ThrLys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
835 840 845835 840 845
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu GluGln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
850 855 860850 855 860
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val GluGly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
865 870 875 880865 870 875 880
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln AsnAsn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
885 890 895885 890 895
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu SerGly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
900 905 910900 905 910
Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspAsp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
915 920 925915 920 925
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly LysSer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
930 935 940930 935 940
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn TyrSer Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
945 950 955 960945 950 955 960
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe AspTrp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
965 970 975965 970 975
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys AlaAsn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
980 985 990980 985 990
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys HisGly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
995 1000 1005995 1000 1005
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp GluVal Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1010 1015 10201010 1015 1020
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerAsn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1025 1030 10351025 1030 1035
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys ValLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1040 1045 10501040 1045 1050
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu AsnArg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1055 1060 10651055 1060 1065
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu GluAla Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1070 1075 10801070 1075 1080
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg LysSer Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1085 1090 10951085 1090 1095
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala LysMet Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1100 1105 11101100 1105 1110
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu IleTyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1115 1120 11251115 1120 1125
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu ThrThr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1130 1135 11401130 1135 1140
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp PheAsn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1145 1150 11551145 1150 1155
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile ValAla Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1160 1165 11701160 1165 1170
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser IleLys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1175 1180 11851175 1180 1185
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys AspLeu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1190 1195 12001190 1195 1200
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val AlaTrp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1205 1210 12151205 1210 1215
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser LysTyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1220 1225 12301220 1225 1230
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met GluLys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1235 1240 12451235 1240 1245
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala LysArg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1250 1255 12601250 1255 1260
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro LysGly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1265 1270 12751265 1270 1275
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu AlaTyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1280 1285 12901280 1285 1290
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro SerSer Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1295 1300 13051295 1300 1305
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys LeuLys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1310 1315 13201310 1315 1320
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val GluLys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1325 1330 13351325 1330 1335
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser GluGln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1340 1345 13501340 1345 1350
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys ValPhe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1355 1360 13651355 1360 1365
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu GlnLeu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1370 1375 13801370 1375 1380
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly AlaAla Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1385 1390 13951385 1390 1395
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys ArgPro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1400 1405 14101400 1405 1410
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His GlnTyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1415 1420 14251415 1420 1425
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln LeuSer Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1430 1435 14401430 1435 1440
Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp TyrGly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr
1445 1450 14551445 1450 1455
Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly GlyAla Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Gly
1460 1465 14701460 1465 1470
Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro AlaGly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala
1475 1480 14851475 1480 1485
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala ThrGly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr
1490 1495 15001490 1495 1500
Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly SerPro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
1505 1510 15151505 1510 1515
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu GlyAla Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1520 1525 15301520 1525 1530
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser ThrThr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
1535 1540 15451535 1540 1545
Glu Pro Ser Glu Asn His Asp Gln Glu Phe Asp Pro Pro Lys ValGlu Pro Ser Glu Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val
1550 1555 15601550 1555 1560
Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val LeuTyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu
1565 1570 15751565 1570 1575
Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys AspSer Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp
1580 1585 15901580 1585 1590
Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys GluLeu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu
1595 1600 16051595 1600 1605
Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile MetAsp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met
1610 1615 16201610 1615 1620
Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln GluTyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu
1625 1630 16351625 1630 1635
Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn AspTrp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp
1640 1645 16501640 1645 1650
Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly ThrLeu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr
1655 1660 16651655 1660 1665
Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala ArgGly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg
1670 1675 16801670 1675 1680
Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu AsnPro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn
1685 1690 16951685 1690 1695
Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg PheVal Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe
1700 1705 17101700 1705 1710
Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser AlaLeu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
1715 1720 17251715 1720 1725
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met AsnAla His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn
1730 1735 17401730 1735 1740
Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln GluArg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu
1745 1750 17551745 1750 1755
Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg ThrCys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr
1760 1765 17701760 1765 1770
Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln HisIle Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His
1775 1780 17851775 1780 1785
Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys ThrPhe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr
1790 1795 18001790 1795 1800
Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp ValGlu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val
1805 1810 18151805 1810 1815
Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg SerSer Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser
1820 1825 18301820 1825 1830
Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys GluTrp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu
1835 1840 18451835 1840 1845
Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser ArgTyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg
1850 1855 18601850 1855 1860
Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg GlyGly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly
1865 1870 18751865 1870 1875
Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala TrpSer His Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp
1880 1885 18901880 1885 1890
Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile AspLys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp
1895 1900 19051895 1900 1905
Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly SerLys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser
1910 1915 19201910 1915 1920
Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn Val ValGly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val
1925 1930 19351925 1930 1935
Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr GlyArg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly
1940 1945 19501940 1945 1950
Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly TrpSer Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp
1955 1960 19651955 1960 1965
Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro ArgTyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg
1970 1975 19801970 1975 1980
Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn LeuGln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu
1985 1990 19951985 1990 1995
Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu GlnLeu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln
2000 2005 20102000 2005 2010
Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr GlnThr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln
2015 2020 20252015 2020 2025
Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu Lys Ser LysAsn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys
2030 2035 20402030 2035 2040
His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala GlnHis Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln
2045 2050 20552045 2050 2055
Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu LeuVal Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu
2060 2065 20702060 2065 2070
Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr PheVal Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe
2075 2080 20852075 2080 2085
Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys LysSer Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys
2090 2095 21002090 2095 2100
Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys GlnArg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln
2105 2110 21152105 2110 2115
Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile LysAla Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys
2120 2125 21302120 2125 2130
Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp AsnGlu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn
2135 2140 21452135 2140 2145
His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr GluHis His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu
2150 2155 21602150 2155 2160
Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro LeuGly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu
2165 2170 21752165 2170 2175
Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly SerPro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser
2180 2185 21902180 2185 2190
Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe LysLys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys
2195 2200 22052195 2200 2205
Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr TyrGln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr
2210 2215 22202210 2215 2220
Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu GlnGlu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln
2225 2230 22352225 2230 2235
Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn PheAsp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe
2240 2245 22502240 2245 2250
Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp GluThr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu
2255 2260 22652255 2260 2265
Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu GlyAla Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly
2270 2275 22802270 2275 2280
Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu IleArg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile
2285 2290 22952285 2290 2295
Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys AsnAla Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn
2300 2305 23102300 2305 2310
Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu ArgLeu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg
2315 2320 23252315 2320 2325
Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu ValIle Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val
2330 2335 23402330 2335 2340
Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His LysAla Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys
2345 2350 23552345 2350 2355
Leu AsnLeu Asn
23602360
<210> 6<210> 6
<211> 2382<211> 2382
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 6<400> 6
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met AspLeu Glu Lys Gly Glu Glu Pro Gly Gly Ser Gly Gly Gly Ser Met Asp
65 70 75 8065 70 75 80
Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly TrpLys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly Trp
85 90 9585 90 95
Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys ValAla Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys Val
100 105 110100 105 110
Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly AlaLeu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly Ala
115 120 125115 120 125
Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys ArgLeu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys Arg
130 135 140130 135 140
Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr LeuThr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr Leu
145 150 155 160145 150 155 160
Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe PheGln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe Phe
165 170 175165 170 175
His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His GluHis Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His Glu
180 185 190180 185 190
Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His GluArg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His Glu
195 200 205195 200 205
Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser ThrLys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser Thr
210 215 220210 215 220
Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met IleAsp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met Ile
225 230 235 240225 230 235 240
Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp AsnLys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp Asn
245 250 255245 250 255
Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn GlnSer Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn Gln
260 265 270260 265 270
Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys AlaLeu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys Ala
275 280 285275 280 285
Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu IleIle Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu Ile
290 295 300290 295 300
Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu IleAla Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu Ile
305 310 315 320305 310 315 320
Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp LeuAla Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp Leu
325 330 335325 330 335
Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp AspAla Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp Asp
340 345 350340 345 350
Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu PheLeu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu Phe
355 360 365355 360 365
Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile LeuLeu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile Leu
370 375 380370 375 380
Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met IleArg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met Ile
385 390 395 400385 390 395 400
Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala LeuLys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala Leu
405 410 415405 410 415
Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp GlnVal Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp Gln
420 425 430420 425 430
Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln GluSer Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln Glu
435 440 445435 440 445
Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly ThrGlu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly Thr
450 455 460450 455 460
Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys GlnGlu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg Lys Gln
465 470 475 480465 470 475 480
Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly GluArg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu Gly Glu
485 490 495485 490 495
Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu LysLeu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe Leu Lys
500 505 510500 505 510
Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro TyrAsp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile Pro Tyr
515 520 525515 520 525
Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met ThrTyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp Met Thr
530 535 540530 535 540
Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val ValArg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu Val Val
545 550 555 560545 550 555 560
Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn PheAsp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr Asn Phe
565 570 575565 570 575
Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu LeuAsp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser Leu Leu
580 585 590580 585 590
Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr ValTyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val
595 600 605595 600 605
Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys LysThr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys
610 615 620610 615 620
Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val LysAla Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys
625 630 635 640625 630 635 640
Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser ValGln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val
645 650 655645 650 655
Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr TyrGlu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr
660 665 670660 665 670
His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluHis Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
675 680 685675 680 685
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu PheGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu Phe
690 695 700690 695 700
Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His LeuGlu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala His Leu
705 710 715 720705 710 715 720
Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr GlyPhe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr Thr Gly
725 730 735725 730 735
Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys GlnTrp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp Lys Gln
740 745 750740 745 750
Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala AsnSer Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe Ala Asn
755 760 765755 760 765
Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys GluArg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe Lys Glu
770 775 780770 775 780
Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His GluAsp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu His Glu
785 790 795 800785 790 795 800
His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile LeuHis Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly Ile Leu
805 810 815805 810 815
Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg HisGln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly Arg His
820 825 830820 825 830
Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr ThrLys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln Thr Thr
835 840 845835 840 845
Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu GluGln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu
850 855 860850 855 860
Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val GluGly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu
865 870 875 880865 870 875 880
Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln AsnAsn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn
885 890 895885 890 895
Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu SerGly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser
900 905 910900 905 910
Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspAsp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
915 920 925915 920 925
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly LysSer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly Lys
930 935 940930 935 940
Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn TyrSer Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys Asn Tyr
945 950 955 960945 950 955 960
Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe AspTrp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp
965 970 975965 970 975
Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys AlaAsn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala
980 985 990980 985 990
Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys HisGly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His
995 1000 1005995 1000 1005
Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp GluVal Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu
1010 1015 10201010 1015 1020
Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerAsn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
1025 1030 10351025 1030 1035
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys ValLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val
1040 1045 10501040 1045 1050
Arg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu AsnArg Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn
1055 1060 10651055 1060 1065
Ala Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu GluAla Val Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu
1070 1075 10801070 1075 1080
Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg LysSer Glu Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys
1085 1090 10951085 1090 1095
Met Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala LysMet Ile Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys
1100 1105 11101100 1105 1110
Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu IleTyr Phe Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile
1115 1120 11251115 1120 1125
Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu ThrThr Leu Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr
1130 1135 11401130 1135 1140
Asn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp PheAsn Gly Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe
1145 1150 11551145 1150 1155
Ala Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile ValAla Thr Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val
1160 1165 11701160 1165 1170
Lys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser IleLys Lys Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile
1175 1180 11851175 1180 1185
Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys AspLeu Pro Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp
1190 1195 12001190 1195 1200
Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val AlaTrp Asp Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala
1205 1210 12151205 1210 1215
Tyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser LysTyr Ser Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys
1220 1225 12301220 1225 1230
Lys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met GluLys Leu Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu
1235 1240 12451235 1240 1245
Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala LysArg Ser Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys
1250 1255 12601250 1255 1260
Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro LysGly Tyr Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys
1265 1270 12751265 1270 1275
Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu AlaTyr Ser Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala
1280 1285 12901280 1285 1290
Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro SerSer Ala Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser
1295 1300 13051295 1300 1305
Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys LeuLys Tyr Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu
1310 1315 13201310 1315 1320
Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val GluLys Gly Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu
1325 1330 13351325 1330 1335
Gln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser GluGln His Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu
1340 1345 13501340 1345 1350
Phe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys ValPhe Ser Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val
1355 1360 13651355 1360 1365
Leu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu GlnLeu Ser Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln
1370 1375 13801370 1375 1380
Ala Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly AlaAla Glu Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala
1385 1390 13951385 1390 1395
Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys ArgPro Ala Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg
1400 1405 14101400 1405 1410
Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His GlnTyr Thr Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln
1415 1420 14251415 1420 1425
Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln LeuSer Ile Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu
1430 1435 14401430 1435 1440
Gly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp TyrGly Gly Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr
1445 1450 14551445 1450 1455
Ala Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly GlyAla Ser Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Gly
1460 1465 14701460 1465 1470
Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro AlaGly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala
1475 1480 14851475 1480 1485
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala ThrGly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr
1490 1495 15001490 1495 1500
Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly SerPro Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser
1505 1510 15151505 1510 1515
Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu GlyAla Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
1520 1525 15301520 1525 1530
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser ThrThr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr
1535 1540 15451535 1540 1545
Glu Pro Ser Glu Asn His Asp Gln Glu Phe Asp Pro Pro Lys ValGlu Pro Ser Glu Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val
1550 1555 15601550 1555 1560
Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val LeuTyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile Arg Val Leu
1565 1570 15751565 1570 1575
Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys AspSer Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val Leu Lys Asp
1580 1585 15901580 1585 1590
Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys GluLeu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu Val Cys Glu
1595 1600 16051595 1600 1605
Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile MetAsp Ser Ile Thr Val Gly Met Val Arg His Gln Gly Lys Ile Met
1610 1615 16201610 1615 1620
Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln GluTyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His Ile Gln Glu
1625 1630 16351625 1630 1635
Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn AspTrp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro Cys Asn Asp
1640 1645 16501640 1645 1650
Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly ThrLeu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr Glu Gly Thr
1655 1660 16651655 1660 1665
Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala ArgGly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His Asp Ala Arg
1670 1675 16801670 1675 1680
Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu AsnPro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe Glu Asn
1685 1690 16951685 1690 1695
Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg PheVal Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg Phe
1700 1705 17101700 1705 1710
Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser AlaLeu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
1715 1720 17251715 1720 1725
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met AsnAla His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn
1730 1735 17401730 1735 1740
Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln GluArg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu
1745 1750 17551745 1750 1755
Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg ThrCys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr
1760 1765 17701760 1765 1770
Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln HisIle Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His
1775 1780 17851775 1780 1785
Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys ThrPhe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr
1790 1795 18001790 1795 1800
Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp ValGlu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr Thr Asp Val
1805 1810 18151805 1810 1815
Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg SerSer Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu Gly Arg Ser
1820 1825 18301820 1825 1830
Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys GluTrp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro Leu Lys Glu
1835 1840 18451835 1840 1845
Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser ArgTyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg
1850 1855 18601850 1855 1860
Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg GlyGly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser Leu Arg Gly
1865 1870 18751865 1870 1875
Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala TrpSer His Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp
1880 1885 18901880 1885 1890
Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile AspLys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp
1895 1900 19051895 1900 1905
Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly SerLys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser
1910 1915 19201910 1915 1920
Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn Val ValGly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn Val Val
1925 1930 19351925 1930 1935
Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr GlyArg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr Gly
1940 1945 19501940 1945 1950
Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly TrpSer Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp
1955 1960 19651955 1960 1965
Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro ArgTyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg
1970 1975 19801970 1975 1980
Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn LeuGln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu
1985 1990 19951985 1990 1995
Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu GlnLeu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln
2000 2005 20102000 2005 2010
Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr GlnThr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln
2015 2020 20252015 2020 2025
Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu Lys Ser LysAsn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys
2030 2035 20402030 2035 2040
His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala GlnHis Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln
2045 2050 20552045 2050 2055
Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu LeuVal Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu Leu
2060 2065 20702060 2065 2070
Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr PheVal Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe
2075 2080 20852075 2080 2085
Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys LysSer Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro Lys Lys Lys
2090 2095 21002090 2095 2100
Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys GlnArg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln
2105 2110 21152105 2110 2115
Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ser Gly Ala ThrAla Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ser Gly Ala Thr
2120 2125 21302120 2125 2130
Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn ProAsn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
2135 2140 21452135 2140 2145
Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu TyrGly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr
2150 2155 21602150 2155 2160
Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser GluMet Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu
2165 2170 21752165 2170 2175
Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile LysGly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys
2180 2185 21902180 2185 2190
Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu AlaVal Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala
2195 2200 22052195 2200 2205
Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr GlnThr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln
2210 2215 22202210 2215 2220
Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe ThrGly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr
2225 2230 22352225 2230 2235
Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr AlaTrp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala
2240 2245 22502240 2245 2250
Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn ValThr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val
2255 2260 22652255 2260 2265
Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val Met GlnLys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln
2270 2275 22802270 2275 2280
Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr ProLys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro
2285 2290 22952285 2290 2295
Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys LeuAla Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu
2300 2305 23102300 2305 2310
Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr ArgVal Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg
2315 2320 23252315 2320 2325
Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr TyrSer Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr
2330 2335 23402330 2335 2340
Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu ThrVal Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr
2345 2350 23552345 2350 2355
Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp LeuTyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu
2360 2365 23702360 2365 2370
Pro Ser Lys Leu Gly His Lys Leu AsnPro Ser Lys Leu Gly His Lys Leu Asn
2375 23802375 2380
<210> 7<210> 7
<211> 2303<211> 2303
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 7<400> 7
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr SerLeu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser
65 70 75 8065 70 75 80
Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly LeuGlu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu
85 90 9585 90 95
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
100 105 110100 105 110
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
115 120 125115 120 125
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
130 135 140130 135 140
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
145 150 155 160145 150 155 160
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
165 170 175165 170 175
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
180 185 190180 185 190
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
195 200 205195 200 205
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
210 215 220210 215 220
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
225 230 235 240225 230 235 240
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
245 250 255245 250 255
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
260 265 270260 265 270
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
275 280 285275 280 285
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
290 295 300290 295 300
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
305 310 315 320305 310 315 320
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
325 330 335325 330 335
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
340 345 350340 345 350
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
355 360 365355 360 365
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
370 375 380370 375 380
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
385 390 395 400385 390 395 400
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
405 410 415405 410 415
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
420 425 430420 425 430
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
435 440 445435 440 445
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
450 455 460450 455 460
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
465 470 475 480465 470 475 480
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
485 490 495485 490 495
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
500 505 510500 505 510
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
515 520 525515 520 525
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
530 535 540530 535 540
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
545 550 555 560545 550 555 560
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
565 570 575565 570 575
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
580 585 590580 585 590
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
595 600 605595 600 605
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
610 615 620610 615 620
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
625 630 635 640625 630 635 640
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
645 650 655645 650 655
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
660 665 670660 665 670
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
675 680 685675 680 685
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
690 695 700690 695 700
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
705 710 715 720705 710 715 720
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
725 730 735725 730 735
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
740 745 750740 745 750
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
755 760 765755 760 765
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
770 775 780770 775 780
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
785 790 795 800785 790 795 800
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
805 810 815805 810 815
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
820 825 830820 825 830
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
835 840 845835 840 845
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
850 855 860850 855 860
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
865 870 875 880865 870 875 880
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
885 890 895885 890 895
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
900 905 910900 905 910
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
915 920 925915 920 925
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
930 935 940930 935 940
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser GluThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
945 950 955 960945 950 955 960
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn AlaGlu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
965 970 975965 970 975
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu ArgLys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
980 985 990980 985 990
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln LeuGly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
995 1000 1005995 1000 1005
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu AspVal Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
1010 1015 10201010 1015 1020
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile ArgSer Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1025 1030 10351025 1030 1035
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp PheGlu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1040 1045 10501040 1045 1050
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn TyrArg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1055 1060 10651055 1060 1065
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr AlaHis His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1070 1075 10801070 1075 1080
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr GlyLeu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1085 1090 10951085 1090 1095
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser GluAsp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1100 1105 11101100 1105 1110
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser AsnGln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1115 1120 11251115 1120 1125
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly GluIle Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1130 1135 11401130 1135 1140
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly GluIle Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1145 1150 11551145 1150 1155
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys ValIle Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1160 1165 11701160 1165 1170
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val GlnLeu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1175 1180 11851175 1180 1185
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn SerThr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1190 1195 12001190 1195 1200
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys TyrAsp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1205 1210 12151205 1210 1215
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val ValGly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1220 1225 12301220 1225 1230
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val LysAla Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1235 1240 12451235 1240 1245
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu LysGlu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1250 1255 12601250 1255 1260
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val LysAsn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1265 1270 12751265 1270 1275
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu LeuLys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1280 1285 12901280 1285 1290
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu GlnGlu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1295 1300 13051295 1300 1305
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe LeuLys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1310 1315 13201310 1315 1320
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu AspTyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1325 1330 13351325 1330 1335
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr LeuAsn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1340 1345 13501340 1345 1350
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val IleAsp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1355 1360 13651355 1360 1365
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn LysLeu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1370 1375 13801370 1375 1380
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile HisHis Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1385 1390 13951385 1390 1395
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys TyrLeu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1400 1405 14101400 1405 1410
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys GluPhe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1415 1420 14251415 1420 1425
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu TyrVal Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1430 1435 14401430 1435 1440
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg AlaGlu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala
1445 1450 14551445 1450 1455
Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro LysAsp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys
1460 1465 14701460 1465 1470
Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly Arg Ala Ser ProLys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly Arg Ala Ser Pro
1475 1480 14851475 1480 1485
Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln Glu Phe Asp ProGly Ile Pro Gly Ser Thr Arg Asn His Asp Gln Glu Phe Asp Pro
1490 1495 15001490 1495 1500
Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro IlePro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile
1505 1510 15151505 1510 1515
Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu ValArg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val
1520 1525 15301520 1525 1530
Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser GluLeu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu
1535 1540 15451535 1540 1545
Val Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln GlyVal Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly
1550 1555 15601550 1555 1560
Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys HisLys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His
1565 1570 15751565 1570 1575
Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser ProIle Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro
1580 1585 15901580 1585 1590
Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu TyrCys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr
1595 1600 16051595 1600 1605
Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu HisGlu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
1610 1615 16201610 1615 1620
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp LeuAsp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu
1625 1630 16351625 1630 1635
Phe Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp IlePhe Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile
1640 1645 16501640 1645 1650
Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys GluSer Arg Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu
1655 1660 16651655 1660 1665
Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu ProVal Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro
1670 1675 16801670 1675 1680
Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu GluGly Met Asn Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu
1685 1690 16951685 1690 1695
Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser LysLeu Gln Glu Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys
1700 1705 17101700 1705 1710
Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly LysVal Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys
1715 1720 17251715 1720 1725
Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile LeuAsp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu
1730 1735 17401730 1735 1740
Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His TyrTrp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr
1745 1750 17551745 1750 1755
Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu LeuThr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu
1760 1765 17701760 1765 1770
Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala ProGly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro
1775 1780 17851775 1780 1785
Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn AlaLeu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala
1790 1795 18001790 1795 1800
Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu SerAsn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser
1805 1810 18151805 1810 1815
Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr ValLeu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val
1820 1825 18301820 1825 1830
Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe ArgSer Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg
1835 1840 18451835 1840 1845
Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser GlyAsn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly
1850 1855 18601850 1855 1860
Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val ThrSer Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr
1865 1870 18751865 1870 1875
Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp LeuAsn Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu
1880 1885 18901880 1885 1890
Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg CysVal Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys
1895 1900 19051895 1900 1905
Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr AlaPro Gly Trp Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala
1910 1915 19201910 1915 1920
Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe MetLeu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met
1925 1930 19351925 1930 1935
Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr ArgAsp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg
1940 1945 19501940 1945 1950
Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly ArgPhe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg
1955 1960 19651955 1960 1965
Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly LeuAsp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu
1970 1975 19801970 1975 1980
Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr LeuLys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu
1985 1990 19951985 1990 1995
Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys ValGln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val
2000 2005 20102000 2005 2010
Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr PheAsp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe
2015 2020 20252015 2020 2025
Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp ProLys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro
2030 2035 20402030 2035 2040
Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser LeuLys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu
2045 2050 20552045 2050 2055
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser GluLeu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu
2060 2065 20702060 2065 2070
Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly ThrLeu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr
2075 2080 20852075 2080 2085
Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly LysVal Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys
2090 2095 21002090 2095 2100
Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu GlyPro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly
2105 2110 21152105 2110 2115
Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe LeuGly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu
2120 2125 21302120 2125 2130
Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro AspTyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp
2135 2140 21452135 2140 2145
Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg ValPhe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val
2150 2155 21602150 2155 2160
Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp ThrThr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr
2165 2170 21752165 2170 2175
Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg GlySer Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly
2180 2185 21902180 2185 2190
Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr LeuVal Asn Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu
2195 2200 22052195 2200 2205
Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly GlyGly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly
2210 2215 22202210 2215 2220
Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly SerLeu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser
2225 2230 22352225 2230 2235
His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys ProHis Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro
2240 2245 22502240 2245 2250
Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr ArgAla Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg
2255 2260 22652255 2260 2265
Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu GlnLeu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln
2270 2275 22802270 2275 2280
His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys LeuHis Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu
2285 2290 22952285 2290 2295
Gly His Lys Leu AsnGly His Lys Leu Asn
23002300
<210> 8<210> 8
<211> 2325<211> 2325
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 8<400> 8
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr SerLeu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser
65 70 75 8065 70 75 80
Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly LeuGlu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu
85 90 9585 90 95
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
100 105 110100 105 110
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
115 120 125115 120 125
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
130 135 140130 135 140
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
145 150 155 160145 150 155 160
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
165 170 175165 170 175
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
180 185 190180 185 190
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
195 200 205195 200 205
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
210 215 220210 215 220
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
225 230 235 240225 230 235 240
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
245 250 255245 250 255
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
260 265 270260 265 270
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
275 280 285275 280 285
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
290 295 300290 295 300
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
305 310 315 320305 310 315 320
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
325 330 335325 330 335
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
340 345 350340 345 350
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
355 360 365355 360 365
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
370 375 380370 375 380
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
385 390 395 400385 390 395 400
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
405 410 415405 410 415
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
420 425 430420 425 430
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
435 440 445435 440 445
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
450 455 460450 455 460
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
465 470 475 480465 470 475 480
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
485 490 495485 490 495
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
500 505 510500 505 510
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
515 520 525515 520 525
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
530 535 540530 535 540
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
545 550 555 560545 550 555 560
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
565 570 575565 570 575
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
580 585 590580 585 590
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
595 600 605595 600 605
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
610 615 620610 615 620
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
625 630 635 640625 630 635 640
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
645 650 655645 650 655
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
660 665 670660 665 670
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
675 680 685675 680 685
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
690 695 700690 695 700
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
705 710 715 720705 710 715 720
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
725 730 735725 730 735
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
740 745 750740 745 750
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
755 760 765755 760 765
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
770 775 780770 775 780
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
785 790 795 800785 790 795 800
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
805 810 815805 810 815
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
820 825 830820 825 830
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
835 840 845835 840 845
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
850 855 860850 855 860
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
865 870 875 880865 870 875 880
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
885 890 895885 890 895
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
900 905 910900 905 910
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
915 920 925915 920 925
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
930 935 940930 935 940
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser GluThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
945 950 955 960945 950 955 960
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn AlaGlu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
965 970 975965 970 975
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu ArgLys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
980 985 990980 985 990
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln LeuGly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
995 1000 1005995 1000 1005
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu AspVal Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
1010 1015 10201010 1015 1020
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile ArgSer Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1025 1030 10351025 1030 1035
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp PheGlu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1040 1045 10501040 1045 1050
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn TyrArg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1055 1060 10651055 1060 1065
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr AlaHis His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1070 1075 10801070 1075 1080
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr GlyLeu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1085 1090 10951085 1090 1095
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser GluAsp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1100 1105 11101100 1105 1110
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser AsnGln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1115 1120 11251115 1120 1125
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly GluIle Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1130 1135 11401130 1135 1140
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly GluIle Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1145 1150 11551145 1150 1155
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys ValIle Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1160 1165 11701160 1165 1170
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val GlnLeu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1175 1180 11851175 1180 1185
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn SerThr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1190 1195 12001190 1195 1200
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys TyrAsp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1205 1210 12151205 1210 1215
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val ValGly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1220 1225 12301220 1225 1230
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val LysAla Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1235 1240 12451235 1240 1245
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu LysGlu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1250 1255 12601250 1255 1260
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val LysAsn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1265 1270 12751265 1270 1275
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu LeuLys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1280 1285 12901280 1285 1290
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu GlnGlu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1295 1300 13051295 1300 1305
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe LeuLys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1310 1315 13201310 1315 1320
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu AspTyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1325 1330 13351325 1330 1335
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr LeuAsn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1340 1345 13501340 1345 1350
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val IleAsp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1355 1360 13651355 1360 1365
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn LysLeu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1370 1375 13801370 1375 1380
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile HisHis Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1385 1390 13951385 1390 1395
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys TyrLeu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1400 1405 14101400 1405 1410
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys GluPhe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1415 1420 14251415 1420 1425
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu TyrVal Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1430 1435 14401430 1435 1440
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg AlaGlu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala
1445 1450 14551445 1450 1455
Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro LysAsp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys
1460 1465 14701460 1465 1470
Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly Arg Ala Ser ProLys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly Arg Ala Ser Pro
1475 1480 14851475 1480 1485
Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln Glu Phe Asp ProGly Ile Pro Gly Ser Thr Arg Asn His Asp Gln Glu Phe Asp Pro
1490 1495 15001490 1495 1500
Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro IlePro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys Arg Lys Pro Ile
1505 1510 15151505 1510 1515
Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu ValArg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr Gly Leu Leu Val
1520 1525 15301520 1525 1530
Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser GluLeu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr Ile Ala Ser Glu
1535 1540 15451535 1540 1545
Val Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln GlyVal Cys Glu Asp Ser Ile Thr Val Gly Met Val Arg His Gln Gly
1550 1555 15601550 1555 1560
Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys HisLys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr Gln Lys His
1565 1570 15751565 1570 1575
Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser ProIle Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly Ser Pro
1580 1585 15901580 1585 1590
Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu TyrCys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu Tyr
1595 1600 16051595 1600 1605
Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu HisGlu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
1610 1615 16201610 1615 1620
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp LeuAsp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu
1625 1630 16351625 1630 1635
Phe Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp IlePhe Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile
1640 1645 16501640 1645 1650
Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys GluSer Arg Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu
1655 1660 16651655 1660 1665
Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu ProVal Ser Ala Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro
1670 1675 16801670 1675 1680
Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu GluGly Met Asn Arg Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu
1685 1690 16951685 1690 1695
Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser LysLeu Gln Glu Cys Leu Glu His Gly Arg Ile Ala Lys Phe Ser Lys
1700 1705 17101700 1705 1710
Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly LysVal Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile Lys Gln Gly Lys
1715 1720 17251715 1720 1725
Asp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile LeuAsp Gln His Phe Pro Val Phe Met Asn Glu Lys Glu Asp Ile Leu
1730 1735 17401730 1735 1740
Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His TyrTrp Cys Thr Glu Met Glu Arg Val Phe Gly Phe Pro Val His Tyr
1745 1750 17551745 1750 1755
Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu LeuThr Asp Val Ser Asn Met Ser Arg Leu Ala Arg Gln Arg Leu Leu
1760 1765 17701760 1765 1770
Gly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala ProGly Arg Ser Trp Ser Val Pro Val Ile Arg His Leu Phe Ala Pro
1775 1780 17851775 1780 1785
Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn AlaLeu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly Asn Ser Asn Ala
1790 1795 18001790 1795 1800
Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu SerAsn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val Pro Leu Ser
1805 1810 18151805 1810 1815
Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr ValLeu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys Thr Val
1820 1825 18301820 1825 1830
Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe ArgSer Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe Arg
1835 1840 18451835 1840 1845
Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser GlyAsn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly
1850 1855 18601850 1855 1860
Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val ThrSer Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr
1865 1870 18751865 1870 1875
Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp LeuAsn Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu
1880 1885 18901880 1885 1890
Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg CysVal Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys
1895 1900 19051895 1900 1905
Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr AlaPro Gly Trp Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala
1910 1915 19201910 1915 1920
Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe MetLeu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met
1925 1930 19351925 1930 1935
Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr ArgAsp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg
1940 1945 19501940 1945 1950
Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly ArgPhe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly Arg
1955 1960 19651955 1960 1965
Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly LeuAsp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu
1970 1975 19801970 1975 1980
Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr LeuLys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu
1985 1990 19951985 1990 1995
Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys ValGln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val
2000 2005 20102000 2005 2010
Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr PheAsp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe
2015 2020 20252015 2020 2025
Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp ProLys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser Arg Ala Asp Pro
2030 2035 20402030 2035 2040
Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser LeuLys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr Asn Phe Ser Leu
2045 2050 20552045 2050 2055
Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly SerLeu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Gly Ser
2060 2065 20702060 2065 2070
Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val GluGly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu
2075 2080 20852075 2080 2085
Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His MetGlu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met
2090 2095 21002090 2095 2100
Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys CysLys Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys
2105 2110 21152105 2110 2115
Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr MetThr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met
2120 2125 21302120 2125 2130
Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe AspArg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp
2135 2140 21452135 2140 2145
Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile AsnIle Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn
2150 2155 21602150 2155 2160
His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro GluHis Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu
2165 2170 21752165 2170 2175
Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly ValGly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val
2180 2185 21902180 2185 2190
Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu IleLeu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile
2195 2200 22052195 2200 2205
Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly ProTyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro
2210 2215 22202210 2215 2220
Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu ThrVal Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr
2225 2230 22352225 2230 2235
Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met AlaLeu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala
2240 2245 22502240 2245 2250
Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys ThrLeu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr
2255 2260 22652255 2260 2265
Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro GlyThr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly
2270 2275 22802270 2275 2280
Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala AsnVal Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn
2285 2290 22952285 2290 2295
Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg TyrAsn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr
2300 2305 23102300 2305 2310
Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu AsnCys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
2315 2320 23252315 2320 2325
<210> 9<210> 9
<211> 2367<211> 2367
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 9<400> 9
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro ProLeu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro
65 70 75 8065 70 75 80
Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu GlyPro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 9585 90 95
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr GluThr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
100 105 110100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr SerPro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro GlyThr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140130 135 140
Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly LeuThr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu
145 150 155 160145 150 155 160
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
165 170 175165 170 175
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
180 185 190180 185 190
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
195 200 205195 200 205
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
210 215 220210 215 220
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
225 230 235 240225 230 235 240
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
245 250 255245 250 255
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
260 265 270260 265 270
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
275 280 285275 280 285
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
290 295 300290 295 300
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
305 310 315 320305 310 315 320
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
325 330 335325 330 335
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
340 345 350340 345 350
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
355 360 365355 360 365
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
370 375 380370 375 380
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
385 390 395 400385 390 395 400
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
405 410 415405 410 415
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
420 425 430420 425 430
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
435 440 445435 440 445
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
450 455 460450 455 460
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
465 470 475 480465 470 475 480
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
485 490 495485 490 495
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
500 505 510500 505 510
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
515 520 525515 520 525
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
530 535 540530 535 540
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
545 550 555 560545 550 555 560
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
565 570 575565 570 575
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
580 585 590580 585 590
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
595 600 605595 600 605
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
610 615 620610 615 620
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
625 630 635 640625 630 635 640
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
645 650 655645 650 655
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
660 665 670660 665 670
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
675 680 685675 680 685
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
690 695 700690 695 700
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
705 710 715 720705 710 715 720
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
725 730 735725 730 735
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
740 745 750740 745 750
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
755 760 765755 760 765
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
770 775 780770 775 780
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
785 790 795 800785 790 795 800
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
805 810 815805 810 815
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
820 825 830820 825 830
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
835 840 845835 840 845
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
850 855 860850 855 860
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
865 870 875 880865 870 875 880
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
885 890 895885 890 895
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
900 905 910900 905 910
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
915 920 925915 920 925
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
930 935 940930 935 940
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
945 950 955 960945 950 955 960
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
965 970 975965 970 975
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
980 985 990980 985 990
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
995 1000 1005995 1000 1005
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro SerThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1010 1015 10201010 1015 1020
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu LeuGlu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1025 1030 10351025 1030 1035
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr LysAsn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1040 1045 10501040 1045 1050
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe IleAla Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1055 1060 10651055 1060 1065
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val AlaLys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1070 1075 10801070 1075 1080
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn AspGln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1085 1090 10951085 1090 1095
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys LeuLys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1100 1105 11101100 1105 1110
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg GluVal Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1115 1120 11251115 1120 1125
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala ValIle Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1130 1135 11401130 1135 1140
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser GluVal Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1145 1150 11551145 1150 1155
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met IlePhe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1160 1165 11701160 1165 1170
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr PheAla Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1175 1180 11851175 1180 1185
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr LeuPhe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1190 1195 12001190 1195 1200
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn GlyAla Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1205 1210 12151205 1210 1215
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala ThrGlu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1220 1225 12301220 1225 1230
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys LysVal Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1235 1240 12451235 1240 1245
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu ProThr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1250 1255 12601250 1255 1260
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp AspLys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1265 1270 12751265 1270 1275
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr SerPro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1280 1285 12901280 1285 1290
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys LeuVal Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1295 1300 13051295 1300 1305
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg SerLys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1310 1315 13201310 1315 1320
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly TyrSer Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1325 1330 13351325 1330 1335
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr SerLys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1340 1345 13501340 1345 1350
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser AlaLeu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1355 1360 13651355 1360 1365
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys TyrGly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1370 1375 13801370 1375 1380
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys GlyVal Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1385 1390 13951385 1390 1395
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln HisSer Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1400 1405 14101400 1405 1410
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe SerLys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1415 1420 14251415 1420 1425
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu SerLys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1430 1435 14401430 1435 1440
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala GluAla Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1445 1450 14551445 1450 1455
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro AlaAsn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1460 1465 14701460 1465 1470
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr ThrAla Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1475 1480 14851475 1480 1485
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser IleSer Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1490 1495 15001490 1495 1500
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly GlyThr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1505 1510 15151505 1510 1515
Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala SerAsp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1520 1525 15301520 1525 1530
Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser GlyGly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly
1535 1540 15451535 1540 1545
Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His Asp GlnArg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln
1550 1555 15601550 1555 1560
Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu LysGlu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys
1565 1570 15751565 1570 1575
Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala ThrArg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr
1580 1585 15901580 1585 1590
Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg TyrGly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr
1595 1600 16051595 1600 1605
Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met ValIle Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
1610 1615 16201610 1615 1620
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser ValArg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val
1625 1630 16351625 1630 1635
Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val IleThr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile
1640 1645 16501640 1645 1650
Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala ArgGly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg
1655 1660 16651655 1660 1665
Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe TyrLys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr
1670 1675 16801670 1675 1680
Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg ProArg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro
1685 1690 16951685 1690 1695
Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val Ser AspPhe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val Ser Asp
1700 1705 17101700 1705 1710
Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val Met IleLys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile
1715 1720 17251715 1720 1725
Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr Phe TrpAsp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp
1730 1735 17401730 1735 1740
Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val AsnGly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn
1745 1750 17551745 1750 1755
Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile AlaAsp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala
1760 1765 17701760 1765 1770
Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser IleLys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile
1775 1780 17851775 1780 1785
Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu LysLys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys
1790 1795 18001790 1795 1800
Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly PheGlu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe
1805 1810 18151805 1810 1815
Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala ArgPro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg
1820 1825 18301820 1825 1830
Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg HisGln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His
1835 1840 18451835 1840 1845
Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser GlyLeu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
1850 1855 18601850 1855 1860
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly LeuAsn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu
1865 1870 18751865 1870 1875
Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu IleVal Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile
1880 1885 18901880 1885 1890
Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val LeuTyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu
1895 1900 19051895 1900 1905
Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly PheSer Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe
1910 1915 19201910 1915 1920
Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr ValLeu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val
1925 1930 19351925 1930 1935
Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys Trp GlyGlu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly
1940 1945 19501940 1945 1950
Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser SerPro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser
1955 1960 19651955 1960 1965
Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg IleCys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile
1970 1975 19801970 1975 1980
Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe PheLeu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe
1985 1990 19951985 1990 1995
Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln GluTrp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu
2000 2005 20102000 2005 2010
Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln AspThr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp
2015 2020 20252015 2020 2025
Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser AsnVal Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn
2030 2035 20402030 2035 2040
Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro Lys GluIle Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu
2045 2050 20552045 2050 2055
Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys Leu AspGlu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp
2060 2065 20702060 2065 2070
Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro LeuAla Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu
2075 2080 20852075 2080 2085
Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu SerArg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser
2090 2095 21002090 2095 2100
Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ala ThrArg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr
2105 2110 21152105 2110 2115
Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn ProAsn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
2120 2125 21302120 2125 2130
Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu TyrGly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr
2135 2140 21452135 2140 2145
Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser GluMet Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu
2150 2155 21602150 2155 2160
Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile LysGly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys
2165 2170 21752165 2170 2175
Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu AlaVal Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala
2180 2185 21902180 2185 2190
Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr GlnThr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His Thr Gln
2195 2200 22052195 2200 2205
Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe ThrGly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly Phe Thr
2210 2215 22202210 2215 2220
Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr AlaTrp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu Thr Ala
2225 2230 22352225 2230 2235
Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn ValThr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr Asn Val
2240 2245 22502240 2245 2250
Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val Met GlnLys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val Met Gln
2255 2260 22652255 2260 2265
Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr ProLys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu Tyr Pro
2270 2275 22802270 2275 2280
Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys LeuAla Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu Lys Leu
2285 2290 22952285 2290 2295
Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr ArgVal Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr Tyr Arg
2300 2305 23102300 2305 2310
Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr TyrSer Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr Tyr
2315 2320 23252315 2320 2325
Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu ThrVal Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr
2330 2335 23402330 2335 2340
Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp LeuTyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu
2345 2350 23552345 2350 2355
Pro Ser Lys Leu Gly His Lys Leu AsnPro Ser Lys Leu Gly His Lys Leu Asn
2360 23652360 2365
<210> 10<210> 10
<211> 2389<211> 2389
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 10<400> 10
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro ProLeu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro
65 70 75 8065 70 75 80
Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu GlyPro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 9585 90 95
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr GluThr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
100 105 110100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr SerPro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro GlyThr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140130 135 140
Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly LeuThr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu
145 150 155 160145 150 155 160
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
165 170 175165 170 175
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
180 185 190180 185 190
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
195 200 205195 200 205
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
210 215 220210 215 220
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
225 230 235 240225 230 235 240
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
245 250 255245 250 255
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
260 265 270260 265 270
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
275 280 285275 280 285
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
290 295 300290 295 300
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
305 310 315 320305 310 315 320
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
325 330 335325 330 335
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
340 345 350340 345 350
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
355 360 365355 360 365
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
370 375 380370 375 380
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
385 390 395 400385 390 395 400
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
405 410 415405 410 415
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
420 425 430420 425 430
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
435 440 445435 440 445
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
450 455 460450 455 460
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
465 470 475 480465 470 475 480
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
485 490 495485 490 495
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
500 505 510500 505 510
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
515 520 525515 520 525
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
530 535 540530 535 540
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
545 550 555 560545 550 555 560
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
565 570 575565 570 575
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
580 585 590580 585 590
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
595 600 605595 600 605
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
610 615 620610 615 620
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
625 630 635 640625 630 635 640
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
645 650 655645 650 655
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
660 665 670660 665 670
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
675 680 685675 680 685
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
690 695 700690 695 700
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
705 710 715 720705 710 715 720
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
725 730 735725 730 735
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
740 745 750740 745 750
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
755 760 765755 760 765
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
770 775 780770 775 780
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
785 790 795 800785 790 795 800
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
805 810 815805 810 815
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
820 825 830820 825 830
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
835 840 845835 840 845
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
850 855 860850 855 860
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
865 870 875 880865 870 875 880
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
885 890 895885 890 895
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
900 905 910900 905 910
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
915 920 925915 920 925
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
930 935 940930 935 940
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
945 950 955 960945 950 955 960
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
965 970 975965 970 975
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
980 985 990980 985 990
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
995 1000 1005995 1000 1005
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro SerThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1010 1015 10201010 1015 1020
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu LeuGlu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1025 1030 10351025 1030 1035
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr LysAsn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1040 1045 10501040 1045 1050
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe IleAla Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1055 1060 10651055 1060 1065
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val AlaLys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1070 1075 10801070 1075 1080
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn AspGln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1085 1090 10951085 1090 1095
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys LeuLys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1100 1105 11101100 1105 1110
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg GluVal Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1115 1120 11251115 1120 1125
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala ValIle Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1130 1135 11401130 1135 1140
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser GluVal Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1145 1150 11551145 1150 1155
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met IlePhe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1160 1165 11701160 1165 1170
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr PheAla Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1175 1180 11851175 1180 1185
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr LeuPhe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1190 1195 12001190 1195 1200
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn GlyAla Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1205 1210 12151205 1210 1215
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala ThrGlu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1220 1225 12301220 1225 1230
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys LysVal Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1235 1240 12451235 1240 1245
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu ProThr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1250 1255 12601250 1255 1260
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp AspLys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1265 1270 12751265 1270 1275
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr SerPro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1280 1285 12901280 1285 1290
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys LeuVal Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1295 1300 13051295 1300 1305
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg SerLys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1310 1315 13201310 1315 1320
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly TyrSer Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1325 1330 13351325 1330 1335
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr SerLys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1340 1345 13501340 1345 1350
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser AlaLeu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1355 1360 13651355 1360 1365
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys TyrGly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1370 1375 13801370 1375 1380
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys GlyVal Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1385 1390 13951385 1390 1395
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln HisSer Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1400 1405 14101400 1405 1410
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe SerLys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1415 1420 14251415 1420 1425
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu SerLys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1430 1435 14401430 1435 1440
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala GluAla Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1445 1450 14551445 1450 1455
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro AlaAsn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1460 1465 14701460 1465 1470
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr ThrAla Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1475 1480 14851475 1480 1485
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser IleSer Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1490 1495 15001490 1495 1500
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly GlyThr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1505 1510 15151505 1510 1515
Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala SerAsp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1520 1525 15301520 1525 1530
Gly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser GlyGly Ser Pro Lys Lys Lys Arg Lys Val Glu Ala Ser Gly Ser Gly
1535 1540 15451535 1540 1545
Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His Asp GlnArg Ala Ser Pro Gly Ile Pro Gly Ser Thr Arg Asn His Asp Gln
1550 1555 15601550 1555 1560
Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu LysGlu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala Glu Lys
1565 1570 15751565 1570 1575
Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala ThrArg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile Ala Thr
1580 1585 15901580 1585 1590
Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg TyrGly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg Tyr
1595 1600 16051595 1600 1605
Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met ValIle Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
1610 1615 16201610 1615 1620
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser ValArg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val
1625 1630 16351625 1630 1635
Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val IleThr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile
1640 1645 16501640 1645 1650
Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala ArgGly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg
1655 1660 16651655 1660 1665
Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe TyrLys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr
1670 1675 16801670 1675 1680
Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg ProArg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro
1685 1690 16951685 1690 1695
Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val Ser AspPhe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val Ser Asp
1700 1705 17101700 1705 1710
Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val Met IleLys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val Met Ile
1715 1720 17251715 1720 1725
Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr Phe TrpAsp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr Phe Trp
1730 1735 17401730 1735 1740
Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val AsnGly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr Val Asn
1745 1750 17551745 1750 1755
Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile AlaAsp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg Ile Ala
1760 1765 17701760 1765 1770
Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser IleLys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn Ser Ile
1775 1780 17851775 1780 1785
Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu LysLys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn Glu Lys
1790 1795 18001790 1795 1800
Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly PheGlu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe Gly Phe
1805 1810 18151805 1810 1815
Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala ArgPro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu Ala Arg
1820 1825 18301820 1825 1830
Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg HisGln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg His
1835 1840 18451835 1840 1845
Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser GlyLeu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
1850 1855 18601850 1855 1860
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly LeuAsn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu
1865 1870 18751865 1870 1875
Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu IleVal Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile
1880 1885 18901880 1885 1890
Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val LeuTyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu
1895 1900 19051895 1900 1905
Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly PheSer Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe
1910 1915 19201910 1915 1920
Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr ValLeu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val
1925 1930 19351925 1930 1935
Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys Trp GlyGlu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys Trp Gly
1940 1945 19501940 1945 1950
Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser SerPro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser Ser
1955 1960 19651955 1960 1965
Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg IleCys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile
1970 1975 19801970 1975 1980
Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe PheLeu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe
1985 1990 19951985 1990 1995
Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln GluTrp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu
2000 2005 20102000 2005 2010
Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln AspThr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp
2015 2020 20252015 2020 2025
Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser AsnVal Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn
2030 2035 20402030 2035 2040
Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro Lys GluIle Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu
2045 2050 20552045 2050 2055
Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys Leu AspGlu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys Leu Asp
2060 2065 20702060 2065 2070
Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro LeuAla Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro Leu
2075 2080 20852075 2080 2085
Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu SerArg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Ser
2090 2095 21002090 2095 2100
Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ala ThrArg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly Ala Thr
2105 2110 21152105 2110 2115
Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn ProAsn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn Pro
2120 2125 21302120 2125 2130
Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln AlaGly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala
2135 2140 21452135 2140 2145
Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys GluGly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu
2150 2155 21602150 2155 2160
Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn HisAsn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His
2165 2170 21752165 2170 2175
His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu GlyHis Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly
2180 2185 21902180 2185 2190
Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu ProThr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro
2195 2200 22052195 2200 2205
Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser LysPhe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys
2210 2215 22202210 2215 2220
Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys GlnThr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln
2225 2230 22352225 2230 2235
Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr GluSer Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu
2240 2245 22502240 2245 2250
Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln AspAsp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp
2255 2260 22652255 2260 2265
Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe ThrGly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr
2270 2275 22802270 2275 2280
Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu AlaSer Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala
2285 2290 22952285 2290 2295
Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly ArgPhe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg
2300 2305 23102300 2305 2310
Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile AlaAsn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala
2315 2320 23252315 2320 2325
Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn LeuAsn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu
2330 2335 23402330 2335 2340
Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg IleLys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile
2345 2350 23552345 2350 2355
Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val AlaLys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala
2360 2365 23702360 2365 2370
Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys LeuVal Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu
2375 2380 23852375 2380 2385
AsnAsn
<210> 11<210> 11
<211> 2369<211> 2369
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 11<400> 11
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr SerLeu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser
65 70 75 8065 70 75 80
Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly LeuGlu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu
85 90 9585 90 95
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
100 105 110100 105 110
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
115 120 125115 120 125
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
130 135 140130 135 140
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
145 150 155 160145 150 155 160
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
165 170 175165 170 175
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
180 185 190180 185 190
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
195 200 205195 200 205
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
210 215 220210 215 220
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
225 230 235 240225 230 235 240
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
245 250 255245 250 255
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
260 265 270260 265 270
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
275 280 285275 280 285
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
290 295 300290 295 300
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
305 310 315 320305 310 315 320
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
325 330 335325 330 335
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
340 345 350340 345 350
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
355 360 365355 360 365
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
370 375 380370 375 380
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
385 390 395 400385 390 395 400
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
405 410 415405 410 415
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
420 425 430420 425 430
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
435 440 445435 440 445
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
450 455 460450 455 460
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
465 470 475 480465 470 475 480
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
485 490 495485 490 495
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
500 505 510500 505 510
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
515 520 525515 520 525
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
530 535 540530 535 540
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
545 550 555 560545 550 555 560
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
565 570 575565 570 575
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
580 585 590580 585 590
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
595 600 605595 600 605
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
610 615 620610 615 620
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
625 630 635 640625 630 635 640
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
645 650 655645 650 655
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
660 665 670660 665 670
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
675 680 685675 680 685
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
690 695 700690 695 700
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
705 710 715 720705 710 715 720
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
725 730 735725 730 735
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
740 745 750740 745 750
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
755 760 765755 760 765
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
770 775 780770 775 780
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
785 790 795 800785 790 795 800
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
805 810 815805 810 815
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
820 825 830820 825 830
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
835 840 845835 840 845
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
850 855 860850 855 860
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
865 870 875 880865 870 875 880
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
885 890 895885 890 895
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
900 905 910900 905 910
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
915 920 925915 920 925
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
930 935 940930 935 940
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser GluThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
945 950 955 960945 950 955 960
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn AlaGlu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
965 970 975965 970 975
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu ArgLys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
980 985 990980 985 990
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln LeuGly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
995 1000 1005995 1000 1005
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu AspVal Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
1010 1015 10201010 1015 1020
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile ArgSer Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1025 1030 10351025 1030 1035
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp PheGlu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1040 1045 10501040 1045 1050
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn TyrArg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1055 1060 10651055 1060 1065
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr AlaHis His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1070 1075 10801070 1075 1080
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr GlyLeu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1085 1090 10951085 1090 1095
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser GluAsp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1100 1105 11101100 1105 1110
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser AsnGln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1115 1120 11251115 1120 1125
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly GluIle Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1130 1135 11401130 1135 1140
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly GluIle Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1145 1150 11551145 1150 1155
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys ValIle Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1160 1165 11701160 1165 1170
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val GlnLeu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1175 1180 11851175 1180 1185
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn SerThr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1190 1195 12001190 1195 1200
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys TyrAsp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1205 1210 12151205 1210 1215
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val ValGly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1220 1225 12301220 1225 1230
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val LysAla Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1235 1240 12451235 1240 1245
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu LysGlu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1250 1255 12601250 1255 1260
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val LysAsn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1265 1270 12751265 1270 1275
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu LeuLys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1280 1285 12901280 1285 1290
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu GlnGlu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1295 1300 13051295 1300 1305
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe LeuLys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1310 1315 13201310 1315 1320
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu AspTyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1325 1330 13351325 1330 1335
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr LeuAsn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1340 1345 13501340 1345 1350
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val IleAsp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1355 1360 13651355 1360 1365
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn LysLeu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1370 1375 13801370 1375 1380
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile HisHis Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1385 1390 13951385 1390 1395
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys TyrLeu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1400 1405 14101400 1405 1410
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys GluPhe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1415 1420 14251415 1420 1425
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu TyrVal Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1430 1435 14401430 1435 1440
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg AlaGlu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala
1445 1450 14551445 1450 1455
Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro LysAsp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys
1460 1465 14701460 1465 1470
Lys Lys Arg Lys Val Ser Pro Gly Gly Gly Pro Ser Ser Gly AlaLys Lys Arg Lys Val Ser Pro Gly Gly Gly Pro Ser Ser Gly Ala
1475 1480 14851475 1480 1485
Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser ThrPro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
1490 1495 15001490 1495 1500
Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro GlyGlu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
1505 1510 15151505 1510 1515
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro AlaThr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
1520 1525 15301520 1525 1530
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro SerGly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser
1535 1540 15451535 1540 1545
Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Asn HisGlu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Asn His
1550 1555 15601550 1555 1560
Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro AlaAsp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala
1565 1570 15751565 1570 1575
Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleGlu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
1580 1585 15901580 1585 1590
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val AspAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp
1595 1600 16051595 1600 1605
Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val GlyArg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly
1610 1615 16201610 1615 1620
Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val ArgMet Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg
1625 1630 16351625 1630 1635
Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp LeuSer Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu
1640 1645 16501640 1645 1650
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn ProVal Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro
1655 1660 16651655 1660 1665
Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe GluAla Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu
1670 1675 16801670 1675 1680
Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp AspPhe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp
1685 1690 16951685 1690 1695
Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly ValArg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val
1700 1705 17101700 1705 1710
Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro ValSer Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val
1715 1720 17251715 1720 1725
Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg TyrMet Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
1730 1735 17401730 1735 1740
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser ThrPhe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
1745 1750 17551745 1750 1755
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly ArgVal Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg
1760 1765 17701760 1765 1770
Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser AsnIle Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
1775 1780 17851775 1780 1785
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met AsnSer Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn
1790 1795 18001790 1795 1800
Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val PheGlu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe
1805 1810 18151805 1810 1815
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuGly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
1820 1825 18301820 1825 1830
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val IleAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile
1835 1840 18451835 1840 1845
Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val SerArg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser
1850 1855 18601850 1855 1860
Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1865 1870 18751865 1870 1875
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro MetGly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met
1880 1885 18901880 1885 1890
Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val ArgGlu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg
1895 1900 19051895 1900 1905
Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser LeuVal Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu
1910 1915 19201910 1915 1920
Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu LysGly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys
1925 1930 19351925 1930 1935
Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysTyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
1940 1945 19501940 1945 1950
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu GlyTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly
1955 1960 19651955 1960 1965
Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe HisSer Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His
1970 1975 19801970 1975 1980
Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg ProArg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro
1985 1990 19951985 1990 1995
Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp AspPhe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp
2000 2005 20102000 2005 2010
Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr LeuGln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu
2015 2020 20252015 2020 2025
Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val TrpGln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp
2030 2035 20402030 2035 2040
Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr ProSer Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro
2045 2050 20552045 2050 2055
Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysLys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
2060 2065 20702060 2065 2070
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu LeuLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu
2075 2080 20852075 2080 2085
Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu ProPro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro
2090 2095 21002090 2095 2100
Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser GlyLeu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly
2105 2110 21152105 2110 2115
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu GluAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
2120 2125 21302120 2125 2130
Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met LysAsn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys
2135 2140 21452135 2140 2145
Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys ThrLeu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr
2150 2155 21602150 2155 2160
Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met ArgSer Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg
2165 2170 21752165 2170 2175
Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp IleIle Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile
2180 2185 21902180 2185 2190
Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn HisLeu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His
2195 2200 22052195 2200 2205
Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu GlyThr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly
2210 2215 22202210 2215 2220
Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val LeuPhe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu
2225 2230 22352225 2230 2235
Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile TyrThr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr
2240 2245 22502240 2245 2250
Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro ValAsn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val
2255 2260 22652255 2260 2265
Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr LeuMet Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu
2270 2275 22802270 2275 2280
Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala LeuTyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu
2285 2290 22952285 2290 2295
Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr ThrLys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr
2300 2305 23102300 2305 2310
Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly ValTyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val
2315 2320 23252315 2320 2325
Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn AsnTyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn
2330 2335 23402330 2335 2340
Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr CysGlu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys
2345 2350 23552345 2350 2355
Asp Leu Pro Ser Lys Leu Gly His Lys Leu AsnAsp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
2360 23652360 2365
<210> 12<210> 12
<211> 2391<211> 2391
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 12<400> 12
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr SerLeu Glu Lys Gly Glu Glu Pro Ser Gly Ser Glu Thr Pro Gly Thr Ser
65 70 75 8065 70 75 80
Glu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly LeuGlu Ser Ala Thr Pro Glu Ser Met Asp Lys Lys Tyr Ser Ile Gly Leu
85 90 9585 90 95
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
100 105 110100 105 110
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
115 120 125115 120 125
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
130 135 140130 135 140
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
145 150 155 160145 150 155 160
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
165 170 175165 170 175
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
180 185 190180 185 190
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
195 200 205195 200 205
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
210 215 220210 215 220
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
225 230 235 240225 230 235 240
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
245 250 255245 250 255
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
260 265 270260 265 270
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
275 280 285275 280 285
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
290 295 300290 295 300
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
305 310 315 320305 310 315 320
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
325 330 335325 330 335
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
340 345 350340 345 350
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
355 360 365355 360 365
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
370 375 380370 375 380
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
385 390 395 400385 390 395 400
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
405 410 415405 410 415
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
420 425 430420 425 430
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
435 440 445435 440 445
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
450 455 460450 455 460
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
465 470 475 480465 470 475 480
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
485 490 495485 490 495
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
500 505 510500 505 510
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
515 520 525515 520 525
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
530 535 540530 535 540
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
545 550 555 560545 550 555 560
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
565 570 575565 570 575
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
580 585 590580 585 590
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
595 600 605595 600 605
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
610 615 620610 615 620
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
625 630 635 640625 630 635 640
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
645 650 655645 650 655
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
660 665 670660 665 670
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
675 680 685675 680 685
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
690 695 700690 695 700
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
705 710 715 720705 710 715 720
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
725 730 735725 730 735
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
740 745 750740 745 750
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
755 760 765755 760 765
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
770 775 780770 775 780
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
785 790 795 800785 790 795 800
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
805 810 815805 810 815
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
820 825 830820 825 830
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
835 840 845835 840 845
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
850 855 860850 855 860
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
865 870 875 880865 870 875 880
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
885 890 895885 890 895
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
900 905 910900 905 910
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
915 920 925915 920 925
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
930 935 940930 935 940
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser GluThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser Glu
945 950 955 960945 950 955 960
Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn AlaGlu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu Asn Ala
965 970 975965 970 975
Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu ArgLys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg
980 985 990980 985 990
Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln LeuGly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu
995 1000 1005995 1000 1005
Val Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu AspVal Glu Thr Arg Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp
1010 1015 10201010 1015 1020
Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile ArgSer Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg
1025 1030 10351025 1030 1035
Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp PheGlu Val Lys Val Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe
1040 1045 10501040 1045 1050
Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn TyrArg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr
1055 1060 10651055 1060 1065
His His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr AlaHis His Ala His Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala
1070 1075 10801070 1075 1080
Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr GlyLeu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly
1085 1090 10951085 1090 1095
Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser GluAsp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu
1100 1105 11101100 1105 1110
Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser AsnGln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn
1115 1120 11251115 1120 1125
Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly GluIle Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu
1130 1135 11401130 1135 1140
Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly GluIle Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu
1145 1150 11551145 1150 1155
Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys ValIle Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val
1160 1165 11701160 1165 1170
Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val GlnLeu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln
1175 1180 11851175 1180 1185
Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn SerThr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser
1190 1195 12001190 1195 1200
Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys TyrAsp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr
1205 1210 12151205 1210 1215
Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val ValGly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val
1220 1225 12301220 1225 1230
Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val LysAla Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys
1235 1240 12451235 1240 1245
Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu LysGlu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys
1250 1255 12601250 1255 1260
Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val LysAsn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys
1265 1270 12751265 1270 1275
Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu LeuLys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu
1280 1285 12901280 1285 1290
Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu GlnGlu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln
1295 1300 13051295 1300 1305
Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe LeuLys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu
1310 1315 13201310 1315 1320
Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu AspTyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp
1325 1330 13351325 1330 1335
Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr LeuAsn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys His Tyr Leu
1340 1345 13501340 1345 1350
Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val IleAsp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile
1355 1360 13651355 1360 1365
Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn LysLeu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys
1370 1375 13801370 1375 1380
His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile HisHis Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His
1385 1390 13951385 1390 1395
Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys TyrLeu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr
1400 1405 14101400 1405 1410
Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys GluPhe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu
1415 1420 14251415 1420 1425
Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu TyrVal Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr
1430 1435 14401430 1435 1440
Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg AlaGlu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp Ser Arg Ala
1445 1450 14551445 1450 1455
Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro LysAsp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Pro Lys
1460 1465 14701460 1465 1470
Lys Lys Arg Lys Val Ser Pro Gly Gly Gly Pro Ser Ser Gly AlaLys Lys Arg Lys Val Ser Pro Gly Gly Gly Pro Ser Ser Gly Ala
1475 1480 14851475 1480 1485
Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser ThrPro Pro Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr
1490 1495 15001490 1495 1500
Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro GlyGlu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly
1505 1510 15151505 1510 1515
Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro AlaThr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala
1520 1525 15301520 1525 1530
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro SerGly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser
1535 1540 15451535 1540 1545
Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Asn HisGlu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Asn His
1550 1555 15601550 1555 1560
Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro AlaAsp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala
1565 1570 15751565 1570 1575
Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleGlu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
1580 1585 15901580 1585 1590
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val AspAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp
1595 1600 16051595 1600 1605
Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val GlyArg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly
1610 1615 16201610 1615 1620
Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val ArgMet Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg
1625 1630 16351625 1630 1635
Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp LeuSer Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu
1640 1645 16501640 1645 1650
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn ProVal Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro
1655 1660 16651655 1660 1665
Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe GluAla Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu
1670 1675 16801670 1675 1680
Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp AspPhe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp
1685 1690 16951685 1690 1695
Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly ValArg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val
1700 1705 17101700 1705 1710
Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro ValSer Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val
1715 1720 17251715 1720 1725
Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg TyrMet Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
1730 1735 17401730 1735 1740
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser ThrPhe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
1745 1750 17551745 1750 1755
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly ArgVal Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg
1760 1765 17701760 1765 1770
Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser AsnIle Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
1775 1780 17851775 1780 1785
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met AsnSer Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn
1790 1795 18001790 1795 1800
Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val PheGlu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe
1805 1810 18151805 1810 1815
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuGly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
1820 1825 18301820 1825 1830
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val IleAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile
1835 1840 18451835 1840 1845
Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val SerArg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser
1850 1855 18601850 1855 1860
Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1865 1870 18751865 1870 1875
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro MetGly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met
1880 1885 18901880 1885 1890
Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val ArgGlu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg
1895 1900 19051895 1900 1905
Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser LeuVal Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu
1910 1915 19201910 1915 1920
Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu LysGly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys
1925 1930 19351925 1930 1935
Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysTyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
1940 1945 19501940 1945 1950
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu GlyTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly
1955 1960 19651955 1960 1965
Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe HisSer Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His
1970 1975 19801970 1975 1980
Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg ProArg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro
1985 1990 19951985 1990 1995
Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp AspPhe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp
2000 2005 20102000 2005 2010
Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr LeuGln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu
2015 2020 20252015 2020 2025
Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val TrpGln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp
2030 2035 20402030 2035 2040
Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr ProSer Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro
2045 2050 20552045 2050 2055
Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysLys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
2060 2065 20702060 2065 2070
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu LeuLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu
2075 2080 20852075 2080 2085
Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu ProPro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro
2090 2095 21002090 2095 2100
Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser GlyLeu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly
2105 2110 21152105 2110 2115
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu GluAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
2120 2125 21302120 2125 2130
Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu LysAsn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
2135 2140 21452135 2140 2145
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu IleGln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile
2150 2155 21602150 2155 2160
Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val AspLys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp
2165 2170 21752165 2170 2175
Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro TyrAsn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr
2180 2185 21902180 2185 2190
Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly ProGlu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro
2195 2200 22052195 2200 2205
Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr GlyLeu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly
2210 2215 22202210 2215 2220
Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe PheSer Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe
2225 2230 22352225 2230 2235
Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr ThrLys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr
2240 2245 22502240 2245 2250
Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser LeuTyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu
2255 2260 22652255 2260 2265
Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val AsnGln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn
2270 2275 22802270 2275 2280
Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly TrpPhe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp
2285 2290 22952285 2290 2295
Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu GluGlu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu
2300 2305 23102300 2305 2310
Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His LeuGly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu
2315 2320 23252315 2320 2325
Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala LysIle Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys
2330 2335 23402330 2335 2340
Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu GluAsn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu
2345 2350 23552345 2350 2355
Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His GluArg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu
2360 2365 23702360 2365 2370
Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly HisVal Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His
2375 2380 23852375 2380 2385
Lys Leu AsnLys Leu Asn
23902390
<210> 13<210> 13
<211> 2369<211> 2369
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 13<400> 13
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro ProLeu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro
65 70 75 8065 70 75 80
Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu GlyPro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 9585 90 95
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr GluThr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
100 105 110100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr SerPro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro GlyThr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140130 135 140
Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly LeuThr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu
145 150 155 160145 150 155 160
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
165 170 175165 170 175
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
180 185 190180 185 190
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
195 200 205195 200 205
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
210 215 220210 215 220
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
225 230 235 240225 230 235 240
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
245 250 255245 250 255
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
260 265 270260 265 270
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
275 280 285275 280 285
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
290 295 300290 295 300
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
305 310 315 320305 310 315 320
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
325 330 335325 330 335
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
340 345 350340 345 350
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
355 360 365355 360 365
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
370 375 380370 375 380
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
385 390 395 400385 390 395 400
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
405 410 415405 410 415
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
420 425 430420 425 430
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
435 440 445435 440 445
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
450 455 460450 455 460
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
465 470 475 480465 470 475 480
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
485 490 495485 490 495
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
500 505 510500 505 510
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
515 520 525515 520 525
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
530 535 540530 535 540
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
545 550 555 560545 550 555 560
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
565 570 575565 570 575
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
580 585 590580 585 590
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
595 600 605595 600 605
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
610 615 620610 615 620
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
625 630 635 640625 630 635 640
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
645 650 655645 650 655
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
660 665 670660 665 670
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
675 680 685675 680 685
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
690 695 700690 695 700
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
705 710 715 720705 710 715 720
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
725 730 735725 730 735
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
740 745 750740 745 750
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
755 760 765755 760 765
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
770 775 780770 775 780
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
785 790 795 800785 790 795 800
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
805 810 815805 810 815
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
820 825 830820 825 830
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
835 840 845835 840 845
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
850 855 860850 855 860
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
865 870 875 880865 870 875 880
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
885 890 895885 890 895
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
900 905 910900 905 910
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
915 920 925915 920 925
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
930 935 940930 935 940
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
945 950 955 960945 950 955 960
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
965 970 975965 970 975
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
980 985 990980 985 990
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
995 1000 1005995 1000 1005
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro SerThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1010 1015 10201010 1015 1020
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu LeuGlu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1025 1030 10351025 1030 1035
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr LysAsn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1040 1045 10501040 1045 1050
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe IleAla Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1055 1060 10651055 1060 1065
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val AlaLys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1070 1075 10801070 1075 1080
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn AspGln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1085 1090 10951085 1090 1095
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys LeuLys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1100 1105 11101100 1105 1110
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg GluVal Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1115 1120 11251115 1120 1125
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala ValIle Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1130 1135 11401130 1135 1140
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser GluVal Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1145 1150 11551145 1150 1155
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met IlePhe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1160 1165 11701160 1165 1170
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr PheAla Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1175 1180 11851175 1180 1185
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr LeuPhe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1190 1195 12001190 1195 1200
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn GlyAla Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1205 1210 12151205 1210 1215
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala ThrGlu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1220 1225 12301220 1225 1230
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys LysVal Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1235 1240 12451235 1240 1245
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu ProThr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1250 1255 12601250 1255 1260
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp AspLys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1265 1270 12751265 1270 1275
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr SerPro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1280 1285 12901280 1285 1290
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys LeuVal Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1295 1300 13051295 1300 1305
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg SerLys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1310 1315 13201310 1315 1320
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly TyrSer Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1325 1330 13351325 1330 1335
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr SerLys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1340 1345 13501340 1345 1350
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser AlaLeu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1355 1360 13651355 1360 1365
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys TyrGly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1370 1375 13801370 1375 1380
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys GlyVal Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1385 1390 13951385 1390 1395
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln HisSer Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1400 1405 14101400 1405 1410
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe SerLys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1415 1420 14251415 1420 1425
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu SerLys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1430 1435 14401430 1435 1440
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala GluAla Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1445 1450 14551445 1450 1455
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro AlaAsn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1460 1465 14701460 1465 1470
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr ThrAla Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1475 1480 14851475 1480 1485
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser IleSer Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1490 1495 15001490 1495 1500
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly GlyThr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1505 1510 15151505 1510 1515
Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala SerAsp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1520 1525 15301520 1525 1530
Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser Gly SerGly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser Gly Ser
1535 1540 15451535 1540 1545
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn HisGlu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn His
1550 1555 15601550 1555 1560
Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro AlaAsp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala
1565 1570 15751565 1570 1575
Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleGlu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
1580 1585 15901580 1585 1590
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val AspAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp
1595 1600 16051595 1600 1605
Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val GlyArg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly
1610 1615 16201610 1615 1620
Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val ArgMet Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg
1625 1630 16351625 1630 1635
Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp LeuSer Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu
1640 1645 16501640 1645 1650
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn ProVal Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro
1655 1660 16651655 1660 1665
Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe GluAla Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu
1670 1675 16801670 1675 1680
Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp AspPhe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp
1685 1690 16951685 1690 1695
Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly ValArg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val
1700 1705 17101700 1705 1710
Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro ValSer Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val
1715 1720 17251715 1720 1725
Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg TyrMet Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
1730 1735 17401730 1735 1740
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser ThrPhe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
1745 1750 17551745 1750 1755
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly ArgVal Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg
1760 1765 17701760 1765 1770
Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser AsnIle Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
1775 1780 17851775 1780 1785
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met AsnSer Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn
1790 1795 18001790 1795 1800
Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val PheGlu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe
1805 1810 18151805 1810 1815
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuGly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
1820 1825 18301820 1825 1830
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val IleAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile
1835 1840 18451835 1840 1845
Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val SerArg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser
1850 1855 18601850 1855 1860
Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1865 1870 18751865 1870 1875
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro MetGly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met
1880 1885 18901880 1885 1890
Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val ArgGlu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg
1895 1900 19051895 1900 1905
Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser LeuVal Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu
1910 1915 19201910 1915 1920
Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu LysGly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys
1925 1930 19351925 1930 1935
Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysTyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
1940 1945 19501940 1945 1950
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu GlyTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly
1955 1960 19651955 1960 1965
Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe HisSer Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His
1970 1975 19801970 1975 1980
Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg ProArg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro
1985 1990 19951985 1990 1995
Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp AspPhe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp
2000 2005 20102000 2005 2010
Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr LeuGln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu
2015 2020 20252015 2020 2025
Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val TrpGln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp
2030 2035 20402030 2035 2040
Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr ProSer Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro
2045 2050 20552045 2050 2055
Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysLys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
2060 2065 20702060 2065 2070
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu LeuLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu
2075 2080 20852075 2080 2085
Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu ProPro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro
2090 2095 21002090 2095 2100
Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser GlyLeu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly
2105 2110 21152105 2110 2115
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu GluAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
2120 2125 21302120 2125 2130
Asn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met LysAsn Pro Gly Pro Ser Glu Leu Ile Lys Glu Asn Met His Met Lys
2135 2140 21452135 2140 2145
Leu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys ThrLeu Tyr Met Glu Gly Thr Val Asp Asn His His Phe Lys Cys Thr
2150 2155 21602150 2155 2160
Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met ArgSer Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr Gln Thr Met Arg
2165 2170 21752165 2170 2175
Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp IleIle Lys Val Val Glu Gly Gly Pro Leu Pro Phe Ala Phe Asp Ile
2180 2185 21902180 2185 2190
Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn HisLeu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr Phe Ile Asn His
2195 2200 22052195 2200 2205
Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu GlyThr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser Phe Pro Glu Gly
2210 2215 22202210 2215 2220
Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val LeuPhe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp Gly Gly Val Leu
2225 2230 22352225 2230 2235
Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile TyrThr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly Cys Leu Ile Tyr
2240 2245 22502240 2245 2250
Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro ValAsn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn Gly Pro Val
2255 2260 22652255 2260 2265
Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr LeuMet Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu Thr Leu
2270 2275 22802270 2275 2280
Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala LeuTyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala Leu
2285 2290 22952285 2290 2295
Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr ThrLys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr
2300 2305 23102300 2305 2310
Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly ValTyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val
2315 2320 23252315 2320 2325
Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn AsnTyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn
2330 2335 23402330 2335 2340
Glu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr CysGlu Thr Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys
2345 2350 23552345 2350 2355
Asp Leu Pro Ser Lys Leu Gly His Lys Leu AsnAsp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
2360 23652360 2365
<210> 14<210> 14
<211> 2391<211> 2391
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 14<400> 14
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro ProLeu Glu Lys Gly Glu Glu Pro Gly Gly Pro Ser Ser Gly Ala Pro Pro
65 70 75 8065 70 75 80
Pro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu GlyPro Ser Gly Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly
85 90 9585 90 95
Thr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr GluThr Ser Glu Ser Ala Thr Pro Glu Ser Gly Pro Gly Thr Ser Thr Glu
100 105 110100 105 110
Pro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr SerPro Ser Glu Gly Ser Ala Pro Gly Ser Pro Ala Gly Ser Pro Thr Ser
115 120 125115 120 125
Thr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro GlyThr Glu Glu Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
130 135 140130 135 140
Thr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly LeuThr Ser Thr Glu Pro Ser Glu Met Asp Lys Lys Tyr Ser Ile Gly Leu
145 150 155 160145 150 155 160
Ala Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu TyrAla Ile Gly Thr Asn Ser Val Gly Trp Ala Val Ile Thr Asp Glu Tyr
165 170 175165 170 175
Lys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg HisLys Val Pro Ser Lys Lys Phe Lys Val Leu Gly Asn Thr Asp Arg His
180 185 190180 185 190
Ser Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly GluSer Ile Lys Lys Asn Leu Ile Gly Ala Leu Leu Phe Asp Ser Gly Glu
195 200 205195 200 205
Thr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr ThrThr Ala Glu Ala Thr Arg Leu Lys Arg Thr Ala Arg Arg Arg Tyr Thr
210 215 220210 215 220
Arg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn GluArg Arg Lys Asn Arg Ile Cys Tyr Leu Gln Glu Ile Phe Ser Asn Glu
225 230 235 240225 230 235 240
Met Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser PheMet Ala Lys Val Asp Asp Ser Phe Phe His Arg Leu Glu Glu Ser Phe
245 250 255245 250 255
Leu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly AsnLeu Val Glu Glu Asp Lys Lys His Glu Arg His Pro Ile Phe Gly Asn
260 265 270260 265 270
Ile Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr HisIle Val Asp Glu Val Ala Tyr His Glu Lys Tyr Pro Thr Ile Tyr His
275 280 285275 280 285
Leu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg LeuLeu Arg Lys Lys Leu Val Asp Ser Thr Asp Lys Ala Asp Leu Arg Leu
290 295 300290 295 300
Ile Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe LeuIle Tyr Leu Ala Leu Ala His Met Ile Lys Phe Arg Gly His Phe Leu
305 310 315 320305 310 315 320
Ile Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu PheIle Glu Gly Asp Leu Asn Pro Asp Asn Ser Asp Val Asp Lys Leu Phe
325 330 335325 330 335
Ile Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro IleIle Gln Leu Val Gln Thr Tyr Asn Gln Leu Phe Glu Glu Asn Pro Ile
340 345 350340 345 350
Asn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu SerAsn Ala Ser Gly Val Asp Ala Lys Ala Ile Leu Ser Ala Arg Leu Ser
355 360 365355 360 365
Lys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu LysLys Ser Arg Arg Leu Glu Asn Leu Ile Ala Gln Leu Pro Gly Glu Lys
370 375 380370 375 380
Lys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu ThrLys Asn Gly Leu Phe Gly Asn Leu Ile Ala Leu Ser Leu Gly Leu Thr
385 390 395 400385 390 395 400
Pro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu GlnPro Asn Phe Lys Ser Asn Phe Asp Leu Ala Glu Asp Ala Lys Leu Gln
405 410 415405 410 415
Leu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala GlnLeu Ser Lys Asp Thr Tyr Asp Asp Asp Leu Asp Asn Leu Leu Ala Gln
420 425 430420 425 430
Ile Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu SerIle Gly Asp Gln Tyr Ala Asp Leu Phe Leu Ala Ala Lys Asn Leu Ser
435 440 445435 440 445
Asp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile ThrAsp Ala Ile Leu Leu Ser Asp Ile Leu Arg Val Asn Thr Glu Ile Thr
450 455 460450 455 460
Lys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His HisLys Ala Pro Leu Ser Ala Ser Met Ile Lys Arg Tyr Asp Glu His His
465 470 475 480465 470 475 480
Gln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro GluGln Asp Leu Thr Leu Leu Lys Ala Leu Val Arg Gln Gln Leu Pro Glu
485 490 495485 490 495
Lys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala GlyLys Tyr Lys Glu Ile Phe Phe Asp Gln Ser Lys Asn Gly Tyr Ala Gly
500 505 510500 505 510
Tyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile LysTyr Ile Asp Gly Gly Ala Ser Gln Glu Glu Phe Tyr Lys Phe Ile Lys
515 520 525515 520 525
Pro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys LeuPro Ile Leu Glu Lys Met Asp Gly Thr Glu Glu Leu Leu Val Lys Leu
530 535 540530 535 540
Asn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly SerAsn Arg Glu Asp Leu Leu Arg Lys Gln Arg Thr Phe Asp Asn Gly Ser
545 550 555 560545 550 555 560
Ile Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg ArgIle Pro His Gln Ile His Leu Gly Glu Leu His Ala Ile Leu Arg Arg
565 570 575565 570 575
Gln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile GluGln Glu Asp Phe Tyr Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu
580 585 590580 585 590
Lys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala ArgLys Ile Leu Thr Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg
595 600 605595 600 605
Gly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr IleGly Asn Ser Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile
610 615 620610 615 620
Thr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala GlnThr Pro Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln
625 630 635 640625 630 635 640
Ser Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluSer Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
645 650 655645 650 655
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val TyrLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val Tyr
660 665 670660 665 670
Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys ProAsn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg Lys Pro
675 680 685675 680 685
Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu PheAla Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp Leu Leu Phe
690 695 700690 695 700
Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr PheLys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys Glu Asp Tyr Phe
705 710 715 720705 710 715 720
Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu AspLys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile Ser Gly Val Glu Asp
725 730 735725 730 735
Arg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile IleArg Phe Asn Ala Ser Leu Gly Thr Tyr His Asp Leu Leu Lys Ile Ile
740 745 750740 745 750
Lys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu GluLys Asp Lys Asp Phe Leu Asp Asn Glu Glu Asn Glu Asp Ile Leu Glu
755 760 765755 760 765
Asp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile GluAsp Ile Val Leu Thr Leu Thr Leu Phe Glu Asp Arg Glu Met Ile Glu
770 775 780770 775 780
Glu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met LysGlu Arg Leu Lys Thr Tyr Ala His Leu Phe Asp Asp Lys Val Met Lys
785 790 795 800785 790 795 800
Gln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg LysGln Leu Lys Arg Arg Arg Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys
805 810 815805 810 815
Leu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu AspLeu Ile Asn Gly Ile Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp
820 825 830820 825 830
Phe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu IlePhe Leu Lys Ser Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile
835 840 845835 840 845
His Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln ValHis Asp Asp Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val
850 855 860850 855 860
Ser Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala GlySer Gly Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly
865 870 875 880865 870 875 880
Ser Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspSer Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
885 890 895885 890 895
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val IleGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val Ile
900 905 910900 905 910
Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn SerGlu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys Asn Ser
915 920 925915 920 925
Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly SerArg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu Leu Gly Ser
930 935 940930 935 940
Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn GluGln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln Leu Gln Asn Glu
945 950 955 960945 950 955 960
Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val AspLys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg Asp Met Tyr Val Asp
965 970 975965 970 975
Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala IleGln Glu Leu Asp Ile Asn Arg Leu Ser Asp Tyr Asp Val Asp Ala Ile
980 985 990980 985 990
Val Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val LeuVal Pro Gln Ser Phe Leu Lys Asp Asp Ser Ile Asp Asn Lys Val Leu
995 1000 1005995 1000 1005
Thr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro SerThr Arg Ser Asp Lys Asn Arg Gly Lys Ser Asp Asn Val Pro Ser
1010 1015 10201010 1015 1020
Glu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu LeuGlu Glu Val Val Lys Lys Met Lys Asn Tyr Trp Arg Gln Leu Leu
1025 1030 10351025 1030 1035
Asn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr LysAsn Ala Lys Leu Ile Thr Gln Arg Lys Phe Asp Asn Leu Thr Lys
1040 1045 10501040 1045 1050
Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe IleAla Glu Arg Gly Gly Leu Ser Glu Leu Asp Lys Ala Gly Phe Ile
1055 1060 10651055 1060 1065
Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val AlaLys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr Lys His Val Ala
1070 1075 10801070 1075 1080
Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn AspGln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp Glu Asn Asp
1085 1090 10951085 1090 1095
Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys LeuLys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser Lys Leu
1100 1105 11101100 1105 1110
Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg GluVal Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg Glu
1115 1120 11251115 1120 1125
Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala ValIle Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
1130 1135 11401130 1135 1140
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser GluVal Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu
1145 1150 11551145 1150 1155
Phe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met IlePhe Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile
1160 1165 11701160 1165 1170
Ala Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr PheAla Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe
1175 1180 11851175 1180 1185
Phe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr LeuPhe Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu
1190 1195 12001190 1195 1200
Ala Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn GlyAla Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly
1205 1210 12151205 1210 1215
Glu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala ThrGlu Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr
1220 1225 12301220 1225 1230
Val Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys LysVal Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys
1235 1240 12451235 1240 1245
Thr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu ProThr Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro
1250 1255 12601250 1255 1260
Lys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp AspLys Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp
1265 1270 12751265 1270 1275
Pro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr SerPro Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser
1280 1285 12901280 1285 1290
Val Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys LeuVal Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu
1295 1300 13051295 1300 1305
Lys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg SerLys Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser
1310 1315 13201310 1315 1320
Ser Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly TyrSer Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr
1325 1330 13351325 1330 1335
Lys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr SerLys Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser
1340 1345 13501340 1345 1350
Leu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser AlaLeu Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala
1355 1360 13651355 1360 1365
Gly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys TyrGly Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr
1370 1375 13801370 1375 1380
Val Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys GlyVal Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly
1385 1390 13951385 1390 1395
Ser Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln HisSer Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His
1400 1405 14101400 1405 1410
Lys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe SerLys His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser
1415 1420 14251415 1420 1425
Lys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu SerLys Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser
1430 1435 14401430 1435 1440
Ala Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala GluAla Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu
1445 1450 14551445 1450 1455
Asn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro AlaAsn Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala
1460 1465 14701460 1465 1470
Ala Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr ThrAla Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr
1475 1480 14851475 1480 1485
Ser Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser IleSer Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile
1490 1495 15001490 1495 1500
Thr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly GlyThr Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly
1505 1510 15151505 1510 1515
Asp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala SerAsp Ser Arg Ala Asp Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser
1520 1525 15301520 1525 1530
Gly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser Gly SerGly Ser Pro Lys Lys Lys Arg Lys Val Ser Pro Gly Ser Gly Ser
1535 1540 15451535 1540 1545
Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn HisGlu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser Asn His
1550 1555 15601550 1555 1560
Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro AlaAsp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro Ala
1565 1570 15751565 1570 1575
Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleGlu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
1580 1585 15901580 1585 1590
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val AspAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp
1595 1600 16051595 1600 1605
Arg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val GlyArg Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly
1610 1615 16201610 1615 1620
Met Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val ArgMet Val Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg
1625 1630 16351625 1630 1635
Ser Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp LeuSer Val Thr Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu
1640 1645 16501640 1645 1650
Val Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn ProVal Ile Gly Gly Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro
1655 1660 16651655 1660 1665
Ala Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe GluAla Arg Lys Gly Leu Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu
1670 1675 16801670 1675 1680
Phe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp AspPhe Tyr Arg Leu Leu His Asp Ala Arg Pro Lys Glu Gly Asp Asp
1685 1690 16951685 1690 1695
Arg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly ValArg Pro Phe Phe Trp Leu Phe Glu Asn Val Val Ala Met Gly Val
1700 1705 17101700 1705 1710
Ser Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro ValSer Asp Lys Arg Asp Ile Ser Arg Phe Leu Glu Ser Asn Pro Val
1715 1720 17251715 1720 1725
Met Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg TyrMet Ile Asp Ala Lys Glu Val Ser Ala Ala His Arg Ala Arg Tyr
1730 1735 17401730 1735 1740
Phe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser ThrPhe Trp Gly Asn Leu Pro Gly Met Asn Arg Pro Leu Ala Ser Thr
1745 1750 17551745 1750 1755
Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly ArgVal Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu Glu His Gly Arg
1760 1765 17701760 1765 1770
Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser AsnIle Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr Arg Ser Asn
1775 1780 17851775 1780 1785
Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met AsnSer Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe Met Asn
1790 1795 18001790 1795 1800
Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val PheGlu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val Phe
1805 1810 18151805 1810 1815
Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuGly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
1820 1825 18301820 1825 1830
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val IleAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile
1835 1840 18451835 1840 1845
Arg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val SerArg His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser
1850 1855 18601850 1855 1860
Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1865 1870 18751865 1870 1875
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro MetGly Leu Val Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met
1880 1885 18901880 1885 1890
Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val ArgGlu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg
1895 1900 19051895 1900 1905
Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser LeuVal Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys Ser Leu
1910 1915 19201910 1915 1920
Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu LysGly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu Lys
1925 1930 19351925 1930 1935
Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysTyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
1940 1945 19501940 1945 1950
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu GlyTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly
1955 1960 19651955 1960 1965
Ser Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe HisSer Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His
1970 1975 19801970 1975 1980
Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg ProArg Ile Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro
1985 1990 19951985 1990 1995
Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp AspPhe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp
2000 2005 20102000 2005 2010
Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr LeuGln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu
2015 2020 20252015 2020 2025
Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val TrpGln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg Val Trp
2030 2035 20402030 2035 2040
Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr ProSer Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr Pro
2045 2050 20552045 2050 2055
Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysLys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
2060 2065 20702060 2065 2070
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu LeuLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu
2075 2080 20852075 2080 2085
Pro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu ProPro Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro
2090 2095 21002090 2095 2100
Leu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser GlyLeu Ser Arg Ala Asp Pro Lys Lys Lys Arg Lys Val Gly Ser Gly
2105 2110 21152105 2110 2115
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu GluAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu
2120 2125 21302120 2125 2130
Asn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu LysAsn Pro Gly Pro Gly Ser Gly Ala Thr Asn Phe Ser Leu Leu Lys
2135 2140 21452135 2140 2145
Gln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu IleGln Ala Gly Asp Val Glu Glu Asn Pro Gly Pro Ser Glu Leu Ile
2150 2155 21602150 2155 2160
Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val AspLys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp
2165 2170 21752165 2170 2175
Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro TyrAsn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr
2180 2185 21902180 2185 2190
Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly ProGlu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro
2195 2200 22052195 2200 2205
Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr GlyLeu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly
2210 2215 22202210 2215 2220
Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe PheSer Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe
2225 2230 22352225 2230 2235
Lys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr ThrLys Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr
2240 2245 22502240 2245 2250
Tyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser LeuTyr Glu Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu
2255 2260 22652255 2260 2265
Gln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val AsnGln Asp Gly Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn
2270 2275 22802270 2275 2280
Phe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly TrpPhe Thr Ser Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp
2285 2290 22952285 2290 2295
Glu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu GluGlu Ala Phe Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu
2300 2305 23102300 2305 2310
Gly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His LeuGly Arg Asn Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu
2315 2320 23252315 2320 2325
Ile Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala LysIle Ala Asn Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys
2330 2335 23402330 2335 2340
Asn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu GluAsn Leu Lys Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu
2345 2350 23552345 2350 2355
Arg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His GluArg Ile Lys Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu
2360 2365 23702360 2365 2370
Val Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly HisVal Ala Val Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His
2375 2380 23852375 2380 2385
Lys Leu AsnLys Leu Asn
23902390
<210> 15<210> 15
<211> 2345<211> 2345
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 15<400> 15
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val ProAsn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro
1. 5 10 151. 5 10 15
Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleAla Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
20 25 3020 25 30
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp ArgAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg
35 40 4535 40 45
Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met ValTyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
50 55 6050 55 60
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val ThrArg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr
65 70 75 8065 70 75 80
Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly GlyGln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly
85 90 9585 90 95
Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly LeuSer Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu
100 105 110100 105 110
Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu HisTyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
115 120 125115 120 125
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu PheAsp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe
130 135 140130 135 140
Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser ArgGlu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg
145 150 155 160145 150 155 160
Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser AlaPhe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
165 170 175165 170 175
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn ArgAla His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg
180 185 190180 185 190
Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys LeuPro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu
195 200 205195 200 205
Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr ThrGlu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
210 215 220210 215 220
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val PheArg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
225 230 235 240225 230 235 240
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg ValMet Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val
245 250 255245 250 255
Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuPhe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
260 265 270260 265 270
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile ArgAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg
275 280 285275 280 285
His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser GlyHis Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
290 295 300290 295 300
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu ValAsn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val
305 310 315 320305 310 315 320
Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr LysPro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys
325 330 335325 330 335
Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu PheThr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe
340 345 350340 345 350
Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser GlyArg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly
355 360 365355 360 365
Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr AsnSer Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn
370 375 380370 375 380
Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val TyrVal Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr
385 390 395 400385 390 395 400
Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly TrpGly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp
405 410 415405 410 415
Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg GlnTyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln
420 425 430420 425 430
Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu LeuGlu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu
435 440 445435 440 445
Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu AlaThr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala
450 455 460450 455 460
Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met ArgVal Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg
465 470 475 480465 470 475 480
Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu ThrVal Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr
485 490 495485 490 495
Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysPro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
500 505 510500 505 510
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu ProLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro
515 520 525515 520 525
Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu GlyLeu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu Gly
530 535 540530 535 540
Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala GlyGly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala Gly
545 550 555 560545 550 555 560
Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro GluSer Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro Glu
565 570 575565 570 575
Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro GlySer Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro Gly
580 585 590580 585 590
Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr GluSer Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr Glu
595 600 605595 600 605
Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu MetPro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu Met
610 615 620610 615 620
Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val GlyAsp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val Gly
625 630 635 640625 630 635 640
Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe LysTrp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe Lys
645 650 655645 650 655
Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile GlyVal Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile Gly
660 665 670660 665 670
Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu LysAla Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu Lys
675 680 685675 680 685
Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys TyrArg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys Tyr
690 695 700690 695 700
Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser PheLeu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser Phe
705 710 715 720705 710 715 720
Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys HisPhe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys His
725 730 735725 730 735
Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr HisGlu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr His
740 745 750740 745 750
Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp SerGlu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp Ser
755 760 765755 760 765
Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His MetThr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His Met
770 775 780770 775 780
Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro AspIle Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro Asp
785 790 795 800785 790 795 800
Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr AsnAsn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr Asn
805 810 815805 810 815
Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala LysGln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala Lys
820 825 830820 825 830
Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn LeuAla Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn Leu
835 840 845835 840 845
Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn LeuIle Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn Leu
850 855 860850 855 860
Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe AspIle Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe Asp
865 870 875 880865 870 875 880
Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp AspLeu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp Asp
885 890 895885 890 895
Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp LeuAsp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp Leu
900 905 910900 905 910
Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp IlePhe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp Ile
915 920 925915 920 925
Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser MetLeu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser Met
930 935 940930 935 940
Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys AlaIle Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys Ala
945 950 955 960945 950 955 960
Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe AspLeu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe Asp
965 970 975965 970 975
Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser GlnGln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser Gln
980 985 990980 985 990
Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp GlyGlu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp Gly
995 1000 1005995 1000 1005
Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu ArgThr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
1010 1015 10201010 1015 1020
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile HisLys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His
1025 1030 10351025 1030 1035
Leu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe TyrLeu Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr
1040 1045 10501040 1045 1050
Pro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu ThrPro Phe Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr
1055 1060 10651055 1060 1065
Phe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn SerPhe Arg Ile Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser
1070 1075 10801070 1075 1080
Arg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr ProArg Phe Ala Trp Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro
1085 1090 10951085 1090 1095
Trp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln SerTrp Asn Phe Glu Glu Val Val Asp Lys Gly Ala Ser Ala Gln Ser
1100 1105 11101100 1105 1110
Phe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn GluPhe Ile Glu Arg Met Thr Asn Phe Asp Lys Asn Leu Pro Asn Glu
1115 1120 11251115 1120 1125
Lys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr ValLys Val Leu Pro Lys His Ser Leu Leu Tyr Glu Tyr Phe Thr Val
1130 1135 11401130 1135 1140
Tyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met ArgTyr Asn Glu Leu Thr Lys Val Lys Tyr Val Thr Glu Gly Met Arg
1145 1150 11551145 1150 1155
Lys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val AspLys Pro Ala Phe Leu Ser Gly Glu Gln Lys Lys Ala Ile Val Asp
1160 1165 11701160 1165 1170
Leu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu LysLeu Leu Phe Lys Thr Asn Arg Lys Val Thr Val Lys Gln Leu Lys
1175 1180 11851175 1180 1185
Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu IleGlu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp Ser Val Glu Ile
1190 1195 12001190 1195 1200
Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr HisSer Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly Thr Tyr His
1205 1210 12151205 1210 1215
Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn GluAsp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp Asn Glu
1220 1225 12301220 1225 1230
Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr LeuGlu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr Leu
1235 1240 12451235 1240 1245
Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr AlaPhe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
1250 1255 12601250 1255 1260
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg ArgHis Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg
1265 1270 12751265 1270 1275
Tyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly IleTyr Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile
1280 1285 12901280 1285 1290
Arg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys SerArg Asp Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser
1295 1300 13051295 1300 1305
Asp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp AspAsp Gly Phe Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp
1310 1315 13201310 1315 1320
Ser Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser GlySer Leu Thr Phe Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly
1325 1330 13351325 1330 1335
Gln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly SerGln Gly Asp Ser Leu His Glu His Ile Ala Asn Leu Ala Gly Ser
1340 1345 13501340 1345 1350
Pro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val AspPro Ala Ile Lys Lys Gly Ile Leu Gln Thr Val Lys Val Val Asp
1355 1360 13651355 1360 1365
Glu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile ValGlu Leu Val Lys Val Met Gly Arg His Lys Pro Glu Asn Ile Val
1370 1375 13801370 1375 1380
Ile Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln LysIle Glu Met Ala Arg Glu Asn Gln Thr Thr Gln Lys Gly Gln Lys
1385 1390 13951385 1390 1395
Asn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys GluAsn Ser Arg Glu Arg Met Lys Arg Ile Glu Glu Gly Ile Lys Glu
1400 1405 14101400 1405 1410
Leu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr GlnLeu Gly Ser Gln Ile Leu Lys Glu His Pro Val Glu Asn Thr Gln
1415 1420 14251415 1420 1425
Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly ArgLeu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu Gln Asn Gly Arg
1430 1435 14401430 1435 1440
Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser AspAsp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg Leu Ser Asp
1445 1450 14551445 1450 1455
Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp AspTyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys Asp Asp
1460 1465 14701460 1465 1470
Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg GlySer Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg Gly
1475 1480 14851475 1480 1485
Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met LysLys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
1490 1495 15001490 1495 1500
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln ArgAsn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg
1505 1510 15151505 1510 1515
Lys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser GluLys Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu
1520 1525 15301520 1525 1530
Leu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr ArgLeu Asp Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg
1535 1540 15451535 1540 1545
Gln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met AsnGln Ile Thr Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn
1550 1555 15601550 1555 1560
Thr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys ValThr Lys Tyr Asp Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val
1565 1570 15751565 1570 1575
Ile Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp PheIle Thr Leu Lys Ser Lys Leu Val Ser Asp Phe Arg Lys Asp Phe
1580 1585 15901580 1585 1590
Gln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala HisGln Phe Tyr Lys Val Arg Glu Ile Asn Asn Tyr His His Ala His
1595 1600 16051595 1600 1605
Asp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys LysAsp Ala Tyr Leu Asn Ala Val Val Gly Thr Ala Leu Ile Lys Lys
1610 1615 16201610 1615 1620
Tyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys ValTyr Pro Lys Leu Glu Ser Glu Phe Val Tyr Gly Asp Tyr Lys Val
1625 1630 16351625 1630 1635
Tyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile GlyTyr Asp Val Arg Lys Met Ile Ala Lys Ser Glu Gln Glu Ile Gly
1640 1645 16501640 1645 1650
Lys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn PheLys Ala Thr Ala Lys Tyr Phe Phe Tyr Ser Asn Ile Met Asn Phe
1655 1660 16651655 1660 1665
Phe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys ArgPhe Lys Thr Glu Ile Thr Leu Ala Asn Gly Glu Ile Arg Lys Arg
1670 1675 16801670 1675 1680
Pro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp AspPro Leu Ile Glu Thr Asn Gly Glu Thr Gly Glu Ile Val Trp Asp
1685 1690 16951685 1690 1695
Lys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met ProLys Gly Arg Asp Phe Ala Thr Val Arg Lys Val Leu Ser Met Pro
1700 1705 17101700 1705 1710
Gln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly PheGln Val Asn Ile Val Lys Lys Thr Glu Val Gln Thr Gly Gly Phe
1715 1720 17251715 1720 1725
Ser Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu IleSer Lys Glu Ser Ile Leu Pro Lys Arg Asn Ser Asp Lys Leu Ile
1730 1735 17401730 1735 1740
Ala Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe AspAla Arg Lys Lys Asp Trp Asp Pro Lys Lys Tyr Gly Gly Phe Asp
1745 1750 17551745 1750 1755
Ser Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val GluSer Pro Thr Val Ala Tyr Ser Val Leu Val Val Ala Lys Val Glu
1760 1765 17701760 1765 1770
Lys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu GlyLys Gly Lys Ser Lys Lys Leu Lys Ser Val Lys Glu Leu Leu Gly
1775 1780 17851775 1780 1785
Ile Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile AspIle Thr Ile Met Glu Arg Ser Ser Phe Glu Lys Asn Pro Ile Asp
1790 1795 18001790 1795 1800
Phe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu IlePhe Leu Glu Ala Lys Gly Tyr Lys Glu Val Lys Lys Asp Leu Ile
1805 1810 18151805 1810 1815
Ile Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly ArgIle Lys Leu Pro Lys Tyr Ser Leu Phe Glu Leu Glu Asn Gly Arg
1820 1825 18301820 1825 1830
Lys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn GluLys Arg Met Leu Ala Ser Ala Gly Glu Leu Gln Lys Gly Asn Glu
1835 1840 18451835 1840 1845
Leu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala SerLeu Ala Leu Pro Ser Lys Tyr Val Asn Phe Leu Tyr Leu Ala Ser
1850 1855 18601850 1855 1860
His Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln LysHis Tyr Glu Lys Leu Lys Gly Ser Pro Glu Asp Asn Glu Gln Lys
1865 1870 18751865 1870 1875
Gln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile IleGln Leu Phe Val Glu Gln His Lys His Tyr Leu Asp Glu Ile Ile
1880 1885 18901880 1885 1890
Glu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp AlaGlu Gln Ile Ser Glu Phe Ser Lys Arg Val Ile Leu Ala Asp Ala
1895 1900 19051895 1900 1905
Asn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp LysAsn Leu Asp Lys Val Leu Ser Ala Tyr Asn Lys His Arg Asp Lys
1910 1915 19201910 1915 1920
Pro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr LeuPro Ile Arg Glu Gln Ala Glu Asn Ile Ile His Leu Phe Thr Leu
1925 1930 19351925 1930 1935
Thr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr ThrThr Asn Leu Gly Ala Pro Ala Ala Phe Lys Tyr Phe Asp Thr Thr
1940 1945 19501940 1945 1950
Ile Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp AlaIle Asp Arg Lys Arg Tyr Thr Ser Thr Lys Glu Val Leu Asp Ala
1955 1960 19651955 1960 1965
Thr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg IleThr Leu Ile His Gln Ser Ile Thr Gly Leu Tyr Glu Thr Arg Ile
1970 1975 19801970 1975 1980
Asp Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr Asp Val ProAsp Leu Ser Gln Leu Gly Gly Asp Ala Tyr Pro Tyr Asp Val Pro
1985 1990 19951985 1990 1995
Asp Tyr Ala Ser Leu Gly Ser Gly Ser Pro Lys Lys Lys Arg LysAsp Tyr Ala Ser Leu Gly Ser Gly Ser Pro Lys Lys Lys Arg Lys
2000 2005 20102000 2005 2010
Val Glu Asp Pro Lys Lys Lys Arg Lys Val Asp Gly Ile Gly SerVal Glu Asp Pro Lys Lys Lys Arg Lys Val Asp Gly Ile Gly Ser
2015 2020 20252015 2020 2025
Gly Ser Asn Gly Ser Ser Gly Ser Ser Glu Leu Ile Lys Glu AsnGly Ser Asn Gly Ser Ser Gly Ser Ser Glu Leu Ile Lys Glu Asn
2030 2035 20402030 2035 2040
Met His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His HisMet His Met Lys Leu Tyr Met Glu Gly Thr Val Asp Asn His His
2045 2050 20552045 2050 2055
Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly ThrPhe Lys Cys Thr Ser Glu Gly Glu Gly Lys Pro Tyr Glu Gly Thr
2060 2065 20702060 2065 2070
Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro PheGln Thr Met Arg Ile Lys Val Val Glu Gly Gly Pro Leu Pro Phe
2075 2080 20852075 2080 2085
Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys ThrAla Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly Ser Lys Thr
2090 2095 21002090 2095 2100
Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln SerPhe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys Gln Ser
2105 2110 21152105 2110 2115
Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu AspPhe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu Asp
2120 2125 21302120 2125 2130
Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp GlyGly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly
2135 2140 21452135 2140 2145
Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr SerCys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser
2150 2155 21602150 2155 2160
Asn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala PheAsn Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe
2165 2170 21752165 2170 2175
Thr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg AsnThr Glu Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn
2180 2185 21902180 2185 2190
Asp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala AsnAsp Met Ala Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn
2195 2200 22052195 2200 2205
Ile Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu LysIle Lys Thr Thr Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys
2210 2215 22202210 2215 2220
Met Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile LysMet Pro Gly Val Tyr Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys
2225 2230 22352225 2230 2235
Glu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala ValGlu Ala Asn Asn Glu Thr Tyr Val Glu Gln His Glu Val Ala Val
2240 2245 22502240 2245 2250
Ala Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu AsnAla Arg Tyr Cys Asp Leu Pro Ser Lys Leu Gly His Lys Leu Asn
2255 2260 22652255 2260 2265
Gly Gly Gly Gly Gly Met Asp Ala Lys Ser Leu Thr Ala Trp SerGly Gly Gly Gly Gly Met Asp Ala Lys Ser Leu Thr Ala Trp Ser
2270 2275 22802270 2275 2280
Arg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr ArgArg Thr Leu Val Thr Phe Lys Asp Val Phe Val Asp Phe Thr Arg
2285 2290 22952285 2290 2295
Glu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr ArgGlu Glu Trp Lys Leu Leu Asp Thr Ala Gln Gln Ile Val Tyr Arg
2300 2305 23102300 2305 2310
Asn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly TyrAsn Val Met Leu Glu Asn Tyr Lys Asn Leu Val Ser Leu Gly Tyr
2315 2320 23252315 2320 2325
Gln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly GluGln Leu Thr Lys Pro Asp Val Ile Leu Arg Leu Glu Lys Gly Glu
2330 2335 23402330 2335 2340
Glu ProGlu Pro
23452345
<210> 16<210> 16
<211> 71<211> 71
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 16<400> 16
Asp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe LysAsp Ala Lys Ser Leu Thr Ala Trp Ser Arg Thr Leu Val Thr Phe Lys
1. 5 10 151. 5 10 15
Asp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp ThrAsp Val Phe Val Asp Phe Thr Arg Glu Glu Trp Lys Leu Leu Asp Thr
20 25 3020 25 30
Ala Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys AsnAla Gln Gln Ile Val Tyr Arg Asn Val Met Leu Glu Asn Tyr Lys Asn
35 40 4535 40 45
Leu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu ArgLeu Val Ser Leu Gly Tyr Gln Leu Thr Lys Pro Asp Val Ile Leu Arg
50 55 6050 55 60
Leu Glu Lys Gly Glu Glu ProLeu Glu Lys Gly Glu Glu Pro
65 7065 70
<210> 17<210> 17
<211> 7<211> 7
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 17<400> 17
Gly Gly Ser Gly Gly Gly SerGly Gly Ser Gly Gly Gly Ser
1. 515
<210> 18<210> 18
<211> 3<211> 3
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 18<400> 18
Ser Gly SerSer Gly Ser
11
<210> 19<210> 19
<211> 17<211> 17
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 19<400> 19
Glu Ala Ser Gly Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser ThrGlu Ala Ser Gly Ser Gly Arg Ala Ser Pro Gly Ile Pro Gly Ser Thr
1. 5 10 151. 5 10 15
ArgArg
<210> 20<210> 20
<211> 4<211> 4
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 20<400> 20
Ser Arg Ala AspSer Arg Ala Asp
11
<210> 21<210> 21
<211> 3<211> 3
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 21<400> 21
Gly Ser GlyGly Ser Gly
11
<210> 22<210> 22
<211> 3<211> 3
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 22<400> 22
Ser Pro GlySer Pro Gly
11
<210> 23<210> 23
<211> 1368<211> 1368
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 23<400> 23
Met Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser ValMet Asp Lys Lys Tyr Ser Ile Gly Leu Ala Ile Gly Thr Asn Ser Val
1. 5 10 151. 5 10 15
Gly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys PheGly Trp Ala Val Ile Thr Asp Glu Tyr Lys Val Pro Ser Lys Lys Phe
20 25 3020 25 30
Lys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu IleLys Val Leu Gly Asn Thr Asp Arg His Ser Ile Lys Lys Asn Leu Ile
35 40 4535 40 45
Gly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg LeuGly Ala Leu Leu Phe Asp Ser Gly Glu Thr Ala Glu Ala Thr Arg Leu
50 55 6050 55 60
Lys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile CysLys Arg Thr Ala Arg Arg Arg Tyr Thr Arg Arg Lys Asn Arg Ile Cys
65 70 75 8065 70 75 80
Tyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp SerTyr Leu Gln Glu Ile Phe Ser Asn Glu Met Ala Lys Val Asp Asp Ser
85 90 9585 90 95
Phe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys LysPhe Phe His Arg Leu Glu Glu Ser Phe Leu Val Glu Glu Asp Lys Lys
100 105 110100 105 110
His Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala TyrHis Glu Arg His Pro Ile Phe Gly Asn Ile Val Asp Glu Val Ala Tyr
115 120 125115 120 125
His Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val AspHis Glu Lys Tyr Pro Thr Ile Tyr His Leu Arg Lys Lys Leu Val Asp
130 135 140130 135 140
Ser Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala HisSer Thr Asp Lys Ala Asp Leu Arg Leu Ile Tyr Leu Ala Leu Ala His
145 150 155 160145 150 155 160
Met Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn ProMet Ile Lys Phe Arg Gly His Phe Leu Ile Glu Gly Asp Leu Asn Pro
165 170 175165 170 175
Asp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr TyrAsp Asn Ser Asp Val Asp Lys Leu Phe Ile Gln Leu Val Gln Thr Tyr
180 185 190180 185 190
Asn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp AlaAsn Gln Leu Phe Glu Glu Asn Pro Ile Asn Ala Ser Gly Val Asp Ala
195 200 205195 200 205
Lys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu AsnLys Ala Ile Leu Ser Ala Arg Leu Ser Lys Ser Arg Arg Leu Glu Asn
210 215 220210 215 220
Leu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly AsnLeu Ile Ala Gln Leu Pro Gly Glu Lys Lys Asn Gly Leu Phe Gly Asn
225 230 235 240225 230 235 240
Leu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn PheLeu Ile Ala Leu Ser Leu Gly Leu Thr Pro Asn Phe Lys Ser Asn Phe
245 250 255245 250 255
Asp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr AspAsp Leu Ala Glu Asp Ala Lys Leu Gln Leu Ser Lys Asp Thr Tyr Asp
260 265 270260 265 270
Asp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala AspAsp Asp Leu Asp Asn Leu Leu Ala Gln Ile Gly Asp Gln Tyr Ala Asp
275 280 285275 280 285
Leu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser AspLeu Phe Leu Ala Ala Lys Asn Leu Ser Asp Ala Ile Leu Leu Ser Asp
290 295 300290 295 300
Ile Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala SerIle Leu Arg Val Asn Thr Glu Ile Thr Lys Ala Pro Leu Ser Ala Ser
305 310 315 320305 310 315 320
Met Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu LysMet Ile Lys Arg Tyr Asp Glu His His Gln Asp Leu Thr Leu Leu Lys
325 330 335325 330 335
Ala Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe PheAla Leu Val Arg Gln Gln Leu Pro Glu Lys Tyr Lys Glu Ile Phe Phe
340 345 350340 345 350
Asp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala SerAsp Gln Ser Lys Asn Gly Tyr Ala Gly Tyr Ile Asp Gly Gly Ala Ser
355 360 365355 360 365
Gln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met AspGln Glu Glu Phe Tyr Lys Phe Ile Lys Pro Ile Leu Glu Lys Met Asp
370 375 380370 375 380
Gly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu ArgGly Thr Glu Glu Leu Leu Val Lys Leu Asn Arg Glu Asp Leu Leu Arg
385 390 395 400385 390 395 400
Lys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His LeuLys Gln Arg Thr Phe Asp Asn Gly Ser Ile Pro His Gln Ile His Leu
405 410 415405 410 415
Gly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro PheGly Glu Leu His Ala Ile Leu Arg Arg Gln Glu Asp Phe Tyr Pro Phe
420 425 430420 425 430
Leu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg IleLeu Lys Asp Asn Arg Glu Lys Ile Glu Lys Ile Leu Thr Phe Arg Ile
435 440 445435 440 445
Pro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala TrpPro Tyr Tyr Val Gly Pro Leu Ala Arg Gly Asn Ser Arg Phe Ala Trp
450 455 460450 455 460
Met Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu GluMet Thr Arg Lys Ser Glu Glu Thr Ile Thr Pro Trp Asn Phe Glu Glu
465 470 475 480465 470 475 480
Val Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met ThrVal Val Asp Lys Gly Ala Ser Ala Gln Ser Phe Ile Glu Arg Met Thr
485 490 495485 490 495
Asn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His SerAsn Phe Asp Lys Asn Leu Pro Asn Glu Lys Val Leu Pro Lys His Ser
500 505 510500 505 510
Leu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val LysLeu Leu Tyr Glu Tyr Phe Thr Val Tyr Asn Glu Leu Thr Lys Val Lys
515 520 525515 520 525
Tyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu GlnTyr Val Thr Glu Gly Met Arg Lys Pro Ala Phe Leu Ser Gly Glu Gln
530 535 540530 535 540
Lys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val ThrLys Lys Ala Ile Val Asp Leu Leu Phe Lys Thr Asn Arg Lys Val Thr
545 550 555 560545 550 555 560
Val Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe AspVal Lys Gln Leu Lys Glu Asp Tyr Phe Lys Lys Ile Glu Cys Phe Asp
565 570 575565 570 575
Ser Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu GlySer Val Glu Ile Ser Gly Val Glu Asp Arg Phe Asn Ala Ser Leu Gly
580 585 590580 585 590
Thr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu AspThr Tyr His Asp Leu Leu Lys Ile Ile Lys Asp Lys Asp Phe Leu Asp
595 600 605595 600 605
Asn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu ThrAsn Glu Glu Asn Glu Asp Ile Leu Glu Asp Ile Val Leu Thr Leu Thr
610 615 620610 615 620
Leu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr AlaLeu Phe Glu Asp Arg Glu Met Ile Glu Glu Arg Leu Lys Thr Tyr Ala
625 630 635 640625 630 635 640
His Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg TyrHis Leu Phe Asp Asp Lys Val Met Lys Gln Leu Lys Arg Arg Arg Tyr
645 650 655645 650 655
Thr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg AspThr Gly Trp Gly Arg Leu Ser Arg Lys Leu Ile Asn Gly Ile Arg Asp
660 665 670660 665 670
Lys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly PheLys Gln Ser Gly Lys Thr Ile Leu Asp Phe Leu Lys Ser Asp Gly Phe
675 680 685675 680 685
Ala Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr PheAla Asn Arg Asn Phe Met Gln Leu Ile His Asp Asp Ser Leu Thr Phe
690 695 700690 695 700
Lys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser LeuLys Glu Asp Ile Gln Lys Ala Gln Val Ser Gly Gln Gly Asp Ser Leu
705 710 715 720705 710 715 720
His Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys GlyHis Glu His Ile Ala Asn Leu Ala Gly Ser Pro Ala Ile Lys Lys Gly
725 730 735725 730 735
Ile Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met GlyIle Leu Gln Thr Val Lys Val Val Asp Glu Leu Val Lys Val Met Gly
740 745 750740 745 750
Arg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn GlnArg His Lys Pro Glu Asn Ile Val Ile Glu Met Ala Arg Glu Asn Gln
755 760 765755 760 765
Thr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg IleThr Thr Gln Lys Gly Gln Lys Asn Ser Arg Glu Arg Met Lys Arg Ile
770 775 780770 775 780
Glu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His ProGlu Glu Gly Ile Lys Glu Leu Gly Ser Gln Ile Leu Lys Glu His Pro
785 790 795 800785 790 795 800
Val Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr LeuVal Glu Asn Thr Gln Leu Gln Asn Glu Lys Leu Tyr Leu Tyr Tyr Leu
805 810 815805 810 815
Gln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn ArgGln Asn Gly Arg Asp Met Tyr Val Asp Gln Glu Leu Asp Ile Asn Arg
820 825 830820 825 830
Leu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu LysLeu Ser Asp Tyr Asp Val Asp Ala Ile Val Pro Gln Ser Phe Leu Lys
835 840 845835 840 845
Asp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn ArgAsp Asp Ser Ile Asp Asn Lys Val Leu Thr Arg Ser Asp Lys Asn Arg
850 855 860850 855 860
Gly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met LysGly Lys Ser Asp Asn Val Pro Ser Glu Glu Val Val Lys Lys Met Lys
865 870 875 880865 870 875 880
Asn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg LysAsn Tyr Trp Arg Gln Leu Leu Asn Ala Lys Leu Ile Thr Gln Arg Lys
885 890 895885 890 895
Phe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu AspPhe Asp Asn Leu Thr Lys Ala Glu Arg Gly Gly Leu Ser Glu Leu Asp
900 905 910900 905 910
Lys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile ThrLys Ala Gly Phe Ile Lys Arg Gln Leu Val Glu Thr Arg Gln Ile Thr
915 920 925915 920 925
Lys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr AspLys His Val Ala Gln Ile Leu Asp Ser Arg Met Asn Thr Lys Tyr Asp
930 935 940930 935 940
Glu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys SerGlu Asn Asp Lys Leu Ile Arg Glu Val Lys Val Ile Thr Leu Lys Ser
945 950 955 960945 950 955 960
Lys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val ArgLys Leu Val Ser Asp Phe Arg Lys Asp Phe Gln Phe Tyr Lys Val Arg
965 970 975965 970 975
Glu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala ValGlu Ile Asn Asn Tyr His His Ala His Asp Ala Tyr Leu Asn Ala Val
980 985 990980 985 990
Val Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu PheVal Gly Thr Ala Leu Ile Lys Lys Tyr Pro Lys Leu Glu Ser Glu Phe
995 1000 1005995 1000 1005
Val Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile AlaVal Tyr Gly Asp Tyr Lys Val Tyr Asp Val Arg Lys Met Ile Ala
1010 1015 10201010 1015 1020
Lys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe PheLys Ser Glu Gln Glu Ile Gly Lys Ala Thr Ala Lys Tyr Phe Phe
1025 1030 10351025 1030 1035
Tyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu AlaTyr Ser Asn Ile Met Asn Phe Phe Lys Thr Glu Ile Thr Leu Ala
1040 1045 10501040 1045 1050
Asn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly GluAsn Gly Glu Ile Arg Lys Arg Pro Leu Ile Glu Thr Asn Gly Glu
1055 1060 10651055 1060 1065
Thr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr ValThr Gly Glu Ile Val Trp Asp Lys Gly Arg Asp Phe Ala Thr Val
1070 1075 10801070 1075 1080
Arg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys ThrArg Lys Val Leu Ser Met Pro Gln Val Asn Ile Val Lys Lys Thr
1085 1090 10951085 1090 1095
Glu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro LysGlu Val Gln Thr Gly Gly Phe Ser Lys Glu Ser Ile Leu Pro Lys
1100 1105 11101100 1105 1110
Arg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp ProArg Asn Ser Asp Lys Leu Ile Ala Arg Lys Lys Asp Trp Asp Pro
1115 1120 11251115 1120 1125
Lys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser ValLys Lys Tyr Gly Gly Phe Asp Ser Pro Thr Val Ala Tyr Ser Val
1130 1135 11401130 1135 1140
Leu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu LysLeu Val Val Ala Lys Val Glu Lys Gly Lys Ser Lys Lys Leu Lys
1145 1150 11551145 1150 1155
Ser Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser SerSer Val Lys Glu Leu Leu Gly Ile Thr Ile Met Glu Arg Ser Ser
1160 1165 11701160 1165 1170
Phe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr LysPhe Glu Lys Asn Pro Ile Asp Phe Leu Glu Ala Lys Gly Tyr Lys
1175 1180 11851175 1180 1185
Glu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser LeuGlu Val Lys Lys Asp Leu Ile Ile Lys Leu Pro Lys Tyr Ser Leu
1190 1195 12001190 1195 1200
Phe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala GlyPhe Glu Leu Glu Asn Gly Arg Lys Arg Met Leu Ala Ser Ala Gly
1205 1210 12151205 1210 1215
Glu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr ValGlu Leu Gln Lys Gly Asn Glu Leu Ala Leu Pro Ser Lys Tyr Val
1220 1225 12301220 1225 1230
Asn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly SerAsn Phe Leu Tyr Leu Ala Ser His Tyr Glu Lys Leu Lys Gly Ser
1235 1240 12451235 1240 1245
Pro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His LysPro Glu Asp Asn Glu Gln Lys Gln Leu Phe Val Glu Gln His Lys
1250 1255 12601250 1255 1260
His Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser LysHis Tyr Leu Asp Glu Ile Ile Glu Gln Ile Ser Glu Phe Ser Lys
1265 1270 12751265 1270 1275
Arg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser AlaArg Val Ile Leu Ala Asp Ala Asn Leu Asp Lys Val Leu Ser Ala
1280 1285 12901280 1285 1290
Tyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu AsnTyr Asn Lys His Arg Asp Lys Pro Ile Arg Glu Gln Ala Glu Asn
1295 1300 13051295 1300 1305
Ile Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala AlaIle Ile His Leu Phe Thr Leu Thr Asn Leu Gly Ala Pro Ala Ala
1310 1315 13201310 1315 1320
Phe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr SerPhe Lys Tyr Phe Asp Thr Thr Ile Asp Arg Lys Arg Tyr Thr Ser
1325 1330 13351325 1330 1335
Thr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile ThrThr Lys Glu Val Leu Asp Ala Thr Leu Ile His Gln Ser Ile Thr
1340 1345 13501340 1345 1350
Gly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly AspGly Leu Tyr Glu Thr Arg Ile Asp Leu Ser Gln Leu Gly Gly Asp
1355 1360 13651355 1360 1365
<210> 24<210> 24
<211> 9<211> 9
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 24<400> 24
Tyr Pro Tyr Asp Val Pro Asp Tyr AlaTyr Pro Tyr Asp Val Pro Asp Tyr Ala
1. 515
<210> 25<210> 25
<211> 7<211> 7
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 25<400> 25
Pro Lys Lys Lys Arg Lys ValPro Lys Lys Lys Arg Lys Val
1. 515
<210> 26<210> 26
<211> 301<211> 301
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 26<400> 26
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val ProAsn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro
1. 5 10 151. 5 10 15
Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleAla Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
20 25 3020 25 30
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp ArgAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg
35 40 4535 40 45
Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met ValTyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
50 55 6050 55 60
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val ThrArg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr
65 70 75 8065 70 75 80
Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly GlyGln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly
85 90 9585 90 95
Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly LeuSer Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu
100 105 110100 105 110
Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu HisTyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
115 120 125115 120 125
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu PheAsp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe
130 135 140130 135 140
Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser ArgGlu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg
145 150 155 160145 150 155 160
Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser AlaPhe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
165 170 175165 170 175
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn ArgAla His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg
180 185 190180 185 190
Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys LeuPro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu
195 200 205195 200 205
Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr ThrGlu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
210 215 220210 215 220
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val PheArg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
225 230 235 240225 230 235 240
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg ValMet Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val
245 250 255245 250 255
Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuPhe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
260 265 270260 265 270
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile ArgAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg
275 280 285275 280 285
His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys ValHis Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val
290 295 300290 295 300
<210> 27<210> 27
<211> 27<211> 27
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 27<400> 27
Ser Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser SerSer Ser Gly Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser
1. 5 10 151. 5 10 15
Gly Leu Val Pro Leu Ser Leu Arg Gly Ser HisGly Leu Val Pro Leu Ser Leu Arg Gly Ser His
20 2520 25
<210> 28<210> 28
<211> 215<211> 215
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 28<400> 28
Met Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg GlnMet Gly Pro Met Glu Ile Tyr Lys Thr Val Ser Ala Trp Lys Arg Gln
1. 5 10 151. 5 10 15
Pro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu LysPro Val Arg Val Leu Ser Leu Phe Arg Asn Ile Asp Lys Val Leu Lys
20 25 3020 25 30
Ser Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr LeuSer Leu Gly Phe Leu Glu Ser Gly Ser Gly Ser Gly Gly Gly Thr Leu
35 40 4535 40 45
Lys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu LysLys Tyr Val Glu Asp Val Thr Asn Val Val Arg Arg Asp Val Glu Lys
50 55 6050 55 60
Trp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly SerTrp Gly Pro Phe Asp Leu Val Tyr Gly Ser Thr Gln Pro Leu Gly Ser
65 70 75 8065 70 75 80
Ser Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg IleSer Cys Asp Arg Cys Pro Gly Trp Tyr Met Phe Gln Phe His Arg Ile
85 90 9585 90 95
Leu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe TrpLeu Gln Tyr Ala Leu Pro Arg Gln Glu Ser Gln Arg Pro Phe Phe Trp
100 105 110100 105 110
Ile Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr ThrIle Phe Met Asp Asn Leu Leu Leu Thr Glu Asp Asp Gln Glu Thr Thr
115 120 125115 120 125
Thr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg GlyThr Arg Phe Leu Gln Thr Glu Ala Val Thr Leu Gln Asp Val Arg Gly
130 135 140130 135 140
Arg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly LeuArg Asp Tyr Gln Asn Ala Met Arg Val Trp Ser Asn Ile Pro Gly Leu
145 150 155 160145 150 155 160
Lys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu GlnLys Ser Lys His Ala Pro Leu Thr Pro Lys Glu Glu Glu Tyr Leu Gln
165 170 175165 170 175
Ala Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp LeuAla Gln Val Arg Ser Arg Ser Lys Leu Asp Ala Pro Lys Val Asp Leu
180 185 190180 185 190
Leu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr PheLeu Val Lys Asn Cys Leu Leu Pro Leu Arg Glu Tyr Phe Lys Tyr Phe
195 200 205195 200 205
Ser Gln Asn Ser Leu Pro LeuSer Gln Asn Ser Leu Pro Leu
210 215210 215
<210> 29<210> 29
<211> 19<211> 19
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 29<400> 29
Ala Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu AsnAla Thr Asn Phe Ser Leu Leu Lys Gln Ala Gly Asp Val Glu Glu Asn
1. 5 10 151. 5 10 15
Pro Gly ProPro Gly Pro
<210> 30<210> 30
<211> 232<211> 232
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 30<400> 30
Ser Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu GlySer Glu Leu Ile Lys Glu Asn Met His Met Lys Leu Tyr Met Glu Gly
1. 5 10 151. 5 10 15
Thr Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly LysThr Val Asp Asn His His Phe Lys Cys Thr Ser Glu Gly Glu Gly Lys
20 25 3020 25 30
Pro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly GlyPro Tyr Glu Gly Thr Gln Thr Met Arg Ile Lys Val Val Glu Gly Gly
35 40 4535 40 45
Pro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr GlyPro Leu Pro Phe Ala Phe Asp Ile Leu Ala Thr Ser Phe Leu Tyr Gly
50 55 6050 55 60
Ser Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe LysSer Lys Thr Phe Ile Asn His Thr Gln Gly Ile Pro Asp Phe Phe Lys
65 70 75 8065 70 75 80
Gln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr GluGln Ser Phe Pro Glu Gly Phe Thr Trp Glu Arg Val Thr Thr Tyr Glu
85 90 9585 90 95
Asp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp GlyAsp Gly Gly Val Leu Thr Ala Thr Gln Asp Thr Ser Leu Gln Asp Gly
100 105 110100 105 110
Cys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser AsnCys Leu Ile Tyr Asn Val Lys Ile Arg Gly Val Asn Phe Thr Ser Asn
115 120 125115 120 125
Gly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr GluGly Pro Val Met Gln Lys Lys Thr Leu Gly Trp Glu Ala Phe Thr Glu
130 135 140130 135 140
Thr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met AlaThr Leu Tyr Pro Ala Asp Gly Gly Leu Glu Gly Arg Asn Asp Met Ala
145 150 155 160145 150 155 160
Leu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr ThrLeu Lys Leu Val Gly Gly Ser His Leu Ile Ala Asn Ile Lys Thr Thr
165 170 175165 170 175
Tyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val TyrTyr Arg Ser Lys Lys Pro Ala Lys Asn Leu Lys Met Pro Gly Val Tyr
180 185 190180 185 190
Tyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu ThrTyr Val Asp Tyr Arg Leu Glu Arg Ile Lys Glu Ala Asn Asn Glu Thr
195 200 205195 200 205
Tyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu ProTyr Val Glu Gln His Glu Val Ala Val Ala Arg Tyr Cys Asp Leu Pro
210 215 220210 215 220
Ser Lys Leu Gly His Lys Leu AsnSer Lys Leu Gly His Lys Leu Asn
225 230225 230
<210> 31<210> 31
<211> 16<211> 16
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 31<400> 31
Ser Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu SerSer Gly Ser Glu Thr Pro Gly Thr Ser Glu Ser Ala Thr Pro Glu Ser
1. 5 10 151. 5 10 15
<210> 32<210> 32
<211> 80<211> 80
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 32<400> 32
Gly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro AlaGly Gly Pro Ser Ser Gly Ala Pro Pro Pro Ser Gly Gly Ser Pro Ala
1. 5 10 151. 5 10 15
Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr ProGly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Glu Ser Ala Thr Pro
20 25 3020 25 30
Glu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala ProGlu Ser Gly Pro Gly Thr Ser Thr Glu Pro Ser Glu Gly Ser Ala Pro
35 40 4535 40 45
Gly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser ThrGly Ser Pro Ala Gly Ser Pro Thr Ser Thr Glu Glu Gly Thr Ser Thr
50 55 6050 55 60
Glu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser GluGlu Pro Ser Glu Gly Ser Ala Pro Gly Thr Ser Thr Glu Pro Ser Glu
65 70 75 8065 70 75 80
<210> 33<210> 33
<211> 543<211> 543
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 33<400> 33
Asn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val ProAsn His Asp Gln Glu Phe Asp Pro Pro Lys Val Tyr Pro Pro Val Pro
1. 5 10 151. 5 10 15
Ala Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly IleAla Glu Lys Arg Lys Pro Ile Arg Val Leu Ser Leu Phe Asp Gly Ile
20 25 3020 25 30
Ala Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp ArgAla Thr Gly Leu Leu Val Leu Lys Asp Leu Gly Ile Gln Val Asp Arg
35 40 4535 40 45
Tyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met ValTyr Ile Ala Ser Glu Val Cys Glu Asp Ser Ile Thr Val Gly Met Val
50 55 6050 55 60
Arg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val ThrArg His Gln Gly Lys Ile Met Tyr Val Gly Asp Val Arg Ser Val Thr
65 70 75 8065 70 75 80
Gln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly GlyGln Lys His Ile Gln Glu Trp Gly Pro Phe Asp Leu Val Ile Gly Gly
85 90 9585 90 95
Ser Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly LeuSer Pro Cys Asn Asp Leu Ser Ile Val Asn Pro Ala Arg Lys Gly Leu
100 105 110100 105 110
Tyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu HisTyr Glu Gly Thr Gly Arg Leu Phe Phe Glu Phe Tyr Arg Leu Leu His
115 120 125115 120 125
Asp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu PheAsp Ala Arg Pro Lys Glu Gly Asp Asp Arg Pro Phe Phe Trp Leu Phe
130 135 140130 135 140
Glu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser ArgGlu Asn Val Val Ala Met Gly Val Ser Asp Lys Arg Asp Ile Ser Arg
145 150 155 160145 150 155 160
Phe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser AlaPhe Leu Glu Ser Asn Pro Val Met Ile Asp Ala Lys Glu Val Ser Ala
165 170 175165 170 175
Ala His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn ArgAla His Arg Ala Arg Tyr Phe Trp Gly Asn Leu Pro Gly Met Asn Arg
180 185 190180 185 190
Pro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys LeuPro Leu Ala Ser Thr Val Asn Asp Lys Leu Glu Leu Gln Glu Cys Leu
195 200 205195 200 205
Glu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr ThrGlu His Gly Arg Ile Ala Lys Phe Ser Lys Val Arg Thr Ile Thr Thr
210 215 220210 215 220
Arg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val PheArg Ser Asn Ser Ile Lys Gln Gly Lys Asp Gln His Phe Pro Val Phe
225 230 235 240225 230 235 240
Met Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg ValMet Asn Glu Lys Glu Asp Ile Leu Trp Cys Thr Glu Met Glu Arg Val
245 250 255245 250 255
Phe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg LeuPhe Gly Phe Pro Val His Tyr Thr Asp Val Ser Asn Met Ser Arg Leu
260 265 270260 265 270
Ala Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile ArgAla Arg Gln Arg Leu Leu Gly Arg Ser Trp Ser Val Pro Val Ile Arg
275 280 285275 280 285
His Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser GlyHis Leu Phe Ala Pro Leu Lys Glu Tyr Phe Ala Cys Val Ser Ser Gly
290 295 300290 295 300
Asn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu ValAsn Ser Asn Ala Asn Ser Arg Gly Pro Ser Phe Ser Ser Gly Leu Val
305 310 315 320305 310 315 320
Pro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr LysPro Leu Ser Leu Arg Gly Ser His Met Gly Pro Met Glu Ile Tyr Lys
325 330 335325 330 335
Thr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu PheThr Val Ser Ala Trp Lys Arg Gln Pro Val Arg Val Leu Ser Leu Phe
340 345 350340 345 350
Arg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser GlyArg Asn Ile Asp Lys Val Leu Lys Ser Leu Gly Phe Leu Glu Ser Gly
355 360 365355 360 365
Ser Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr AsnSer Gly Ser Gly Gly Gly Thr Leu Lys Tyr Val Glu Asp Val Thr Asn
370 375 380370 375 380
Val Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val TyrVal Val Arg Arg Asp Val Glu Lys Trp Gly Pro Phe Asp Leu Val Tyr
385 390 395 400385 390 395 400
Gly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly TrpGly Ser Thr Gln Pro Leu Gly Ser Ser Cys Asp Arg Cys Pro Gly Trp
405 410 415405 410 415
Tyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg GlnTyr Met Phe Gln Phe His Arg Ile Leu Gln Tyr Ala Leu Pro Arg Gln
420 425 430420 425 430
Glu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu LeuGlu Ser Gln Arg Pro Phe Phe Trp Ile Phe Met Asp Asn Leu Leu Leu
435 440 445435 440 445
Thr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu AlaThr Glu Asp Asp Gln Glu Thr Thr Thr Arg Phe Leu Gln Thr Glu Ala
450 455 460450 455 460
Val Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met ArgVal Thr Leu Gln Asp Val Arg Gly Arg Asp Tyr Gln Asn Ala Met Arg
465 470 475 480465 470 475 480
Val Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu ThrVal Trp Ser Asn Ile Pro Gly Leu Lys Ser Lys His Ala Pro Leu Thr
485 490 495485 490 495
Pro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser LysPro Lys Glu Glu Glu Tyr Leu Gln Ala Gln Val Arg Ser Arg Ser Lys
500 505 510500 505 510
Leu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu ProLeu Asp Ala Pro Lys Val Asp Leu Leu Val Lys Asn Cys Leu Leu Pro
515 520 525515 520 525
Leu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro LeuLeu Arg Glu Tyr Phe Lys Tyr Phe Ser Gln Asn Ser Leu Pro Leu
530 535 540530 535 540
<210> 34<210> 34
<211> 1307<211> 1307
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 34<400> 34
Met Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys ThrMet Thr Gln Phe Glu Gly Phe Thr Asn Leu Tyr Gln Val Ser Lys Thr
1. 5 10 151. 5 10 15
Leu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile GlnLeu Arg Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Lys His Ile Gln
20 25 3020 25 30
Glu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr LysGlu Gln Gly Phe Ile Glu Glu Asp Lys Ala Arg Asn Asp His Tyr Lys
35 40 4535 40 45
Glu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp GlnGlu Leu Lys Pro Ile Ile Asp Arg Ile Tyr Lys Thr Tyr Ala Asp Gln
50 55 6050 55 60
Cys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala IleCys Leu Gln Leu Val Gln Leu Asp Trp Glu Asn Leu Ser Ala Ala Ile
65 70 75 8065 70 75 80
Asp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu IleAsp Ser Tyr Arg Lys Glu Lys Thr Glu Glu Thr Arg Asn Ala Leu Ile
85 90 9585 90 95
Glu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile GlyGlu Glu Gln Ala Thr Tyr Arg Asn Ala Ile His Asp Tyr Phe Ile Gly
100 105 110100 105 110
Arg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu IleArg Thr Asp Asn Leu Thr Asp Ala Ile Asn Lys Arg His Ala Glu Ile
115 120 125115 120 125
Tyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu LysTyr Lys Gly Leu Phe Lys Ala Glu Leu Phe Asn Gly Lys Val Leu Lys
130 135 140130 135 140
Gln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu ArgGln Leu Gly Thr Val Thr Thr Thr Glu His Glu Asn Ala Leu Leu Arg
145 150 155 160145 150 155 160
Ser Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn ArgSer Phe Asp Lys Phe Thr Thr Tyr Phe Ser Gly Phe Tyr Glu Asn Arg
165 170 175165 170 175
Lys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His ArgLys Asn Val Phe Ser Ala Glu Asp Ile Ser Thr Ala Ile Pro His Arg
180 185 190180 185 190
Ile Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile PheIle Val Gln Asp Asn Phe Pro Lys Phe Lys Glu Asn Cys His Ile Phe
195 200 205195 200 205
Thr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu AsnThr Arg Leu Ile Thr Ala Val Pro Ser Leu Arg Glu His Phe Glu Asn
210 215 220210 215 220
Val Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu ValVal Lys Lys Ala Ile Gly Ile Phe Val Ser Thr Ser Ile Glu Glu Val
225 230 235 240225 230 235 240
Phe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile AspPhe Ser Phe Pro Phe Tyr Asn Gln Leu Leu Thr Gln Thr Gln Ile Asp
245 250 255245 250 255
Leu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr GluLeu Tyr Asn Gln Leu Leu Gly Gly Ile Ser Arg Glu Ala Gly Thr Glu
260 265 270260 265 270
Lys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys AsnLys Ile Lys Gly Leu Asn Glu Val Leu Asn Leu Ala Ile Gln Lys Asn
275 280 285275 280 285
Asp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile ProAsp Glu Thr Ala His Ile Ile Ala Ser Leu Pro His Arg Phe Ile Pro
290 295 300290 295 300
Leu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile LeuLeu Phe Lys Gln Ile Leu Ser Asp Arg Asn Thr Leu Ser Phe Ile Leu
305 310 315 320305 310 315 320
Glu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys TyrGlu Glu Phe Lys Ser Asp Glu Glu Val Ile Gln Ser Phe Cys Lys Tyr
325 330 335325 330 335
Lys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala LeuLys Thr Leu Leu Arg Asn Glu Asn Val Leu Glu Thr Ala Glu Ala Leu
340 345 350340 345 350
Phe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser HisPhe Asn Glu Leu Asn Ser Ile Asp Leu Thr His Ile Phe Ile Ser His
355 360 365355 360 365
Lys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp ThrLys Lys Leu Glu Thr Ile Ser Ser Ala Leu Cys Asp His Trp Asp Thr
370 375 380370 375 380
Leu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly LysLeu Arg Asn Ala Leu Tyr Glu Arg Arg Ile Ser Glu Leu Thr Gly Lys
385 390 395 400385 390 395 400
Ile Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His GluIle Thr Lys Ser Ala Lys Glu Lys Val Gln Arg Ser Leu Lys His Glu
405 410 415405 410 415
Asp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu SerAsp Ile Asn Leu Gln Glu Ile Ile Ser Ala Ala Gly Lys Glu Leu Ser
420 425 430420 425 430
Glu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His AlaGlu Ala Phe Lys Gln Lys Thr Ser Glu Ile Leu Ser His Ala His Ala
435 440 445435 440 445
Ala Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu LysAla Leu Asp Gln Pro Leu Pro Thr Thr Leu Lys Lys Gln Glu Glu Lys
450 455 460450 455 460
Glu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His LeuGlu Ile Leu Lys Ser Gln Leu Asp Ser Leu Leu Gly Leu Tyr His Leu
465 470 475 480465 470 475 480
Leu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu PheLeu Asp Trp Phe Ala Val Asp Glu Ser Asn Glu Val Asp Pro Glu Phe
485 490 495485 490 495
Ser Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu SerSer Ala Arg Leu Thr Gly Ile Lys Leu Glu Met Glu Pro Ser Leu Ser
500 505 510500 505 510
Phe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser ValPhe Tyr Asn Lys Ala Arg Asn Tyr Ala Thr Lys Lys Pro Tyr Ser Val
515 520 525515 520 525
Glu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly TrpGlu Lys Phe Lys Leu Asn Phe Gln Met Pro Thr Leu Ala Ser Gly Trp
530 535 540530 535 540
Asp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys AsnAsp Val Asn Lys Glu Lys Asn Asn Gly Ala Ile Leu Phe Val Lys Asn
545 550 555 560545 550 555 560
Gly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr LysGly Leu Tyr Tyr Leu Gly Ile Met Pro Lys Gln Lys Gly Arg Tyr Lys
565 570 575565 570 575
Ala Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp LysAla Leu Ser Phe Glu Pro Thr Glu Lys Thr Ser Glu Gly Phe Asp Lys
580 585 590580 585 590
Met Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys CysMet Tyr Tyr Asp Tyr Phe Pro Asp Ala Ala Lys Met Ile Pro Lys Cys
595 600 605595 600 605
Ser Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr ThrSer Thr Gln Leu Lys Ala Val Thr Ala His Phe Gln Thr His Thr Thr
610 615 620610 615 620
Pro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr LysPro Ile Leu Leu Ser Asn Asn Phe Ile Glu Pro Leu Glu Ile Thr Lys
625 630 635 640625 630 635 640
Glu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe GlnGlu Ile Tyr Asp Leu Asn Asn Pro Glu Lys Glu Pro Lys Lys Phe Gln
645 650 655645 650 655
Thr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu AlaThr Ala Tyr Ala Lys Lys Thr Gly Asp Gln Lys Gly Tyr Arg Glu Ala
660 665 670660 665 670
Leu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr ThrLeu Cys Lys Trp Ile Asp Phe Thr Arg Asp Phe Leu Ser Lys Tyr Thr
675 680 685675 680 685
Lys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln TyrLys Thr Thr Ser Ile Asp Leu Ser Ser Leu Arg Pro Ser Ser Gln Tyr
690 695 700690 695 700
Lys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr HisLys Asp Leu Gly Glu Tyr Tyr Ala Glu Leu Asn Pro Leu Leu Tyr His
705 710 715 720705 710 715 720
Ile Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val GluIle Ser Phe Gln Arg Ile Ala Glu Lys Glu Ile Met Asp Ala Val Glu
725 730 735725 730 735
Thr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala LysThr Gly Lys Leu Tyr Leu Phe Gln Ile Tyr Asn Lys Asp Phe Ala Lys
740 745 750740 745 750
Gly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly LeuGly His His Gly Lys Pro Asn Leu His Thr Leu Tyr Trp Thr Gly Leu
755 760 765755 760 765
Phe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly GlnPhe Ser Pro Glu Asn Leu Ala Lys Thr Ser Ile Lys Leu Asn Gly Gln
770 775 780770 775 780
Ala Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala HisAla Glu Leu Phe Tyr Arg Pro Lys Ser Arg Met Lys Arg Met Ala His
785 790 795 800785 790 795 800
Arg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys ThrArg Leu Gly Glu Lys Met Leu Asn Lys Lys Leu Lys Asp Gln Lys Thr
805 810 815805 810 815
Pro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn HisPro Ile Pro Asp Thr Leu Tyr Gln Glu Leu Tyr Asp Tyr Val Asn His
820 825 830820 825 830
Arg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro AsnArg Leu Ser His Asp Leu Ser Asp Glu Ala Arg Ala Leu Leu Pro Asn
835 840 845835 840 845
Val Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg PheVal Ile Thr Lys Glu Val Ser His Glu Ile Ile Lys Asp Arg Arg Phe
850 855 860850 855 860
Thr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr GlnThr Ser Asp Lys Phe Phe Phe His Val Pro Ile Thr Leu Asn Tyr Gln
865 870 875 880865 870 875 880
Ala Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr LeuAla Ala Asn Ser Pro Ser Lys Phe Asn Gln Arg Val Asn Ala Tyr Leu
885 890 895885 890 895
Lys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu ArgLys Glu His Pro Glu Thr Pro Ile Ile Gly Ile Asp Arg Gly Glu Arg
900 905 910900 905 910
Asn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu GluAsn Leu Ile Tyr Ile Thr Val Ile Asp Ser Thr Gly Lys Ile Leu Glu
915 920 925915 920 925
Gln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys LeuGln Arg Ser Leu Asn Thr Ile Gln Gln Phe Asp Tyr Gln Lys Lys Leu
930 935 940930 935 940
Asp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser ValAsp Asn Arg Glu Lys Glu Arg Val Ala Ala Arg Gln Ala Trp Ser Val
945 950 955 960945 950 955 960
Val Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val IleVal Gly Thr Ile Lys Asp Leu Lys Gln Gly Tyr Leu Ser Gln Val Ile
965 970 975965 970 975
His Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val LeuHis Glu Ile Val Asp Leu Met Ile His Tyr Gln Ala Val Val Val Leu
980 985 990980 985 990
Ala Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala GluAla Asn Leu Asn Phe Gly Phe Lys Ser Lys Arg Thr Gly Ile Ala Glu
995 1000 1005995 1000 1005
Lys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys LeuLys Ala Val Tyr Gln Gln Phe Glu Lys Met Leu Ile Asp Lys Leu
1010 1015 10201010 1015 1020
Asn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly GlyAsn Cys Leu Val Leu Lys Asp Tyr Pro Ala Glu Lys Val Gly Gly
1025 1030 10351025 1030 1035
Val Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe AlaVal Leu Asn Pro Tyr Gln Leu Thr Asp Gln Phe Thr Ser Phe Ala
1040 1045 10501040 1045 1050
Lys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala ProLys Met Gly Thr Gln Ser Gly Phe Leu Phe Tyr Val Pro Ala Pro
1055 1060 10651055 1060 1065
Tyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro PheTyr Thr Ser Lys Ile Asp Pro Leu Thr Gly Phe Val Asp Pro Phe
1070 1075 10801070 1075 1080
Val Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe LeuVal Trp Lys Thr Ile Lys Asn His Glu Ser Arg Lys His Phe Leu
1085 1090 10951085 1090 1095
Glu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp PheGlu Gly Phe Asp Phe Leu His Tyr Asp Val Lys Thr Gly Asp Phe
1100 1105 11101100 1105 1110
Ile Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg GlyIle Leu His Phe Lys Met Asn Arg Asn Leu Ser Phe Gln Arg Gly
1115 1120 11251115 1120 1125
Leu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys AsnLeu Pro Gly Phe Met Pro Ala Trp Asp Ile Val Phe Glu Lys Asn
1130 1135 11401130 1135 1140
Glu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly LysGlu Thr Gln Phe Asp Ala Lys Gly Thr Pro Phe Ile Ala Gly Lys
1145 1150 11551145 1150 1155
Arg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg TyrArg Ile Val Pro Val Ile Glu Asn His Arg Phe Thr Gly Arg Tyr
1160 1165 11701160 1165 1170
Arg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu GluArg Asp Leu Tyr Pro Ala Asn Glu Leu Ile Ala Leu Leu Glu Glu
1175 1180 11851175 1180 1185
Lys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys LeuLys Gly Ile Val Phe Arg Asp Gly Ser Asn Ile Leu Pro Lys Leu
1190 1195 12001190 1195 1200
Leu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala LeuLeu Glu Asn Asp Asp Ser His Ala Ile Asp Thr Met Val Ala Leu
1205 1210 12151205 1210 1215
Ile Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr GlyIle Arg Ser Val Leu Gln Met Arg Asn Ser Asn Ala Ala Thr Gly
1220 1225 12301220 1225 1230
Glu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val CysGlu Asp Tyr Ile Asn Ser Pro Val Arg Asp Leu Asn Gly Val Cys
1235 1240 12451235 1240 1245
Phe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala AspPhe Asp Ser Arg Phe Gln Asn Pro Glu Trp Pro Met Asp Ala Asp
1250 1255 12601250 1255 1260
Ala Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu LeuAla Asn Gly Ala Tyr His Ile Ala Leu Lys Gly Gln Leu Leu Leu
1265 1270 12751265 1270 1275
Asn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly IleAsn His Leu Lys Glu Ser Lys Asp Leu Lys Leu Gln Asn Gly Ile
1280 1285 12901280 1285 1290
Ser Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg AsnSer Asn Gln Asp Trp Leu Ala Tyr Ile Gln Glu Leu Arg Asn
1295 1300 13051295 1300 1305
<210> 35<210> 35
<211> 1228<211> 1228
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 35<400> 35
Met Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys ThrMet Ser Lys Leu Glu Lys Phe Thr Asn Cys Tyr Ser Leu Ser Lys Thr
1. 5 10 151.5 10 15
Leu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile AspLeu Arg Phe Lys Ala Ile Pro Val Gly Lys Thr Gln Glu Asn Ile Asp
20 25 3020 25 30
Asn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr LysAsn Lys Arg Leu Leu Val Glu Asp Glu Lys Arg Ala Glu Asp Tyr Lys
35 40 4535 40 45
Gly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn AspGly Val Lys Lys Leu Leu Asp Arg Tyr Tyr Leu Ser Phe Ile Asn Asp
50 55 6050 55 60
Val Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser LeuVal Leu His Ser Ile Lys Leu Lys Asn Leu Asn Asn Tyr Ile Ser Leu
65 70 75 8065 70 75 80
Phe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu AsnPhe Arg Lys Lys Thr Arg Thr Glu Lys Glu Asn Lys Glu Leu Glu Asn
85 90 9585 90 95
Leu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly AsnLeu Glu Ile Asn Leu Arg Lys Glu Ile Ala Lys Ala Phe Lys Gly Asn
100 105 110100 105 110
Glu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile LeuGlu Gly Tyr Lys Ser Leu Phe Lys Lys Asp Ile Ile Glu Thr Ile Leu
115 120 125115 120 125
Pro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser PhePro Glu Phe Leu Asp Asp Lys Asp Glu Ile Ala Leu Val Asn Ser Phe
130 135 140130 135 140
Asn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu AsnAsn Gly Phe Thr Thr Ala Phe Thr Gly Phe Phe Asp Asn Arg Glu Asn
145 150 155 160145 150 155 160
Met Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys IleMet Phe Ser Glu Glu Ala Lys Ser Thr Ser Ile Ala Phe Arg Cys Ile
165 170 175165 170 175
Asn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu LysAsn Glu Asn Leu Thr Arg Tyr Ile Ser Asn Met Asp Ile Phe Glu Lys
180 185 190180 185 190
Val Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu LysVal Asp Ala Ile Phe Asp Lys His Glu Val Gln Glu Ile Lys Glu Lys
195 200 205195 200 205
Ile Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu PheIle Leu Asn Ser Asp Tyr Asp Val Glu Asp Phe Phe Glu Gly Glu Phe
210 215 220210 215 220
Phe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala IlePhe Asn Phe Val Leu Thr Gln Glu Gly Ile Asp Val Tyr Asn Ala Ile
225 230 235 240225 230 235 240
Ile Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu AsnIle Gly Gly Phe Val Thr Glu Ser Gly Glu Lys Ile Lys Gly Leu Asn
245 250 255245 250 255
Glu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro LysGlu Tyr Ile Asn Leu Tyr Asn Gln Lys Thr Lys Gln Lys Leu Pro Lys
260 265 270260 265 270
Phe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu SerPhe Lys Pro Leu Tyr Lys Gln Val Leu Ser Asp Arg Glu Ser Leu Ser
275 280 285275 280 285
Phe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val PhePhe Tyr Gly Glu Gly Tyr Thr Ser Asp Glu Glu Val Leu Glu Val Phe
290 295 300290 295 300
Arg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys LysArg Asn Thr Leu Asn Lys Asn Ser Glu Ile Phe Ser Ser Ile Lys Lys
305 310 315 320305 310 315 320
Leu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly IleLeu Glu Lys Leu Phe Lys Asn Phe Asp Glu Tyr Ser Ser Ala Gly Ile
325 330 335325 330 335
Phe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile PhePhe Val Lys Asn Gly Pro Ala Ile Ser Thr Ile Ser Lys Asp Ile Phe
340 345 350340 345 350
Gly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp AspGly Glu Trp Asn Val Ile Arg Asp Lys Trp Asn Ala Glu Tyr Asp Asp
355 360 365355 360 365
Ile His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp AspIle His Leu Lys Lys Lys Ala Val Val Thr Glu Lys Tyr Glu Asp Asp
370 375 380370 375 380
Arg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln LeuArg Arg Lys Ser Phe Lys Lys Ile Gly Ser Phe Ser Leu Glu Gln Leu
385 390 395 400385 390 395 400
Gln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys GluGln Glu Tyr Ala Asp Ala Asp Leu Ser Val Val Glu Lys Leu Lys Glu
405 410 415405 410 415
Ile Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser SerIle Ile Ile Gln Lys Val Asp Glu Ile Tyr Lys Val Tyr Gly Ser Ser
420 425 430420 425 430
Glu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys LysGlu Lys Leu Phe Asp Ala Asp Phe Val Leu Glu Lys Ser Leu Lys Lys
435 440 445435 440 445
Asn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val LysAsn Asp Ala Val Val Ala Ile Met Lys Asp Leu Leu Asp Ser Val Lys
450 455 460450 455 460
Ser Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu ThrSer Phe Glu Asn Tyr Ile Lys Ala Phe Phe Gly Glu Gly Lys Glu Thr
465 470 475 480465 470 475 480
Asn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp IleAsn Arg Asp Glu Ser Phe Tyr Gly Asp Phe Val Leu Ala Tyr Asp Ile
485 490 495485 490 495
Leu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val ThrLeu Leu Lys Val Asp His Ile Tyr Asp Ala Ile Arg Asn Tyr Val Thr
500 505 510500 505 510
Gln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn ProGln Lys Pro Tyr Ser Lys Asp Lys Phe Lys Leu Tyr Phe Gln Asn Pro
515 520 525515 520 525
Gln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg AlaGln Phe Met Gly Gly Trp Asp Lys Asp Lys Glu Thr Asp Tyr Arg Ala
530 535 540530 535 540
Thr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp LysThr Ile Leu Arg Tyr Gly Ser Lys Tyr Tyr Leu Ala Ile Met Asp Lys
545 550 555 560545 550 555 560
Lys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn GlyLys Tyr Ala Lys Cys Leu Gln Lys Ile Asp Lys Asp Asp Val Asn Gly
565 570 575565 570 575
Asn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys MetAsn Tyr Glu Lys Ile Asn Tyr Lys Leu Leu Pro Gly Pro Asn Lys Met
580 585 590580 585 590
Leu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn ProLeu Pro Lys Val Phe Phe Ser Lys Lys Trp Met Ala Tyr Tyr Asn Pro
595 600 605595 600 605
Ser Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys GlySer Glu Asp Ile Gln Lys Ile Tyr Lys Asn Gly Thr Phe Lys Lys Gly
610 615 620610 615 620
Asp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe LysAsp Met Phe Asn Leu Asn Asp Cys His Lys Leu Ile Asp Phe Phe Lys
625 630 635 640625 630 635 640
Asp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe AsnAsp Ser Ile Ser Arg Tyr Pro Lys Trp Ser Asn Ala Tyr Asp Phe Asn
645 650 655645 650 655
Phe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg GluPhe Ser Glu Thr Glu Lys Tyr Lys Asp Ile Ala Gly Phe Tyr Arg Glu
660 665 670660 665 670
Val Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys LysVal Glu Glu Gln Gly Tyr Lys Val Ser Phe Glu Ser Ala Ser Lys Lys
675 680 685675 680 685
Glu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln IleGlu Val Asp Lys Leu Val Glu Glu Gly Lys Leu Tyr Met Phe Gln Ile
690 695 700690 695 700
Tyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu HisTyr Asn Lys Asp Phe Ser Asp Lys Ser His Gly Thr Pro Asn Leu His
705 710 715 720705 710 715 720
Thr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln IleThr Met Tyr Phe Lys Leu Leu Phe Asp Glu Asn Asn His Gly Gln Ile
725 730 735725 730 735
Arg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu LysArg Leu Ser Gly Gly Ala Glu Leu Phe Met Arg Arg Ala Ser Leu Lys
740 745 750740 745 750
Lys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn LysLys Glu Glu Leu Val Val His Pro Ala Asn Ser Pro Ile Ala Asn Lys
755 760 765755 760 765
Asn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val TyrAsn Pro Asp Asn Pro Lys Lys Thr Thr Thr Leu Ser Tyr Asp Val Tyr
770 775 780770 775 780
Lys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro IleLys Asp Lys Arg Phe Ser Glu Asp Gln Tyr Glu Leu His Ile Pro Ile
785 790 795 800785 790 795 800
Ala Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu ValAla Ile Asn Lys Cys Pro Lys Asn Ile Phe Lys Ile Asn Thr Glu Val
805 810 815805 810 815
Arg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile AlaArg Val Leu Leu Lys His Asp Asp Asn Pro Tyr Val Ile Gly Ile Ala
820 825 830820 825 830
Arg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys GlyArg Gly Glu Arg Asn Leu Leu Tyr Ile Val Val Val Asp Gly Lys Gly
835 840 845835 840 845
Asn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe AsnAsn Ile Val Glu Gln Tyr Ser Leu Asn Glu Ile Ile Asn Asn Phe Asn
850 855 860850 855 860
Gly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys GluGly Ile Arg Ile Lys Thr Asp Tyr His Ser Leu Leu Asp Lys Lys Glu
865 870 875 880865 870 875 880
Lys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn IleLys Glu Arg Phe Glu Ala Arg Gln Asn Trp Thr Ser Ile Glu Asn Ile
885 890 895885 890 895
Lys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile CysLys Glu Leu Lys Ala Gly Tyr Ile Ser Gln Val Val His Lys Ile Cys
900 905 910900 905 910
Glu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu AsnGlu Leu Val Glu Lys Tyr Asp Ala Val Ile Ala Leu Ala Asp Leu Asn
915 920 925915 920 925
Ser Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr GlnSer Gly Phe Lys Asn Ser Arg Val Lys Val Glu Lys Gln Val Tyr Gln
930 935 940930 935 940
Lys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp LysLys Phe Glu Lys Met Leu Ile Asp Lys Leu Asn Tyr Met Val Asp Lys
945 950 955 960945 950 955 960
Lys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln IleLys Ser Asn Pro Cys Ala Thr Gly Gly Ala Leu Lys Gly Tyr Gln Ile
965 970 975965 970 975
Thr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly PheThr Asn Lys Phe Glu Ser Phe Lys Ser Met Ser Thr Gln Asn Gly Phe
980 985 990980 985 990
Ile Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser ThrIle Phe Tyr Ile Pro Ala Trp Leu Thr Ser Lys Ile Asp Pro Ser Thr
995 1000 1005995 1000 1005
Gly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala AspGly Phe Val Asn Leu Leu Lys Thr Lys Tyr Thr Ser Ile Ala Asp
1010 1015 10201010 1015 1020
Ser Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val ProSer Lys Lys Phe Ile Ser Ser Phe Asp Arg Ile Met Tyr Val Pro
1025 1030 10351025 1030 1035
Glu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe SerGlu Glu Asp Leu Phe Glu Phe Ala Leu Asp Tyr Lys Asn Phe Ser
1040 1045 10501040 1045 1050
Arg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser TyrArg Thr Asp Ala Asp Tyr Ile Lys Lys Trp Lys Leu Tyr Ser Tyr
1055 1060 10651055 1060 1065
Gly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn ValGly Asn Arg Ile Arg Ile Phe Arg Asn Pro Lys Lys Asn Asn Val
1070 1075 10801070 1075 1080
Phe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu LeuPhe Asp Trp Glu Glu Val Cys Leu Thr Ser Ala Tyr Lys Glu Leu
1085 1090 10951085 1090 1095
Phe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg AlaPhe Asn Lys Tyr Gly Ile Asn Tyr Gln Gln Gly Asp Ile Arg Ala
1100 1105 11101100 1105 1110
Leu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe MetLeu Leu Cys Glu Gln Ser Asp Lys Ala Phe Tyr Ser Ser Phe Met
1115 1120 11251115 1120 1125
Ala Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr GlyAla Leu Met Ser Leu Met Leu Gln Met Arg Asn Ser Ile Thr Gly
1130 1135 11401130 1135 1140
Arg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser AspArg Thr Asp Val Asp Phe Leu Ile Ser Pro Val Lys Asn Ser Asp
1145 1150 11551145 1150 1155
Gly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn AlaGly Ile Phe Tyr Asp Ser Arg Asn Tyr Glu Ala Gln Glu Asn Ala
1160 1165 11701160 1165 1170
Ile Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile AlaIle Leu Pro Lys Asn Ala Asp Ala Asn Gly Ala Tyr Asn Ile Ala
1175 1180 11851175 1180 1185
Arg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu AspArg Lys Val Leu Trp Ala Ile Gly Gln Phe Lys Lys Ala Glu Asp
1190 1195 12001190 1195 1200
Glu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu TrpGlu Lys Leu Asp Lys Val Lys Ile Ala Ile Ser Asn Lys Glu Trp
1205 1210 12151205 1210 1215
Leu Glu Tyr Ala Gln Thr Ser Val Lys HisLeu Glu Tyr Ala Gln Thr Ser Val Lys His
1220 12251220 1225
<210> 36<210> 36
<211> 1314<211> 1314
<212> Белок<212> Protein
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полипептид<223> Synthetic polypeptide
<400> 36<400> 36
Met Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Gly Met SerMet Tyr Pro Tyr Asp Val Pro Asp Tyr Ala Ser Gly Ser Gly Met Ser
1. 5 10 151. 5 10 15
Ile Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu ArgIle Tyr Gln Glu Phe Val Asn Lys Tyr Ser Leu Ser Lys Thr Leu Arg
20 25 3020 25 30
Phe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala ArgPhe Glu Leu Ile Pro Gln Gly Lys Thr Leu Glu Asn Ile Lys Ala Arg
35 40 4535 40 45
Gly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys Lys AlaGly Leu Ile Leu Asp Asp Glu Lys Arg Ala Lys Asp Tyr Lys Lys Ala
50 55 6050 55 60
Lys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu Ile LeuLys Gln Ile Ile Asp Lys Tyr His Gln Phe Phe Ile Glu Glu Ile Leu
65 70 75 8065 70 75 80
Ser Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser Asp ValSer Ser Val Cys Ile Ser Glu Asp Leu Leu Gln Asn Tyr Ser Asp Val
85 90 9585 90 95
Tyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys Asp PheTyr Phe Lys Leu Lys Lys Ser Asp Asp Asp Asn Leu Gln Lys Asp Phe
100 105 110100 105 110
Lys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr Ile LysLys Ser Ala Lys Asp Thr Ile Lys Lys Gln Ile Ser Glu Tyr Ile Lys
115 120 125115 120 125
Asp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile Asp AlaAsp Ser Glu Lys Phe Lys Asn Leu Phe Asn Gln Asn Leu Ile Asp Ala
130 135 140130 135 140
Lys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln Ser LysLys Lys Gly Gln Glu Ser Asp Leu Ile Leu Trp Leu Lys Gln Ser Lys
145 150 155 160145 150 155 160
Asp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr Asp IleAsp Asn Gly Ile Glu Leu Phe Lys Ala Asn Ser Asp Ile Thr Asp Ile
165 170 175165 170 175
Asp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr Thr TyrAsp Glu Ala Leu Glu Ile Ile Lys Ser Phe Lys Gly Trp Thr Thr Tyr
180 185 190180 185 190
Phe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn AspPhe Lys Gly Phe His Glu Asn Arg Lys Asn Val Tyr Ser Ser Asn Asp
195 200 205195 200 205
Ile Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro LysIle Pro Thr Ser Ile Ile Tyr Arg Ile Val Asp Asp Asn Leu Pro Lys
210 215 220210 215 220
Phe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala ProPhe Leu Glu Asn Lys Ala Lys Tyr Glu Ser Leu Lys Asp Lys Ala Pro
225 230 235 240225 230 235 240
Glu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu LeuGlu Ala Ile Asn Tyr Glu Gln Ile Lys Lys Asp Leu Ala Glu Glu Leu
245 250 255245 250 255
Thr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val PheThr Phe Asp Ile Asp Tyr Lys Thr Ser Glu Val Asn Gln Arg Val Phe
260 265 270260 265 270
Ser Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu AsnSer Leu Asp Glu Val Phe Glu Ile Ala Asn Phe Asn Asn Tyr Leu Asn
275 280 285275 280 285
Gln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys Phe ValGln Ser Gly Ile Thr Lys Phe Asn Thr Ile Ile Gly Gly Lys Phe Val
290 295 300290 295 300
Asn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile Asn LeuAsn Gly Glu Asn Thr Lys Arg Lys Gly Ile Asn Glu Tyr Ile Asn Leu
305 310 315 320305 310 315 320
Tyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys Met SerTyr Ser Gln Gln Ile Asn Asp Lys Thr Leu Lys Lys Tyr Lys Met Ser
325 330 335325 330 335
Val Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser Phe ValVal Leu Phe Lys Gln Ile Leu Ser Asp Thr Glu Ser Lys Ser Phe Val
340 345 350340 345 350
Ile Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met Gln SerIle Asp Lys Leu Glu Asp Asp Ser Asp Val Val Thr Thr Met Gln Ser
355 360 365355 360 365
Phe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys Ser IlePhe Tyr Glu Gln Ile Ala Ala Phe Lys Thr Val Glu Glu Lys Ser Ile
370 375 380370 375 380
Lys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln Lys LeuLys Glu Thr Leu Ser Leu Leu Phe Asp Asp Leu Lys Ala Gln Lys Leu
385 390 395 400385 390 395 400
Asp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr Asp LeuAsp Leu Ser Lys Ile Tyr Phe Lys Asn Asp Lys Ser Leu Thr Asp Leu
405 410 415405 410 415
Ser Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala Val LeuSer Gln Gln Val Phe Asp Asp Tyr Ser Val Ile Gly Thr Ala Val Leu
420 425 430420 425 430
Glu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro SerGlu Tyr Ile Thr Gln Gln Ile Ala Pro Lys Asn Leu Asp Asn Pro Ser
435 440 445435 440 445
Lys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys TyrLys Lys Glu Gln Glu Leu Ile Ala Lys Lys Thr Glu Lys Ala Lys Tyr
450 455 460450 455 460
Leu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys HisLeu Ser Leu Glu Thr Ile Lys Leu Ala Leu Glu Glu Phe Asn Lys His
465 470 475 480465 470 475 480
Arg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn PheArg Asp Ile Asp Lys Gln Cys Arg Phe Glu Glu Ile Leu Ala Asn Phe
485 490 495485 490 495
Ala Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp AsnAla Ala Ile Pro Met Ile Phe Asp Glu Ile Ala Gln Asn Lys Asp Asn
500 505 510500 505 510
Leu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp LeuLeu Ala Gln Ile Ser Ile Lys Tyr Gln Asn Gln Gly Lys Lys Asp Leu
515 520 525515 520 525
Leu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp Leu LeuLeu Gln Ala Ser Ala Glu Asp Asp Val Lys Ala Ile Lys Asp Leu Leu
530 535 540530 535 540
Asp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His Ile SerAsp Gln Thr Asn Asn Leu Leu His Lys Leu Lys Ile Phe His Ile Ser
545 550 555 560545 550 555 560
Gln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His Phe TyrGln Ser Glu Asp Lys Ala Asn Ile Leu Asp Lys Asp Glu His Phe Tyr
565 570 575565 570 575
Leu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val Pro LeuLeu Val Phe Glu Glu Cys Tyr Phe Glu Leu Ala Asn Ile Val Pro Leu
580 585 590580 585 590
Tyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser Asp GluTyr Asn Lys Ile Arg Asn Tyr Ile Thr Gln Lys Pro Tyr Ser Asp Glu
595 600 605595 600 605
Lys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly Trp AspLys Phe Lys Leu Asn Phe Glu Asn Ser Thr Leu Ala Asn Gly Trp Asp
610 615 620610 615 620
Lys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys Asp AspLys Asn Lys Glu Pro Asp Asn Thr Ala Ile Leu Phe Ile Lys Asp Asp
625 630 635 640625 630 635 640
Lys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile Phe AspLys Tyr Tyr Leu Gly Val Met Asn Lys Lys Asn Asn Lys Ile Phe Asp
645 650 655645 650 655
Asp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys Ile ValAsp Lys Ala Ile Lys Glu Asn Lys Gly Glu Gly Tyr Lys Lys Ile Val
660 665 670660 665 670
Tyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe PheTyr Lys Leu Leu Pro Gly Ala Asn Lys Met Leu Pro Lys Val Phe Phe
675 680 685675 680 685
Ser Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu ArgSer Ala Lys Ser Ile Lys Phe Tyr Asn Pro Ser Glu Asp Ile Leu Arg
690 695 700690 695 700
Ile Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys GlyIle Arg Asn His Ser Thr His Thr Lys Asn Gly Ser Pro Gln Lys Gly
705 710 715 720705 710 715 720
Tyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile AspTyr Glu Lys Phe Glu Phe Asn Ile Glu Asp Cys Arg Lys Phe Ile Asp
725 730 735725 730 735
Phe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe GlyPhe Tyr Lys Gln Ser Ile Ser Lys His Pro Glu Trp Lys Asp Phe Gly
740 745 750740 745 750
Phe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe TyrPhe Arg Phe Ser Asp Thr Gln Arg Tyr Asn Ser Ile Asp Glu Phe Tyr
755 760 765755 760 765
Arg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn Ile SerArg Glu Val Glu Asn Gln Gly Tyr Lys Leu Thr Phe Glu Asn Ile Ser
770 775 780770 775 780
Glu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr Leu PheGlu Ser Tyr Ile Asp Ser Val Val Asn Gln Gly Lys Leu Tyr Leu Phe
785 790 795 800785 790 795 800
Gln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg Pro AsnGln Ile Tyr Asn Lys Asp Phe Ser Ala Tyr Ser Lys Gly Arg Pro Asn
805 810 815805 810 815
Leu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn Leu GlnLeu His Thr Leu Tyr Trp Lys Ala Leu Phe Asp Glu Arg Asn Leu Gln
820 825 830820 825 830
Asp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr Arg LysAsp Val Val Tyr Lys Leu Asn Gly Glu Ala Glu Leu Phe Tyr Arg Lys
835 840 845835 840 845
Gln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala Ile AlaGln Ser Ile Pro Lys Lys Ile Thr His Pro Ala Lys Glu Ala Ile Ala
850 855 860850 855 860
Asn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu Tyr AspAsn Lys Asn Lys Asp Asn Pro Lys Lys Glu Ser Val Phe Glu Tyr Asp
865 870 875 880865 870 875 880
Leu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe His CysLeu Ile Lys Asp Lys Arg Phe Thr Glu Asp Lys Phe Phe Phe His Cys
885 890 895885 890 895
Pro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe Asn AspPro Ile Thr Ile Asn Phe Lys Ser Ser Gly Ala Asn Lys Phe Asn Asp
900 905 910900 905 910
Glu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His Ile LeuGlu Ile Asn Leu Leu Leu Lys Glu Lys Ala Asn Asp Val His Ile Leu
915 920 925915 920 925
Ser Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val AspSer Ile Ala Arg Gly Glu Arg His Leu Ala Tyr Tyr Thr Leu Val Asp
930 935 940930 935 940
Gly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly AsnGly Lys Gly Asn Ile Ile Lys Gln Asp Thr Phe Asn Ile Ile Gly Asn
945 950 955 960945 950 955 960
Asp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu LysAsp Arg Met Lys Thr Asn Tyr His Asp Lys Leu Ala Ala Ile Glu Lys
965 970 975965 970 975
Asp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile LysAsp Arg Asp Ser Ala Arg Lys Asp Trp Lys Lys Ile Asn Asn Ile Lys
980 985 990980 985 990
Glu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala LysGlu Met Lys Glu Gly Tyr Leu Ser Gln Val Val His Glu Ile Ala Lys
995 1000 1005995 1000 1005
Leu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu AsnLeu Val Ile Glu Tyr Asn Ala Ile Val Val Phe Glu Asp Leu Asn
1010 1015 10201010 1015 1020
Phe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val TyrPhe Gly Phe Lys Arg Gly Arg Phe Lys Val Glu Lys Gln Val Tyr
1025 1030 10351025 1030 1035
Gln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu ValGln Lys Leu Glu Lys Met Leu Ile Glu Lys Leu Asn Tyr Leu Val
1040 1045 10501040 1045 1050
Phe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg AlaPhe Lys Asp Asn Glu Phe Asp Lys Thr Gly Gly Val Leu Arg Ala
1055 1060 10651055 1060 1065
Tyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly LysTyr Gln Leu Thr Ala Pro Phe Glu Thr Phe Lys Lys Met Gly Lys
1070 1075 10801070 1075 1080
Gln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser LysGln Thr Gly Ile Ile Tyr Tyr Val Pro Ala Gly Phe Thr Ser Lys
1085 1090 10951085 1090 1095
Ile Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys TyrIle Cys Pro Val Thr Gly Phe Val Asn Gln Leu Tyr Pro Lys Tyr
1100 1105 11101100 1105 1110
Glu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp LysGlu Ser Val Ser Lys Ser Gln Glu Phe Phe Ser Lys Phe Asp Lys
1115 1120 11251115 1120 1125
Ile Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe AspIle Cys Tyr Asn Leu Asp Lys Gly Tyr Phe Glu Phe Ser Phe Asp
1130 1135 11401130 1135 1140
Tyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr IleTyr Lys Asn Phe Gly Asp Lys Ala Ala Lys Gly Lys Trp Thr Ile
1145 1150 11551145 1150 1155
Ala Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp LysAla Ser Phe Gly Ser Arg Leu Ile Asn Phe Arg Asn Ser Asp Lys
1160 1165 11701160 1165 1170
Asn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu LeuAsn His Asn Trp Asp Thr Arg Glu Val Tyr Pro Thr Lys Glu Leu
1175 1180 11851175 1180 1185
Glu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly GluGlu Lys Leu Leu Lys Asp Tyr Ser Ile Glu Tyr Gly His Gly Glu
1190 1195 12001190 1195 1200
Cys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe PheCys Ile Lys Ala Ala Ile Cys Gly Glu Ser Asp Lys Lys Phe Phe
1205 1210 12151205 1210 1215
Ala Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg AsnAla Lys Leu Thr Ser Val Leu Asn Thr Ile Leu Gln Met Arg Asn
1220 1225 12301220 1225 1230
Ser Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val AlaSer Lys Thr Gly Thr Glu Leu Asp Tyr Leu Ile Ser Pro Val Ala
1235 1240 12451235 1240 1245
Asp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys AsnAsp Val Asn Gly Asn Phe Phe Asp Ser Arg Gln Ala Pro Lys Asn
1250 1255 12601250 1255 1260
Met Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly LeuMet Pro Gln Asp Ala Asp Ala Asn Gly Ala Tyr His Ile Gly Leu
1265 1270 12751265 1270 1275
Lys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu GlyLys Gly Leu Met Leu Leu Gly Arg Ile Lys Asn Asn Gln Glu Gly
1280 1285 12901280 1285 1290
Lys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu PheLys Lys Leu Asn Leu Val Ile Lys Asn Glu Glu Tyr Phe Glu Phe
1295 1300 13051295 1300 1305
Val Gln Asn Arg Asn AsnVal Gln Asn Arg Asn Asn
13101310
<210> 37<210> 37
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 37<400> 37
actgcggaaa tttgagcgt 19actgcggaaa tttgagcgt 19
<210> 38<210> 38
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 38<400> 38
acgctcaaat ttccgcagt 19acgctcaaat ttccgcagt 19
<210> 39<210> 39
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 39<400> 39
aggcaatggc tgcacatgc 19aggcaatggc tgcacatgc 19
<210> 40<210> 40
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 40<400> 40
gcatgtgcag ccattgcct 19gcatgtgcag ccattgcct 19
<210> 41<210> 41
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 41<400> 41
gacgcttggt tctgaggag 19gacgcttggt tctgaggag 19
<210> 42<210> 42
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 42<400> 42
ctcctcagaa ccaagcgtc 19ctcctcagaa ccaagcgtc 19
<210> 43<210> 43
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 43<400> 43
tccggaaacg cattcctct 19tccggaaacg cattcctct 19
<210> 44<210> 44
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 44<400> 44
agaggaatgc gtttccgga 19agaggaatgc gtttccgga 19
<210> 45<210> 45
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 45<400> 45
ccgcgtcagc ccggcccgg 19ccgcgtcagc ccggcccgg 19
<210> 46<210> 46
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 46<400> 46
ccgggccggg ctgacgcgg 19ccgggccggg ctgacgcgg 19
<210> 47<210> 47
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 47<400> 47
cgactcccgc tgggcctct 19cgactcccgc tgggcctct 19
<210> 48<210> 48
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 48<400> 48
agaggcccag cgggagtcg 19agaggcccag cgggagtcg 19
<210> 49<210> 49
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 49<400> 49
ccgttgcgcg ctcgctctc 19ccgttgcgcg ctcgctctc 19
<210> 50<210> 50
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 50<400> 50
gagagcgagc gcgcaacgg 19gagagcgagc gcgcaacgg 19
<210> 51<210> 51
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 51<400> 51
ccgcgcatcc tgccaggcc 19ccgcgcatcc tgccaggcc 19
<210> 52<210> 52
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 52<400> 52
ggcctggcag gatgcgcgg 19ggcctggcag gatgcgcgg 19
<210> 53<210> 53
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 53<400> 53
ccaacttggc gcgtttcgg 19ccaacttggc gcgtttcgg 19
<210> 54<210> 54
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 54<400> 54
ccgaaacgcg ccaagttgg 19ccgaaacgcg ccaagttgg 19
<210> 55<210> 55
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 55<400> 55
accacgcgtc cgagtccgg 19accacgcgtc cgagtccgg 19
<210> 56<210> 56
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 56<400> 56
ccggactcgg acgcgtggt 19ccggactcgg acgcgtggt 19
<210> 57<210> 57
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 57<400> 57
tgctcattgt ccctggaca 19tgctcattgt ccctggaca 19
<210> 58<210> 58
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 58<400> 58
tgtccaggga caatgagca 19tgtccaggga caatgagca 19
<210> 59<210> 59
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 59<400> 59
ggacaccctg ctcattgtc 19ggacaccctg ctcattgtc 19
<210> 60<210> 60
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 60<400> 60
gacaatgagc agggtgtcc 19gacaatgagc agggtgtcc 19
<210> 61<210> 61
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 61<400> 61
accggcagcc tgcgcgtcc 19accggcagcc tgcgcgtcc 19
<210> 62<210> 62
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 62<400> 62
ggacgcgcag gctgccggt 19ggacgcgcag gctgccggt 19
<210> 63<210> 63
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 63<400> 63
cgatgggcac ccactgctc 19cgatgggcac ccactgctc 19
<210> 64<210> 64
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 64<400> 64
gagcagtggg tgcccatcg 19gagcagtggg tgcccatcg 19
<210> 65<210> 65
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 65<400> 65
ccttcacgtg gacgcgcag 19ccttcacgtg gacgcgcag 19
<210> 66<210> 66
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 66<400> 66
ctgcgcgtcc acgtgaagg 19ctgcgcgtcc acgtgaagg 19
<210> 67<210> 67
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 67<400> 67
cgtgaaggtg gaagccttc 19cgtgaaggtg gaagccttc 19
<210> 68<210> 68
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 68<400> 68
gaaggcttcc accttcacg 19gaaggcttcc accttcacg 19
<210> 69<210> 69
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 69<400> 69
ctccttggtc aggcgccgg 19ctccttggtc aggcgccgg 19
<210> 70<210> 70
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 70<400> 70
ccggcgcctg accaaggag 19ccggcgcctg accaaggag 19
<210> 71<210> 71
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 71<400> 71
tggtcaggcg ccggttccg 19tggtcaggcg ccggttccg 19
<210> 72<210> 72
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 72<400> 72
cggaaccggc gcctgacca 19cggaaccggc gcctgacca 19
<210> 73<210> 73
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 73<400> 73
tagaggtcgc cttctcctc 19tagaggtcgc cttctcctc 19
<210> 74<210> 74
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 74<400> 74
gaggagaagg cgacctcta 19gaggagaagg cgacctcta 19
<210> 75<210> 75
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 75<400> 75
cgacgctcgg gtcgcggtg 19cgacgctcgg gtcgcggtg 19
<210> 76<210> 76
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 76<400> 76
caccgcgacc cgagcgtcg 19caccgcgacc cgagcgtcg 19
<210> 77<210> 77
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 77<400> 77
atgctgtcgc cgcgcgggg 19atgctgtcgc cgcgcgggg 19
<210> 78<210> 78
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 78<400> 78
ccccgcgcgg cgacagcat 19ccccgcgcgg cgacagcat 19
<210> 79<210> 79
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 79<400> 79
ctcaccctca ccggagcca 19ctcaccctca ccggagcca 19
<210> 80<210> 80
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 80<400> 80
tggctccggt gagggtgag 19tggctccggt gagggtgag 19
<210> 81<210> 81
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 81<400> 81
ccgcaaactt tactcctta 19ccgcaaactt tactcctta 19
<210> 82<210> 82
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 82<400> 82
taaggagtaa agtttgcgg 19taaggagtaaagtttgcgg 19
<210> 83<210> 83
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 83<400> 83
ctcctaagat tggcttcac 19ctcctaagat tggcttcac 19
<210> 84<210> 84
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 84<400> 84
gtgaagccaa tcttaggag 19gtgaagccaa tcttaggag 19
<210> 85<210> 85
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 85<400> 85
ccggagccac tcctaagat 19ccggagccac tcctaagat 19
<210> 86<210> 86
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 86<400> 86
atcttaggag tggctccgg 19atcttaggag tggctccgg 19
<210> 87<210> 87
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 87<400> 87
ttctctaccc tacgtctca 19ttctctacct tacgtctca 19
<210> 88<210> 88
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 88<400> 88
tgagacgtag ggtagagaa 19tgagacgtag ggtagagaa 19
<210> 89<210> 89
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 89<400> 89
tacgtctcat tctccgcaa 19tacgtctcat tctccgcaa 19
<210> 90<210> 90
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 90<400> 90
ttgcggagaa tgagacgta 19ttgcggagaa tgagacgta 19
<210> 91<210> 91
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 91<400> 91
gctaggcctc cagcccttc 19gctaggcctc cagcccttc 19
<210> 92<210> 92
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 92<400> 92
gaagggctgg aggcctagc 19gaagggctgg aggcctagc 19
<210> 93<210> 93
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 93<400> 93
acaggtggcg ccgcaactt 19acaggtggcg ccgcaactt 19
<210> 94<210> 94
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 94<400> 94
aagttgcggc gccacctgt 19aagttgcggc gccacctgt 19
<210> 95<210> 95
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 95<400> 95
agccggaggc gcgagagtc 19agccggaggc gcgagagtc 19
<210> 96<210> 96
<211> 19<211> 19
<212> ДНК<212> DNA
<213> Искусственная последовательность<213> Artificial sequence
<220><220>
<223> Синтетический полинуклеотид<223> Synthetic polynucleotide
<400> 96<400> 96
gactctcgcg cctccggct 19gactctcgcg cctccggct 19
<---<---
Claims (65)
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US62/660,023 | 2018-04-19 |
Related Child Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
RU2023124935A Division RU2023124935A (en) | 2018-04-19 | 2019-04-19 | COMPOSITIONS AND METHODS OF GENE EDITING |
Publications (2)
Publication Number | Publication Date |
---|---|
RU2020137717A RU2020137717A (en) | 2022-05-19 |
RU2804665C2 true RU2804665C2 (en) | 2023-10-03 |
Family
ID=
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016063264A1 (en) * | 2014-10-24 | 2016-04-28 | Ospedale San Raffaele S.R.L. | Permanent epigenetic gene silencing |
WO2018053035A1 (en) * | 2016-09-13 | 2018-03-22 | The Jackson Laboratory | Targeted dna demethylation and methylation |
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2016063264A1 (en) * | 2014-10-24 | 2016-04-28 | Ospedale San Raffaele S.R.L. | Permanent epigenetic gene silencing |
WO2018053035A1 (en) * | 2016-09-13 | 2018-03-22 | The Jackson Laboratory | Targeted dna demethylation and methylation |
Non-Patent Citations (2)
Title |
---|
JOHN P GUILINGER et al., Fusion of catalytically inactive Cas9 to FokI nuclease improves the specificity of genome modification, Nature Biotechnology, 2014, 32(6), pp.577-582. НЕМУДРЫЙ А.А. и др., Системы редактирования геномов TALEN и CRISPR/Cas - инструменты открытий, Acta naturae, 2014, ТОМ 6, N 3(22). * |
TAFADZWA MLAMBO et al., Designer epigenome modifiers enable robust and sustained gene silencing in clinically relevant human cells, Nucleic Acids Research, 10 March 2018, Vol. 46, No. 9, pp. 4456-4468. * |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112334577B (en) | Compositions and methods for gene editing | |
US20240309345A1 (en) | Compositions and methods for gene editing | |
JP7469433B2 (en) | Mutant CAS9 Protein | |
EP3382018B1 (en) | Dna methylation editing kit and dna methylation editing method | |
EP3344766B1 (en) | Systems and methods for selection of grna targeting strands for cas9 localization | |
US9499592B2 (en) | Transcription activator-like effectors | |
KR20160027191A (en) | Orthogonal cas9 proteins for rna-guided gene regulation and editing | |
CN110462034A (en) | Streptococcus pyogenes CAS9 mutated gene and polypeptide encoded by it | |
KR20160014036A (en) | Rna-guideded transcriptional regulation | |
US20230212323A1 (en) | Compositions and methods for epigenome editing | |
RU2804665C2 (en) | Compositions and methods of gene editing | |
CN116724058A (en) | Compositions and methods for gene editing | |
RU2791447C1 (en) | DNA CUTTER BASED ON THE ScCas12a PROTEIN FROM THE BACTERIUM SEDIMENTISPHAERA CYANOBACTERIORUM | |
Chapter et al. | CHAPTER II A-to-I RNA editing by using ADAR1 artificial deaminase system for restoration of genetic code in Ochre (UAA) stop codon | |
CN117062912A (en) | Fusion proteins for CRISPR-based transcriptional inhibition |