Один из пяти человеческих генов ненастоящий

Новые исследования могут изменить лицо биомедицины; обнаружено, что геном человека содержит гораздо меньше «настоящих» или кодирующих белок генов, чем считалось ранее.

Наша ДНК может содержать гораздо меньше «настоящих» генов, чем мы думали изначально.

В начале 1990-х годов ученые решили нанести на карту всю последовательность ДНК человеческого генома.

Так называемый проект «Геном человека» был направлен на поиск генетических связей с болезнями и понимание функции и структуры различных элементов генома, например, какие гены кодируют белки и какие факторы регулируют экспрессию генов.

Первоначальные результаты проекта «Геном человека» предсказывали, что существует 40 000 генов, которые могут кодировать белки, большие молекулы, которые жизненно важны для хорошего функционирования тканей и органов тела.

Однако, когда этот проект подходил к завершению в 2003 году, по оценкам, это число упало примерно до 20 000–25 000 генов, кодирующих белок.

С этого момента ученые стремились придумать окончательный протеом - то есть общее количество белков, которые могут быть экспрессированы генами - и сосредоточились на понимании того, как генетическая экспрессия этих белков мутирует при нескольких заболеваниях.

С этой целью международная группа исследователей во главе с Майклом Трессом из отдела биоинформатики Испанского национального центра онкологических исследований в Мадриде, Испания, в настоящее время изучила гены, которые, согласно основным доступным базам данных протеома, считаются кодирующими белки.

Тресс и коллеги опубликовали результаты своего исследования в журнале. Исследования нуклеиновых кислот. Федерико Абаскаль из Института Сэнгера Wellcome Trust в Хинкстоне, Соединенное Королевство, является первым автором статьи.

По крайней мере, 2000 генов являются «псевдогенами».

Исследователи сравнили протеомы из трех коллекций последовательностей белков и генетических аннотаций: GENCODE / Ensembl, RefSeq и UniProtKB.

Тресс и команда обнаружили, что из общего числа 22 210 генов, перечисленных как кодирующие белок, только 19 446 присутствуют во всех трех коллекциях.

Затем они увеличили разницу в 2764 гена, изучив экспериментальные данные и информацию, доступную из аннотаций.

Данные свидетельствуют о том, что большинство этих генов были «некодирующими генами или псевдогенами».

Кроме того, ученые обнаружили, что еще 1470 генов, которые были перечислены как кодирующие белок в трех коллекциях, не обладали функциональными характеристиками или типичной эволюцией генов, кодирующих белок.

Таким образом, исследователи «полагают, что в настоящее время в трех справочных базах данных количество кодирующих генов человека переоценивается как минимум на 2000, что усложняет и добавляет шума в крупномасштабные биомедицинские эксперименты».

«Определение того, какие из потенциальных некодирующих генов не кодируют белки, - сложная, но жизненно важная задача, поскольку эталонный протеом человека является фундаментальной опорой большинства фундаментальных исследований и поддерживает почти все крупномасштабные биомедицинские проекты».

Направления будущих исследований

Тресс рассказывает, как исследователи развивают свои открытия. «Мы смогли детально проанализировать многие из этих генов, - объясняет он, - и более 300 генов уже были классифицированы как некодирующие».

«Удивительно, - отмечает соавтор исследования Дэвид Хуан, - некоторые из этих необычных генов хорошо изучены и имеют более 100 научных публикаций, основанных на предположении, что ген производит белок».

Таким образом, результаты могут изменить область биомедицины в том виде, в котором мы ее знаем. Однако необходимы дополнительные исследования.

«Наши данные, - добавляет Абаскаль, - предполагают, что у людей может быть только 19 000 кодирующих генов, но мы до сих пор не знаем, какие [эти] 19 000 генов».

none:  сиделки - уход на дому волчья пасть иммунная система - вакцины