Один из пяти человеческих генов ненастоящий
Новые исследования могут изменить лицо биомедицины; обнаружено, что геном человека содержит гораздо меньше «настоящих» или кодирующих белок генов, чем считалось ранее.
Наша ДНК может содержать гораздо меньше «настоящих» генов, чем мы думали изначально.В начале 1990-х годов ученые решили нанести на карту всю последовательность ДНК человеческого генома.
Так называемый проект «Геном человека» был направлен на поиск генетических связей с болезнями и понимание функции и структуры различных элементов генома, например, какие гены кодируют белки и какие факторы регулируют экспрессию генов.
Первоначальные результаты проекта «Геном человека» предсказывали, что существует 40 000 генов, которые могут кодировать белки, большие молекулы, которые жизненно важны для хорошего функционирования тканей и органов тела.
Однако, когда этот проект подходил к завершению в 2003 году, по оценкам, это число упало примерно до 20 000–25 000 генов, кодирующих белок.
С этого момента ученые стремились придумать окончательный протеом - то есть общее количество белков, которые могут быть экспрессированы генами - и сосредоточились на понимании того, как генетическая экспрессия этих белков мутирует при нескольких заболеваниях.
С этой целью международная группа исследователей во главе с Майклом Трессом из отдела биоинформатики Испанского национального центра онкологических исследований в Мадриде, Испания, в настоящее время изучила гены, которые, согласно основным доступным базам данных протеома, считаются кодирующими белки.
Тресс и коллеги опубликовали результаты своего исследования в журнале. Исследования нуклеиновых кислот. Федерико Абаскаль из Института Сэнгера Wellcome Trust в Хинкстоне, Соединенное Королевство, является первым автором статьи.
По крайней мере, 2000 генов являются «псевдогенами».
Исследователи сравнили протеомы из трех коллекций последовательностей белков и генетических аннотаций: GENCODE / Ensembl, RefSeq и UniProtKB.
Тресс и команда обнаружили, что из общего числа 22 210 генов, перечисленных как кодирующие белок, только 19 446 присутствуют во всех трех коллекциях.
Затем они увеличили разницу в 2764 гена, изучив экспериментальные данные и информацию, доступную из аннотаций.
Данные свидетельствуют о том, что большинство этих генов были «некодирующими генами или псевдогенами».
Кроме того, ученые обнаружили, что еще 1470 генов, которые были перечислены как кодирующие белок в трех коллекциях, не обладали функциональными характеристиками или типичной эволюцией генов, кодирующих белок.
Таким образом, исследователи «полагают, что в настоящее время в трех справочных базах данных количество кодирующих генов человека переоценивается как минимум на 2000, что усложняет и добавляет шума в крупномасштабные биомедицинские эксперименты».
«Определение того, какие из потенциальных некодирующих генов не кодируют белки, - сложная, но жизненно важная задача, поскольку эталонный протеом человека является фундаментальной опорой большинства фундаментальных исследований и поддерживает почти все крупномасштабные биомедицинские проекты».
Направления будущих исследований
Тресс рассказывает, как исследователи развивают свои открытия. «Мы смогли детально проанализировать многие из этих генов, - объясняет он, - и более 300 генов уже были классифицированы как некодирующие».
«Удивительно, - отмечает соавтор исследования Дэвид Хуан, - некоторые из этих необычных генов хорошо изучены и имеют более 100 научных публикаций, основанных на предположении, что ген производит белок».
Таким образом, результаты могут изменить область биомедицины в том виде, в котором мы ее знаем. Однако необходимы дополнительные исследования.
«Наши данные, - добавляет Абаскаль, - предполагают, что у людей может быть только 19 000 кодирующих генов, но мы до сих пор не знаем, какие [эти] 19 000 генов».