ОТКРЫТЫЕ БАЗЫ ДАННЫХ ДЛЯ БИОИНФОРМАЦИОННОГО АНАЛИЗА

awesome-healthcare-datasets

подборка клинических датасетов и баз

СhEMBL

Курируемая вручную база данных биоактивных молекул. Содержит информацию о клинических испытаниях, областях назначения, мишенях и др. по 2.3 млн соединений.

DrugBank

База данных лекарств с информацией об их механизмах действия, показаниях к назначению, побочных эффектах, мишенях, статусе клинических испытаний.

Drug Target Commons

Курируемая вручную открытая база данный, содержащая информацию о мишенях лекарств.

IUPHAR

Курируемая вручную база данных, содержащая информация о более 1700 мишенях и механизмах взаимодействия с различными лигандами, в том числе лекарствами.

Comparative Toxicogenomics Database

Курируемая вручную база данных, содержащая информацию о взаимодействии химических веществ с генами (белками) - мишенями и заболеваниями, и заболеваний с генами.

DGIdb (Drug-Gene Interaction Database)

База данных взаимодействия лекарств с генами-мишенями, аккумулирующая данные из других открытых баз данных и литературных источников. Включает как известные взаимодействия, так и потенциально возможные на основе близости гена к известным мишеням.

Therapeutic Target Database

База данных о мишенях лекарств, их активных центрах, соотвествующих лекарствах, заболеваниях и их биомаркерах (412 заболеваний, 512 биохимических классов мишеней, 32 механизма действия, 161 класс лекарств). Включает информацию о регуляции экспрессии мишеней (в том числе о соответствующих микроРНК). Возможность поиска лекарств по структурной близости и мишеней по сходству последовательности (BLAST).

PDSP Ki database

База данных констант связывания малых молекул с мишенями.

PHAROS

База данных, характеризующая мишени лекарств по биологическим функциям, ассоциированным заболеваниям, малым молекулам-модуляторам, интегрируя данные  из множества открытых источников.

STITCH

База данных взаимодействия более 400000 малых молекул (включая лекарства и метаболиты) с белками у более чем 2000 организмов.

SIDER 

https://snap.stanford.edu/biodata/datasets/10018/10018-ChSe-Decagon.html

База данных побочных эффектов лекарств.

SEP-L1000 LINCS

Результаты предсказания побочных эффектов лекарств на основе их транскрипционных сигнатур

Drug Repositioning Hub

База данных и библиотека лекарств, прошедших клинические испытания и находящихся на доклинической стадии (более 7000 веществ), их мишеней, механизмов взаимодействия, ассоциированных заболеваниях. 

ClinicalTrials.gov

База данных результатов клинических испытаний, проводимых в различных странах.

LINCS

База данных транскрипционных сигнатур более 21000 малых молекул (наряду с другими пертурбагенами) в различных клеточных линиях.

http://dev3.ccs.miami.edu:8080/signatures/home

https://maayanlab.cloud/sigcom-lincs/#/Download

SigComLINCS - UpDown

Поиск малых молекул и других малых молекул по их воздействию на экспрессию интересующих генов на основе результатов LINCS проектов. Возможна генерация сетов генов по коэкспрессии с интересующим геном (также возможен поиск по варианту) с помощью ARCHS.

SigComLINCS - GenePages

Поиск сигнатур, регулирующих один интересующий ген.

repoDB

База данных с информацией о результатах исследований по перепозиционированию из DrugBank и ClinicalTrials.gov, которая может использоваться для оценки эффективности новых подходов к перепозиционированию.

Open Targets

Платформа, интегрирующая данные, находящиеся в открытом доступе, в том числе полногеномных исследований ассоциаций и функциональной геномики для приоритизации генов-мишеней и полиморфизмов, ассоциированных с заболеваниями.

https://platform.opentargets.org/

https://genetics.opentargets.org/

DRUG TARGETOR

Платформа для приоритизации лекарств и их мишеней для конкретного фенотипа с использованием данных GWAS. 

IDG TIGA

Ресурс интегрирует данные полногеномных исследований ассоциаций из разных исследований для приоритизации потенциальных генов-мишеней. Для идентификации ассоциаций генов с фенотипами используются данные GWAS Catalog.

Harmonizome

База данных, интегрирующая списки генов и белков из множества ресурсов.

DisGeNET

Одна из наиболее обширных коллекций ассоциаций генов и вариантов с заболеваниями. Интегрирует данные из каталогов полногеномных исследований ассоциаций, научных публикаций и др.

SymMap

База данных, интегрирующая информацию о 499 растениях, используемых в традиционной китайской медицине, 961 симптомах, ассоциированных с ними 5235 заболеваниях, 19595 ингредиентах данных растений и  4302 генах-мишенях в фрпме гетерогенной сети.

DrugSig

База данных для исследований по переназначению лекарств, включающая 1300 лекарств, 800 мишеней и транскрипционных сигнатур лекарств (в качестве сигнатур взяты ведущих 500 генов со снижением и повышением экспрессии в ответ на лекарство). Есть функции для поиска лекарств-кандидатов для переназначения по сигнатуре (списку генов) или отдельному гену.

HERB

База данных, основанная на результатах  транскриптомных исследований эффектов растений/ингредиентов, используемых в традиционной китайской медицине, связывающая 12933 мишени и 28212 заболеваний с 7263 растениями и  49258 ингредиентами.

OMIM

База данных о заболеваниях человека с генетическим компонентом и соответствующих генах.

GWAS Catalog

База данных результатов  полногеномных исследований ассоциаций.

IEU Open GWAS

База данных результатов  полногеномных исследований ассоциаций.

BIOBANK RUSSIA

База данных результатов полногеномных исследований ассоциаций в когорте из 4145 россиян.

MR-Base

База данных и аналитическая платформа для проведения Менделевской рандомизации.

DRKG (Drug Repurposing Knowledge Graph)

Граф связей между генами, лекарствами, заболеваниями, побочными эффектами, симптомами. Объединяет информацию из шести баз данных, включая DrugBank, Hetionet, GNBR, String, IntAct и DGIdb.

Hetionet

Граф биомедицинских данных из 29 открытых баз данных генов, лекарств, заболеванией и др. 

GeoDatasets

В этой базе данных хранятся тщательно отобранные наборы данных по экспрессии генов, а также оригинальные записи серий и платформ в репозитории Gene Expression Omnibus (GEO).

ATLAS

АТЛАС это продукт с открытым исходным кодом, разработанный в рамках OHDSI, предоставляющий доступ к данным пациентов и аналитике.

Подборка открытых баз на сайте OpenDataScience