ОТКРЫТЫЕ БАЗЫ ДАННЫХ ДЛЯ БИОИНФОРМАЦИОННОГО АНАЛИЗА
awesome-healthcare-datasets
подборка клинических датасетов и баз
СhEMBL
Курируемая вручную база данных биоактивных молекул. Содержит информацию о клинических испытаниях, областях назначения, мишенях и др. по 2.3 млн соединений.
DrugBank
База данных лекарств с информацией об их механизмах действия, показаниях к назначению, побочных эффектах, мишенях, статусе клинических испытаний.
Drug Target Commons
Курируемая вручную открытая база данный, содержащая информацию о мишенях лекарств.
IUPHAR
Курируемая вручную база данных, содержащая информация о более 1700 мишенях и механизмах взаимодействия с различными лигандами, в том числе лекарствами.
Comparative Toxicogenomics Database
Курируемая вручную база данных, содержащая информацию о взаимодействии химических веществ с генами (белками) - мишенями и заболеваниями, и заболеваний с генами.
DGIdb (Drug-Gene Interaction Database)
База данных взаимодействия лекарств с генами-мишенями, аккумулирующая данные из других открытых баз данных и литературных источников. Включает как известные взаимодействия, так и потенциально возможные на основе близости гена к известным мишеням.
Therapeutic Target Database
База данных о мишенях лекарств, их активных центрах, соотвествующих лекарствах, заболеваниях и их биомаркерах (412 заболеваний, 512 биохимических классов мишеней, 32 механизма действия, 161 класс лекарств). Включает информацию о регуляции экспрессии мишеней (в том числе о соответствующих микроРНК). Возможность поиска лекарств по структурной близости и мишеней по сходству последовательности (BLAST).
PDSP Ki database
База данных констант связывания малых молекул с мишенями.
PHAROS
База данных, характеризующая мишени лекарств по биологическим функциям, ассоциированным заболеваниям, малым молекулам-модуляторам, интегрируя данные из множества открытых источников.
STITCH
База данных взаимодействия более 400000 малых молекул (включая лекарства и метаболиты) с белками у более чем 2000 организмов.
SIDER
https://snap.stanford.edu/biodata/datasets/10018/10018-ChSe-Decagon.html
База данных побочных эффектов лекарств.
SEP-L1000 LINCS
Результаты предсказания побочных эффектов лекарств на основе их транскрипционных сигнатур
Drug Repositioning Hub
База данных и библиотека лекарств, прошедших клинические испытания и находящихся на доклинической стадии (более 7000 веществ), их мишеней, механизмов взаимодействия, ассоциированных заболеваниях.
ClinicalTrials.gov
База данных результатов клинических испытаний, проводимых в различных странах.
LINCS
База данных транскрипционных сигнатур более 21000 малых молекул (наряду с другими пертурбагенами) в различных клеточных линиях.
http://dev3.ccs.miami.edu:8080/signatures/home,
https://maayanlab.cloud/sigcom-lincs/#/Download
SigComLINCS - UpDown
Поиск малых молекул и других малых молекул по их воздействию на экспрессию интересующих генов на основе результатов LINCS проектов. Возможна генерация сетов генов по коэкспрессии с интересующим геном (также возможен поиск по варианту) с помощью ARCHS.
SigComLINCS - GenePages
Поиск сигнатур, регулирующих один интересующий ген.
repoDB
База данных с информацией о результатах исследований по перепозиционированию из DrugBank и ClinicalTrials.gov, которая может использоваться для оценки эффективности новых подходов к перепозиционированию.
Open Targets
Платформа, интегрирующая данные, находящиеся в открытом доступе, в том числе полногеномных исследований ассоциаций и функциональной геномики для приоритизации генов-мишеней и полиморфизмов, ассоциированных с заболеваниями.
https://platform.opentargets.org/,
https://genetics.opentargets.org/
DRUG TARGETOR
Платформа для приоритизации лекарств и их мишеней для конкретного фенотипа с использованием данных GWAS.
IDG TIGA
Ресурс интегрирует данные полногеномных исследований ассоциаций из разных исследований для приоритизации потенциальных генов-мишеней. Для идентификации ассоциаций генов с фенотипами используются данные GWAS Catalog.
Harmonizome
База данных, интегрирующая списки генов и белков из множества ресурсов.
DisGeNET
Одна из наиболее обширных коллекций ассоциаций генов и вариантов с заболеваниями. Интегрирует данные из каталогов полногеномных исследований ассоциаций, научных публикаций и др.
SymMap
База данных, интегрирующая информацию о 499 растениях, используемых в традиционной китайской медицине, 961 симптомах, ассоциированных с ними 5235 заболеваниях, 19595 ингредиентах данных растений и 4302 генах-мишенях в фрпме гетерогенной сети.
DrugSig
База данных для исследований по переназначению лекарств, включающая 1300 лекарств, 800 мишеней и транскрипционных сигнатур лекарств (в качестве сигнатур взяты ведущих 500 генов со снижением и повышением экспрессии в ответ на лекарство). Есть функции для поиска лекарств-кандидатов для переназначения по сигнатуре (списку генов) или отдельному гену.
HERB
База данных, основанная на результатах транскриптомных исследований эффектов растений/ингредиентов, используемых в традиционной китайской медицине, связывающая 12933 мишени и 28212 заболеваний с 7263 растениями и 49258 ингредиентами.
OMIM
База данных о заболеваниях человека с генетическим компонентом и соответствующих генах.
GWAS Catalog
База данных результатов полногеномных исследований ассоциаций.
IEU Open GWAS
База данных результатов полногеномных исследований ассоциаций.
BIOBANK RUSSIA
База данных результатов полногеномных исследований ассоциаций в когорте из 4145 россиян.
MR-Base
База данных и аналитическая платформа для проведения Менделевской рандомизации.
DRKG (Drug Repurposing Knowledge Graph)
Граф связей между генами, лекарствами, заболеваниями, побочными эффектами, симптомами. Объединяет информацию из шести баз данных, включая DrugBank, Hetionet, GNBR, String, IntAct и DGIdb.
Hetionet
Граф биомедицинских данных из 29 открытых баз данных генов, лекарств, заболеванией и др.
GeoDatasets
В этой базе данных хранятся тщательно отобранные наборы данных по экспрессии генов, а также оригинальные записи серий и платформ в репозитории Gene Expression Omnibus (GEO).
ATLAS
АТЛАС это продукт с открытым исходным кодом, разработанный в рамках OHDSI, предоставляющий доступ к данным пациентов и аналитике.