Gene Set Enrichment Analysis
·
통계 & 머신러닝/생물정보통계 모델
Gene Set Enrichment Analysis`Gene Set Enrichment Analysis (GSEA)`는 `In Silico``pathway` 분석 기법으로, `microarray`나 `RNA-seq` 자료를 통해 특정 `gene set`이 관심있는 `표현형`과 얼마나 연관성이 있는지 확인하는 통계적 기법입니다. 여러 전통적인 기법과`PAEA`와 같은 새로운 방법의 검정법 등이 논문에 많이 그리고 새로이 등장하고 있습니다. 그 중 `GSEA`는 독보적인 위치에 있습니다. 그 이유로`GSEA`가 단순한 기술적 선점효과 뿐 아니라, 굉장히 단순하여 이해하기 쉬움으로부터 오는 해석력까지 갖추고 있기 때문으로 보입니다. 이번 포스트 에서는 그 원리를 한번 확인해보겠습니다.Enrichment Sco..
ZIBseq
·
통계 & 머신러닝/생물정보통계 모델
Intro  `Microbiome data` 분석 역시 그룹간 유의미하게 다른 microbiome을 찾는것이 정말 중요합니다. 참고로 Differentially Expressed Genes (DEG) 를 찾는 과정과 매우 유사하며, microbiome자료 에서는 유의미하게 다른 microbiome을 주로 Differential Abundance Features (DAFs) 라고 부른다. Microbiome data는 `ASV`나 `OTU`를 사용하는데, 결국 tabluar count data이기 때문에 기존의 RNAseq 분석 방법과 크게 다르지 않다 생각할 수 있습니다. 때문에 이전 포스터에서 소개한 `edgeR`과 `DESeq2`도 `DAFs`를 찾는데 사용이 가능하지만, `microbiome`의 생..
edgeR & DESeq2
·
통계 & 머신러닝/생물정보통계 모델
Intro  `edgeR`과 `DESeq2`는 RNAseq downstream analysis를 하다 보면 한번쯤은 보게되는 논문입니다. 두 가지 모두 `biomarker selection`에 대한 방법론과 해석을 제시합니다. 먼저 `edgeR`(2010)이 나오고 `DESeq2`(2014)가 나왔으며 두 논문 citation수가 (2022/10/12기준) 각각 27575회, 42124회 입니다. 엄청난 파워가 있는 논문들로 아직까지 커뮤니티에 질문과 답변이 활발하게 올라오고 있습니다.   이 논문들은 `biomarker selection`을 위한 `Differentially Expressed Gene(DEG)` 분석 논문입니다. DEG: control(normal healthy group)과 case(..