연구실소개
김용대. 지능형자료분석 연구실 https://idea.snu.ac.kr
High-dimensional Data Analysis
Survival Analysis
Bayesian Statistics
김지수. 위상 기반 통계 및 인공지능 연구실https://jkim82133.github.io
위상 기반 통계 및 인공지능 연구실에서는 위상 자료 분석(Topological Data Analysis, TDA)을 통계적으로 추정하고 기계학습(machine learning) 또는 자료 분석에 응용하는 방법을 주로 연구한다. 수학 분야인 위상수학에서는 국소적인 부분들이 대역적으로 어떻게 연결되어 있는지 탐구하는데, 이러한 위상적 특성을 자료 분석 시 활용하는 것을 위상 자료 분석이라고 한다. 우리는 이런 위상 자료 분석을 통계적인 모형 하에서 자료로부터 추정(inference)하는 통계적 방법과 관련 이론을 연구한다. 이를 위해 자료로부터 위상구조를 추정하는 상황에 맞는 계산 위상수학(computational topology)의 이론을 개발하고, 또한 위상 자료 분석이 요구하는 위상적 및 기하학적 조건에 맞게 기존의 통계 이론을 확장시킨다. 또한, 위상 자료 분석을 기계학습 또는 자료 분석에 실용적으로 적용하는 방법에 대해서도 병행하여 연구한다.
Topological Data Analysis
Statistical Inference on Topology and Geometry
Machine Learning Theory
Computational Topology
Clustering
문하은. 비모델 통계방법론 연구실https://sites.google.com/view/haeunmoon
본 연구실은 비모델 통계적 방법론과 그 응용에 대해 연구한다. 많은 데이터가 그 기저의 확률 분포나 변수간 관계를 사전에 특정하기 어려운 점을 감안하여, 이에 대한 가정을 없애거나 최소화할 수 있는 범용적인 방법론을 개발한다. 관련 주제는 가설 검정, 변수 선택, 예측 추론, 임계값 선택 등이 있으며, 이는 통계학과 데이터과학의 주요 주제를 포괄한다. 이러한 방법론을 실제 데이터에 적용하여, 신뢰할 수 있고 효율적인 결과를 도출하는 것을 목표로 한다.
Independence Testing
Model-Free Analysis
Handling Missing Data
Omics Data Analysis
박건웅. 데이터사이언스&머신러닝 연구실https://sites.google.com/view/gwpark
본 연구실은 의사결정이 요구되는 다양한 분야에 적용가능한 통계적 방법론 개발을 목표로 한다. 따라서 강화학습, 추천시스템, 네트워크분석, 그래피컬모델, 인과관계추론 등의 다양한 주제를 다루며, 이들의 이론적 토대를 탐구하고 최적의 알고리즘 개발에 중점을 둔다.
Causal inference
Graphical model learning
High-dimensional and robust learning
Network Analysis
Reinforcement learning
박병욱. 비모수추론 연구실 https://sites.google.com/view/theostat
데이터의 양이 방대해지고 복잡도가 증가함에 따라 유한차원의 모수공간을 가정하는 모수적 방법의 경우, 통계적 추론의 융통성을 기대하기 어렵다. 이를 극복하기 위해 모수공간을 무한차원으로 확장하는 통계적 방법론이 요구되며, 확장된 공간에서 추론의 융통성을 보장하는 모형과 추정 방법에 대한 연구가 필요하다. 특히, 데이터 수집 기술의 급격한 발전으로 데이터가 다변화된 현대에 이르러서는 유클리드 기하학에 바탕을 둔 방법론 대신에 데이터 고유의 기하학적 구조를 고려한 올바른 분석 기법을 개발하는 것 또한 통계학의 중요한 역할이 되었다. 본 연구실에서는 비유클리드 공간에서 값을 가지는 데이터를 분석하는데 필요한 비모수적 방법과 준모수적 방법을 연구하고 있다. 특히, 모형의 차원은 무한으로 유지하여 모형의 융통성을 보장하는 동시에 차원의 저주를 받지 않도록 특별한 구조를 가정하는 비모수구조모형의 추정이론을 중점적으로 개발하고 있다. 이러한 방법론의 개발과 함께 산학협력을 통하여 개발된 방법을 실용화하는 연구도 병행하고 있다.
Structured Nonparametric Models
Semiparametric Inference
Non-Euclidean Data Analysis
박태성. 생물정보통계 연구실 http://bibs.snu.ac.kr
Missing data analysis
Microarray data analysis
Statistical Genetics
Gene-Gene interaction model
Integrated Omics Data analysis
신예은. 예측모형 연구실 https://sites.google.com/view/yeieunshin
본 연구실은 암 또는 질병의 위험을 분석하기 위한 통계적 방법들을 개발한다. 주로 기존 이론을 적용하기에 간단하지 않은 여러 질병들의 경쟁 위험과 복잡한 형태의 위험 인자들 (예를 들면, 신체활동량 측정 가속도계, 산업 및 환경 변수, 신진대사 불균형) 과의 관계를 분석한다. 개발된 모형은 전 세계 암 역학 연구의 다양한 코호트 자료에 실제로 응용하며, 불완전한 코호트 자료 (case-cohort 혹은 nested case-control과 같이 계층적으로 디자인된 코호트)에서 모형의 추정과 검증을 개선하는 데 특히 관심이 있다.
Biostatistics
Survival Analysis
Spatiotemporal Statistics
Missing Data
Survey Sampling
오희석. 통계적 다중척도 분석 연구실 https://sites.google.com/view/snumultiscale
자연과학, 공학을 포함한 다양한 분야에서 관측되는 많은 자료나 현상들은 구조가 복잡하여 하나의 관점(척도, singlescale)으로 그 복잡성을 이해하기 쉽지 않다. 이와 같은 복잡자료(complex data)를 다중척도(multiscale)로 표현한다면 보다 효과적으로 자료의 구조 및 특성을 이해하고 정리할 수 있다. 본 연구실에서는 통계모형화와 추론에 다중척도방법을 접목하여 통계이론과 방법론 및 응용의 확장을 목표로 한다. 구체적인 연구분야는 통계학과 다중척도방법(multiscale methods in statistics), 함수추정(function estimation), 시계열분석(time series analysis) 등이다.
Spatial-temporal data analysis
Statistical methods for climatology
원중호. 통계계산 연구실 https://won-j.github.io
High-performance statistical computing
Optimization – MM algorithms, proximal algorithms
Machine learning
Image processing
이권상. 인과추론 연구실 https://www.kwonsanglee.com
본 연구실에서는 통계적 인과추론의 이론과 방법론을 연구한다. 효과적이면서도 정확하게 인과관계를 추론할 수 있는 실험 또는 관찰연구의 설계와 분석을 주로 연구한다. 예를 들어, 미처 관측하지 못한 교란변수가 분석과정에 미치는 영향을 최소화하는 설계디자인을 만들어 내는 연구를 진행한다. 분석과정에서는 이질적 효과를 발견하여 처리효과(treatment effect)에 대한 이해를 높이며, 효과적인 추정을 가능하게 하는 방법론에 대해 연구한다. 이러한 연구는 의학, 보건, 사회과학 등 다양한 학문에 적용되어 다양한 문제들에 중요한 통찰력을 제공할 수 있다.
Causal inference
Design and analysis of observational studies
Effect modification/Heterogeneous treatment effect
Sensitivity analysis
Application in medicine, public health and social sciences.
이상열. 시계열 예측분석 연구실 https://sites.google.com/snu.ac.kr/tspa
Change point analysis and statistical process control
Environmental and healthcare statistics
Social science data and SNS analysis
Predictive analytics and machine learning
이재용. 베이즈 연구실 https://snubayes.org
베이즈 추론은 통계적 추론의 한 방식으로 영국의 장로교 목사이자 수학자였던 토마스 베이즈가 신의 존재를 증명하고자 하는 의도로 쓴 논문을 기원으로 한다. 베이즈 추론은 불확실성을 가진 정보를 확률분포로 표현하고, 이를 이용하여 통계적 추론을 한다. 불확실성이 있는 정보를 자연스럽게 표현할 수 있는 장점으로 인해 기상학, 의학, 공학, 인공지능 등의 다양한 분야에서 사용되고 있다. 본 연구실에서는 베이즈 추론의 다양한 분야를 연구한다. 주요 연구분야는 고차원 모형 추론과 미분방정식 모형과 비모수 베이즈추론과 베이즈 통계의 다양한 응용 분야 적용이다. 각 적용 분야에서 새로운 통계추론 방법을 개발하고, 이 방법들의 이론적 성질 규명과 베이즈 계산 방법 등을 연구하고 있다.
Bayesian Statistics
High-dimensional statistical inference
Differential equation models.
Nonparametric Bayesian models
임요한. 다변량통계 연구실 https://sites.google.com/view/mvstat
Order related statistical inference
Latent variable models
Statistical computing
임채영. 공간통계 연구실 https://limcstat.github.io
본 연구실에서는 공중보건, 기후/환경, 뇌과학, 의생물공학, 사회과학 등 다양한 분야에서 얻어지는 공간 또는 시공간데이터를 분석하기 위한 통계방법론의 개발 및 이를 활용한 응용문제에 대해 연구한다.
High-dimensional statistical models
Bayesian asymptotics
Monte Carlo methods
Bayesian statistical methods in climatology, biology and medical science
장원철. 고차원 대용량 자료분석 연구실
본 연구실은 천문학, 뇌인지과학, 생물정보학분야에 혼히 볼 수 있는 고차원 대용량 자료의 분석과 그에 필요한 새로운 통계적 방법론에 대해 연구한다. 이러한 방법론들의 예를 들자면 우주거대 구조 (large structure of the universe)를 이해하기 위해서는 은하 군집(galaxy clusters)의 분포에 관한 추론, fMRI분석에서 사용되는 고차원 자료를 위한 다중검정방법등을 들 수 있다. 또한 고차원 모형에 분석에 있어서 중요한 이론적 토대를 제공하는 shrinkage estimator에 대한 연구와 이를 이용한 새로운 통계적 모형에 대해 연구한다.
Multiple Testing
Social Network Analysis
Statistical Applications in Astronomy and Neuroscience
정성규. 통계적학습이론 연구실https://statlet.github.io
Analysis of structured, geometric and non-Euclidean data
Statistical learning
Junyong Park. 고차원 다중검정 연구실
Multiple testing
Classification in high dimension
Bioinformatics
Meta Analysis
Won Chang. 불확실성 정량화 연구실https://www.wonchang.net
복잡한 수학적 모델 및 머신러닝 모델의 효과적인 활용을 위해서는 적절한 불확실성 정량화가 필수적이다. 우리 연구실은 가우시안 프로세스와 심층 신경망과 같은 첨단 머신러닝 기법을 활용하여, 통계적으로 타당하고 과학적으로 유용한 불확실성 정량화 방법을 개발하는 것을 목표로 한다. 이를 위해 변분 베이지안 딥러닝 방법론 및 대규모 시공간 데이터를 위한 비모수 베이지안 방법론을 연구하고 있으며, 개발된 방법들을 기후 변화 연구, 질병 모델링, 유전자 군집화와 같은 다양한 분야에 적용하고 있다.
Uncertainty Quantification
Machine Learning for Enviromnetal Research
Machine Learning for Biomedical Research
Spatio-Temporal Modeling