연구실소개

김용대. 지능형자료분석 연구실 https://idea.snu.ac.kr

소개
불확실한 현상들에 대하여 질서와 법칙을 발견하고 연구한다. 현대 통계학의 대표적인 이론분야인 경험과정(Empirical Process)을 기본으로 다양한 응용분야에 대한 이론과 방법론을 개발한다. 특히 대용량 자료의 패턴과 관계를 분석하는 데이터마이닝(Data Mining), 개체의 수명과 원인 등을 분석하는 생존분석(Survival Analysis), 베이지안 방법론(Bayesian Statistics) 등을 연구한다.
관심분야
Statistical Learning and Data Mining
High-dimensional Data Analysis
Survival Analysis
Bayesian Statistics

김지수. 위상 기반 통계 및 인공지능 연구실https://jkim82133.github.io

소개

위상 기반 통계 및 인공지능 연구실에서는 위상 자료 분석(Topological Data Analysis, TDA)을 통계적으로 추정하고 기계학습(machine learning) 또는 자료 분석에 응용하는 방법을 주로 연구한다. 수학 분야인 위상수학에서는 국소적인 부분들이 대역적으로 어떻게 연결되어 있는지 탐구하는데, 이러한 위상적 특성을 자료 분석 시 활용하는 것을 위상 자료 분석이라고 한다. 우리는 이런 위상 자료 분석을 통계적인 모형 하에서 자료로부터 추정(inference)하는 통계적 방법과 관련 이론을 연구한다. 이를 위해 자료로부터 위상구조를 추정하는 상황에 맞는 계산 위상수학(computational topology)의 이론을 개발하고, 또한 위상 자료 분석이 요구하는 위상적 및 기하학적 조건에 맞게 기존의 통계 이론을 확장시킨다. 또한, 위상 자료 분석을 기계학습 또는 자료 분석에 실용적으로 적용하는 방법에 대해서도 병행하여 연구한다.

관심분야

Topological Data Analysis
Statistical Inference on Topology and Geometry
Machine Learning Theory
Computational Topology
Clustering

문하은. 비모델 통계방법론 연구실https://sites.google.com/view/haeunmoon

소개

본 연구실은 비모델 통계적 방법론과 그 응용에 대해 연구한다. 많은 데이터가 그 기저의 확률 분포나 변수간 관계를 사전에 특정하기 어려운 점을 감안하여, 이에 대한 가정을 없애거나 최소화할 수 있는 범용적인 방법론을 개발한다. 관련 주제는 가설 검정, 변수 선택, 예측 추론, 임계값 선택 등이 있으며, 이는 통계학과 데이터과학의 주요 주제를 포괄한다. 이러한 방법론을 실제 데이터에 적용하여, 신뢰할 수 있고 효율적인 결과를 도출하는 것을 목표로 한다.

관심분야

Independence Testing
Model-Free Analysis
Handling Missing Data
Omics Data Analysis

박건웅. 데이터사이언스&머신러닝 연구실https://sites.google.com/view/gwpark

소개

본 연구실은 의사결정이 요구되는 다양한 분야에 적용가능한 통계적 방법론 개발을 목표로 한다. 따라서 강화학습, 추천시스템, 네트워크분석, 그래피컬모델, 인과관계추론 등의 다양한 주제를 다루며, 이들의 이론적 토대를 탐구하고 최적의 알고리즘 개발에 중점을 둔다.

관심분야

Causal inference
Graphical model learning
High-dimensional and robust learning
Network Analysis
Reinforcement learning

박병욱. 비모수추론 연구실 https://sites.google.com/view/theostat

소개

데이터의 양이 방대해지고 복잡도가 증가함에 따라 유한차원의 모수공간을 가정하는 모수적 방법의 경우, 통계적 추론의 융통성을 기대하기 어렵다. 이를 극복하기 위해 모수공간을 무한차원으로 확장하는 통계적 방법론이 요구되며, 확장된 공간에서 추론의 융통성을 보장하는 모형과 추정 방법에 대한 연구가 필요하다. 특히, 데이터 수집 기술의 급격한 발전으로 데이터가 다변화된 현대에 이르러서는 유클리드 기하학에 바탕을 둔 방법론 대신에 데이터 고유의 기하학적 구조를 고려한 올바른 분석 기법을 개발하는 것 또한 통계학의 중요한 역할이 되었다. 본 연구실에서는 비유클리드 공간에서 값을 가지는 데이터를 분석하는데 필요한 비모수적 방법과 준모수적 방법을 연구하고 있다. 특히, 모형의 차원은 무한으로 유지하여 모형의 융통성을 보장하는 동시에 차원의 저주를 받지 않도록 특별한 구조를 가정하는 비모수구조모형의 추정이론을 중점적으로 개발하고 있다. 이러한 방법론의 개발과 함께 산학협력을 통하여 개발된 방법을 실용화하는 연구도 병행하고 있다.

관심분야

Structured Nonparametric Models
Semiparametric Inference
Non-Euclidean Data Analysis

박태성. 생물정보통계 연구실 http://bibs.snu.ac.kr

소개
생물정보통계(BioInformatics & BioStatistics, BIBS) 연구실은 국내의 생물통계학과 생물정보학 분야의 연구를 선도하고 있으며 2005년에 통계학 분야 최초로 NRL(National Research Laboratory)로 선정되어 5년간 유전체, 전사체 연구를 이끌어왔다. 최근에는 NRL을 통해 축척한 연구 결과를 바탕으로 통계학 분야 최초로 2012년에 창의연구단으로 선정되어 최장 9년간 장기간 동안 대규모의 고차원 생물정보학 자료의 분석을 위한 연구에 집중할 수 있는 기반이 마련되었다. 생물정보통계연구실은 다양한 종류의 대규모 임상자료와 생물학 자료를 분석하기위해 통계학에 기반한 연구방법론의 개발 및 응용에 초점을 맞춘 연구를 진행하고 있으며 통계학에 기반한 생물정보학 연구를 수행하고 있다. 특히 최근의 새로운 유전체 기술의 발달로 인해 대용량의 유전체데이터가 낮은 가격으로 생산되면서, 개인수준에서도 유전정보를 뽑아낼 수 있는 시대가 도래하였다. 따라서 다양하고 방대한 자료들 중 의미 있는 정보를 효율적으로 찾아내기 위해 통계학의 필요성이 더 절실해졌다. 또한 통계학의 여러 가지 방법들이 이러한 대규모 오믹스 자료의 분석에 응용됨으로써, 질병 연구에 큰 기여를 하고 있다. 생물정보통계연구실에서는 마이크로어레이 기술을 이용한 유전자 발현이나 단일염기다형성(SNP)과 같은 유전체 자료뿐 아니라, 최근 개발된 차세대염기서열해독(NGS) 기술을 통한 유전체 및, 후성유전체 자료 등 다양한 종류의 오믹스 자료를 통합하여 분석하기위한 통계학 기반의 분석 방법 및 기술을 연구하고 있다. 더 나아가서 유전자간의 복잡한 상호작용탐지 및 여러 수준의 오믹스 자료를 통합 분석할 수 있는 방법을 개발하여, 생물학적 현상의 보다 깊은 이해를 도모하고 질병이 일어나는 원인 및 기작 등을 밝혀내어 인류복지증진에 기여하는 것이 목표이다.
관심분야
Repeated Measures data analysis
Missing data analysis
Microarray data analysis
Statistical Genetics
Gene-Gene interaction model
Integrated Omics Data analysis

신예은. 예측모형 연구실 https://sites.google.com/view/yeieunshin

소개

본 연구실은 암 또는 질병의 위험을 분석하기 위한 통계적 방법들을 개발한다. 주로 기존 이론을 적용하기에 간단하지 않은 여러 질병들의 경쟁 위험과 복잡한 형태의 위험 인자들 (예를 들면, 신체활동량 측정 가속도계, 산업 및 환경 변수, 신진대사 불균형) 과의 관계를 분석한다. 개발된 모형은 전 세계 암 역학 연구의 다양한 코호트 자료에 실제로 응용하며, 불완전한 코호트 자료 (case-cohort 혹은 nested case-control과 같이 계층적으로 디자인된 코호트)에서 모형의 추정과 검증을 개선하는 데 특히 관심이 있다.

관심분야

Biostatistics
Survival Analysis
Spatiotemporal Statistics
Missing Data
Survey Sampling

오희석. 통계적 다중척도 분석 연구실 https://sites.google.com/view/snumultiscale

소개

자연과학, 공학을 포함한 다양한 분야에서 관측되는 많은 자료나 현상들은 구조가 복잡하여 하나의 관점(척도, singlescale)으로 그 복잡성을 이해하기 쉽지 않다. 이와 같은 복잡자료(complex data)를 다중척도(multiscale)로 표현한다면 보다 효과적으로 자료의 구조 및 특성을 이해하고 정리할 수 있다. 본 연구실에서는 통계모형화와 추론에 다중척도방법을 접목하여 통계이론과 방법론 및 응용의 확장을 목표로 한다. 구체적인 연구분야는 통계학과 다중척도방법(multiscale methods in statistics), 함수추정(function estimation), 시계열분석(time series analysis) 등이다.

관심분야
Multiscale methods in statistics
Spatial-temporal data analysis
Statistical methods for climatology

원중호. 통계계산 연구실 https://won-j.github.io

소개
본 연구실은 공학, 금융, 의료 분야에서 나타나는 고처리량 (high-throughput) 자료의 통계적 상호작용 패턴을 찾아내는 계산적 방법론을 주로 연구한다. 특히 대용량 데이터 분석을 위한 고성능 컴퓨팅 (high-performance computing; HPC) 기법을 적극적으로 통계 계산 문제에 적용하고자 한다.
관심분야

High-performance statistical computing
Optimization – MM algorithms, proximal algorithms
Machine learning
Image processing

이권상. 인과추론 연구실 https://www.kwonsanglee.com

소개

본 연구실에서는 통계적 인과추론의 이론과 방법론을 연구한다. 효과적이면서도 정확하게 인과관계를 추론할 수 있는 실험 또는 관찰연구의 설계와 분석을 주로 연구한다. 예를 들어, 미처 관측하지 못한 교란변수가 분석과정에 미치는 영향을 최소화하는 설계디자인을 만들어 내는 연구를 진행한다. 분석과정에서는 이질적 효과를 발견하여 처리효과(treatment effect)에 대한 이해를 높이며, 효과적인 추정을 가능하게 하는 방법론에 대해 연구한다. 이러한 연구는 의학, 보건, 사회과학 등 다양한 학문에 적용되어 다양한 문제들에 중요한 통찰력을 제공할 수 있다.

관심분야

Causal inference
Design and analysis of observational studies
Effect modification/Heterogeneous treatment effect
Sensitivity analysis
Application in medicine, public health and social sciences.

이상열. 시계열 예측분석 연구실 https://sites.google.com/snu.ac.kr/tspa

소개
본 연구실에서는 재정시계열분석 (financial time series analysis), 위험관리 (risk management), 모형의 변화점 탐지 (change point analysis) 및 통계적 공정관리 (statistical process control), 환경보건통계학 (environmental and healthcare statistics), 예측분석방법론 (predictive analytics) 및 사회과학 자료 분석 (social science statistics) 등을 주로 연구하고 있다. 또한 모형의 적합도 검정 (goodness of fit test), 극단값 이론 (extreme value theory) 등도 주요한 연구 분야중 하나이다. 최근에는 support vector machine 및 deep learning 알고리즘을 기존의 시계열 모형과 결합하는 hybrid method의 개발을 중점적으로 시도하고 있다.
관심분야
Financial time series analysis and risk management
Change point analysis and statistical process control
Environmental and healthcare statistics
Social science data and SNS analysis
Predictive analytics and machine learning

이재용. 베이즈 연구실 https://snubayes.org

소개

베이즈 추론은 통계적 추론의 한 방식으로 영국의 장로교 목사이자 수학자였던 토마스 베이즈가 신의 존재를 증명하고자 하는 의도로 쓴 논문을 기원으로 한다. 베이즈 추론은 불확실성을 가진 정보를 확률분포로 표현하고, 이를 이용하여 통계적 추론을 한다. 불확실성이 있는 정보를 자연스럽게 표현할 수 있는 장점으로 인해 기상학, 의학, 공학, 인공지능 등의 다양한 분야에서 사용되고 있다. 본 연구실에서는 베이즈 추론의 다양한 분야를 연구한다. 주요 연구분야는 고차원 모형 추론과 미분방정식 모형과 비모수 베이즈추론과 베이즈 통계의 다양한 응용 분야 적용이다. 각 적용 분야에서 새로운 통계추론 방법을 개발하고, 이 방법들의 이론적 성질 규명과 베이즈 계산 방법 등을 연구하고 있다.

관심분야

Bayesian Statistics
High-dimensional statistical inference
Differential equation models.
Nonparametric Bayesian models

임요한. 다변량통계 연구실 https://sites.google.com/view/mvstat

소개
본 연구실은 복잡한 확률 구조를 지닌 다차원 (또는 고차원) 자료에 대한 이론과 방법론을 연구한다. 특히 고차원 공분산 행렬의 이론, 확률적 그래프 모형과 잠재 변수 모형에 대한 방법론, 그리고 순서관련 통계 절차를 연구하고 이를 통하여 여러 응용분야의 문제들에 대한 통계적 기법을 제공한다.
관심분야
(Large scale) multivariate statistical procedure
Order related statistical inference
Latent variable models
Statistical computing

임채영. 공간통계 연구실 https://limcstat.github.io

소개

본 연구실에서는 공중보건, 기후/환경, 뇌과학, 의생물공학, 사회과학 등 다양한 분야에서 얻어지는 공간 또는 시공간데이터를 분석하기 위한 통계방법론의 개발 및 이를 활용한 응용문제에 대해 연구한다.

관심분야
Bayesian nonparametric models
High-dimensional statistical models
Bayesian asymptotics
Monte Carlo methods
Bayesian statistical methods in climatology, biology and medical science

장원철. 고차원 대용량 자료분석 연구실

소개

본 연구실은 천문학, 뇌인지과학, 생물정보학분야에 혼히 볼 수 있는 고차원 대용량 자료의 분석과 그에 필요한 새로운 통계적 방법론에 대해 연구한다. 이러한 방법론들의 예를 들자면 우주거대 구조 (large structure of the universe)를 이해하기 위해서는 은하 군집(galaxy clusters)의 분포에 관한 추론, fMRI분석에서 사용되는 고차원 자료를 위한 다중검정방법등을 들 수 있다. 또한 고차원 모형에 분석에 있어서 중요한 이론적 토대를 제공하는 shrinkage estimator에 대한 연구와 이를 이용한 새로운 통계적 모형에 대해 연구한다.

관심분야
Large-scale Inference
Multiple Testing
Social Network Analysis
Statistical Applications in Astronomy and Neuroscience

정성규. 통계적학습이론 연구실https://statlet.github.io

소개
본 연구실은 고차원다변량자료와 기하적 자료의 통계분석을 위한 이론과 방법론을 연구한다. 고차원 저표본 자료를 스파이크 모형과 희박성 가정 하에서 차원 축소, 분류하는 방법 등을 개발하며, 특히 고차원 자료의 기하적 성질을 이용한 방법론의 개발과 이론적, 실증적 분석을 도모한다. 또한, 방향, 형상 등의 매니폴드 값을 가지는 자료가 비유클리드 공간에 있음을 감안하여, 그 자료에 적합한 효율적인 통계 모형 개발과 그 추정, 추론법을 연구하며 기계학습 (또는 statistical learning)을 비유클리드 자료분석에 응용한다. 의생명공학, 뇌과학, 유전학, 컴퓨터 비전 및 의료영상분석 등에서 고차원다변량자료와 특수한 구조를 가진 비유클리드 자료가 많이 나타나므로, 관련분야에 쓰일 수 있는 통계기법을 제시한다.
관심분야
High-dimension, low-sample-size problems
Analysis of structured, geometric and non-Euclidean data
Statistical learning

Junyong Park. 고차원 다중검정 연구실

소개
본연구실은 고차원에서의 통계적 가설검정 및 추론, 다중 검정, 고차원 분류 문제 및 메타 분석을 다루며 그에 대한 방법론의 개발과 이론적 규명을 연구한다. 이러한 방법들을 기반으로 유전정보학 및 의료분야에 응용하는 것을 연구한다.
관심분야
Hypothesis testing in high dimension
Multiple testing
Classification in high dimension
Bioinformatics
Meta Analysis

Won Chang. 불확실성 정량화 연구실https://www.wonchang.net

소개

복잡한 수학적 모델 및 머신러닝 모델의 효과적인 활용을 위해서는 적절한 불확실성 정량화가 필수적이다. 우리 연구실은 가우시안 프로세스와 심층 신경망과 같은 첨단 머신러닝 기법을 활용하여, 통계적으로 타당하고 과학적으로 유용한 불확실성 정량화 방법을 개발하는 것을 목표로 한다. 이를 위해 변분 베이지안 딥러닝 방법론 및 대규모 시공간 데이터를 위한 비모수 베이지안 방법론을 연구하고 있으며, 개발된 방법들을 기후 변화 연구, 질병 모델링, 유전자 군집화와 같은 다양한 분야에 적용하고 있다.

관심분야

Uncertainty Quantification
Machine Learning for Enviromnetal Research
Machine Learning for Biomedical Research
Spatio-Temporal Modeling