×

연구실

연구실 소개 및 연구분야

서울대학교 심규석 교수의 데이타마이닝 및 데이타베이스 (Knowledge Discovery and Database) 연구실에서는 대규모의 데이타베이스에서 유용한 지식을 추출하는 다양한 알고리즘 및 데이타베이스 시스템에 대해 연구하고 있다. 주요한 연구 분야는 데이타마이닝 분야의 심화 주제, 스트림 데이터 마이닝과 XML의 저장구조 및 질의처리이다. 지난 1990년대 초 이래, 데이타마이닝 분야의 활발한 연구를 통해 Classification, Association Rule, Sequential Pattern, Clustering, Outlier Discovery 등의 분야가 정립되어 많은 알고리즘과 연구 성과들이 나오고 있다.

본 연구실에서는 새로운 데이타마이닝 문제와 기존의 개념을 확장하는 다양한 주제에 대한 연구를 진행 중이다. 그리고, 최근 이슈가 되고 있는 스트림(Stream) 데이터마이닝 분야로 연구 영역을 넓히고 있다. 또한, XML 데이타가 인터넷 환경에서의 정보전달 양식의 표준으로 자리잡음에 따라, 이를 위한 저장구조, 색인구조, 그리고 질의처리에 대한 연구와 개인정보 유출에 따른 프라이버시 보호에 대한 연구도 활발하게 진행하고 있다. 최근에는 스마트폰이 보급화되면서 앞으로 요구되어질 cloud computing 환경을 위한 분산 처리 알고리즘에 대한 연구도 진행하고 있다. 또한 삼성전자에서 요청한 산학과제로 스마트폰에서 모여지는 데이터에 대한 데이타마이닝 알고리즘 연구를 진행하고 있다.

최근 관심분야 및 주요 연구과제

- Data Mining and Knowledge Discovery
- MapReduce Algorithms for Big Data Analysis
- XML and Semi-structured Data
- Internet Stream Data
- Cloud Computing
- Query Processing and Optimization
- Data Warehousing and OLAP
- Privacy
- Sensor Network

주요 논문/특허

[1] Hongrae Lee, Raymond T. Ng, and Kyuseok Shim, "Similarity Join Size Estimation using Locality Sensitive Hashing" the 37th International Conference on VLDB, Mar. 2011.
[2] Chulyun Kim, and Kyuseok Shim, "TEXT: Automatic Template Extraction from Heterogeneous Web Pages", IEEE Transactions on Knowledge and Data Engineering Journal, 2011
[3] Hyoungmin Park, and Kyuseok Shim, "Approximate algorithms with generalizing attribute values for k-anonymity", Information Systems Journal, 2010
[4] Younghoon Kim, Kyounggu Woo, Hyoungmin Park, and Kyuseok Shim, "Efficient processing of substring match queries with inverted q-gram indexes", the 26th International Conference on IEEE Data Engineering, 2010
[5] Hongrae Lee, Raymond T. Ng, and Kyuseok Shim, "Power-Law Based Estimation of Set Similarity Join Size", the 35th International Conference on VLDB, 2009
[6] Hyoungmin Park, and Kyuseok Shim, "FAST: Flash-Aware External Sorting for Mobile Database Systems", The Journal of Systems and Software, 2009
[7] Hongrae Lee, Raymond T. Ng, and Kyuseok Shim, "Approximate Substring Selectivity Estimation", the 12th International Conference on Extending Database Technology, 2009