데이터베이스연구실
지도교수
장재우
사이트
https://sites.google.com/view/jbnu-dblab
연구분야
트랜잭션 충돌 예측 기법,대용량 로그 분석,암호화 데이터베이스 상에서의 데이터 마이닝, 분산 병렬 암호화 kNN 분류 기법
위치
공대 7호관 401호

연구내용

연혁 및 현황 : 본 데이터베이스 연구실은 1992년에 설립된 이래, 2020년 현재까지 박사 17명, 석사 47명을 배출하였으며, 대학(4), 국공립 연구소(17) 기업(29) 의 높은 취업률을 지니고 있습니다. 또한 현재 연구실에는 박사과정 1명, 석사과정 0명, 학부과정 4명이 학업에 매진하고 있습니다.

연구실 특징 : 데이터 베이스 연구실의 특징은 다음과 같습니다.
- 첫째, 정보보호, 클라우드 컴퓨팅 등 데이터 베이스의 최신 분야에 대한 심도 깊은 연구를 수행할 수 있습니다.
- 둘째, 다양한 관련 프로젝트 참여를 통한 실무 능력 향상 및 연구비 지원이 가능합니다.



연구내용

1. 암호화 데이터베이스 상에서의 데이터 마이닝 연구
기존 암호화 데이터베이스 상에서의 분류 기법은 접근 패턴이 클라우드 서버에 노출되는 문제점을 지니며, 데이터 마이닝을 위해 모든 데이터를 고려하기 때문에 높은 처리 비용이 요구된다. 이러한 문제점을 해결하기 위해 본 연구실은 암호화 데이터베이스 상에서의 데이터 마이닝 기법에 대해 연구한다. 이를 위해 첫째, 암호화된 데이터베이스 상에서 보안성과 효율성을 제공하는 암호화 분류 기법을 연구한다. 둘째, 암호화된 데이터베이스 상에서 보안성과 효율성을 제공하는 암호화 클러스터링 기법을 연구한다. 마지막으로, 암호화된 데이터베이스 상에서의 보안성과 효율성을 제공하는 암호화 연관 규칙 분석 기법을 연구한다. 그림 1은 본 연구실에서 연구하는 암호화 데이터베이스 상에서의 데이터 마이닝 기법을 나타낸다.




2. 분산 병렬 암호화 분류 알고리즘 연구
제안된 암호화 분류 알고리즘을 확장하여 하둡 맵리듀스 기반 분산 병렬 암호화 분류 알고리즘을 제안한다. 제안하는 알고리즘은 kd-트리 노드 ID를 기반으로 암호화 데이터를 각 서버에 분산시켜 병렬 처리한다. 전체 수행 절차는 i)암호화 인덱스 탐색, ii)분류를 위한 kNN 탐색, iii)질의 결과 검증, iv)범주 탐색의 4단계로 구성되며, 그림 2와 같다.




i) 암호화 인덱스 탐색 단계는 맵 함수를 이용하여 암호화 노드를 다수의 분산 서버에 균등하게 할당하며, 리듀스 함수를 이용하여 할당된 노드에 대해 질의와 인접한 kd-트리 노드 후보를 탐색한다(Step 1). ii) 분류를 위한 kNN 탐색 단계는 다수의 리듀스 함수를 이용하여 kNN 후보 탐색을 독립적으로 수행하며, 각 결과를 병합하여 최종 kNN 데이터 후보 집합을 생성한다(Step 2). iii) 결과 검증 단계는 맵 함수를 이용하여 kNN 데이터 후보 집합을 분산 서버에 노드별로 할당하고, 리듀스 함수를 이용하여 이전 단계에서 탐색한 kNN 질의 후보보다 가까운 노드를 탐색한다. 만약 가까운 노드가 발견되면, 추가적인 맵리듀스 수행을 통해 최종 kNN을 재탐색한다(Step 3). iv) 범주 탐색 단계는 맵 함수를 이용하여 kNN 데이터 후보의 분류 범주를 탐색하고, 리듀스 함수를 이용하여 kNN 데이터의 범주 빈도를 계산하여 질의가 속하는 최종 분류 범주를 결정한다.

연구실 소개