반응형
Steganalysis 란?
숨겨진 정보를 탐지하고 추출하는 기술로 "스테가노그래피(Steganography)"의 역과정에 해당하는 분석기술
- 스테가노그래피이미지, 오디오, 비디오 등의 디지털 미디어 안에 비밀 정보를 숨기는 기술
- 스태그어날리시스숨겨진 정보의 존재 여부를 탐지하거나 숨겨진 정보 자체를 추출하는 과정, 디지털 포렌식 및 사이버 보안 분야에서 핵심적으로 사용
Steganography 기술 개요
먼저, 스테가노그래피 기술을 알아야 스태그어날리시스를 이해가능
- 스테가노그래피 주요 특징
- 원본 이미지, 비디오, 오디오와 시각적, 청각적 차이가 거의 없다
- Least Significant Bit 삽입방식이 대표적
- 공간적 도메인, 주파스 도메인 방식으로 나뉨
- 주요 활용 분야
- 군사 정보 기관의 기밀 메시지 전송
- 디지털 저작권 관리(ex : 워터마킹)
- 디지털 포렌식 증거 은닉 및 탐지
Steganalysis 상세 개념 및 분류
1. Blind Steganalysis
- 숨겨진 데이터가 어떤 알고리즘으로 숨겨졌는지 모르는 상황에서 사용
- 머신러닝 및 딥러닝 모델로 훈련하여 채턴 탐지
2. Targeted Steganalysis
- 특정한 스테가노그래피 알고리즘을 이미 알고있으며 그것을 표적으로 삼아 숨긴 데이터를 탐지
3. Universal Steganalysis
- 모든 종류의 스테가노그래피 기술에 일반적으로 적용할 수 있는 기술
- 일반적으로 이미지나 비디오 데이터의 통계적 특징을 분석하여 이상 패턴을 찾는 방식
Steganalysis 접근법 (Detection 방법)
1. 통계 기반 방법
- 이미지 픽셀이나 주파수 계수의 통계적 특성(히스토그램, 고차원 통계값 등) 활용
- 숨긴 데이터 삽입에 따른 미세한 통계적 변화 탐지
2. 기계 학습 기반 방법
- SVM(Support Vector Machine), Random Forest 등 고전적 ML 알고리즘 활용
- CNN 및 Deeplearning 모델로 이미지 데이터 분석을 통한 탐지
3. Hybrid 방식
- 통계적 방법과 머신러닝, 딥러닝을 결합하여 정밀도 높이는 방식
- 최근 주목받는 연구 방향
Steganalysis에서 딥러닝의 활용
- 주요 딥러닝 기술 활용
- CNN 기반 특징 추출
- Attention 매커니즘을 활용한 미세 특징 탐지
- Vision Transformer의 미세한 패치 단위 분석
- 주요 연구 방향
- 데이터 셋 구성(Cover 이미지 vs Stego 이미지)
- Fine-grained Classification (미세한 변화 분류)
- Zero-shot Steganalysis (알려지지 않은 기술에 대한 탐지)
Steganalysis에 필요한 배경지식
- 디지털 이미지 처리
- 이미지 압축의 원리와 손실, 무손실 압축 차이점
- 이미지의 주파수 변환과 공간적 도메인 특징
- 정보보안 및 암호학 기초
- 기본적인 암호화 기법(AES, RSA 등)
- 암호화와 데이터 은닉의 개념적 차이 이해
- 통계학 및 기계학습
- SVM, Logistic Regression 분류 알고리즘 기본
- 딥러닝을 활용한 CNN 기반 분석 기술
- 프로그래밍 및 딥러닝 프레임 워크
- python, pytorch, tensorflow를 활용한 딥러닝 구현 능력
실습 환경
1. 도구 및 라이브러리
- OpenStego, Steghide 등 데이터 은닉 도구
- python, pytorch, tensorflow
2. 추천 데이터 셋
3. 참고 문헌
- Fridrich, J., et al. (2012). Rich models for steganalysis of digital images
- Ye, J., et al. (2017). Deep learning hierarchical representations for image steganalysis
- Qian, Y., et al. (2015). Deep learning for steganalysis via convolutional neural networks
'DeepLearning|MachineLearning' 카테고리의 다른 글
2025년 5월기준 CV 최신 트렌드 (2) | 2025.05.31 |
---|---|
딥러닝/머신러닝을 위한 CS기초과목 필요성과 이유 (0) | 2025.03.28 |
Confusion Matrix(분류 모델 성능 평가지표) 란? (2) | 2023.12.20 |
DeepLearning 기초 개념 : batch_size, steps, epoch, iteration (0) | 2022.04.28 |
TTA(Test-Time Augmentation) (0) | 2022.04.28 |