Diki 검색중...
#개념
이미지 분할(Image Segmentation)은 이미지 내에서 픽셀 단위로
객체(object), 배경(background), 속성(attribute) 등을 구분하여 구조적 의미를 부여하는 컴퓨터 비전 기술이다. 이 과정은 이미지 전체를 하나의 덩어리로 다루는 기존의 단순 분류(Classification)보다 훨씬 정밀한 수준의 시각 이해를 가능하게 한다. 이미지 분할은 시각 인지의 가장 기본적인 형태인 "이 픽셀은 무엇에 속하는가?"라는 질문에 답하는 기술이며, 이를 기반으로 객체 인식(object detection), 시각 추적(tracking), 3D 재구성(reconstruction) 등 다양한 상위 작업이 수행된다. 이미지 분할은 크게 의미 분할(Semantic Segmentation), 인스턴스 분할(Instance Segmentation), 파놉틱 분할(Panoptic Segmentation)로 구분된다.의미 분할(Semantic Segmentation)은 모든 픽셀을 사람이 의미적으로 인식하는 클래스 단위로 분류하는 방식으로, 예를 들어 도로·보행자·자동차 등을 픽셀 수준에서 구분한다. 인스턴스 분할(Instance Segmentation)은 동일한 클래스 내에서도 개별 객체를 별도로 분리하여 마스크(mask)를 생성하는 방식으로, 여러 자동차가 동시에 등장하는 장면에서 각 자동차를 독립된 객체로 인식한다. 파놉틱 분할(Panoptic Segmentation)은 두 방식을 통합하여, 모든 픽셀을 의미적으로 분류하면서도 개별 객체를 구분하는 일관된 시각 이해 모델을 제공한다.전통적 이미지 분할은 임계값 기반 분할(Thresholding), 에지 검출(Sobel, Canny), 영역 성장(Region Growing), 워터셰드(Watershed), 그래프 컷(Graph Cut) 등 기법을 중심으로 발전했다. 그러나 이러한 방식은 조명 변화, 텍스처 다양성, 복잡한 경계 조건에서 성능이 급격히 감소한다. 이러한 한계를 극복하기 위해 등장한 딥러닝 기반 방식은 위치 정보와 고수준 의미 정보를 동시에 학습하며, 복잡한 패턴을 가진 이미지에서도 높은 정확도를 유지한다. 대표적인 딥러닝 모델로는 다음과 같은 계열이 있다.대표적인 딥러딩 모델- U-Net: 의료 영상 분석에서 널리 사용되는 구조로, 인코더–디코더 형태와
스킵 연결(skip connection)을 통해 정밀한 세그멘테이션을 수행한다. - FCN(Fully Convolutional Network): 완전한 CNN 기반 구조로 이미지 크기와 무관하게 픽셀 단위 예측을 수행한 초기 모델이다.
- DeepLab 계열(DeepLabv3, DeepLabv3+): Atrous Convolution과 ASPP(Atrous Spatial Pyramid Pooling)를 활용해 다중 스케일 특징을 효과적으로 학습한다.
- Mask R-CNN: 객체 검출과 인스턴스 분할을 결합한 모델로, 다양한 산업에서 기본 표준으로 자리 잡았다.
- SAM(Segment Anything Model): 범용 세그멘테이션을 목표로 한 모델로, 프롬프트 기반 인터페이스를 제공하며 인간 개입과 자동 분할을 모두 지원한다.
트랜스포머 기반 아키텍처, 멀티모달 학습, 지식 증류(distillation), 경량화 모델, 반지도학습(semi-supervised segmentation), 제로샷·원샷 분할 기법 등이 적극적으로 연구되고 있다.#관련 용어
각 픽셀을 의미 클래스로 분류하는 방식
동일 클래스 내 개별 객체를 구분하여 마스크를 생성하는 방식
Semantic과 Instance Segmentation을 결합한 통합 방식
#직무 연관도
DA | Data Analyst보통
이미지 기반 데이터 분석 또는 품질 검사 자동화를 수행할 때 활용된다.
DS | Data Scientist밀접
객체 인식·의료 영상 분석 등에서 정확한 픽셀 단위 분석을 위해 강력한 연구적 활용 가치가 있다.
DE | Data Engineer밀접
자율주행·로보틱스 등에서 실시간 이미지 분할 모델을 시스템에 통합하고 최적화해야 한다.
#사용 사례
이미지 분할은 고정밀 시각 이해가 필요한 산업 전반에서 사용된다. 의료에서는 종양·장기 자동 분할에, 자율주행에서는 도로·차선·보행자 분리를 위해 활용된다. 제조에서는 제품 결함 감지에 쓰이며, 농업에서는 작물 상태 모니터링에 활용된다.
MRI 의료 영상에서 종양 영역을 자동으로 분할하여 진단을 보조하는 데 활용된다.
#참고 자료
#추천 포스트
© 2024 diki All rights reserved.