계속지나가기
코딩스뮤
계속지나가기
전체 방문자
오늘
어제
  • 코딩스뮤:)
    • Algorithm
      • 백준 문제풀이
      • 프로그래머스 문제풀이
      • 알고리즘 이론
      • 자료구조
      • SW Expert Academy
    • 인공지능(AI)
      • LLMs
      • 자연어처리(NLP)
      • 컴퓨터비전(CV)
      • 딥러닝(DL)
      • 머신러닝(ML)
      • 인공지능기초수학
      • 선형대수학
    • 컴퓨터 세팅
    • Computer Science
      • 유닉스프로그래밍
      • 프로그래밍언어론
      • 디자인패턴
      • 클린코드
      • SW 영어
      • 리눅스
      • 논리회로
    • Server
      • Docker

블로그 메뉴

  • 홈
  • Who Am I(CV)
  • 태그

공지사항

인기 글

태그

  • 언어모델
  • NLP
  • DigitalImageProcessing
  • 비지도학습
  • 군집화
  • LM
  • 기계학습
  • 파이썬 클린코드
  • machinelearning
  • 손실함수
  • SIFT
  • ComputerVision
  • 지도학습
  • 결정경계
  • 에지검출
  • 경사하강법
  • 머신러닝
  • 선형회귀
  • 알고리즘
  • f1-score
  • ML
  • 디지털이미지처리
  • MaximumFlow
  • 최대유량
  • networkflow
  • DIP
  • 컴퓨터비전
  • 네트워크플로우
  • 비용함수
  • 패턴인식

최근 댓글

최근 글

티스토리

hELLO · Designed By 정상우.
계속지나가기

코딩스뮤

[패턴인식] 영상 처리(3) : 다해상도, 모폴로지, 컬러
인공지능(AI)/컴퓨터비전(CV)

[패턴인식] 영상 처리(3) : 다해상도, 모폴로지, 컬러

2021. 10. 24. 00:11
반응형

Digital Image Processing

목차

0. Preview

1. 디지털 영상이란?

2. 히스토그램

3. 이진 영상

4. 영상 처리의 세가지 기본 연산

5. 다해상도

6. 모폴로지

7. 컬러

 

 

<3~4.영상 처리의 세가지 기본 연산>은 이전 게시글을 참고해주세요

https://codingsmu.tistory.com/103?category=983612 

 

[패턴인식] 영상 처리(2) : 이진영상, 영상 처리의 세가지 기본 연산

Digital Image Processing 목차 0. Preview 1. 디지털 영상이란? 2. 히스토그램 3. 이진 영상 4. 영상 처리의 세가지 기본 연산 5. 다해상도 6. 모폴로지 7. 컬러 은 이전 게시글을 참고해주세요 https://codingsm..

codingsmu.tistory.com

 

 

5. 다해상도


  • 해상도를 줄이거나 늘리는 연산
    • 다양한 응용
      • 멀티미디어 장치에 디스플레이
      • 물체 크기 변환에 강인한 인식 등
    • 업샘플링과 다운샘플링 
  • 피라미드
    • 샘플링 비율 0.5로 다운 샘플링 반복
    •  
      피라미드
  • 피라미드 구축 연산
    • $f_k(j,i) = f_{k-1}(\frac{j}{r}, \frac{i}{r})$, $r=\frac{1}{2}, 1 <= k <= q$
    • 에일리어싱(Aliasing) 발생 : 화소에 따라 100% 또는 0%만큼 공헌
      • 에일리어싱 왜곡 완화 방법 : (a) Decimation, (b) Weighted Average
      • 피라미드 구축을 위한 다운샘플링
  • Burt&Adelson 방법[Burt83a]
    • $f_k(j,i) = u x f =  \sum_{y=-2}^{2}\sum_{x=-2}^{2}w(y,x)f_{k-1}(\frac{j}{r}+y, \frac{i}{r}+x)$, $r=\frac{1}{2}, 1 <= k <= q$
    • 모든 화소가 50%씩 공헌
    • [Burt83a]가 사용한 필터
    • 피라미드 영상의 예(원래 해상도는 764x1024)

 

6. 모폴로지


  • 모폴로지(Morphology)
    • 원래 생물학에서 생물의 모양 변화를 표현하는 기법
    • 수학적 모폴로지: 컴퓨터비전에서 패턴을 원하는 형태로 변환하는 기법

6.1 이진 모폴로지(Binaray Morphology)

  • 구조요소(Structuring element)
    • 몇 가지 대표적인 구조요소
  • 팽창, 침식, 열기,닫기 연산
    • St={s+t|s∈S}
    • 팽창(Dilation) : f⊕S=∪Sx (U의 x는 x∈f)
      • f의 1인 화소에 구조요소 S를 씌우고, S의 1인 점과 겹치는 곳을 모두 1로 바꿈(합집합)
      • 즉, 결과적으로 영상에 있는 연결요소는 구조요소만큼 외부로 팽창한다 
    • 침식(Erosion) : f⊝S={x|x+s∈f, ∀s∈S}
      • f의 어떤 화소에 구조요소S를 씌웠을 때, 구조요소의 1인 곳과 겹치는 곳이 모두 1인 경우만 그 화소를 1로 결정(교집합)
    • 열기(Open) : f∘S=(f⊝S)⊕S (침식 후 팽창)
    • 닫기(Close) : f⋅S=(f⊕S)⊝S (팽창 후 침식)
  • 참고로, 닫기/열기 시 팽창(n)과 침식(m)이 반드시 n==m번 일어날 필요는 없다
    • 단, 크기(size)를 닫기/열기 후에도 똑같이 유지하고 싶다면  n==m 이어야 함
    • if n > m: size 증가
    • elif n < m : size 감소
  • 모폴로지 적용 예시 
    • 전자 현미경으로 찍은 한지 영상에 적용한 모폴로지
  • 예제 : 원래 영상(a)를 구조요소(b)를 통해 팽창, 침식, 열기, 닫기 연산 수행결과를 보이고 효과를 분석해보자
    • 팽창
    • 침식
    • 열기와 닫기
    • 효과 분석
      • (c)열기는 삐죽 튀어나온 값을 세밀하게 제거 가능(그림에서 초록색 부분)
      • (d)닫기는 홀(hole)이 매꿔지는 효과(그림에서 회색 부분)

6.2 명암 모폴로지(PASS)

 

 

7. 컬러


  • 컬러 모델 색을 표현하고자 하는 방식으로 대표적으로 RGB, HSI 모델이 있음
  • RGB 모델(Red, Green, Blue)
    • 길이가 1인 정육면체로 색을 표현
    • RGB 컬러 모델
    • RGB 컬러 모델은 색을 혼합할수록 색이 밝아지는 가산체계(Additive System)를 사용
      • RGB를 같은 비율로 혼합 -> R(1,0,0) + G(0,1,0) + B(0,0,1) ->가장 밝은 흰색
      • 빨강색 + 초록색 -> R(1,0,0) + G(0,1,0) -> Yellow(1,1,0) : 노란색
      • 초록색 + 파란색 -> G(0,1,0) + B(0,0,1)  -> Cyan(0,1,1)  : 청록색
      • 빨강색 + 파란생 -> R(1,0,0) + B(0,0,1) -> Magenta(1,0,1) : 자홍색
    • 단점 : 컬러 요소들의 상호관계가 너무 커서 특정 색상만 분리가 어려움

 

  • RGB 모델로 영상 표현
      • $f_r, f_g, f_b$의 세 채널로 표현 
      • 색상-밝기(연관,의존) :   R > G > B, H > S > I, $Y, C_b, C_r$
      •  
    RGB 컬러 영상
  • HSI 모델 (Hue:색상, Saturation:채도, Intensity(밝기,명도))
    • 사용자가 더 쉽게 색을 지정할 수 있게함
    • 색상(H) : 다른 색과 구별 될 수 있는 색의 명칭이나 색의 특성, 구분, 순수색
    • 채도(S) : 색 표현시 연하다,진하다,탁하다 등과 같은 정도로 흰색과 순수색의 혼합비율(0~100%)을 의미
    • 명도(I) : 색의 밝고 어두움의 정도인 명암(明暗)을 표현 
    • 이중 콘으로 색을 표현
      • HSI 컬러모델
    • 컬러 영상 처리
      • 가장 단순한 방법은 세 채널을 독립적으로 처리 
        • RGB 영상에 가우시안 스무딩을 적용한 결과
        • 독립적으로 적용하면 적절하지 않은 경우(히스토그램 평활화)
          • 이유 : R,G,B가 서로 밝기와 색상 성분이 상관되어(correlative) 있기 때문에 독립적으로 처리한 후 합치면 영상이 이상하게 변함
          • 해결법: RGB를 HSI(혹은 $Y, C_b, C_r$)로 변환 후 I(혹은 Y) 성분만 이용해서 히스토그램 평활화를 진행해서 합친다. 이 경우, 색상은 유지하고 밝기 성분에서만 히스토그램 평활화 진행 가능
      • 점 연산 적용 예시
        • RGB 영상에 점 연산을 적용한 결과


반응형

'인공지능(AI) > 컴퓨터비전(CV)' 카테고리의 다른 글

[패턴인식] 에지 검출(2) : 캐니 에지, 컬러 에지, 선분 검출  (0) 2021.10.24
[패턴인식] 에지 검출(1) : 에지 검출의 기초, 영교차 이론  (0) 2021.10.24
[패턴인식] 영상 처리(2) : 이진영상, 영상 처리의 세가지 기본 연산  (2) 2021.10.21
[패턴인식] 영상 처리(1) : 디지털 영상, 히스토그램  (0) 2021.10.21
[패턴인식] 컴퓨터 비전 소개 : Intro. Computer Vision  (0) 2021.10.17
    '인공지능(AI)/컴퓨터비전(CV)' 카테고리의 다른 글
    • [패턴인식] 에지 검출(2) : 캐니 에지, 컬러 에지, 선분 검출
    • [패턴인식] 에지 검출(1) : 에지 검출의 기초, 영교차 이론
    • [패턴인식] 영상 처리(2) : 이진영상, 영상 처리의 세가지 기본 연산
    • [패턴인식] 영상 처리(1) : 디지털 영상, 히스토그램
    계속지나가기
    계속지나가기
    NLP Engineer

    티스토리툴바