개발자라면 한번쯤은 보러오는 곳
[Computer Vision] Problem design 본문
728x90
반응형
획득과 표현
- 샘플링과 양자화
- 2차원 영상 공간을 M*N으로 샘플링(M*N을 해상도라 부름)
- 명암을 L단계로 양자화 (L을 명암 단계라 부름, 즉 명암은 [0,L-1] 사이 분포)
- 영상 좌표계
- 화소 위치는 x=(j,i) 또는 x=(y,x)로 표기 (pixel)
- 영상은 f(x) 또는 f(j,i), 0<= j <= M-1, 0<= i <= N-1로 표기
- 컬러 영상은 fr(x), fg(x), fb(x)의 세 채널로 구성
- 영상 표기 방법
- 컬러
- RGB 모델로 영상 표현
- fr, fg, fb의 세 채널로 표현
- 가장 단순한 영상처리 방법은 세채널을 독립적으로 처리
- HSI 모델
- 이중 콘으로 색을 표현
과학적 접근과 공학적 접근
- 과학적 접근
- 목표 1을 달성하려는 노력
- 사람 시각의 원리를 밝혀낸 다음 컴퓨터로 모방
- 뇌 과학의 주요 관심사
- 지식 표현, 학습, 추론, 창작 같은 인공 지능이 필수
- 어려운 이유
- 역 문제 (3차원 -> 2차원 (사진); 2차원 -> 3차원 정보손실)
- 불량 문제 (ill-posed problem; 정답이 없는 문제)
- 다양한 변형 발생 (기하학적 변환, 광도 변환)
- 공학적 접근
- 목표 2를 달성하려는 노력
- 특정상황에서특정임무를수행하는실용시스템구축
- 성공적인 시스템
- 많은응용현장에서쓰고있음
- 컴퓨터비전이사람보다뛰어난경우(예,엔진실린더정밀측정,칩검사등)
- 실용적인 성능 달성의 어려움
- 여전히역문제,불량문제,다양한변환발생
- 영상은숫자배열형태
- 목표 2를 달성하려는 노력
Learning Task
- Improve their performance P
- at some task T
- with experience E
성능 평가
1. 정확률
= 모델이 True라고 분류한 것 중에서 실제 True인 것의 비율
2. 재현율
= 실제 True인 것 중에서 모델이 True라고 예측한 것의 비율
- True Positive(TP) : 실제 True인 정답을 True라고 예측 (정답)
- False Positive(FP) : 실제 False인 정답을 True라고 예측 (오답)
- False Negative(FN) : 실제 True인 정답을 False라고 예측 (오답)
- True Negative(TN) : 실제 False인 정답을 False라고 예측 (정답)
728x90
반응형
'학교 수업 > Computer Vision' 카테고리의 다른 글
[Computer Vision] Machine Learning (1) | 2022.10.15 |
---|---|
[Computer Vision] Edge detection (0) | 2022.10.12 |
[Computer Vision] Filters (1) | 2022.10.08 |
[Computer Vision] Basic operation (0) | 2022.10.04 |
[Computer Vision] introduction (1) | 2022.10.02 |
Comments