code

이미지 처리 : 폐색이란 무엇입니까?

codestyles 2020. 11. 20. 09:00
반응형

이미지 처리 : 폐색이란 무엇입니까?


저는 이미지 처리 프로젝트를 개발 중이며 많은 과학 논문에서 폐색 이라는 단어를 접하게 됩니다. 이미지 처리의 맥락에서 폐색이란 무엇을 의미합니까? 사전은 일반적인 정의 만 제공합니다. 누구나 이미지를 컨텍스트로 사용하여 설명 할 수 있습니까?


폐색은보고 싶은 것이 있지만 센서 설정의 일부 속성이나 일부 이벤트로 인해 볼 수 없음을 의미합니다. 문제가 정확히 어떻게 나타나거나 문제를 처리하는 방법은 당면한 문제에 따라 달라 집니다.

몇 가지 예 :

물체 (사람, 자동차 등)를 추적 하는 시스템을 개발하는 경우 추적중인 물체가 다른 물체에 의해 가려지면 (폐색) 폐색이 발생합니다. 서로 지나가는 두 사람이나 다리 아래에서 운전하는 자동차처럼. 이 경우 문제는 개체가 사라졌다가 다시 나타날 때 수행하는 작업입니다.

범위 카메라를 사용하는 경우 오 클루 전은 정보가없는 영역입니다. 일부 레이저 거리 카메라는 검사중인 표면에 레이저 빔을 전송 한 다음 결과 이미지에서 해당 레이저의 충격 지점을 식별하는 카메라 설정을 사용하여 작동합니다. 그것은 그 지점의 3D 좌표를 제공합니다. 그러나 카메라와 레이저가 반드시 정렬 된 것은 아니기 때문에 검사 ​​된 표면에 카메라가 볼 수 있지만 레이저가 부딪 힐 수없는 (교합) 지점이있을 수 있습니다. 여기서 문제는 센서 설정의 문제입니다.

두 카메라 중 하나에서만 볼 수있는 장면 부분이있는 경우 스테레오 이미징 에서도 동일한 현상이 발생할 수 있습니다 . 이 지점에서는 범위 데이터를 분명히 수집 할 수 없습니다.

더 많은 예가있을 것입니다.

문제를 지정하면 해당 경우에 어떤 폐색이 있는지, 어떤 문제가 수반되는지 정의 할 수 있습니다.


폐색 문제는 컴퓨터 비전이 일반적으로 어려운 주된 이유 중 하나입니다. 특히 이것은 Object Tracking 에서 훨씬 더 문제가됩니다 . 아래 그림을 참조하십시오.

여기에 이미지 설명 입력

여성의 얼굴이 프레임에서 완전히 보이지 않고 프레임 의 얼굴 05190835는 대조적으로 어떻게 표시되는지 확인하십시오 0005.


그리고 여기 세 프레임 모두에서 남자의 얼굴이 부분적으로 가려진 사진이 하나 더 있습니다.

부분 폐색


Notice in the below image how the tracking of the couple in red & green bounding box is lost in the middle frame due to occlusion (i.e. partially hidden by another person in front of them) but correctly tracked in the last frame when they become (almost) completely visible.

여기에 이미지 설명 입력

Picture courtesy: Stanford, USC


Occlusion is the one which blocks our view. In the image shown here, we can easily see the people in the front row. But the second row is partly visible and third row is much less visible. Here, we say that second row is partly occluded by first row, and third row is occluded by first and second rows. We can see such occlusions in class rooms (students sitting in rows), traffic junctions (vehicles waiting for signal), forests (trees and plants), etc., when there are a lot of objects. 여기에 이미지 설명 입력


다른 답변에서 오 클루 전을 잘 설명 했으므로 여기에만 추가하겠습니다. 기본적으로 우리와 컴퓨터 사이에는 의미 론적 차이가 있습니다.

컴퓨터는 실제로 모든 이미지를 RGB 이미지의 모든 색상에 대해 일반적으로 0-255 범위의 값 시퀀스로 인식합니다. 이러한 값은 이미지의 모든 지점에 대해 (row, col) 형식으로 인덱싱됩니다. 따라서 물체가 물체의 일부 측면이 숨겨져있는 카메라에서 위치를 변경하면 (사람의 손이 보이지 않도록 함) 컴퓨터는 다른 숫자 (또는 가장자리 또는 기타 기능)를 보게되므로 컴퓨터 알고리즘이 다음과 같이 변경됩니다. 물체를 감지, 인식 또는 추적합니다.

참고 URL : https://stackoverflow.com/questions/2764238/image-processing-what-are-occlusions

반응형