OpenCV - 영상필터링 연산 | 블러처리 | Canny
▶영상의 필터링 연산영상의 필터링 연산(Image Filtering Operation) 은 영상의 특성을 강조하거나 잡음을 제거하기 위해 커널(필터)을 활용하여 픽셀 값을 변환하는 과정입니다. OpenCV에서는 필터링을 통해 노이즈 제거, 엣지 검출, 블러 효과, 샤프닝 등의 처리를 수행할 수 있습니다. 대표적인 필터링 기법으로는 평균 블러링(Averaging), 가우시안 블러링(Gaussian Blur), 미디언 블러링(Median Blur) 등이 있으며, cv2.blur(), cv2.GaussianBlur(), cv2.medianBlur() 함수를 통해 적용할 수 있습니다. 또한, 고급 필터링 기법으로 소벨 필터(Sobel Filter), 라플라시안 필터(Laplacian Filter) 와 같은 엣지..
2025. 3. 24.
OpenCV - Morphological | Diagonal Approximation
▶ 모폴로지 연산모폴로지 연산(Morphological Operations) 은 이진화된 영상에서 객체의 형태를 조작하는 연산으로, 침식(Erosion), 팽창(Dilation), 열기(Open), 닫기(Close) 등의 기법을 포함합니다. 모폴로지 연산은 주로 노이즈 제거, 객체의 형태 보정, 경계 강조, 윤곽선 추출 등에 사용됩니다. OpenCV에서는 cv2.morphologyEx() 함수를 통해 다양한 모폴로지 연산을 적용할 수 있으며, 구조 요소(커널, cv2.getStructuringElement())를 정의하여 원하는 형태로 연산을 수행할 수 있습니다. 침식(Erosion)은 객체를 축소하여 작은 노이즈를 제거하는 데 사용되며, 반대로 팽창(Dilation)은 객체를 확장하여 빈 공간을 채우는..
2025. 3. 21.
OCR 광학 문자인식
1. OCROCR(Optical Character Recognition, 광학 문자 인식) 는 이미지나 문서에서 문자를 식별하고 디지털 텍스트로 변환하는 기술입니다. OCR은 주로 스캔된 문서, 사진 속 글자, 번호판, 손글씨 등의 텍스트를 자동으로 인식하는 데 사용됩니다. 기본적인 OCR 방식은 이미지 전처리(그레이스케일 변환, 이진화, 노이즈 제거) 후 문자 영역을 감지하고, 문자 패턴을 데이터베이스와 비교하여 최적의 텍스트를 추출하는 과정으로 이루어집니다. OpenCV와 Tesseract OCR을 사용하면 Python에서 쉽게 구현할 수 있으며, 딥러닝 기반의 EasyOCR, PaddleOCR, Google Vision OCR 등을 활용하면 한글과 다양한 언어의 인식률을 더욱 높일 수 있습니다. O..
2025. 3. 18.
OpenCV - getRotationMatrix2D| getPerspectiveTransform
▶ 이미지 로테이션 import cv2img = cv2.imread('D:/PJ/DLHJ/ong.jpg')img = cv2.resize(img, (300,300))#이미지 회전을 위한 중심좌표 조건 설정cp = (img.shape[1]/2, img.shape[0]/2)print(cp) #(1512.0, 1512.0)#회전조건 설정rot = cv2.getRotationMatrix2D(cp, 30, 0.5)#이미지 적용(Affine)dst = cv2.warpAffine(img, rot, (0,0))#이미지 확인cv2.imshow('img', img)cv2.imshow('dst', dst)cv2.waitKey() 이미지로테이션을 하기 위해서 이미지를 불러왔다. 내가 좋아하는 우리 옹이를 사진으로 사용하기 위해..
2025. 3. 17.
OpenCV & 영상 처리 핵심 개념 | Grayscale, RGB, True Color
1. OpenCV (모듈)OpenCV(Open Source Computer Vision Library)는 실시간 컴퓨터 비전 및 이미지 처리를 위한 오픈소스 라이브러리입니다. Python에서 cv2 모듈을 통해 사용할 수 있으며, 이미지 및 영상의 읽기, 변환, 필터링, 객체 검출, 특징 추출 등의 다양한 기능을 제공합니다. 또한, NumPy와의 호환성이 좋아 배열 연산을 활용한 고속 이미지 처리가 가능하며, 머신러닝 및 딥러닝 모델과도 쉽게 연동할 수 있습니다. 주로 얼굴 인식, 객체 추적, 증강 현실(AR), 자율 주행 등의 분야에서 널리 활용됩니다. 즉 이걸 외워놓으면 좀 영상처리는 편할 수 있다. ▶ Google COLAB환경 실행방법!pip install opencv-python!pip inst..
2025. 3. 11.
Computer Vision_개념을 다시한번 잡기 위한 글
1. 컴퓨터 비전컴퓨터 비전은 인공지능(AI)의 한 분야로, 컴퓨터가 인간처럼 이미지나 영상을 이해하고 분석할 수 있도록 하는 기술입니다. 이는 객체 검출, 이미지 분류, 얼굴 인식, 장면 이해 등 다양한 작업을 포함하며, 주로 머신러닝과 딥러닝을 활용하여 이미지 속 특징을 추출하고 패턴을 학습합니다. 예를 들어, 자율주행 자동차는 컴퓨터 비전을 사용하여 도로의 차선, 보행자, 신호등을 인식하며, 의료 영상 분석에서는 CT나 MRI 이미지를 분석하여 질병을 진단할 수 있습니다. 최근에는 합성곱 신경망(CNN)과 같은 딥러닝 모델이 발전하면서 컴퓨터 비전의 성능이 크게 향상되었으며, 다양한 산업에서 활발히 활용되고 있습니다. 2. 컴퓨터 비전에서의 프레임워크컴퓨터 비전에서 주로 사용하는 프레임워크로는 Op..
2025. 3. 6.