컴퓨터 비전이란 무엇입니까?

컴퓨터 비전은 기계가 이미지를 자동으로 인식하고 정확하고 효율적으로 설명하는 데 사용하는 기술입니다. 오늘날 컴퓨터 시스템은 스마트폰, 교통 카메라, 보안 시스템 및 기타 장치에서 제공되거나 생성된 대량의 이미지 및 비디오 데이터에 액세스할 수 있습니다. 컴퓨터 비전 애플리케이션은 인공 지능기계 학습(AI/ML)을 사용하여 객체 식별 및 안면 인식은 물론 분류, 권장, 모니터링 및 탐지를 위해 이 데이터를 정확하게 처리합니다.

컴퓨터 비전이 중요한 이유는 무엇인가요?

시각 정보 처리 기술이 등장한 지는 꽤 오래되었지만 대부분의 프로세스에 인간이 직접 개입해야 했고 시간 소모가 심했을 뿐 아니라 오류가 발생하기도 쉬웠습니다. 예를 들어 과거에는 안면 인식 시스템을 구현하려면 개발자가 수천 개의 이미지에 콧등의 너비, 눈 사이의 거리와 같은 주요 데이터 포인트를 수동으로 태그해야 했습니다. 이미지 데이터는 구조화되지 않고 컴퓨터가 구성하기에 복잡하기 때문에 이러한 작업을 자동화하려면 광범위한 컴퓨팅 성능이 필요했습니다. 따라서 비전 애플리케이션은 비용이 많이 들고 대부분의 조직이 사용하기에는 어려움이 많았습니다.

오늘날 이 분야의 발전과 컴퓨팅 능력의 엄청난 발전이 합쳐져 이미지 데이터 처리의 규모와 정확도가 모두 향상되었습니다. 클라우드 컴퓨팅 리소스로 구동되는 컴퓨터 비전 시스템은 이제 누구나 이용할 수 있습니다. 모든 조직이 신원 증명 확인, 콘텐츠 조정, 스트리밍 비디오 분석, 장애 감지 등에 이 기술을 사용할 수 있습니다.

컴퓨터 비전의 사용 사례로는 무엇이 있나요?

수많은 컴퓨터 비전 애플리케이션이 엔터테인먼트, 비즈니스, 의료, 교통 및 일상 생활에서 사용됩니다. 아래에서 몇 가지 사용 사례를 살펴보겠습니다.

보안 및 안전

정부와 기업은 컴퓨터 비전을 사용하여 자산, 부지 및 시설의 보안을 개선합니다. 예를 들어 카메라와 센서로 공공 장소, 산업 현장 및 높은 보안 수준이 요구되는 곳을 모니터링합니다. 허가 받지 않은 사람이 제한 구역에 들어가는 등 평소와는 다른 일이 발생하면 자동 경보를 보냅니다.

마찬가지로 컴퓨터 비전은 가정뿐만 아니라 직장에서도 개인의 보안 수준을 개선할 수 있습니다. 예를 들어, 인식 기술로 수많은 보안 관련 문제를 모니터링할 수 있습니다. 여기에는 반려 동물을 감지하는 가정용 실시간 스트리밍 또는 방문객이나 배송된 패키지를 감지하는 실시간 현관 카메라가 포함됩니다. 직장에서는 근로자의 적절한 개인 보호 장비 착용, 경고 시스템 알림 또는 보고서 작성 등을 모니터링할 수 있습니다.

운영 효율성

컴퓨터 비전은 이미지를 분석하고 비즈니스 인텔리전스를 위한 메타데이터를 추출하여 새로운 수익 기회와 운영 효율성을 창출할 수 있습니다. 예를 들어 다음과 같은 작업을 수행할 수 있습니다.

  • 제품이 공장에서 출고되기 전 자동으로 품질 결함 식별
  • 기계 유지보수 및 안전 문제 탐지
  • 소셜 미디어 이미지 분석을 통한 고객 행동의 경향 및 패턴 발견
  • 자동 안면 인식을 이용한 직원 인증

의료 서비스

헬스케어 산업은 컴퓨터 비전 기술을 적용하는 주요 산업 중 하나입니다. 특히 의료 영상 분석을 통해 장기와 조직을 시각화하여 의료 전문가가 빠르고 정확한 진단을 내릴 수 있도록 돕고, 그 결과 치료 결과가 개선되고 기대 수명이 길어집니다. 예:

  • 점 및 피부 병변 분석을 통한 종양 발견
  • 자동 X선 분석
  • MRI 스캔을 통한 증상 발견

자율 주행 교통 수단

자율 주행 차량 기술은 컴퓨터 비전을 사용하여 실시간 이미지를 인식하고 자율 운송에 장착된 여러 대의 카메라를 이용하여 3D 지도를 작성합니다. 이미지를 분석하고 다른 도로 사용자, 도로 표지판, 보행자 또는 장애물을 식별할 수 있습니다.

반자율 주행 차량의 경우, 컴퓨터 비전은 기계 학습(ML)을 사용하여 운전자 행동을 모니터링합니다. 예를 들어 운전자의 머리 위치, 시선 추적, 상체 움직임을 기반으로 주의력 저하, 피로, 졸음의 징후를 찾아냅니다. 이 기능이 특정 경고 신호를 감지하면 운전자에게 경고하여 운전 사고 가능성을 줄입니다.

농업

컴퓨터 비전 애플리케이션은 지능형 자동화를 통한 생산성 향상부터 비용 절감에 이르기까지 농업 부문의 전반적인 기능을 향상시킵니다. 위성 영상과 UAV 영상을 활용하여 광대한 토지를 분석하고 농업 관행을 개선합니다. 컴퓨터 비전 애플리케이션은 토지 상태 모니터링, 작물 질병 식별, 토양 수분 확인, 날씨 및 작물 수확량 예측과 같은 작업을 자동화합니다. 컴퓨터 비전을 활용한 동물 모니터링은 스마트 농업의 또 다른 주요 전략 중 하나입니다.

컴퓨터 비전은 어떻게 작동하나요?

컴퓨터 비전 시스템은 인공 지능(AI) 기술을 사용하여 객체 인식 및 객체 분류를 담당하는 인간 두뇌의 기능을 모방합니다. 컴퓨터 과학자는 방대한 양의 정보를 입력하여 컴퓨터가 시각적 데이터를 인식하도록 훈련합니다. 기계 학습(ML) 알고리즘은 이러한 이미지 또는 비디오에서 일반적인 패턴을 식별하고 해당 지식을 적용하여 알 수 없는 이미지를 정확하게 식별합니다. 예를 들어 컴퓨터가 수백만 개의 자동차 이미지를 처리할 경우, 컴퓨터는 이미지에서 차량을 정확하게 탐지할 수 있는 식별 패턴을 구축하기 시작할 것입니다. 컴퓨터 비전은 아래와 같은 기술을 사용합니다.

딥 러닝

딥 러닝신경망을 사용하는 ML의 일종입니다. 딥 러닝 신경망은 인공 신경 세포로 구성됩니다. 인공 신경 세포는 컴퓨터 내부에서 함께 작동하는 여러 계층의 소프트웨어 모듈입니다. 수학적 계산을 사용하여 이미지 데이터의 다양한 측면을 자동으로 처리하고 점차적으로 이미지에 대한 종합적인 이해를 발전시킵니다.

컨볼루션 신경망

CNN(컨볼루션 신경망)은 레이블 지정 시스템을 활용하여 시각적 데이터를 분류하고 전체 이미지를 이해합니다. 이미지를 픽셀로 분석하고 각 픽셀에 레이블 값을 부여합니다. 이 값이 입력되면 컨볼루션이라는 수학 연산 수행 후 이미지에 대한 예측을 수행합니다. 사람이 멀리 있는 물체를 인식하려는 것처럼 CNN은 색상, 내부 형태 및 질감과 같은 추가 세부 정보를 채우기 전에 먼저 윤곽선과 단순한 모양을 식별합니다. 마지막으로 예측 프로세스를 여러 번 반복하여 정확도를 높입니다.

순환 신경망

순환 신경망(RNN)은 CNN과 유사하지만 일련의 이미지를 처리하여 이미지 사이의 연관성을 찾아낼 수 있습니다. CNN은 단일 이미지 분석에 사용되는 반면 RNN은 비디오를 분석하고 이미지 간의 관계를 이해할 수 있습니다. 

컴퓨터 비전과 이미지 처리의 차이점은 무엇인가요?

이미지 처리는 알고리즘을 사용하여 선명화, 다듬기, 필터링 또는 향상 등의 이미지 변경 작업을 진행합니다. 컴퓨터 비전은 이미지를 변경하지 않고 레이블 지정과 같은 작업을 보고 수행하는 대상을 이해한다는 점에서 다릅니다. 경우에 따라 컴퓨터 비전 시스템이 이미지를 더 잘 이해할 수 있도록 이미지 처리를 사용하여 이미지를 수정할 수 있습니다. 컴퓨터 비전을 사용하여 이미지나 이미지의 일부를 식별한 다음 이미지 처리를 사용하여 이미지를 추가로 수정하는 경우도 있습니다.

컴퓨터 비전이 수행할 수 있는 일반적인 작업은 무엇인가요?

아래에서 조직에서 구현할 수 있는 컴퓨터 비전 작업의 몇 가지 예를 살펴보겠습니다. 

이미지 분류

이미지 분류를 통해 컴퓨터는 이미지를 보고 해당 이미지가 속한 클래스를 정확하게 분류할 수 있습니다. 컴퓨터 비전은 클래스를 이해하고 이에 나무, 비행기, 건물과 같은 레이블을 지정합니다. 일례로 카메라가 사진 속 얼굴을 인식하여 초점을 맞출 수 있습니다.

개체 탐지

개체 탐지는 이미지를 감지하고 위치를 파악하기 위한 컴퓨터 비전 작업입니다. 분류를 사용하여 이미지를 식별, 정렬 및 구성합니다. 개체 탐지는 산업 및 제조 공정에서 자율 애플리케이션을 제어하고 생산 라인을 모니터링하는 데 사용됩니다. 커넥티드 홈 카메라 제조업체 및 서비스 제공업체는 또한 개체 탐지 기능을 활용하여 카메라의 라이브 비디오 스트림을 처리하여 사람과 물체를 실시간으로 감지하고 최종 사용자에게 실행 가능한 경고를 제공합니다.

객체 추적

객체 추적은 딥러닝 모델을 사용하여 범주에 속하는 항목을 식별하고 추적합니다. 이 기능은 여러 분야에 걸쳐 실제 생활에 사용되고 있습니다. 객체 추적의 첫 번째 요소는 개체 탐지입니다. 객체 주변에 경계 상자가 생성되고 객체 ID가 부여되며 프레임을 통해 추적할 수 있습니다. 예를 들어, 객체 추적은 도시 환경에서 교통 모니터링, 인간 감시 및 의료 영상에 활용될 수 있습니다.

세그멘테이션

세그멘테이션은 보이는 픽셀을 기준으로 물체의 이미지를 여러 영역으로 나누어 물체를 식별하는 컴퓨터 비전 알고리즘입니다. 세그멘테이션은 또한 항목의 모양이나 윤곽선을 배치하여 그것이 무엇인지 결정하는 등 이미지를 단순화합니다. 이를 통해 세그멘테이션은 이미지 또는 프레임에 하나 이상의 객체가 있는지 여부도 인식합니다.

예를 들어 영상에 고양이와 개가 있는 경우 세그멘테이션을 사용하여 두 동물을 인식할 수 있습니다. 개체 탐지와 달리, 세그멘테이션은 객체의 주변에 상자를 생성하는 대신 픽셀을 추적하여 객체의 모양을 결정하기 때문에 분석과 레이블 지정이 더 쉬워집니다.

콘텐츠 기반 이미지 검색

콘텐츠 기반 이미지 검색은 대규모 데이터베이스에서 특정 디지털 이미지를 검색할 수 있는 컴퓨터 비전 기술을 응용한 것입니다. 태그, 설명, 레이블 및 키워드와 같은 메타데이터를 분석합니다. 의미 체계 검색은 '건물 사진 찾기'와 같은 명령을 사용하여 적절한 콘텐츠를 검색합니다.

AWS는 어떻게 컴퓨터 비전 작업을 지원하나요?

AWS는 고객의 전문 지식 수준에 상관 없이 모든 포괄적인 데이터 소스 세트에 연결된 가장 광범위하고 완전한 인공 지능 및 기계 학습(AI/ML) 서비스 세트를 제공합니다.

프레임워크를 기반으로 구축하고 자체 인프라를 관리하는 고객을 위해 PyTorch, MXNet, TensorFlow를 비롯한 가장 인기 있는 딥 러닝 프레임워크의 버전을 최적화합니다. AWS는 사용자의 고유한 성능 및 예산 요구를 충족할 수 있도록 프로세서 및 액셀러레이터를 선택하여 광범위하고 심층적인 컴퓨팅, 네트워킹 및 스토리지 인프라 ML 서비스 포트폴리오를 제공합니다.

비즈니스 전반에 걸쳐 표준 컴퓨터 비전 솔루션을 만들려는 고객을 위해 Amazon SageMaker는 비즈니스 분석가를 위한 노코드 제품을 비롯한 완전관리형 인프라, 도구 및 워크플로를 통해 모든 사용 사례에 맞게 데이터를 쉽게 준비하고 ML 모델을 구축, 훈련 및 배포할 수 있도록 합니다.

ML 기술이 부족하거나 시장 출시 시간을 단축하려는 고객 또는 기존 프로세스 또는 애플리케이션에 인텔리전스를 추가하려는 고객을 위해 AWS는 다양한 ML 기반 컴퓨터 비전 서비스를 제공합니다. 이러한 서비스를 사용하면 사전 학습된 API를 통해 AI 애플리케이션에 인텔리전스를 쉽게 추가할 수 있습니다. Amazon Rekognition은 ML로 이미지 및 비디오 분석을 자동화하고 수백만 개의 이미지, 라이브 스트림 및 저장된 비디오를 몇 초 만에 분석합니다.

지금 바로 무료 AWS 계정을 생성하여 컴퓨터 비전을 시작해 보세요.

AWS의 다음 단계

무료 계정 가입

AWS 프리 티어에 즉시 액세스할 수 있습니다.

가입 
콘솔에서 구축 시작

AWS 관리 콘솔에서 AWS로 구축을 시작하세요.

로그인