Amazon Neptune ML

쉽고 빠르며 정확한 그래프 예측

개요

Amazon Neptune ML은 Neptune의 새로운 기능입니다. 이 기능은 그래프 데이터를 사용하여 쉽고 빠르며 정확하게 예측할 수 있는 그래프 전용 기계 학습(ML) 기술인 그래프 신경망(GNN)을 사용합니다. Neptune ML은 비그래프 방식을 사용한 예측과 비교하여 대부분의 그래프 예측 정확도를 50% 이상 개선할 수 있습니다.

관계가 수십억 개인 그래프에서 정확히 예측하는 작업은 어렵고 시간이 많이 걸릴 수 있습니다. XGBoost와 같은 기존 ML 접근 방식은 테이블 형식의 데이터용으로 설계되었기 때문에 그래프에서는 효과적으로 작동하지 않을 수 있습니다. 따라서 이 방법을 그래프에서 사용하면 시간이 걸리고 전문 개발자 기술이 필요하며, 최적의 예측에 미치지 못할 수도 있습니다.

AWS에서 제공하는 오픈 소스 라이브러리인 Deep Graph Library(DGL)를 통해 딥 러닝을 그래프 데이터에 쉽게 적용할 수 있습니다. Neptune ML은 그래프 데이터에 가장 적합한 ML 모델을 선택하고 학습시키는 번거로운 작업을 자동화하고 사용자가 Neptune API 및 쿼리를 사용하여 그래프에서 직접 ML을 실행할 수 있도록 지원합니다. 그 덕분에 이제 새로운 도구 및 ML 기술을 배울 필요 없이, 몇 주가 아닌 몇 시간 만에 Neptune 데이터에 대한 ML을 생성, 훈련 및 적용할 수 있습니다.

ML 및 생성형 AI

Neptune ML은 그래프 데이터에 ML 모델을 자동으로 생성하고 학습하고 적용합니다. DGL을 사용하여 워크로드에 가장 적합한 ML 모델을 자동으로 선택하고 학습시키므로 그래프 데이터에 대한 ML 기반 예측을 몇 주가 아닌 몇 시간 만에 수행할 수 있습니다.

Neptune ML은 그래프 데이터에 적용된 최첨단 ML 기법인 GNN을 사용하여 그래프에서 수십억 개 이상의 관계를 추론할 수 있으므로 더 정확한 예측을 할 수 있습니다.

*스탠포드 대학교에서 발표한 연구에 따르면, Neptune ML은 GNN을 사용하여 비그래프 ML보다 50% 이상 더 정확하게 예측합니다.

LangChain은 대규모 언어 모델(LLM)을 사용하여 애플리케이션 생성을 간소화하도록 설계된 오픈 소스 Python 프레임워크입니다. 개발자는 Neptune과 LangChain의 통합을 통해 LangChain의 오픈 소스 프레임워크를 사용하여 컨텍스트 인식 애플리케이션 생성을 간소화할 수 있습니다.

Neptune 및 LangChain을 사용하면 제공된 컨텍스트를 기반으로 응답을 반환하고 openCypher 쿼리 언어를 사용하여 Neptune 그래프 데이터베이스를 쿼리할 수 있습니다. 예를 들어, Neptune openCypher QA 체인을 사용하여 영어 질문을 openCypher 쿼리로 변환하고 사람이 읽을 수 있는 응답을 반환할 수 있습니다. 이 체인을 사용해 '오스틴 공항에는 몇 개의 출발 노선이 있나요?'와 같은 질문에 답할 수 있습니다.

Neptune openCypher QA 체인에 대한 자세한 내용은 오픈 소스 LangChain 설명서를 참조하세요.

LlamaIndex는 사용자 지정 데이터 소스를 대규모 언어 모델(LLM)에 연결하는 데 사용할 수 있는 오픈 소스 데이터 프레임워크이며 LLM에 지식 그래프를 사용하는 것을 지원합니다.

LlamaIndex를 사용하면 Neptune을 그래프 저장소 또는 벡터 저장소로 사용하여 GraphRAG와 같은 기술을 통해 생성형 AI 애플리케이션을 구축할 수 있습니다.

사용 사례

사기 행위로 인한 기업의 손실액은 수백만 내지 수십억 USD에 달합니다. 따라서 기업은 사기성 사용자, 계정, 기기, IP 주소 또는 신용 카드를 탐지하여 손실을 최소화하고자 합니다. 개체(사용자, 장치 또는 카드) 간의 상호 작용을 그래프로 표현하여, 사용자의 반복적인 소액 결제나 다수의 계정 사용 등 잠재적 사기 행위의 집계를 탐지할 수 있습니다.

자세히 알아보기

자격 증명 그래프는 여러 장치 및 식별자에서 제품 또는 웹 사이트와 상호 작용한 내용을 기반으로 고객 및 잠재 고객에 대한 통합된 하나의 뷰를 제공합니다. 조직에서는 자격 증명 그래프를 사용하여 수백만 사용자를 대상으로 실시간 맞춤화 및 광고 타겟팅을 시행합니다. Neptune ML은 여러 기기에서의 검색 기록이나 고객 유치 퍼널 내 위치와 같은 특성을 기반으로 특정 고객에게 다음 단계 또는 할인 제품을 자동으로 추천합니다.

자세히 알아보기

지식 그래프는 조직의 모든 구성원이 보다 쉽게 사용할 수 있도록 조직의 정보 자산을 통합합니다. Neptune ML은 여러 데이터 소스 간 누락된 관계를 유추하고 유사한 개체를 식별하여 모든 사용자의 정보 이해를 돕습니다.

자세히 알아보기

기존에는 분석 서비스를 수동으로 사용하여 제품 추천이 이루어졌습니다. Neptune ML은 그래프 데이터에서 새로운 관계를 직접 식별할 수 있기 때문에 플레이어가 구매할 만한 게임, 팔로우할 만한 다른 플레이어 또는 구매할 만한 제품 목록을 쉽게 추천할 수 있습니다.

요금

선불 투자가 필요하지 않습니다. Amazon SageMaker, Neptune, Amazon Simple Storage Service(Amazon S3) 등 사용한 AWS 리소스에 대한 비용만 지불하면 됩니다.

시작하기

사전 구축된 AWS CloudFormation 빠른 시작 템플릿을 사용하면 Neptune ML을 가장 쉽게 시작할 수 있습니다. 또한 Neptune ML 노트북에서 사전 구축된 CloudFormation 스택을 사용한 노드 분류, 노드 회귀, 링크 예측의 엔드 투 엔드 예시를 확인할 수 있습니다.

Neptune ML 스택 생성