일반
Q: Amazon Transcribe란 무엇인가요?
Amazon Transcribe는 음성을 텍스트로 손쉽게 변환할 수 있는 AWS 인공 지능 서비스입니다. 자동 음성 인식(ASR) 기술을 사용하므로 음성 기반 고객 서비스 통화 트랜스크립션, 오디오/비디오 콘텐츠의 자막 생성, 오디오/비디오 콘텐츠에 콘텐츠 분석(텍스트 기반) 수행을 비롯해 다양한 비즈니스 애플리케이션에서 Amazon Transcribe를 사용할 수 있습니다.
Q: Amazon Transcribe는 다른 AWS 제품과 어떻게 상호작용하나요?
Amazon Transcribe는 오디오 입력을 텍스트로 변환하여 다양한 텍스트 분석 애플리케이션에서 음성 입력을 사용할 수 있는 기회를 제공합니다. 예를 들어 Amazon Transcribe에서 변환한 텍스트 데이터에 Amazon Comprehend를 사용하여 감정을 분석하거나 엔터티 및 핵심 문구를 추출할 수 있습니다. 이와 마찬가지로 Amazon Translate와 Amazon Polly를 통합하면 한 언어로 음성 입력을 받고 다른 언어로 번역한 후 음성 출력을 생성하여 다국어 대화를 효과적으로 지원할 수 있습니다. Amazon Transcribe를 Amazon Kendra 또는 Amazon OpenSearch와 통합하여 오디오/비디오 라이브러리에서 텍스트 기반 검색을 인덱싱하고 수행할 수도 있습니다. 자세히 알아보려면 Live Call Analytics and Agent Assist, Post Call Analytics, MediaSearch 또는 Content Analysis 솔루션을 확인하세요.
Q: Amazon Transcribe를 사용하기 전에 알아야 할 것은 무엇인가요?
Amazon Transcribe는 음량, 음의 고저, 말하는 속도에서의 차이를 포함하여 다양한 음성 및 청각적 특성을 처리하도록 설계되었습니다. 오디오 신호(배경 소음, 음성이 중첩된 화자, 악센트가 있는 음성 또는 단일 오디오 파일 내 여러 언어 간에 전환과 같은 요소 등 포함)의 콘텐츠 및 품질은 서비스 출력의 정확성에 영향을 줄 수 있습니다. 지속적인 서비스 업데이트를 통해 다양한 발음의 차이를 인식하고 추가 콘텐츠 유형을 지원하도록 개선하고 있습니다.
Amazon Transcribe 사용
Q: 개발자는 Amazon Transcribe에 어떻게 액세스하나요?
가장 쉬운 시작 방법은 콘솔을 사용하여 오디오 파일을 트랜스크립션하는 작업을 제출하는 것입니다. AWS 명령줄 인터페이스에서 서비스를 직접 호출하거나 지원되는 SDK 중 원하는 것을 사용해 애플리케이션에 통합할 수도 있습니다. 어떤 방법이든 Amazon Transcribe 사용을 시작하여 코드 몇 줄을 통해 오디오 파일에 대한 자동 트랜스크립션을 생성할 수 있습니다.
Q: Amazon Transcribe에서 실시간 트랜스크립션을 지원합니까?
예. Amazon Transcribe를 사용하면 HTTP2를 통해 양방향 스트리밍을 열 수 있습니다. 오디오 스트림을 서비스에 전송하고 텍스트 스트림을 실시간으로 반환 받을 수 있습니다. 자세한 내용은 설명서 페이지를 참조하세요.
Q: 실시간 트랜스크립션이 지원하는 인코딩은 무엇인가요?
지원되는 미디어 유형은 배치 트랜스크립션과 스트리밍 트랜스크립션에서 다르지만 두 트랜스크립션 모두에 무손실 형식이 권장됩니다. 자세한 내용은 설명서 페이지를 참조하세요.
Q: Amazon Transcribe에서는 어떤 언어를 지원하나요?
언어 지원에 대한 내용은 이 설명서 페이지를 참조하세요.
Q: Amazon Transcribe는 어떤 디바이스에서 작동합니까?
Amazon Transcribe는 대부분의 경우 디바이스의 구애를 받지 않습니다. 일반적으로 휴대전화, PC, 태블릿, IoT 디바이스(예: 차량 오디오 시스템)와 같이 디바이스에 마이크가 장착된 모든 디바이스에서 작동합니다. Amazon Transcribe API는 디바이스에 입력되고 있는 오디오 스트림의 품질(8kHz 또는 16kHz)을 감지할 수 있기 때문에 음성 텍스트 변환용 음향 모델을 적절하게 선택합니다. 또한 개발자는 애플리케이션을 통해 Amazon Transcribe API를 호출하여 음성 텍스트 변환 기능에 액세스할 수 있습니다.
Q: Amazon Transcribe로 처리할 수 있는 오디오 콘텐츠에 크기 제한이 있나요?
Amazon Transcribe 서비스 호출은 배치 서비스의 경우 API 호출당 4시간(또는 2GB)으로 제한됩니다. 스트리밍 서비스는 최대 4시간까지 연결된 상태를 수용할 수 있습니다.
Q: Amazon Transcribe에서는 어떤 프로그래밍 언어를 지원하나요?
Amazon Transcribe 배치 서비스는 .NET, Go, Java, JavaScript, PHP, Python 및 Ruby를 지원합니다. Amazon Transcribe 실시간 서비스는 Java SDK, Ruby SDK 및 C++ SDK를 지원합니다. 다른 SDK에 대한 지원도 곧 제공될 예정입니다. 자세한 내용은 리소스 및 설명서 페이지를 참조하세요.
Q: 내 사용자 지정 어휘 단어가 인식되지 않습니다. 어떻게 해야 하나요?
음성 인식 출력은 사용자 지정 어휘 항목 외에도 다양한 요소의 영향을 받으므로 사용자 지정 어휘에 포함된 용어라고 해서 올바르게 인식될 것이라는 보장은 없습니다. 그러나 가장 흔한 이유 중 하나는 단어가 쓰여진 것과 발음이 크게 다르기 때문입니다.
이런 경우에는 동일한 단어에 대해 사용자 지정 어휘 파일에 여러 개의 구문을 생성하여 발음의 가능한 변형을 파악하는 것이 좋습니다. 이러한 구문 항목의 출력에 DisplayAs 열을 사용할 수 있습니다. 자세한 내용은 사용자 지정 어휘 설명서를 참조하세요.
Q: 내 출력에 너무 많은 사용자 지정 단어가 표시되는 이유는 무엇인가요?
사용자 지정 어휘는 표적화된 단어로 구성된 짧은 목록에 맞게 최적화되어 있습니다. 어휘가 많으면 사용자 지정 단어가 과다하게 생성될 수 있습니다. 이는 특히 비슷하게 발음되는 단어들이 포함되어 있을 때 두드러집니다. 목록이 긴 경우에는 드문 단어와 오디오 파일에서 실제로 기대되는 단어를 주로 포함하도록 목록을 줄여 보십시오. 여러 사용 사례를 다루기 위해 많은 어휘를 포함하는 경우 서로 다른 사용 사례별로 목록을 분리하세요. 길이가 짧고 다른 여러 단어와 비슷한 소리가 나는 단어는 과다한 생성으로 이어질 수 있습니다(출력에 너무 많은 사용자 지정 단어가 등장함). 이러한 단어는 주변 단어와 결합하여 하이픈으로 구분된 구 형태로 나열하는 것이 좋습니다. 예를 들어 ‘A.D.’라는 사용자 지정 단어를 ‘A.D.-converter’와 같은 구의 일부로 포함할 수 있습니다.
Q: DisplayAs 형식을 사용할 때 트랜스크립션되는 원래 언어와 관련이 없는 문자 집합을 표시할 수 있나요(예: “Street”를 “街道“로 출력)?
예. 구는 특정 언어에 대해 제한적인 문자 집합만 사용할 수도 있지만, DisplayAs 열에는 \t(TAB)를 제외한 모든 UTF-8 문자가 허용됩니다.
Q: 자동 콘텐츠 편집 또는 개인 식별 정보(PII)를 Transcribe용 배치 및 스트리밍 API 모두에서 사용할 수 있나요?
예. Amazon Transcribe는 배치 및 스트리밍 API 모두에 대해 자동 콘텐츠 편집 또는 PII 편집을 지원합니다.
Q: 자동 콘텐츠 편집/PII 식별 및 편집에 지원되는 언어는 무엇인가요?
자동 콘텐츠 편집/PII 편집의 언어 사용 가능 여부에 대한 정보는 Amazon Transcribe 설명서를 참조하세요.
Q: 자동 콘텐츠 편집은 소스 오디오에 있는 민감한 개인 정보도 편집합니까?
아니요. 이 기능은 소스 오디오에서 민감한 개인 정보를 제거하지 않습니다. 그러나 Amazon Transcribe Call Analytics를 사용할 때는 트랜스크립트와 소스 오디오 모두에서 민감한 개인 정보가 제거됩니다. 통화 분석에서 오디오를 편집하는 방법에 대한 자세한 내용은 이 링크를 참조하세요. 또한 식별된 PII 표현의 각 인스턴스에 대해 편집된 트랜스크립션에 제공된 시작 및 종료 타임스탬프를 사용하여 소스 오디오에서 직접 개인 정보를 편집할 수 있습니다. 표준 Transcribe API에 대한 이 오디오 편집 솔루션을 참조하세요.
그러나 특수 Amazon Transcribe Call Analytics API를 사용할 때는 트랜스크립트와 소스 오디오 모두에서 민감한 개인 정보가 제거됩니다. 자세히 알아보려면 Call Analytics 오디오 편집 설명서를 검토하세요.
Q: 기존 텍스트 트랜스크립트의 개인 정보를 편집하는 데 자동 콘텐츠 편집을 사용할 수 있나요?
아니요. 자동 콘텐츠 편집은 오디오에서만 입력으로 작동합니다.
Q: 자동 콘텐츠 편집을 사용하기 전에 알아야 할 것은 무엇인가요?
자동 콘텐츠 편집은 개인 식별 정보(PII)를 식별하고 제거하도록 설계되었지만, 기계 학습의 예측 특성으로 인해 서비스에서 생성한 트랜스크립트에 있는 일부 PII는 식별 및 제거를 못할 수도 있습니다. 자동 콘텐츠 편집에서 제공한 모든 출력을 검토하여 요구 사항에 맞는지 확인해야 합니다.
Q: 스트리밍을 위한 자동 콘텐츠 편집과 배치 API 간에 차이점이 있나요?
예. 배치 API에서 지원하지 않는 스트리밍 API에 대해서 자동 콘텐츠 편집에서 지원하는 두 가지 추가 기능이 있습니다. 스트리밍 API로 콘텐츠 편집을 사용할 때 PII만 식별하고 편집은 실행하지 않도록 할 수 있습니다. 또한 스트리밍 API로 특정 PII 유형을 식별하거나 편집할 수 있습니다. 예를 들어 사회 보장 번호와 신용 카드 정보만 편집하고 이름과 이메일 주소 같은 다른 PII는 그대로 둘 수 있습니다.
Q: 어느 AWS 리전에서 자동 콘텐츠 편집 또는 PII 편집을 사용할 수 있나요?
AWS 리전에서 배치 및 스트리밍 API에 대한 자동 콘텐츠 편집/PII 편집의 가용성에 대한 정보는 Amazon Transcribe 설명서를 참조하세요.
Q: 어떤 API에서 자동 언어 식별을 지원하나요?
자동 언어 식별은 현재 배치 및 스트리밍 API에서 지원됩니다.
Q: Amazon Transcribe에서는 어떤 언어를 자동으로 식별할 수 있나요?
Amazon Transcribe에서는 배치 및 스트리밍 API에서 지원되는 모든 언어를 식별할 수 있습니다. 지원되는 언어 및 언어별 기능에 대한 자세한 내용은 여기를 참조하세요.
Q: Amazon Transcribe는 동일한 오디오 파일에 있는 여러 언어를 식별하나요?
Amazon Transcribe는 배치의 경우 다국어 ID를 지원합니다. 자세한 내용은 이 링크를 참조하세요.
Q: 자동 언어 식별에서 선택할 수 있는 언어 목록을 제한하는 방법이 있나요?
예. 미디어 라이브러리에 있을 수 있는 언어 목록을 지정할 수 있습니다. 언어 목록을 제공하면 해당 목록에서 식별된 언어가 선택됩니다. 언어를 지정하지 않으면 시스템이 Amazon Transcribe에서 지원되는 모든 언어를 대상으로 오디오 파일을 처리하여 가장 가능성 높은 언어를 선택합니다. 언어 선택 목록을 제공하면 언어 식별 정확도가 더 높아집니다. 자세한 내용은 이 링크를 참조하세요.
요금 및 가용성
Q: 비용은 어떻게 되나요?
자세한 내용은 Amazon Transcribe 요금 페이지를 참조하세요.
Q: Amazon Transcribe를 사용할 수 있는 AWS 리전은 어디인가요?
AWS 글로벌 인프라 리전 표를 참조하세요. Amazon Transcribe 엔드포인트 및 할당량에 대한 자세한 내용은 여기를 참조하세요.
데이터 프라이버시
Q: Amazon Transcribe에서 처리한 음성 입력이 저장됩니까? AWS에서는 이를 어떻게 사용합니까?
Amazon Transcribe는 서비스에서 처리한 음성 입력을 오로지 서비스를 제공 및 유지 관리하고 Amazon Transcribe 및 다른 Amazon 기계 학습/인공 지능 기술의 품질을 개선 및 개발하기 위해서만 저장하고 사용할 수 있습니다. 관련 기술의 개발 및 교육을 비롯하여 Amazon Transcribe 고객 경험을 지속적으로 개선하기 위해서는 고객 콘텐츠를 사용하는 것이 중요합니다. AWS에서는 고객 또는 고객의 최종 사용자를 제품, 서비스 또는 마케팅의 대상으로 삼기 위해 고객의 콘텐츠에 포함되어 있을 수 있는 개인 식별 정보를 사용하지 않습니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 저장 암호화 및 전송 암호화를 비롯하여 적절하고 정교한 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 https://aws.amazon.com/compliance/data-privacy-faq/를 참조하세요. AWS Organizations 옵트아웃 정책을 사용하여 Amazon Transcribe 및 기타 Amazon 기계 학습/인공 지능 기술의 품질을 개선 및 개발하는 데 본인의 콘텐츠가 사용되는 것을 거부할 수 있습니다. 옵트아웃 방법에 대한 자세한 내용은 AI 서비스 옵트아웃 정책을 참조하세요.
Q: Amazon Transcribe에서 저장한 트랜스크립션 작업과 연관된 데이터 및 아티팩트를 삭제할 수 있나요?
예. 사용 가능한 삭제 API를 통해 트랜스크립션 작업과 관련된 데이터와 그 밖의 아티팩트를 삭제할 수 있습니다. 삭제하는 데 문제가 있는 경우 AWS 지원에 문의해 주세요.
Q: Amazon Transcribe에서 처리하고 저장한 내 콘텐츠에 대한 액세스 권한은 누구에게 있습니까?
승인된 직원만 Amazon Transcribe에서 처리한 콘텐츠에 액세스할 수 있습니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 저장 암호화 및 전송 암호화를 비롯하여 적절하고 정교한 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 https://aws.amazon.com/compliance/data-privacy-faq/를 참조하세요.
Q: Amazon Transcribe에서 처리하고 저장한 내 콘텐츠는 여전히 내 소유입니까?
사용자는 언제나 자신의 콘텐츠에 대한 소유권을 유지하며 AWS에서는 사용자의 동의가 있을 때만 이를 사용합니다.
Q: 사용자 지정 언어 모델을 훈련하는 데 사용하는 데이터는 어떻게 됩니까? 여전히 내가 소유하나요?
전용 모델을 훈련하는 데 사용되는 텍스트 데이터를 제출하면 원본 텍스트 데이터와 생성된 사용자 지정 모델에 대한 소유권을 사용자가 보유하게 됩니다. 이 텍스트 데이터는 저장되거나 AWS의 일반 음성 인식 엔진을 개선하는 데 사용되지 않습니다. CLM을 사용하여 생성된 모델은 독립적이며 소유자만 액세스할 수 있습니다.
Q: 서비스에서 훈련 데이터를 저장하지 않는데, 트랜스크립션 품질이나 전체적인 서비스 경험이 후퇴하거나 저하됩니까?
서비스가 훈련 데이터를 저장하지 않더라도 트랜스크립션 품질이 저하되지 않습니다. 실제로 사용자 지정 언어 모델을 생성하는 데 훈련 데이터를 사용하고 나면 모델 자체를 재량에 따라 반복적으로 사용할 수 있습니다. 고객이 업로드한 원래의 훈련 세트는 당사 시스템에서 삭제됩니다. 기술적 지원이 필요한 경우에만 문제가 됩니다. 원래 훈련 데이터를 저장하지 않기 때문에 지원 팀이 잠재적 서비스 문제를 조사해야 할 경우 해당 자산이나 관련 중간 아티팩트에 편리하게 액세스할 수 없습니다. 지원이 가능하기는 하지만, 고객에게 추가적인 정보를 요청해야 할 수 있으므로 매우 신속하게 제공하기는 어려울 수 있습니다.
Q: 향후의 모델 업데이트 또는 개선 시 데이터를 재사용하려면 어떻게 해야 합니까?
훈련 데이터가 저장되지 않으므로 동일한 데이터 집합과 추가적인 데이터를 다시 업로드하여 새 모델을 훈련해야 합니다. Amazon Transcribe에서 제공하는 기본 모델을 업데이트하면 알림이 전송됩니다. 최신 기본 모델을 활용하려면 새 모델을 훈련하기 위한 데이터를 제출해야 합니다. 그러면 앞서 생성한 원본 사용자 지정 모델과 사용하고자 하는 새 버전을 모두 가지고 있어야 합니다.
Q: 모델을 삭제하려면 어떻게 해야 하나요?
생성한 모든 고객 언어 모델을 재량에 따라 삭제할 수 있습니다.
Q: Amazon Transcribe에서 처리한 콘텐츠는 내가 Amazon Transcribe를 사용하고 있는 AWS 리전 이외에 외부로 이동하나요?
Amazon Transcribe에서 처리한 모든 콘텐츠는 암호화되어 Amazon Transcribe를 사용하고 있는 AWS 리전에 저장됩니다. Amazon Transcribe에서 처리한 콘텐츠 중 일부는 Amazon Transcribe 고객 경험 및 기타 Amazon 기계 학습/인공 지능 기술의 지속적인 개선 및 개발만을 위해 다른 AWS 리전에 저장될 수 있습니다. AWS Support에 연락하여 Amazon Transcribe 및 기타 Amazon 기계 학습/인공 지능 기술의 품질을 개선하기 위해 본인의 콘텐츠를 사용하지 않도록 거부하는 경우, 그러한 콘텐츠는 다른 AWS 리전에 저장되지 않습니다. AWS Support에 문의하여 고객 계정과 연결된 음성 입력을 삭제하도록 요청할 수 있습니다. AWS에서는 고객의 신뢰, 개인 정보, 콘텐츠의 보안을 최우선으로 하고 있으며 콘텐츠에 대한 무단 액세스 또는 유출을 방지하기 위해 저장 중 및 전송 중 암호화를 비롯하여 적절하고 정교한 기술적 및 물리적 제어를 구현하고 고객과의 약속을 충실히 준수합니다. 자세한 내용은 https://aws.amazon.com/compliance/data-privacy-faq/를 참조하세요.
Q: 13세 미만 어린이를 대상으로 하며 COPPA(Children’s Online Privacy Protection Act)의 적용을 받는 웹 사이트, 프로그램 또는 애플리케이션에 Amazon Transcribe를 사용할 수 있습니까?
예. COPPA에 따라 필요한 알림을 제공하고 필요한 확인 가능한 부모 동의를 제공해야 하는 의무 조항을 비롯한 Amazon Transcribe 서비스 약관을 준수하는 경우, 13세 미만 어린이를 대상(전체 또는 일부)으로 하는 웹 사이트, 프로그램 또는 애플리케이션에 Amazon Transcribe를 사용할 수 있습니다.
Q: 내 웹 사이트, 프로그램 또는 애플리케이션이 COPPA의 적용을 받는지 확인하려면 어떻게 해야 합니까?
COPPA 요구 사항에 대한 정보와 웹 사이트, 프로그램 또는 기타 애플리케이션에 COPPA가 적용되는지 확인하기 위한 지침은 미국연방거래위원회(US FTC)에서 제공하고 관리하는 리소스를 직접 참조하시기 바랍니다. 또한, 이 사이트에는 서비스의 대상(전체 또는 일부)이 13세 미만 어린이인지를 확인하는 방법에 대한 정보도 제공되어 있습니다.
Amazon Transcribe Call Analytics
Q: Amazon Transcribe Call Analytics이란 무엇입니까?
Amazon Transcribe Call Analytics는 다양한 통화 트랜스크립트와 실행 가능한 대화 인사이트를 제공하는 AI 기반 API로, 이를 통화 애플리케이션에 추가하여 고객 경험과 에이전트 생산성을 높일 수 있습니다. 강력한 음성을 텍스트로 변환 기능 및 고객 관리와 아웃바운드 영업 통화를 이해하기 위해 특별히 훈련된 자연어 처리(NLP) 모델을 결합합니다. AWS Contact Center Intelligence(CCI) 솔루션의 일부인 이 API는 고객 센터의 제약을 받지 않으므로 고객과 ISV가 통화 분석 기능을 자신의 애플리케이션에 쉽게 추가할 수 있습니다.
Q. Amazon Transcribe Call Analytics에서 어떤 작업을 수행할 수 있나요?
Amazon Transcribe Call Analytics는 실시간 통화 분석과 통화 후 분석을 모두 수행할 수 있습니다. 개발자는 Call Analytics를 사용하여 고객 및 에이전트 감정 점수, 통화 원인, 통화 범주, 통화 요약과 같은 소중한 인텔리전스를 API 출력으로 인바운드 또는 아웃바운드 통화 애플리케이션에 빠르게 추가할 수 있습니다. 일반적인 사용 사례로는 에이전트 지원, 요약, 감독자 알림, 통화 분석이 있습니다. 여기에서 Transcribe Call Analytics에 기반을 둔 오픈 소스 샘플 솔루션인 Real-time Call Analytics with Agent Assist와 Post Call Analytics를 확인하세요.
Q. Amazon Transcribe Call Analytics를 시작하려면 어떻게 해야 하나요?
API 및 AWS Management Console을 통해 Transcribe Call Analytics를 사용할 수 있습니다. API 또는 콘솔을 통해 분석 작업을 생성하고 모니터링할 수 있습니다. 콘솔에서는 분석 작업 목록과 JSON 출력 미리 보기 및 입력 파라미터를 포함한 작업 세부 정보 페이지를 볼 수 있습니다. 이외에도 자동화된 문의 범주 기능을 위해 API 및 콘솔을 통해 범주를 생성하고 편집할 수 있습니다.
Q. Amazon Transcribe Call Analytics는 어떤 언어를 지원하나요?
Amazon Transcribe Call Analytics의 언어 사용 가능 여부에 대한 정보는 Amazon Transcribe 설명서를 참조하세요.
Q: Amazon Transcribe Call Analytics는 어느 AWS 리전에서 사용할 수 있나요?
Amazon Transcribe Call Analytics의 AWS 리전 적용 범위에 대한 자세한 내용은 AWS 리전 서비스 설명서를 참조하세요. Amazon Transcribe Call Analytics의 생성형 통화 요약은 현재 미국 동부(버지니아 북부) 및 미국 서부(오레곤)에서만 사용할 수 있습니다.
Q: 통화 후 및 실시간 Transcribe Call Analytics API 모두에서 생성형 통화 요약 기능을 사용할 수 있나요?
현재 생성형 통화 요약은 통화 후 분석을 위한 Transcribe Call Analytics API에서만 사용할 수 있습니다.
Q: Amazon Transcribe Call Analytics 요금은 어떻게 책정됩니까?
Amazon Transcribe Call Analytics API는 표준 Amazon Transcribe API와 별도로 요금이 책정됩니다. 자세한 내용은 Amazon Transcribe 요금 페이지를 참조하세요.
Amazon Transcribe Medical
Q: Amazon Transcribe Medical이란 무엇입니까?
Amazon Transcribe Medical은 개발자가 의료 관련 음성 데이터를 텍스트로 변환하는 기능을 애플리케이션에 쉽게 추가할 수 있도록 하는 자동 음성 인식(ASR) 서비스입니다. Amazon Transcribe Medical을 사용하면 구술한 의료 데이터 및 대화 음성을 신속하고 정확하게 텍스트로 기록하여 다양한 용도로 활용할 수 있는데, 가령 의사의 메모를 기록하거나 다운스트림 텍스트 분석을 처리하여 의미 있는 통찰력 추출할 수 있습니다.
Q: Amazon Transcribe Medical로 어떤 작업을 수행할 수 있습니까?
Amazon Transcribe Medical은 고급 기계 학습 모델을 사용하여 의료진의 음성을 텍스트로 정확하게 옮겨 기록합니다. Transcribe Medical은 임상 문서 워크플로 및 약품 안전성 모니터링(약물 감시)부터 원격 진료용 자막 그리고 의료 서비스 및 생명 과학 영역의 콜 센터 분석에 이르기까지 다양한 사용 사례를 지원하는 데 활용할 수 있는 텍스트 트랜스크립트를 생성할 수 있습니다.
Q: Amazon Transcribe Medical을 사용하려면 자동 음성 인식(ASR) 분야의 전문가가 되어야 합니까?
아니요. ASR 또는 기계 학습과 관련된 전문 지식이 있어야 Amazon Transcribe Medical을 사용할 수 있는 것은 아닙니다. Transcribe Medical의 API를 호출하기만 하면 이 서비스가 백엔드에서 필요한 기계 학습을 처리하여 의료진의 음성을 텍스트로 옮겨 기록합니다.
Q: Amazon Transcribe Medical을 시작하려면 어떻게 해야 합니까?
AWS Management Console 또는 SDK를 사용하여 Amazon Transcribe Medical을 시작할 수 있습니다. 자세한 내용은 이 기술 설명서 페이지를 참조하세요.
Amazon Transcribe Medical은 프리 티어를 제공하므로 서비스를 테스트해 볼 수 있습니다. 자세한 내용은 이 요금 페이지를 참조하십시오.
Q: Amazon Transcribe Medical에서는 어떤 언어를 지원합니까?
Amazon Transcribe Medical에서는 현재 의료 트랜스크립션을 영어로 지원합니다.
Q: Amazon Transcribe Medical에서는 어떤 의료 전문 분야를 지원합니까?
Amazon Transcribe Medical은 확대되는 1차 진료 및 특수 진료 전문 분야 목록을 위한 트랜스크립션을 지원합니다. 지원하는 의료 전문 분야에 대한 자세한 내용은 설명서를 참조하세요.
Q: Amazon Transcribe Medical은 어느 AWS 리전에서 사용할 수 있나요?
Amazon Transcribe Medical의 AWS 리전 적용 범위에 대한 자세한 내용은 AWS 리전 서비스 설명서를 참조하세요.
Q: Amazon Transcribe Medical의 요금은 어떻게 부과되나요?
요금에 대한 자세한 내용은 Amazon Transcribe Medical 요금 페이지를 참조하세요.
Q: Amazon Transcribe Medical은 HIPAA 적격 서비스입니까?
예.
Q: Amazon Transcribe Medical에서 처리한 콘텐츠가 서비스 제공 이외의 목적으로 사용됩니까?
Amazon Transcribe Medical은 서비스가 처리한 콘텐츠를 서비스 제공 및 유지 이외의 다른 사유로 사용하지 않습니다. Amazon Transcribe Medical에서 처리한 콘텐츠는 이 서비스 또는 다른 Amazon 기계 학습/인공 지능 기술을 위한 품질을 개발하거나 개선하는 데 사용되지 않습니다.
Q: Amazon Transcribe Medical에는 시간이 경과함에 따라 학습하는 기능이 있습니까?
예. Amazon Transcribe Medical은 기계 학습을 이용하며 고객 사용 사례에 더욱 유용하게 활용될 수 있도록 지속적으로 학습합니다. Amazon Transcribe Medical은 모델 학습 서비스에 사용된 고객 데이터를 저장하거나 사용하지 않습니다.
Q: Amazon Transcribe Medical 서비스를 사용하기 전에 추가로 알아야 할 사항이 있습니까?
Amazon Transcribe Medical은 전문적인 의학적 조언, 진단 또는 치료를 대체할 수 없습니다. 고객 및 최종 사용자는 Amazon Transcribe Medical이 제공한 모든 정보의 정확성, 완전성, 적시성 및 적합성을 결정하기 위해 본인의 재량, 경험을 활용하고 판단해야 할 책임이 있습니다. 귀하와 최종 사용자는 Amazon Transcribe Medical의 사용을 기반으로 한 결정, 조언, 행동 및/또는 부적절한 행동에 대해 전적으로 책임을 집니다.
Amazon Transcribe Medical은 상황에 따라 보호된 의료 정보를 정확하게 식별하지 못할 수 있으며 HIPAA에 의거하여 보호된 의료 정보 식별을 취소하기 위한 요구 사항을 충족하지 못합니다. 귀하에게는 Amazon Transcribe Medical이 제공한 결과를 검토하여 필요에 맞게 적절히 사용할 책임이 있습니다.
사용자 지정 언어 모델
Q: 현재 사용자 지정 언어 모델은 어떤 기능을 제공하나요?
사용자 지정 언어 모델(CLM)을 사용하면 도메인에 특정된 언어 모델을 훈련하고 개발할 수 있습니다. CLM은 현재 배치 전사에 대해 오스트레일리아 영어, 영국 영어, 힌디어, 미국 영어 및 미국 스페인어를 지원하고 스트리밍 전사에 대해 미국 영어를 지원합니다. CLM은 배치 전사에서 사용자 지정 어휘의 동시 사용을 지원합니다.
Q: 어떤 유형의 훈련 데이터가 얼마나 필요합니까? 데이터를 어떻게 획득할 수 있습니까? 데이터에 특정 형식이 있어야 합니까?
텍스트 데이터는 사용자 지정 모델을 사용하여 기록할 오디오와 관련이 있어야 합니다. 도메인별 단어, 구, 단어 조합을 최대한 많이 포함하고 있어야 합니다. 실행되는 텍스트의 단어 수는 100,000~10,000,000개를 권장합니다. 텍스트 데이터 리소스는 사내 또는 공개 소스에서 획득할 수 있습니다(예: 고객 웹사이트의 텍스트 사용). 각 평문 파일에 단어가 20만 개 내외로 포함된 것이 좋지만 전체 파일 용량은 1GB를 초과하지 않아야 합니다. 텍스트는 UTF-8 형식이고 1줄당 1문장을 사용해야 합니다. 각 문장에는 구두점이 포함되어야 합니다. 사용자가 철자 검사, 서식 지정 문자 제거, 인코딩 검증을 담당해야 합니다.
Q: 사용자 지정 언어 모델(CLM)을 사용하려면 어떻게 해야 합니까?
사용자 지정 언어 모델을 훈련하려면 고객이 Amazon S3 버킷에서 텍스트를 제공하기만 하면 됩니다. 그러면 사용자가 Amazon Transcribe 서비스 콘솔을 사용하여 데이터를 로드하여 처리하고, 사용자 지정 언어 모델을 훈련할 수 있습니다. 훈련은 완전히 자동화되며 최소한의 사용자 개입만 필요합니다. 최종 사용자 지정 모델이 준비되면 고객의 AWS 계정에서 도메인별 오디오 파일을 기록할 수 있습니다. 게다가 고객은 여러 사용자 지정 모델을 훈련하여 다양한 사용 사례에 사용할 수 있습니다.
Q: 개선이 보장됩니까? 텍스트 데이터를 수집하는 노력을 확장할 가치가 있습니까?
개선이 된다는 보장은 없습니다. 성능은 텍스트 데이터가 오디오와 일치하는 정도, 입력되는 데이터의 양에 따라 변경됩니다. 일반적으로 데이터가 많을수록 좋지만, 특히 데이터는 기록하려는 오디오 파일에서 일어날 것으로 예상되는 단어와 단어 시퀀스를 포함해야 합니다. 트랜스크립션 정확도가 개선되는 수준은 훈련 데이터의 품질과 사용 사례에 따라 달라집니다. 일부 시나리오에서는 일반적 벤치마킹에서 상대적 정확도가 10~15%까지 개선됩니다.
Q: 모델을 훈련하는 데 얼마나 걸립니까? 언제 사용할 수 있습니까?
일반적으로 모델 훈련은 6~10시간이 걸립니다. 훈련 시간의 길이는 데이터 세트의 용량에 따라 달라집니다. 사용자 지정 모델은 훈련을 완료한 이후에 바로 사용할 수 있습니다.
Q: 모델은 어떻게 사용할 수 있습니까? Amazon Transcribe에서 제공하는 일반 모델보다 더 성능이 좋은지 어떻게 확인할 수 있나요?
모델은 훈련 프로세스를 진행하기 전에 모델 ID를 할당한 계정에서 사용할 수 있습니다. 모델을 사용하려면 모델 ID를 포함한 플래그를 트랜스크립션 요청에 추가해야 합니다. 오디오 파일에서 모델을 테스트하고 일반 엔진에서 획득한 결과와 출력을 비교해야 합니다.
Q: 사용자 지정 언어 모델을 몇 개까지 훈련할 수 있나요? 계정에서 동시에 여러 모델을 사용할 수 있습니까?
AWS 계정에서 언제든 최대 5개의 모델을 동시에 훈련할 수 있습니다. 기본적으로 각 계정에 최대 10개의 모델을 저장할 수 있습니다. 더 많은 모델이 필요할 경우, 서비스 한도를 여기에서 높일 수 있습니다.
Q: 사용자 지정 음향 모델이 지원됩니까?
아니요. 사용자 지정 음향 모델은 지원되지 않습니다. 사용자 지정 언어 모델은 사용 사례 또는 도메인과 관련된 텍스트 데이터를 기반으로 구축됩니다.
Amazon Transcribe 요금에 대해 자세히 알아보기