Вопросы и ответы по Amazon SageMaker

Общие вопросы

Следующее поколение Amazon SageMaker – это унифицированная платформа для данных, аналитики и искусственного интеллекта. SageMaker нового поколения объединяет широко используемые возможности AWS в сфере машинного обучения и аналитики, а также предоставляет интегрированный интерфейс для аналитики и искусственного интеллекта с унифицированным доступом ко всем вашим данным. Она позволяет вам организовать совместную работу и разрабатывать решения быстрее в единой студии (ознакомительная версия), используя привычные сервисы AWS для разработки моделей, генеративного искусственного интеллекта, обработки данных и SQL-аналитики. В тоже время весь процесс ускоряется за счет Amazon Q для разработчиков (самого мощного ассистента на базе генеративного искусственного интеллекта для разработки программного обеспечения). Кроме того, вы можете получить доступ ко всем данным, независимо от места их хранения (например, в озерах данных, хранилищах данных, сторонних приложениях или федеративных источниках данных), а встроенные средства управления удовлетворяют требованиям корпоративной безопасности.

Мы дополнили сервис Amazon SageMaker, получивший широкое распространение, обширным набором возможностей AWS для работы с данными, аналитикой и искусственным интеллектом, чтобы создать единую платформу для работы в этих сферах. В дальнейшем существующий в SageMaker набор возможностей для работы с искусственным интеллектом и машинным обучением, предназначенный для обработки данных, создания, обучения и развертывания моделей искусственного интеллекта, будет называться Amazon SageMaker AI. Amazon SageMaker AI встроен в следующее поколение Amazon SageMaker, а также доступен в качестве отдельной услуги для тех, кто хочет сфокусироваться на создании, обучении и развертывании моделей искусственного интеллекта и машинного обучения с учетом масштабирования.

В новое поколение Amazon SageMaker входят указанные ниже элементы.

  • Amazon SageMaker Unified Studio (ознакомительная версия) – единая среда разработки для обеспечения доступа и использования привычных инструментов и функций из специализированных сервисов AWS для аналитики, искусственного интеллекта и машинного обучения. К таким можно отнести Amazon EMR, AWS Glue, Amazon Athena, Amazon Redshift, Amazon Bedrock и Amazon SageMaker AI.
  • Amazon SageMaker Lakehouse – это решение для унифицированного доступа к данным в озерах данных Amazon S3, Amazon Redshift, сторонних и федеративных источниках данных.
  • Управление данными и искусственным интеллектом в Amazon SageMaker – это решение для безопасного обнаружения, управления и совместной работы с данными и искусственным интеллектом.

Следующее поколение Amazon SageMaker предлагает приведенные ниже возможности.

  • Amazon SageMaker Unified Studio (ознакомительная версия) – это решение для создания приложений с использованием всех ваших данных и инструментов для аналитики и искусственного интеллекта в единой среде.
  • Amazon SageMaker Lakehouse – это решение для объединения данных в озерах данных Amazon Simple Storage Service (Amazon S3), хранилищах данных Amazon Redshift, сторонних и федеративных источниках данных с помощью Amazon SageMaker Lakehouse.
  • Управление данными и искусственным интеллектом – это решение для безопасного обнаружения, управления и совместной работы с данными и искусственным интеллектом с помощью Amazon SageMaker Catalog, созданного на базе Amazon DataZone.
  • Разработка моделей – это решение для разработки, обучения и развертывания машинного обучения и базовых моделей с полностью управляемой инфраструктурой, инструментами и рабочими процессами при помощи Amazon SageMaker AI (ранее – Amazon SageMaker).
  • Разработка генеративных приложений искусственного интеллекта – это возможность создавать и масштабировать приложения с генеративным искусственным интеллектом при помощи Amazon Bedrock.
  • SQL-аналитика – это набор функций для сбора информации с помощью сервиса Amazon Redshift, который является самым эффективным движком SQL.
  • Обработка данных – это анализ, подготовка и интеграция данных для аналитики и искусственного интеллекта с помощью фреймворков с открытым исходным кодом на Amazon Athena, Amazon EMR и AWS Glue.

Amazon SageMaker – это унифицированная платформа для данных, аналитики и искусственного интеллекта. SageMaker нового поколения объединяет широко используемые возможности AWS в сфере машинного обучения и аналитики, а также предоставляет интегрированный интерфейс для аналитики и искусственного интеллекта с унифицированным доступом ко всем вашим данным. Этот унифицированный подход помогает эффективнее работать с данными, расширять сотрудничество между командами и повышать общую производительность.

Ниже описаны преимущества Amazon SageMaker.

  • Работайте совместно и ускоряйте процесс разработки с помощью единой среды разработки для данных и искусственного интеллекта, используя привычные сервисы AWS для создания моделей, генеративного искусственного интеллекта, обработки данных и SQL-аналитики.
  • Разрабатывайте и масштабируйте примеры использования искусственного интеллекта за счет обширного набора инструментов для обучения, настройки и развертывания моделей машинного обучения и базовых моделей, а также быстрого создания приложений генеративного искусственного интеллекта, адаптированных для вашего бизнеса.
  • Устраняйте количество хранилищ данных с помощью открытого озера, которое объединяет все ваши данные в озерах данных Amazon S3, хранилищах данных Amazon Redshift, сторонних или федеративных источниках данных.
  • Удовлетворяйте потребности предприятия в сфере безопасности за счет встроенных средств управления данными и искусственным интеллектом, которые позволяют контролировать доступ к определенным данным, моделям машинного обучения, артефактам разработки генеративного искусственного интеллекта и вычислениям, предоставляя их конкретным пользователям для заданных целей.

Да. Можно продолжать использовать отдельные сервисы AWS, в том числе Amazon SageMaker AI (ранее – Amazon SageMaker), Amazon EMR для обработки больших данных, AWS Glue и Amazon Redshift для хранения данных, самостоятельно, основываясь на специфических потребностях своего бизнеса. Это не повлияет на то, как вы используете свои отдельные сервисы сейчас.

Еще одним преимуществом Amazon SageMaker является унифицированный, удобный интерфейс, который позволяет получить доступ к этим сервисам. Такой подход поможет эффективнее внедрять инновации с помощью данных, расширить взаимодействие между командами и повысить общую производительность.

Amazon SageMaker объединяет широкий набор сервисов AWS для искусственного интеллекта и аналитики: Amazon SageMaker Unified Studio (ознакомительная версия), Управление данными и искусственным интеллектом в Amazon SageMaker и Amazon SageMaker Lakehouse.

Из Amazon SageMaker Unified Studio можно перейти к возможностям обработки данных, SQL-аналитике, машинному обучению и разработке приложений с генеративным искусственным интеллектом, используя для этого существующие сервисы AWS. Для обработки данных можно использовать такие сервисы, как Amazon Athena, AWS Glue, Amazon EMR и Управляемые рабочие процессы Amazon для Apache Airflow (Amazon MWAA), которые позволяют легко анализировать, готовить, интегрировать и оркестрировать данные для аналитики и искусственного интеллекта при любом масштабировании. Для SQL-аналитики Amazon Redshift легко интегрируется с Amazon SageMaker Lakehouse, что позволяет получить мощные возможности для аналитики SQL на объединенных данных в хранилищах данных Redshift и озерах данных Amazon S3. Возможности машинного обучения обеспечивает Amazon SageMaker AI (ранее – Amazon SageMaker). Они предназначены для создания, обучения и развертывания базовых моделей и моделей машинного обучения. Кроме того, можно разрабатывать приложения с генеративным искусственным интеллектом с помощью Amazon Bedrock IDE (ознакомительная версия).

Управление данными и искусственным интеллектом в Amazon SageMaker позволяет организовать комплексное встроенное администрирование с помощью унифицированной системы регулирования данных в Amazon SageMaker Catalog, разработанной на базе Amazon DataZone, для безопасного обнаружения и контроля данных и искусственного интеллекта, а также совместной работы над ними.

Решение Amazon SageMaker Lakehouse построено на базе нескольких сервисов Каталога данных AWS Glue, AWS Lake Formation и Amazon Redshift с целью обеспечить унифицированный доступ к данным в озерах данных Amazon S3, хранилищах данных Amazon Redshift, сторонних и объединенных источниках данных.

Кроме того, эти сервисы все еще доступны как отдельные компоненты через Консоль управления AWS, что дает свободу действий для каждого конкретного случая. В 2025 году мы планируем расширить платформу Amazon SageMaker за счет внедрения новых сервисов, чтобы унифицировать возможности аналитики и искусственного интеллекта. В числе этих сервисов есть решения для поисковой аналитики (Сервис Amazon OpenSearch), бизнес-аналитики (Amazon QuickSight) и потоковой передачи (целый портфель сервисов AWS).

Начать использовать Amazon SageMaker не трудно. Первым шагом станет переход к консоли управления Amazon SageMaker Unified Studio (ознакомительная версия), где нужно создать домен. Домен – это организационная структура, объединяющая активы, пользователей и их проекты для вашего отдела в организации. В консоли управления выберите пункт Create domain (Создать домен), и вам будет предложено два варианта: Quick setup (Быстрая настройка) и Manual setup (Ручная настройка). Выберите быструю настройку, чтобы начать работу с набором стандартных конфигураций, которые можно настроить позже. Альтернативный вариант – ручная настройка, которая дает полный контроль над параметрами при создании домена. После создания домена можно перейти в Amazon SageMaker Unified Studio (веб-приложение в браузере), где доступны все данные и инструменты для аналитики и искусственного интеллекта. Чтобы узнать больше о начале работы с решением, обратитесь к документации SageMaker.

Ваши имеющиеся наработки, добытые при работе с данными в таких сервисах AWS, как Amazon EMR, AWS Glue и Amazon Athena, остаются доступными. Это означает, что весь существующий код и созданные вами ресурсы можно по-прежнему без проблем использовать. В первом квартале 2025 года мы подготовим удобные сценарии обновления и подробные инструкции по переводу существующей базы кода на единый интерфейс SageMaker.

Мы развиваем Amazon SageMaker, который широко используется для машинного обучения, и превращаем его в платформу для работы с данными и искусственным интеллектом. Для этого мы интегрируем полный набор инструментов AWS для работы с данными, аналитикой и искусственным интеллектом, которые уже повсеместно используют клиенты. Кроме того, мы добавили ряд возможностей в новую платформу SageMaker, в том числе SageMaker Unified Studio (ознакомительная версия), SageMaker Lakehouse (GA) и SageMaker Catalog (GA).

Новая платформа SageMaker объединяет практически все компоненты, необходимые для SQL-аналитики с Amazon Redshift, обработки данных с Amazon EMR, разработки моделей искусственного интеллекта с SageMaker AI и приложений генеративного искусственного интеллекта с новой BedRock IDE (ознакомительная версия). Все эти элементы поставляются через интегрированный интерфейс разработки в унифицированной студии (ознакомительная версия).

Описание работы с продуктом

Структура проекта в SageMaker помогает пользователям организовать работу и предоставляет рабочий контекст для выполняемых ими заданий. Ассистент предоставляет пространство для совместной работы, где пользователи могут взаимодействовать с данными и артефактами, в том числе с моделями машинного обучения, блокнотами, запросами, информационными панелями и приложениями генеративного искусственного интеллекта. Проекты защищены таким образом, чтобы доступ к данным и инструментам в рамках проекта имели только его непосредственные участники. Проект создает роли Управления идентификацией и доступом AWS (IAM) на основе выбранных возможностей (например, озера данных), которые предоставляют пользователям необходимый доступ для выполнения поставленных задач. Проекты также обеспечивают возможность изоляции работы в одном аккаунте, а также границу безопасности (группу безопасности и роли IAM).

Amazon Q для разработчиков – это голосовой ассистент на базе генеративного искусственного интеллекта, который интегрирован в SageMaker. Он повышает вашу продуктивность на протяжении всего жизненного цикла разработки. Через интерфейс чата можно на естественном языке задавать вопросы о SageMaker, получать помощь в работе с кодом и исследовать ресурсы (например, наборы данных). При общении с Amazon Q для разработчиков используется контекст текущего разговора, чтобы ассистент давал индивидуальные рекомендации и автоматически помогал в процессе разработки в SageMaker. Amazon Q для разработчиков может помочь с вопросами по коду, предоставить встроенные дополнения к коду, сгенерировать SQL-запросы, найти и интегрировать наборы данных, а также предложить интеллектуальную помощь, отвечающую вашим конкретным потребностям в разработке.


Вникая в нюансы вашей работы, Amazon Q для разработчиков предоставляет адресную помощь, адаптированную под контекст, которая упрощает процесс разработки и повышает общую производительность в среде SageMaker.

SageMaker – это унифицированная веб-среда, объединяющая мощные инструменты для полноценной работы с данными и искусственным интеллектом. Встроенные IDE облегчают работу над искусственным интеллектом и машинным обучением, позволяя обрабатывать большие объемы данных из различных источников с помощью таких фреймворков и сервисов, как PySpark, AWS Glue и Amazon EMR.

Для контроля версий и управления рабочими процессами можно выполнять фиксацию в Git и определять рабочие процессы с помощью Amazon MWAA. Интегрированный редактор SQL-запросов позволяет изучать, анализировать и визуализировать данные, легче сохранять и передавать запросы, а также создавать новые наборы данных.

Разработка моделей упрощается с помощью привычных инструментов искусственного интеллекта SageMaker (например, блокнотов Amazon SageMaker, JumpStart, HyperPod, MLFlow, Pipelines и Model Registry). В ходе этих процессов Amazon Q для разработчиков легко интегрируется с инструментами SageMaker, обеспечивая интеллектуальную поддержку при поиске и подготовке данных, создании конвейеров, построении и обучении моделей, а также развертывании кода.

IDE Bedrock (ознакомительная версия), интегрированная в SageMaker Unified Studio (ознакомительная версия), является комплексной средой для разработки приложений генеративного искусственного интеллекта. Этот удобный интерфейс поможет ускорить разработку приложений в надежной и безопасной среде, открывая доступ к высокопроизводительным базовым моделям и расширенным возможностям настройки Amazon Bedrock.

Вы можете использовать такие полезные функции, как Amazon Bedrock Knowledge Bases, Guardrails, Agents и Prompt Flows, что позволит вашей команде быстро адаптировать приложения генеративного искусственного интеллекта под конкретные потребности бизнеса, соблюдая при этом правила ответственного использования ИИ. Платформа поддерживает управляемый доступ и позволяет безопасно осуществлять межфункциональное взаимодействие за счет обмена данными с контролем доступа и возможности аудита с помощью git.

Amazon SageMaker Lakehouse позволяет объединять данные в озерах данных AWS, хранилищах данных, сторонних приложениях и операционных базах данных. Это решение обеспечивает быстрый и оптимизированный доступ к данным в одной точке за счет интеграции с нулевым использованием ETL, федеративных источников запросов и более чем 240 коннекторов.

Amazon SageMaker осуществляет комплексное встроенное управление за счет унифицированной системы управления данными в Amazon SageMaker Catalog, построенной на базе Amazon DataZone. Такой подход позволяет осуществлять каталогизацию, обнаружение, управление структурированными и неструктурированными данными, моделями машинного обучения и приложениями в масштабах всей организации. Кроме того, решение подходит для организации доступа к указанным компонентам. Платформа гарантирует, что указанные сотрудники получат соответствующий уровень доступа к нужным активам, что позволяет соблюдать жесткие стандарты безопасности и соответствия нормативным требованиям.

В Amazon SageMaker можно создавать конвейеры данных и управлять ими разными способами. Обработка данных Amazon SageMaker объединяет Amazon EMR, Amazon Athena, AWS Glue и Amazon MWAA, чтобы вы могли интегрировать, подготавливать и изучать данные в едином пространстве. С помощью SageMaker AI можно создавать конвейеры для оркестрации моделей, ориентированных на машинное обучение, а с помощью Amazon MWAA – конвейеры данных и рабочие процессы. Также можно использовать интеграции с нулевым использованием ETL, которые упрощают движение данных, удаляя сложные операции извлечения, преобразования и загрузки (ETL), обеспечивая при этом прямую репликацию данных между сервисами. Посетите раздел о нулевом использовании ETL, чтобы узнать больше.

Цены

При использовании Amazon SageMaker с вас будет взиматься плата в соответствии с моделью ценообразования для различных сервисов AWS, доступных через Amazon SageMaker. За использование Amazon SageMaker Unified Studio (ознакомительная версия), среды разработки данных и искусственного интеллекта, которая позволяет получить интегрированный интерфейс в Amazon SageMaker, отдельная плата не взимается. Чтобы получить дополнительную информацию, посетите страницу Amazon SageMaker с ценами на решение.

Уровень бесплатного пользования SageMaker позволяет быстро начать внедрять инновации с помощью данных и искусственного интеллекта без каких-либо затрат. Подробности см. в разделе цен на SageMaker.

Доступность

Следующее поколение сервиса Amazon SageMaker доступно в таких регионах AWS: Восток США (Северная Вирджиния, Огайо), Запад США (Орегон), Азиатско-Тихоокеанский регион (Токио) и Европа (Ирландия). Amazon SageMaker Unified Studio и Amazon Bedrock IDE доступны в ознакомительной версии в этих регионах AWS. Чтобы узнать о будущих обновлениях, ознакомьтесь со списком региональных сервисов AWS.

Да. Решение SageMaker создано для стабильной производительности и времени непрерывной работы, что необходимо для критически важных рабочих нагрузок, связанных с аналитикой и искусственным интеллектом. Поскольку унифицированная платформа состоит из множества сервисных компонентов, доступность сервиса привязана к используемому сервисному компоненту.

Чтобы ознакомится с подробной информацией о соглашениях об уровне обслуживания (SLA) для каждого отдельного сервиса, обратитесь к соответствующей документации по SLA. В SLA содержатся конкретные гарантии времени непрерывной работы и надежности различных сервисов, входящих в интерфейс SageMaker.

Доступная документация по SLA: