DP-100日本語 無料問題集「Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版)」
注: この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、記載された目標を達成する可能性のある独自の解決策が含まれています。一部の質問セットには複数の正解がある場合もあれば、正解がない場合もあります。
このセクションの質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Azure Machine Learning を使用して、分類モデルをトレーニングする実験を実行しています。
Hyperdrive を使用して、モデルの AUC メトリックを最適化するパラメーターを見つけたいと考えています。次のコードを実行して、実験用に HyperDriveConfig を構成します。

この構成を使用して、ランダム フォレスト モデルをトレーニングし、それを検証データでテストするスクリプトを実行する予定です。検証データのラベル値は y_test 変数という名前の変数に保存され、モデルからの予測確率は y_predicted という名前の変数に保存されます。
Hyperdrive が AUC メトリックのハイパーパラメータを最適化できるようにするには、スクリプトにログを追加する必要があります。解決策: 次のコードを実行します。

ソリューションは目標を達成していますか?
このセクションの質問に答えた後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Azure Machine Learning を使用して、分類モデルをトレーニングする実験を実行しています。
Hyperdrive を使用して、モデルの AUC メトリックを最適化するパラメーターを見つけたいと考えています。次のコードを実行して、実験用に HyperDriveConfig を構成します。

この構成を使用して、ランダム フォレスト モデルをトレーニングし、それを検証データでテストするスクリプトを実行する予定です。検証データのラベル値は y_test 変数という名前の変数に保存され、モデルからの予測確率は y_predicted という名前の変数に保存されます。
Hyperdrive が AUC メトリックのハイパーパラメータを最適化できるようにするには、スクリプトにログを追加する必要があります。解決策: 次のコードを実行します。

ソリューションは目標を達成していますか?
正解:A
解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
自動機械学習を使用して、分類モデルと回帰モデルをトレーニングします。
自動化された機械学習の実験結果を評価する必要があります。結果には、分類モデルがその予測でどのように系統的誤差を起こしているか、およびターゲット フィーチャと回帰モデルの予測の間の関係が含まれます。自動機械学習によって生成されたチャートを使用する必要があります。
モデル タイプごとにグラフのタイプを選択する必要があります。
どの種類のグラフを使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注: 正しく選択するたびに 1 ポイントの価値があります。

自動化された機械学習の実験結果を評価する必要があります。結果には、分類モデルがその予測でどのように系統的誤差を起こしているか、およびターゲット フィーチャと回帰モデルの予測の間の関係が含まれます。自動機械学習によって生成されたチャートを使用する必要があります。
モデル タイプごとにグラフのタイプを選択する必要があります。
どの種類のグラフを使用する必要がありますか? 回答するには、回答領域で適切なオプションを選択してください。
注: 正しく選択するたびに 1 ポイントの価値があります。

正解:

Explanation:
1. Confusion Matrix
2. Prediction vs True
The calibration curve plots a model's confidence in its predictions against the proportion of positive samples at each confidence level (https://learn.microsoft.com/en-us/azure/machine-learning/how-to-understand- automated-ml?view=azureml-api-2#calibration-curve) The predicted vs. true chart plots the relationship between the target feature (true/actual values) and the model's predictions (https://learn.microsoft.com/en-us/azure/machine-learning/how-to-understand-automated- ml?view=azureml-api-2#predicted-vs-true)
Azure Machine Learning を使用して、Bandit の早期終了ポリシーでハイパーパラメーターの調整を実装します。
このポリシーでは、slack_factor を 01 に設定し、評価間隔を 1 に設定し、評価遅延を b に設定します。
早期終了ポリシーの結果を評価する必要があります
あなたは何を評価すべきですか?回答するには、回答エリアで適切なオプションを選択します。
注: それぞれの正しい選択は 1 ポイントの価値があります。

このポリシーでは、slack_factor を 01 に設定し、評価間隔を 1 に設定し、評価遅延を b に設定します。
早期終了ポリシーの結果を評価する必要があります
あなたは何を評価すべきですか?回答するには、回答エリアで適切なオプションを選択します。
注: それぞれの正しい選択は 1 ポイントの価値があります。

正解:

Explanation:

Azure Machine Learning Studioで分類タスクを実行しています。
提供されたデータセットに基づいて、バランスの取れたテストおよびトレーニングサンプルを準備する必要があります。
0.75:0.25の比率でデータを分割する必要があります。
各パラメーターにどの値を使用する必要がありますか? 回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

提供されたデータセットに基づいて、バランスの取れたテストおよびトレーニングサンプルを準備する必要があります。
0.75:0.25の比率でデータを分割する必要があります。
各パラメーターにどの値を使用する必要がありますか? 回答するには、回答エリアで適切なオプションを選択します。
注:それぞれの正しい選択には1ポイントの価値があります。

正解:

Explanation:

Box 1: Split rows
Use the Split Rows option if you just want to divide the data into two parts. You can specify the percentage of data to put in each split, but by default, the data is divided 50-50.
You can also randomize the selection of rows in each group, and use stratified sampling. In stratified sampling, you must select a single column of data for which you want values to be apportioned equally among the two result datasets.
Box 2: 0.75
If you specify a number as a percentage, or if you use a string that contains the "%" character, the value is interpreted as a percentage. All percentage values must be within the range (0, 100), not including the values
0 and 100.
Box 3: Yes
To ensure splits are balanced.
Box 4: No
If you use the option for a stratified split, the output datasets can be further divided by subgroups, by selecting a strata column.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/split-data
ハイパードライブを使用して、モデルのトレーニング時に選択されたハイパーパラメーターを最適化する予定です。次のコードを作成して、ハイパーパラメータ実験のオプションを定義します


次の各ステートメントについて、ステートメントがtrueの場合は[はい]を選択します。それ以外の場合は、[いいえ]を選択します。注:正しい選択はそれぞれ1ポイントの価値があります。



次の各ステートメントについて、ステートメントがtrueの場合は[はい]を選択します。それ以外の場合は、[いいえ]を選択します。注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

Explanation:

Box 1: No
max_total_runs (50 here)
The maximum total number of runs to create. This is the upper bound; there may be fewer runs when the sample space is smaller than this value.
Box 2: Yes
Policy EarlyTerminationPolicy
The early termination policy to use. If None - the default, no early termination policy will be used.
Box 3: No
Discrete hyperparameters are specified as a choice among discrete values. choice can be:
one or more comma-separated values
a range object
any arbitrary list object
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-train-core/azureml.train.hyperdrive.hyperdriveconfig
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-tune-hyperparameters
組織はAzure Machine Learningサービスを使用しており、機械学習の使用を拡大したいと考えています。
次のコンピューティング環境があります。組織は別のコンピューティング環境を作成したくありません。

次のシナリオで使用するコンピューティング環境を決定する必要があります。
どの計算タイプを使用する必要がありますか?答えるには、適切なコンピューティング環境を正しいシナリオにドラッグします。各コンピューティング環境は、1回、複数回、またはまったく使用しない場合があります。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。
注:それぞれの正しい選択は1ポイントの価値があります。

次のコンピューティング環境があります。組織は別のコンピューティング環境を作成したくありません。

次のシナリオで使用するコンピューティング環境を決定する必要があります。
どの計算タイプを使用する必要がありますか?答えるには、適切なコンピューティング環境を正しいシナリオにドラッグします。各コンピューティング環境は、1回、複数回、またはまったく使用しない場合があります。コンテンツを表示するには、ペイン間で分割バーをドラッグするか、スクロールする必要がある場合があります。
注:それぞれの正しい選択は1ポイントの価値があります。

正解:

Explanation:

Box 1: nb_server

Box 2: mlc_cluster
With Azure Machine Learning, you can train your model on a variety of resources or environments, collectively referred to as compute targets. A compute target can be a local machine or a cloud resource, such as an Azure Machine Learning Compute, Azure HDInsight or a remote virtual machine.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/concept-compute-target
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-set-up-training-targets
workspace1 という名前の Azure Machine Learning ワークスペースと、DSMV1 という名前のデータ サイエンス仮想マシン (DSVM) を管理します。
Jupiter ノートブックと Python SDK v2 コードを使用して、DSMV1 で実験を行う必要があります。メトリクスとアーティファクトはワークスペース 1 に保存する必要があります。 まず、必要なすべてのパッケージをインポートするための Python SCK v2 コードを作成します。
workspace1 にメトリクスと記事を保存するには、Python SOK v2 コードを実装する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクションのリストから適切なアクションを回答領域に移動し、正しい順序で配置します。

Jupiter ノートブックと Python SDK v2 コードを使用して、DSMV1 で実験を行う必要があります。メトリクスとアーティファクトはワークスペース 1 に保存する必要があります。 まず、必要なすべてのパッケージをインポートするための Python SCK v2 コードを作成します。
workspace1 にメトリクスと記事を保存するには、Python SOK v2 コードを実装する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクションのリストから適切なアクションを回答領域に移動し、正しい順序で配置します。

正解:

Explanation:

モデルトレーニング要件に適した早期停止基準を実装する必要があります。
ソリューションの開発に使用する必要がある3つのコードセグメントはどれですか?回答するには、適切なコードセグメントをコードセグメントのリストから回答領域に移動し、正しい順序で並べます。
注:回答の選択肢の複数の順序が正しいです。選択した正しい注文のいずれかのクレジットを受け取ります。

ソリューションの開発に使用する必要がある3つのコードセグメントはどれですか?回答するには、適切なコードセグメントをコードセグメントのリストから回答領域に移動し、正しい順序で並べます。
注:回答の選択肢の複数の順序が正しいです。選択した正しい注文のいずれかのクレジットを受け取ります。

正解:

Explanation:

You need to implement an early stopping criterion on models that provides savings without terminating promising jobs.
Truncation selection cancels a given percentage of lowest performing runs at each evaluation interval. Runs are compared based on their performance on the primary metric and the lowest X% are terminated.
Example:
from azureml.train.hyperdrive import TruncationSelectionPolicy
early_termination_policy = TruncationSelectionPolicy(evaluation_interval=1, truncation_percentage=20, delay_evaluation=5)
Azure Machine Learningを使用して、モデルをトレーニングおよび登録します。
IT部門がAzureMachine Learningワークスペースで作成したservice-computeという名前の推論クラスターに、リアルタイムWebサービスとしてモデルを本番環境にデプロイする必要があります。
デプロイされたWebサービスを使用するクライアントアプリケーションは、Azure ActiveDirectoryサービスプリンシパルに基づいて認証される必要があります。
Azure Machine LearningSDKを使用してモデルをデプロイするスクリプトを作成する必要があります。必要なモジュールがインポートされました。
コードをどのように完成させる必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

IT部門がAzureMachine Learningワークスペースで作成したservice-computeという名前の推論クラスターに、リアルタイムWebサービスとしてモデルを本番環境にデプロイする必要があります。
デプロイされたWebサービスを使用するクライアントアプリケーションは、Azure ActiveDirectoryサービスプリンシパルに基づいて認証される必要があります。
Azure Machine LearningSDKを使用してモデルをデプロイするスクリプトを作成する必要があります。必要なモジュールがインポートされました。
コードをどのように完成させる必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。

正解:

Explanation:

Box 1: AksCompute
Example:
aks_target = AksCompute(ws,"myaks")
# If deploying to a cluster configured for dev/test, ensure that it was created with enough
# cores and memory to handle this deployment configuration. Note that memory is also used by
# things such as dependencies and AML components.
deployment_config = AksWebservice.deploy_configuration(cpu_cores = 1, memory_gb = 1) service = Model.deploy(ws, "myservice", [model], inference_config, deployment_config, aks_target) Box 2: AksWebservice Box 3: token_auth_enabled=Yes Whether or not token auth is enabled for the Webservice.
Note: A Service principal defined in Azure Active Directory (Azure AD) can act as a principal on which authentication and authorization policies can be enforced in Azure Databricks.
The Azure Active Directory Authentication Library (ADAL) can be used to programmatically get an Azure AD access token for a user.
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-deploy-azure-kubernetes-service
https://docs.microsoft.com/en-us/azure/databricks/dev-tools/api/latest/aad/service-prin-aad-token
Azure Machine Learning ワークスペースがあります。ローカル コンピューターで実験を実行しています。
MLflow 追跡を使用して、ローカル実験の実行からのメトリックとアーティファクトをワークスペースに保存する必要があります。
どの順序でアクションを実行する必要がありますか? 答えるには、アクションのリストからすべてのアクションを解答領域に移動し、正しい順序で並べます。

MLflow 追跡を使用して、ローカル実験の実行からのメトリックとアーティファクトをワークスペースに保存する必要があります。
どの順序でアクションを実行する必要がありますか? 答えるには、アクションのリストからすべてのアクションを解答領域に移動し、正しい順序で並べます。

正解:

Explanation:
