DP-100日本語 無料問題集「Microsoft Designing and Implementing a Data Science Solution on Azure (DP-100日本語版)」

Azure Machine Learning Designerを使用して、リアルタイムサービスエンドポイントを作成します。 Azure Machine Learning serviceコンピューティングリソースが1つあります。モデルをトレーニングし、デプロイメント用のリアルタイムパイプラインを準備します。推論パイプラインをWebサービスとして公開する必要があります。どの計算タイプを使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
注:この質問は、同じシナリオを提示する一連の質問の一部です。シリーズの各質問には、指定された目標を満たす可能性のある独自のソリューションが含まれています。一部の質問セットには複数の正しい解決策がある場合がありますが、他の質問セットには正しい解決策がない場合があります。
このセクションの質問に回答した後は、その質問に戻ることはできません。その結果、これらの質問はレビュー画面に表示されません。
Azure Machine Learningサービスのデータストアをワークスペースに作成します。データストアには次のファイルが含まれています。
* /data/2018/Q1.csv
* /data/2018/Q2.csv
* /data/2018/Q3.csv
* /data/2018/Q4.csv
* /data/2019/Q1.csv
すべてのファイルは、次の形式でデータを保存します。
id、f1、f2i
1,1.2,0
2,1,1、
1 3,2.1,0
次のコードを実行します。

次のコードを使用して、training_dataという名前のデータセットを作成し、すべてのファイルから単一のデータフレームにデータを読み込む必要があります。

解決策:次のコードを実行します。

ソリューションは目標を達成していますか?

解説: (JPNTest メンバーにのみ表示されます)
Azure MachineLearningワークスペースを作成します。
DataDriftDetectorクラスを使用して、ベースラインデータセットと後続のターゲットデータセット間のデータドリフトを検出する必要があります。
コードセグメントをどのように完成させる必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:

Explanation:

Box 1: create_from_datasets
The create_from_datasets method creates a new DataDriftDetector object from a baseline tabular dataset and a target time series dataset.
Box 2: backfill
The backfill method runs a backfill job over a given specified start and end date.
Syntax: backfill(start_date, end_date, compute_target=None, create_compute_target=False) Reference:
https://docs.microsoft.com/en-us/python/api/azureml-datadrift/azureml.datadrift.datadriftdetector(class)
Azure Machine Learning Designer を使用して、次のデータセットを実験に読み込みます。
データセット1

データセット2

Azure Machine Learning Designer を使用して、次のデータセットを実験に読み込みます。
入力データセットと同じ列とヘッダー行を持ち、両方の入力データセットのすべての行を含むデータセットを作成する必要があります。
解決策: Join Data コンポーネントを使用します。
ソリューションは目標を満たしていますか?

Azure MachineLearningワークスペースでモデルを作成して登録します。
Azure Machine Learning SDKを使用して、ParallelRunStepを使用してモデルを使用して入力データをスコアリングするバッチ推論パイプラインを実装する必要があります。パイプラインステップのParallelRunConfigcompute_target設定の値を指定する必要があります。
計算ターゲットを作成する必要があります。
どのクラスを使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
ワークスペース 1 という名前の Azure Machine Learning ワークスペースを、computet という名前のコンピューティング インスタンスを使用して管理します。
kernel 1 という名前のカーネルを computet1 から削除する必要があります。ワークスペース 1 から noa ターミナル ウィンドウを使用して、コンピューティング 1 に接続します。
カーネル 1 を削除するには、ターミナル ウィンドウにコマンドを入力する必要があります。
どのコマンドを使用すればよいでしょうか? 回答するには、回答領域で適切なオプションを選択してください。
注: 正しく選択するたびに 1 ポイントの価値があります。
正解:

Explanation:
workspace1 という名前の Azure Machine learning ワークスペースを管理します。
workspace1 にコンピューティング インスタンスを追加するには、Python SDK v2 コードを開発する必要があります。コードは、必要なすべてのモジュールをインポートし、Compute インスタンス クラスのコンストラクターを呼び出す必要があります。
インスタンス化されたコンピューティング インスタンスをワークスペース 1 に追加する必要があります。
何を使えばいいのでしょうか?

Azure Machine Learning StudioからWeka環境に大きなデータセットを移動しています。
Weka環境用にデータをフォーマットする必要があります。
どのモジュールを使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
Azure Machine Learningワークスペースでモデルをトレーニングおよび登録します。
クライアントアプリケーションがバッチ推論のモデルを使用できるようにするパイプラインを公開する必要があります。入力データから予測を取得するには、Python推論スクリプトを実行する単一のParallelRunStepステップでパイプラインを使用する必要があります。
ParallelRunStepパイプラインステップの推論スクリプトを作成する必要があります。
どの2つの関数を含める必要がありますか?それぞれの正解がソリューションの一部を示しています。
注:それぞれの正しい選択は1ポイントの価値があります。

正解:A、B 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
Azure MachineLearningのリモートコンピューティングでトレーニング実験を実行しています。
実験は、mlflowおよびazureml-contrib-runパッケージを含むconda環境を使用するように構成されています。
実験で生成されたメトリックを追跡するためのロギングパッケージとしてMLflowを使用する必要があります。
実験用のスクリプトを完了する必要があります。
コードをどのように完成させる必要がありますか?回答するには、回答領域で適切なオプションを選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:

Explanation:

Box 1: import mlflow
Import the mlflow and Workspace classes to access MLflow's tracking URI and configure your workspace.
Box 2: mlflow.start_run()
Set the MLflow experiment name with set_experiment() and start your training run with start_run().
Box 3: mlflow.log_metric(' ..')
Use log_metric() to activate the MLflow logging API and begin logging your training run metrics.
Box 4: mlflow.end_run()
Close the run:
run.endRun()
Reference:
https://docs.microsoft.com/en-us/azure/machine-learning/how-to-use-mlflow
機械学習モデルをトレーニングして登録します。モデルを使用して複数のデータファイルから予測を生成するバッチ推論パイプラインを作成します。
バッチ推論パイプラインを、毎晩実行するようにスケジュールできるサービスとして公開する必要があります。
推論サービスに適切な計算ターゲットを選択する必要があります。
どの計算ターゲットを使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
Azure Machine Learning スタジオを使用して、column1 という名前の 10 進数列を含む mltable データ資産を分析します。column1 の値が正規分布していることを確認する必要があります。
どの統計を使用する必要がありますか?

バイナリ分類モデルを作成します。
モデルのパフォーマンスを評価する必要があります。
どの 2 つのメトリックを使用できますか? それぞれの正解は完全なソリューションを示します。
注意: 正しい選択ごとに 1 ポイントが付与されます。

正解:A、C 解答を投票する
Azure Machine Learning ワークスペースを管理するとします。model1 という名前のモデルをトレーニングします。
異なるモデルの予測結果に対して変更する特徴を特定する必要があります。
Model1 の Responsible Al (RAI) ダッシュボードを構成する必要があります。
どの 3 つのアクションを順番に実行する必要がありますか? 回答するには、アクションのリストから適切なアクションを回答領域に移動し、正しい順序で並べます。
正解:

Explanation:
群衆感情モデルの評価戦略を定義する必要があります。
順番に実行する必要がある3つのアクションはどれですか?回答するには、適切なアクションをアクションのリストから回答エリアに移動し、正しい順序に並べます。
正解:

Explanation:

Scenario:
Experiments for local crowd sentiment models must combine local penalty detection data.
Crowd sentiment models must identify known sounds such as cheers and known catch phrases. Individual crowd sentiment models will detect similar sounds.
Note: Evaluate the changed in correlation between model error rate and centroid distance In machine learning, a nearest centroid classifier or nearest prototype classifier is a classification model that assigns to observations the label of the class of training samples whose mean (centroid) is closest to the observation.
References:
https://en.wikipedia.org/wiki/Nearest_centroid_classifier
https://docs.microsoft.com/en-us/azure/machine-learning/studio-module-reference/sweep-clustering
データセットに対してフィーチャエンジニアリングを実行しています。
CityNameという名前の機能を追加し、列の値にテキストLondonを入力する必要があります。
データセットに新しい機能を追加する必要があります。
どのAzure Machine Learning Studioモジュールを使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
あなたはAzureMachineLearningワークスペースの所有者です。
カスタムロールを使用して、コンピューティングリソースの作成または削除を防止する必要があります。ワークスペース内の他のすべての操作を許可する必要があります。
カスタムロールを構成する必要があります。
どのように構成を完了する必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:

Explanation:


Box 1: Microsoft.MachineLearningServices/workspaces/*/read
Reader role: Read-only actions in the workspace. Readers can list and view assets, including datastore credentials, in a workspace. Readers can't create or update these assets.
Box 2: Microsoft.MachineLearningServices/workspaces/*/write
If the roles include Actions that have a wildcard (*), the effective permissions are computed by subtracting the NotActions from the allowed Actions.
Box 3: Box 2: Microsoft.MachineLearningServices/workspaces/computes/*/delete Box 4: Microsoft.MachineLearningServices/workspaces/computes/*/write Reference:
https://docs.microsoft.com/en-us/azure/role-based-access-control/overview#how-azure-rbac-determines-if-a- user-has-access-to-a-resource
Azure Machine Learning モデルをトレーニングして登録します
モデルをオンライン エンドポイントにデプロイする予定です
アプリケーションが無期限のアーティファクトで認証方法を使用してモデルにアクセスできることを確認する必要があります。
解決:
マネージド オンライン エンドポイントを作成し、その auth.mode パラメーターの値を aml.token に設定します。モデルをオンライン エンドポイントにデプロイします。
ソリューションは目標を満たしていますか?

Azure Machine Learning SDK を使用して、分類モデルをトレーニングし、その精度メトリックを計算するトレーニング実験を実行します。
新しいデータが利用可能になると、モデルは毎月再トレーニングされます。
バッチ推論パイプラインで使用するには、モデルを登録する必要があります。
モデルを登録し、その後の再トレーニング実験で作成されたモデルが、現在登録されているモデルよりも精度が高い場合にのみ登録されるようにする必要があります。
この目標を達成するには、どのような 2 つの方法がありますか? それぞれの正解は完全な解決策を示しています。
注意: 正しい選択ごとに 1 ポイントが付与されます。

正解:A、D 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
train.pyという名前のPythonスクリプトを作成し、scriptsという名前のフォルダーに保存します。このスクリプトは、scikit-learnフレームワークを使用して、機械学習モデルをトレーニングします。
スクリプトは、ローカルワークステーションでAzure MachineLearningの実験として実行する必要があります。
train.pyスクリプトを実行する実験を開始するには、Pythonコードを作成する必要があります。
コードセグメントをどのように完成させる必要がありますか?回答するには、回答エリアで適切なオプションを選択してください。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:

Explanation:

Box 1: source_directory
source_directory: A local directory containing code files needed for a run.
Box 2: script
Script: The file path relative to the source_directory of the script to be run.
Box 3: environment
Reference:
https://docs.microsoft.com/en-us/python/api/azureml-core/azureml.core.scriptrunconfig

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡