DP-203日本語 無料問題集「Microsoft Data Engineering on Microsoft Azure (DP-203日本語版)」

Azure Synapse Analytics 専用の SQL プールで販売トランザクション テーブルを設計しています。テーブルには 1 か月あたり約 6,000 万行が含まれ、月ごとに分割されます。テーブルは、クラスター化列ストア インデックスとラウンド ロビン分散を使用します。
分散とパーティションの組み合わせごとにおよそ何行ありますか?

解説: (JPNTest メンバーにのみ表示されます)
Pool1 という名前の Azure Synapse Analytics 専用 SQL プールを含む Azure サブスクリプションがあります。
次の表に示すクエリがあります。

Pool1 の結果セット キャッシュを有効にするかどうかを評価しています。結果セット キャッシュを有効にすると、どのクエリ結果がキャッシュされますか?

Azure Data Lake Storage Gen2 アカウントのファイルのフォルダー構造を設計しています。このアカウントには、3 年分のデータを含むコンテナーが 1 つあります。
次の要件を満たすフォルダー構造を推奨する必要があります。
* Azure Synapse Analytics サーバーレス SQL pooh によるクエリのパーティション削除をサポート
* 当月のデータの高速データ取得をサポート
* 部門ごとのデータ セキュリティ管理を簡素化
どのフォルダ構造をお勧めしますか?

解説: (JPNTest メンバーにのみ表示されます)
CSVファイルからデータを取り込み、指定されたタイプのデータに列をキャストし、AzureSynapseAnalytics専用のSQLプールのテーブルにデータを挿入するAzureDataFactoryデータフローを作成しています。CSVファイルには、username、comment、dateという名前の列が含まれています。
データフローには、すでに次のものが含まれています。
*ソース変換
*適切なタイプのデータを設定するための派生列変換
*データをプールに配置するためのシンク変換
データフローが次の要件を満たしていることを確認する必要があります。
*すべての有効な行を宛先テーブルに書き込む必要があります。
*コメント列の切り捨てエラーは事前に回避する必要があります。
*挿入時に切り捨てエラーが発生するコメント値を含む行は、BLOBストレージ内のファイルに書き込む必要があります。
実行する必要がある2つのアクションはどれですか?それぞれの正解は、解決策の一部を示しています。注:正しい選択はそれぞれ1ポイントの価値があります

正解:A、D 解答を投票する
workspace1 という名前の Azure Synapse Analytics ワークスペースを含む Azure サブスクリプションがあります。Workspace1 は、repo1 という名前の Azure DevOps リポジトリに接続します。Repo1 には、main という名前のコラボレーション ブランチと、branch1 という名前の開発ブランチが含まれています。Branch1 には、pipeline1 という名前の Azure Synapse パイプラインが含まれています。
ワークスペース 1 で、パイプライン 1 のテストを完了します。
パイプライン 1 を毎日午前 6 時に実行するようにスケジュールする必要があります。
順番に実行する必要がある 4 つのアクションはどれですか? 答えるには、アクションのリストから適切なアクションを回答エリアに移動し、正しい順序で並べます。
注: 回答の選択肢の順序が 1 つ以上正しいです。選択した正しい注文のいずれかに対してクレジットを受け取ります。
正解:

Explanation:
account1 という名前の Azure Data Lake Storage Gen2 アカウントがあり、このアカウントには Container"1 という名前のコンテナーが含まれています。Container1 には、FolderA と FolderB という名前の 2 つのフォルダーが含まれています。
次の要件を満たすようにアクセス制御リスト (ACL) を構成する必要があります。
* Group1 は FolderA の内容とサブフォルダーを一覧表示して読み取ることができる必要があります。
* Group2 は FolderA と FolderB の内容を一覧表示して読み取ることができる必要があります。
* Group2 は Container1 のルートにある他のフォルダーを読み取れないようにする必要があります。
各グループの ACL 権限をどのように構成すればよいでしょうか? 回答するには、回答領域で適切なオプションを選択してください。注: 正しい選択ごとに 1 ポイントが付与されます。
正解:

Explanation:
Azure IoT ハブからのデータを処理し、複雑な変換を実行する C# アプリケーションがあります。
アプリケーションをリアルタイム ソリューションに置き換える必要があります。ソリューションでは、既存のアプリケーションからできるだけ多くのコードを再利用する必要があります。

解説: (JPNTest メンバーにのみ表示されます)
Azure Synapse Analytics 専用の SQL プールがあります。
過去 3 年間の売上データを格納する Table1 という名前のファクト テーブルを作成する必要があります。ソリューションは、次のクエリ操作用に最適化する必要があります。
注文数を週ごとに表示します。
*地域ごとの売上合計を計算します。
*製品ごとの売上合計を計算します。
* 特定の月のすべての注文を検索します。
Table1 を分割するには、どのデータを使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
Azure Stream Analytics を使用して、Azure Event Hubs から Twitter データを受信し、そのデータを Azure Blob ストレージ アカウントに出力します。過去 5 分間のツイート数を 5 分ごとに出力する必要があります。各ツイートは 1 回だけカウントする必要があります。
どのウィンドウ関数を使用すればよいですか?

Azure Data Lake Storage Gen2 コンテナーがあります。
データはコンテナーに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることができますが、ファイルを変更することはできません。
次の要件を満たすデータ アーカイブ ソリューションを設計する必要があります。
新しいデータは頻繁にアクセスされ、できるだけ早く利用できるようにする必要があります。
5 年以上前のデータにアクセスする頻度は低くなりますが、要求されたときに 1 秒以内に利用できるようにする必要があります。
7 年以上前のデータにはアクセスしません。 7 年後、データは可能な限り低いコストで永続化する必要があります。
必要な可用性を維持しながら、コストを最小限に抑える必要があります。
データをどのように管理する必要がありますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。
正解:

Explanation:

Box 1: Move to cool storage
Box 2: Move to archive storage
Archive - Optimized for storing data that is rarely accessed and stored for at least 180 days with flexible latency requirements, on the order of hours.
The following table shows a comparison of premium performance block blob storage, and the hot, cool, and archive access tiers.

Reference:
https://docs.microsoft.com/en-us/azure/storage/blobs/storage-blob-storage-tiers Explanation:
Box 1: Replicated
Replicated tables are ideal for small star-schema dimension tables, because the fact table is often distributed on a column that is not compatible with the connected dimension tables. If this case applies to your schema, consider changing small dimension tables currently implemented as round-robin to replicated.
Box 2: Replicated
Box 3: Replicated
Box 4: Hash-distributed
For Fact tables use hash-distribution with clustered columnstore index. Performance improves when two hash tables are joined on the same distribution column.
Reference:
https://azure.microsoft.com/en-us/updates/reduce-data-movement-and-make-your-queries-more-efficient-with- the-general-availability-of-replicated-tables/
https://azure.microsoft.com/en-us/blog/replicated-tables-now-generally-available-in-azure-sql-data-warehouse/
次の表に示すユーザーを含むAzureSynapseAnalytics専用のSQLプールがあります。

User1はデータベースに対してクエリを実行し、クエリは次の図に示す結果を返します。

User1は、マスクされていないデータにアクセスできる唯一のユーザーです。
ドロップダウンメニューを使用して、図に示されている情報に基づいて各ステートメントを完了する回答の選択肢を選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:

Explanation:

Box 1: 0
The YearlyIncome column is of the money data type.
The Default masking function: Full masking according to the data types of the designated fields
* Use a zero value for numeric data types (bigint, bit, decimal, int, money, numeric, smallint, smallmoney, tinyint, float, real).
Box 2: the values stored in the database
Users with administrator privileges are always excluded from masking, and see the original data without any mask.
Reference:
https://docs.microsoft.com/en-us/azure/azure-sql/database/dynamic-data-masking-overview
Azureサブスクリプションがあります。
Azure Data Lake Storage Gen2Premiumアカウントをデプロイする必要があります。ソリューションは、次の要件を満たしている必要があります。
* 365日より古いブロブは削除する必要があります。
*管理者の労力を最小限に抑える必要があります。
*コストを最小限に抑える必要があります
何を使うべきですか?答えるには、答えの中から適切なオプションを選択してください。注正しい選択はそれぞれ1ポイントの価値があります。
正解:

Explanation:

https://learn.microsoft.com/en-us/azure/storage/blobs/premium-tier-for-data-lake-storage

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡