DP-203日本語 無料問題集「Microsoft Data Engineering on Microsoft Azure (DP-203日本語版)」
CSVファイルからデータを取り込み、指定されたタイプのデータに列をキャストし、AzureSynapseAnalytics専用のSQLプールのテーブルにデータを挿入するAzureDataFactoryデータフローを作成しています。CSVファイルには、username、comment、dateという名前の列が含まれています。
データフローには、すでに次のものが含まれています。
*ソース変換
*適切なタイプのデータを設定するための派生列変換
*データをプールに配置するためのシンク変換
データフローが次の要件を満たしていることを確認する必要があります。
*すべての有効な行を宛先テーブルに書き込む必要があります。
*コメント列の切り捨てエラーは事前に回避する必要があります。
*挿入時に切り捨てエラーが発生するコメント値を含む行は、BLOBストレージ内のファイルに書き込む必要があります。
実行する必要がある2つのアクションはどれですか?それぞれの正解は、解決策の一部を示しています。注:正しい選択はそれぞれ1ポイントの価値があります
データフローには、すでに次のものが含まれています。
*ソース変換
*適切なタイプのデータを設定するための派生列変換
*データをプールに配置するためのシンク変換
データフローが次の要件を満たしていることを確認する必要があります。
*すべての有効な行を宛先テーブルに書き込む必要があります。
*コメント列の切り捨てエラーは事前に回避する必要があります。
*挿入時に切り捨てエラーが発生するコメント値を含む行は、BLOBストレージ内のファイルに書き込む必要があります。
実行する必要がある2つのアクションはどれですか?それぞれの正解は、解決策の一部を示しています。注:正しい選択はそれぞれ1ポイントの価値があります
正解:A、D
解答を投票する
workspace1 という名前の Azure Synapse Analytics ワークスペースを含む Azure サブスクリプションがあります。Workspace1 は、repo1 という名前の Azure DevOps リポジトリに接続します。Repo1 には、main という名前のコラボレーション ブランチと、branch1 という名前の開発ブランチが含まれています。Branch1 には、pipeline1 という名前の Azure Synapse パイプラインが含まれています。
ワークスペース 1 で、パイプライン 1 のテストを完了します。
パイプライン 1 を毎日午前 6 時に実行するようにスケジュールする必要があります。
順番に実行する必要がある 4 つのアクションはどれですか? 答えるには、アクションのリストから適切なアクションを回答エリアに移動し、正しい順序で並べます。
注: 回答の選択肢の順序が 1 つ以上正しいです。選択した正しい注文のいずれかに対してクレジットを受け取ります。
ワークスペース 1 で、パイプライン 1 のテストを完了します。
パイプライン 1 を毎日午前 6 時に実行するようにスケジュールする必要があります。
順番に実行する必要がある 4 つのアクションはどれですか? 答えるには、アクションのリストから適切なアクションを回答エリアに移動し、正しい順序で並べます。
注: 回答の選択肢の順序が 1 つ以上正しいです。選択した正しい注文のいずれかに対してクレジットを受け取ります。
正解:
Explanation:
account1 という名前の Azure Data Lake Storage Gen2 アカウントがあり、このアカウントには Container"1 という名前のコンテナーが含まれています。Container1 には、FolderA と FolderB という名前の 2 つのフォルダーが含まれています。
次の要件を満たすようにアクセス制御リスト (ACL) を構成する必要があります。
* Group1 は FolderA の内容とサブフォルダーを一覧表示して読み取ることができる必要があります。
* Group2 は FolderA と FolderB の内容を一覧表示して読み取ることができる必要があります。
* Group2 は Container1 のルートにある他のフォルダーを読み取れないようにする必要があります。
各グループの ACL 権限をどのように構成すればよいでしょうか? 回答するには、回答領域で適切なオプションを選択してください。注: 正しい選択ごとに 1 ポイントが付与されます。
次の要件を満たすようにアクセス制御リスト (ACL) を構成する必要があります。
* Group1 は FolderA の内容とサブフォルダーを一覧表示して読み取ることができる必要があります。
* Group2 は FolderA と FolderB の内容を一覧表示して読み取ることができる必要があります。
* Group2 は Container1 のルートにある他のフォルダーを読み取れないようにする必要があります。
各グループの ACL 権限をどのように構成すればよいでしょうか? 回答するには、回答領域で適切なオプションを選択してください。注: 正しい選択ごとに 1 ポイントが付与されます。
正解:
Explanation:
Azure Data Lake Storage Gen2 コンテナーがあります。
データはコンテナーに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることができますが、ファイルを変更することはできません。
次の要件を満たすデータ アーカイブ ソリューションを設計する必要があります。
新しいデータは頻繁にアクセスされ、できるだけ早く利用できるようにする必要があります。
5 年以上前のデータにアクセスする頻度は低くなりますが、要求されたときに 1 秒以内に利用できるようにする必要があります。
7 年以上前のデータにはアクセスしません。 7 年後、データは可能な限り低いコストで永続化する必要があります。
必要な可用性を維持しながら、コストを最小限に抑える必要があります。
データをどのように管理する必要がありますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。
データはコンテナーに取り込まれ、データ統合アプリケーションによって変換されます。その後、データは変更されません。ユーザーはコンテナー内のファイルを読み取ることができますが、ファイルを変更することはできません。
次の要件を満たすデータ アーカイブ ソリューションを設計する必要があります。
新しいデータは頻繁にアクセスされ、できるだけ早く利用できるようにする必要があります。
5 年以上前のデータにアクセスする頻度は低くなりますが、要求されたときに 1 秒以内に利用できるようにする必要があります。
7 年以上前のデータにはアクセスしません。 7 年後、データは可能な限り低いコストで永続化する必要があります。
必要な可用性を維持しながら、コストを最小限に抑える必要があります。
データをどのように管理する必要がありますか?答えるには、答えで適切なオプションを選択します。
注: 正しい選択ごとに 1 ポイントの価値があります。
正解:
Explanation:
Box 1: Move to cool storage
Box 2: Move to archive storage
Archive - Optimized for storing data that is rarely accessed and stored for at least 180 days with flexible latency requirements, on the order of hours.
The following table shows a comparison of premium performance block blob storage, and the hot, cool, and archive access tiers.
Reference:
https://docs.microsoft.com/en-us/azure/storage/blobs/storage-blob-storage-tiers Explanation:
Box 1: Replicated
Replicated tables are ideal for small star-schema dimension tables, because the fact table is often distributed on a column that is not compatible with the connected dimension tables. If this case applies to your schema, consider changing small dimension tables currently implemented as round-robin to replicated.
Box 2: Replicated
Box 3: Replicated
Box 4: Hash-distributed
For Fact tables use hash-distribution with clustered columnstore index. Performance improves when two hash tables are joined on the same distribution column.
Reference:
https://azure.microsoft.com/en-us/updates/reduce-data-movement-and-make-your-queries-more-efficient-with- the-general-availability-of-replicated-tables/
https://azure.microsoft.com/en-us/blog/replicated-tables-now-generally-available-in-azure-sql-data-warehouse/
次の表に示すユーザーを含むAzureSynapseAnalytics専用のSQLプールがあります。
User1はデータベースに対してクエリを実行し、クエリは次の図に示す結果を返します。
User1は、マスクされていないデータにアクセスできる唯一のユーザーです。
ドロップダウンメニューを使用して、図に示されている情報に基づいて各ステートメントを完了する回答の選択肢を選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。
User1はデータベースに対してクエリを実行し、クエリは次の図に示す結果を返します。
User1は、マスクされていないデータにアクセスできる唯一のユーザーです。
ドロップダウンメニューを使用して、図に示されている情報に基づいて各ステートメントを完了する回答の選択肢を選択します。
注:正しい選択はそれぞれ1ポイントの価値があります。
正解:
Explanation:
Box 1: 0
The YearlyIncome column is of the money data type.
The Default masking function: Full masking according to the data types of the designated fields
* Use a zero value for numeric data types (bigint, bit, decimal, int, money, numeric, smallint, smallmoney, tinyint, float, real).
Box 2: the values stored in the database
Users with administrator privileges are always excluded from masking, and see the original data without any mask.
Reference:
https://docs.microsoft.com/en-us/azure/azure-sql/database/dynamic-data-masking-overview
Azureサブスクリプションがあります。
Azure Data Lake Storage Gen2Premiumアカウントをデプロイする必要があります。ソリューションは、次の要件を満たしている必要があります。
* 365日より古いブロブは削除する必要があります。
*管理者の労力を最小限に抑える必要があります。
*コストを最小限に抑える必要があります
何を使うべきですか?答えるには、答えの中から適切なオプションを選択してください。注正しい選択はそれぞれ1ポイントの価値があります。
Azure Data Lake Storage Gen2Premiumアカウントをデプロイする必要があります。ソリューションは、次の要件を満たしている必要があります。
* 365日より古いブロブは削除する必要があります。
*管理者の労力を最小限に抑える必要があります。
*コストを最小限に抑える必要があります
何を使うべきですか?答えるには、答えの中から適切なオプションを選択してください。注正しい選択はそれぞれ1ポイントの価値があります。
正解:
Explanation:
https://learn.microsoft.com/en-us/azure/storage/blobs/premium-tier-for-data-lake-storage