DP-203 Deutsch 無料問題集「Microsoft Data Engineering on Microsoft Azure (DP-203 Deutsch Version)」
Sie verfügen über einen Azure Synapse Analytics-Arbeitsbereich.
Sie planen, eine Lake-Datenbank mithilfe einer Datenbankvorlage in Azure Synapse bereitzustellen.
Welche beiden Elemente waren in der Vorlage enthalten? Jede richtige Antwort stellt einen Teil der Lösung dar.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert
Sie planen, eine Lake-Datenbank mithilfe einer Datenbankvorlage in Azure Synapse bereitzustellen.
Welche beiden Elemente waren in der Vorlage enthalten? Jede richtige Antwort stellt einen Teil der Lösung dar.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert
正解:D、E
解答を投票する
Sie verfügen über ein Azure-Abonnement, das eine Azure Data Factory mit dem Namen ADF1 enthält.
Mit Azure Data Factory Studio erstellen Sie eine komplexe Datenpipeline in ADF1.
Sie stellen fest, dass die Schaltfläche „Speichern“ nicht verfügbar ist und dass Validierungsfehler vorliegen, die die Veröffentlichung der Pipeline verhindern.
Sie müssen sicherstellen, dass Sie die Logik der Pipeline speichern können.
Lösung: Sie exportieren ADF1 als Azure Resource Manager (ARM)-Vorlage.
Mit Azure Data Factory Studio erstellen Sie eine komplexe Datenpipeline in ADF1.
Sie stellen fest, dass die Schaltfläche „Speichern“ nicht verfügbar ist und dass Validierungsfehler vorliegen, die die Veröffentlichung der Pipeline verhindern.
Sie müssen sicherstellen, dass Sie die Logik der Pipeline speichern können.
Lösung: Sie exportieren ADF1 als Azure Resource Manager (ARM)-Vorlage.
正解:A
解答を投票する
Sie laden eine Tabelle stapelweise in einen dedizierten SQL-Pool von Azure Synapse Analytics.
Sie müssen Daten aus einer Staging-Tabelle in die Zieltabelle laden. Die Lösung muss sicherstellen, dass alle Einfügungen in diesem Stapel rückgängig gemacht werden, wenn beim Laden der Daten in die Zieltabelle ein Fehler auftritt.
Wie sollten Sie den Transact-SQL-Code vervollständigen? Um zu antworten, ziehen Sie die entsprechenden Werte auf die richtigen Ziele. Jeder Wert kann einmal, mehrmals oder überhaupt nicht verwendet werden. Möglicherweise müssen Sie die Trennleiste zwischen den Fenstern ziehen oder scrollen, um den Inhalt anzuzeigen.
HINWEIS Jede richtige Auswahl ist einen Punkt wert.

Sie müssen Daten aus einer Staging-Tabelle in die Zieltabelle laden. Die Lösung muss sicherstellen, dass alle Einfügungen in diesem Stapel rückgängig gemacht werden, wenn beim Laden der Daten in die Zieltabelle ein Fehler auftritt.
Wie sollten Sie den Transact-SQL-Code vervollständigen? Um zu antworten, ziehen Sie die entsprechenden Werte auf die richtigen Ziele. Jeder Wert kann einmal, mehrmals oder überhaupt nicht verwendet werden. Möglicherweise müssen Sie die Trennleiste zwischen den Fenstern ziehen oder scrollen, um den Inhalt anzuzeigen.
HINWEIS Jede richtige Auswahl ist einen Punkt wert.

正解:

Explanation:

Ein Unternehmen plant, Apache Spark Analytics zur Analyse von Einbruchserkennungsdaten zu verwenden.
Sie müssen eine Lösung zur Analyse von Netzwerk- und Systemaktivitätsdaten auf böswillige Aktivitäten und Richtlinienverstöße empfehlen. Die Lösung muss den Verwaltungsaufwand minimieren.
Was sollten Sie empfehlen?
Sie müssen eine Lösung zur Analyse von Netzwerk- und Systemaktivitätsdaten auf böswillige Aktivitäten und Richtlinienverstöße empfehlen. Die Lösung muss den Verwaltungsaufwand minimieren.
Was sollten Sie empfehlen?
正解:B
解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
Sie verfügen über ein Azure Data Lake Storage Gen2-Konto mit dem Namen „konto1“, das Protokolle speichert, wie in der folgenden Tabelle gezeigt.

Sie gehen nicht davon aus, dass während der Aufbewahrungsfristen auf die Protokolle zugegriffen wird.
Sie müssen eine Lösung für Konto1 empfehlen, die die folgenden Anforderungen erfüllt:
* Löscht die Protokolle automatisch am Ende jedes Aufbewahrungszeitraums
* Minimiert Lagerkosten
Was sollten Sie in die Empfehlung aufnehmen? Um zu antworten, wählen Sie im Antwortbereich die entsprechenden Optionen aus.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.


Sie gehen nicht davon aus, dass während der Aufbewahrungsfristen auf die Protokolle zugegriffen wird.
Sie müssen eine Lösung für Konto1 empfehlen, die die folgenden Anforderungen erfüllt:
* Löscht die Protokolle automatisch am Ende jedes Aufbewahrungszeitraums
* Minimiert Lagerkosten
Was sollten Sie in die Empfehlung aufnehmen? Um zu antworten, wählen Sie im Antwortbereich die entsprechenden Optionen aus.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

正解:

Explanation:

Box 1: Store the infrastructure logs in the Cool access tier and the application logs in the Archive access tier For infrastructure logs: Cool tier - An online tier optimized for storing data that is infrequently accessed or modified. Data in the cool tier should be stored for a minimum of 30 days. The cool tier has lower storage costs and higher access costs compared to the hot tier.
For application logs: Archive tier - An offline tier optimized for storing data that is rarely accessed, and that has flexible latency requirements, on the order of hours. Data in the archive tier should be stored for a minimum of 180 days.
Box 2: Azure Blob storage lifecycle management rules
Blob storage lifecycle management offers a rule-based policy that you can use to transition your data to the desired access tier when your specified conditions are met. You can also use lifecycle management to expire data at the end of its life.
Reference:
https://docs.microsoft.com/en-us/azure/storage/blobs/access-tiers-overview
Sie planen, eine Tabelle in einem dedizierten SQL-Pool von Azure Synapse Analytics zu erstellen.
Die Daten in der Tabelle werden fünf Jahre lang aufbewahrt. Einmal jährlich werden Daten gelöscht, die älter als fünf Jahre sind.
Sie müssen sicherstellen, dass die Daten gleichmäßig auf die Partitionen verteilt sind. Die Lösung muss den Zeitaufwand für das Löschen alter Daten minimieren.
Wie sollten Sie die Transact-SQL-Anweisung vervollständigen? Um zu antworten, ziehen Sie die entsprechenden Werte auf die richtigen Ziele. Jeder Wert kann einmal, mehrmals oder überhaupt nicht verwendet werden. Möglicherweise müssen Sie die Trennleiste zwischen den Fenstern ziehen oder scrollen, um den Inhalt anzuzeigen.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

Die Daten in der Tabelle werden fünf Jahre lang aufbewahrt. Einmal jährlich werden Daten gelöscht, die älter als fünf Jahre sind.
Sie müssen sicherstellen, dass die Daten gleichmäßig auf die Partitionen verteilt sind. Die Lösung muss den Zeitaufwand für das Löschen alter Daten minimieren.
Wie sollten Sie die Transact-SQL-Anweisung vervollständigen? Um zu antworten, ziehen Sie die entsprechenden Werte auf die richtigen Ziele. Jeder Wert kann einmal, mehrmals oder überhaupt nicht verwendet werden. Möglicherweise müssen Sie die Trennleiste zwischen den Fenstern ziehen oder scrollen, um den Inhalt anzuzeigen.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

正解:

Explanation:
Box 1: HASH
Box 2: OrderDateKey
In most cases, table partitions are created on a date column.
A way to eliminate rollbacks is to use Metadata Only operations like partition switching for data management.
For example, rather than execute a DELETE statement to delete all rows in a table where the order_date was in October of 2001, you could partition your data early. Then you can switch out the partition with data for an empty partition from another table.
Reference:
https://docs.microsoft.com/en-us/sql/t-sql/statements/create-table-azure-sql-data-warehouse
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql/best-practices-dedicated-sql-pool
Sie entwerfen ein Enterprise Data Warehouse in Azure Synapse Analytics, das Website-Verkehrsanalysen in einem Sternschema speichert.
Sie planen eine Faktentabelle für Website-Besuche. Die Tabelle wird etwa 5 GB groß sein.
Sie müssen empfehlen, welcher Verteilungstyp und Indextyp für die Tabelle verwendet werden soll. Die Lösung muss die schnellste Abfrageleistung bieten.
Was sollten Sie empfehlen? Um zu antworten, wählen Sie im Antwortbereich die entsprechenden Optionen aus.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

Sie planen eine Faktentabelle für Website-Besuche. Die Tabelle wird etwa 5 GB groß sein.
Sie müssen empfehlen, welcher Verteilungstyp und Indextyp für die Tabelle verwendet werden soll. Die Lösung muss die schnellste Abfrageleistung bieten.
Was sollten Sie empfehlen? Um zu antworten, wählen Sie im Antwortbereich die entsprechenden Optionen aus.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

正解:

Explanation:
Box 1: Hash
Consider using a hash-distributed table when:
The table size on disk is more than 2 GB.
The table has frequent insert, update, and delete operations.
Box 2: Clustered columnstore
Clustered columnstore tables offer both the highest level of data compression and the best overall query performance.
Reference:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables- distribute
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql-data-warehouse/sql-data-warehouse-tables-index
Sie verfügen über ein Azure Data Lake Storage-Konto, das eine Stagingzone enthält.
Sie müssen einen Molkereiprozess entwerfen, um inkrementelle Daten aus der Stagingzone aufzunehmen, die Daten durch Ausführen eines R-Skripts zu transformieren und die transformierten Daten dann in ein Data Warehouse in Azure Synapse Analytics einzufügen.
Lösung: Sie verwenden einen Azure Data Factory-Zeitplantrigger, um eine Pipeline auszuführen, die die Daten in eine Staging-Tabelle im Data Warehouse kopiert, und verwenden dann eine gespeicherte Prozedur, um das R-Skript auszuführen.
Erfüllt dies das Ziel?
Sie müssen einen Molkereiprozess entwerfen, um inkrementelle Daten aus der Stagingzone aufzunehmen, die Daten durch Ausführen eines R-Skripts zu transformieren und die transformierten Daten dann in ein Data Warehouse in Azure Synapse Analytics einzufügen.
Lösung: Sie verwenden einen Azure Data Factory-Zeitplantrigger, um eine Pipeline auszuführen, die die Daten in eine Staging-Tabelle im Data Warehouse kopiert, und verwenden dann eine gespeicherte Prozedur, um das R-Skript auszuführen.
Erfüllt dies das Ziel?
正解:A
解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
Sie speichern Dateien in einem Azure Data Lake Storage Gen2-Container. Der Container verfügt über die in der folgenden Abbildung gezeigte Speicherrichtlinie.

Verwenden Sie die Dropdown-Menüs, um die Antwortmöglichkeit auszuwählen, die jede Aussage basierend auf den in der Grafik dargestellten Informationen vervollständigt.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.


Verwenden Sie die Dropdown-Menüs, um die Antwortmöglichkeit auszuwählen, die jede Aussage basierend auf den in der Grafik dargestellten Informationen vervollständigt.
HINWEIS: Jede richtige Auswahl ist einen Punkt wert.

正解:

Explanation:

Box 1: moved to cool storage
The ManagementPolicyBaseBlob.TierToCool property gets or sets the function to tier blobs to cool storage.
Support blobs currently at Hot tier.
Box 2: container1/contoso.csv
As defined by prefixMatch.
prefixMatch: An array of strings for prefixes to be matched. Each rule can define up to 10 case-senstive prefixes. A prefix string must start with a container name.
Reference:
https://docs.microsoft.com/en-us/dotnet/api/microsoft.azure.management.storage.fluent.models.
managementpolicybaseblob.tiertocool