DP-203 Korean 無料問題集「Microsoft Data Engineering on Microsoft Azure (DP-203 Korean Version)」

Azure Data Lake Storage Gen2 계정에 원본 데이터의 증분 로드를 수행하는 Azure Data Factory 파이프라인이 있습니다.
로드할 데이터는 원본 테이블에서 LastUpdatedDate라는 열로 식별됩니다.
4시간마다 파이프라인을 실행할 계획입니다.
파이프라인 실행이 다음 요구 사항을 충족하는지 확인해야 합니다.
동시성 또는 조절 제한으로 인해 파이프라인 실행이 실패하면 실행을 자동으로 재시도합니다.
테이블의 기존 데이터 백필을 지원합니다.
어떤 유형의 트리거를 사용해야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
ADM이라는 Azure 데이터 팩토리가 있습니다.
현재는 모든 파이프라인 작성 변경 사항을 ADF1에 직접 게시하고 있습니다.
파이프라인 아티팩트에 대한 변경 사항에 대한 버전 제어를 구현해야 합니다. 솔루션은 AOFl을 위해 Azure Data Factory Studio에 현재 정의된 리소스에 버전 제어를 적용할 수 있도록 해야 합니다. 어떤 두 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다. 참고: 각 정답은 1점입니다.

正解:D、E 解答を投票する
참고: 이 질문은 동일한 시나리오를 제시하는 일련의 질문 중 일부입니다. 시리즈의 각 질문에는 명시된 목표를 충족할 수 있는 고유한 솔루션이 포함되어 있습니다. 일부 질문 세트에는 하나 이상의 올바른 솔루션이 있을 수 있지만 다른 질문 세트에는 올바른 솔루션이 없을 수 있습니다.
이 섹션의 질문에 답한 후에는 해당 질문으로 돌아갈 수 없습니다. 결과적으로 이러한 질문은 검토 화면에 나타나지 않습니다.
Twitter 데이터를 분석할 Azure Stream Analytics 솔루션을 설계하고 있습니다.
각 10초 창에서 트윗 수를 계산해야 합니다. 솔루션은 각 트윗이 한 번만 계산되도록 해야 합니다.
솔루션: 5초의 홉 크기와 10초의 창 크기를 사용하는 호핑 창을 사용합니다.
이것이 목표를 달성합니까?

解説: (JPNTest メンバーにのみ表示されます)
Azure Synapse Analytics 전용 SQL 풀에서 FactPurchase라는 팩트 테이블을 디자인하고 있습니다. 이 테이블에는 소매점에 대한 공급업체의 구매가 포함되어 있습니다. FactPurchase에는 다음 열이 포함됩니다.

FactPurchase는 매일 100만 행의 데이터를 추가하고 3년간의 데이터를 포함합니다.
다음 쿼리와 유사한 Transact-SQL 쿼리가 매일 실행됩니다.
선택하다
SupplierKey, StockItemKey, COUNT(*)
팩트구매에서
WHERE DateKey >= 20210101
AND 날짜 키 <= 20210131
GROUP by SupplierKey, StockItemKey
어떤 테이블 분포가 쿼리 시간을 최소화합니까?

解説: (JPNTest メンバーにのみ表示されます)
Azure Blob Storage 계정에 저장된 Parquet 파일을 Azure Data Lake Storage Gen2 계정에 복사하는 솔루션을 설계하고 있습니다.
데이터는 데이터 레이크에 매일 로드되며 {연도}/{월}/{일}/의 폴더 구조를 사용합니다.
두 계정 간의 데이터 전송을 최소화하려면 매일 Azure Data Factory 데이터 로드를 설계해야 합니다.
설계에 포함해야 하는 두 가지 구성은 무엇입니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 올바른 선택은 1점의 가치가 있습니다.

正解:B、D 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
준비 영역이 포함된 Azure Data Lake Storage 계정이 있습니다.
스테이징 영역에서 증분 데이터를 수집하고 R 스크립트를 실행하여 데이터를 변환한 다음 변환된 데이터를 Azure Synapse Analytics의 데이터 웨어하우스에 삽입하도록 유제품 프로세스를 설계해야 합니다.
솔루션: Azure Data Factory 일정 트리거를 사용하여 데이터를 데이터 웨어하우스의 준비 테이블에 복사하는 파이프라인을 실행한 다음 저장 프로시저를 사용하여 R 스크립트를 실행합니다.
이것이 목표를 달성합니까?

解説: (JPNTest メンバーにのみ表示されます)
Azure Synapse 데이터베이스 템플릿을 사용하여 호수 데이터베이스를 배포하고 있습니다.
데이터베이스에 추가 테이블을 추가해야 합니다. 솔루션은 템플릿 테이블과 동일한 그룹화 방법을 사용해야 합니다.
'어떤 그룹화 방법을 사용해야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
Azure Synapse Analytics 전용 SQL 풀에서 테이블을 일괄 로드하고 있습니다.
준비 테이블에서 대상 테이블로 데이터를 로드해야 합니다. 솔루션은 대상 테이블에 데이터를 로드하는 동안 오류가 발생하는 경우 해당 배치의 모든 삽입이 실행 취소되도록 해야 합니다.
Transact-SQL 코드를 어떻게 완성해야 합니까? 응답하려면 적절한 값을 올바른 대상으로 드래그하십시오. 각 값은 한 번, 두 번 이상 사용되거나 전혀 사용되지 않을 수 있습니다. 콘텐츠를 보려면 창 사이의 분할 막대를 끌거나 스크롤해야 할 수 있습니다.
참고 각 올바른 선택은 1점의 가치가 있습니다.
正解:

Explanation:
Azure Synapse Analytics에서 1GB 미만의 차원 테이블을 만들 계획입니다.
다음 요구 사항을 충족하려면 테이블을 만들어야 합니다.
* 가장 빠른 쿼리 시간을 제공합니다.
* 쿼리 중 데이터 이동을 최소화합니다.
어떤 유형의 테이블을 사용해야 합니까?

解説: (JPNTest メンバーにのみ表示されます)
Pool1이라는 Azure Synapse Analytics 서버리스 SQL 풀과 storage1이라는 Azure Data Lake Storage Gen2 계정이 있습니다. AllowedBlobpublicAccess 속성은 storage1에 대해 비활성화됩니다.
Azure AD(Azure Active Directory) 사용자가 Pool1에서 storage1에 액세스하는 데 사용할 수 있는 외부 데이터 원본을 만들어야 합니다.
무엇을 먼저 만들어야 할까요?

解説: (JPNTest メンバーにのみ表示されます)
회사의 인적 자원(MR) 부서를 위한 데이터 마트를 설계하고 있습니다. 데이터 마트에는 정보와 직원 트랜잭션이 포함됩니다. 소스 시스템에서 다음 필드가 있는 플랫 추출이 있습니다.
* 직원 ID
* 이름
* 성
* 받는 사람
* GrossArnount
* 트랜잭션 ID
* 정부 ID
* NetAmountPaid
* 거래 날짜
데이터 마트용 Azure Synapse 분석 전용 SQL 풀에서 시작 스키마 데이터 모델을 설계해야 합니다.
어떤 두 개의 테이블을 만들어야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.

正解:B、D 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
요금소를 통과하는 차량의 스트리밍 데이터를 처리하고 있습니다.
Azure Stream Analytics를 사용하여 각 10분 기간 동안 번호판, 차량 제조업체 및 마지막 차량이 지나간 시간을 반환해야 합니다.
쿼리를 어떻게 완료해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
正解:

Explanation:


Box 1: MAX
The first step on the query finds the maximum time stamp in 10-minute windows, that is the time stamp of the last event for that window. The second step joins the results of the first query with the original stream to find the event that match the last time stamps in each window.
Query:
WITH LastInWindow AS
(
SELECT
MAX(Time) AS LastEventTime
FROM
Input TIMESTAMP BY Time
GROUP BY
TumblingWindow(minute, 10)
)
SELECT
Input.License_plate,
Input.Make,
Input.Time
FROM
Input TIMESTAMP BY Time
INNER JOIN LastInWindow
ON DATEDIFF(minute, Input, LastInWindow) BETWEEN 0 AND 10
AND Input.Time = LastInWindow.LastEventTime
Box 2: TumblingWindow
Tumbling windows are a series of fixed-sized, non-overlapping and contiguous time intervals.
Box 3: DATEDIFF
DATEDIFF is a date-specific function that compares and returns the time difference between two DateTime fields, for more information, refer to date functions.
Reference:
https://docs.microsoft.com/en-us/stream-analytics-query/tumbling-window-azure-stream-analytics
전사적 Azure Data Lake Storage Gen2 계정이 있습니다. 데이터 레이크는 VNET1이라는 Azure 가상 네트워크를 통해서만 액세스할 수 있습니다.
데이터 레이크의 데이터를 사용할 Azure Synapse에서 SQL 풀을 빌드하고 있습니다.
귀사에는 영업팀이 있습니다. 영업 팀의 모든 구성원은 Sales라는 Azure Active Directory 그룹에 있습니다. POSIX 컨트롤은 데이터 레이크의 파일에 대한 영업 그룹 액세스 권한을 할당하는 데 사용됩니다.
매시간 SQL 풀에 데이터를 로드할 계획입니다.
SQL 풀이 데이터 레이크에서 판매 데이터를 로드할 수 있는지 확인해야 합니다.
어떤 세 가지 작업을 수행해야 합니까? 각 정답은 솔루션의 일부를 나타냅니다.
참고: 각 영역 선택은 1점의 가치가 있습니다.

正解:B、C、E 解答を投票する
解説: (JPNTest メンバーにのみ表示されます)
Pool1이라는 Azure Synapse Analytics 전용 SQL 풀과 Account1이라는 Azure Data Lake Storage Gen2 계정이 있습니다.
외부 테이블을 사용하여 Account1의 파일에 액세스할 계획입니다.
외부 테이블을 만들 때 참조할 수 있는 Pool1에 데이터 원본을 만들어야 합니다.
Transact-SQL 문을 어떻게 완성해야 합니까? 대답하려면 대답 영역에서 적절한 옵션을 선택하십시오.
참고: 각 올바른 선택은 1점의 가치가 있습니다.
正解:

Explanation:

Box 1: blob
The following example creates an external data source for Azure Data Lake Gen2 CREATE EXTERNAL DATA SOURCE YellowTaxi WITH ( LOCATION = 'https://azureopendatastorage.blob.core.windows.net/nyctlc/yellow/', TYPE = HADOOP) Box 2: HADOOP Reference:
https://docs.microsoft.com/en-us/azure/synapse-analytics/sql/develop-tables-external-tables

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡