Professional-Data-Engineer日本語 無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

データ処理パイプラインを設計しています。パイプラインは、負荷の増加に応じて自動的にスケーリングできる必要があります。メッセージは少なくとも1回処理する必要があり、1時間以内に注文する必要があります。ソリューションをどのように設計する必要がありますか?

世界中の何百万ものデバイスからloTセンサーデータを収集し、そのデータをBigQueryに保存しています。アクセスパターンは、次のクエリを使用してlocation_idとdevice_versionによって変更された最近のデータに基づいています。

コストとパフォーマンスについてクエリを最適化する必要があります。データをどのように構成する必要がありますか?

あなたは、ApacheHadoopクラスターで実行する会社のETLパイプラインを作成する責任があります。パイプラインには、いくつかのチェックポイントと分割のパイプラインが必要になります。パイプラインを作成するには、どの方法を使用する必要がありますか?

最近の価格履歴に基づいて特定の株式の価格を予測する機械学習モデルを作成する場合、どのタイプの推定量を使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
ストリーミング エンジンと水平自動スケーリングを有効にして、Dataflow ストリーミング パイプラインを実行しています。
ワーカーの最大数を 1000 に設定しました。パイプラインの入力は、Cloud Storage からの通知を含む Pub/Sub メッセージです。パイプライン変換の 1 つは CSV ファイルを読み取り、CSV 行ごとに要素を出力します。ジョブのパフォーマンスが低い。パイプラインは 10 個のワーカーのみを使用しており、オートスケーラーが追加のワーカーを起動していないことがわかります。パフォーマンスを向上させるには何をすべきでしょうか?

解説: (JPNTest メンバーにのみ表示されます)
データがパイプラインに入った時間に基づいて、無制限のデータソースのデータを1時間ごとに集約するには、どのクラウドデータフロー/ビーム機能を使用する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
あなたの組織には、プロジェクト A とプロジェクト B という 2 つの Google Cloud プロジェクトがあります。プロジェクト A には、機密ソースからデータを受け取る Pub/Sub トピックがあります。プロジェクト A のリソースのみがそのトピックのデータにアクセスできる必要があります。プロジェクト B および将来のプロジェクトがプロジェクト A トピック内のデータにアクセスできないようにしたいと考えています。あなたは何をするべきか?

解説: (JPNTest メンバーにのみ表示されます)
Cloud Dataprepを使用して、BigQueryテーブルのデータのサンプルにレシピを作成しました。実行時間が可変のロードジョブが完了した後、同じスキーマを持つデータの毎日のアップロードでこのレシピを再利用する必要があります。あなたは何をするべきか?

Cloud Bigtableは、Googleの______ビッグデータデータベースサービスです。

解説: (JPNTest メンバーにのみ表示されます)
データウェアハウスとしてGoogleBigQueryを使用しています。ユーザーは、クエリをいつ実行しても、次の単純なクエリの実行が非常に遅いと報告しています。
SELECT country、state、city FROM [myproject:mydataset.mytable] GROUP BY countryクエリのクエリプランを確認すると、ステージ1の[読み取り]セクションに次の出力が表示されます。

このクエリの遅延の最も可能性の高い原因は何ですか?

タイムスタンプ列とID列のWHERE句を使用してBigQueryテーブルをフィルタリングするクエリがあります。 bq query --- dry_runを使用すると、タイムスタンプとIDのフィルターがデータ全体のごく一部を選択している場合でも、クエリがテーブルのフルスキャンをトリガーすることがわかります。既存のSQLクエリへの変更を最小限に抑えて、BigQueryによってスキャンされるデータの量を減らしたいと考えています。あなたは何をするべきか?

天気アプリは15分ごとにデータベースにクエリを実行して、現在の気温を取得します。フロントエンドは、Google AppEngineとサーバーの数百万のユーザーによって強化されています。データベース障害に対応するためにフロントエンドをどのように設計する必要がありますか?

解説: (JPNTest メンバーにのみ表示されます)
Google Cloud Bigtableスキーマを設計するときは、_________することをお勧めします。

解説: (JPNTest メンバーにのみ表示されます)
projects.regions.clusters.create操作を使用して新しいCloudDataprocクラスターを作成する場合、プロジェクト、リージョン、名前、および____の4つの値が必要です。

解説: (JPNTest メンバーにのみ表示されます)
アプリケーションイベントをPub/Subトピックにパブリッシュするパイプラインを設計しています。分析のために結果をBigQueryに読み込む前に、1時間間隔でイベントを集計する必要があります。ソリューションは、大量のイベントを処理してBigQueryに読み込むことができるように、スケーラブルである必要があります。あなたは何をするべきか?

スケーラブルな方法でデータを収集する必要がある新しいアプリケーションを構築しています。データはアプリケーションから1日中継続的に到着し、年末までに1日あたり約150GBのJSONデータを生成すると予想されます。要件は次のとおりです。
*プロデューサーをコンシューマーから切り離す
*無期限に保存される生の取り込みデータのスペースとコスト効率の高いストレージ
*ほぼリアルタイムのSQLクエリ
* SQで照会される少なくとも2年間の履歴データを維持します。これらの要件を満たすために、どのパイプラインを使用する必要がありますか?

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡