Professional-Data-Engineer日本語 無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

ETL パイプラインを管理しています。Dataflow で実行されているストリーミング パイプラインが受信データの処理に時間がかかり、出力の遅延を引き起こしていることに気づきました。また、パイプライン グラフが Dataflow によって自動的に最適化され、1 つのステップに統合されていることにも気付きました。潜在的なボトルネックが発生している場所を特定したいと考えています。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
Pub/Sub トピックから読み取る Apache Beam 処理パイプラインを設計しました。トピックのメッセージ保持期間は 1 日で、Cloud Storage バケットに書き込みます。RPO が 15 分であるリージョン停止が発生した場合にデータ損失を防ぐには、バケットの場所と処理戦略を選択する必要があります。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
BigQuery ML で線形回帰モデルを作成し、顧客が自社の製品を購入する可能性を予測しています。モデルでは、都市名変数を主要な予測コンポーネントとして使用しており、モデルをトレーニングして提供するには、データを列に整理する必要があります。予測可能な変数を維持しながら、最小限のコーディングでデータを準備したいと考えています。どうすればよいでしょうか。

あなたは、さまざまなストレージ サービスでそれぞれのデータ所有者によってデータが整理および管理されている医療組織の一員です。この分散型エコシステムの結果、データの検出と管理が困難になっています。組織を支援するために、コストを最適化したソリューションを迅速に特定して実装する必要があります。
* データ管理と発見
* データ系統の追跡
* データ品質の検証
ソリューションをどのように構築すればよいでしょうか?

解説: (JPNTest メンバーにのみ表示されます)
社内の IT アプリケーションの 1 つと Google BigQuery を統合して、ユーザーがアプリケーションのインターフェースから BigQuery にクエリを実行できるようにします。個々のユーザーに BigQuery への認証を行わせたり、データセットへのアクセス権を与えたりすることは望ましくありません。IT アプリケーションから BigQuery に安全にアクセスする必要があります。
何をすべきでしょうか?

特定の日に雨が降るかどうかを予測するモデルを構築しています。入力特徴は数千個あり、一部の特徴を削除することで、モデルの精度への影響を最小限に抑えながらトレーニング速度を向上できるかどうかを確認したいと考えています。何ができるでしょうか?

Cloud Composer を使用して ETL パイプラインをオーケストレートします。Apache Airflow 有向非巡回グラフ (DAG) のタスクの 1 つはサードパーティのサービスに依存しています。タスクが成功しなかった場合に通知を受け取りたいのですが、どうすればよいですか。

解説: (JPNTest メンバーにのみ表示されます)
BigQuery オンデマンド環境を管理しています。ビジネス インテリジェンス ツールは、日レベルと月レベルで大規模な (50 TB) 販売履歴ファクト テーブルを集計するクエリを毎日何百も送信しています。これらのクエリの応答時間は遅く、コストの予想を超えています。応答時間を短縮し、クエリ コストを削減し、メンテナンスを最小限に抑える必要があります。どうすればよいでしょうか。

解説: (JPNTest メンバーにのみ表示されます)
金融市場データを消費者と共有し、消費者がデータ フィードを受信するためのアプリケーションを構築しています。データは市場からリアルタイムで収集されます。消費者は次の方法でデータを受け取ります。
リアルタイムイベントストリーム
リアルタイムストリームと履歴データへのANSI SQLアクセス
履歴エクスポートの一括処理
どのソリューションを使用すべきでしょうか?

Pll (個人識別情報) データが含まれる可能性のあるファイルを Cloud Storage に、そして最終的には BigQuery にストリーミングするティールライム予測エンジンを構築しています。名前とメール アドレスは結合キーとしてよく使用されるため、機密データがマスクされていても参照整合性が維持されるようにする必要があります。権限のない個人が Pll データにアクセスできないようにするには、Cloud Data Loss Prevention API (DLP API) をどのように使用すればよいですか。

BigQuery のデータ変換ソリューションを設計しています。開発者は SOL に精通しており、ELT 開発手法を使用したいと考えています。さらに、開発者は直感的なコーディング環境と、SQL をコードとして管理する能力を必要としています。開発者がこれらのパイプラインを構築するためのソリューションを特定する必要があります。何をすべきでしょうか?

解説: (JPNTest メンバーにのみ表示されます)
金融サービス会社はクラウド テクノロジーに移行しており、50 TB の金融時系列データをクラウドに保存したいと考えています。このデータは頻繁に更新され、常に新しいデータがストリーミングされます。また、このデータから洞察を得るために、既存の Apache Hadoop ジョブをクラウドに移行したいと考えています。
データを保存するためにどの製品を使用すればよいでしょうか?

数百万件の機密性の高い患者記録をリレーショナル データベースから BigQuery にコピーする必要があります。データベースの合計サイズは 10 TB です。安全で時間効率の良いソリューションを設計する必要があります。どうすればよいでしょうか。

Google Cloud Bigtable スキーマを設計するときは、_________ することをお勧めします。

解説: (JPNTest メンバーにのみ表示されます)
パソコンのウェブブラウザから Cloud Dataproc クラスタにウェブ トラフィック データを安全に転送するには、_____ を使用する必要があります。

解説: (JPNTest メンバーにのみ表示されます)
現在のオンプレミスの Apache Hadoop デプロイメントをクラウドに移行する予定です。デプロイメントが、長時間実行されるバッチ ジョブに対して可能な限りフォールト トレラントかつコスト効率に優れていることを確認する必要があります。マネージド サービスを使用したいと考えています。どうすればよいでしょうか。

Cloud Bigtable スキーマの行キーを設計する際の一般的な推奨事項は何ですか?

解説: (JPNTest メンバーにのみ表示されます)
あなたは自動車メーカーに勤務しており、異常なセンサー イベントをキャプチャするために Google Cloud Pub/Sub を使用してデータ パイプラインを設定しました。Cloud Pub/Sub のプッシュ サブスクリプションを使用して、発生した異常なイベントに対処するために作成したカスタム HTTPS エンドポイントを呼び出しています。カスタム HTTPS エンドポイントは、大量の重複メッセージを受信し続けています。これらの重複メッセージの原因として最も可能性が高いのは何でしょうか。

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡