Professional-Data-Engineer日本語 無料問題集「Google Certified Professional Data Engineer Exam (Professional-Data-Engineer日本語版)」

データフローパイプラインをテストして、テキストファイルを取り込んで変換します。ファイルは圧縮されたgzipで圧縮され、エラーは配信不能キューに書き込まれ、Sidelnputsを使用してデータを結合しています。パイプラインの完了に予想よりも時間がかかることに気づきました。Dataflowジョブを迅速に処理するにはどうすればよいですか。

あなたの会社は、リアルタイムのセンサーデータを工場のフロアからBigtableにストリーミングしていますが、パフォーマンスが非常に低いことに気づきました。リアルタイムダッシュボードに入力するクエリでBigtableのパフォーマンスを向上させるには、行キーをどのように再設計する必要がありますか?

運用システムのトランザクションデータをオンプレミスデータベースからGCPに移動する必要がある中規模の企業で働いています。データベースのサイズは約20TBです。どのデータベースを選択する必要がありますか?

MariaDBSQLデータベースをGCEVMインスタンスにデプロイしており、モニタリングとアラートを設定する必要があります。最小限の開発作業でMariaDBからネットワーク接続、ディスクIO、レプリケーションステータスなどのメトリックを収集し、ダッシュボードとアラートにStackDriverを使用する必要があります。
あなたは何をするべきか?

銀行業界の政府規制は、クライアントの個人情報(PII)の保護を義務付けています。会社では、PIIを暗号化してアクセス制御し、主要なデータ保護標準に準拠する必要があります。CloudData Loss Prevention(Cloud DIP)を使用することに加えて、Googleが推奨する慣行に従い、サービスアカウントを使用してPIIへのアクセスを制御する必要があります。あなたは何をするべきか?

Cloud Machine Learning Engineを使用して自分のコンピューターでTensorFlowトレーニングジョブを実行するには、コマンドは何から始まりますか?

解説: (JPNTest メンバーにのみ表示されます)
業界の政府規制により、特定の種類のデータへのアクセスの監査可能な記録を維持する必要があります。期限切れのすべてのログが正しくアーカイブされると仮定すると、その義務の対象となるデータをどこに保存する必要がありますか?

あなたは、通信サービス プロバイダの販売データを分析するために BigQuery でデータ ウェアハウスを設計しています。顧客、製品、およびサブスクリプションのデータ モデルを作成する必要がある すべての顧客、製品、およびサブスクリプションは毎月更新できますが、すべてのデータの履歴記録を維持する必要があります。現在および履歴レポートに視覚化レイヤーを使用する予定です。データ モデルがシンプルで使いやすいものであることを確認する必要があります。そして費用対効果が高い。あなたは何をするべきか?

解説: (JPNTest メンバーにのみ表示されます)
次の条件を満たすように、クラウドネイティブの履歴データ処理システムを設計しています。
*分析対象のデータはCSV、Avro、PDF形式であり、Cloud Dataproc、BigQuery、ComputeEngineなどの複数の分析ツールからアクセスできます。
*ストリーミングデータパイプラインは、新しいデータを毎日保存します。
*パフォーマンスはソリューションの要素ではありません。
*ソリューションの設計では、可用性を最大化する必要があります。
このソリューションのデータストレージをどのように設計する必要がありますか?

ニューラルネットワークモデルのトレーニングには数日かかります。トレーニング速度を上げたい。あなたは何ができますか?

タイムスタンプ列とID列のWHERE句を使用してBigQueryテーブルをフィルタリングするクエリがあります。 bq query --- dry_runを使用すると、タイムスタンプとIDのフィルターがデータ全体のごく一部を選択している場合でも、クエリがテーブルのフルスキャンをトリガーすることがわかります。既存のSQLクエリへの変更を最小限に抑えて、BigQueryによってスキャンされるデータの量を減らしたいと考えています。あなたは何をするべきか?

Google Cloud Pub / Subサブスクリプションをソースとして実行しているGoogleCloudDataflowストリーミングパイプラインがあります。新しいCloudDataflowパイプラインを現在のバージョンと互換性のないものにするコードを更新する必要があります。この更新を行うときにデータを失いたくない。あなたは何をするべきか?

次の要件を持つ運用チームのビジュアライゼーションを作成する必要があります。
どのアプローチが要件を満たしていますか?

あなたは銀行で働いています。すでに付与されているローン申請と、これらの申請がデフォルトになっているかどうかに関する情報を含むラベル付きデータセットがあります。クレジット申請者のデフォルト率を予測するためのモデルをトレーニングするように依頼されました。
あなたは何をするべきか?

弊社を連絡する

我々は12時間以内ですべてのお問い合わせを答えます。

オンラインサポート時間:( UTC+9 ) 9:00-24:00
月曜日から土曜日まで

サポート:現在連絡