質問 1:What is the name of the method that transforms categorical features into a series of binary indicator feature variables?
A. Target encoding
B. String indexing
C. One-hot encoding
D. Leave-one-out encoding
E. Categorical
正解:C
解説: (Topexam メンバーにのみ表示されます)
質問 2:A data scientist is using MLflow to track their machine learning experiment. As a part of each of their MLflow runs, they are performing hyperparameter tuning. The data scientist would like to have one parent run for the tuning process with a child run for each unique combination of hyperparameter values. All parent and child runs are being manually started with mlflow.start_run.
Which of the following approaches can the data scientist use to accomplish this MLflow run organization?
A. They can specify nested=True when starting the child run for each unique combination of hyperparameter values
B. They can turn on Databricks Autologging
C. They can start each child run with the same experiment ID as the parent run
D. They can specify nested=True when starting the parent run for the tuning process
E. They can start each child run inside the parent run's indented code block using mlflow.start runO
正解:A
解説: (Topexam メンバーにのみ表示されます)
質問 3:A data scientist has defined a Pandas UDF function predict to parallelize the inference process for a single-node model:
They have written the following incomplete code block to use predict to score each record of Spark DataFrame spark_df:
Which of the following lines of code can be used to complete the code block to successfully complete the task?
A. predict(*spark_df.columns)
B. predict(spark_df.columns)
C. predict(Iterator(spark_df))
D. mapInPandas(predict(spark_df.columns))
E. mapInPandas(predict)
正解:E
解説: (Topexam メンバーにのみ表示されます)
質問 4:A machine learning engineer is trying to scale a machine learning pipeline by distributing its single-node model tuning process. After broadcasting the entire training data onto each core, each core in the cluster can train one model at a time. Because the tuning process is still running slowly, the engineer wants to increase the level of parallelism from 4 cores to 8 cores to speed up the tuning process. Unfortunately, the total memory in the cluster cannot be increased.
In which of the following scenarios will increasing the level of parallelism from 4 to 8 speed up the tuning process?
A. When the entire data can fit on each core
B. When the tuning process in randomized
C. When the model is unable to be parallelized
D. When the data is particularly long in shape
E. When the data is particularly wide in shape
正解:A
解説: (Topexam メンバーにのみ表示されます)
質問 5:In which of the following situations is it preferable to impute missing feature values with their median value over the mean value?
A. When the features contain no outliers
B. When the features are of the boolean type
C. When the features contain no missing no values
D. When the features are of the categorical type
E. When the features contain a lot of extreme outliers
正解:E
解説: (Topexam メンバーにのみ表示されます)
質問 6:A machine learning engineer wants to parallelize the inference of group-specific models using the Pandas Function API. They have developed the apply_model function that will look up and load the correct model for each group, and they want to apply it to each group of DataFrame df.
They have written the following incomplete code block:
Which piece of code can be used to fill in the above blank to complete the task?
A. groupedApplyInPandas
B. applyInPandas
C. predict
D. mapInPandas
正解:B
解説: (Topexam メンバーにのみ表示されます)
質問 7:A team is developing guidelines on when to use various evaluation metrics for classification problems. The team needs to provide input on when to use the F1 score over accuracy.
Which of the following suggestions should the team include in their guidelines?
A. The F1 score should be utilized over accuracy when the number of actual positive cases is identical to the number of actual negative cases.
B. The F1 score should be utilized over accuracy when there is significant imbalance between positive and negative classes and avoiding false negatives is a priority.
C. The F1 score should be utilized over accuracy when there are greater than two classes in the target variable.
D. The F1 score should be utilized over accuracy when identifying true positives and true negatives are equally important to the business problem.
正解:B
解説: (Topexam メンバーにのみ表示されます)
Databricks Databricks-Machine-Learning-Associate 認定試験の出題範囲:
トピック | 出題範囲 |
---|
トピック 1 | - ML Workflows: The topic focuses on Exploratory Data Analysis, Feature Engineering, Training, Evaluation and Selection.
|
トピック 2 | - Scaling ML Models: This topic covers Model Distribution and Ensembling Distribution.
|
トピック 3 | - Spark ML: It discusses the concepts of Distributed ML. Moreover, this topic covers Spark ML Modeling APIs, Hyperopt, Pandas API, Pandas UDFs, and Function APIs.
|
トピック 4 | - Databricks Machine Learning: It covers sub-topics of AutoML, Databricks Runtime, Feature Store, and MLflow.
|
参照:https://www.databricks.com/learn/certification/machine-learning-associate
弊社は無料Databricks Databricks-Machine-Learning-Associateサンプルを提供します
お客様は問題集を購入する時、問題集の質量を心配するかもしれませんが、我々はこのことを解決するために、お客様に無料Databricks-Machine-Learning-Associateサンプルを提供いたします。そうすると、お客様は購入する前にサンプルをダウンロードしてやってみることができます。君はこのDatabricks-Machine-Learning-Associate問題集は自分に適するかどうか判断して購入を決めることができます。
Databricks-Machine-Learning-Associate試験ツール:あなたの訓練に便利をもたらすために、あなたは自分のペースによって複数のパソコンで設置できます。
TopExamは君にDatabricks-Machine-Learning-Associateの問題集を提供して、あなたの試験への復習にヘルプを提供して、君に難しい専門知識を楽に勉強させます。TopExamは君の試験への合格を期待しています。
弊社は失敗したら全額で返金することを承諾します
我々は弊社のDatabricks-Machine-Learning-Associate問題集に自信を持っていますから、試験に失敗したら返金する承諾をします。我々のDatabricks Databricks-Machine-Learning-Associateを利用して君は試験に合格できると信じています。もし試験に失敗したら、我々は君の支払ったお金を君に全額で返して、君の試験の失敗する経済損失を減少します。
弊社のDatabricks Databricks-Machine-Learning-Associateを利用すれば試験に合格できます
弊社のDatabricks Databricks-Machine-Learning-Associateは専門家たちが長年の経験を通して最新のシラバスに従って研究し出した勉強資料です。弊社はDatabricks-Machine-Learning-Associate問題集の質問と答えが間違いないのを保証いたします。
この問題集は過去のデータから分析して作成されて、カバー率が高くて、受験者としてのあなたを助けて時間とお金を節約して試験に合格する通過率を高めます。我々の問題集は的中率が高くて、100%の合格率を保証します。我々の高質量のDatabricks Databricks-Machine-Learning-Associateを利用すれば、君は一回で試験に合格できます。
安全的な支払方式を利用しています
Credit Cardは今まで全世界の一番安全の支払方式です。少数の手続きの費用かかる必要がありますとはいえ、保障があります。お客様の利益を保障するために、弊社のDatabricks-Machine-Learning-Associate問題集は全部Credit Cardで支払われることができます。
領収書について:社名入りの領収書が必要な場合、メールで社名に記入していただき送信してください。弊社はPDF版の領収書を提供いたします。
一年間の無料更新サービスを提供します
君が弊社のDatabricks Databricks-Machine-Learning-Associateをご購入になってから、我々の承諾する一年間の更新サービスが無料で得られています。弊社の専門家たちは毎日更新状態を検査していますから、この一年間、更新されたら、弊社は更新されたDatabricks Databricks-Machine-Learning-Associateをお客様のメールアドレスにお送りいたします。だから、お客様はいつもタイムリーに更新の通知を受けることができます。我々は購入した一年間でお客様がずっと最新版のDatabricks Databricks-Machine-Learning-Associateを持っていることを保証します。