個人財務 CRISP-DMプロセスフェーズ3:データ準備 - ダミー

CRISP-DMプロセスフェーズ3:データ準備 - ダミー

目次:

Anonim

データマイニング担当者は、データマイニング(CRISP-DM)プロセスモデルの第3段階:データ準備の大半を費やします。データマイニングに使用されるほとんどのデータは、もともとは収集され、他の目的のために保存されていました。

データ準備フェーズには、5つの タスク が含まれます。これらは

  • データの選択

    <!データの整理
  • データの書式設定

  • データの書式設定

  • CRISP-DMのステップバイステップガイドでは、データセットの各セットの成果物として明示的に言及していません。これらのデータセットは、より良く存在し、適切にアーカイブされ、文書化されていました。データセットはタスクと一対一に対応しませんが、使用されるデータに関する情報は、各成果物レポートに含める必要があります。

  • -

タスク:データの選択

データのどの部分を実際にデータマイニングに使用するかを決定します。

このタスクの成果物は、包含と排除の根拠です。その中で、今後のデータマイニング作業に使用されるデータとそうでないデータについて説明します。

あなたの目標、データ品質、技術的問題(例えば、ツールのフィールドや行数の制限など)との関連性に基づいて、データの各部分を含めたり除外したりする理由を説明しますデータ形式のニーズに合わせた適切な処理を行うことができます。

<! - 3 - >

タスク:データのクリーニング

使用するように選択されたデータは、完全にきれい(エラーなし)になる可能性は低いです。特定のケースや個別のセル(データ項目)を除いた特定のデータ修正を行うためにソースを追跡したり、より洗練されたモデリング手法で選択されたデフォルト値または代替データで一部のデータを置き換えたりするなど、データマイニング作業のすべてまたは一部に対して、データのサブセットのみを使用することもできます。

このタスクの成果物は、データをきれいにするために使用されたすべての決定とアクションを詳細に記録するデータクリーニングレポートです。このレポートは、プロセスのデータ理解段階でデータ品質の検証タスクで確認された各データ品質の問題を網羅し、参照する必要があります。また、レポートでは、データの消去中に選択した結果に与える影響についても説明します。

タスク:データの作成

新しいフィールドをいくつか派生させる必要があるかもしれません(例えば、顧客が注文を受けたときの納期と日付を使用して顧客が注文を受け取るまでの時間を計算する)新しい形式のデータを作成することができます。

このタスクの成果物には、2つのレポート

派生属性:

作成した新しいフィールド(列)、作成方法、および理由を示すレポートが含まれます。

  • 生成レコード: 作成した新しいケース(行)、作成した方法、およびその理由を説明するレポート。

  • マージ・データとフォーマット・データ・タスクは、プロセスのこの段階で最後にリストされますが、必ずしも最後になるとは限りません。データ準備段階の早い段階でマージや再フォーマットが必要な場合があります。 タスク:データの統合

あなたのデータは、いくつかの異なるデータセットに存在する可能性があります。これらの異種データセットの一部またはすべてをまとめてモデリング段階に備える必要があります。

このタスクの成果物はマージされたデータです。 (そして、マージがどのように行われたかを文書化することは害ではありません)。

タスク:データのフォーマット

データは、モデリングに最も便利なフォーマット以外のフォーマットであなたに来ることがよくあります。 (書式の変更は、通常、ツールの設計によって行われます。)したがって、これらの書式を今すぐ変換してください。

このタスクの成果物は、あなたの再フォーマットされたデータです。 (そして、あなたが行った変更を記述した少しのレポートは、賢明なものです)。

データマイニングプロセスのデータ準備フェーズは、モデリングの準備ができたデータセットとデータセットを記述した徹底的なレポートで終了する必要があります。

CRISP-DMプロセスフェーズ3:データ準備 - ダミー

エディタの選択

自転車の点検チェックリスト - ダミー

自転車の点検チェックリスト - ダミー

すぐに自転車の点検をするために数分。あなたの自転車を一時的に与えることは、あなたの次の乗り心地の安全性、快適性、そして楽しさを高めることができます。乗車準備の一環として、次の手順に従ってください:車輪のクイックリリースレバーを開閉して、確認します。

必須サイクリング用具 - ダミー

必須サイクリング用具 - ダミー

あなたはバイクの乗り心地をさらに楽しくするために何百万ものものを買うことができます。自転車用に必要なアクセサリーをいくつかご紹介します。ヘルメット:ヘルメットを着用することはオーストラリアとニュージーランドの法律です。

自転車の範囲を閲覧可能 - ダミー

自転車の範囲を閲覧可能 - ダミー

あなたはサイクリングをすることに決めましたが、その重要なキットを欠いている - バイク!あなたが望む自転車のタイプを正確に知っていない限り、良いアドバイスは、あなたの時間を費やして、自転車で何をするのか、どこに乗るのかを本当に考えてみることです。

エディタの選択

アプリとプライバシー - ダミーを特定する

アプリとプライバシー - ダミーを特定する

Spotifyアプリケーションに登録すると、あなたの個人的な詳細の一部にアクセスする。たとえば、Top10アプリを使用してプレイリストを公開するには、既存のFacebookアカウントにリンクする必要があります。このプロセス中、Facebookはあなたに特定の種類の共有を許可するかどうか尋ねます。

モバイル対応携帯電話を識別する - ダミー

モバイル対応携帯電話を識別する - ダミー

SpotifyモバイルはiPhoneで最も人気がありますが、優れたAndroidバージョン(basks Androidマーケットの5つ星評価のうち5つの評価では5位に入っています)が急速に追いついています。

特集 - ダミー

特集 - ダミー

スポットメイキングは、モバイルでも、あらゆる音楽への普遍的な即時アクセスを可能にしますデバイスまたはデスクトップコンピュータ。 Facebookは人々が古い友達と再会して新しい友達を作るのを助け、Spotifyの助けを借りて青春の歌を再発見し、友人や検索を通じて新鮮な音楽を発見しました。

エディタの選択

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSは、動作がオブジェクトに関連付けられているプログラムを設計するさまざまな方法です。説明するために、紅茶とスープの作り方を検討することを検討してください。しかし、即座に代わりに活動に飛び込んではいけません。探偵が犯罪現場に入るように行動してください。

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

このセクションでは、MPMoviePlayerViewControllerクラスの高レベル抽象化を使用してiOSアプリケーションでビデオを再生する方法を説明します。 - (IBAction)playVideo:(id)sender {MPMoviePlayerViewController * moviePlayer = [[MPMoviePlayerViewController alloc] initWithContentURL:movieURL];このコードは、ビデオビューコントローラ内のTTTVideoViewControllerファイルからです。 [self presentMoviePlayerViewControllerAnimated:moviePlayer];}シンプルさ自体!必要なのはURLです。

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

JavaScript Object Notation (JSON)はiOSアプリのデータを表現する上で事実上の標準になっています。 JSONを使用して、Web上でデータを転送したり、長期保存データを保存および取得するためのフォーマットとして使用することができます。 JSONは、人間が読める形式であり、マシンが理解しやすい形式です。 JSONのデータは1つにまとめることができます...