個人財務 第2フェーズ2のCRISP-DMプロセスモデル:データ理解 - ダミー

第2フェーズ2のCRISP-DMプロセスモデル:データ理解 - ダミー

目次:

Anonim

Cross-Industry Standard Process for Data Mining(CRISP-DM)プロセスモデルの第2フェーズでは、データを取得して検証しますそれがあなたのニーズに合っていること。ビジネスの理解に戻って計画を修正する原因となる問題を特定することができます。目標や計画を再考するもう一つの理由は、ビジネス理解の欠陥を発見するかもしれません。

データの理解フェーズには、4つの タスク が含まれます。これらは

  • データの収集

  • データの記述

  • データの調査

  • データの品質の確認

タスク:データの収集

目標を設定し、データマイニング計画を定義しました。計画のすべてのステップは、適切なデータを持っているかどうかによって異なります。あなたは本当にそのデータを持っていることを確認してください!

このタスクには、最初のデータ収集レポートの1つだけが存在します。レポートでは、データを取得したこと、または少なくともデータへのアクセス権を取得し、データアクセスプロセスをテストし、データが存在することを確認する必要があります。また、データマイニングに使用するツールにデータをロードして、ツールがデータと互換性があることを確認する必要があります。

<! - 2 - >

このレポートを作成する前に、必要なデータを集めるために多くの作業を行うことがあります。まず、次のようにプランを作成します。

  • データ要件の概要: データマイニングの目標に対応するために必要なデータタイプのリストを作成します。必要な時間範囲やデータ形式などの詳細を含むリストを展開します。

  • データの可用性を確認する: 必要なデータが存在し、使用できることを確認します。必要なデータの一部が利用できない場合は、その問題の対処方法を決定します。

    <! (999)新規データの収集
    • 選択基準の定義:

    • 特定のデータソース(データベース、ファイル、ドキュメントなど)を使用します。これらのソース内で、このプロジェクトに関連するテーブル、フィールド、およびケース範囲を指定します。

    • これらの手順を完了したら、実際にデータを取得する必要があります。この段階で、プロジェクトに使用するデータマイニングプラットフォームにデータをインポートして、それが可能であることを確認し、プロセスを理解するようにします。この試行では、

  • ケースやフィールドの数や使用可能なメモリ量などの、期待していなかったソフトウェア(またはハードウェア)の制限を検出する可能性があります。 あなたのソースのデータフォーマット

データの不完全さを扱うことの難しさ(たとえば、不完全なデータセットをインポートまたは分析しない製品に遭遇する可能性があります)

  • 最後に、収集プロセスをレポートで要約します。レポートには、要件を記述し、収集したデータとどのような情報源かを正確に説明する必要があります。実際にデータを取得し、データマイニングプラットフォームと互換性があることを確認します。困難に遭遇した場合は、自分が何だったのか、どのように対処したのか(代替ソースの使用、計画の改訂、フォーマットの変更など)を説明します。

  • このタスクの成果物は単なる単純なレポートですが、そのレポートを書く前に行う必要がある作業は単純ではありません!データアクセスは、データマイニングプロセスの中で最も困難かつ不満足な部分の1つであり、技術的およびビジネス上の課題があります。

  • タスク:データの記述

データが完成しましたので、あなたの持つ一般的な説明を準備します。

このタスクの成果物はデータ記述レポートです。そこには、データのソースとフォーマット、ケースの数、フィールドの数と説明、その他重要な情報が記載されています。また、データマイニングの目標に対するデータの適合性を簡単に評価します。たとえば、データに、期待するフィールドとそこにある必要があるフィールドが含まれていること、および分析に十分なケースが含まれていることを確認します。

タスク:データの調査

このタスクでは、データをより詳細に調べます。各変数について、値の範囲とその分布を調べます。さらにデータをチェックするために、簡単なデータ操作と基本的な統計手法を使用します。データの探索はいくつかの目的をサポートします:

データに精通してください。

データ品質問題の兆候

データ準備ステップのステージを設定します。

  • このタスクの成果物はデータ調査レポートです。データの探索中に作成した仮説や初期の発見を文書化する場所です。このレポートには、配布、要約、データ品質の問題の兆候など、データ記述レポートよりもデータの詳細な説明が含まれている必要があります。

  • タスク:データの品質の確認

  • データがあり、それを調べた後、目標を達成するのに十分なのかどうかを判断する必要があります。あなたはしばしばいくらか問題を抱えていますが、引き続き進むことができますが、データ品質が非常に悪いために計画をサポートできず、代替案を探す必要があります。最悪のデータ問題には、

必要なデータは存在しません。 (存在しないか、それとも捨てられましたか?このデータを収集して将来の使用のために保存できるかどうか)

存在しますが、それを持つことはできません。 (この制限を克服できますか?)

重大なデータ品質の問題があります(紛失または誤った値がたくさんあり、修正できません)。

  • このタスクの成果物はデータ品質レポートです。これはあなたが持っているデータ、見つけた軽度かつ重大な品質問題、品質問題または代替案(代替データリソースの使用など)の可能な救済策をまとめたものです。本当に深刻なデータ品質の問題に直面しており、適切なソリューションを特定できない場合は、目標や計画を再検討することを推奨する必要があります。

第2フェーズ2のCRISP-DMプロセスモデル:データ理解 - ダミー

エディタの選択

自転車の点検チェックリスト - ダミー

自転車の点検チェックリスト - ダミー

すぐに自転車の点検をするために数分。あなたの自転車を一時的に与えることは、あなたの次の乗り心地の安全性、快適性、そして楽しさを高めることができます。乗車準備の一環として、次の手順に従ってください:車輪のクイックリリースレバーを開閉して、確認します。

必須サイクリング用具 - ダミー

必須サイクリング用具 - ダミー

あなたはバイクの乗り心地をさらに楽しくするために何百万ものものを買うことができます。自転車用に必要なアクセサリーをいくつかご紹介します。ヘルメット:ヘルメットを着用することはオーストラリアとニュージーランドの法律です。

自転車の範囲を閲覧可能 - ダミー

自転車の範囲を閲覧可能 - ダミー

あなたはサイクリングをすることに決めましたが、その重要なキットを欠いている - バイク!あなたが望む自転車のタイプを正確に知っていない限り、良いアドバイスは、あなたの時間を費やして、自転車で何をするのか、どこに乗るのかを本当に考えてみることです。

エディタの選択

アプリとプライバシー - ダミーを特定する

アプリとプライバシー - ダミーを特定する

Spotifyアプリケーションに登録すると、あなたの個人的な詳細の一部にアクセスする。たとえば、Top10アプリを使用してプレイリストを公開するには、既存のFacebookアカウントにリンクする必要があります。このプロセス中、Facebookはあなたに特定の種類の共有を許可するかどうか尋ねます。

モバイル対応携帯電話を識別する - ダミー

モバイル対応携帯電話を識別する - ダミー

SpotifyモバイルはiPhoneで最も人気がありますが、優れたAndroidバージョン(basks Androidマーケットの5つ星評価のうち5つの評価では5位に入っています)が急速に追いついています。

特集 - ダミー

特集 - ダミー

スポットメイキングは、モバイルでも、あらゆる音楽への普遍的な即時アクセスを可能にしますデバイスまたはデスクトップコンピュータ。 Facebookは人々が古い友達と再会して新しい友達を作るのを助け、Spotifyの助けを借りて青春の歌を再発見し、友人や検索を通じて新鮮な音楽を発見しました。

エディタの選択

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSアプリケーションでオブジェクト指向設計を使用する方法 - ダミー

IOSは、動作がオブジェクトに関連付けられているプログラムを設計するさまざまな方法です。説明するために、紅茶とスープの作り方を検討することを検討してください。しかし、即座に代わりに活動に飛び込んではいけません。探偵が犯罪現場に入るように行動してください。

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

IOSアプリケーションでハイレベル抽象化を使用してビデオを再生する方法 - ダミー

このセクションでは、MPMoviePlayerViewControllerクラスの高レベル抽象化を使用してiOSアプリケーションでビデオを再生する方法を説明します。 - (IBAction)playVideo:(id)sender {MPMoviePlayerViewController * moviePlayer = [[MPMoviePlayerViewController alloc] initWithContentURL:movieURL];このコードは、ビデオビューコントローラ内のTTTVideoViewControllerファイルからです。 [self presentMoviePlayerViewControllerAnimated:moviePlayer];}シンプルさ自体!必要なのはURLです。

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

IOSアプリケーションでJavaスクリプトオブジェクト表記を使用する方法 - ダミー

JavaScript Object Notation (JSON)はiOSアプリのデータを表現する上で事実上の標準になっています。 JSONを使用して、Web上でデータを転送したり、長期保存データを保存および取得するためのフォーマットとして使用することができます。 JSONは、人間が読める形式であり、マシンが理解しやすい形式です。 JSONのデータは1つにまとめることができます...