ビデオ: 【字幕付】2018年5月24日参議院文教科学委員会(抜粋)「学校教育法等の一部を改正する法律案」可決 2024
予測分析プロジェクトでは、適切なデータソースを特定し、それらのソースからデータをプールし、それを配置する必要があります構造化された、組織的な形式で提供されます。これらの作業は非常に困難な作業であり、組織全体のさまざまなデータ管理者間で慎重な調整が必要になります。
分析する変数も選択する必要があります。このプロセスでは、データ制約、プロジェクト制約、ビジネス目標を考慮する必要があります。
<! - 1 - >選択する変数には予測能力が必要です。また、予算と時間枠内でプロジェクトにとって価値があり実行可能な変数も考慮する必要があります。たとえば、犯罪捜査で銀行取引を分析している場合、関連するすべての関係者の電話記録が分析に関連する可能性がありますが、アナリストはアクセスできません。
プロジェクトのこのフェーズでかなりの時間を費やすことが期待されます。データの収集、データ分析、およびデータの内容、品質、および構造の処理プロセスは、時間のかかる作業リストになる可能性があります。
<! - 2 - >データ識別の過程で、データとその特性を理解するのに役立ちます。この知識は、モデルを構築するために使用するアルゴリズムを選択するのに役立ちます。例えば、時系列データは、回帰アルゴリズムによって分析することができる。分類アルゴリズムを使用して離散データを分析することができる。
変数の選択は、データの理解度によって異なります。少なくとも最初は何百もの変数を見て評価しなければならないと驚かないでください。幸いにも、これらの変数を扱い、重要な洞察を得るようになると、それらを数十に絞り込み始めます。また、プロジェクト全体でのデータ変更の理解に応じて、変数の選択が変更されることを期待してください。
<! - 3 - >あなたが知っていること、知らないこと、見つからないものを追跡するために使用できるデータ・インベントリを構築することは有益です。データインベントリには、さまざまなデータ要素の一覧と、プロセスの後続の手順に関連する属性が含まれている必要があります。
たとえば、特定の期間、セグメントに欠落している郵便番号やレコードがないかどうかを記録することができます。
あなたのビジネス知識(あなたは 専門知識 とも呼ばれます)は、プロジェクトの成果にプラスの影響を与える重要な変数を選択するのに役立ちます。彼らは、これらの変数の重要性、どこでどのように入手するのか、その他の貴重な情報をあなたに説明するのに役立ちます。