目次:
- <! - 1 - >
- ビジネス中心のデータ科学者は、まず問題に関連するデータセットを特定し、次にそのデータセットを特定する必要があります。問題を解決するために必要なデータを十分に抽出します。データマイニング:
- 粒度
ビデオ: TensorFlow Dev Summit 2019 Keynote 2024
生データを実用的なインサイトに変えることは、データからの進展の第一歩です実際にあなたに利益をもたらすものに集められます。ビジネス中心のデータ科学者は、生データから洞察を生成するためにデータ分析を使用しています(999)。 分析の種類の特定 以下に列挙するように、複雑さが増す順に、最も遭遇する4種類のデータ分析があります。
<! - 1 - >
記述的アナリティクス:
このタイプのアナリティクスは、「何が起こったのですか?記述的な分析は、過去のデータと現在のデータに基づいています。ビジネスアナリストやビジネス中心のデータ科学者は、現代のビジネスインテリジェンスを記述分析に基づいています。-
診断分析: このタイプの分析を使用して、「なぜこの特定のことが起こったのですか? "または"何がうまくいかなかったのですか?診断分析は、データ駆動型イニシアチブのサブコンポーネントの成功または失敗の推測と推論に役立ちます。
-
<!予測分析:この種の分析は過去のデータと現在のデータに基づいていますが、予測分析は記述分析よりも一歩進んでいます。 予測分析は、将来の事象または傾向を予測するために複雑なモデル構築および分析を必要とする。ビジネスコンテキストでは、これらの分析はビジネス中心のデータ科学者によって実行されます。
処方分析:このタイプの分析は、予測分析に基づいたインフォメーション・アクションを通じてプロセス、構造、システムを最適化することを目的としています。何が起こるかの情報に基づいた評価に基づいて何をすべきかを示します。ビジネスアナリストとビジネス中心のデータ科学者は両方とも規律分析を生成できますが、その方法とデータソースは異なります。 -
<!理想的には、ビジネスは4つのタイプのデータ分析に関与する必要がありますが、規範分析はデータ分析から価値を生み出す最も直接的かつ効果的な手段です。 アナリティクスの共通課題の特定 アナリティクスは、通常、企業内で少なくとも2つの課題を提示します。まず、分析を含む特定のスキルセットを持つ新規採用者を見つけるのは非常に困難です。第二に、熟練したアナリストでさえ、経営者の意思決定者が理解できる方法で複雑な洞察を伝達することが困難なことがあります。これらの課題を克服するためには、分析製品を評価して受け入れる文化を創造し、育成する必要があります。ビジネスは、組織のすべてのレベルを教育するために働く必要があります。そのため、管理者はアナリティクスの基本概念とそれを実装することで達成できる成功を収めています。逆に、ビジネス中心のデータ・サイエンティストは、ビジネスに関する全般的な知識、特に、現在のビジネスをしっかりと理解していなければなりません。強力なビジネス知識は、ビジネス中心のデータ科学者の3つの主要な要件の1つです。他の2つは、強力なコーディングの洞察力であり、数学と統計モデリングによる強力な定量分析スキルです。 未加工データと実用的な洞察力を結ぶ
-
データの暴動は、データを洞察力に変換するために必要な作業のもう一つの重要な部分です。生データから分析を構築するには、ほとんどの場合、 データ論争
を使用する必要があります.-データを正確にかつ正確にするために、あるフォーマットと構造からデータを消去して変換するプロセスと手順分析ツールやスクリプトの形式では、消費する必要があります。
データ抽出:
ビジネス中心のデータ科学者は、まず問題に関連するデータセットを特定し、次にそのデータセットを特定する必要があります。問題を解決するために必要なデータを十分に抽出します。データマイニング:
データマイニングは、データマイニングによって抽出された生データをクリーニングした後、データマイニングをより便利に使用できる形式に変換します(データマイニングは、データマイニングと呼ばれます)。 。 (Mungは、破壊的なプロセスとして人生を始めました。認識できないものを認識できないものに変換します。つまり、Mash Until No Good、MUNGのようなフレーズです。)
データガバナンス:
データガバナンス基準は、手作業および自動化されたデータソースが、手元のモデルのデータ標準に準拠していることを保証するための品質管理手段として使用されます。データガバナンスの標準を適用して、データを格納して使用できるようにする際に、適切な粒度になるようにする必要があります。
粒度
は、データセットの詳細レベルの尺度です。データ粒度は、データが分割されるサブグループの相対的なサイズによって決定されます。 データアーキテクチャ: ITアーキテクチャが重要です。データが別々の固定リポジトリで隔離されている場合、その悪名高いデータサイロは誰もが苦情を申し立てますが、特定の事業部門内の少数の人にしか利用できません。サイロ化されたデータ構造は、組織のデータの過半数が単に組織全体で利用できないというシナリオをもたらします。 (言うまでもなく、サイロ化されたデータ構造は非常に無駄で非効率的です)。
組織のビジネスデータから最大の価値と洞察を引き出すことを目標とする場合は、データが中央のデータウェアハウスに格納されていることを確認し、別のサイロではありません。