ビデオ: Sean's NFL Fan Sentiment Study - Data Analysis with R 2024
最近の大きなデータ分析では、正当な理由のために多くの誇大宣伝が行われています。この動きの一部になりたい場合は、ビッグデータ分析の特性を知る必要があります。企業は何かがあることを知っていますが、最近までそれを掘り起こすことはできませんでした。これは分析にエンベロープを押しつけることは、大規模なデータ分析の動きのエキサイティングな側面です。
企業は収集したデータにアクセスして分析することができ、また洞察を得ることができますが、効果的に管理や分析を行うことはできませんでした。膨大な量の異種データを視覚化することが必要な場合や、高度な分析ストリーミングをリアルタイムで実行する場合があります。それはいくつかの点で進化的であり、他の点では革命的です。
<! - 1 - >だから、あなたの会社が大きなデータ分析で封筒を押しているときはどう違うのですか?ビッグデータ分析をサポートするインフラストラクチャは異なり、アルゴリズムはインフラストラクチャに対応するように変更されています。
意思決定指向
-
行動指向
-
意思決定指向分析は、従来のビジネスインテリジェンスに似ています。大規模なデータソースの選択的なサブセットと表現を見て、結果をビジネス上の意思決定プロセスに適用しようとします。確かにこれらの決定は何らかの行動やプロセスの変更をもたらすかもしれませんが、分析の目的は意思決定を増強することです。
<!アクション指向分析は、パターンが現れたり、特定の種類のデータが検出され、行動が必要な場合に、迅速な対応に使用されます。分析を通じて大きなデータを活用し、積極的または反応的な行動変化を引き起こすことは、早期採用者にとって大きな可能性を提供します。
分析アプリケーションを作成して大きなデータを見つけて活用することで、後ではなく早く価値を抽出することができます。このタスクを実行するには、これらのカスタムアプリケーションをゼロから、またはプラットフォームやコンポーネントを利用して構築する方が効果的です。<! - 3 - >
まず、ビッグデータ分析の追加的な特徴のいくつかを見てみましょう。これは、ボリューム、速度、およびバラエティの3つのV以外に、従来の種類の分析とは異なります。
はプログラム的です。
-
分析の最大の変化の1つは、過去に手動でアプリケーションにロードして探索できるデータセットを扱っていたことです。大規模なデータ分析では、データの規模のためにあらゆる種類の探索を行うためにプログラムで処理する必要のある生データから開始する場合があります。 これはデータ駆動型である可能性があります。 多くのデータ科学者は、仮説に基づいたデータ分析手法(前提を開発し、その前提が正しいかどうかを確認するためのデータ収集)を使用していますが、データを使用して分析を推進することもできます。それの量。たとえば、機械学習アルゴリズムを使用して、この種の仮説のない分析を行うことができます。 多くの 属性を使用できます。
-
過去には、そのデータソースの何百もの属性や特性を扱っていた可能性があります。今では、何千もの属性と数百万の観測データで構成された数百ギガバイトのデータを扱うことができます。すべてが現在、より大きなスケールで起こっています。 反復可能であることがあります。 より多くのコンピューティングパワーは、あなたが望む方法を得るまで、あなたのモデルを反復できることを意味します。ここに例があります。特定の顧客行動に関する予測変数を見つけようとしているモデルを構築しているとします。妥当なサンプルのデータを抽出したり、データが存在する場所に接続したりすることがあります。仮説を検証するためのモデルを構築するかもしれません。
-
過去には、モデルを効果的に機能させるためのメモリがあまり多くなかったかもしれませんが、アルゴリズムを訓練するのに必要な繰り返しを実行するには膨大な量の物理メモリが必要です。また、自然言語処理やニューラルネットワークのような先進的なコンピューティング技術を使用して、データが追加されるにつれて学習に基づいてモデルを自動的に進化させる必要があるかもしれません。 クラウドベースのインフラストラクチャをサービスとして活用することで、必要なコンピューティングサイクルを迅速に取得することができます。 Amazon Cloud Services(ACS)のようなインフラストラクチャをサービス(IaaS)プラットフォームとして使用すると、大きなデータセットを取り込み、迅速に分析するためのマシンのクラスタを迅速にプロビジョニングできます。
-