目次:
ビデオ: Overview of SAS for Demand-Driven Planning and Optimization 2024
Excelレポートのビルディングブロックとして、データモデルのデータを適切に構造化する必要があります。すべてのデータセットが均等に作成されるわけではありません。一部のデータセットは標準のExcel環境で動作しますが、データモデリングの目的では機能しないことがあります。データモデルを構築する前に、ソースデータがダッシュボード用に適切に構造化されていることを確認してください。
過度の単純化のリスクがあるため、Excelで一般的に使用されるデータセットには、3つの基本的な形式があります。
-
スプレッドシートレポート
-
フラットデータファイル
-
表データセット
パンチラインは、フラットデータファイルと表データセットだけが効果的なデータモデルを作成することです。
スプレッドシートレポートは非効率的なデータモデルを作成します。
スプレッドシートレポート は、高度にフォーマットされ、要約されたデータを表示し、管理者またはエグゼクティブユーザー用のプレゼンテーションツールとして設計されます。典型的なスプレッドシートレポートでは、空白スペースを慎重に使用してフォーマットを行い、データを審美的な目的で繰り返し、高レベルの分析のみを提示します。次の図は、スプレッドシートレポートを示しています。
<! - 2 - > スプレッドシートレポート。スプレッドシートのレポートは見た目がよくても効果的なデータモデルではありません。どうして?主な理由は、これらのレポートでは、データ、分析、およびプレゼンテーションが分離されていないということです。あなたは基本的に1つの分析に固定されています。
報告書からグラフを作成することはできますが、既存のもの以外の分析を適用することは現実的ではありません。たとえば、この特定のレポートを使用して、すべての自転車販売の平均を計算して提示しますか?どのようにベスト・パフォーマンスのトップ10市場のリストを計算しますか?
<! - 3 - >この設定では、毎月更新するのが難しい非常に手作業のプロセスに陥ってしまいます。すでにレポートに含まれている上位レベルの分析以外の分析は、ファンシーな数式でも基本的に最高です。さらに、バイクの販売を月単位で表示する必要がある場合はどうなりますか?データモデルでスプレッドシートレポートにないデータを使用した分析が必要な場合、別のデータセットを検索する必要があります。
フラットデータファイルは、データモデルにうまく適合します。
別のタイプのファイルフォーマットはフラットファイルです。 フラットファイル は、行と列で構成されたデータリポジトリです。各行は、データ要素のセット、または レコードに対応します。 各列は フィールドです。 フィールドは、レコード内の一意のデータ要素に対応します。次の図には、前のレポートと同じデータが含まれていますが、フラットデータファイル形式で表されています。
フラットデータファイル。すべてのデータフィールドに列があり、すべての列が1つのデータ要素に対応することに注意してください。さらに、余分な間隔はなく、各行(またはレコード)は固有の情報セットに対応しています。しかし、これをフラットなファイルにする重要な属性は、レコードを一意に識別する単一のフィールドがないことです。実際に、レコードを一意に識別できるようにするには、4つの個別のフィールド(地域、市場、事業セグメント、および月の売上金額)を指定する必要があります。
フラットファイルは、必要なデータを保持するのに十分詳細に記述でき、単純な公式(SUM、AVERAGE、VLOOKUP、およびSUMIF)の幅広い分析に役立つため、Excelのデータモデリングに適しています。名前はいくつか。
表データセットは、ピボットテーブル駆動型データモデルに最適です。
多くの実効データモデルは、主にピボットテーブルによって駆動されます。ピボットテーブルは、Excelの優れた分析ツールです。ピボットテーブルを使用しているユーザーにとっては、チャートや表などのレポートコンポーネントで使用するためにデータを要約して整形する優れた方法を提供していることがわかります。
表データセット は、ピボットテーブル駆動型データモデルに最適です。次の図は、表形式のデータセットを示しています。表形式のデータセットとフラットデータファイルの主な違いは、表形式のデータセットでは列ラベルが実際のデータの2倍にならないことです。たとえば、Sales Period列には月の識別子が含まれています。この構造の微妙な違いは、表形式のデータセットをピボットテーブルの最適なデータソースにする理由です。この構造により、ソートやグループ化などの主要なピボット・テーブル機能が確実に機能するようになります。
表形式のデータセット。表形式データセットの属性は次のとおりです。
-
データセットの最初の行には、各列の情報を記述するフィールドラベルが含まれています。
-
列ラベルは、フィルタまたはクエリの基準(月、日付、年、地域、市場など)として使用できるデータ項目として二重の義務を引き出しません。
-
空白の行または列はありません。すべての列に見出しがあり、値はすべての行にあります。
-
各列は、一意のデータカテゴリを表します。
-
各行は、各列の個々の項目を表します。