目次:
- エンティティの抽出と強化
- 製品カテゴリ
- この機能を使用する場合は、データベースの集計をデータの横に効率的に計算できることを確認してください。ほとんどのNoSQLデータベースは機能しますが、一部のデータベースは機能しません。
- NoSQLデータベースベンダーがビジュアライゼーションツールを提供しているか、ビジネスパートナにこれらのデータベースに接続できるツールがあるかどうかを確認します。流行のツールには、最新の共有ビジネスインテリジェンスサーバーであるTableau Serverが含まれています。これは、NoSQLデータベースを含むさまざまなデータベースのデータに対話型レポートを公開することをサポートします。
ビデオ: An Introduction To NoSQL Databases 2024
大量のデータを格納して検索し、高速化することは素晴らしいことです.NoSQLで新しく管理されたデータを取得すると、素晴らしいことができます。
エンティティの抽出と強化
データベーストリガ、アラートアクション、および外部システムを使用してソースデータを分析できます。多分それはフリーテキストですが、既知の主題について言及しているのかもしれません。これらのトリガーとアラートアクションは、テキストを個人または組織として強調表示し、効果的にコンテンツ自体にタグを付け、文書がその中に収まるようにすることができます。
<! - 1 - >良い例は、ニュース記事の内容です。 Apache StanbolやOpenCalaisのようなツールを使用して、主要な用語を識別することができます。これらのツールは、 "プーチン大統領"を見て、ロシア人で現在のロシア連邦大統領であるウラジミールプーチンと呼ばれる人物に関連すると判断するかもしれない。
他の例には、疾患および薬物の名称、組織、会話の話題、言及された製品、コメントが肯定的であるか否定的であるかなどが含まれる。
<! - 9 - >これはすべてエンティティ抽出(999)の例です(これは、テキストの名前からオブジェクトのタイプを自動的に抽出するプロセスです) 。 重要な用語を識別することによって、それらをタグ付けするか、XML要素でラップすることができ、コンテンツをより効果的に検索するのに役立ちます。エンティティエンリッチメントとは、それを特定することに加えて、元のテキストに基づいて情報を追加することを意味する。プーチン氏の例では、プーチン大統領にプレーンテキストの「プーチン」を転用することができます。また、「ロンドン」をロンドンに変えることもできます。 <! - 3 - > このデータをユーザーインターフェイスに強調表示されたテキストとして表示し、各件名に関する詳細情報を表示することができます。
フリーテキスト検索、アラート、データベーストリガー、およびTEMIS LuxidやSmartLogicなどの外部ソフトウェアへの統合を使用して豊富化を提供できます。
検索とアラート情報を保存したら、検索したいことがあります。フリーテキスト検索は簡単ですが、エンティティ抽出を実行した後、さらに多くのオプションがあります。 「オレンジ」という名前の人物(オレンジ色のウィリアムのように)を検索するのではなく、オレンジ色の検索レコードではなく、もちろん色と果物です。
これを行うと、より詳細な検索が行われます。また、ファセットナビゲーションも可能です。 Amazonに行き、Harry Potterを検索すると、書籍、映画、ゲームなどのカテゴリが表示されます。
製品カテゴリ
は、検索結果内のデータの側面、つまりすべての検索結果の各面の最も一般的な値を示す
ファセット の例です現在のページにないもの ユーザーインターフェースは、豊富なデータの探索(基本的なGoogleのエスクサーチ)をサポートすることができます。ユーザーは、それらを利用して以前の検索結果を保存して読み込むこともできます。 新しく追加されたレコードがその条件と一致したときに警告がアクティブになるように、保存された検索条件を設定できます。したがって、新しいレコードが検索条件に一致すると、アクションが発生します。おそらく「プーチン」がプーチンになるかもしれない すべての検索エンジンがすべての検索語をアラートにするわけではありません。テキストフィールドに限られているものもあれば、他の人は地理空間基準を行うことができません。設定が必要なアラートを処理できることを確認してください。
集計関数
関連する情報を見つけたら、もっと深く掘り下げたいと思うかもしれません。出所によっては、GDPが4,000億ドルを超える国や、家族の全員の平均年齢はどれくらいか、オーストラリアではヘビの咬傷が最も多い国をいくつか質問するかもしれません。これらの例は、一連の検索結果に対して分析がどのように実行されるかを示しています。これらは、それぞれカウント、平均平均、および地理空間ヒートマップの計算です。そのような計算をデータの隣に置くことができることは、いくつかの利点をもたらす。最初の利点は、索引を使用して物事をスピードアップできることです。第2に、これらの索引はメモリー内にキャッシュされる可能性が高くなり、索引がさらに高速になります。第3に、メモリインデックスでは、Hadoop File System(HDFS)ストレージを使用するNoSQLデータベースで特に役立ちます。 HDFSは、高速アグリゲーション計算のためにネイティブのインデックス作成またはインメモリのカラムストアを実行しません。これを実行するには、NoSQLデータベースが必要です。
ファセットナビゲーションは、ユーザーインターフェイスに表示される検索結果に対するカウントベースの集計の例です。同じことが、特定の時点を示すレコードの数を示すタイムラインにも当てはまります。たとえば、今年、今月、または今年の結果を表示しますか?
この機能を使用する場合は、データベースの集計をデータの横に効率的に計算できることを確認してください。ほとんどのNoSQLデータベースは機能しますが、一部のデータベースは機能しません。
チャート作成およびビジネスインテリジェンス
次に明らかになるユーザーインターフェイス拡張には、ライブ管理情報および履歴ビジネスインテリジェンス分析のためのテーブルサマリーのチャート化および表示が含まれます。
NoSQLデータベースのほとんどは、データベースに統合しやすいREST APIを提供します。つまり、さまざまなアプリケーション層を接続したり、JavaScriptアプリケーションをこれらのデータベースに直接接続することもできます。 JavaScriptにはさまざまな優れたチャートライブラリが用意されています。適切なデータベースコネクタをインストールした後で、Rエコシステムを使用してこれらのデータベースに保持されているデータに基づくチャートを作成することもできます。
NoSQLデータベースの中には、ODBCまたはJDBCリレーショナルデータベースプラグインを提供するものもあります。特定のレコード内のインデックスを作成し、それらを関連するビューとして表示することは、NoSQLドキュメントデータベースの非構造化データをビジネスインテリジェンスツールで分析できるデータに変換するうえで便利です。