目次:
- ビッグデータに対する感受性
- 大規模データ用Clarabridge
- 大規模データのIBM
- 大規模データ用のOpenText
- たとえば、SAS High Performance Analytics Serverは、集約データのサブセットだけでなく、完全なデータを使用して分析モデルを開発できるインメモリソリューションです。 SASは、この分析の一環として、何千もの変数と何百万ものドキュメントを使用できると述べています。このソリューションは、Hadoop Distributed File System(HDFS)を使用する汎用ハードウェアだけでなく、EMC GreenplumまたはTeradataアプライアンス上でも動作します。
ビデオ: 『計量テキスト分析のすすめ』河野 武司 2024
ここでは、テキスト分析のビッグデータ市場におけるいくつかのプレイヤーの概要を示します。いくつかは小さく、他は家庭用の名前です。 ビッグデータテキスト分析 、 などと呼ばれるものもあれば、 テキスト分析と呼ばれるものもあります。
ビッグデータに対する感受性
アトムスは、10年以上前に製品の開発と販売を開始した元のテキスト分析会社の1つです。現時点では、150を超える企業顧客と、世界最大のNLP開発グループの1つです。 Attensityは、テキスト分析のためのいくつかのエンジンを提供します。自動分類、エンティティ抽出、完全抽出などがあります。 Exhaustive Extractionは、解析されたテキストから事実を自動的に抽出し、この情報を整理するAttensityの主力技術です。
<! - 1 - >同社は、社内および社外の情報源からの報告のためにテキストを分析し、ビジネスユーザーに関与させるためにルーティングすることにより、ソーシャルおよびマルチチャネルの分析と関与に重点を置いています。ソーシャルメディアの大規模なストリームを集約したソーシャルメディア会社、Biz360を購入しました。大量のリアルタイムテキストを処理するための高性能機能を提供するグリッドコンピューティングシステムを開発しました。
<! - 2 - >Attensityは、Hadoopフレームワークを使用してデータを格納します。また、インバウンドデータのスパイクを認識し、必要に応じてより多くの/より少ないサーバー間で処理を調整するオーケストレーションプロセスを作成するデータキューイングシステムも備えています。
大規模データ用Clarabridge
もう一つの純粋なテキスト分析ベンダーであるClarabridgeは、実際には、非構造化データを処理する必要性を認識したビジネスインテリジェンス(BI)コンサルティング会社(Claraview)のスピンオフです。その目標は、顧客を全体的に見て、重要な経験と課題を特定し、組織内の全員が行動をとり、リアルタイムでコラボレーションすることで、企業が測定可能なビジネス価値を高めるのを支援することです。
<! - 3 - >これには、お客様のフィードバックデータ/テキストのセンチメントおよび分類のリアルタイム決定、およびClarabridgeシステムへの将来の処理のための逐語的なステージングが含まれます。
クララブリッジは、現時点では、シングルクリックの根本原因分析を含むテキスト処理、センチメント、または新たな問題に関連する満足度の変化を特定するなど、洗練された面白い機能を顧客に提供しています。また、SaaS(Software as a Service)としてのソリューションも提供しています。
大規模データのIBM
ソフトウェア大手IBMは、Smarter Planet戦略の下で、テキスト分析分野でいくつかのソリューションを提供しています。WatsonとIBM SPSSのほかに、IBMはエンタープライズ・サーチによるIBM Content Analyticsも提供しています。 IBM Content Analyticsは、IBM Researchでの作業に基づいて開発されました。
IBM Content Analyticsはコンテンツを分析情報に変換するために使用され、BIツールセットで構造化データを分析する方法と同様の詳細分析に利用できます。 IBM Content Analyticsとエンタープライズ・サーチは、以前は2つの別個の製品でした。
統合ソリューションは、テキスト分析を使用するエンタープライズ検索の強化と、スタンドアロンのコンテンツ分析ニーズの両方を対象としています。 ICAESはIBM InfoSphere BigInsightsプラットフォームと緊密に統合されており、非常に大規模な検索およびコンテンツ分析の収集が可能です。
大規模データ用のOpenText
カナダの企業であるOpenTextは、エンタープライズ情報管理ソリューションにおけるリーダーシップで最もよく知られています。そのビジョンは、企業の構造化されていないデータから価値を管理し、確保し、価値を引き出すことに重点を置いています。意味論的ミドルウェアという用語を提供します。同社によれば、そのセマンティック技術の進化は、言語、フォーマット、および業界のドメイン間で大規模なデータセットに対してリアルタイムの解析を高精度で可能にする機能に根ざしています。セマンティックミドルウェアの背後にあるアイデアは、セマンティクスが異なるレベルで公開され、ビジネス上の問題に対処するためにさまざまなテクノロジで動作するということです。つまり、必要に応じてテキスト分析を有効にして利用することができます。
SAS for big data
SASは、長い間複雑な大規模データの問題を解決してきました。数年前、テキスト分析ベンダーTeragramを買収し、分析で構造化データと非構造化データの両方を使用し、このデータを記述的モデルと予測モデルに統合する戦略を強化しました。現在、テキスト分析機能は、全体的な分析プラットフォームの一部であり、テキストデータは単に別のデータソースと見なされます。 SASは、パフォーマンスが顧客の期待を満たすことを保証するために、高性能分析の分野で革新を続けています。目標は数日で解決して解決するために数週間かかっていた問題や、代わりに数分で問題を解決して解決することでした。