BIにおける各種用語をまとめたBI用語集のページです。
アルファベット
(英:Business Intelligence)
(読み方:ビジネスインテリジェンス)
(別名:Business Intelligence Development Studio)
BIDSとは、Microsoft SQL Serverに付属するツールである(一部エディションを除く)。
Microsoftの統合開発環境であるMicrosoft Visual Studioに、SQL Serverのビジネスインテリジェンス機能固有のプロジェクトを追加したものである。SSAS、SSIS、SSRSといったプロジェクトを作成でき、これらのビジネスソリューションを開発する上での主要な環境となる。
(英:BI Analyst)
(別名:データアナリスト)
BIアナリストとは、「モダンアナリスト・ドット・コム (modernanalyst.com) 」にも記載されているように、以下の事項に責任を持つ専門技術者である。
- 企業のデータ分析やマイニングを行い傾向や相互関連性を特定する。
- 問題解決のために複数のシステム間のデータ追跡とデータマッピングを担当する。
- BIシステムとデータディスカバリーツールを用いて、経営層の意思決定を支援する。
- 業務データの統計分析を行う。
- その他
(英:Business Intelligence Tools)
(読み方:ビジネス・インテリジェンス・ツール)
(英:BI Governance)
BIの統治(ガバナンス)とは、「フォレスターリサーチ」のボリス・エヴェルソン氏 (Boris Evelson) によると、BIのガバナンスはデータガバナンスの重要な一部である。特にBIシステムに焦点をあてて、特定のデータを使用するユーザーが誰で、いつ、どのようにそのデータを使用するかについて、規則や制度を形成し再構成をしていくことをいう。
(別名:BIDS)
Business Intelligence Development Studioとは、Microsoft SQL Serverに付属するツールである(一部エディションを除く)。
Microsoftの統合開発環境であるMicrosoft Visual Studioに、SQL Serverのビジネスインテリジェンス機能固有のプロジェクトを追加したものである。SSAS、SSIS、SSRSといったプロジェクトを作成でき、これらのビジネスソリューションを開発する上での主要な環境となる。
(英:Customer Relationship Management)
(読み方:カスタマー・リレーションシップ・マネジメント)
(別名:顧客関係管理)
CRMとは、企業が顧客と長期的かつ良好な関係を構築する手法、戦略のことである。BIなど、各種の情報システムを組み合わせて実現される。
(英:Data Analysis eXpressions)
DAXとは、数式言語の一種である。PowerPivotテーブルの計算列におけるカスタム計算の定義に使用できる。Excelの数式言語の拡張版として扱われており、Excelの関数も数多くサポートしている。本来であれば、リレーショナルデータベーススキーマやOLAPの概念に関する高度な知識が必要となる集計を、簡単に行うことができる。
(英:Data WareHouse)
(読み方:データウェアハウス)
DWHとは、社内の複数のデータソースからデータを統合するリレーショナル・データベース。データを有効に活用できるように最適化を行い、一元的に管理する。
近年は、BIシステムの一部として構成されることが多い。
(英:Extract, Transform, Load)
(別名:ステージング処理)
ETLとは、Extract(抽出)、Transform(変換)、Load(書出し)の略で、ステージング処理の別名である。企業内の、蓄積されたさまざまなデータソースからデータを抽出し、利用しやすい形式に変換して、DWH(データウェアハウス)に書き出す仕組みのことである。DWH(データウェアハウス)と共に、BIシステムの一部として構成されることが多い。
代表的なETLツールとして、SSISが知られる。
(別名:Microsoft Excel)
Excelとは、Microsoft社の表計算ソフトである。複雑な計算式やグラフの作成、さらにはデータベースの作成など、様々なデータの集計や分析を行なうことができる。このため、BIにおいて利用される機会も多い。クロス集計用機能「ピボットテーブル」は、SSASのキューブを表示・分析するためのインターフェースとしても使用される。また、Excel 2010から、セルフサービスBI機能を実現するためのアドイン・PowerPivotを利用できるようになった。
BIツールには、ビュー(分析画面)をExcelファイルとして出力したり、Excel上でビューの表示・操作が出来る等、Excelをインターフェースとして活用できるものもある。
現在は、上記に加え、Excelファイルや、Excelファイル内のPowerPivotキューブを、OLAPサーバのキューブと同様に分析出来る機能も備えた(=Excelデータを分析対象として有効活用できる)製品も登場している (Panorama NovaView®) 。
(英:Hybrid OnLine Analytical Processing)
HOLAPとは、OLAPによるデータの分析の方法である。MOLAPとROLAPの中間的位置づけとなる。リレーショナルデータベースに格納されたデータから求めた集計値を、多次元データベース(キューブ)に格納している形態である。多次元データベースにある集計値で要求を解決できる場合は、MOLAPと同等のレスポンスを発揮できる(解決できない場合は、リレーショナルデータベースへの問い合わせにより結果を求める)。一方で、多次元データベースでは、MOLAPほどの大量データ保持は必要とされない。
(英:Key Performance Indicator)
(別名:重要業績評価指標、主要業績評価指標)
KPIとは、設定した業務目標や戦略的目標をどの程度達成しているかを判断するために企業が活用する、定量化できる指標。KPIによって管理職はどんな時でも、業務上何が起きているかという洞察を得ることができ、事態がどちらの方向に向かっているかを理解する手立てになる。BIシステムでは、多くの場合、分析ニーズに応じた各種KPIを表示する機能が実装される。
(英:Multi Dimensional eXpressions)
MDXとは、多次元データベース(キューブ)からデータを取り出すために使用されるクエリ言語である。OLAPデータベースにおいて、事実上の標準として用いられている。
Necto™の開発元であるPanorama Software社は、従来から高いOLAP技術を有しており、MDXの開発元としても知られている。よって、Necto™には、MDXクエリの最適化が標準装備されている。
(英:Multi dimensional OnLine Analytical Processing)
MOLAPとは、OLAPによるデータの分析の方法である。データベースに格納されたデータから、あらかじめ集計値をバッチ処理で計算し、多次元データベース(キューブ)として格納しておく。ユーザーの操作要求に応じて、その多次元データベースから集計済データを取りだし、参照・利用する。
ROLAPと異なり、集計値を多次元データベースとして格納するためのバッチ処理が必要である。ROLAPと比べての利点としては、ユーザー操作に対するレスポンスが圧倒的に早い事や、複雑な多次元モデルに対応しやすい事が挙げられる。ROLAPと比べての欠点としては、多次元データベースという、従来からのリレーショナルデータベースとは異なる知識が必要となることや、多次元データベースのメーカー間の互換性が無い事が挙げられる。また、データベース内のデータを、直接検索・集計するわけではないので、データのリアルタイム性では劣る。その他、分析内容によっては、多次元データベースに大量の集計値データが作られることにも留意する必要がある。
(英:OnLine Analytical Processing)
(読み方:オンライン・アナリティカル・プロセシング)
(別名:オンライン分析処理、多次元分析)
OLAPとは、データベースからデータを取り出し、多次元的な分析を行う処理のことである。Panorama Softwareが開発し、1996年にMicrosoft社に売却したデータディスカバリ技術。高度な分析を行う、「what if」シナリオを計画する、帳票を無制限に表示する機能など多くの機能がある。BIにおける代表的な分析手法である。リレーショナル・データベースを利用したROLAPと、多次元データベース(キューブ)を利用したMOLAPに大別される。両者の中間的立場であるHOLAPもある。キューブ(ROLAPで生成される、擬似的な多次元データベースも含む)に対して、ドリリング、スライシング、ダイシングといった方法で操作し、分析を行う。代表的なOLAPサーバとして、SSASが知られる(なお、SSASは、ROLAP・MOLAP・HOLAPの中から任意の動作モードを選択する事が出来る)。
BIシステムは、専ら、こうしたOLAPサーバに、BIツール(Panorama NovaView®など)を組み合わせ、ユーザーのニーズに合わせたインターフェースや機能を追加する形で構築される。
(別名:PowerPivot for Microsoft Excel)
PowerPivotとは、Excel 2010 及び、SharePoint Server 2010 用のアドイン機能である。これまでSSAS (SQL Server Analysis Services) のようなOLAPサーバ上にしか作成できなかった多次元データベース(キューブ)を、Excelブック上に作成できる。セルフサービスBIを実現するためのツールとして位置づけられている。
BIツールには、PowerPivotキューブを、OLAPサーバのキューブと同様に分析・共有出来る製品も登場している (Panorama NovaView®) 。
(英:Relational OnLine Analytical Processing)
ROLAPとは、OLAPによるデータの分析の方法である。ユーザーの操作要求に応じて、リレーショナルデータベースに格納されたデータを直接検索・集計し、その結果を擬似的な多次元データベース(キューブ)として参照・利用する。MOLAPと異なり、集計値を多次元データベースとしてあらかじめ格納しないので、そのためのバッチ処理は不要である。MOLAPと比べての利点としては、従来からあるリレーショナルデータベース技術を用いるため、メーカー間の互換性の問題が少なく、また技術的に比較的理解が容易であることが挙げられる。また、データベース内のデータを、そのときの要求に応じて直接検索・集計するため、リアルタイムなデータを分析できる。MOLAPと比べての欠点としては、ユーザー操作に対するレスポンスが大きく劣ることが挙げられる。また、従来からのリレーショナルデータベース技術が基盤となっているため、複雑な多次元モデルに対応しづらく、MOLAPには無い制約や、それを解決するための設計(データ補完など)について考慮しないといけない場合がある。
(別名:Microsoft SharePoint)
SharePointとは、Webブラウザをベースとしたコラボレーション(グループウェア)やドキュメントの管理を行うサーバアプリケーションである。または、上記のプラットフォームを構築するアプリケーションソフト群の総称。共有されたワークスペースやドキュメントに対してWebブラウザからアクセスできるほか、Wikiやブログ等も構築できる。SharePoint 2010から、PowerPivot共有のための機能が追加された。
BIツールには、SharePointページ内に自身の分析機能を統合できる等、SharePointとの連携機能を持った製品も存在する (Panorama NovaView®) 。
(英:Standardized Query Language)
SQLとは、標準化されたデータベース照会言語 (Standardized Query Language) の略。リレーショナルデータベースの管理を行い、データの操作を行うためのプログラミングに使用される言語である。
(英:Microsoft SQL Server)
(別名:MS SQL)
(別名:SSAS)
SQL Server Analysis Servicesとは、Microsoft SQL Serverに付属するソフトウェアである(一部エディションを除く)。ビジネスインテリジェンス アプリケーション用のオンライン分析処理 (OLAP) 機能とデータマイニング機能を持つ。代表的なOLAPサーバとして知られる。OLAP機能では、ROLAP・MOLAP・HOLAPの中から任意の動作モードを選択可能で、それに合わせた多次元データベース(キューブ)を作成・管理する。
(別名:SSIS)
SQL Server Integration Servicesとは、Microsoft SQL Serverに付属するソフトウェアである(一部エディションを除く)。エンタープライズ レベルのデータ統合、およびデータ変換ソリューションを構築するためのツール。データの抽出、変換及び読込処理を行なえる。代表的ETLツールのひとつとして知られる。
(別名:SSRS)
SQL Server Reporting Servicesとは、Microsoft SQL Serverに付属するソフトウェアである(一部エディションを除く)。レポートの開発・発行・管理といった、レポートに関する一通りの機能がある。組織的なレポートの作成、配置、管理に役立てることのできるツール。
50音順
(英:Infographics)
インフォグラフィックとは、データの視覚化表現を実現するものであり、簡単に理解でき、業務の遂行を促進するようにしたもの。
(英:in-memory OLAP)
インメモリOLAPとは、Microsoftが開発した、インメモリによるOLAP分析テクノロジーの別名である。PowerPivotが使用するインメモリ計算エンジン「Vertipaq」を指すこともある。すべての集計・計算をメモリ内で実行することにより、従来の多次元データベース(キューブ)よりはるかに高速なレスポンスを実現する。
(英:Embedded Analytics)
埋め込みアナリティクスとは、BIソリューションに帳票作成とデータ分析の機能を統合したもの。ユーザーはBIプラットフォームを終了する必要がなく、データ分析の機能をフルに活用できる。
(英:Excel Hell)
エクセル地獄とは、企業内で不必要なデータのコピーが膨大に作成され、膨大な数のエクセルファイルが共有され、最新のデータシート、正しいデータのバージョンのファイルがどれなのか、まったくわからなくなった状況。
(英:hierarchy)
(英:cube)
(別名:多次元データベース)
キューブとは、OLAPで操作対象となる多次元データベースの事である。DWH(データウェアハウス)から取り出したデータをもとに、OLAPサーバ(SSASなど)上に作成されるデータマートである。
基本的に、MOLAPで作成される多次元データベースの事を指すが、ROLAPでリレーショナルデータベースへの問い合わせ結果として生成される擬似的な多次元データベースのことも指す。
複数のディメンション(分析の切り口)とメジャー(集計対象となる値)のセットとして定義される。ディメンションの組み合わせや、ディメンション内の階層を変えることで、データ内の関係性や変化などを直感的に理解することが出来る。
多くの場合、ユーザーはBIツールによってキューブを操作・参照する。なお、多次元データベースのデータの格納単位を表す言葉として「キューブ」が使われることもある。
Necto™ではMicrosoft SSASのキューブに直接接続することが可能です。
(英:Collaborative BI)
(英:Modern BI)
(英:State of the Art BI)
最先端のBIとは、もっとも高度な技術と最新の機能を搭載し、あらゆるBIソリューションのなかで最も優れた分析機能を提供する。
(英:Automated Analysis)
自動分析とは、データを自動で分析し、データの中に内在する隠された洞察を発見し、ユーザーが考えつかなかったような課題に対して回答を提示する機能。
(英:Aggregation)
(英:Collective Knowledge)
集合知とは、企業全体に有益となる知識。グループや部門を横断して洞察やデータによる知見を共有することでもたらされる知識であり、分析の質を高める。
(英:Bottlenecks)
障害とは、BIシステムの効率を妨げる、データの流れが詰まっている箇所、または障害箇所。
(英:Suggestive Discovery Engine)
推奨型ディスカバリエンジンとは、プログラムに採用されているエンジンで、個人の嗜好や行動に基づいてユーザーが注目すべきもっとも適切な洞察を推奨する。
(英:Scalability)
スケーラビリティーとは、時間の経過とともにBIソリューションを使用するユーザー数の増加に対応できる機能。
(英:snowflake schema)
(英:Smart Data)
スマートデータとは、ビッグデータから得られた企業にとって有益なデータセットであり、それに基づいて行動することができる有用なデータに変えることが可能である。
(英:Smart Data Discovery)
(英:slicer)
(英:slicing)
(別名:スライス)
(英:self service BI)
セルフサービスBIとは、Microsoftが提唱する、BIの形態である。ExcelのアドインであるPowerPivotを使うことにより、データベース(OLAPサーバ)上ではなく、Excelブック上に多次元データベース(キューブ)を作り、分析に使用する。従来のBIでは不可避だった、システム部門の各種負担や、分析担当者の意図したキューブが作られない事態を解消する。大幅なコスト削減、分析の費用対効果向上を見込める。
システムアナリストとしての経験やコンピュータサイエンスの知識を持たない業務ユーザーが、データソースにアクセスして分析を実行できるBIシステム。ユーザーはBIプラットフォーム上で、データにアクセスし、データのプロファイル(統計情報)を取得し、対象データの作成を準備し、統合し、データのキュレーション(収集・評価・整理)を行い、データの内容や品質を向上させることができる。セルフサービスBIを成功させるには、BIツールは集中管理型のBIである必要があり、かつIT担当者がそれを監督しなければならない。
(英:Centralized Business Intelligence)
全社集中管理型ビジネスインテリジェンスとは、BIシステムの類型の一つである。多くの社内ユーザーが単一の同じ真実(シングルバージョンオブトゥルース)に基づいて、連携して洞察を共有することが保障されている。IT部門はデータへのアクセス認証を管理してデータセキュリティを確実に実施する。
(英:Social BI)
(英:Social Enterprise)
ソーシャルエンタープライズとは、企業の中で全く新しいレベルの人と人との結びつきを提供する企業を言う。情報や考えを共有し、共同作業を行うことができるソーシャルグリッドを積極的に活用する。売上に影響が出る前に問題を明らかにして解決することができ、より効率よく業務を推進できる。
(英:Dark Data)
ダークデータ(出典:ガートナー)とは、「特定の情報資産のことであり、企業が通常の事業活動の過程で収集、処理、保存するが、ほとんどの場合、他の目的に有効活用されていないものをさす。」と定義される。企業が保有するデータのうち90%がダークデータであるとされる。
(英:dicing)
(別名:ダイス)
ダイシングとは、OLAPにおける多次元分析の方法の1つである。キューブの集計軸(ディメンション)を入れ替えて、異なるさまざまな表を表示する操作のこと。
ダイシングの操作に関しては、こちらの説明をご覧ください。
(英:Dashboard)
(英:Geo-analytic capabilities)
(英:dimension table)
(英:Data Analyst)
データアナリストとは、「モダンアナリスト・ドット・コム (modernanalyst.com) 」にも記載されているように、以下の事項に責任を持つ専門技術者である。
- 企業のデータ分析やマイニングを行い傾向や相互関連性を特定する。
- 問題解決のために複数のシステム間のデータ追跡とデータマッピングを担当する。
- BIシステムとデータディスカバリーツールを用いて、経営層の意思決定を支援する。
- 業務データの統計分析を行う。
- その他
(英:Data Analytics)
データアナリティクスとは、IT情報サイトの「テックターゲット (TechTarget) 」によると「データアナリティクスとは、データセットを分析調査するプロセスのことで、データが含有する情報からの推論により意志決定のための結論を得ることを目的とする。近年ますますこの目的に特化したシステム、ソフトウェアの活用が増えている。」
(英:Data WareHouse)
(別名:DWH)
データウェアハウスとは、社内の複数のデータソースからデータを統合するリレーショナル・データベース。データを有効に活用できるように最適化を行い、一元的に管理する。
近年は、BIシステムの一部として構成されることが多い。
(英:Data Silos)
データサイロとは、「テックターゲット (TechTarget) 」によると、「企業内の1つの部署や人の管理下にあって、ほかの部署からは隔絶されているデータ」のことである。データサイロは効果的な業務運営の妨げ(ボトルネック)となっている。
(英:Data Sources)
データソースとは、分析するべき対象となるデータを入手したオリジナルなデータ形態のことである。データソースはファイル、データベース、データセットなどの場合がある。Necto™のような最新のBIソリューションは複数のデータソースからデータをマッシュアップすることが可能。
(英:Data Visualization)
データの視覚化表示とは、データを視覚的に表現すること。従来からの視覚化表示の形態であるグラフ、図表に加えて最新のインフォグラフィックなどのツールがある。
(英:Data Governance)
データの統治(ガバナンス)とは、「フォレスターリサーチ」のボリス・エヴェルソン氏 (Boris Evelson) によると、企業のデータ資産を管理し統治する、人、プロセス、指針、技術などについて、そのすべての範囲(生成、変換、管理責任(者)、など)を包括的に取り扱うことを指す。(例えば、データガバナンスの管理責任の適用、マスターデータ管理、メタデータ管理、データの品質など)
(英:data mart)
データマートとは、データウェアハウスから、部門や個人の使用目的に合わせて、特定のデータを切り出して整理し直し、別のデータベースに格納した部分集合である。BIにおける多次元データベース(キューブ)も、データマートの一種と言える。
(英:Data Mining)
(英:Data Mashup)
データマッシュアップとは、複数のデータセットを、分析しやすく、視覚的にわかりやすい表現に一体化して統合すること。
(英:Insights)
洞察(出典:フォレスター・リサーチ (Forrester Research) )とは、「業務プロセスや意思決定の枠組みにおいて、すぐに利用できる知識」である。
(英:Systems of Insight)
洞察のシステムとは、「フォレスターリサーチ」の副社長ボリス・エヴェルソン (Boris Evelson) が作った用語。データの入手しやすさと、業務のスピーディな実行を組み合わせて可能とするBIシステムで、このシステムではIT担当者と業務ユーザーの両者が協力して分析作業を行って目的を達成することができる。
(英:drilling)
(英:drill up)
(英:drill down)
(英:Business Intelligence)
(別名:BI)
(英:Big Data)
ビッグデータとは、従来のデータ処理ツールでは処理不可能な膨大で複雑なデータセット。
(英:View)
ビューとは、データベースにおける仮想的なテーブルのことである。BIツールにおける、分析画面を指す言葉としても使われる。
(英:fact table)
(英:Federated Business Intelligence)
分散型ビジネスインテリジェンスとは、多くのユーザーがそれぞれ別々のデスクトップ機で分析作業を行うBI活用モデル。データサイロや不必要なデータのコピーが生成され、複数のバージョンの真実が作られる(シングルバージョンオブトゥルースが確保できない)ことにつながる。
(英:measure)
(英:relational database)
(別名:関係データベース、RDB)
リレーショナルデータベースとは、データベースの形式の一つで、データ同士を関連付けて扱うデータベースのことである。
(英:relationship)