Power BIでデータ解析を視覚化する 基礎編
自分自身はデータ解析のアプリケーションを過去にもいくつか作ったことがありますが、グラフであったりパラメータでデータを操作するといった部分については、Excel・Accessや視覚化するライブラリに任せて、データの生成や整備のほうに重きを置いています。
故にあまりBI系ツールというのは使わないのですが、データの整備や解析に十分な知識の無い現場のユーザが主に使う事が多いと思いますが、今回ツールを使う機会があったので調べてみました。今回は、Microsoft365のPower BIについて詳細に調査してみました。
目次
今回使用するアプリや資料
- Power BI Desktop
- 厚労省人口動態統計10年分データ - Excelファイル
- 人口動態統計 - Power BI用ファイル
Tableauとは違い、Power BI Desktopツールは基本的に無償で利用が可能です。有償プランに切り替える事でより高度な機能を使えるようになる仕組みになっているため、Tableauのように高価な支出を伴って検証ではなく、十分納得した上で十分な時間を利用して検証を行うことが可能です。
他の製品との比較
製品としての比較
BIツールというのはそれそのものの歴史はまだまだ始まったばかりですが、BIそのものは実際のところ、昔から企業では当たり前のように行われてきた事です。Excelデータとグラフ化で十分BIツールといえますし、オンライン上で視覚化ライブラリを使っていつでも最新の情報にアクセス出来るのも、BIです。しかし、Excelでは「そのファイルを開く」必要があり利便性が低い、また、大規模データを扱うにはExcelでは荷が重すぎる。
そこで使う事になるのが専用のBIツールとなるわけです。逆を言えばExcelの延長線程度の使い方しかしていないのであれば、BIツールはそもそも必要ないでしょう。また、これは業務改善ツールではないので、使い手側に相応のデータ解析能力を求められます。ミスリードしたデータでいくら有用性を伝えても、意味がありません。
今回は、Power BIとTableauとで両者を比較してみます。
項目名 | Power BI | Tableau |
無償版 | 有り | 無し(14日間の体験版のみ) |
コスト(ユーザ当たり) | Pro版:1,090円/月 (M365 E5に含まれてる)
Premium版:2,170円/月~ |
Creator版:102,000円/年(月当たり8,500円)
※ExplorerとViewerがあるが作成はできない |
対応OS | Windows / iOS / Android | Windows / macOS / iOS / Android |
オンライン版 | 有り(編集も可能) | 有り(但し、データの編集は不可能) |
学習コスト | 中(Power Queryも使える) | 高(独自UIであるため) |
アカウント管理 | ADで一元管理が可能 | 別途必要 |
ファイル共有 | 可能(無償版でも可能) | 可能(有償版で可能になる) |
Desktopツール | 有り(無償版でも利用可能) | 有り(有償版で可能になる) |
Teams連携 | 可能 | 不可能 |
サーバディスク容量 | 1GB~(上限10GB)・Premiumで最大50GB | 100GB |
データ同期回数 | 8回 / 日 ・Premiumで48回/日 | 1時間毎 |
処理速度 | 遅い | 早い |
API連携 | 可能 | 可能 |
機能面での充実度はTableauではあるものの
- Power BIはAPIを使っての操作は、既存のMicrosoft365アカウントで可能であるため、サードのプログラムが作成しやすい。
- 一方TableauもREST APIがあるものの、高価で裾野が狭いが故にほとんど、ウェブ上には知見もない上に、Microsoft365との連携にはハードルが高い。
- 膨大なデータ量とそれをさばく処理速度面で不満(ビッグデータの扱い)というレベルに至ってはじめて、Tableauは利用価値がある
- 中小規模で、尚且十分なスキルもないのに、Tableauに手を出すのは甚だ疑問。
- 知見の裾野の広さは、学習コストで跳ね返ってくる。
- メモリ消費が非常に激しい(Power BIは最低ラインが16GBとも言われてる)
Google Trendsの動向
- 先発のTableauであるが、グラフを見てもわかるように、すでにそのトレンドは平行線か下降気味。
- 一方、Power BIは少しずつトレンドで上昇しつつある
- 10倍近いコスト差は、やはり堪えたというのがこの単純なトレンドからも伺える
- 米国内であっても同様の動きです。
BIツールを導入する上での注意点
導入失敗事例
以下のようなケースに該当する場合には、BIツールの導入効果は見込めないと思います。そもそも誰でも手軽にBI出来るというだけで、解析や分析は人間の仕事です。
- Excelで出来てる程度の延長線でしかない(母数の少ないデータでただ視覚化してるだけ)
- ユーザにデータサイエンスの基礎知識や技能が無い
- 統計の罠に嵌って、誤った経営判断を下してしまう
- BIツールの投資コスト(ROI)に見合うリターンが無い(検証もされていない)
- 利用目的が漠然としていて、分析範囲も非常に狭い領域だけで行ってる
- データベース(SQLやリレーションシップ)やデータの整理に関するITリテラシーが不足している
結局はグラフ製造機としてしか利用されず、異動や退職で主担当者が消えた後は、漫然と使ってるだけで広がりもせず、企業にとってただのコスト源になってる(つまり、継続してきちんと使い倒し維持する体制が無い)という、典型的な導入が目的になってしまってるケースが散見されてたり。
統計解析で求められるスキル
経理ソフトで簿記のスキルを求められるの同じように、BIツールを使うには相応のスキルが求められます。ただ単純に視覚化されたものを見て、分かった気になってるのが一番危うい状態です。統計データというものは、自分にとって都合の良いように解釈し理由を付けて、いくらでも正当化は可能です。しかしそれはただの統計のマジックでしかなく、自分自身を騙した所で何も良い事はありません。
主として必要とされるスキルは以下になると思います。
- 最低でもSQLやそのデータ生成に必要なデータの整形・ノイズ除去などのITスキル
- 統計の罠に嵌まらないだけの経験とデータサイエンスのスキル、論理的思考、客観性
- 現場の業務と密接に結びついたフローとしてデータ解析を組み込める能力
- データの対象に対する深い見識(会計学、経営学、マーケティング等々)
- データの事前整備に於いて、最低限総務省のデータ表記方法の統一ルール程度は遵守して日々メンテが行えるかどうか?
ただ、文化系な人に取って最大の壁なのが、2つ目の要素である「論理的思考能力」。ほぼこれを鍛えるシーンが文化系には存在しないのと、ITスキルの高さとイコールではないので、多くの人は挫折することになる。
Desktop版を使ってみる
早速、Power BI Desktop for Windowsをダウンロードしてインストールしてみて、使ってみようと思います。インストール自体は対して難しいものでもないので、ここでは省略いたします(使用するOSのBit数にだけ気をつけましょう)。インストールしたら早速機動してみましょう。
図:サンプルデータを表示してみた様子
利用できるデータソース
データソースの制限事項
数点制限事項があり、これらに抵触しないように事前にデータ整備をしておく必要があります。
- データセットのサイズは最大で1GB(Premium版で最大50GB)になります。
- 列数は最大16,000列までです。
- クエリ結果は最大100万レコードまで。元のデータが100万レコード以上でも問題はない。
- 1列に格納できる固有の値の最大値は1,999,999,997まで。
ローカルデータ接続
基本中の基本である「ファイル」に接続して取り込み、BIを実行するスタイルになります。主に使うであろう・対応しているファイル形式は以下の通りです。
- Excelワークシート - xlsmも対応している
- テキストデータ - XMLやCSV、JSON形式に対応している
- Accessデータベース - クエリなども使えるので最もオススメ
その他のファイルに対しては、ODBCでも接続が可能なので、例えばSQLite3などにもODBCドライバで予めDSN設定を作っておけば接続が可能です。OLE DBも利用可能になっていますので、接続文字列を構築できるならば、結構幅広いデータソースに対応が可能と言えます。
図:ファイルへの接続ではExcelがポピュラー
ウェブサービス接続
次に利用する機会が多いと言えるのは、インターネット上のウェブサービスへの接続でしょう。Power BIが接続に対応してる主に使うであろうサービスは以下の通り。
- SharePoint Onlineリスト
- Dynamics365
- Salesforce
- Googleアナリティクス
- Github
- Exchange Online
一般ユーザとして使う機会があるものとなると、Googleアナリティクスくらいになってしまいますが、情シスなどの部署でということであれば、利用するシーンは多いかもしれません。
図:日本じゃ知らないサービスが結構ある
サーバ接続
企業の実務に於いてはオンプレ・クラウド共にPower BIを使うシーンとしてポピュラーなのはサーバ接続。主にデータベースサーバになります。Power BIで対応してるものとしては主に以下のようなものが挙げられます。事前にレプリカの用意やアクセス権限の切り分けなどで苦労するかもしれません。
- Azure Database - PostgreSQLやCosmos, Power PlatformのDataverseなど
- SQL Server
- Oracle
- IBM DB2
- PostgreSQL
- MySQL・MariaDB
- SAP HANA
- Google BigQuery
ODBCドライバがあれば、このリストに無いデータベースサーバでも接続は可能です。事前にODBCデータベースアドミニストレータにてDSNを作っておく必要があります。気をつけたいのがこれらデータベースサーバがオンプレで外部からアクセス不可の場合、組織外からPower BIのソース更新ができないので、予めそのような用途の要望がある場合にはオンプレミスデータゲートウェイなどのセットアップと許可が必要(または、VPN接続環境など)
図:データベースはメジャー所は全対応
使ってみる
詳細な使い方に関しては、別のエントリーである「活用編」にて詳しく記述をしたいと思います。ここではお試しとして、もっともお手軽な「Excelデータに接続して解析」を行ってみたいと思います。解析する為の元データは厚生労働省の人口動態統計10年分をまとめたExcelデータを元に作ってみます。
データをインポートする
Excelファイルを選択しPower BIにデータを取り込みます。後日元のデータに追加や変更があった場合にはデータの更新が必要になりますが、ファイルへのパスは絶対パスになっているので、他人に渡した場合には更新が出来ない恐れもあるので注意が必要です。取り込む手順は以下の通り。
- Power BI Desktopを起動する
- リボンより「Excel」をクリックする
- データの入ってるExcelファイルを指定する
- ナビゲータが開かれるので、左サイドバーからシートを選び、読み込みをクリックする
- データを更新する場合には、リボンより「データの更新」をクリックする。この時ファイルは取り込み時と同じパスに存在する必要があります。
- 名前をつけて保存すると拡張子pbixというファイルにデータとグラフと共にセットになって保存されます。サンプルファイルはこちら。
図:ナビゲータからファイル取り込み中
レポートを作成する
データソースからのレポート作成は複数作り込むことが可能です。Excelのように画面下にある「ページ」という部分を増やしそれぞれに視覚化やデータの加工を施した結果を表示する事が可能です。作り方は以下の通り。今回は単純な推移のグラフを作ってみようと思います。
- Power BIの画面の右サイドバーにある「フィールド」にデータソースが表示されているので、開く
- 出生総数、死亡総数、年度の3つにチェックを入れる
- 軸に「年度」を指定し、値に「出生総数、死亡総数」を割り当てます
- 視覚化から、折れ線グラフをクリックします。サイズは適当にドラッグして調整します。
- ページに総数年度推移の名前をつけて完成
できればこれに、追加でテーブルを追加し、元にしたデータをデータテーブルとして表示すると尚良いでしょう。また、違った切り口で有用と思われるものを複数ページ追加する事で、レポート閲覧者により有用な情報として見せることが可能です。ラインの色や文字の大きさなどの書式、追加のラインとして平均値やら中央値などの補助線を加えると、分析の幅が広がります。
図:簡単な推移グラフを作れた
発行する
作成完了したデータは、ファイルであればファイルサーバやクラウドストレージ経由で他の人と共有が可能です。Pro版などの場合は、オンライン版のPower BI側にデータを送り込んで、ウェブ上で他人と共有する事が可能になっています。
発行機能はこのWeb版にデータセットを送り込んであげる機能です。送り込むには事前にMicrosoftアカウントへのログインが必要(Microsoft365のアカウントであって、フリーのアカウントはNG)になります。
- Power BIのリボンから「発行」をクリックする
- メアドの入力を求められるので、自身のMicrosoftアカウントのメアドを入力し続行をクリックする
- Power BIにサインインするでは、Power BIを選んでOKをクリック(中国の・・・は選ばない)
- 宛先を選択では、マイワークスペースを選択する(予め、オンライン版側で別のスペースを作ってる場合はそれを指定する)
- 成功したとメッセージが出たら完了
- Power BI Portalにログインして開いてみる
- マイワークスペースを開く
- 型がレポートになってるファイル名と同じ項目を開く
- アップしたデータとグラフが閲覧できるようになった
図:無事にウェブ版へ発行ができた
その他
オンライン版を使ってみる
Power BIはデスクトップ版だけでなく、オンライン版が存在します。基本的にはデスクトップ版で色々と資料を作成し、完成品をオンライン版にPushするのが使い方になります。しかし、Power BIのオンライン版はTableauと違い、ウェブ上で色々と編集作業も可能です(共有するにはPro版以上が必要になります)。オンラインなのでデバイスを気にせず使える点と、ブラウザがあれば使えるので、アプリのインストールが不要という利点もあります。
但しデスクトップ版よりもかなり簡易な形になってるので、こちらで運用をするのは難しい。主な機能は以下のような感じ。
- Desktop版同様に取り込んだデータソースのデータであれば、編集画面から新たにグラフの作成やレポートの作成が可能
- 他人と共有するためにはPro版以上のライセンスが必要
- 手動でデータの貼り付けであれば、新たにデータセットを用意して作成することも可能
- エクスポートでPDFやPowerPoint形式で出力が可能
- スマートフォンでもアプリをインストールしたりウェブブラウザ上から閲覧が可能
図:オンライン版も結構しっかりした作り
図:Desktopと同様に編集も可能
スマフォ版を使ってみる
Power BIはiOSおよびAndroid用にアプリが用意されています。よって、いちいちパソコンを持ち出すことなく、作成されたPower BIのデータを閲覧する事が可能です。こちらも利用するには、Microsoft365のアカウントが必要になります(通常のMicrosoftアカウントでは利用できません)。
基本的にはオンライン版と同じで、クラウド上にアップされたデータソースを閲覧するものになるため、スマフォ内にあるpbixファイルを直接開いて閲覧といった事はできないようです。試しに初めから用意されてるサンプルデータを開いてみました。
実際にサンプルを開いてみると本当に閲覧だけなので、オンライン版と異なり作成や編集といった事はできないようです。また、オンライン版と同じであるため、事前に自身のワークスペースに対して、Power BI Desktopからデータを発行しておく必要性があります。
※常にデータを最新に維持するように仕込んで、全社員が見られるようにしておけば、いろいろな動機づけや働きかけにもつながるかもしれません。
図:サンプルを表示してみた