Microsoft の Power BI を使ってデータの視覚化やデータ分析を行いたいという声をよく聞きます。
Power BI では、ビジネスの状況やデータの全体像を一目で把握するために、重要な指標(KPI)やグラフを1つの画面にまとめることなどができます。※このような画面のことをダッシュボードといいます。
そして、それらの元となるデータを Power BI に取り込むときには「Power Query」を使うことになります。
イメージとしては、 ”Power BI” という工場の中に、材料(データ)を運び込んで下処理する ”Power Query” という専用のラインが組み込まれているようなものです。
Power BI 上でグラフなどを作って可視化すること自体はそれほど難しくありませんが、可視化にあたって大事なところ(大変なところ)は、その前段階である「データを整える作業」です。
この「データを整える作業」を担うのが Power Query というわけです。

Power BI と Power Query の役割を整理
Power BI と Power Query の役割分担は以下のようになります。
Power Query:データの「取得・変換」
バラバラな形式のデータを読み込み、不要な列を消したり、表記ゆれを直したりして「きれいなデータ」を作る。
Power BI:データの「視覚化・分析」
Power Queryで作った複数のテーブルを関連付けるなどして、グラフやレポートにして分析する。
なお、Power Query は必ずしも Power BI のみで使うわけではなく、単純なデータの加工などにも使えます。それから Power Pivot での集計作業などでも、やはり元データを整えるときに使うので、利用範囲は非常に広く、便利な機能なのです。

Power BI 利用の主な流れ
Power BI でダッシュボードやレポートを作る場合の流れを確認しておきます。基本的には以下の順番で処理していきます。
- 接続 (Extract)
Power Query が Excel や CSV、データベースなどからデータを取得する。 - 加工 (Transform)
Power Query で、列の分割やフィルター、計算列の追加を行う。 - 読み込み (Load)
きれいになったデータがPower BIのメモリ上に送られる。 - 可視化
Power BI Desktopの画面でグラフを作成する。
※「接続・加工・読み込み」のプロセスを「ETL」と呼びます。
※ Power BI では、詳細な分析画面を「レポート」、その中の重要な指標を1枚に凝縮したものを「ダッシュボード」と呼び分けます。

なぜ Power Query が必要なの?
前提として多くのデータは、最初からグラフにしやすい形をしているケースは少ないものです。例えば、Excelファイルで以下のようなケースを想像してみてください。
- 支店別や担当者別、月別などでシートが分かれている。
- 社内の売上管理システムが出力した合計行や不要な見出し行がある。
- 顧客リストで ”東京都” と ”東京” 、 ”株式会社” と ”(株)” が混在している。
これらのデータ加工作業を Excelのワークシート上で行うのは、なかなか大変です。
さらに、ダッシュボードやレポートは「毎週」や「毎月」など、定期的にデータを見たいケースが多く、毎回同じデータ加工作業を行うのは非効率です。
Power Query を使えば「データ加工作業の手順」を記録できるため、翌週や翌月に新しいデータが入ってきた際も「更新」ボタンを押すだけで、データ加工の作業を自動で行うことができるのです。
そのため、Power BI を使う際には 実質的に Power Query が必須、というわけです。

Power Query と Power BI はセットで使う!
このように、Power BI を使うためには Power Query が必要不可欠です。
Power Query と Power BI の2つをセットで使いこなすことで、毎月の集計作業から解放され、本来時間をかけるべき「分析」に集中できるようになります。
そして Power Query は Power BI 利用時だけでなく、通常のExcelデータの加工時にももちろん使えます。Power Query を知っておくといろいろと便利なので、ぜひ押さえておきましょう。







