データサイエンスのためのTableau

 みなさんこんにちは、アゼストの山下と申します。今回はデータサイエンスを事業の柱の一つとしている弊社が、Tableauを活用してきた事例を一つご紹介いたします。

Tableau × データサイエンス

 みなさんはTableauをどのようにご活用していらっしゃいますでしょうか?

 データの可視化、というのが主な目的かと思います。しかし、さらに可視化したデータから何を読み解くことが出来るか、ということがビジネス上の問題に対しては重要になってきます。

 ビジュアルなデータ表現に優れているTableauを使えば、データから多くの発見を得ることが出来ます。今回ご紹介するのはTableauを通してデータを眺めることで直感とは反する発見を得た一つの事例です。

Tableauを使ったデータサイエンス 〜ヘルスケアデータの分析〜

 新型コロナウイルスの流行が始まってから早三年、現在社会にはwithコロナの生活スタイルが求められています。

 テレワークの普及もその一つでしょう。家にいながら仕事をすることが、今や一つの常識になりつつあります。東京都の調査結果によると、昨年10月時点での都内企業のテレワーク実施率は54.1%にも上るそうです。

 このような状況の中で懸念されているのが、テレワーク中心の働き方により仕事上のコミュニケーションが減り、業務上の不安や孤独から心身の健康に悪影響を受けてしまうことです。また、実際に会って会話する機会が減ったことにより、従業員の体調の悪化に周囲が気づきづらくなっていることも問題となっています。つまり、現在企業には、従業員の健康状態の管理・把握など、使用者が適切な労務管理を行うことが求められているのです。

 今回は、アゼストが医療法人と共同研究しているメンタルヘルスデータより、回答結果を読み解いていきます。

 アンケート形式のデータのため、それを読み解くためには各項目の因果関係を正確に把握することが求められます。そこで活躍するのがTableauです。Tableauを効果的に活用してデータをビジュアライズすることで、今回扱うような膨大なデータに隠された「データが持つ意味合い」に気づくことができます。

 まずはこちらをご覧ください。

 これは各カテゴリ間の相関を表した散布図です。こうしてアンケートの結果をカテゴリごとにまとめてその結果をプロットすることで、ある要素がどの要素に影響を与えているのかが見えてきます。変数を定義して工夫すればこのように俯瞰的に見られる点もTableauの素晴らしいところですね。

 今回は「うつ傾向」との相関に注目して見ていきましょう。

「うつ傾向」と相関が高いのは何? 〜データから見えてくる意外な結果〜

 今回のアンケートの設問は、10個のカテゴリに分かれています。

  • 仕事量の多さ
  • 仕事の質の不適
  • 仕事での対人関係
  • 仕事以外での対人関係
  • 将来への不安
  • うつ傾向
  • 肉体的なつらさ
  • 怒り・軽躁状態
  • 依存傾向
  • 疲労感

この中で「うつ傾向」に影響を与えているのは、どのカテゴリでしょうか?

 おそらく、「仕事量の多さ」をまず挙げる方が多いのではないでしょうか。確かに、仕事に追われて残業ばかりしている会社員がうつになっている割合は高そうに思えます。

 ではここで、データから分かった「うつ傾向」と相関の高い項目を見ていきましょう。相関の高いカテゴリの上位3つは次のとおりです。

1位 「将来への不安」

 「将来への不安」の数値が高いほど、「うつ傾向」の数値も高くなっているのが分かりますので、「将来への不安」が「うつ傾向」に影響を与えると思われます。

 今度は男女で色分けをしてみました。男性が青丸、女性が赤丸です。これをみた限り、男女による差はなさそうですね。

 同様に見ていくと2位は「疲労感」、3位は「仕事の質の不適」となっています。

2位 「疲労感」

3位 「仕事の質の不適」

 「仕事量の多さ」は上位3つには入りませんでしたね。では、「仕事量の多さ」は何位だったのでしょうか?

 仕事量の多さ

 この図から、「仕事量の多さ」の数値が高くなっても「うつ傾向」の数値はそれほど高くなっていないことが分かります。実は、「仕事量の多さ」は「うつ傾向」との相関が最も低いカテゴリだったのです!

 意外な結果ですね。例えば企業の管理者が従業員の心身の健康を保つための施策を考えるとき、このデータを見ずに考えていたら、まずは残業を減らすことから始めていたことでしょう。

 もちろんそれも大事なことなのかもしれませんが、しかし、データを見る限り最も優先的に取り組むべきなのは従業員の「将来への不安」を解消してあげることが示唆されています。

 今回はカテゴリ間の相関を見るにとどめますが、このヘルスケアデータからは様々な発見が得られます。

 例えば、「うつ傾向」と相関の高かった「将来への不安」の中でも最も重要となってくる項目(設問)はなんなのか、「仕事量の多さ」が「うつ傾向」に結びつかなかった要因はどの項目にあったのか。さらには生活習慣と健康状態の関係なども、今回のデータからは発見することが出来ました。

データサイエンスの重要性

 「今後,世界ではますますデータを利活用した新産業創出や企業の経営力・競争力強化がなされることが予想され,データの有する価値を見極めて効果的に活用することが企業の可能性を広げる一方で,重要なデータを見逃した結果として企業存続に関わる問題となる可能性もある。」

 これは文部科学省が過去に作成した「大学の数理・データサイエンス教育強化方策について」という資料の中の一文です。

 今回のヘルスケアデータの例ではデータから判断することなく直感で判断していたら、本当に必要な対策を取れないところでした。データを正確に読み取って、その結果に基づいて施策を考えることの重要性をお分かりいただけたと思います。さらにこれは、既に訪れている本格的なデータ活用社会において、絶対に必要となってくることなのです。

アゼストのご紹介

 最後に弊社のご紹介です。

 アゼストは、お客様のビジネス戦略に基づいて、デバイスアプリケーションやサービスのコンサルティング、サービス統合開発、アプリケーション開発、データ分析の事業を展開しております。クラウドサービスに関しては、アマゾンウェブサービスを利用したサービスのプロトタイプ開発、プラットフォーム構築などに取り組んでいます。

 本記事で紹介したような医療データを中心にデータ分析業務についても得意としている一方で、動画解析・活用に関しハードウェアの導入~ソフトウェアによる解析~Tableauによるデータの可視化までを一貫して提供することも可能です。

 Tableau のリセラーパートナーとして、Tableauの導入から支援までの幅広いサービスも提供しておりまので、詳しくは弊社ホームページをご覧ください。

https://www.azest.co.jp/

Language »