本記事はこんな悩みを持った人に向けての記事です。
データサイエンティストとして、仕事をするために必要なスキルの一つとして、ビジネス力が挙げられます。
実際にデータサイエンティスト協会のスキルセットを見てみると、データサイエンティストに必要な三つの力のうちの一つに、ビジネス力が書かれています。
参考:https://www.datascientist.or.jp/news/release20211119/
本記事では、こちらのデータサイエンティスト協会が出しているビジネス力のスキル項目について、実際にデータサイエンティストとして働いている私が、具体例を交えて、解説していこうと思います。
スキル項目は全部で10つです。
それでは見て参りましょう。
データサイエンスをテックアカデミーで学ぶ
週2回マンツーマンでのメンタリング、毎日15〜23時のチャット・レビューサポートで短期間でPythonを使って様々なモデルを構築し、データ分析を行うプログラム。
統計学の基礎やPythonで実際に分析する方法まで習得することができます。
※条件を満たすことで受講のために支払う受講料の最大70%が教育訓練給付金としてハローワークから支給されます。(詳細はリンク先で確認。)
行動規範
行動規範とは、ビジネス力の中でもデータとの付き合い方を対象としたものです。
データを扱う際には、心得ておくべき観点があります。
この観点は、とても大事であり、気をつけないと大きな問題になる可能性があるので、データを扱うものとしては、まず身につけて欲しい観点です。
具体的には以下の三つです。
行動規範の観点
- 個人情報を保護する。
- データを都合のいいように解釈しない。
- 素早く結果を出す。
まず、一つ目の個人情報を保護するは、言うまでも無いと思います。
データ分析をする人全員に名前や住所、その人の買ったものなどが入ったデータをそのまま渡っていたりすると、気持ちが悪いですよね。
データ分析をやる際は、個人を特定できるデータを使って分析を行ってはいけません。
匿名化などの処理を加えて分析を行う必要があります。
こういった個人情報を保護しながら分析をする必要があると言う認識を持つことが大事です。
二つ目のデータを都合のいいように解釈しないとは、捏造や、改竄などをしないと言うことです。
欲しい結果を得たいが故にデータを捏造したら、信頼性を失うことに繋がりかねません。
データを扱うものとして、このようなことは絶対にしてはならないと言う認識を持ったほうが良いです。
三つ目の素早く結果を出すとは、結果を出すための手段を認識していると言うことです。
目的を設定する、問題をきっちり特定している、生み出す価値を認識しているなど様々な要素がありますが、これらをきっちり認識した上で、作業を行うと言う姿勢が大事です。
契約・権利保護
契約・権利保護とは、ビジネス力の中でも、成果物と使用ライブラリに対しての法律の知識を対象としたものです。
こちらのビジネス力は、自分が作った成果物が後々問題にならないように身につけるべき力です。
具体的には、契約法、著作権法、不正競争防止法、特許など知識です。
個人や中小企業でデータに携わる際には、法律に詳しい人のチェックを受けることが難しい場合もあるかと思うので、最低限の知識は身につけておいたほうが良いかと思います。
特にデータサイエンティストの職を個人事業主として、やろうと思っている方は法律の知識を持っておきましょう。
自分を守れるのは自分だけです。
論理的思考
論理的思考とは、物事を構造的に考え、説明する力のことです。
個人的には、この能力はデータサイエンティストとして働くのであれば、一番身につけるべきビジネス力だと感じております。
データサイエンティストは、職業柄データの説明を行う場面が多く存在します。
その際にこの論理的思考ができていないと、相手に伝わらない説明となってしまい、せっかく分析を正しく行っていても、よく分からない意味のない分析だと受け取られてしまいます。
論理的思考力は、大きく分けて以下の三つに分けられます。
論理的思考力
- MECEに思考する力
- 因果を思考する力
- 思考したことを説明する力
一つ目のMECEに思考する力とは、漏れなくダブりなく思考する力のことです。
MECEとは「Mutually Exclusive and Collectively Exhaustive」の略で、日本語に訳すと漏れなくダブりなくとなります。
MECEに考えることは、忘れがちですがとても重要です。
PCを買おうとしている場面を例にあげましょう。
家電量販店の人にどのPCがいいか聞いた際に、「うちのPCはスペックが最高なのでおすすめです。値段は10万円でメモリが16GBで、コア数は。。。」みたいに永遠に自社の説明だけされても買おうとならないはずです。
しかし、「うちのPCはスペックが最高なのでおすすめです。PCの大手は3社あり、A社は10万だすとメモリが8GB、B社は10万円だすとメモリが4GB、しかし我が社は10万円で16GBのメモリのPCが買うことができます。ですのでぜひ検討してみてください」
と言われると、最初の説明よりは買おうとなるのでは無いでしょうか?
でもまだ営業トークっぽいですって?
それは、性能のMECEが足りてないからです。
バッテリー、コア数、通信速度などなど他の要素もちゃんと説明してくれると信頼できるようになるのではないでしょうか。
二つ目の因果を思考する力とは、原因と結果を明確にしながら考える力のことです。
AだからB、BだからCなどといったように考える力のことです。
ここで注意したいのが、間のステップの説明を省いてはいけないと言うことです。
たまにAだからB、BだからC、CだからD、なのでAだからDであると言う説明を、前半部分を飛ばしていきなりAだからDであると説明する人がいます。
これは通常は伝わらないと思ってもらって良いでしょう。
人間の思考は思っている以上に多様的です。
ですので、論理が飛躍していると間の論理を埋めることは通常の人には難しいことなのです。
きっちり間の論理も説明するようにしましょう。
最後の、思考したことを説明する力は、先ほどのMECEと因果がしっかりと理解できていれば簡単にできます。
なぜなら世の中には説明のためのフレームワークがたくさん存在し、それがMECEと因果関係が理解できていれば後は作業で埋めるだけで完成するものになっているからです。
ですので、説明をする力を身につけるには、MECEと因果関係の理解を徹底しましょう。
着想・デザイン
着想・デザインとは、持っている知識から具体的な解決策を考え出すことを指します。
データを膨大に所有していても、それを使用して問題を解決する手法を思いつくことができなければ、データの利活用はできません。
自分が持っている知識を、ビジネス的な解決策として提供することができなければ、そこから価値は生まれません。
この力を身につけるためには、日々妄想し続ける必要があります。
このデータを使うことでどんなことができるのか。
どんなデータがあればこの問題は解決できるのか。
データサイエンティストであれば、このようなことを毎日考えるぐらいの気概があるといいでしょう。
課題の定義
課題の定義では、課題に対して、以下の4つ項目をきちんと定義できることが重要です。
課題の定義
- KPI
- 課題箇所
- 課題解決が生み出す価値
- 課題解決プロセス
一つ目のKPIとは、課題解決の達成度を図るために用いられる指標です。
例えば、飲食店では、来場客数や回転数などがKPIとして使用されます。
二つ目の課題箇所とは、課題が起きている箇所ということです。
またまた、飲食店の例で例えると朝、昼、夜のどの時間帯の売り上げが原因なのかを特定するといった感じです。
三つ目の、課題解決が生み出す価値は、そのままの意味です。
飲食店だと、課題解決により売上がどの程度上がるのかということです。
四つ目の、課題解決プロセスとは、課題を解決の手法を考えるにあたって、何が論点となり、どういったスケジュールで方式を考えていくかということをイメージすることです。
飲食店だと、料理メニューに何を追加するかが論点となり、これを考えるにあたって、新メニューを作って試食することを10料理分行う必要があるなということをざっくりとイメージするということです。
ぜひ課題を定義する際には、上記の4つのことを事前に定義できるようにしていきましょう。
データ入手
データ入手とは、社内、社外にどんなデータがあるかを把握し、そのデータを使用できるように働きかけることができる力です。
ビジネス力の中でも軽視されがちな力ですが、この力があると非常にデータ施策の幅が広がります。
このデータ入手の力は、施策の精度を上げるという観点でとても重要です。
しかしデータサイエンティストであっても、データにどのようなものがあるのかを知らない人も多いです。
社内でも、全然知らなかったというデータが存在することはあるでしょうし、社外だとオープンソースで公開されているデータやサービスとして提供されているアノテーションデータなどは、常に情報取得のアンテナを貼ってないと認知することができません。
そのため、まずどんなデータがあるのかを認識しましょう。
また、データを認識することができたら、そのデータがどうやったら使えるのまで把握できるとなお良いです。
お金はかかるのか、個人情報的な観点でどの範囲まで使えるのか、データはどの頻度で最新のものが使えるのか、誰に連絡するとデータが使えるのか、そういったことを把握しておくことはとても強みになると思います。
ぜひ、データ入手の力も鍛えていきましょう。
ビジネス観点のデータ理解
ビジネス観点のデータ理解とは、ビジネスとして価値のあるデータ分析を行うということです。
同じデータ分析でも、適用するビジネスによって、そのビジネス価値は変わります。
例えば、男性と女性の平均身長というがそれぞれ、171cmと158cmであるという分析結果があったとします。
この結果をペットショップに持っていって、この分析結果で何かビジネス価値を生み出そうとするのは難しいです。
しかし、この結果をUNIQLOに持っていくと、男性と女性の服のサイズを決めるのに活かすことができるでしょう。
このように、分析結果が同じであっても、それをビジネスに活かすことができるかどうかは、どんなビジネスをやっているかによって変わってきます。
では、どうすれば、ビジネス的に価値があるデータ分析ができるのでしょう。
ビジネス的に価値があるデータ分析をするには、ビジネス観点をよく知る人にヒアリングを行う力がとても重要になります。
データサイエンティストが本業である場合、ビジネス領域では、営業や企画、マーケなど自分よりビジネス観点に精通した人が必ずいます。
そういった人に、どういった知見があるのか、どういったことが分析結果として考えられるかなど、まず最初にヒアリングを行うことが大事です。
ヒアリングを行い、ビジネス的観点をある程度つけた上で分析を行うと、最終的にデータ分析の結果をレポートとして出すときに、レポートを受け取った相手が思っていた結果と違うと思うことも少なくなるでしょう。
分析評価
分析評価とは、目的に対して分析結果から得られる考察が妥当なものかを判断する力です。
これを考える際に必要になるのが以下二つの観点です。
分析評価の観点
- 目的としたいものに対して、適切な範囲で分析がされているか
- バイアスがかかっていないか
一つ目の、目的としたいものに対して、適切な範囲で分析がされているかに関しては、分析の母集団が大きすぎず小さすぎない分析ができているかということです。
例えば、20代の男性の平均身長を知りたいとなったときに、23歳男性のみのデータから平均身長を出すことは、母集団が小さいと言えるでしょう。
逆に、20代の男性の平均身長を知りたいとなったときに、全年代の男性の平均身長を出すと、母集団が大きいということになります。
このような事象は比較的よく起こります。
分析者が勝手に、20代の男性の平均身長も23歳男性の平均身長も一緒だろうと考えて、分析したり、そもそも23歳のデータしかないからそれを20代の男性の平均身長として使うといったことが起こりがちです。
データについては、過大過小評価せず、きっちりと表現する力をつけることを徹底しましょう。
二つ目のバイアスがかかっていないかというものは、母集団を絞ることで想定していない効果が乗っている場合がないかということです。
例えば、土曜日と日曜日の飲食店の売上を分析する際に、2020年10月の売上で比較し、それぞれ土曜日が100万円、日曜日が120万円だったとします。
普通に考えれば日曜日の方が売上が高いと言えるでしょう。
しかし、2020年の10月だけ日曜日に近くでコンサートが開催されていたとしたらどうでしょう。
このコンサートは単発的なコンサートなので、コンサートがあることによる売上効果が本来の日曜日の売上に加算されてしまいます。
そのため、土曜日と日曜日で売上がどのように違うのかという分析には、コンサートによる売上効果を日曜日の売上から引く必要があります。
このように、特定の条件でのみに適応される効果が、分析したい効果ではない場合、バイアスがかかっていると言えます。
このバイアスの影響を防ぐには、できるだけ慎重に対象となるものにかかるバイアスを想定するということが重要となってくるでしょう。
事業への実装
事業への実装とは、実際に事業として継続的にデータを活用できる方法を構築することです。
これができるようになるためには、以下の3つのことができる必要があります。
事業への実装
- 工数見立て
- インフラの構築
- モニタリング基盤の構築
まず、一つ目の工数見立てとは、あるデータ施策を行うに当たって、どれだけの人員にどれだけの年月その施策に当てる必要があるのかを見積もるということです。
施策を行うとなると、そこにどれだけリソースを割くのかということを考える必要があります。
そのためには、施策の全体像を把握し、それぞれの工程での工数をざっくりと出すことができることが望ましいです。
ちなみに、工数は一般的に一人が一ヶ月働くときの作業量を1人月として、この人月を単位に見積もられることが多いです。
二つ目の、インフラの構築とは、データ施策を定期実行するための基盤をどう構築するのかをということです。
例えば、機械学習で個人にあった飲食店をお勧めするロジックを作ったとします。
この機械学習ロジックを実運用しようと思った場合は、この機械学習ロジックを定期実行するための基盤が必要となります。
機械学習ロジックがpythonという言語で書かれていた場合は、飲食店をお勧めする際に毎回pythonのコードを実行し、その結果をwebサーバに返すという処理が必要となります。
この処理をどのようにサーバを立てて、どんなライブラリを入れて行うのか、エラーが出たときはどういう処理を行うのかなど、ロジックだけではなく、インフラの部分も考える必要があります。
三つ目の、モニタリング基盤の構築とは、データ施策を実装した後に、データ施策がうまく稼働しているかを監視するシステムを作るということです。
データ施策は、作成した当初はうまくいっていたのに、環境が変わったがため、うまく稼働しなくなるということが起こります。
最近で言うと、コロナ前ではうまくいっていたのに、コロナ後は人の行動が変化したため、コロナ前に作ったデータ施策では上手く機能しないと言うことが起こっています。
こういったことが起こることを防ぐのも大事なのですが、それ以上に上手く機能しなくなったことを検知するためのシステムを作ることが大切です。
異常が検知できれば、上手く機能しなくなった原因を探ってもう一度データ施策を実行することができるからです。
そのため、追いかけている値を定期的に見ることのできるモニタリング基盤を作ることは必要となってきます。
PJマネジメント
PJマネジメントとは、チームとしてデータ施策を行う際に、施策を成功に導いていくためのチームリーダーが行う管理のことです。
管理対象は主に下の4つです。
PJマネジメントの対象
- 立ち上げ
- リソース
- リスク
- メンバー
一つ目の立ち上げの管理とは、どんな流れで開発を行っていくか、どんな人材が必要か、開発のルールを決めると言うことです。
事業側から求められている要件に対して、上記のものを適切に決めると言う必要があります。
二つ目のリソースの管理とは、メンバーの得意なこと、やりたいことを考慮しながら、業務範囲を決めると言うことである。
データサイエンティストと一括りに行っても、人によってできることとできないことがあります。
ここを見極めて、効率的な配置でプロジェクトを進める必要があります。
三つ目のリスクの管理とは、プロジェクトにおいて、今どういった問題が起きているのかを判断し、適切に問題に対応すると言うことです。
プロジェクトを進めていると、プロジェクトが遅れたり、セキュリティ上の問題が発覚するなど問題が発生することがあります。
こういった問題に対して都度解決していく能力が必要となります。
四つ目のメンバーの管理とは、メンバーがモチベーションを維持しながら、プロジェクトを推進できるようにすると言うことです。
このモチベーションの維持を行うためには、目標を明確にしたり、知識を共有できる仕組みを作ったり、発言しやすい雰囲気を作ったりと様々なことを実行するのが良いです。
ここに正解はないので、日々考えながらモチベーション管理方法を模索していきましょう。
まとめ
今回は、データサイエンティストに必要な力の一つであるビジネス力について、10個の項目に分けて解説していきました。
個人的に、ビジネス力があり、事業価値を生み出すことのできるデータサイエンティストは、企業にとってとても貴重な存在だと思います。
ですので、ぜひ記事を参考にして、データサイエンティストに必要なビジネス力を把握し、日々鍛えていってください。
他にもデータサイエンティスト関係の記事もあるので、もっと知りたいという方は参考にしてください。
-
【知っておきたい】データサイエンティストに必要なスキルとは?
未経験くんデータサイエンティストになりたいんだけどどういうスキルが必要なの? 初心者くんデータサイエンティストとして、スキル磨いていきたいんだけど、どんなスキルを磨けばいいか分からない こんな悩みの人 ...
続きを見る
-
【受講料が70%OFF】AI人材のスキルをつけるオススメのAI人材育成講座を現役エンジニアが解説
★この記事は5分で読み終えることができます。現役エンジニアである筆者がAI人材のスキルを身に付けたい人に向けた解説記事になります。政府の補助を受けて70%の受講料が返還される制度について解説しています ...
続きを見る