お問い合わせ・資料請求

2019.6.6 新卒社員のデータ分析業務の紹介と成果

2019年4月からデータサイエンティストとして働いているM.Uです。
セラクのデータ分析チームは、研修を終えた後にみどりモニタのサンプルデータを使用して、データ分析を行う業務があります。
今回は、その内容をご紹介します。

分析はチームごとに分かれ、以下の流れを5日間で行いました。

  1. 1.みどりモニタのデータを把握
  2. 2.課題解決の提案をするための分析テーマを決定
  3. 3.テーマに沿った分析
  4. 4.プレゼンテーション作成
  5. 5.分析結果の発表

データは気温、湿度、土壌水分量、日照量などが含まれています。
チームごとで前処理の方法、分析手法を新卒社員自ら考え、実際のプロジェクトと同様にスケジュールを立てることから始めました。
ここからは、各チームの分析テーマと分析結果をふまえた考察をご紹介します。
チームは全て4チームあり、ここでは便宜上チーム名をA、B、C、Dとします。

チームA

テーマ:二酸化炭素濃度から見る農作物収穫時期分析

チームAは、高濃度の二酸化炭素はトマトの収穫量を増加させるということに注目しました。
みどりモニタは二酸化酸素濃度の計測も行うので、そのデータを利用して分析すると二酸化炭素濃度が特に高い時期が判明します。
チームAでは、二酸化炭素濃度(日平均値)の傾向を観察した結果、ピークと増減について一定の周期性を確認しました。
そこで、「二酸化炭素濃度が高い時期=収穫時期」と仮定し、分析結果からトマトの収穫時期を推測することによって翌年以降の栽培計画が立てやすくなると考えました。
他の変数の候補として気温を考慮しましたが、季節的な変動が激しいため、今回の分析では変数として使用していません。

今回の分析では、トマト生産者のデータ量が多い神奈川県を分析の対象とし、その中でも日平均の二酸化炭素濃度が最大になる日が多い9月〜5月の間で月ごとの集計をしました。
ここでの集計の基準は、それぞれのデータの年間のなかで二酸化炭素濃度(日平均値)において最も大きい値をとったとき、その月のみを1回とカウントしています。
以下がデータを集計したグラフです。

グラフの横軸は9月〜5月を月ごとで示していて、縦軸はカウントした回数の合計を示していています。
グラフから、二酸化炭素濃度(日平均)が最大になるのは、1月、2月が最も多く、この時期が神奈川県では最もトマト収穫が盛んであると推測しました。
実際にトマトの収穫時期を調べてみると、9月頃から徐々に収穫に移行しており、数ヶ月間収穫時期があるトマトの栽培傾向と概ね合致していたことが判明しました。
このことから、変数の設定としては適切だったと考えられ、さらに他の変数も投入すれば分析の精度が上がると考えられます。
分析の精度が上がると、全体の収穫時期傾向からトマトの出荷量が多くなる時期、少なくなる時期が予測できるため、翌年以降の栽培計画の指標になることが期待できます。

チームB

テーマ:ハウス内の温度変化から見る農業手法

チームBは、みどりモニタのユーザーや新しく農業を始めたい方向けに、分析結果から農作業のノウハウを提供するというテーマに決めました。
みどりボックスは2分おきにデータをクラウドに送信していて、各ユーザーはみどりモニタを通してハウス内の様子を知ることができます。
つまり、そのデータを分析すると各ユーザーがどのくらいの水量で水やりをしたのか、どのように土壌改良したのか、なども推測できます。
そして、その手法を同じ地域に住む他のユーザーに教えることによって、成功する農業を広めることができると考えています。

今回の分析では、農家の減少が著しい島根県を分析の対象とし、多くのユーザーが野菜を育てている期間ということで11月分の気温を分析しました。
分析する際には、各データの気温を時系列で表示して比較するという方法をとりました。
ここで、データイメージ図をご紹介します。

グラフの横軸は日付と日時を表していて、例えば一番左の目盛だと11月1日午前3時ということになります。
縦軸は気温を℃で表していて、折れ線グラフは気温の変化を表しています。
こちらのデータでは、グラフから15時に急激に気温が下がっていることが分かります。
他のユーザーの気温データと比較すると、これほど気温が下がるのは不自然であることが分かりました。
このことから、ユーザーは「クイックドロップ」という手法を使っていると推測できます。
クイックドロップとは、施設内の温度管理方法の1つであり、急激に温度を下げることによって水の農作物の成長を促すための手法です。
一気に温度を下げるために、窓を開けてハウス内に風を通すなどという方法があり、こちらのデータではそのような手法を取ったということがグラフから推測できます。

次に、別のユーザーのデータイメージ図をご紹介します。

このデータでは、16℃を下回らないように調節していることが分かり、気温の管理が重要な野菜を育てていることが推測できます。
このように、みどりモニタのデータを分析すると、ユーザーごとの気温の管理方法を推測することができます。
ユーザーを地域ごとや栽培している野菜ごとにグループ化して、湿度や土壌水分量などの変数と組み合わせることによって分析の精度が上がると、農業手法の手がかりを得ることができ、成功する農業の手助けが可能だと考えています。

チームC

テーマ:潅水状況の検出

チームCでは、みどりボックスの機能の1つである土壌水分センサーに注目しました。
土壌水分センサーのデータを分析することによって、潅水(=水やり)のタイミングの参考になります。
以前、土壌水分センサーデータから潅水を検出するという記事をご紹介しましたが、今回は分析をする前に、潅水による一時的な土壌水分量の著しい上昇、時間経過に伴う経過が見ることができると予想しました。
また、グラフを表示させて潅水状況を知ることができると、収量・品質の向上、作業の効率化、異常が起きていないかの監視をすることができます。
そこでチームCは、みどりモニタが保有している土壌水分量データを使用し、ユーザーが常に適切な潅水計画を立てる手助けができるのではと考えました。

以下が時系列で表示させたイメージグラフです。

グラフの横軸は日付を表していて、縦軸は体積含水率であり単位は%で表しています。
グラフを見ると、潅水前後は20〜30%を保っていて、潅水するときは土壌水分量が約45%になるように水量を調整しているということが推測できます。
また、5回目と6回目の潅水の間隔が他の間隔より空いていることが分かり、当時の天気予報やハウス内の気象条件を考慮していると考えられます。
みどりモニタに記録されている土壌水分量以外のデータや気象庁の天候データを使用すれば、より正確に各ユーザーごとの年間潅水計画を立てることが可能かと考えられます。

チームD

テーマ:気象状況とハウス内の環境変化の比較分析

チームDは、みどりモニタが数値の異常を感知するとユーザーに知らせる、ということに注目しました。
みどりモニタには時系列でデータが保存されていて、データをグラフで表示させるといつ異常値があるか一目で分かります。
複数年の同じ月ごとに集計したみどりモニタのデータと気象庁のデータを比較することにより、月ごとのハウス内の環境を予測するモデルを作ることが可能であると考えられます。
これにより、使用したデータの年以降のハウス内の環境変化を予測することができれば、生産者が前もって変化に対策できるようになると考えました。

全てのデータを扱うとなると、欠損値が多い要素を含めて分析してしまい、正しい結果が得ることが出来ないと考えたため、以下の要素を取得することにしました。

  1. 1.日時
  2. 2.気温
  3. 3.湿度
  4. 4.日照量

今回は、いくつか分析結果をピックアップしてご紹介します。
以下のグラフは、2017年8月のみどりモニタの平均気温(MDR_Temperature)と気象庁の気温(JMA_Temperature)を比較したものです。


グラフの横軸は日付を表していて、縦軸は気温を℃で表しています。
このグラフから、みどりモニタで取得したデータにおいて昼の時間帯は32℃以下に保たれるように調整されていることが分かります。
また、どの夜の時間帯でも26℃以下になっています。

次に、2017年6月のみどりモニタの平均湿度(MDR_Humidity)と気象庁の湿度(JMA_Humidity)を比較した分析結果をご紹介します。

グラフの横軸は日付を表していて、縦軸は湿度を%で表しています。
グラフから、湿度の最高値と最低値ではみどりモニタのデータの方が10%ほど高いことが分かりました。
しかし、2つのデータの差の平均を見てみると、わずか1.5%でした。
このことから、ハウス内の湿度は気温など他の要素に依存するのであって、特に湿度を調整をしているわけではないと判断しました。
最後に、2017年6月のみどりモニタの平均日照量(MDR_Illuminance)と平均湿度(MDR_Humidity)の分析結果をご紹介します。

グラフの横軸は日付を表していて、左側の縦軸は日照量をW/m2で、右側の縦軸は湿度を%で表しています。
このグラフから、日照量が増加すれば湿度は減少し、湿度が増加すれば日照量は減少する傾向があることが分かりました。
グラフだけでは野菜の管理方法が分からないので、他のデータと一緒に分析すると日照量または湿度をどのように管理しているか推測できます。

紹介した3つのグラフのように、分析をするとみどりモニタのデータからユーザーがどのような管理をしているかが分かります。
また、土壌水分量や二酸化炭素濃度など複数のデータを組み合わせることで、より正確なハウス内の環境予測が期待されます。
これらのデータをもとに、天気予報を見た段階でどのように管理をすればよいか、より具体的な計画を立てられるのではないかと考えています。

まとめ

今回は新卒社員で構成された4チームによる、分析テーマと考察を紹介しました。
データ分析をすることによって、その要素の傾向を知ることだけでなく、その結果からどのように課題を解決すべきか導いてくれる可能性があります。
また、今までの経験に基づいて課題を解決することももちろん重要ですが、分析によって課題に関する新たな知見を得ることができるでしょう。

個人的な感想ですが、今回のデータ分析業務によって、問題解決力や分析力が身についたので良い経験になりました。
この経験を活かして、みどりモニタに関するデータにとどまらず、あらゆる業界に関するデータにおいても、お客様が求めているもの以上の価値を創出できるデータサイエンティストを目指そうと思います。

みどりモニタの申し込みをご検討されている方は、ぜひご相談ください。

この記事をシェアする

みどりクラウドが
農業の未来を変えていく。

お問い合わせ・資料請求
03-6851-4831