お問い合わせはこちら

テレワークで機械学習する人必見! 今こそ使いたい、GPUクラウドでお悩み解決

公開
更新

新型コロナウイルス感染症 (COVID-19)拡大対策としてテレワークを余儀なくされるケースが急増しています。人工知能(AI)ビジネスに取り組んでいるスタートアップ企業も例外ではなく、オンプレミスでAI開発環境を保有する場合、IT関連メーカーの工場稼働停止や世界的な物流停滞の影響で、AI関連製品の供給ストップ、納期遅延が発生しています。このような環境下でオンプレミスの機械学習、深層学習の開発リソース不足を補う目的で、GPUのクラウドサービスを導入するケースが増加傾向にあります。こんなときこそ、GPU活用事例を参考に開発の生産性を向上させてみませんか。

テレワークで機械学習する人必見! 今こそ使いたい、GPUクラウドでお悩み解決

テレワークで機械学習する人必見! 今こそ使いたい、GPUクラウドとは?

大量のデータを扱う科学技術計算、VRや3Dレンダリング、自動運転のための物体検知などに対応可能な高機能コンピュータリソースであるGPUをクラウド環境で提供するサービスです。

GPUクラウドとは?

オンプレミスとGPUクラウドの併用とは

既にオンプレミスでAIの開発環境を保有しているのに、GPUクラウドを併用する意味はあるのか?

最新のGPUを搭載したグラフィックボードを複数枚実装し、CPU・GPU間、GPU・GPU間が高速バスで接続されているリッチな開発環境で、潤沢なマシンリソースにまだまだ余裕があれば、敢えてGPUクラウドを併用するメリットは少ないかもしれません。
しかし、開発環境のマシンスペックに不安を感じたり、構築済の学習モデルをクラウド上のハイスペックなGPUで動作させたときのベンチマークをとりたければ、GPUクラウドの利用価値はあると言えます。

以下、その理由を見てましょう。

GPUクラウド利用の勘所

どういうケースでGPUクラウドを使うメリットがある?

・再学習の頻度が高いか

先ず考えられるのは、学習モデル構築時に大量のGPUリソースが必要になるケースが挙げられます。ビッグデータの解析やカメラで撮影した動画の中から多くのオブジェクト(対象物)を物体検知したい場合、ゲーミングPC用に実装されたGPUでは画像処理に長時間要するため、データセンター向けGPUを搭載したGPUクラウドを利用することで処理時間の短縮を図れます。
一方、一度学習モデルを構築すれば長期間にわたって、そのモデルを利用し続けることが可能なケースがあります。例えば、画像認識するオブジェクトが増えない場合などが当てはまる。そのような場合、モデル構築に時間を要しても問題ないことが想定できるのでオンプレミスで問題がないかもしれません。

・テレワークのため、開発環境を物理的に変更できない

次に挙げられるのは、GPUが高性能であるが故に発生するハードウエア特性の課題をクリアするためにGPUクラウドの利用価値があると言えます。GPUのクラウドサービスを提供している事業者は高品質なデータセンターでIaaS(Infrastructure as a Service)環境として提供しているため、エンドユーザー側では、消費電力や熱量を気にせず、セキュアに安定稼働させることが可能で、システム運用上大きなメリットになります。

テレワーク時代のGPUクラウド利用場面(利用目的)

テレワーク時代のGPUクラウド利用場面(利用目的)

ここでは、どのようなテーマに対してGPUクラウドが利用可能か、いくつかの事例を紹介しましよう

AI外観検査(良品・不良品判別など)

・検査工程で目視からAIへの代替化の流れ

製造業でのAI活用事例として、検査工程における目視検査の一部をAIで代替するケースが挙げられます。その背景には、製造現場の人手不足や熟練検査員の高齢化に伴う後継問題という共通課題が存在します。AIには人の目に替わって、良・不良を判定したり、不具合の種類を自動的に分類することが求められ、画像認識技術の向上に伴い、多くの検査ラインに導入されつつあります。
そのためには、大量の画像データをもとに学習モデルを構築する必要があり、場合によっては数時間から数日要するケースもあり、ゲームPC用のグラフィックボードと比較し、高速処理が可能なGPUクラウドを活用することで、大幅な時間短縮が期待されているのです。

・学習と推論を並行することでラインのダウンタイム短縮

組立工程では、作業指示書の記載と異なる部品をピックアップした場合にAIが警告を出すことで誤組立を防止したり、部品の付け忘れを検知することで不良品の出荷を停止する用途で画像認識が活用されています。ここでの課題として判別対象の部品が増えたり、検査用カメラの機種変更など検査条件が変わるたびに再学習が必要になることです。現場での推論処理とモデル再構築のための学習処理を同時並行させるためにGPUクラウドを効果的に活用することがラインのダウンタイム短縮に寄与します。

画像認識(農作物の色味から収穫可否推測)

・農業と相性がいいAIでムダの排除を目指す

イチゴやトマトなど成長にあわせて緑色から赤色に色味が変化する農作物の収穫タイミングを画像認識技術で推論し、作業者や管理者に情報提供する仕組みが構築されています。収穫期にだけ作業に当たる短期就労者は収穫タイミングを示すカラーチャートと目の前にある農作物を比較しながら、収穫作業を行うことが多くあります。この場合、判断が人の感覚にゆだねられていることから、収穫が早すぎて出荷できないケースや逆に収穫タイミングを逃してしまい、ジュースやジャムなどの加工食品としてしか利用できないなど、廃棄ロスや売上低下につながることが多く発生しているのです。

・AIの予測に基づく農業の生産性向上

収穫にあたる個人の感覚や勘を排除し、AIが収穫可能と判断した農作物を作業者が装着しているスマートグラスのレンズ上に表示したり、管理者用端末に情報掲示することで、その日の出荷可能数を推計でき、必要な人員を効率的に配置することで、生産性向上に寄与することが期待されています。
また、収穫予測モデルの精度向上のためには、品種ごとに季節や日照条件等の変化にあわせて、再学習の回数を増やす必要があることから、大量画像データをもとにモデル構築するためにGPUクラウドのハイパフォーマンスが威力を発揮することになるのです。

カメラ画像の関節点抽出・姿勢推定(工場内の安全管理・作業工程分析)

・顔認証以外に広がる画像認識技術

カメラ画像のAI画像認識と言えば「顔認証」を思い浮かべる人が多いと思うが、最近は一歩進み、人が映った静止画や動画から関節点抽出・姿勢推定に取り組むケースが増えています。人体、顔、手足などのキーポイントを画像から検出する技術がディープラーニングにより、実用レベルまで向上しているのです。これにより、立位・座位の推定や転倒状態についての検知が可能になり、医療・介護現場や高所作業監視に導入されることで、人に替わってAIが監視を行い転倒者をいち早く検知し、救護に向かうシステムの本格導入が実現目前です。

・医療分野への広がりに期待

また、リハビリの経過観察に導入し施術前と施術中、施術後の姿勢やからだの動きを関節点抽出技術で視覚化することで、医療従事者から患者への説明が明快になったり、整骨院での施術前後の骨格の変異を視覚的に表現するなど応用範囲も広いと考えられています。
OpenPoseなど高精度なライブラリの発表に伴い、様々な場面での適用が期待されていますが、動画を解析する場合にロースペックマシンを使用すると推論処理に長時間要し、業務の生産性やサービスレベルの低下につながるため、スポットでGPUクラウドを利用することでサービス提供までの時間短縮が可能になります。

カゴヤ提供の「Tesla GPUサーバー」を使うメリット

「GPUサーバー」を使うメリット

ここからは当社カゴヤ・ジャパンが提供している「Tesla GPUサーバー」を例にそのメリットを見ていきましょう。

すぐに使える

GPUサーバーやグラフィックボードのメーカー在庫不足や物流遅延によるハードウエアリソース調達期間の長期化の悩みが解決します。
時間課金サービスなら、オンラインでの申込みで最短当日から利用開始が可能です。

目的に応じて使い分けが可能

スポット利用やトライアルなら1時間単位で利用可能な時間課金サービスが便利です。
科学技術計算や画像処理など大量リソースが必要ならマルチGPUにも対応した月額課金サービスがお薦めです。

データセンター向けGPUで高速処理

CG、ゲーム開発、CAD等で主に利用されてきたGPUが昨今はAI開発環境で利用されており、CPUの数倍から100倍以上の速度で計算処理することから開発効率向上に大きく寄与するでしょう。

「Tesla GPUサーバー」を使ったらこうなった(ビフォー・アフター)

「Tesla GPUサーバー」を使ったらこうなった(ビフォー・アフター)

Tesla GPUサーバー」の活用場面とメリットについてみてきました。それでは実際に利用されたお客様の事例から、どのような変化があったのかを紹介します。

学習時間が大幅に短縮できた!

・Tesla P100で学習時間が1/3に

20,000枚の画像を学習させるための時間短縮が課題でした。オンプレミス環境ではTesla K80を保有しているが、GPUサーバー上でTesla P100を使い、学習することで1/3に時間を短縮できました。学習時間の短縮に伴い、別の課題(案件受注のためのトライアル分析)に取り組むことが可能になり、提案機会の増加にも貢献。開発環境を増強するためにサーバーの管理コストが不要で、クラウドの利用料金だけになることから、トータルコスト削減にもつながりました。

・GPUサーバー上でのシステム運用環境が実現できた!

GPUサーバーは高価なため、初期投資を抑える目的でゲーミングPCを開発マシンとして採用したが、サーバーではないため24時間365日稼働させることができないという問題があり、開発環境をそのまま納品先での運用環境として導入することができませんでした。そこで推論処理をGPUサーバー上で行う方法にすることで、開発をオンプレミスで行い、システムの運用環境をクラウド上で実装することで24時間365日稼働する仕組みを構築できました。

・オンプレミスの弱点を克服できた!

CPUと比較し、GPUの消費電力は非常に大きいため、開発リソース拡充目的でグラフィックボードを追加する場合、電源容量には注意が必要です。また、消費電力が大きくなると発熱量も比例して大きくなるためファンを追加したり、空気の流れを確保するためにスロットを空けておくなど物理的な制約が発生し、手軽に開発リソースを追加することが難しいという課題が存在します。そこで、GPUサーバーならデータセンター事業者の安定したインフラを利用できるため、開発リソースの追加を短時間に実現できました。

まとめ

オンプレミスでのAIソリューション開発環境の課題を補完するGPUサーバーの役割りについてご理解いただけたでしょうか。とくにゲーミングPCに実装されているグラフィックボードを必要に応じて追加しているケースで発生する電源容量ならびにエアフロー確保の問題や開発環境を運用環境に移行したい場合に生じる連続稼働の問題をGPUサーバーを利用することで解決できるメリットは大きいと思われます。

また、HCI(ハイパーコンバージドインフラストラクチャ)サービスというサーバーの仮想化を実現するのに必要な機能を1台にまとめたサービスもご利用いただけます。数百台分のサーバー・ストレージ・ネットワーク・ソフトウェアなどの機能を1台かつ、1つの管理画面で運用できるメリットを持ったサービスとなっています。

HCIサービス

カゴヤのHCIサービスは、拡張性と耐障害性に優れたハイパーコンバージドインフラをお客様に合わせた料金体系でご利用頂けるサブスク型仮想化基盤です。

>>詳しくはこちら