機械学習エンジニア3社合同MeetUp!〜MICIN・DATASECTION・LPixel〜 に参加してきました。
以下自分用のメモです。
概要
機械学習を活用した技術開発を行う株式会社情報医療・データセクション株式会社・エルピクセル株式会社3社のCTO/研究開発部長が、
各社の最先端の機械学習を活用した技術開発に関する講演を実施い
- 日時: 2017/03/15(木)19:00〜
- 場所: 東京大学伊藤国際学術研究センター
機械学習による動画像認識
今井真宏 氏 (データセクション 研究開発部部長)
TFUGコアメンバー
- 動画像認識とは?
- Spantial features × Temporal features
- 画像認識との違いは画像の動き(フレーム間での関係性を解析する必要がある)
- データのギャップ
- 研究の戦場と実際の戦場(汚い、ノイズが入っている)
- 様々な予測と組み合わせる
- 推定進行方向、推定スピード、推定運転状態、危険な物体を警告
- 全ての予測をRGB動画から行う
- 動画像の認識方法
- フレーム間の関係を表現しなければならない
- フレーム間の関係の記述をする必要がある
- フレーム間の関係
- 移動平均
- 確率過程
- ガウス過程
- パーティクルフィルタ
- ニューラルネットワーク
- CNN, RNN, Gated CN
- フレーム間の関係の記述(特徴量)
- ニューラルネットワーク
- CNN, RNN
- Color
- HOG
- Haar-like
- LBP
- SIFT, SURF, ORB, A-KAZE
- Flow
- ニューラルネットワーク
- Follo me
- Tracking by Detection
- 特徴量を使って前後のフレームに存在する物体をリンク
- メリット
- 理論が明快
- タスクに合わせてカスタマイズしやすい
- デメリット
- 物体検出が前提
- ノンリアルタイム
- Rolo
- CNNとRNNの組み合わせ
- メリット
- 物体のいい移動がスムーズ
- 中間表現によって隠れにも強い
- End2Endでニューラルネットワーク
- デメリット
- マルチトラック(大量の物体の追跡)で時間がかかる
- これからの動画像認識
- さらに多くの人に役立つソフトウェア
- データ量
- 速度
- 精度
- 補完、予測
- 最適な組み合わせ
- データ量
- モデル圧縮
- Smaller CNNs
- 蒸留
- 生成モデル
- Generative Adversarial Networks(GAN)
- 条件付きGAN
- 実際の複雑な状況には、かなり複雑な確率分布が必要
- 組み合わせ最適化
- Neural Combinatorial Optimization
- Encoder・Decoderを利用
- アテンションを結果にしている
- Neural Combinatorial Optimization
- さらに多くの人に役立つソフトウェア
- データセクション社で取り組んでいる動画像認識機能を実際の自動車への組み込んでいるか?
- まだ実際にはデプロイできていない
- 今後、計算量の削減が必須。現時点では一般的なGPUが必要
時系列データ処理の最前線 ~医療データは健康増進にどこまで寄与できるのか~
巣籠悠輔 氏 (情報医療(MICIN) CTO)
東大でDeppLearningの講義を担当している。Gunosyの創業メンバー。
「Deep Learning Javaプログラミング 深層学習の理論と実装」の著者
- 情報医療 - 情報と医療の隔たりを無くしたい
- スマホ診療・遠隔診療
- 医療×人工知能
- curon
- 医師と患者をつなぐプラットフォーム
- 医療スタッフAIが医者が欲しい質問を代わりに患者にする
- 2015年に規制が緩和され、全国で遠隔診療ができる
- β (新しい領域なので新しい技術を積極的に取り入れている)
- Webpack + Angular2
- ReactNative
- ディープラニングと最も相性がいいのが画像認識分野
- 人間の視覚野⇒脳内での処理がモデル化しやすい
- ディープラーニングの変遷と今後
- 画像からの特徴抽出 ⇒ ・・・ ⇒ 言語からの特徴抽出 ⇒ 言語からの知識獲得
- 機械学習 / 深層学習の段階分け
- Level1:認識, Level2:予測, Level3:実行
- 医療分野の現状
- 画像診断、知識ベースの病名予測(Level2に入ったぐらいの状態)
- 深層学習のこれまで / これから
- 自然言語処理
- 機械の「言語の理解」が飛躍的に発展
- シンボルグラウンディング問題も解決されつつある
- 記号空間 ⇒ パターン空間 ⇒ 記号空間
- 自然言語処理の発展 ⇒ 時系列データの処理の発展
- 時系列データの処理
- 時系列データ処理の手法は、画像分析・生成にも使える
- Bi-diractional RNN
- 過去も未来も分かっているデータから欠損などを予測したりするのに使う
- RNN Encoder-Decoder
- One-shot Learning
- いかに少ないデータで学習・予測を行えるようにするか
- 機械のより「メタ」な知識の獲得
- 個々の時系列のデータからいかに深く分析する
- 自然言語処理
- 医療データへの活かし方
- 服薬順守の予測を良い精度でできている
ライフサイエンス領域における機械学習を活用した画像解析
朽名夏麿 氏 (エルピクセル CTO)
- 生命現象のスケールと画像
- ライフサイエンスの分野ではイメージングの技術が欠かせない
- 画像自動分類の必要性
- イメージング技術の進歩によって、画像の多様化・多量化
- 可塑性・適応性のある仕組み⇒機械学習・パターン認識
- LPixcel
- IMACEL
- LP series
- LP-exam series ・・・ 論文画像不正検出
- LPX plugins
- 画像から得られる特徴の例
- 輝度
- 形状
- 模様
- 決定木(Decision Tree)による分類では特徴空間では斜めの線が引けない
- 決定木はなぜ分類精度が低いのか
- 単純すぎる。バイアスが大。表現力不足
- 集団学習。異なる学習データを利用して多数決を行う
- bagging
- RandomForest
- ExtTree
- 決定木はなぜ分類精度が低いのか