AI・機械学習に関すること prod.らいあん

AI・機械学習に関する気づきやメモ

Vehicle_Price_Prediction_using_Visual_Features

消費者製品の画像を利用した販売価格予測というタスクに焦点を当ている研究。 自転車と自動車の画像からそれぞれの価格を推定するregressionタスクにCNNを用いている。ベースラインモデルである多クラスSVMと線形モデルに対して同等~高い精度が出た。VGGとMobileNetによる転移学習よりも制度の高いネットワーク構造PriceNetRegCNNを提案している。また、CNNモデルに関して、画像のどの部分が予測に効いているかをVisualizationすることにより示している。

related work

Zeiler and Fergusは、どのような視覚的特徴が隠れたユニットの活性化を最大化するかを学習し、どの特徴が事前予測に影響を与えるかを決定するために、オブスキュアリングスライディングウィンドウを利用している。

  1. Zeiler and R. Fergus. Visualizing and understand-ing convolutional networks. InECCV, 2014.

Zhou et al. は、グローバル平均プーリングを用いて、画像のどの領域が分類予測に最も影響を与えているかを可視化している。

  1. Zhou, A. Khosla, A. Lapedriza, A. Oliva, andA. Torralba. Learning deep features for discriminativelocalization. InCVPR, 2016.6

Simonyanらは、物体認識ネットワークが予測したクラススコアを最大化する画像を生成している。 これらの方法のサブセットを使って、製品の価格が高いか低いかの結果となる特徴を可視化する実験を行っている。

  1. Simonyan, A. Vedaldi, and A. Zisserman. Deep in-side convolutional networks: Visualising image clas-sification models and saliency maps. InICLR, 2014.

 提案手法

構築する特徴抽出器

  • HoG+PCA(ヒストグラムごとに8つの方向を持ち、ウィンドウサイズは32×32ピクセルでPCAで200次元にする)
  • CNN (vgg16を使用しており、vgg16の最後の全結合層にPCAei適用し次元削減をしている)
  • VGG16
  • SqueezeNet

    予測器

  • 線形回帰
  • SVM
  • VGG16(出力を1次元にして直接価格予測)
  • SqueezeNet(出力を1次元にして直接価格予測)