top of page
検索
  • 執筆者の写真和田一成

DETRによる物体検出 その1

2022年年末あたりからAIによる物体検出の実験をしている。その中でDETRによるアプローチが、広い可能性のある汎用性の高いモデルとして注目されている様である。これは、Facebookの研究チームが2020年に公開したもので、End-to-End Object Detection with Transformersの略である。初めてTransformerを物体検出に利用したモデルで、Transformerに画像を入力するだけで物体検出が可能というシンプルな構造を有しているのが、DETRの特徴のひとつである。

今回、撮り溜めてあった写真を入力画像として利用してみた。以下の写真は2022年の川越祭り前日に訪れた際の写真で、データセットCocoを用いて、物体検出とバウンディングボックス、その確率を示している。抜け落ちなくperson, bicycle, traffic light, handbag, carなどが検出されており、その精度に驚かされる。ただし、Cocoは米国を中心として構築されているデータベースなので、駐車禁止のサインがstop signとなっているのはご愛嬌。

さらに山車の準備をする川越市民の様子を示すのが下の写真である。

さらに、Attentionの表示をおこなった。これは、写真中のどこにpersonと判断するのに注目しているかを示すAttention weightと呼ばれるデータを可視化しているものである。明るい箇所にAIが注目しているということで、手や頭髪だったりするが、なかなか興味深い。




閲覧数:11回0件のコメント

最新記事

すべて表示

寺院の3次元モデルの生成をし始めた。この背景は存続が厳しい状況にある国内の寺院に対し、その資産をデジタルデータとして残していきたいと考えていた折、ご縁あって埼玉県内のお寺の仏像、建物、墓所などの360度VRツアーを作製することをはじめ、その一環として3Dモデルも利用してみようという事になった。スキャニングはLiDARやフォトグラメトリを使っている。以下の例はSketchfabに投稿した作品の一部で

7月4日にアキレス腱断裂の怪我をして、7月7日に手術を受けた。1週間の入院となったが、9月上旬現在順調に回復してきていて、歩く際に脚に装着する歩行支援ブーツがそろそろ取り外せそうな状況にある。 怪我の原因は、テレビで放映していた運動を準備運動も無しに行ったことである。この年齢になると、運動前のストレッチなどは絶対に行わないと、通んでもないことになりかねないことを、学んだ。皆様もご注意して下さい。

  • 赤城山周辺の秋の風景
  • Kazushige Wada
  • Instagram
bottom of page