top of page
検索
  • 執筆者の写真和田一成

DETRによる物体検出 その1

2022年年末あたりからAIによる物体検出の実験をしている。その中でDETRによるアプローチが、広い可能性のある汎用性の高いモデルとして注目されている様である。これは、Facebookの研究チームが2020年に公開したもので、End-to-End Object Detection with Transformersの略である。初めてTransformerを物体検出に利用したモデルで、Transformerに画像を入力するだけで物体検出が可能というシンプルな構造を有しているのが、DETRの特徴のひとつである。

今回、撮り溜めてあった写真を入力画像として利用してみた。以下の写真は2022年の川越祭り前日に訪れた際の写真で、データセットCocoを用いて、物体検出とバウンディングボックス、その確率を示している。抜け落ちなくperson, bicycle, traffic light, handbag, carなどが検出されており、その精度に驚かされる。ただし、Cocoは米国を中心として構築されているデータベースなので、駐車禁止のサインがstop signとなっているのはご愛嬌。

さらに山車の準備をする川越市民の様子を示すのが下の写真である。

さらに、Attentionの表示をおこなった。これは、写真中のどこにpersonと判断するのに注目しているかを示すAttention weightと呼ばれるデータを可視化しているものである。明るい箇所にAIが注目しているということで、手や頭髪だったりするが、なかなか興味深い。




閲覧数:5回0件のコメント

最新記事

すべて表示

7月4日にアキレス腱断裂の怪我をして、7月7日に手術を受けた。1週間の入院となったが、9月上旬現在順調に回復してきていて、歩く際に脚に装着する歩行支援ブーツがそろそろ取り外せそうな状況にある。 怪我の原因は、テレビで放映していた運動を準備運動も無しに行ったことである。この年齢になると、運動前のストレッチなどは絶対に行わないと、通んでもないことになりかねないことを、学んだ。皆様もご注意して下さい。

狭山市立博物館より設立30周年記念事業として、ビデオ制作の一部に来館者、職員の日常を静止画で撮影したいとのご希望があり、協力させて頂いた。撮影期間中には恐竜展が開催されていて、子供さん連れのご家族の来館者が多かったが、外国人の方も見受けられた。できる限りお声がけをして、この趣旨と将来的にYouTube投稿の可能性のあることを前提に、写真使用のご許可を頂いた。10月31日に記念式典が催されるとのこと

  • 赤城山周辺の秋の風景
  • Kazushige Wada
  • Instagram
bottom of page