Object Detection
選択肢がたくさんある。どれもtd内のPython環境で構築するのが一般的か。
ただ、td内のScriptDATなどで構築すると、シングルスレッドで動くため描画系のボトルネックになる可能性がある
Yolo
AGPL
Tensorflow
metaの汎用検出プラットフォーム(?)
ヘッドレスの解析を素のPythonのループで行い、結果をOSCなどで送信するのがお手軽で良さそう。
tdのライセンスなどもいらない。
Yolo v11を試してみる
(2024/12/13)
ChatGPTでultralyticsを使ってyoloを使う例を生成
cv2でフレーム表示
https://scrapbox.io/files/675be86c0a45492f4dba64ac.png
Speed: 1.0ms preprocess, 43.5ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)
推論は速いがpreprocessでなんか時間がかかってる
と思ったら、GPU使っていない… ( import torch; print(torch.cuda.is_available()) が false )
現在のpytorchに対して最新のcuda=12.4を使う必要
謎にこけるのでcondaをupdateして環境ごとつくりなおし
動いた
Speed: 1.5ms preprocess, 9.0ms inference, 1.0ms postprocess per image at shape (1, 3, 384, 640)
60GFPSも問題なくでる、GPU使用率も低いのでシングルスレッドで描画とあわせても実用に問題なさそう