2025/10/8 - main-custard

2025/10/8

#2025/10 #daily_log #inbox

やったこと

2025/10/8の研究ログ

色々修正中

訓練の実装は全部終わったはず

評価もスコア自体は出せている

メトリクス計算が上手くいってないだけ

それだけ修正すればOK

カメラを用いるAALの論文を探す

一旦終わり

ベースラインで埋め込み作成

ベースラインを動かす

ベースラインにConfident Mean Teacherを組み込む

Confident Mean Teacherの論文を読む

GPTとかGithub Copilotでコードを作る

10ラウンドやって若干の精度向上を確認

今度はフルで動かす > 完了したが,精度が若干偏っている

今度は信頼度を動的に動かすバージョンを実装

Github Copilotがやってくれました

それを現在動かしている

Mambaの音響イベント検知への応用を見つけはした

やってないこと

Cross-attentionによる特徴量結合の実装 < 自分の言葉で噛み砕く

/research-custard/卒論のゴールを考える

一通り考えをまとめたが,それを踏まえて,Geminiの出力も総合して考える

できれば壁打ちもする

2025年のSED論文を読む

色々なSEDアーキテクチャの実装例を探す

Mambaをdcase2024に移植する

振り返り

基礎を固めてから色々LLMに頼むのが吉

基礎を固めるために使うのもあり

今やっているのは若干基礎を飛び越えているため,もう少し段階を踏んで進んだ方が良かった

今後はきちんと基礎を学んでからLLMで実装など進めよう

待ち時間の有効活用は微妙

コンテクスト切り替えの疲労が若干あるかも

休憩をきちんと取っていなかったのも良くない

途中から意識したが,遅かった

あまり思考に集中できていない瞬間が多く,微妙に活力が余っている

短い時間で深く集中できれば待ち時間問題を部分的に解決できるかもしれない

結局考えていかないと終わらないが,要約や説明などのタスクをGithub CopilotではなくGeminiに頼むのは結構良かった

複数のLLMを使ってコンテキストを節約しながら進めるのが良いかも

2025/10/7 > 2025/10/8 > 2025/10/9