2025/10/8
#2025/10 #daily_log #inbox
やったこと
2025/10/8の研究ログ
色々修正中
訓練の実装は全部終わったはず
評価もスコア自体は出せている
メトリクス計算が上手くいってないだけ
それだけ修正すればOK
カメラを用いるAALの論文を探す
一旦終わり
ベースラインで埋め込み作成
ベースラインを動かす
ベースラインにConfident Mean Teacherを組み込む
Confident Mean Teacherの論文を読む
GPTとかGithub Copilotでコードを作る
10ラウンドやって若干の精度向上を確認
今度はフルで動かす > 完了したが,精度が若干偏っている
今度は信頼度を動的に動かすバージョンを実装
Github Copilotがやってくれました
それを現在動かしている
Mambaの音響イベント検知への応用を見つけはした
やってないこと
Cross-attentionによる特徴量結合の実装 < 自分の言葉で噛み砕く
/research-custard/卒論のゴールを考える
一通り考えをまとめたが,それを踏まえて,Geminiの出力も総合して考える
できれば壁打ちもする
2025年のSED論文を読む
色々なSEDアーキテクチャの実装例を探す
Mambaをdcase2024に移植する
振り返り
基礎を固めてから色々LLMに頼むのが吉
基礎を固めるために使うのもあり
今やっているのは若干基礎を飛び越えているため,もう少し段階を踏んで進んだ方が良かった
今後はきちんと基礎を学んでからLLMで実装など進めよう
待ち時間の有効活用は微妙
コンテクスト切り替えの疲労が若干あるかも
休憩をきちんと取っていなかったのも良くない
途中から意識したが,遅かった
あまり思考に集中できていない瞬間が多く,微妙に活力が余っている
短い時間で深く集中できれば待ち時間問題を部分的に解決できるかもしれない
結局考えていかないと終わらないが,要約や説明などのタスクをGithub CopilotではなくGeminiに頼むのは結構良かった
複数のLLMを使ってコンテキストを節約しながら進めるのが良いかも
2025/10/7 > 2025/10/8 > 2025/10/9