J-Moshi - 西尾泰和の外部脳

J-Moshi

atsumoto_ohashi 日本語リアルタイム音声対話モデルJ-Moshiを公開しました！

@kyutai_labs のMoshiをベースとし、人間のように「話す」と「聞く」を同時に行います。

日本語で利用可能な初めてのモデルです。

モデルサイズは7Bと軽量なのでぜひお試しください

#NLP2025 で発表予定です。

takahiroanno 相槌とかフィラーとかカットインがめちゃ自然ですごい、、、！　しかも7Bの小ささでこの仕上がり！

これをローカルマシンで動かしたらAdvanced Voiceに依存せずに音声でのタスク整理ができるかもな

いつのタイミングかわからないけどAdvanced Voiceを無音で放置していると5分くらいで切断されるようになったのでPC作業してる時につけっぱなしにしておいて、ふと思いついたときに音声で操作するってやりかたができなくなった

J-Moshiは試作段階であり，その応答は不自然な場合があります．また，J-Moshiの学習データの大部分は雑談対話であるため，ユーザの指示に従った応答を生成することはできません．

あー、これがどれくらい影響するだろう

Macで動くように変換した話

2025-01-25

install中

動くは動く

まだ現時点では日本語で無料で動くようになった、という感じ

九官鳥みたい

まだ会話で有用なタスクをできるわけではない

ユーザの指示に従った応答を生成することはできません．ってことだな