captiOnline4の説明
2022/01/13 若月大輔waka.icon
筑波技術大学 産業技術学部
目次
目的
captiOnline4の概要と構成などを理解する
主に文字通訳を担当する入力者が,captiOnline4の機能を学び,基本的な使い方を習得する
captiOnline4の概要
captiOnline(キャプションライン)はウェブブラウザだけで遠隔からPC文字通訳を行うことができるシステムです.ノートPCやスマートフォンなどでインターネットでウェブページを閲覧できる環境があれば,屋内外を問わずどこでも利用することができます.専用のソフトウェアや機器の導入も必要ないので,普段お使いの文字通訳用のPCだけで遠隔文字通訳が実現できます.
質の良い文字通訳には,入力者がやりやすい入力インタフェースが不可欠です.captiOnlineには入力者が快適な連係入力ができるよう様々な機能が実装されています(普段IPtalkを利用されている方からもご好評いただいています).また,最新版では音声認識を活用した入力や,Zoomへの字幕挿入機能なども備えています.
captiOnlineをすぐにお試しいただけるページをご用意していますのでぜひご体験ください!
構成等
クライアント:HTML5+JavaScript
しくみ
文字通訳に必要なデータを,サーバを介してクライアント間でやりとりすることで遠隔文字通訳を実現
WebSocketを利用した高速な通信を利用
SSL暗号化によるより安全な通信
主なデータの流れ
1. 利用者のPC等の端末から,ビデオ会議システム等を使用して音声を入力者へ配信する
2. 入力者は配信された音声を文字化して字幕を生成する
入力者はお互いの入力がリアルタイムに確認できるので連係入力が可能
3. 生成された字幕はサーバを介してリアルタイムに利用者へ提供される
https://gyazo.com/96849a7adc4857621b89a672b9b1810b
主な機能等
ウェブブラウザだけで文字通訳
アドレスを開くだけで文字通訳が可能
アプリのインストール等は不要
OSを問わない(Windows,MAC,スマートフォンなどどれでも利用できる)
ウェブベースの通信
ウェブページが見れるネットワークに接続していれば利用可能
通信の暗号化
HTTPS通信時,WebSocketも同様に暗号化するので盗聴されない
マルチルームで文字通訳
同一サーバで複数のルームで同時に文字通訳できる
文字通訳に必要な機能を実装
実際の文字通訳者の意見を元にインタフェースを設計(連絡,Fキー,訂正など)
高速な通信により連係入力が可能
文字の修飾
タグにより太字,斜体,色などの文字修飾が可能
字幕への画像挿入
図表や数式などを挿入できるハイブリッド字幕を生成可能
事前原稿の共同編集
入力者間で事前原稿(前ロール)の共有,共同編集が可能
音声認識による文字通訳
ブラウザに搭載されている音声認識エンジンによる発話の文字化が可能
認識結果を修正して出力も可能
コメントの送受信
同じルームにいるクライアント(利用者,入力者)どうしでコメントのやり取りが可能
音声配信
Typistページの使い方
用意するもの
パソコン
ネットワークインタフェースを備えたもの
インターネット環境
高速で安定なもの(光回線等,有線推奨)
モバイルルータ等でも実施は可能
ウェブブラウザ
Google Chrome推奨(開発環境と同じ)
Edge,Safari等でも可能
連係入力を行う場合はFirefoxは不可(他の入力者の入力の様子がリアルタイムに表示されない)
おおらかな心(重要!)
完璧ではなくベストを尽くすことを目指しましょう
入力者ががんばったところでネットやシステムなどの環境上の制限もある
インターネットを使用した通信なので不安定なこともある(ネットは水物)
遠隔情報保障が普及しはじめたのは最近なのです(研究は20年くらい前から)
浸透していなくてあたりまえ,完璧じゃないのはあたりまえ
入力者,利用者ともに現状の理解が必要
遠隔情報保障では横のつながりが増えます
異なる地域の入力者間で連係入力→作法の違いなど→よく相談して合理的に解決しましょう
あなたのせいじゃありません
きっとシステムのせいです(人がつくったものですから…ぜひ開発者へのフィードバックを!)
Typistのページを開く
ウェブブラウザでURLを開く
https://gyazo.com/f1d5200af11c9035f6e1b5ac2c6071d7
「Typist」リンクをクリック
https://gyazo.com/59017956363f2854860387601205621b
captiOnlineの入力者ページ
メインバー
字幕パネル
連係パネル
連絡パネル
交代タイマパネル
Fキーパネル
訂正パネル
原稿パネル
原稿モニタパネル
メモパネル
音声認識パネル
画像パネル
コメントパネル
YouTubeパネル
音声配信パネル
音声受信パネル
https://gyazo.com/d29d607fc8c32fe2706d1d2190ab23e1
初期設定
メインバーに自分の名前を入れる(最初はランダムな数字4桁)
パネルの配置を好みに合わせて変更する
各パネルに関連した設定は,そのパネルの歯車アイコンをクリック
何かがおかしいと感じたら,メインバーの歯車アイコンから「全ての設定を初期化」
※これらの設定は,ルームごとに保存されます
※設定はブラウザに保存されます.サーバには保存されません.
メインバー
特徴
captiOnline4全体に関する設定をする
各パネルの開閉ができる
QRコードを表示する
接続状況や接続者数,時間を確認できる
https://gyazo.com/fbb3c9ad4e3ea188a42e9552fa63c048
メニュー等(左から順に)
captiOnlineアイコン:クリックするとブラウザでもう1つ同じルームのページを開くことができる(なにげに便利)
歯車ボタン:captiOnline4全体に関係する設定や初期化をすることができる
画面
フォント:ページ全体のフォントを変更できる
画面スクロール禁止:パネル全体が画面外にでていてもスクロールさせない
スクロールバー非表示:スクロールバーを表示させないことで画面をスッキリさせることができる.スクロールはマウスホイールなどを利用する必要あり.
背景色:緯度と経度(初期値は日本経緯度原点)を設定して,現在の空の色をシミュレート
全設定
全設定の初期化:ルームの全設定を初期化する
全設定のダウンロード:ルームの全設定をファイルとしてダウンロードして保存する
全設定のアップロード:フームの全設定ファイルをアップロードして反映させる
ウインドウが重なったボタン:各パネルの開閉ができる
QRコードボタン:同じルームのTypistページにアクセスできるQRコードを表示する
入力者名:自分の入力者名を入力する
ルーム名:@の右側がルーム名(上の画像では「tmp」という名前のルーム)
顔アイコン:笑顔マークはサーバに接続中,泣顔マークは未接続状態を表す.マウスをホバーするとRTT(ラウンドトリップタイム)に関する情報を表示する.
人のアイコンと数値:ルームに接続している人(クライアント)の数を表す.マウスをホバーするとその内訳が表示される.
時計:現在の時間を表示する
役立つ情報等
画面スクロール禁止って?
入力中に他のパネルにフォーカスがあってしまい,予期せぬ画面スクロールを発生させないようにする機能です
他のルームでも同じ設定で使用するには?
全設定のダウンロードで保存したファイルを他のルームでアップロードしてください
字幕パネル
特徴
連係パネルなどで入力された結果を表出し,字幕の内容を確認する
User側にも同じ内容の字幕が表出される
フォントや行数などの表示設定ができる
https://gyazo.com/c0976f2aa60218eff9f0cea05c150845
使い方
表出された字幕を確認する
メニュー等
歯車ボタン
画面
フォント,文字色,背景色:字幕のフォント,文字色,背景色を設定する
行数:字幕の行数を設定する.パネルサイズに応じて自動でフォントサイズが変更される(フォントサイズを直接変更する設定はない)
行間:字幕の行間を設定する(1で行間なし)
スクロール速度:新しい文が挿入されてスクロールをするときの速度を設定する
訂正可能なログの文数制限:訂正パネルでさかのぼって訂正できる文の数を設定する(数値を大きくすると表出ログが増えた際に動作が重くなる可能性がある)
表示オプション
ユーザのコメント表示:コメントパネルで入力されたコメントを字幕上に流して表示する
入力中の字幕表示:入力や音声認識している最中の文をリアルタイムに表示する
修正中の文表示:訂正パネルで訂正している最中の文をリアルタイムに表示する
自動ふりがな:漢字に自動でふりがなをふる(IPADIC辞書を使用しているが誤ったふりがなが表示されることもある)
改行なし表示:入力に改行が含まれていいても,無視して改行なしで表示する
文書ボタン
ダウンロード:字幕のログをテキスト形式,HTML形式,CSV形式でダウンロードする(管理者の設定で無効になっていると表示されない)
消去:字幕のログを削除する
再生成:サーバに保存された字幕データから字幕のログを再生成する(管理者の設定で無効になっていると表示されない)
役立つ情報等
字幕データはサーバに保存されるの?
captiOnline4では保存されます.法令に基づく場合などの例外を除き,利用者の同意なく第三者へ提供されることはありません.
管理者の設定から保存しないように変更することも可能です(この場合,再生成はできなくなります)
連係パネル
特徴
自分の入力領域(図では背景白)と他の入力者の表示領域(図では背景グレー)が一緒に表示される
ドラッグ&ドロップで順番を入れ替えられる
自分の入力領域を複数設けることができる
各領域は端をドラッグ&ドロップすることでサイズを変更できる
https://gyazo.com/aae2c2bfe3f4eaff3b4ddb0809bba8ad
使い方
自分の入力領域に文をタイプしてエンターキーで送出
Shift+エンターキーで改行が可能
連係入力に必要なUndoなどの基本的なファンクションキー(Fキー)機能を利用する
Fキーパネルを参照
自分の入力領域と他の入力者の領域は名前の部分をドラッグして順番を変更する
2人連係入力をする場合は,パートナーを自分の入力領域の上に配置すると良い
領域の高さを領域の下の部分をドラッグすることで調整する
自分の入力領域のを高くすることで,変換候補が下の人に重なるのを防ぐことができる
文字修飾をする
b太字0 のようにすると 太字 となる.他にも斜体や下線,着色などがある.
メニューの当該ボタンを押すと自動でタグが出力される
メニュー等
歯車ボタン
画面
フォント:連係パネル内のフォントを指定する
自分のフォントサイズ/文字色/背景色:自分の入力領域などのフォントサイズ,文字色,背景色を設定する
他者のフォントサイズ/文字色/背景色:他の入力者の表示領域などのフォントサイズ,文字色,背景色を設定する
表示オプション
他者の原稿操作を表示:他の入力者の原稿パネルの選択行を表示する
入力支援
送信時の接頭文字列:文を送出する際に,ここで設定した文字列を頭につける
入力後に改行:文を送出する際にその文末に改行をつけて送出する
for Chat ボタン:クリックすると接頭文字列と改行を自動設定して,入力した文がチャットのように出力される
送信抑制する行頭文字:ここで設定した文字列が文頭にあると,字幕に出力されない(入力途中も)
自動改行する文字列:ここで設定した文字列の次に自動で改行を挿入する.複数行に設定することで複数の文字列で自動で改行を挿入できる
文字列の変換:変換前文字列と変換後文字列を半角スペースを挟んで設定する.複数行に設定することで複数の変換を設定できる
回転矢印ボタン:他の入力者の状況を更新する(接続状況が悪く,いない/いるはずの入力者がいる/いないときにクリック)
+ボタン:自分の入力領域を1つ増やします
B/I/U/Sボタン:文字を修飾(太字,斜体,下線,打消線)するタグを出力します
カラーボタン:文字を修飾(それぞれのカラーで着色)するタグを出力します
役立つ情報等
「。」で必ず改行するようにしたいです
自動改行する文字列に「。」を設定してみてください
かな漢字変換の候補で他の入力者の表示領域が隠れて見えなくなってしまいます
自分の入力領域の下端をドラッグして変換候補に重ならなくなるように高さを調整すると良いかもしれません
ユーザ名が表示されている枠の幅もドラッグで調整できます
入力領域で改行がしたいです
Ctrl+EnterかShift+Enterで改行を入れることができます
文字修飾のボタンをクリックするのがダルいです
太字,斜体,下線,打消線はそれぞれ,Alt+b/i/u/sに対応しています.カラーもAlt+1〜9に対応しています
連絡パネル
特徴
入力者間でメッセージを送り合うことができる
特定の入力者にメッセージを送ることができる
https://gyazo.com/8e055f2002c9afa8c06bea6fa93bc25e
使い方
パネルの下部にある入力領域にメッセージを入力してエンターキーで送信
送信先を選択して特定の入力者へのメッセージ送信
メニュー等
歯車ボタン
画面
フォント:連絡パネル内のフォントを設定する
フォントサイズ/文字色/背景色:メッセージのフォントサイズ/文字色/背景色を設定する
通知色:新しいメッセージが投稿された時の通知色を設定する
スクロール速度:新しいメッセージが投稿されてスクロールをするときの速度を設定する
タイムスタンプ:投稿されたメッセージにタイムスタンプをつける
連係パネルへの背景通知:新しいメッセージが投稿されたときに連係パネルの背景色を変更して通知する
連係パネルへのスクロール文通知:新しいメッセージが投稿されたときに連係パネル上にスクロールする文で通知する
文書ボタン:ログのダウンロード(テキスト形式/HTML形式),消去をする
紙飛行機アイコン:メッセージの送信先を指定する.(Everyone)で全体に送信する
役立つ情報等
他の入力者が連絡パネルにメッセージを入力している最中は,「若月…」のような表示がされます.
交代タイマパネル
特徴
設定した時間間隔で交代メッセージなどを全ての入力者に通知することができる
再生,停止,次へなどの操作ができる
残り時間をプログレスバーで視覚的に表示する
https://gyazo.com/02d279254d1915e787c76ae175fb4031
使い方
タイマー設定を開いて交代文と交代時間を設定する
再生ボタン▶をクリックして開始
適宜,一時停止,停止,次へボタンでタイマーを操作
メニュー等
歯車ボタン
画面
フォント:交代タイマパネル内のフォントを設定する
フォントサイズ/文字色/背景色:メッセージのフォントサイズ/文字色/背景色を設定する
通知色:新しいメッセージが表出された時の通知色を設定する
スクロール速度:新しいメッセージが表出されてスクロールをするときの速度を設定する
タイムスタンプ:表出されたメッセージにタイムスタンプをつける
連係パネルへの背景通知:新しいメッセージが表出されたときに連係パネルの背景色を変更して通知する
連係パネルへのスクロール文通知:新しいメッセージが表出されたときに連係パネル上にスクロールする文で通知する
文書ボタン:ログのダウンロード(テキスト形式/HTML形式),消去をする
タイマ設定ボタン
タイマ(再生時に上から順に再生されていく)
Message:表出されるメッセージを設定する
Minute:メッセージを表示する時間を設定する
☒ボタン:設定したメッセージを削除する
+ボタン:新しいメッセージを作成する
https://gyazo.com/1947a675948e8f36f5e0661561601b58
再生ボタン:タイマを再生する
一時停止ボタン:タイマを一時停止する
停止ボタン:タイマを停止する
次へボタン:次のメッセージを表出させる
メニュー下のステータス領域
表示しているメッセージの残り表示時間の提示(残り時間に応じて緑→黄→赤と変化)
現在のメッセージの表示
役立ち情報等
そもそも何に使うパネルですか?
対面の現場では直接入力者同士でやりとりしたり,チャット等(連絡パネル)を使用したりして交代の通知などをしていたと思いますが,オンラインではそれが難しい状況があります.交代の通知を自動化するためのパネルです.
各メッセージごとに設定する時間を変更できるんですね
captiOnline3では全てのメッセージを同じ時間で表出していましたが,入力者の熟練度の違いなどを考慮して,それぞれ異なる時間で設定できるようにしました.
Fキーパネル
特徴
事前に定型句を指定しておいて,ファンクションキー(Fキー)でそれを利用,表出できる
Shift+Fキーにも定型句を設定できる(⇑F1などの標記)
https://gyazo.com/939eea6dfc82af8401d7c72ab03eb61c
使用方法
各ファンクションキーに定型句を入力し設定する
連係パネルで設定したファンクションキーを押すと,その定型句が字幕に挿入される
チェックボックスにチェックを入れておくと直接送出できる
メニュー等
歯車ボタン
画面
フォント/フォントサイズ:ファンクションパネル内のフォントとフォントサイズを設定する
機能
F1: ふりがな:F1キーに連係パネルで入力した文のフリガナを自動設定する
F8: 括弧 左/右:F8キーで出力される括弧を設定する
⇑F8: 括弧 左/右:Shift+F8キーで出力される括弧を設定する
役立つ情報等
ふりがなが不完全なのですが…
F1のふりがなは,かな漢字変換前のひらがなが自動設定されますので,短い読みで辞書登録された漢字などのふりがなは正しく出ません.
訂正パネル
特徴
字幕として表出された文が順に表示される
文を修正することで,字幕上の文も同時に修正される
他の入力者が修正している文は,その文の背景が明滅する
https://gyazo.com/d97cd001b203722ef9b834cf8dde184c
使用方法
訂正したい文にフォーカスを合わせて,文を修正したらエンターキーを押して確定する
Tabキーで次の文,Shift+Tabで前の文に戻ることができる
設定
歯車ボタン
画面
フォント/フォントサイズ:ファンクションパネル内のフォントとフォントサイズを設定する
文字色/背景色:文の文字色/背景色を設定する
通知色:他の入力者が文を修正しているときの通知色を設定する.修正時はここで設定した色で背景を明滅させる
スクロール速度:新しい文が挿入されたときにスクロールする際の速度を設定する
訂正可能なログの文数制限:訂正パネルでさかのぼって訂正できる文の数を設定する(数値を大きくすると表出ログが増えた際に動作が重くなる可能性がある)※字幕パネルにある設定と同じ
文書ボタン
訂正文リストの消去や再生成(字幕パネルに表出されている文を元にする)をする
役立つ情報等
複数の入力者が同じ文を修正したらどうなるの?
だれかがエンターを押した時点でその訂正情報が全てのクライアントに送信され反映されますので,タイミングによっては予期しない訂正となることがあります.訂正時の担当やルールを決めるなどの対応を採ってください.
原稿パネル
特徴
事前に作成した字幕の原稿から,文を順に送出できる
複数の原稿を切り替えて使用することが可能
入力者間で原稿の共同編集が可能
テキスト形式で作成した原稿をアップロードすることが可能
https://gyazo.com/85b86188b72224479fa2c33fb4e9a1e9
使用方法
原稿を作成する
空の原稿を作成してテキスト入力やコピーペースト,テキストファイルのアップロードなど
字幕へ送出したい行にキャレット(カーソル)を移動させてF1キーを押すと送出され,キャレットが次の行へ移動する
F12キーで送出した際は,キャレットがある行の文の頭に改行をつけて字幕に送出する(1文1行で字幕に送る場合)
F2キーでキャレットがある行の文を連係パネルに送る(他の入力者の連係パネルに表示される)
原稿操作の状況(キャレットがある行とその前後の文)を他の入力者にモニタしてもらうためには,操作の配信ボタンを押す
原稿操作の状況が原稿モニタパネルに表示される
メニュー等
歯車ボタン
画面
フォント/フォントサイズ/行間/文字色/背景色:原稿のフォント,フォントサイズ,行間,文字色および背景色をそれぞれ設定する
選択行の文字色/選択行の背景色:キャレットがある行の文字色と背景色を設定する
他者のキャレット表示:他の入力者のキャレットの位置を表示する
入力支援
行をコメント化する文字列:ここに設定された文字列が行頭にある行は,F1などでも送出されない
エンターキーで送信:F1だけでなくエンターキーでも送出できるようにする
モニタ
モニタ用に送信する行数:原稿モニタに送信する行数を設定する
Help
操作の配信ボタン
原稿操作の状況(キャレットがある行とその前後の文)を原稿モニタパネルに配信する.配信時は Live Streaming と表示される
停止ボタン:操作の配信を停止する.停止すると Stop と表示される
原稿の更新ボタン:サーバに保存されている原稿と同期させ内容を更新する(ネットワークの不調等で共有がうまくいっていないときなどに利用する)
原稿の生成ボタン ※入力者ページ全体に影響します
新しい原稿:原稿名を入力して空の原稿を生成する
原稿のアップロード:PCにあるテキストファイルを選択し,アップロードする
操作マニュアル:原稿パネルの操作マニュアルを原稿として生成する
原稿の削除ボタン:現在表示中の原稿を削除します ※入力者ページ全体に影響します
原稿の名前変更ボタン:現在表示中の原稿の名前を変更します ※入力者ページ全体に影響します
原稿の選択ドロップダウンメニュー:表示する原稿を選択します
メニュー下のステータス領域
操作の配信状況(Live Streaming/Stop)の表示,CRDTのサーバへの接続状況(笑顔マーク/泣顔マーク)を表示します
CRDTのサーバはcaptiOnlineと同じサーバで稼働しています
泣顔マークのときはCRDTのサーバに接続できていません
共同編集のしくみ
CRDT(Conflict-free Replicated Data Type)と呼ばれるデータ構造の実装を活用して,複数の人のテキスト編集操作をマージする仕組みを採用している ある人の原稿の編集と,他の人の原稿の編集(操作)が同時に行われると,その瞬間に異なる原稿がそれぞれで生成されることになりますが,これらの原稿の操作をあとでマージして整合性を保ちます.
複数の人が同じテキストファイル(原稿)に文字を入力したり,削除したりしている様子がほぼリアルタイムに共有することができます
役立つ情報等
原稿はどこに保存されますか?
サーバに保存され,入力者間で共有,共同編集ができるようにしています.取り扱いについては字幕のログと同様です
用語を検索したりできますか?
Ctrl+Fでできます.その他の機能については,原稿の生成ボタン→操作マニュアル→追加で生成される操作マニュアルを参照してください
CRDTのサーバへの接続状態が泣顔マークのままです
一部のネットワークではCRDTのサーバへ接続できないことを確認しています.今後のアップデートで対応予定です
原稿モニタパネル
特徴
原稿パネルの原稿操作の状況を表示することができる
原稿送出担当が原稿のどこにカーソル(キャレット)を置いているか,キャレットの前後の行をモニタできる
原稿モニタパネルを使用するには,モニタしたい入力者の原稿パネルで操作の配信をオンにする必要がある
https://gyazo.com/95d8abecb288f69567662adc9a1dfb08
使用方法
モニタしたい入力者の原稿パネルで操作の配信ボタンをクリックして配信状態にする
原稿モニタパネルでモニタしたい入力者の名前を選ぶ(基本的にはAutoのままでOK)
メニュー等
歯車ボタン
画面
フォント/フォントサイズ/行間/文字色/背景色:原稿のフォント,フォントサイズ,行間,文字色および背景色をそれぞれ設定する
選択行の文字色/選択行の背景色:モニタ中の原稿にてキャレットがある行の文字色と背景色を設定する
Help
モニタ対象の選択ドロップダウンメニュー
モニタする入力者を選択する
メニュー下のステータス領域
モニタ中の入力者と原稿名が表示される
役立つ情報等
メモパネル
概要
ちょっとしたメモを入力,保存しておくことができる
https://gyazo.com/ce4bfefffc4b4cd69afd65d8134b3369
使用方法
メモをタイピングする
メモを見る
メニュー等
歯車ボタン
画面
フォント/フォントサイズ/行間/文字色/背景色:原稿のフォント,フォントサイズ,行間,文字色および背景色をそれぞれ設定する
選択行の文字色/選択行の背景色:キャレットがある行の文字色と背景色を設定する
メモの削除ボタン:メモを削除する
役立つ情報等
音声認識パネル
音声認識を利用して音声の文字化をする
文字化した結果を字幕パネルや連係パネル,原稿パネルに送ることができる
日本語以外の様々な言語に対応している
https://gyazo.com/9bab3e4edd72a531e2c12314eb23a4ec
使用方法
音声認識結果を送る方法方法を選択する
開始ボタン▶をクリックするとマイクに入力された音声を文字化する
終了するときは停止ボタン■をクリックする
メニュー等
歯車ボタン
音声認識
言語:認識する言語を選択する
継続的:音声認識を区切る長さを設定する.ONにすると一文を長めに認識する
文字列の変換:変換前文字列と変換後文字列を半角スペースを挟んで設定する.複数行に設定することで複数の変換を設定できる
接頭文字列:音声認識で出力される文の先頭に,ここで設定した文字列をつける
接尾文字列:音声認識で出力される文の最後に,ここで設定した文字列をつける.例えば「。」を設定すると認識結果に句点をつけて出力ができる
エラーメッセージの表示:音声認識エンジンが返すエラーメッセージを表示する(デバッグ用)
画面
フォント/フォントサイズ/スクロール速度:音声認識パネル内のフォント/フォントサイズ/スクロール速度を設定する
開始ボタン:音声認識を開始する
停止ボタン:音声認識を停止する
次へボタン:認識中の音声を中断して次の認識を開始する.音質の悪い音声の入力等により認識が止まっているときなどに使用すると良い
送信先ドロップダウンメニュー:音声認識の結果を送信先を選択する(字幕,字幕(改行付き),字幕(チャット風),連絡,原稿)
役立つ情報等
音声認識エンジンはなんですか?
Web Speech APIのSpeech Recognitionインタフェース(要はブラウザの機能)を使用しています
おそらくクラウド型の音声認識エンジンです
使用するマイクを変更するには?
Chromeの場合は音声認識を開始するとアドレスバーの右側にマイクのアイコンが現れるので,これをクリックしてマイクを選択してください.その後リロードをすると設定が反映されます.
https://gyazo.com/07141cf5e07595ef895ca5941a148232
音声認識を修正しながら字幕を作成したいのだけど
音声認識結果の文が字幕パネルに出力されると,訂正パネルにも同じ文が出力されるので,こちらを修正することで実現できます
音声認識結果をそのまま字幕パネルに出力せず,確認修正した上で出力するには,認識結果の送信先を原稿にして原稿パネル上で修正した上で字幕パネルに送出することができます
ZoomやYouTube等で出力される音声を認識するには?
Windowsの場合:PEPNet-Japanで公開しているマニュアルを参照してみてください
PCの構成によってはうまく行かない場合があるとのことです
Macの場合:BlackHoleなどの仮想オーディオドライバとLadioCastを組み合わせて使用します
画像パネル
画像を字幕に挿入してハイブリッド字幕を生成できる
PCに保存された画像ファイル,Webページに表示された画像,PPTなどのオブジェクトをドラッグ&ドロップすることができる
画像パネル上の画像を直接字幕に挿入,連係パネルや訂正パネルなどにドラッグ&ドロップして使用することも可能
https://gyazo.com/6e2f26c94e48b74f4bb5bf549c3e4737
使用方法
画像パネルに画像ファイルや画像をドラッグ&ドロップする
挿入したい画像にマウスカーソルを当てると紙飛行機ボタンが現れるので,それをクリックすると字幕に画像を挿入できる
画像を連係パネル,訂正パネル,メモパネルにドラッグ&ドロップすると画像を挿入するタグが挿入される
画像は右寄せで表示されて,挿入された場所に画像へのリンクとサムネイルが表示される
画像や画像のリンクをクリックすると画像が拡大される
https://gyazo.com/8d8eabf31046d9295602bc6be2cc81e2https://gyazo.com/b0b8a63d29a694def56726dc6937e8a0
メニュー等
歯車ボタン
画面
画像の最大高:画像パネルに表示されるの最大高を設定する(字幕に表示されるときの高さはではない)
スクロール速度:新しい画像がドラッグ&ドロップされたときのスクロール速度を設定する
利用可能な画像の要求ボタン:サーバ上の当該ルームに保存されている利用可能な画像ファイルを要求して,画像パネル上に表示して利用できるようにする
画像を日付順でソートボタン:画像パネル上にある画像を日付順でソートする
選択された画像の削除ボタン:各画像の右上のチェックボックスにチェックが入った画像を一括で削除する
役立つ情報等
画像パネルでアップロードされた画像はどこに保存される?
ルームごとにサーバに保存されます.取り扱いについては字幕のログと同様です.
画像パネルで画像を削除したら,字幕パネル上でその画像が見れなくなりました
サーバ上に保存した画像を引用して表示しているので,画像パネルでその画像を削除すると参照できなくなり表示できなくなります
コメントパネル
特徴
字幕利用者や入力者がコメントを共有することができる
同じルームにいる人どうしでコミュニケーションができる
字幕パネルの設定により字幕上にコメントを流すことができる
https://gyazo.com/db1b7ff66f4268390161c948f711c775
使用方法
コメントパネルの下の入力欄にメッセージを入力してエンターキーを押す
字幕パネルの設定→表示オプション→ユーザのコメント表示を有効にすることで,字幕上にコメントを流して表示できる(Typistのコメントは黄色,Userのコメントは水色で表示されます)
コメント受信時にコメントが表示されない状態(コメントパネルを開いていない,字幕パネルでユーザのコメント表示を有効にしていない)のときに字幕パネルの右上に吹き出しマークを表示する.吹き出しマークをクリックするとコメントパネルを開く
https://gyazo.com/0c5708755ebe6f8fd501709527b2827c
メニュー等
歯車ボタン
画面
フォント/フォントサイズ/文字色/背景色:コメントパネル内のフォント/フォントサイズ/文字色/背景色をそれぞれ設定する
通知色:コメントを受信した際のコメントの背景色を設定する
スクロール速度:新たなコメントを受信してスクロールが必要な時のスクロール速度を設定する
タイムスタンプ:タイムスタンプの表示/非常時を設定する
連係パネルへの背景通知:新たなコメントを受信した際に,連係パネルの背景を明滅させて通知するようにする
連係パネルへのスクロール文通知:新たなコメントを受信した際に,連係パネルにそのコメントを流して通知するようにする
Help
ログ操作ボタン:投稿されたコメントのダウンロード/消去/再生成をする
再生成は字幕パネルに残っているコメントを利用して再生成する
役立つ情報等
利用者にコメントを投稿してほしくないのですが…
管理者設定でコメントの許可/不許可を切り替えることができます
YouTubeパネル
特徴
同じルームにいる人に対してYouTubeの動画を同期させながら再生することができる
YouTubeの動画を使用した入力の練習に使用できる
Userのページでも同期させながら再生できるのでYouTubeの動画にリアルタイムで字幕をつけることができる
https://gyazo.com/db1932d29ae7778d0f44031732d336bb
使い方
歯車ボタンをクリックしてYouTubeのビデオIDを設定する
YouTubeビデオの操作担当者(1名)が,操作担当になるボタンをクリックする
YouTube上の再生ボタン▶をクリックする
停止やシークバーによる操作も可能
メニュー等
歯車ボタン
ビデオ
ビデオID:YouTubeのビデオIDを設定する.
遅延:YouTubeを再生するときの遅延を設定する.
Userのページで5秒程度に設定すると映像と連係入力のタイミングが合うかもしれない
Help:
操作担当になるボタン:YouTubeのビデオの操作担当者になり,ビデオの再生,停止,再生位置の変更(シークバーの操作)などを行えるようになります.操作担当者はルームで1名だけなので他の入力者がこのボタンをクリックすると担当者がその人に移動する
YouTubeプレーヤーの更新ボタン:YouTubeプレーヤーを更新する.同期がおかしいときなどに使用する
音量スライダーバー:YouTubeの音量を調整します
役立つ情報等
YouTubeの動画はどうやって同期していますか?
操作担当者のビデオIDや再生状態,再生位置に関するデータを他の人に定期的に送信して同期しています.再生が同期していない場合は,自動で再生を速くする/遅くするなどして同期を試みます
同期のための再生が速い/遅いが長いときは,YouTubeプレーヤーの更新ボタンをクリックしてみてください
音声配信パネル
マイクに入力された音声を他の入力者に配信するために使用します
遠隔での文字通訳の場合,Zoom等のビデオ会議を使用することが多いと思いますので,そちらの使用を推奨します
音声受信パネル
他の入力者から配信された音声を再生します
音声配信する人のPCとOSが異なる場合に,うまく再生できないことがあります
遠隔での文字通訳の場合,Zoom等のビデオ会議を使用することが多いと思いますので,そちらの使用を推奨します
Administratorページの使い方
用意するもの
Administratorのページを開く
「Administrator」のリンクをクリックします
captiOnlineの管理者ページ
部屋情報
部屋の別名
ユーザ名とパスワード
利用者用
入力者用
管理者用
接続者の管理
字幕ログ
音声認識
コメント
文字修飾
https://gyazo.com/b87a8a696aa05b29f80e416afd3b741e
部屋情報
特徴
ルーム情報や接続状況を確認できる
https://gyazo.com/d97bd85d39a2290917a8a19ec8eda1d4
使用方法
部屋名,接続状態,接続数を確認する
部屋の別名
特徴
当該ルームの別名を設定できる
一時的な利用者に当該ルームを使用してもらう場合に部屋の別名(エイリアス)を作成して使用してもらい,使用が済んだらそのエイリアスを削除するといった使用が可能
https://gyazo.com/764cf186848538aefbc00aa75840b94b
使用方法
New alias と表示されている欄に別名(半角英数)を入力し,追加ボタンをクリック
Alias list と表示されている欄に別名が表示される(設定した部屋名_文字の羅列)
Copyボタンでそのルームのアドレスをコピーすることができる
QR Codeボタンで,そのルームへのQRコードを表示できる
☓ボタンで設定した別名を削除できる
役立つ情報等
別名とは複数の別のルームを作れるという意味ですか?
いいえ,同じルームに別名(別のアドレス)でアクセスできる機能です.一時的な利用者に本当のルーム名をしられたくない場合などに使用します
複数のルームが必要なときはご連絡ください
ユーザ名とパスワード
特徴
利用者,入力者,管理者の各ページ(User,Typist,Administrator)を開くためのアカウントとパスワードを設定する
各ページごとに複数のアカウントとパスワードを設定できる
https://gyazo.com/ab1aa5941bd326a19b161f6a8f4c422d
※上の図では利用者ページはパスワードなし,入力者ページにhoge,管理者ページにadminという名前のアカウントが設定されている
使用方法
New usernameの欄にアカウント名,New passwordの欄にそのアカウントのパスワードを入力し,追加ボタンを押す
Account listの欄に追加されたアカウント名が表示される(利用者と入力者についてはGen. URLボタンが表示される)
Gen. URLボタンを押すとパスワード入力が求められ,そのアカウントに設定したパスワードを入力するとアカウント情報を含んだリンクが生成される
この特別なリンクを利用者に提供することでアカウント情報を入力することなくページを開くことができる(が,部屋の別名で代用できる場合もあるのであまり出番はないかもしれない)
https://gyazo.com/d36c9cd94d68a2eda4b51bb1a3eabf2f
役立つ情報等
アカウントごとに複数のルームが作られるということですか?
いいえ,同じページを異なるアカウントとパスワードで開くことができるようにするものです.例えば,一時的にページに入って欲しい人のためのアカウントを作成し,使用が終わったらそのアカウントを削除するような使い方ができます
利用者用のページにパスワードを設定したのですが,パスワードなしで開いてしまうのはなぜですか?
各ページを開くことができる権限は,Administrator > Typist > User の順で設定されています.これは例えばTypistのアカウントであれば,Userのページ(利用者ページ)をひらくことができることを意味しています
Userにアカウントを設定していたとしても,Typistにアカウントの設定がなければ,アカウントなしでTypistとUserのページにアクセスできることになります
管理者ページにパスワードを設定したのですが,アクセスしてもパスワードの入力が求められません.大丈夫でしょうか?
captiOnline4ではブラウザの認証機能を用いています.この認証情報は一時的にブラウザに保存されるため,一度アカウント認証をクリアすると同じページにアクセスする場合に求められないことがあります.確認をするためにはブラウザの関係するキャッシュを削除するなどしてみてください
接続者の管理
特徴
特定の利用者や入力者の接続切る(キック)することができる
悪質なユーザに対しては,1時間接続を拒否することができる
https://gyazo.com/11695478ab1aa1864e4c7db80d87f76e
使用方法
再読込ボタンを押してClient List(同じルームに接続している人のリスト)を更新する
キックしたい人のKick!ボタンをクリックする
キックされた人はルームの接続が切れ,字幕を見れない/入力できないようになりますが,リロードをされた際は再接続できる
1時間接続を拒否したい人については for 1h ボタンをクリックする
された人は1時間の間,リロードをしても同じルームにアクセスできなくなる
役立つ情報等
誤って for 1h を押してしまいました解除する方法はありますか?
一度設定をすると管理者からは削除できませんので,使用する際はご注意ください
字幕ログ(文字部分をクリックすると展開する)
特徴
字幕のログの取り扱いに関する設定ができる
字幕のログの保存等を行うことができる
https://gyazo.com/c6e4c0822c00045bdf7f24bf761898ea
使用方法
サーバ上でログ記録:字幕として表出されたログをサーバ上に記録するかどうかの設定
チェックをはずしてログ記録を無効にすると,過去の字幕の再生成はできない
スクロール許可:利用者と入力者ページの字幕パネルにおいてスクロールを許可するかどうかを設定します
スクロールを許可しない設定にすると,表出された字幕ログをスクロールさせて見ることができなくなる
ダウンロード許可:利用者と入力者ページの字幕パネルにおいて,字幕ログのダウンロードを許可するかどうかを設定する
再生成許可:利用者と入力ページの字幕パネルにおいて,サーバ上の字幕のログ記録を使用して再生成を許可するかどうかを設定する
字幕:字幕の表示,保存等を行うことができる
主に過去のログ記録から字幕を再生成してダウンロードする際に使用する
Defaultボタンで初期設定に戻せる
役立つ情報等
音声認識(文字部分をクリックすると展開する)
特徴
各ページで音声認識の利用の許可設定をする
https://gyazo.com/b619874ce38eae6bcfa7d1572498f4ee
使用方法
音声認識の許可:利用者と入力者ページの音声認識パネルにおいて,音声認識を許可するかどうかを設定する
Defaultボタンで初期設定に戻せる
役立つ情報等
利用者ページで音声認識を許可する意味は?
利用者ページによる個人利用が多い場合は,Userを有効にしておくと利用者ページで音声認識パネルを使用できます
現場で音声認識を使用する場合は,利用者ページで音声認識をした結果を入力者ページで修正するといった使用も検討できます
コメント(文字部分をクリックすると展開する)
特徴
各ページでコメント投稿を許可するかどうかを設定できる
https://gyazo.com/ee722b58aad4b279388831b9049a32df
使用方法
コメント投稿許可:利用者と入力者ページの投稿パネルにおいて,コメントの投稿を許可するかどうかを設定する
チェックをはずすと,コメントパネルの入力部分が無効状態になる
Defaultボタンで初期設定に戻せる
文字修飾
特徴
入力ページの連係パネルにおける1〜9のタグに文字色を設定する
https://gyazo.com/c19470da76731dbaf17931ecfd291bba
使用方法
設定するタグをクリックしてカラーを選択する
設定はルーム全体に反映される