音声入力をすぐできるようにする

概要

音声入力の活用で生産性向上

キーボード入力に比べ、思考をそのまま言語化できるため情報伝達量が大幅に増加。

これまで面倒で共有しづらかった細かな知見も、音声入力により量・質ともに向上。

思っていることの正確なアウトプット

人間・AIへ“正しい量”を届けやすくなり、チーム内外とのコミュニケーション効率が向上。

今までは、キーボードで打ったり、文字情報でまとめるのに時間がかかる手間から控えていた

特に、文字情報で入力していると、文字情報化に思考を奪われるため、思っていることをすべて伝えられない。

まとめることはAIに任せて、自分は思っている事を話しながらOutputすることに集中する。

音声入力の利点を示す具体例として、本記事を執筆。

利用用途

AIが生成したOutputのレビュー作成

meeting前に、自分の思考をまとめてagenda作成

slackの返信を作る前に、自分の思考をまとめて返信作成

ポイント

マイク配置

概要

机の真正面にマイクを置き、“話せる状態”を視覚的に即認識“できるようにする。

配置の流れ

以前: 吊り下げ型をディスプレイ上部に設置 → ディスプレイ移動のたびにマイクも移動が必要で面倒

今: ディスプレイより下に固定、作業時はマイク固定運用

机上スタンドにマイクを載せる想定

ケーブルはシンプルで抜き差し容易、常時使用しない前提で取り外しやすさ重視

マイク具体機種は、Shure MV7+を利用

スタンドは、セットで購入したものを利用

https://gyazo.com/dc5eafecfc894f1a2b47a484e3495ac3

余談

kiiは、普段PC意外の別のデバイスにAirPods Proを繋いで、音楽を聞きながら作業をしている。

以前は、PCのマイクを単体で用意していなかったので、AirPods Proを接続し直していた。

少なくとも音楽聴きながら、PCで音声入力はできなかった。

なので、毎度スイッチコストがあった。

今は、音楽聴きながら入力できるので最高！

Aqua Voice: ワンアクションで音声入力オン／オフし、滑らかな音声入力体験を実現

キーボードショートカットでトグルできるようにする。

現在は音声入力ツール「Aqua Voice」を使用

以前は、Chat GPTのDesktopやiOS Appで入力して、Appleのユニバーサルクリップボードで渡してた。

Aqua Voiceのいいところ

フォーカス中のアプリに対し、会話終了と同時にテキスト出力

音声入力中に他操作をしてもウィンドウが閉じず継続できる点が利点

※Aqua Voiceを挟まずに、↓のChat GPTだけでやってもいいです。

音声入力をまとめるChat GPT Project: 人間が読みやすいように、音声入力テキストの自動要約

生音声入力テキストは、人間には冗長で読みにくい。コンテキスト情報と合わせ、情報量を減らさずに要約するツールが必要

ChatGPT のプロジェクト機能を活用中

code: knoqledge.md

### 役割

あなたは、Web Frontendアプリケーションの開発のプロフェッショナルで、

Product開発に精通しています。

また、音声入力で渡されたテキストをまとめる能力があります。

特に、Product開発における要求や要件をまとめる能力に長けています。

### 行うタスク

音声入力で入力された要件整理用の口頭のメモを、まとめてください。

情報は全く減らさないでください。

あくまで、言い淀みを減らすだけにとどめて下さい。

また、各コメントに対して行ってください。前回のコメントの内容は一切反映しないで、各コメントに対して言い淀みを減らすタスクをおこなってください。

まとめたOutputは、コピー&ペーストしやすいように、codeブロック内にmarkdown形式でまとめてください。

modelは、一番普通ので良い。

gpt 4oとか

例: この記事の作成モチベーションを口頭で話しつつ、記事情報コンテキスト渡して、概要も含ませて考えさせる。

code:gpt-project-input.txt

以下の音声をいい感じでまとめてください。もともとすでにベースの記事を書いてるんですけど、その記事のモチベーションというか概要をまとめたいって感じですね。音声入力の方ではモチベーションに関することを述べてるんで、モチベーションと概要をまとめてわかりやすくその記事の導入部分を作ってほしいです。

---

音声入力をすぐできるようにする

...(この記事全部コピペ)

---

この記事を書くモチベーションは、自分が最近音声入力でテキストを打つことがすごく増えまして、それによって生産性がすごく上がったし、自分の思考を他の人間とかAIに伝える量がちゃんと正しく、ちゃんとした量を伝えられるようになった。自分が今まで伝えるのが面倒くさいなって思っていたいろんな情報っていうのをちゃんと量を増やせるようになったのがいいと思っています。なので、それをそのメリットを示したいために今回記述します。

code:gpt-project-output.md

## 記事の導入 ─ モチベーションと概要

### モチベーション

- **音声入力の活用で生産性向上**

キーボード入力に比べ、思考をそのまま言語化できるため情報伝達量が大幅に増加。

これまで面倒で共有しづらかった細かな知見も、音声入力により量・質ともに向上。

- **正確なアウトプット**

人間・AI双方へ“正しい量”を届けやすくなり、チーム内外とのコミュニケーション効率が向上。

音声入力の利点を示す具体例として、本記事を執筆。

### 概要

#### 1. 音声入力を“すぐ”始められる物理環境

- **マイク配置**

- 机の真正面に **Shure MV7+** を固定し、視覚的に「話せる状態」を常時認識。

- 以前: 吊り下げ型をディスプレイ上部に設置→ディスプレイ移動時にマイクも移動が必要で不便。

- 現在: ディスプレイ下に机上スタンドで固定。ケーブルは抜き差し容易なシンプル構成（常時接続しない前提）。

- スタンドはセット付属品を使用。参考写真: <https://gyazo.com/dc5eafecfc894f1a2b47a484e3495ac3>

#### 2. ワンアクションで音声入力オン／オフ

- **キーボードショートカット** でトグル制御。

- 使用ツール: **Aqua Voice**

- 会話終了と同時にフォーカス中アプリへテキストを自動出力。

- 音声入力中に他操作をしてもウィンドウが閉じず継続可能。

- 以前は ChatGPT Desktop / iOS Appで音声入力していた。

#### 3. 音声入力テキストの自動要約フロー

- 生の音声入力テキストは冗長・読みにくい課題。

- **コンテキスト情報**と合わせつつ情報量を減らさず要約するツールが必要。

- ChatGPTの**プロジェクト機能**を活用中（knoqledge.md）。

- **役割**

Web Frontend開発のプロとしてProduct開発に精通し、音声入力テキストを要求／要件へ整理。

- **タスク**

- 音声入力メモを情報を減らさず言い淀みだけ排除。

- 各コメントごとに独立して実行。

- 出力はコピー&ペーストしやすいMarkdownコードブロック形式。

- 使用モデル: 標準（例: GPT-4o）。

---

上記の環境・フローにより「即話す→即テキスト化→即要約→共有」が一気通貫で実現。

結果として、思考を損なわずに他者へ迅速に伝達できるワークフローを確立した。

Tips

音声入力はどんなツールでもたまに失敗するケースがあるので、適度な量で出力して、追加入力するほうがいい。

2~3分で抑えた方が、失った時のダメージ低い。

上記からも、オン・オフが１アクションで切り替えられる方がいい。

Outputは完璧でないので、自分で調整することもある。

特に対人間は。