雑談ページ3
なんでも書いていいページですnishio.icon
もちろんここに限らずどこに書いてもいいのですが、雑談することが目的のページがあった方が気兼ねなく書けるかなという意図です
サブタイトル
新年早々イベントラッシュ!
2024/1/2
新年あけましておめでとうございます!cFQ2f7LRuLYP.icon
和訳停滞中
おめでとうございます!nishio.icon
このイベントでフォーラムに入る人もいると思うのでちょうどいいから新年区切りで雑談ページをローテーションしといた
Glen来日イベントが終わったら次のマイルストーンはこれかな
akinorioyama.iconさんと話してこの方針でやっていくことにしました!
イベントの説明などを考える
機械翻訳版をみんなで読んでいく
疑問点や感想などを好きに書き込める
Scrapboxの特徴により参加してる人たちの疑問や感想がリアルタイムで共有される
みたいな感じ
1/3
🎉cFQ2f7LRuLYP.icon
🎉healthy-sato.icon
🎉tkgshn.icon*4
コメント: 機械翻訳の結果の文章と、人力翻訳の結果の文章とコメントとの区別がわかりにくい
たしかにnishio.icon
気になったので来ましたinajob.icon
気になる人たちがやっているので来た、というレベル
ここからこのトピック自体を自分が気になるところまで持っていくのが次に期待されること
ようこそ!nishio.icon
1/4
音声自動認識からの機械翻訳で日本語での字幕が見れるようになってました、復習が捗るね!nishio.icon
https://scrapbox.io/files/65969c5f21dbba0023d0d03a.png
残念ながら僕は週末に予定があるんですけど、ない人は字幕付きで見返してみるのはとても良いと思う
(僕もYouTubeをダウンロードしたら移動の電車で視聴できるかな?)
「英語動画は苦手〜」って人が読むためのページができましたnishio.icon
你行你来の訳を探してますtsuzumik.icon もしやPlurality bookの範囲外です...?
ですnishio.icon
後で書く→書いた!
ありがとうございますtsuzumik.icon
これ超welcomeですnishio.icon
何が理解の役に立つのかは事前にはわからないので役に立つかもしれないものはなんでも集めてリンクで繋いでいく
書いておけば後から繋がる
やっていきますtsuzumik.icon
仕事がいろいろありそう
機械翻訳にやすりをかけて磨く営み
こっちは根気が続かないtsuzumik.icon
キーワードにあてる訳語を造語する営み
気になるキーワード一覧みたいなの作りたい
キーワードも本文を読んでいけば見つかる?
1/5
現状の説明
まず翻訳結果をMarkdownでGithubにおいてpreview機能で読めるようにした
それをみながらScrapboxに書いていた
これが「人力翻訳」アイコン
これはPCでの作業で、年末忙しくなって時間が取れなかくなったのでスマホで読んでコメントできるようにしようと思ってその時にあったものを全部貼り付けた
この時に「人力検索」「貼り付けただけ」のページができた
年末年始に翻訳を進めようかと思ってた
終わって一息ついた、今ここ
「Scrapbox上でワイワイやっていく上で元の文章とコメントの区別がつきにくいのは問題」ということが明らかになったのが今
機械翻訳スクリプトがScrapbox形式まで出力するならアイコンをつけたりするのもできるかも
今後考えてみる
機械翻訳出力と人間のコミュニケーションをしてるページを機械的にマージするのは、楽な問題ではない
1/6
電車移動中〜nishio.icon
わが庵の門を開きて車作る いざいざ来たれ 作りたき人よcFQ2f7LRuLYP.icon
もっとこなれた訳求む(你行你来)
「いざ来たれ」よいtsuzumik.icontsuzumik.iconnishio.icon もう少しPlurality、なめ敵などの社会思想の文脈で色々調べたり書いたりしていきたく(理想的にはアカデミアに耐えうるような形で)少しずつこちらにも貢献できればと思い参加しました。よろしくお願いします。Shoji.icon よろしくお願いします!cFQ2f7LRuLYP.iconnishio.icontsuzumik.icon
1/9
そしてGlenは台湾に行ってAudreyにあってる
ログを機械翻訳して置いといた
よろしくお願いしますYudai.icon
よろしくお願いします!cFQ2f7LRuLYP.iconnishio.icon
1/11
nishio.icon
🎉cFQ2f7LRuLYP.icon
1/12
Upstreamを確認nishio.icon
READMEのタイトルが変わっている
Plurality: Technology for collaborative diversity and democracy
Plurality: The Future of Collaborative Technology and Democracy
issue templateにjoin.yamlってのが増えてる
とか解説書こうかと思ったけど割と色々更新されてるのでいいや
https://scrapbox.io/files/65a0e33150dc880023853252.png
翻訳の頭にアイコンをつける実験nishio.icon
Unicodeの旗絵文字にした
これは単に機械的に並べたもの
これは手動で対応する段落を交互に並べたもの(一部だけ)
英語版だけにしかない小噺がある
意味を解釈しないと対応づけができないから交互に並べることの自動化は難しい
プログラムを更新して空行にはつけないようにした
明日以降の自動翻訳でも自動的に更新されます
このプロジェクトが始まったのは10月で、まだGPTsがなかったnishio.icon 「僕nishio.iconが作業しなくても最新の機械翻訳が手に入る」という意味では今のシステムには意味があるが、
その後の「改善」のフェーズのことはあんまり考えられてなかった
GPTsを改善していくのが良いかもな…
ちょっと試してみたけどイマイチかな…
今のところ気になるのは「審議」と「白襟」くらいかな 行頭の空白文字やnbspが残ってるケース、HTMLタグが残ってるケースがある
1/14
2024/1/15
fixing PDF...nishio.icon
Scrapboxは便利
https://scrapbox.io/files/65a4d93fa2e1700023689ce6.png
Glen: Also looking at the issues on GitHub is a great opportunity for concrete contributions the community values
「また、GitHubのissueを見ることは、コミュニティが評価する具体的な貢献の絶好の機会だ。」
これもどこかに書いとこ
2024/1/16
やっていくと良さそうな小さなタスクnishio.icon
原稿中に出てくる英語の人名をリンクにする
理由
文字起こしをする時に、固有名詞がわからないことがありがち(who?にしてある) リンクになってるとScrapboxの曖昧検索で見つけやすい
2024/1/17
底本や翻訳が変わった時のマージの方法について考えていたのだけども、LLMを使って上手いことやる技術を開発するより、マージが楽になる支援ツールを使って僕がエイヤとマージする方が全体の労力が小さいと判断したので明日ツールを作りますnishio.icon
300 pages!
🎉cFQ2f7LRuLYP.icon
2024/1/17
who?を解消したnishio.icon
マージツールできた
どうマージするかを試行錯誤した結果「Scrapboxにあった文章、機械翻訳1、機械翻訳2」の形で段落ごとに並べることにした
機械翻訳を貼り付けたまま手付かずの場合、どっちかの翻訳のままだったりするが、まあ安心して書き換えられる効果があるかな?
結果、分量が多くなってScrapboxに貼り付けを拒否されたりするように
長いページは分割していきたい、その方がScrapboxの長所が活用される
「再翻訳かけたものの効果を見るためにまず先にマージするか」と始めたものの、4-0まで来てだいぶ疲れている
予定だとこのマージが終わってから改めて再翻訳バージョンとマージしたら訳が揺れてても両方参考にできてより良くできるかなと…
どうしよっかな…
マージ終わった!
22:30
途中から細かいことを考えずにマージ作業だけしたのでスピードアップした
マージが行われたことによって1/16時点の最新の原稿からの翻訳がScrapbox上で、今までの議論を生かしたまま読めるようになった
わかってる問題点
英語原稿にnbspやHTMLタグが混ざっている
HTMLタグはマージ作業中にスキップしてる
nbspは、後で機械的に削るコードを書こうと思う
翻訳されてない(英語や中国語のまま)のケース
見つけ次第DeepLとかで訳し直してるのだけど、今回はマージを優先して無視した
新着の文章の翻訳にある程度の確率で紛れ込んでくる
Scrapboxで一段落が複数に分割されていて、機械翻訳がされてない時に、勢いでキーを押して「1行目→機械翻訳→残りの行」になってしまったところがある
Scrapbox上で直す方が楽だなと思った
将来的には段落を空行でわけて、空行区切りで作業するといいのかもなぁという気持ち
🎉cFQ2f7LRuLYP.icon
本当にポリポリタンなのか...
2024/1/18
Scrapboxに慣れてる人は伸び伸び活動してください
「ページを作っても良い」と言っても初見の人はページを作りにくいだろうからハードルをすごく下げている
ホントお疲れ様ですcFQ2f7LRuLYP.icon
後半1/3くらい疲れて雑です、時間を置いてから見直して改善します
前回100%の完成度のつもりでCode for Japanにシェアした時も結局見返して3〜4回修正したしな
イベントで最初に読む文章をとしてこれがいいなと準備してた文章が3日前に別のリポジトリで更新されてた( #PR63 )ことにイベント前日に気づいた問題nishio.icon とりあえず一番冒頭の一塊は新しい原稿を元に訳し直したのでそっちを読んでもらうことにしよう
話がシンプルになって初見の人にやさしくなってる
その下に「概要」と「章のアウトライン」がある
章のアウトラインはEnglishとMandarinで食い違いがあった
これもPR済み
そういう状態だから急がなくていいや、近々また更新されそう
無事起きた、意外と時間に余裕のある起床nishio.icon
イベントの膨大な情報量で記憶が飛ぶと思うので今の思考をメモしておく
タスク
PR63の修正を反映する
今すぐよりも、もっと「世界にとって有益なもの」ができたタイミングで最後のスライドのアナウンスを変更して…
とか考えるとデッドロックだから今のバージョンをさっさと公開すべきか?
少なくとも3〜6月の間にはこの日本語コミュニティを機械翻訳で英語にしたものを世界にシェアして日本の人々が紡いだ知識のネットワークを世界の公共財にしたい
自分のScrapboxの機械翻訳よりさらにもう一歩難しいものを作る必要がある
翻訳後の英語Scrapboxに対して参加を可能にすべきだろうから
面白そうwtkgshn.icon