俺のスクボの英訳化

input:

Scrapboxの翻訳

blu3mo.iconのopenai使った実装がある

sta.iconは構文解析的なのが要るね言うてる

inbox時 at 2023/06/25

文法からばらして行単位で変換して組み立てる。ジェイソン変換。外の価値観なら俺は見出だされるのでは？/いや手でお気に入りを英語ブログに書けばいいかも

nishio.iconのも踏まえた上でblu3mo.iconの頭脳でつくってるので、そこだけ読めば良さそうか

/villagepump/ChatGPTでScrapboxTranslatorを作る

ダーティーボックスに振り回されてる感じ

ダータビリティ無いときつそうsta.icon*2

モチベーション

原理優先の人と濃く過ごしてみる必要がある

sta.icon「俺は素晴らしい概念をつくれている。原理優先の国の人達には刺さるはずだ。英語で公開すれば、そのうち誰かが俺を身につけてくれるだろう」

simpsta.icon

ダーティーボックスはできる気がしないので、構文解析的なアプローチで一からやるしかないか……？

この開発作業でChatGPT.iconに適宜頼るのは当然あり

すでにScrapbox to Markdownやtms1で似たようなことはしている

これら以上にちゃんと設計しながらつくらないといけないだろう

sta.jsonを読み込ませて、英訳したsta_en.jsonをつくる

翻訳はChatGPT.iconでいいか

何度も何度も打ち込むことになる

料金は、まあ……なんとかなるだろ

どちらかというと早く終わらせるための並列化とデータ構造が肝になるだろう

たとえば以下のcline(Cluster Of Line)をどうやって訳すか

https://gyazo.com/4d0a48af41ff7f46b348b9d2c890980b

行レベルでやるなら6クエリ

まとめるなら1クエリで済む

が、復元させるためには行単位の区別が要る

インデントの反映も要る

1-indent 1-●みたいに適当な記号置いて、chatgptでは「●は無視しろ」的にするか？（blu3mo.iconの工夫をパクる）

v2（の話）が出てるので追う

/villagepump/ScrapboxTranslator v2を作る

発想を転換しているsta.icon

箇条書きのメモを元にブログっぽい文章を生成させるほうが良いのかも

そうなると翻訳というより「翻訳 + 整形」、つまりChatGPT.iconの出番

そしてMarkdownでやればいいんじゃね？とも

1 LLMはmarkdownの方を多く食ってる

2 ChatGPT.iconにto markdownまでやらせるのはもったいない（のでto markdownまではこっちでやっておく）

nishio.iconも「GPTに移行したい」と目論んでいるようだ

sta.icon

天才

こんなの全く思いつきもしなかった

やっぱりもっと頼った方がいいな

できたみたいだsta.icon

pythonだから俺でも読めてありがたい

細かいAPIの問い合わせ方法のチューニングは興味ないからいいや

nishio.icon含め、その辺はできる技術者に任せればいい、どうせ敵わない

と言いつつ、気になるので見る

https://github.com/blu3mo/ScrapboxTranslator/blob/main/util.py#L4C5-L4C27

tiktoken.get_encoding("cl100k_base")

なんだこれ

https://github.com/openai/tiktoken

へー、測れるライブラリあったんや

やっぱプロンプトが肝だよなぁ

ScrapboxTranslator v2のプロンプト

nishio.iconの追っかけてなかったので見る

pContinuousTranslation2023-06-01 - 西尾泰和のScrapbox

そもそも翻訳が必要なのか、という議論

> 日本語の文章をそのまま翻訳するより、LLMがそれを参考に英語で書く方がいいのでは

blu3mo.iconが公開できそうなほどのブツができたという

https://blu3mo.com/

v2のpromptはハルシネーション多いからやめたんだという

値段面

翻訳をキャッシュして更新時は差分だけ訳す

gpt-3.5-turbo使ってる

ccx

2023/07/11

blu3mo.iconのv2ができてたので見てた、俺が作れる練度ではない、よってもう俺はつくるの諦めてこれを使うのが良い

2023/06/29

simpにて俺でも実装できそう、どうするかと思っていたが、普通に二人のアイデアが凄すぎて素直に頼った方が良さそう