俺のスクボの英訳化
input:
blu3mo.iconのopenai使った実装がある
sta.iconは構文解析的なのが要るね言うてる
inbox時 at 2023/06/25
文法からばらして行単位で変換して組み立てる。ジェイソン変換。外の価値観なら俺は見出だされるのでは?/いや手でお気に入りを英語ブログに書けばいいかも
nishio.iconのも踏まえた上でblu3mo.iconの頭脳でつくってるので、そこだけ読めば良さそうか
モチベーション
sta.icon「俺は素晴らしい概念をつくれている。原理優先の国の人達には刺さるはずだ。英語で公開すれば、そのうち誰かが俺を身につけてくれるだろう」
simpsta.icon
ダーティーボックスはできる気がしないので、構文解析的なアプローチで一からやるしかないか……?
この開発作業でChatGPT.iconに適宜頼るのは当然あり
これら以上にちゃんと設計しながらつくらないといけないだろう
k
sta.jsonを読み込ませて、英訳したsta_en.jsonをつくる
翻訳はChatGPT.iconでいいか
何度も何度も打ち込むことになる
料金は、まあ……なんとかなるだろ
どちらかというと早く終わらせるための並列化とデータ構造が肝になるだろう
https://gyazo.com/4d0a48af41ff7f46b348b9d2c890980b
行レベルでやるなら6クエリ
まとめるなら1クエリで済む
が、復元させるためには行単位の区別が要る
インデントの反映も要る
1-indent 1-●みたいに適当な記号置いて、chatgptでは「●は無視しろ」的にするか?(blu3mo.iconの工夫をパクる)
v2(の話)が出てるので追う
発想を転換しているsta.icon
箇条書きのメモを元にブログっぽい文章を生成させるほうが良いのかも
そうなると翻訳というより「翻訳 + 整形」、つまりChatGPT.iconの出番
そしてMarkdownでやればいいんじゃね?とも
1 LLMはmarkdownの方を多く食ってる
2 ChatGPT.iconにto markdownまでやらせるのはもったいない(のでto markdownまではこっちでやっておく)
nishio.iconも「GPTに移行したい」と目論んでいるようだ
sta.icon
天才
こんなの全く思いつきもしなかった
やっぱりもっと頼った方がいいな
できたみたいだsta.icon
pythonだから俺でも読めてありがたい
細かいAPIの問い合わせ方法のチューニングは興味ないからいいや
nishio.icon含め、その辺はできる技術者に任せればいい、どうせ敵わない
と言いつつ、気になるので見る
tiktoken.get_encoding("cl100k_base")
なんだこれ
へー、測れるライブラリあったんや
やっぱプロンプトが肝だよなぁ
nishio.iconの追っかけてなかったので見る
そもそも翻訳が必要なのか、という議論
> 日本語の文章をそのまま翻訳するより、LLMがそれを参考に英語で書く方がいいのでは
blu3mo.iconが公開できそうなほどのブツができたという
v2のpromptはハルシネーション多いからやめたんだという
値段面
翻訳をキャッシュして更新時は差分だけ訳す
2023/07/11
blu3mo.iconのv2ができてたので見てた、俺が作れる練度ではない、よってもう俺はつくるの諦めてこれを使うのが良い
2023/06/29
simpにて俺でも実装できそう、どうするかと思っていたが、普通に二人のアイデアが凄すぎて素直に頼った方が良さそう