nishio/pUnnamed(仮)
(名前が定まってなさそうですが言及したいのでとりあえずpUnnamedをそのまま使いますblu3mo.icon)
ウケるnishio.icon
期待blu3mo.icon*2
プロジェクト名とか雑だけど一応動いたnishio.icon
値段感気になりますblu3mo.icon*2
全文翻訳は2.3万?
Yesnishio.icon
更新を随時訳すのは安く済むのか
差分翻訳はほぼ無視できる金額だと思うnishio.icon
インデントを取り除いた行単位で翻訳していて、翻訳結果は全部キャッシュしている(cache.jsonという巨大ファイルに入ってる)
行ごとにこのキャッシュを見て、すでにあるなら翻訳しない
ちらほらリンク切れしているblu3mo.icon
https://gyazo.com/500aaa713f3df87f8cf7f31e65d30fa7
長い文章のリンクは翻訳が揺れるんだなぁnishio.icon
1. 先にタイトルだけ全て英訳して、日英対応テーブルを作る
2. 本文のリンクを機械的に英語に置き換える
(「LLMとかAIを使わないで行う」という意味で「機械的に」と言ったが、不思議な言葉の使い方だな)blu3mo.icon
人を介した単純作業のほうが「機械的に」がしっくりくるのなんだか面白いshoya140.icon
元の意味合い的には「シンプルに」というニュアンスだったのだけど機械が進化して複雑なことをやってくるようになった時代!nishio.icon
3. リンクがすでに英語に置き換わっている文章をChatGPTに投げて翻訳
DeepLでもこれがうまくいくかは不明
おおー、参考になります!>失敗ケースを観測していないnishio.icon
これをやると、差分更新が面倒そうblu3mo.icon
初回は各行Nに対し各タイトルMが含まれるか総当たりするしかないかなぁnishio.icon
もしくはパースしてリンク部分を抽出するか
こっちな気がするな
パースした方が早いなblu3mo.icon
空ページへのリンクが含まれないなnishio.icon
1000件超えてただけだった
各行に含まれているか調べたい理由はよくわからなかった
雑に置換するだけなら、lines.map((line) => line.replaceAll("[置換前のリンク]", "[replaced link]"))とすればいい
正確に置換する場合はパースが必要
で囲まれたリンクを無視したり、ハッシュタグに対応したり
行ごとに翻訳しているのが関係している?
元の日本語X→リンクを英語に置換したY→全体を機械翻訳したZとなるnishio.icon
この場合に、今はX→Zをキャッシュしてるけど、DeepLの翻訳呼び出しをキャッシュするという意図ならY→Zに変えるべきかなぁ
一方でXが変わってないならX→Yも必要ないので〜🤔
いや、違うな、ページタイトルの訳を修正するケースがある
X→Yはキャッシュにヒットしなければ翻訳なしにする
(これも翻訳するならアイコン表記だとかリンクだとか文字装飾だとかを全部除外するコードを書かないといけない)
これは実際に試して見て時間コストを観察すべきだなぁ
blu3mo.icon
正しい綴りはskepticismだと思うが、DeepLはスペルミスをする..?
なぜこうなったのかが気になっている
あ、イギリス英語ではscepticismと書くのか