url-info
deprecated
任意のdomainのdataをfetchする方法がわかったので、もう使いません
serverless functionを経由せずに、直接browserから取得できる
/icons/hr.icon
URL先のweb pageの情報を返すREST API
repo
takker99/url-info
vercel project
Overview – Vercel
/emoji/warning.icontakker.icon以外アクセス不可
2021-02-12 08:21:08 encodingを追加
文字化けした場合は、この中に入っている文字コード情報を元にdecodeしなおすこと
文字化けした文字列から完全に復元することは不可能
文字化け解説・「文字化けテスター」で復元率を高めるコツ - instant tools
使い方
GET
https://url-info.vercel.app/api/page?url=${url}&hash=${hash}
hashにはフラグメント識別子を投げる
# 付きで#をとったものを渡す
URL queryに#で始まる文字列を投げるとエラーになるみたい
例
https://url-info.vercel.app/api/page?url=https://scrapbox.io
Response
code:json
{
"url": "", // GETに入れたURL
"title": "", // page title 取得できなかったらない
"encoding": "utf-8" // URL先のhtmlファイルのエンコーディング情報
"ogps": [ // OGP情報
{
"property": "", // ないこともある
"content": "", // ないこともある
}
]
}
取得できなかったらundefinedにする
Scrapboxから使う:
url-info-proxy
欲しい機能
絶対いる
Shift_JISなど複数のencodingに対応する
2020-11-29 11:25:15 まだ実装していない。てかShift-JIS使っているweb siteどれだったか忘れた
文字化けが起きたら対処してみる
対処法:文字コードを指定してfetchする
2021-01-24 10:58:54
/icons/fail.iconTextDecoderを使う
/icons2/deno.iconのTextDecoderはShift-JISに対応していない
/icons/fail.iconiconv-liteを使う
謎のerrorが出る
/icons/done.icon2021-02-12 02:31:02 文字コードの種類だけ取得して、scrapbox-url-customizerで変換すればいいことに気づいた
daiiz-paste-urlだとこれができないので不便
あると便利
ページ内ジャンプに対応
フラグメント識別子とも呼ぶらしい
フラグメント識別子を取得する
#anchorがある場合、その要素を探し出して、もしあればそれのtextContentを返す
2020-11-29 17:38:16 どうやらServerRequestに渡されるときにフラグメント識別子が消えてしまうらしい
別なURL queryを使って投げよう
2020-11-29 17:59:16 できた
実装
Vercel + Deno
#2021-02-25 22:27:15
#2021-02-12 08:22:00
#2021-02-12 02:31:59
#2020-12-28 17:11:50
#2020-11-29 10:53:07
#2020-11-28 15:10:01