Longman Dictionaryをweb scraping
したい
動機
単語の意味を簡単にscrapboxに取り込みたい
方法
Longmanのhtmlを解析して、JSON dataにする
1. html構造を調べる
/programming-notes/Longman Dictionaryをweb scrapingする
12:09:52 そこそこ調べた
あとは英単語を調べるたびに残りの構造や特殊なケースを調べよう
2. JSONの型を決める
3. 実装する
懸念
web scraping
は許可されているか?
HTMLをパースするぶんには問題なさそう
from
https://www.ldoceonline.com/robots.txt
Reference
longmanとOxfordから英単語情報をscrapするscript
Longman Dictionary
#2021-08-01
08:54:58
#2021-02-27
11:35:57