RSSからおすすめの情報をレコメンドするシステム
AWSのlambdaにてPythonを使ってはてブのRSS情報を蓄積する処理を作るのが手始めかなと思う。 どこにデータを集積するかだけど、DynamoDBでも使おうと思う。一日に一度か2度ぐらい、はてブのRSSを読み込んで、DynamoDBにタイトル、概要、URLを登録するような処理を作成。
これは全データを読み込む必要がないかな。1年分のデータを食わせる程度で十分かと思う。また、AutoTrainの学習データに足りないようであればInoreaderのお気に入りデータも読み込んでDynamoDBに取り込む。
その後、蓄積したデータをCSVファイルで吐かせて、AutoTrainに食わせて分類器を作る。そして、1日に1度か2度ばかし、InoreaderのニュースRSSをこの分類器で分類させておすすめのニュースだけ分別してRSSにしてどこかに設置させる。
まずはAWS CLIをセッティングしないとどうしようもない。
public.icon