デプロイ
Push a model to Replicate
modal
Hugging Face Endpoint
Fireworks ai
netlify
vercel
google cloud
aws
azure
steramlit
gradio
github
Kamal 2 を使い、インフラに詳しくない人でもNext.jsを296円のVPSにデプロイできるよう、説明してみる
Where is LLM inference run?
Serverless vs. Self-hosted LLM inference