AgentOps
MLE-bench: Evaluating Machine Learning Agents on Machine Learning Engineering
How Rexera’s AI agents drive quality control with LangGraph
SREが投資するAIOps ~ペアーズにおけるLLM for Developerへの取り組み~
AIエージェントを実運用に乗せるステップはこんな感じじゃなかろうか
The Shift from Models to Compound AI Systems
Weaveを用いた生成AIアプリケーションの評価_モニタリンングと実践例.pdf
Announcing the OWASP LLM and Gen AI Security Project Initiative for Securing Agentic Applications