GiNZA
spaCy の日本語モデル & パイプライン
spaCy(フレームワーク)
└─ GiNZA(日本語モデル)
└─ SudachiPy(形態素解析エンジン)
megagonlabs/ginza: A Japanese NLP Library using spaCy as framework based on Universal Dependencies
GiNZA - Japanese NLP Library | Universal Dependenciesに基づくオープンソース日本語NLPライブラリ
開発者向けの情報 | GiNZA - Japanese NLP Library
日本語NLPライブラリGiNZAのすゝめ Python - Qiita
はじめての自然言語処理 spaCy/GiNZA を用いた自然言語処理 | オブジェクトの広場
$ pip install ginza ja_ginza
code:examples.py
import spacy
nlp = spacy.load("ja_ginza")
doc = nlp("自然言語処理")
M1 対応 (試してない)
pip install spacy[apple] で最適化されたやつが入る
What's New in v3.2 · spaCy Usage Documentation
$ pip install torch thinc-apple-ops も README に書かれてる
ストップワード
spaCy/spacy/lang/ja/stop_words.py at master · explosion/spaCy
#NLP