GiNZA
spaCy
の日本語モデル & パイプライン
spaCy
(フレームワーク)
└─
GiNZA
(日本語モデル)
└─
SudachiPy
(形態素解析エンジン)
megagonlabs/ginza: A Japanese NLP Library using spaCy as framework based on Universal Dependencies
GiNZA - Japanese NLP Library | Universal Dependenciesに基づくオープンソース日本語NLPライブラリ
開発者向けの情報 | GiNZA - Japanese NLP Library
日本語NLPライブラリGiNZAのすゝめ Python - Qiita
はじめての自然言語処理 spaCy/GiNZA を用いた自然言語処理 | オブジェクトの広場
$ pip install ginza ja_ginza
code:examples.py
import spacy
nlp = spacy.load("ja_ginza")
doc = nlp("自然言語処理")
M1 対応
(試してない)
pip install spacy[apple]
で最適化されたやつが入る
What's New in v3.2 · spaCy Usage Documentation
$ pip install torch thinc-apple-ops も README に書かれてる
ストップワード
spaCy/spacy/lang/ja/stop_words.py at master · explosion/spaCy
#NLP