BioBERT 手習い
機械学習なんもわからん(まじでわからん)
わからんけど、無敵のBERTで PubMed Abstract / PMC full text から gene name とか全部ぶっこぬけるんじゃないんですか?
"biobert" でググる
ほらね?
https://academic.oup.com/bioinformatics/article/36/4/1234/5566506#199180388
BioBERT: a pre-trained biomedical language representation model for biomedical text mining
高麗大学 (Korea University) のチーム
ソウルじゃないんだ
私大らしい
日大みたいなもん?
GitHub にモデルもソースコードも公開している、素晴らしい
https://github.com/dmis-lab/biobert
1.4k Star !!
BioBERT を使ってみたブログを書いている人がいる
Tagging Genes and Proteins with BioBERT https://towardsdatascience.com/tagging-genes-and-proteins-with-biobert-c7b04fc6eb4f
まさにこれ
notebook を公開してくれている
https://github.com/perkdrew/advanced-nlp/tree/master/BioBERT
FOSS最高!
やってみたいが GPU 載ったマシンじゃないと学習のプロセスが回らないぽい?
M1 MacBook Pro でやるべきタスクかもしんない