係り受け連続範囲
係り受け解析して、チャンクのかかり先が次のチャンクであるようなブロックを取り出す code:python
from cabocha.analyzer import CaboChaAnalyzer
analyzer = CaboChaAnalyzer()
tree = analyzer.parse(
"僕が今作ってるものも「たくさんのアトムがあって、しばしば複数のコンポーネントが一つのアトムに依存してたり、複数のアトムに依存するコンポーネントがあったりする、アトムの変更では一部のコンポーネントだけ再描画したい」という特徴なのでRecoilのアプローチはとてもフィットしそう")
start = 0
while start < tree.chunk_size:
i = start
while True:
if treei.next_link_id == i + 1: result.append(treei + 1.surface) i += 1
else:
break
print(start, result, treei.next_link_id) start = i + 1
code::
助詞や活用を削る(手作業、これも機械的に支援したい)
code::
僕
今作ってるもの
たくさんのアトムがある
しばしば
複数のコンポーネント
一つのアトムに依存
複数のアトムに依存するコンポーネントがある
アトムの変更
一部のコンポーネントだけ再描画したい
Recoilのアプローチ
とてもフィットしそう
code::
input
僕は短文の付箋を作ることとか、長文で書いてしまったものを短く刻むことに慣れてるのだけど、世の中の人は慣れてないから長文のまま入れてしまって「字が小さすぎて読めない付箋」を作っちゃうよね
expected output
僕
短文の付箋を作る
長文で書いてしまったものを短く刻む
慣れてる
世の中の人
慣れてない
長文のまま入れてしまう
字が小さすぎて読めない付箋
作っちゃう
これは係り受け解析で失敗してる