半構造化文書
書式
がおおよそ決まっている
文書
ある程度の自由度もある
半構造化
+
文書
非構造化文書
文書モデル