文本语料库一般可视为存放在一个目录下的所有文本文件,该目录可能含有不定层次和数量的子目录与文本文件。真实语料库统计需要统计和展示的内容很多,本任务仅考虑对分词后的文本语料库,主要任务如下: 利用分词工具,将文本进行分词及词性标注 ...