15年洋洋洒洒写了一大篇年终总结,16年却没有动笔的念头,因为16年的经历确实是乏善可陈,没有什么值得拿出来写的。现在已经到了2017年最后一天,回首过去一年,确实是感慨万千,在各个方面我的人生都达了一个新的高度。现在回想起来,也许16年一年的蛰伏正是为了17年的一飞冲天做铺垫呢。 read more

中文说明

依赖于NLTK库,感谢前人的贡献。

本脚本可以识别出英语文本中的被动语态,包括主句和从句。

被动语态识别规则:

  • 若一个句子中没有被动分词,则该句不可能是被动句
  • 若一个句子中仅有一个被动分词且其为“been”,则该句不可能为被动句 eg: He has been a teacher since 2000.
  • 若一个句子中至少含有一个“been”之外的过去分词,且该过去分词到前方最近的人称代词或名词之间的所有动词均为be的某种形式,则该句中存在被动语态。

由于缺乏测试集,仅在少量文本中验证,正确率尚可。如果谁有大规模进行过被动语态标注的语料库,欢迎使用此脚本验证其正确识别比例。 read more