由于标签体系可以灵活调整, 文本分类被广泛应用到众多领域中, 下面列出一些典型的应用:
垃圾邮件的检验:垃圾邮件检测的方法有很多, 其中一类就是利用文本分类技术来过滤垃圾邮件。...下面再罗列一些我认为目前不是很成熟但是很有潜力的NLP技术:
句子, 段落的相似性检测:词语的相似度检测已经很成熟, 句子和章节的相似性检测的研究也在进行中。...相似性检测有很广的应用空间, 可以用来解决问答论坛上重复问题, 文章抄袭问题等。
自动文本摘要:即为文章生成一个简短的总结性段落。...当我们写文章时很多人会写一个TLNR(太长不读版), 文本摘要技术可以自动为我们生成这个TLNR, 节省我们的时间。在信息爆炸时代, 文本摘要技术有着巨大的潜力。...自动问答:该技术的价值无需赘述, 不过目前的问答机器人都只能在特定领域回答一些简单地问题, 通用的问答机器人目前还无法实现, 这将是一个巨大的挑战。