License:

MIT License

链接:

讨论

同类项目

IK Analyzer
IK Analyzer 是一个开源的,基于java语言开发的轻量级的中文分词工具包。新版本的IKAnalyzer3.0发展为 面向Java的公用分词组件,独立于Lucene项目,同时提供了对Lucene的默认优化实现。在2012版本中,IK实现了简单的分词歧义排除算法,标志着IK分词器从单纯的词典分词向模拟语义分词衍化。
OpenNLP
OpenNLP 是一个机器学习工具包,用于处理自然语言文本。支持大多数常用的 NLP 任务,例如:标识化、句子切分、部分词性标注、名称抽取、组块、解析等。
mmseg4j
mmseg4j 是基于Java开发的跨平台的中文分词器,用 Chih-Hao Tsai 的 MMSeg 算法实现的,并实现 lucene 的 analyzer 和 solr 的 TokenizerFactory 以方便在Lucene和Solr中使用。
盘古分词
盘古分词是一个基于 .net framework 的中英文分词组件。
FudanNLP
FudanNLP是基于Java开发的跨平台的中文自然语言处理工具包,也包含为实现这些任务的机器学习算法和数据集。目前实现的内容如下:中文处理工具;信息检索;机器学习。

相关讨论组

该项目还没有关联的讨论组