| Package | Description |
|---|---|
| org.wltea.analyzer | |
| org.wltea.analyzer.cfg | |
| org.wltea.analyzer.seg |
| Modifier and Type | Method and Description |
|---|---|
void |
Context.lockBuffer(ISegmenter segmenter) |
void |
Context.unlockBuffer(ISegmenter segmenter) |
| Modifier and Type | Method and Description |
|---|---|
static List<ISegmenter> |
Configuration.loadSegmenter()
初始化子分词器实现
(目前暂时不考虑配置扩展)
|
| Modifier and Type | Class and Description |
|---|---|
class |
CJKSegmenter
中文(CJK)词元处理子分词器,涵盖一下范围
1.中文词语
2.姓名
3.地名
4.未知词(单字切分)
5.日文/韩文(单字切分)
|
class |
LetterSegmenter
负责处理字母的子分词器,涵盖一下范围
1.英文单词、英文加阿拉伯数字、专有名词(公司名)
2.IP地址、Email、URL
|
class |
QuantifierSegmenter
数量词子分词器,涵盖一下范围
1.阿拉伯数字,阿拉伯数字+中文量词
2.中文数字+中文量词
3.时间,日期
4.罗马数字
5.数学符号 % .
|
Copyright © 2022. All rights reserved.