public class MatcherWordTokenizer extends AbstractWordTokenizer
| Modifier and Type | Field and Description |
|---|---|
static String |
SPACE_CHARS
Represent all the space chars.
|
CHANGE_SEQUENCE, DELETE_CHARS, INSERT_CHARS| Constructor and Description |
|---|
MatcherWordTokenizer() |
MatcherWordTokenizer(Matcher matcher) |
| Modifier and Type | Method and Description |
|---|---|
static MatcherWordTokenizer |
createExcludeMatcher(String chars)
Esta función crea un
para buscar las palabras dentro de la (
) dada. |
static MatcherWordTokenizer |
createMatcher(String regexp)
Esta función crea un
para buscar las palabras dentro de la (
) dada. |
static MatcherWordTokenizer |
createMatcher(String regexp,
int flags)
Esta función crea un
para buscar las palabras dentro de la (
) dada. |
Word |
currentWord(int index)
Obtiene la palabra actual sobre la que est� index, si index
no est� en medio de una palabra devolver� null.
|
protected Matcher |
getMatcher() |
Word |
nextWord(int index)
Para localizar bien los empieces de frases delega en la función isStartOfSentence.
|
void |
updateCharSequence(int start,
int end,
int cause)
Se llama cuando hay que actualizar la secuencia de car�cteres actuales.
|
getCharSequence, isStartOfSentence, previousWord, setCharSequencepublic static final String SPACE_CHARS
public MatcherWordTokenizer(Matcher matcher)
public MatcherWordTokenizer()
public static MatcherWordTokenizer createMatcher(String regexp, int flags)
Matcher
para buscar las palabras dentro de la (
CharSequence) dada.regexp - La expresión regular a utilizar y que hará que se salten los
espacios.flags - Los flags que se utilizan en
Pattern.compile.Matcher para
obtener las palabras.public static MatcherWordTokenizer createMatcher(String regexp)
Matcher
para buscar las palabras dentro de la (
CharSequence) dada.regexp - La expresión regular a utilizar y que hará que se salten los
espacios.Matcher para
obtener las palabras.public static MatcherWordTokenizer createExcludeMatcher(String chars)
Matcher
para buscar las palabras dentro de la (
CharSequence) dada. Haciendo
que el texto que se le pasa sea el texto a excluir, es decir la expresón
deberían de ser los caracteres que forman los espacios entre las palabras.chars - La expresión regular a utilizar y que indica cuales son los
espacios entre las palabras. Es decir los caracteres que no forman
parte de una palabra.Matcher para
obtener las palabras.SPACE_CHARSprotected Matcher getMatcher()
public Word nextWord(int index)
nextWord in interface WordTokenizernextWord in class AbstractWordTokenizerpublic Word currentWord(int index)
WordTokenizerindex - El �ndice desde donde buscar.public void updateCharSequence(int start,
int end,
int cause)
WordTokenizerstart - El primer car�cter desde donde se actualiza.end - El �ltimo car�cter desde donde se actualiza.cause - La causa de la actualizaci�n. Puede ser cualquiera de las
constantes INSERT_CHARS, DELETE_CHARS, CHANGE_SEQUENCECopyright © 2020. All rights reserved.