org.wltea.analyzer.core
类 CharacterUtil

java.lang.Object
  继承者 org.wltea.analyzer.core.CharacterUtil

public class CharacterUtil
extends java.lang.Object

字符集识别工具类


字段摘要
static int CHAR_ARABIC
           
static int CHAR_CHINESE
           
static int CHAR_ENGLISH
           
static int CHAR_OTHER_CJK
           
static int CHAR_USELESS
           
 
构造方法摘要
CharacterUtil()
           
 
方法摘要
static int identifyCharType(char input)
          识别字符类型
static char regularize(char input)
          进行字符规格化(全角转半角,大写转小写处理)
 
从类 java.lang.Object 继承的方法
equals, getClass, hashCode, notify, notifyAll, toString, wait, wait, wait
 

字段详细信息

CHAR_USELESS

public static final int CHAR_USELESS
另请参见:
常量字段值

CHAR_ARABIC

public static final int CHAR_ARABIC
另请参见:
常量字段值

CHAR_ENGLISH

public static final int CHAR_ENGLISH
另请参见:
常量字段值

CHAR_CHINESE

public static final int CHAR_CHINESE
另请参见:
常量字段值

CHAR_OTHER_CJK

public static final int CHAR_OTHER_CJK
另请参见:
常量字段值
构造方法详细信息

CharacterUtil

public CharacterUtil()
方法详细信息

identifyCharType

public static int identifyCharType(char input)
识别字符类型

参数:
input -
返回:
int CharacterUtil定义的字符类型常量

regularize

public static char regularize(char input)
进行字符规格化(全角转半角,大写转小写处理)

参数:
input -
返回:
char