public final class Character extends Object implements Serializable, Comparable<Character>
Character类包装一个对象中的基本类型char的值。
类型为Character的对象包含一个单一字段,其类型为char 。
此外,该类还提供了几种方法来确定字符的类别(小写字母,数字等),并将字符从大写转换为小写,反之亦然。
字符信息基于Unicode标准版本6.2.0。
的方法和类的数据Character通过在UnicodeData文件的是由Unicode Consortium维护的Unicode字符数据库的一部分的信息来定义。 该文件为每个定义的Unicode代码点或字符范围指定各种属性,包括名称和常规类别。
该文件及其描述可从Unicode Consortium获得:
char数据类型(因此Character对象封装的值)基于原始Unicode规范,其将字符定义为固定宽度的16位实体。 Unicode标准已经被更改为允许其表示需要超过16位的字符。 法定代码点的范围现在是U + 0000到U + 10FFFF,称为Unicode标量值 。 (请参阅Unicode标准中U + n符号的 definition。 )
The set of characters from U+0000 to U+FFFF有时被称为基本多语言平面(BMP) 。 Characters其代码点大于U + FFFF称为增补字符秒。 Java平台在char阵列和String和StringBuffer类中使用UTF-16表示。 在此表示中,补充字符表示为一对char值,第一个来自高替代范围(\ uD800- \ uDBFF),第二个来自低代理范围(\ uDC00- \ uDFFF)。
因此, char值代表基本多语言平面(BMP)代码点,包括代码代码点或UTF-16编码的代码单位。 int值代表所有Unicode代码点,包括补充代码点。 下(至少显著)的21个比特int用于表示Unicode代码点和上部(最显著)11位必须为零。 除非另有说明,关于补充字符和代数char值的行为如下:
char值的方法不能支持补充字符。 他们将char范围中的char值视为未定义的字符。 例如, Character.isLetter('\uD840')返回false ,即使这个特定值如果后面跟着一个字符串中的任何低代理值都会表示一个字母。 int值的方法支持所有Unicode字符,包括补充字符。 例如, Character.isLetter(0x2F81A)返回true ,因为代码点值表示一个字母(一个CJK表意文字)。 在Java SE API文档中, Unicode代码点用于U + 0000和U + 10FFFF之间的字符值, Unicode代码单位用作UTF-16编码的16位char值。 有关Unicode术语的更多信息,请参阅Unicode Glossary 。
| Modifier and Type | Class and Description |
|---|---|
static class |
Character.Subset
该类的实例表示Unicode字符集的特定子集。
|
static class |
Character.UnicodeBlock
一系列字符子集,表示Unicode规范中的字符块。
|
static class |
Character.UnicodeScript
一个家庭代表在定义的字符脚本字符子集的
Unicode Standard Annex #24: Script Names 。
|
| Modifier and Type | Field and Description |
|---|---|
static int |
BYTES
用于以无符号二进制形式表示
char值的字节数。
|
static byte |
COMBINING_SPACING_MARK
Unicode规范中的一般类别“Mc”。
|
static byte |
CONNECTOR_PUNCTUATION
Unicode规范中的通用类别“Pc”。
|
static byte |
CONTROL
Unicode规范中的一般类别“Cc”。
|
static byte |
CURRENCY_SYMBOL
Unicode规范中的一般类别“Sc”。
|
static byte |
DASH_PUNCTUATION
Unicode规范中的一般类别“Pd”。
|
static byte |
DECIMAL_DIGIT_NUMBER
Unicode规范中的一般类别“Nd”。
|
static byte |
DIRECTIONALITY_ARABIC_NUMBER
Unicode规范中的弱双向字符类型“AN”。
|
static byte |
DIRECTIONALITY_BOUNDARY_NEUTRAL
Unicode规范中的双向字符类型“BN”弱。
|
static byte |
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
Unicode规范中的双向字符类型“CS”弱。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER
Unicode规范中的弱双向字符类型“EN”。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
Unicode规范中的双向字符类型为“ES”较弱。
|
static byte |
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
Unicode规范中的双向字符类型“ET”较弱。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT
Unicode规范中的强双向字符类型“L”。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
Unicode规范中的强双向字符类型“LRE”。
|
static byte |
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
Unicode规范中的强双向字符类型“LRO”。
|
static byte |
DIRECTIONALITY_NONSPACING_MARK
Unicode规范中的弱双向字符类型“NSM”。
|
static byte |
DIRECTIONALITY_OTHER_NEUTRALS
Unicode规范中的中立双向字符类型“ON”。
|
static byte |
DIRECTIONALITY_PARAGRAPH_SEPARATOR
Unicode规范中的中立双向字符类型“B”。
|
static byte |
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
Unicode规范中的双向字符类型为“PDF”。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT
Unicode规范中的强双向字符类型“R”。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
Unicode规范中的强双向字符类型“AL”。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
Unicode规范中的强双向字符类型“RLE”。
|
static byte |
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
Unicode规范中的强双向字符类型“RLO”。
|
static byte |
DIRECTIONALITY_SEGMENT_SEPARATOR
Unicode规范中的中立双向字符类型“S”。
|
static byte |
DIRECTIONALITY_UNDEFINED
未定义的双向字符类型。
|
static byte |
DIRECTIONALITY_WHITESPACE
Unicode规范中的中立双向字符类型“WS”。
|
static byte |
ENCLOSING_MARK
Unicode规范中的一般类别“Me”。
|
static byte |
END_PUNCTUATION
Unicode规范中的一般类别“Pe”。
|
static byte |
FINAL_QUOTE_PUNCTUATION
Unicode规范中的一般类别“Pf”。
|
static byte |
FORMAT
Unicode规范中的一般类别“Cf”。
|
static byte |
INITIAL_QUOTE_PUNCTUATION
Unicode规范中的一般类别“Pi”。
|
static byte |
LETTER_NUMBER
Unicode规范中的一般类别“Nl”。
|
static byte |
LINE_SEPARATOR
Unicode规范中的一般类别“Zl”。
|
static byte |
LOWERCASE_LETTER
Unicode规范中的一般类别“L1”。
|
static byte |
MATH_SYMBOL
Unicode规范中的通用类别“Sm”。
|
static int |
MAX_CODE_POINT
一个
Unicode code point的最大值 ,常数
U+10FFFF 。
|
static char |
MAX_HIGH_SURROGATE
一个
Unicode high-surrogate code unit的最大值在UTF-16编码中,常数为
'\uDBFF' 。
|
static char |
MAX_LOW_SURROGATE
一个
Unicode low-surrogate code unit的最大值在UTF-16编码中,常数为
'\uDFFF' 。
|
static int |
MAX_RADIX
用于转换到字符串和从字符串转换的最大基数。
|
static char |
MAX_SURROGATE
UTF-16编码中的Unicode代理代码单元的最大值,常数
'\uDFFF' 。
|
static char |
MAX_VALUE
该字段的常数值是
char类型的
'\uFFFF' 。
|
static int |
MIN_CODE_POINT
一个
Unicode code point的最小值 ,常数
U+0000 。
|
static char |
MIN_HIGH_SURROGATE
一个
Unicode high-surrogate code unit的最小值在UTF-16编码中,常数为
'\uD800' 。
|
static char |
MIN_LOW_SURROGATE
一个
Unicode low-surrogate code unit的最小值在UTF-16编码中,常数为
'\uDC00' 。
|
static int |
MIN_RADIX
可用于转换到字符串和从字符串转换的最小基数。
|
static int |
MIN_SUPPLEMENTARY_CODE_POINT
一个
Unicode supplementary code point的最小值 ,常数
U+10000 。
|
static char |
MIN_SURROGATE
UTF-16编码中的Unicode代理代码单元的最小值,常数
'\uD800' 。
|
static char |
MIN_VALUE
该字段的常数值是
char
'\u0000' 。
|
static byte |
MODIFIER_LETTER
Unicode规范中的一般类别“Lm”。
|
static byte |
MODIFIER_SYMBOL
Unicode规范中的一般类别“Sk”。
|
static byte |
NON_SPACING_MARK
Unicode规范中的一般类别“Mn”。
|
static byte |
OTHER_LETTER
Unicode规范中的一般类别“Lo”。
|
static byte |
OTHER_NUMBER
Unicode规范中的常规类别“否”。
|
static byte |
OTHER_PUNCTUATION
Unicode规范中的一般类别“Po”。
|
static byte |
OTHER_SYMBOL
Unicode规范中的一般类别“So”。
|
static byte |
PARAGRAPH_SEPARATOR
Unicode规范中的一般类别“Zp”。
|
static byte |
PRIVATE_USE
Unicode规范中的一般类别“Co”。
|
static int |
SIZE
用于以无符号二进制形式表示
char值的位数,常数
16 。
|
static byte |
SPACE_SEPARATOR
Unicode规范中的一般类别“Zs”。
|
static byte |
START_PUNCTUATION
Unicode规范中的一般类别“Ps”。
|
static byte |
SURROGATE
Unicode规范中的常规类别“Cs”。
|
static byte |
TITLECASE_LETTER
Unicode规范中的常规类别“Lt”。
|
static 类<Character> |
TYPE
类原始类型
char的
类实例。
|
static byte |
UNASSIGNED
Unicode规范中的一般类别“Cn”。
|
static byte |
UPPERCASE_LETTER
Unicode规范中的一般类别“Lu”。
|
| Constructor and Description |
|---|
Character(char value)
构造一个新分配的
Character对象,代表指定的
char值。
|
| Modifier and Type | Method and Description |
|---|---|
static int |
charCount(int codePoint)
确定代表指定字符(Unicode代码点)所需的
char值。
|
char |
charValue()
返回此
Character对象的值。
|
static int |
codePointAt(char[] a, int index)
返回
char数组的给定索引处的代码点。
|
static int |
codePointAt(char[] a, int index, int limit)
返回
char数组的给定索引处的代码点,其中只能使用
index小于
limit数组元素。
|
static int |
codePointAt(CharSequence seq, int index)
返回
CharSequence给定索引处的代码点。
|
static int |
codePointBefore(char[] a, int index)
返回
char阵列给定索引之前的代码点。
|
static int |
codePointBefore(char[] a, int index, int start)
返回
char阵列给定索引之前的代码点,只能使用
index大于等于
start数组元素。
|
static int |
codePointBefore(CharSequence seq, int index)
返回的给定索引前面的代码点
CharSequence 。
|
static int |
codePointCount(char[] a, int offset, int count)
返回
char数组参数的子阵列中的Unicode代码点数。
|
static int |
codePointCount(CharSequence seq, int beginIndex, int endIndex)
返回指定字符序列的文本范围内的Unicode代码点数。
|
static int |
compare(char x, char y)
数值比较两个
char数值。
|
int |
compareTo(Character anotherCharacter)
数字比较两个
Character对象。
|
static int |
digit(char ch, int radix)
返回指定基数中字符
ch的数值。
|
static int |
digit(int codePoint, int radix)
返回指定基数中指定字符(Unicode代码点)的数值。
|
boolean |
equals(Object obj)
将此对象与指定对象进行比较。
|
static char |
forDigit(int digit, int radix)
确定指定基数中特定数字的字符表示。
|
static byte |
getDirectionality(char ch)
返回给定字符的Unicode方向属性。
|
static byte |
getDirectionality(int codePoint)
返回给定字符的Unicode方向性属性(Unicode代码点)。
|
static String |
getName(int codePoint)
返回指定字符的Unicode名称
codePoint ,或者如果代码点是空
unassigned 。
|
static int |
getNumericValue(char ch)
返回指定的Unicode字符代表的
int值。
|
static int |
getNumericValue(int codePoint)
返回
int值指定字符(Unicode代码点)表示。
|
static int |
getType(char ch)
返回一个值,表示一个字符的一般类别。
|
static int |
getType(int codePoint)
返回一个值,表示一个字符的一般类别。
|
int |
hashCode()
返回这个 Character的哈希码;
等于调用charValue()的结果。
|
static int |
hashCode(char value)
返回一个 char值的哈希码;
兼容Character.hashCode() 。
|
static char |
highSurrogate(int codePoint)
返回主导替代(一个
high surrogate code unit所述的)
surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。
|
static boolean |
isAlphabetic(int codePoint)
确定指定的字符(Unicode代码点)是否是字母表。
|
static boolean |
isBmpCodePoint(int codePoint)
确定指定的字符(Unicode代码点)是否在
Basic Multilingual Plane (BMP)中 。
|
static boolean |
isDefined(char ch)
确定字符是否以Unicode定义。
|
static boolean |
isDefined(int codePoint)
确定Unicode中是否定义了一个字符(Unicode代码点)。
|
static boolean |
isDigit(char ch)
确定指定的字符是否是数字。
|
static boolean |
isDigit(int codePoint)
确定指定的字符(Unicode代码点)是否为数字。
|
static boolean |
isHighSurrogate(char ch)
确定给定的
char值是否为
Unicode high-surrogate code unit (也称为
引导代理单元 )。
|
static boolean |
isIdentifierIgnorable(char ch)
确定指定的字符是否应被视为Java标识符或Unicode标识符中的可忽略字符。
|
static boolean |
isIdentifierIgnorable(int codePoint)
确定指定字符(Unicode代码点)是否应被视为Java标识符或Unicode标识符中的可忽略字符。
|
static boolean |
isIdeographic(int codePoint)
确定指定字符(Unicode代码点)是否是Unicode标准定义的CJKV(中文,日文,韩文和越南文)表意文字。
|
static boolean |
isISOControl(char ch)
确定指定的字符是否是ISO控制字符。
|
static boolean |
isISOControl(int codePoint)
确定引用的字符(Unicode代码点)是否是ISO控制字符。
|
static boolean |
isJavaIdentifierPart(char ch)
确定指定的字符是否可以是Java标识符的一部分,而不是第一个字符。
|
static boolean |
isJavaIdentifierPart(int codePoint)
确定字符(Unicode代码点)可能是Java标识符的一部分,而不是第一个字符。
|
static boolean |
isJavaIdentifierStart(char ch)
确定指定字符是否允许作为Java标识符中的第一个字符。
|
static boolean |
isJavaIdentifierStart(int codePoint)
确定字符(Unicode代码点)是否允许作为Java标识符中的第一个字符。
|
static boolean |
isJavaLetter(char ch)
已弃用
替换为isJavaIdentifierStart(char)。
|
static boolean |
isJavaLetterOrDigit(char ch)
已弃用
由isJavaIdentifierPart(char)替代。
|
static boolean |
isLetter(char ch)
确定指定的字符是否是一个字母。
|
static boolean |
isLetter(int codePoint)
确定指定的字符(Unicode代码点)是否是一个字母。
|
static boolean |
isLetterOrDigit(char ch)
确定指定的字符是字母还是数字。
|
static boolean |
isLetterOrDigit(int codePoint)
确定指定的字符(Unicode代码点)是字母还是数字。
|
static boolean |
isLowerCase(char ch)
确定指定的字符是否是小写字符。
|
static boolean |
isLowerCase(int codePoint)
确定指定的字符(Unicode代码点)是否是小写字符。
|
static boolean |
isLowSurrogate(char ch)
确定给定的
char值是否为
Unicode low-surrogate code unit (也称为
尾随代理单元 )。
|
static boolean |
isMirrored(char ch)
根据Unicode规范确定字符是否镜像。
|
static boolean |
isMirrored(int codePoint)
确定是否根据Unicode规范镜像指定的字符(Unicode代码点)。
|
static boolean |
isSpace(char ch)
已弃用
替换为isWhitespace(char)。
|
static boolean |
isSpaceChar(char ch)
确定指定的字符是否是Unicode空格字符。
|
static boolean |
isSpaceChar(int codePoint)
确定指定字符(Unicode代码点)是否为Unicode空格字符。
|
static boolean |
isSupplementaryCodePoint(int codePoint)
确定指定字符(Unicode代码点)是否在
supplementary character范围内。
|
static boolean |
isSurrogate(char ch)
确定给定的
char值是否是Unicode
代理代码单元 。
|
static boolean |
isSurrogatePair(char high, char low)
确定指定的一对
char值是否有效
Unicode surrogate pair 。
|
static boolean |
isTitleCase(char ch)
确定指定的字符是否是一个titlecase字符。
|
static boolean |
isTitleCase(int codePoint)
确定指定的字符(Unicode代码点)是否是一个titlecase字符。
|
static boolean |
isUnicodeIdentifierPart(char ch)
确定指定的字符是否可以是Unicode标识符的一部分,而不是第一个字符。
|
static boolean |
isUnicodeIdentifierPart(int codePoint)
确定指定的字符(Unicode代码点)是否可能是Unicode标识符的一部分,而不是第一个字符。
|
static boolean |
isUnicodeIdentifierStart(char ch)
确定指定字符是否允许为Unicode标识符中的第一个字符。
|
static boolean |
isUnicodeIdentifierStart(int codePoint)
确定Unicode标识符中的第一个字符是否允许指定的字符(Unicode代码点)。
|
static boolean |
isUpperCase(char ch)
确定指定的字符是否为大写字符。
|
static boolean |
isUpperCase(int codePoint)
确定指定的字符(Unicode代码点)是否为大写字符。
|
static boolean |
isValidCodePoint(int codePoint)
确定指定的代码点是否有效
Unicode code point value 。
|
static boolean |
isWhitespace(char ch)
根据Java确定指定的字符是否为空格。
|
static boolean |
isWhitespace(int codePoint)
根据Java确定指定字符(Unicode代码点)是否为空格。
|
static char |
lowSurrogate(int codePoint)
返回尾随替代(一个
low surrogate code unit所述的)
surrogate pair表示在UTF-16编码指定的补充的字符(Unicode代码点)。
|
static int |
offsetByCodePoints(char[] a, int start, int count, int index, int codePointOffset)
返回给定的
char子阵列中的索引,该子阵列与
index由
codePointOffset代码点偏移。
|
static int |
offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
返回给定的char序列中与
index (
codePointOffset代码点偏移的索引。
|
static char |
reverseBytes(char ch)
返回通过反转指定的
char值中的字节顺序获得的值。
|
static char[] |
toChars(int codePoint)
将指定的字符(Unicode代码点)转换为存储在
char数组中的UTF-16
char形式。
|
static int |
toChars(int codePoint, char[] dst, int dstIndex)
将指定的字符(Unicode代码点)转换为其UTF-16表示形式。
|
static int |
toCodePoint(char high, char low)
将指定的代理对转换为其补充代码点值。
|
static char |
toLowerCase(char ch)
使用UnicodeData文件中的大小写映射信息将字符参数转换为小写。
|
static int |
toLowerCase(int codePoint)
使用UnicodeData文件中的大小写映射信息将字符(Unicode代码点)参数转换为小写。
|
String |
toString()
返回
String表示此对象
Character的价值。
|
static String |
toString(char c)
返回一个
String对象,表示指定的
char 。
|
static char |
toTitleCase(char ch)
使用UnicodeData文件中的案例映射信息将字符参数转换为titlecase。
|
static int |
toTitleCase(int codePoint)
使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为titlecase。
|
static char |
toUpperCase(char ch)
使用UnicodeData文件中的案例映射信息将字符参数转换为大写。
|
static int |
toUpperCase(int codePoint)
使用UnicodeData文件中的案例映射信息将字符(Unicode代码点)参数转换为大写。
|
static Character |
valueOf(char c)
返回一个
表示指定的
char值的
Character实例。
|
public static final int MIN_RADIX
digit方法,所述forDigit方法和toString类的方法Integer 。
public static final int MAX_RADIX
digit方法,所述forDigit方法和toString类的方法Integer 。
public static final char MIN_VALUE
char类型的
'\u0000' 。
public static final char MAX_VALUE
char类型的
'\uFFFF' 。
public static final byte UNASSIGNED
public static final byte UPPERCASE_LETTER
public static final byte LOWERCASE_LETTER
public static final byte TITLECASE_LETTER
public static final byte MODIFIER_LETTER
public static final byte OTHER_LETTER
public static final byte NON_SPACING_MARK
public static final byte ENCLOSING_MARK
public static final byte COMBINING_SPACING_MARK
public static final byte DECIMAL_DIGIT_NUMBER
public static final byte LETTER_NUMBER
public static final byte OTHER_NUMBER
public static final byte SPACE_SEPARATOR
public static final byte LINE_SEPARATOR
public static final byte PARAGRAPH_SEPARATOR
public static final byte CONTROL
public static final byte FORMAT
public static final byte PRIVATE_USE
public static final byte SURROGATE
public static final byte DASH_PUNCTUATION
public static final byte START_PUNCTUATION
public static final byte END_PUNCTUATION
public static final byte CONNECTOR_PUNCTUATION
public static final byte OTHER_PUNCTUATION
public static final byte MATH_SYMBOL
public static final byte CURRENCY_SYMBOL
public static final byte MODIFIER_SYMBOL
public static final byte OTHER_SYMBOL
public static final byte INITIAL_QUOTE_PUNCTUATION
public static final byte FINAL_QUOTE_PUNCTUATION
public static final byte DIRECTIONALITY_UNDEFINED
char值在Unicode规范中具有未定义的方向性。
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR
public static final byte DIRECTIONALITY_ARABIC_NUMBER
public static final byte DIRECTIONALITY_COMMON_NUMBER_SEPARATOR
public static final byte DIRECTIONALITY_NONSPACING_MARK
public static final byte DIRECTIONALITY_BOUNDARY_NEUTRAL
public static final byte DIRECTIONALITY_PARAGRAPH_SEPARATOR
public static final byte DIRECTIONALITY_SEGMENT_SEPARATOR
public static final byte DIRECTIONALITY_WHITESPACE
public static final byte DIRECTIONALITY_OTHER_NEUTRALS
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING
public static final byte DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING
public static final byte DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE
public static final byte DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static final char MIN_HIGH_SURROGATE
'\uD800' 。
高代数也被称为领先代理 。
public static final char MAX_HIGH_SURROGATE
'\uDBFF' 。
高代数也被称为领先代理 。
public static final char MIN_LOW_SURROGATE
'\uDC00' 。
低代数也被称为拖尾代理 。
public static final char MAX_LOW_SURROGATE
'\uDFFF' 。
低代数也被称为拖尾代理 。
public static final char MIN_SURROGATE
'\uD800' 。
public static final char MAX_SURROGATE
'\uDFFF' 。
public static final int MIN_SUPPLEMENTARY_CODE_POINT
U+10000 。
public static final int MIN_CODE_POINT
U+0000 。
public static final int MAX_CODE_POINT
U+10FFFF 。
public static final int SIZE
16 。
public static final int BYTES
char值的字节数。
public Character(char value)
Character对象,代表指定的
char值。
value - 由
Character对象表示的值。
public static Character valueOf(char c)
Character(char)使用 ,因为该方法可能通过缓存经常请求的值而产生明显更好的空间和时间性能。
该方法将始终缓存范围为'\u0000'至'\u007F' (含)的值,并且可能将其他值缓存在此范围之外。
c - 一个char值。
public char charValue()
Character对象的值。
char值为char。
public int hashCode()
Character的哈希码;
等于调用charValue()的结果。
hashCode在类别
Object
Character的哈希码值
Object.equals(java.lang.Object) ,
System.identityHashCode(java.lang.Object)
public static int hashCode(char value)
char值的哈希码;
兼容Character.hashCode() 。
value - 用于返回哈希码的
char 。
char值。
public boolean equals(Object obj)
true当且仅当该参数不是null并且是Character对象,表示相同char值作为该对象。
equals在类别
Object
obj - 要比较的对象。
true如果对象是一样的;
false否则。
Object.hashCode() , HashMap
public String toString()
String表示此对象Character的价值。
结果是长度为1的字符串,其唯一成分是由此Character对象表示的基char值。
public static String toString(char c)
String表示指定对象char 。
结果是长度为1的字符串,仅由指定的char char 。
c -的
char要转换
char
public static boolean isValidCodePoint(int codePoint)
codePoint - 要测试的Unicode代码点
true如果指定的代码点值在MIN_CODE_POINT和MAX_CODE_POINT之间;
false否则。
public static boolean isBmpCodePoint(int codePoint)
char 。
public static boolean isSupplementaryCodePoint(int codePoint)
codePoint - 要测试的字符(Unicode码点)
true如果指定的代码点在MIN_SUPPLEMENTARY_CODE_POINT和MAX_CODE_POINT之间;
false否则。
public static boolean isHighSurrogate(char ch)
char值是否为Unicode high-surrogate code unit (也称为引导代理单元 )。
这些值本身并不表示字符,而是以UTF-16编码的supplementary characters表示形式使用。
ch - 要测试的
char值。
true如果char值在MIN_HIGH_SURROGATE和MAX_HIGH_SURROGATE之间;
false否则。
isLowSurrogate(char) ,
Character.UnicodeBlock.of(int)
public static boolean isLowSurrogate(char ch)
char值是否为Unicode low-surrogate code unit (也称为后置代理单元 )。
这些值本身不表示字符,但在代表性使用supplementary characters在UTF-16编码。
ch - 要测试的
char值。
true如果char值在MIN_LOW_SURROGATE和MAX_LOW_SURROGATE之间;
false否则。
isHighSurrogate(char)
public static boolean isSurrogate(char ch)
char值是否是Unicode 代理代码单元 。
这些值本身不表示字符,但在代表性使用supplementary characters在UTF-16编码。
当且仅当它是low-surrogate code unit或high-surrogate code unit时, char值是代理代码单元。
ch - 要测试的
char值。
true如果char值在MIN_SURROGATE和MAX_SURROGATE之间;
false否则。
public static boolean isSurrogatePair(char high,
char low)
high - 待测试的高替代代码值
low - 要测试的低代理代码值
true如果指定的高和低代理代码值代表一个有效的代理对;
false否则。
public static int charCount(int codePoint)
char表示指定字符(Unicode代码点)需要的值。
如果指定的字符等于或大于0x10000,则该方法返回2.否则,该方法返回1。
此方法不会将指定的字符验证为有效的Unicode代码点。 如果需要,来电者必须使用isValidCodePoint验证字符值。
codePoint - 要测试的字符(Unicode码点)。
isSupplementaryCodePoint(int)
public static int toCodePoint(char high,
char low)
high - 高替代码单位
low - 低代码单位
public static int codePointAt(CharSequence seq, int index)
CharSequence给定索引处的代码点。
如果char给定索引处的值CharSequence处于高代理项范围,下列指数小于所述长度CharSequence和char以下索引处的值是在低代理项范围内,则所述辅助返回与该替代对对应的代码点。
否则,返回给定索引处的char值。
seq - 一系列
char值(Unicode码单位)
index -索引到
char中值(Unicode代码单位)
seq被转换
NullPointerException - 如果
seq为空。
IndexOutOfBoundsException - 如果值为
index为负值或不小于
seq.length() 。
public static int codePointAt(char[] a,
int index)
char数组的给定索引处的代码点。
如果char阵列中给定指数的char值处于高代理范围内,则以下指数小于char阵列的长度,下列char的char值处于低代理范围,则返回与该替代对对应的补码。
否则返回给定索引处的char值。
a -
char阵列
index - 要
char的
char数组中的
char值(Unicode代码单元)的索引
NullPointerException - 如果
a为空。
IndexOutOfBoundsException - 如果值为
index为负值或不小于
char阵列的长度。
public static int codePointAt(char[] a,
int index,
int limit)
char阵列给定索引处的代码点,只能使用index小于limit阵列元素。
如果char阵列中给定指数的char值处于高代理范围,则以下指数小于limit ,下列指标中的char值处于低代理范围,则补码代码相应的这个代理对被退回。
否则返回给定索引处的char值。
a -
char数组
index - 要
char的
char数组中的
char值(Unicode码单位)的索引
limit - 可以在
char阵列中使用的最后一个数组元素之后的索引
NullPointerException - 如果
a为空。
IndexOutOfBoundsException - 如果
index参数为负数或不小于
limit参数,或者如果
limit参数为负数或大于
char阵列的长度。
public static int codePointBefore(CharSequence seq, int index)
CharSequence 。
如果char在值(index - 1)在CharSequence处于低代理项范围, (index - 2)不为负,并且char在值(index - 2)在CharSequence处于高代理项范围内,则对应于该代理对的增补代码点是回。
否则, char在值(index - 1)返回。
seq -
CharSequence实例
index - 应该返回的代码点
index的索引
NullPointerException - 如果
seq为空。
IndexOutOfBoundsException - 如果
index参数小于1或大于
seq.length() 。
public static int codePointBefore(char[] a,
int index)
char数组的给定索引之前的代码点。
如果char阵列中(index - 1)的char的char值处于低代理范围内,则(index - 2)不为负, char阵列中(index - 2)的char值处于高代理范围内,则该替代对应的补码代码对被退回。
否则,返回char值(index - 1) 。
a -
char阵列
index - 应该返回的代码点
index的索引
NullPointerException - 如果
a为空。
IndexOutOfBoundsException - 如果
index参数小于1或大于
char阵列的长度
public static int codePointBefore(char[] a,
int index,
int start)
char阵列给定索引之前的代码点,只能使用index大于或等于start数组元素。
如果char在值(index - 1)中char阵列是在低代理项范围, (index - 2)不小于start和char在值(index - 2)中char阵列在高代理项范围内,则对应于所述补充代码点这个代理对被退回。
否则, char值为(index - 1) 。
a -
char阵列
index - 应该返回的代码点之后的索引
start -
char阵列中第一个数组元素的索引
NullPointerException - 如果
a为空。
IndexOutOfBoundsException - 如果
index参数不大于
start参数或大于
char数组的长度,或
start参数为负数或不小于
char阵列的长度。
public static char highSurrogate(int codePoint)
char返回。
如果isSupplementaryCodePoint(x)是true ,那么isHighSurrogate (highSurrogate(x))和toCodePoint (highSurrogate(x), lowSurrogate (x)) == x也总是true 。
codePoint - 补充字符(Unicode码点)
public static char lowSurrogate(int codePoint)
char返回。
如果isSupplementaryCodePoint(x)是true ,那么isLowSurrogate (lowSurrogate(x))和toCodePoint ( highSurrogate (x), lowSurrogate(x)) == x也总是true 。
codePoint - 补码(Unicode码点)
public static int toChars(int codePoint,
char[] dst,
int dstIndex)
dst[dstIndex] ,并返回1。
如果指定的代码点是补充字符,则其代理值存储在dst[dstIndex] (高代码)和dst[dstIndex+1] (低代码)中,并返回2。
codePoint - 要转换的字符(Unicode代码点)。
dst -的阵列
char其中
codePoint的UTF-16值被存储。
dstIndex - 起始索引到
dst阵列中转换后的值被存储。
IllegalArgumentException - 如果指定的
codePoint不是有效的Unicode代码点。
NullPointerException - 如果指定的
dst为空。
IndexOutOfBoundsException - 如果dstIndex为负数或不小于dst.length ,或dst中的dstIndex没有足够的数组元素存储结果char值。
(如果dstIndex等于dst.length-1 ,并且指定的codePoint是补充字符,则高代替值不存储在dst[dstIndex] 。)
public static char[] toChars(int codePoint)
char阵列中的UTF-16表示。
如果指定的代码点是BMP(基本多语言平面或平面0)值,则所得到的char阵列的值与codePoint相同。
如果指定的代码点是补充代码点,则生成的char阵列具有相应的代理对。
codePoint - 一个Unicode码点
char阵列具有
codePoint的UTF-16表示。
IllegalArgumentException - 如果指定的
codePoint不是有效的Unicode代码点。
public static int codePointCount(CharSequence seq, int beginIndex, int endIndex)
beginIndex并延伸到char在索引endIndex - 1 。
因此,文本范围的长度( char s)为endIndex-beginIndex 。
文本范围内的非配对替代品,每一个代码点都是一样的。
seq - 字符序列
beginIndex - 索引到第一个
char的文本范围。
endIndex - 指数最后一个
char的文字范围。
NullPointerException - 如果
seq为空。
IndexOutOfBoundsException - 如果
beginIndex为负,或
endIndex大于给定序列的长度,或
beginIndex大于
endIndex 。
public static int codePointCount(char[] a,
int offset,
int count)
char数组参数的子阵列中的Unicode代码点数。
offset参数是子阵列的第一个char的索引, count参数指定了char s char阵列的长度。
子代码中的非配对代理计数为每个代码点。
a -
char阵列
offset - 给定
char阵列中第一个
char的索引
count -
char s
char阵列的长度
NullPointerException - 如果
a为空。
IndexOutOfBoundsException - 如果
offset或
count为负,或
offset + count大于给定阵列的长度。
public static int offsetByCodePoints(CharSequence seq, int index, int codePointOffset)
index由codePointOffset代码点偏移。
由index和codePointOffset给出的文本范围内的非配对替代品每个作为一个代码点。
seq - 字符序列
index - 要偏移的索引
codePointOffset - 代码点的偏移量
NullPointerException - 如果
seq为空。
IndexOutOfBoundsException - 如果
index为负或大于char序列的长度,或
codePointOffset为正,从index开始的
index小于
codePointOffset代码点,或
codePointOffset为负,index之前的
index小于绝对值的
codePointOffset代码点。
public static int offsetByCodePoints(char[] a,
int start,
int count,
int index,
int codePointOffset)
char子阵列中的索引,该子阵列由index由codePointOffset代码点偏移。
start和count参数指定了一个char阵列的子阵列。
由index和codePointOffset给出的文本范围内的非配对替代codePointOffset作为一个代码点。
a -
char数组
start - 第一个
char的索引
count -子阵列的在长度
char小号
index - 要偏移的索引
codePointOffset - 代码点的偏移量
NullPointerException - 如果
a为空。
IndexOutOfBoundsException - 如果
start或
count为负,或者如果
start + count大于给定阵列的长度,或
index小于
start或更大,则
start + count或
codePointOffset为正,文本范围为
index ,以
start + count - 1有少于
codePointOffset代码点,或者如果
codePointOffset为负且文本范围开始
start和结尾
index - 1具有比的绝对值较少
codePointOffset代码点。
public static boolean isLowerCase(char ch)
如果Character.getType(ch)提供的一般类别类型为LOWERCASE_LETTER ,或者符合Unicode标准定义的其他Character.getType(ch) ,则LOWERCASE_LETTER为LOWERCASE_LETTER 。
以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写的。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isLowerCase(int)方法。
ch - 要测试的字符。
true如果字符是小写的;
false否则。
isLowerCase(char) ,
isTitleCase(char) ,
toLowerCase(char) ,
getType(char)
public static boolean isLowerCase(int codePoint)
如果getType(codePoint)提供的一般类别类型为LOWERCASE_LETTER ,或者符合Unicode标准定义的其他__Lowercase ,则LOWERCASE_LETTER为LOWERCASE_LETTER 。
以下是小写字符的示例:
a b c d e f g h i j k l m n o p q r s t u v w x y z '\u00DF' '\u00E0' '\u00E1' '\u00E2' '\u00E3' '\u00E4' '\u00E5' '\u00E6' '\u00E7' '\u00E8' '\u00E9' '\u00EA' '\u00EB' '\u00EC' '\u00ED' '\u00EE' '\u00EF' '\u00F0' '\u00F1' '\u00F2' '\u00F3' '\u00F4' '\u00F5' '\u00F6' '\u00F8' '\u00F9' '\u00FA' '\u00FB' '\u00FC' '\u00FD' '\u00FE' '\u00FF'
许多其他Unicode字符也是小写的。
codePoint - 要测试的字符(Unicode码点)。
true如果字符是小写的;
false否则。
isLowerCase(int) ,
isTitleCase(int) ,
toLowerCase(int) ,
getType(int)
public static boolean isUpperCase(char ch)
如果Character.getType(ch)提供的一般类别类型为Character.getType(ch) ,则UPPERCASE_LETTER为UPPERCASE_LETTER 。 或者它具有由Unicode标准定义的贡献属性Other_Uppercase。
以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写字母。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isUpperCase(int)方法。
ch - 要测试的字符。
true如果字符是大写字母;
false否则。
isLowerCase(char) ,
isTitleCase(char) ,
toUpperCase(char) ,
getType(char)
public static boolean isUpperCase(int codePoint)
如果getType(codePoint)提供的一般类别类型为UPPERCASE_LETTER ,或者符合Unicode标准定义的其他_Uppercase ,则UPPERCASE_LETTER为UPPERCASE_LETTER 。
以下是大写字符的示例:
A B C D E F G H I J K L M N O P Q R S T U V W X Y Z '\u00C0' '\u00C1' '\u00C2' '\u00C3' '\u00C4' '\u00C5' '\u00C6' '\u00C7' '\u00C8' '\u00C9' '\u00CA' '\u00CB' '\u00CC' '\u00CD' '\u00CE' '\u00CF' '\u00D0' '\u00D1' '\u00D2' '\u00D3' '\u00D4' '\u00D5' '\u00D6' '\u00D8' '\u00D9' '\u00DA' '\u00DB' '\u00DC' '\u00DD' '\u00DE'
许多其他Unicode字符也是大写字母。
codePoint - 要测试的字符(Unicode代码点)。
true如果字符是大写字母;
false否则。
isLowerCase(int) ,
isTitleCase(int) ,
toUpperCase(int) ,
getType(int)
public static boolean isTitleCase(char ch)
如果Character.getType(ch)提供的一般类别类型是Character.getType(ch) ,则TITLECASE_LETTER是一个TITLECASE_LETTER 。
一些字符看起来像拉丁字母对。 例如,有一个大写字母,看起来像“LJ”,并有相应的小写字母,看起来像“lj”。 看起来像“Lj”的第三种形式是使用初始大写字母小写的单词时使用的适当形式,如书名。
这些是这个方法返回的Unicode字符的一些true :
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON LATIN CAPITAL LETTER L WITH SMALL LETTER J LATIN CAPITAL LETTER N WITH SMALL LETTER J LATIN CAPITAL LETTER D WITH SMALL LETTER Z 许多其他Unicode字符也是titlecase。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isTitleCase(int)方法。
ch - 要测试的字符。
true如果字符是titlecase;
false否则。
isLowerCase(char) ,
isUpperCase(char) ,
toTitleCase(char) ,
getType(char)
public static boolean isTitleCase(int codePoint)
如果getType(codePoint)提供的一般类别类型是TITLECASE_LETTER ,则TITLECASE_LETTER是一个TITLECASE_LETTER 。
一些字符看起来像拉丁字母对。 例如,有一个大写字母,看起来像“LJ”,并有相应的小写字母,看起来像“lj”。 看起来像“Lj”的第三种形式是使用初始大写字母小写的单词时使用的适当形式,如书名。
这些是这个方法返回的一些Unicode字符true :
LATIN CAPITAL LETTER D WITH SMALL LETTER Z WITH CARON LATIN CAPITAL LETTER L WITH SMALL LETTER J LATIN CAPITAL LETTER N WITH SMALL LETTER J LATIN CAPITAL LETTER D WITH SMALL LETTER Z 许多其他Unicode字符也是titlecase。
codePoint - 要测试的字符(Unicode代码点)。
true如果字符是titlecase;
false否则。
isLowerCase(int) ,
isUpperCase(int) ,
toTitleCase(int) ,
getType(int)
public static boolean isDigit(char ch)
如果Character.getType(ch)提供的一般类别类型是Character.getType(ch) ,则DECIMAL_DIGIT_NUMBER是DECIMAL_DIGIT_NUMBER 。
一些包含数字的Unicode字符范围:
'\u0030'至'\u0039' ,ISO-LATIN-1位数字( '0'至'9' ) '\u0660'至'\u0669' ,阿拉伯语 - 印度数字 '\u06F0'至'\u06F9' ,扩展阿拉伯语 - 印度数字 '\u0966'到'\u096F' ,梵文数字 '\uFF10'到'\uFF19' ,全宽数字 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isDigit(int)方法。
ch - 要测试的字符。
true如果字符是数字;
false否则。
digit(char, int) ,
forDigit(int, int) ,
getType(char)
public static boolean isDigit(int codePoint)
如果getType(codePoint)提供的一般类别类型是DECIMAL_DIGIT_NUMBER ,则DECIMAL_DIGIT_NUMBER是DECIMAL_DIGIT_NUMBER 。
一些包含数字的Unicode字符范围:
'\u0030'至'\u0039' ,ISO-LATIN-1位数字( '0'至'9' ) '\u0660'至'\u0669' ,阿拉伯语 - 印度数字 '\u06F0'至'\u06F9' ,扩展阿拉伯语 - 印度数字 '\u0966'到'\u096F' ,梵文数字 '\uFF10'到'\uFF19' ,全宽数字 codePoint - 要测试的字符(Unicode码点)。
true如果字符是数字;
false否则。
forDigit(int, int) ,
getType(int)
public static boolean isDefined(char ch)
如果至少有以下条件之一成立,则定义一个字符:
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isDefined(int)方法。
ch - 要测试的字符
true如果字符在Unicode中有定义的含义;
false否则。
isDigit(char) ,
isLetter(char) ,
isLetterOrDigit(char) ,
isLowerCase(char) ,
isTitleCase(char) ,
isUpperCase(char)
public static boolean isDefined(int codePoint)
如果至少有以下条件之一成立,则定义一个字符:
codePoint - 要测试的字符(Unicode码点)。
true如果字符在Unicode中有定义的含义;
false否则。
isDigit(int) ,
isLetter(int) ,
isLetterOrDigit(int) ,
isLowerCase(int) ,
isTitleCase(int) ,
isUpperCase(int)
public static boolean isLetter(char ch)
一个字符被认为是一个字母,当其一般类别类型,通过提供Character.getType(ch) ,是以下任一:
UPPERCASE_LETTER LOWERCASE_LETTER TITLECASE_LETTER MODIFIER_LETTER OTHER_LETTER 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用isLetter(int)方法。
ch - 要测试的字符。
true如果字符是一个字母;
false否则。
isDigit(char) ,
isJavaIdentifierStart(char) ,
isJavaLetter(char) ,
isJavaLetterOrDigit(char) ,
isLetterOrDigit(char) ,
isLowerCase(char) ,
isTitleCase(char) ,
isUnicodeIdentifierStart(char) ,
isUpperCase(char)
public static boolean isLetter(int codePoint)
一个字符被认为是一个字母,当其一般类别类型,通过提供getType(codePoint) ,是以下任一:
UPPERCASE_LETTER LOWERCASE_LETTER TITLECASE_LETTER MODIFIER_LETTER OTHER_LETTER codePoint - 要测试的字符(Unicode代码点)。
true如果字符是一个字母;
false否则。
isDigit(int) ,
isJavaIdentifierStart(int) ,
isLetterOrDigit(int) ,
isLowerCase(int) ,
isTitleCase(int) ,
isUnicodeIdentifierStart(int) ,
isUpperCase(int)
public static boolean isLetterOrDigit(char ch)
如果Character.isLetter(char ch)或Character.isDigit(char ch)返回true ,字符被认为是字母或数字。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isLetterOrDigit(int)方法。
ch - 要测试的字符。
true如果字符是字母或数字;
false否则。
isDigit(char) ,
isJavaIdentifierPart(char) ,
isJavaLetter(char) ,
isJavaLetterOrDigit(char) ,
isLetter(char) ,
isUnicodeIdentifierPart(char)
public static boolean isLetterOrDigit(int codePoint)
如果isLetter(codePoint)或isDigit(codePoint)返回true ,字符被认为是字母或数字。
codePoint - 要测试的字符(Unicode代码点)。
true如果字符是字母或数字;
false否则。
isDigit(int) ,
isJavaIdentifierPart(int) ,
isLetter(int) ,
isUnicodeIdentifierPart(int)
@Deprecated public static boolean isJavaLetter(char ch)
当且仅当以下之一为真时,字符才能启动Java标识符:
isLetter(ch)返回true getType(ch)返回LETTER_NUMBER ch是货币符号(如'$' ) ch是连接标点符号(如'_' )。 ch - 要测试的字符。
true如果字符可能启动Java标识符;
false否则。
isJavaLetterOrDigit(char) ,
isJavaIdentifierStart(char) ,
isJavaIdentifierPart(char) ,
isLetter(char) ,
isLetterOrDigit(char) ,
isUnicodeIdentifierStart(char)
@Deprecated public static boolean isJavaLetterOrDigit(char ch)
当且仅当以下任何一项为真时,字符可能是Java标识符的一部分:
'$' ) '_' ) isIdentifierIgnorable返回true的字符。 ch - 要测试的字符。
true如果字符可能是Java标识符的一部分;
false否则。
isJavaLetter(char) ,
isJavaIdentifierStart(char) ,
isJavaIdentifierPart(char) ,
isLetter(char) ,
isLetterOrDigit(char) ,
isUnicodeIdentifierPart(char) ,
isIdentifierIgnorable(char)
public static boolean isAlphabetic(int codePoint)
如果getType(codePoint)提供的一般类别类型是以下任何一种,则字符被认为是字母:
UPPERCASE_LETTER LOWERCASE_LETTER TITLECASE_LETTER MODIFIER_LETTER OTHER_LETTER LETTER_NUMBER codePoint - 要测试的字符(Unicode码点)。
true如果字符是Unicode字母字符,
false否则。
public static boolean isIdeographic(int codePoint)
codePoint - 要测试的字符(Unicode代码点)。
true如果字符是Unicode表意字符,
false false。
public static boolean isJavaIdentifierStart(char ch)
当且仅当以下条件之一为真时,字符可能启动Java标识符:
isLetter(ch)返回true getType(ch)返回LETTER_NUMBER ch是货币符号(如'$' ) ch是连接标点符号(如'_' )。 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isJavaIdentifierStart(int)方法。
ch - 要测试的字符。
true如果字符可能启动Java标识符;
false否则。
isJavaIdentifierPart(char) ,
isLetter(char) ,
isUnicodeIdentifierStart(char) ,
SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierStart(int codePoint)
当且仅当以下条件之一为真时,字符可能启动Java标识符:
isLetter(codePoint)返回true getType(codePoint)返回LETTER_NUMBER '$' ) '_' )。 codePoint - 要测试的字符(Unicode代码点)。
true如果字符可能启动Java标识符;
false否则。
isJavaIdentifierPart(int) ,
isLetter(int) ,
isUnicodeIdentifierStart(int) ,
SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(char ch)
如果以下任何一项为真,则字符可能是Java标识符的一部分:
'$' ) '_' ) isIdentifierIgnorable返回true的字符 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isJavaIdentifierPart(int)方法。
ch - 要测试的字符。
true如果字符可能是Java标识符的一部分;
false否则。
isIdentifierIgnorable(char) ,
isJavaIdentifierStart(char) ,
isLetterOrDigit(char) ,
isUnicodeIdentifierPart(char) ,
SourceVersion.isIdentifier(CharSequence)
public static boolean isJavaIdentifierPart(int codePoint)
如果以下任何一项为真,则字符可能是Java标识符的一部分:
'$' ) '_' ) isIdentifierIgnorable(codePoint)返回true的字符 codePoint - 要测试的字符(Unicode代码点)。
true如果字符可能是Java标识符的一部分;
false否则。
isIdentifierIgnorable(int) ,
isJavaIdentifierStart(int) ,
isLetterOrDigit(int) ,
isUnicodeIdentifierPart(int) ,
SourceVersion.isIdentifier(CharSequence)
public static boolean isUnicodeIdentifierStart(char ch)
如果且仅当以下条件之一为真时,字符可能会启动Unicode标识符:
isLetter(ch)返回true getType(ch)返回LETTER_NUMBER 。 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isUnicodeIdentifierStart(int)方法。
ch - 要测试的字符。
true如果字符可能启动Unicode标识符;
false否则。
isJavaIdentifierStart(char) ,
isLetter(char) ,
isUnicodeIdentifierPart(char)
public static boolean isUnicodeIdentifierStart(int codePoint)
如果且仅当以下条件之一为真时,字符可能会启动Unicode标识符:
isLetter(codePoint)返回true getType(codePoint)返回LETTER_NUMBER 。 codePoint - 要测试的字符(Unicode码点)。
true如果字符可能启动Unicode标识符;
false否则。
isJavaIdentifierStart(int) ,
isLetter(int) ,
isUnicodeIdentifierPart(int)
public static boolean isUnicodeIdentifierPart(char ch)
当且仅当以下语句之一为真时,字符可能是Unicode标识符的一部分:
'_' ) isIdentifierIgnorable返回true这个角色。 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isUnicodeIdentifierPart(int)方法。
ch - 要测试的字符。
true如果字符可能是Unicode标识符的一部分;
false否则。
isIdentifierIgnorable(char) ,
isJavaIdentifierPart(char) ,
isLetterOrDigit(char) ,
isUnicodeIdentifierStart(char)
public static boolean isUnicodeIdentifierPart(int codePoint)
当且仅当以下语句之一为真时,字符可能是Unicode标识符的一部分:
'_' ) isIdentifierIgnorable返回true这个角色。 codePoint - 要测试的字符(Unicode码点)。
true如果字符可能是Unicode标识符的一部分;
false否则。
isIdentifierIgnorable(int) ,
isJavaIdentifierPart(int) ,
isLetterOrDigit(int) ,
isUnicodeIdentifierStart(int)
public static boolean isIdentifierIgnorable(char ch)
以下Unicode字符在Java标识符或Unicode标识符中是可忽略的:
'\u0000'至'\u0008' '\u000E'至'\u001B' '\u007F'至'\u009F' FORMAT一般类别值 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isIdentifierIgnorable(int)方法。
ch - 要测试的字符。
true如果字符是可能是Java或Unicode标识符的一部分的可忽略的控制字符;
false否则。
isJavaIdentifierPart(char) ,
isUnicodeIdentifierPart(char)
public static boolean isIdentifierIgnorable(int codePoint)
以下Unicode字符在Java标识符或Unicode标识符中是可忽略的:
'\u0000'通过'\u0008' '\u000E'至'\u001B' '\u007F'通过'\u009F' FORMAT一般类别的值 codePoint - 要测试的字符(Unicode码点)。
true如果字符是可能是Java或Unicode标识符的一部分的可忽略的控制字符;
false否则。
isJavaIdentifierPart(int) ,
isUnicodeIdentifierPart(int)
public static char toLowerCase(char ch)
请注意,某些true范围(特别是符号或表意文字) Character.isLowerCase(Character.toLowerCase(ch))并不总是返回true。
一般来说, String.toLowerCase()应该用来将字符映射成小写。 String案例映射方法比Character案例映射方法有好几个好处。 String案例映射方法可以执行区域设置敏感映射,上下文相关映射和1:M字符映射,而Character案例映射方法不能。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用toLowerCase(int)方法。
ch - 要转换的字符。
isLowerCase(char) ,
String.toLowerCase()
public static int toLowerCase(int codePoint)
请注意, Character.isLowerCase(Character.toLowerCase(codePoint))并不总是返回true一些范围的字符,特别是符号或表意文字。
一般来说, String.toLowerCase()应用于将字符映射为小写。 String案例映射方法比Character案例映射方法有好几个好处。 String案例映射方法可以执行区域设置敏感的映射,上下文敏感映射和1:M字符映射,而Character案例映射方法不能。
codePoint - 要转换的字符(Unicode码点)。
isLowerCase(int) ,
String.toLowerCase()
public static char toUpperCase(char ch)
请注意, Character.isUpperCase(Character.toUpperCase(ch))并不总是返回true一些范围的字符,特别是符号或表意文字。
一般来说, String.toUpperCase()应用于将字符映射为大写。 String案例映射方法比Character案例映射方法有好几个好处。 String案例映射方法可以执行区域设置敏感映射,上下文相关映射和1:M字符映射,而Character案例映射方法不能。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符(包括补充字符),请使用toUpperCase(int)方法。
ch - 要转换的字符。
isUpperCase(char) ,
String.toUpperCase()
public static int toUpperCase(int codePoint)
请注意,某些true范围(特别是符号或表意文字) Character.isUpperCase(Character.toUpperCase(codePoint))并不总是返回true。
一般来说, String.toUpperCase()应该用来将字符映射成大写。 String案例映射方法比Character案例映射方法有好几个好处。 String案例映射方法可以执行区域设置敏感映射,上下文相关映射和1:M字符映射,而Character案例映射方法不能。
codePoint - 要转换的字符(Unicode代码点)。
isUpperCase(int) ,
String.toUpperCase()
public static char toTitleCase(char ch)
char参数已经是一个titlecase char ,将返回相同的char值。
需要注意的是Character.isTitleCase(Character.toTitleCase(ch))并不总是返回true为字符的一些范围。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用toTitleCase(int)方法。
ch - 要转换的字符。
isTitleCase(char) ,
toLowerCase(char) ,
toUpperCase(char)
public static int toTitleCase(int codePoint)
需要注意的是Character.isTitleCase(Character.toTitleCase(codePoint))并不总是返回true为字符的一些范围。
codePoint - 要转换的字符(Unicode代码点)。
isTitleCase(int) ,
toLowerCase(int) ,
toUpperCase(int)
public static int digit(char ch,
int radix)
ch的数值。
如果基数不在范围MIN_RADIX ≤ radix ≤ MAX_RADIX或者价值ch不是指定基数的有效数字, -1返回。 如果以下至少一个为真,则字符为有效数字:
isDigit是true的true,字符(或其单字符分解)的Unicode十进制数字值小于指定的基数。 在这种情况下,返回十进制数值。 'A'至'Z' ,其代码小于radix + 'A' - 10 。 在这种情况下,返回ch - 'A' + 10 。 'a'到'z' ,其代码小于radix + 'a' - 10 。 在这种情况下,返回ch - 'a' + 10 。 '\uFF3A' )的全宽大写拉丁字母A( '\uFF21' ) '\uFF3A' ,其代码小于radix + '\uFF21' - 10 。 在这种情况下,返回ch - '\uFF21' + 10 。 '\uFF41' )到z( '\uFF5A' )之一,其代码小于radix + '\uFF41' - 10 。 在这种情况下,返回ch - '\uFF41' + 10 。 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用digit(int, int)方法。
ch - 要转换的字符。
radix - 基数。
forDigit(int, int) ,
isDigit(char)
public static int digit(int codePoint,
int radix)
如果基数不在范围MIN_RADIX ≤ radix ≤ MAX_RADIX或者如果字符不是指定基数的有效数字, -1返回。 如果以下至少一个为真,则字符为有效数字:
isDigit(codePoint)是true的true,字符(或其单字符分解)的Unicode十进制数字值小于指定的基数。 在这种情况下,返回十进制数值。 'A'至'Z' ,其代码小于radix + 'A' - 10 。 在这种情况下,返回codePoint - 'A' + 10 。 'a'至'z' ,其代码小于radix + 'a' - 10 。 在这种情况下,返回codePoint - 'a' + 10 。 '\uFF3A' )的全宽大写拉丁字母A( '\uFF21' ) '\uFF3A' ,其代码小于radix + '\uFF21' - 10 。 在这种情况下,返回codePoint - '\uFF21' + 10 。 '\uFF5A' )的全宽小写拉丁字母a( '\uFF41' ) '\uFF5A' ,其代码小于radix + '\uFF41'- 10 。 在这种情况下,返回codePoint - '\uFF41' + 10 。 codePoint - 要转换的字符(Unicode代码点)。
radix - 基数。
forDigit(int, int) ,
isDigit(int)
public static int getNumericValue(char ch)
int值。
例如,字符'\u216C' (罗马数字五十)将返回值为50的int。
大写字母( '\u0041'至'\u005A' ),小写( '\u0061'至'\u007A' )和全宽变体( '\uFF21'至'\uFF3A'和'\uFF41'至'\uFF5A' )的字母AZ的数字值均为10至35.这与Unicode规范无关,其中不会为这些char值分配数值。
如果字符没有数值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用getNumericValue(int)方法。
ch - 要转换的字符。
int值;
-2如果字符的数值不是非负整数;
-1,如果字符没有数值。
forDigit(int, int) ,
isDigit(char)
public static int getNumericValue(int codePoint)
int值指定字符(Unicode代码点)表示。
例如,字符'\u216C' (罗马数字五十)将返回值为50的int 。
大写字母( '\u0041'至'\u005A' ),小写( '\u0061'至'\u007A' )和全宽变体( '\uFF21'至'\uFF3A'和'\uFF41'至'\uFF5A' )的字母AZ的数字值均为10至35.这与Unicode规范无关,其中不为这些char值分配数值。
如果字符没有数值,则返回-1。 如果字符的数值不能表示为非负整数(例如,小数值),则返回-2。
codePoint - 要转换的字符(Unicode代码点)。
int值;
-2如果字符的数值不是非负整数;
-1,如果字符没有数值。
forDigit(int, int) ,
isDigit(int)
@Deprecated public static boolean isSpace(char ch)
true以下五个字符:
'\t' U+0009 HORIZONTAL TABULATION '\n' U+000A NEW LINE '\f' U+000C FORM FEED '\r' U+000D CARRIAGE RETURN ' ' U+0020 SPACE
ch - 要测试的字符。
true如果字符是ISO-LATIN-1的空格;
false否则。
isSpaceChar(char) ,
isWhitespace(char)
public static boolean isSpaceChar(char ch)
SPACE_SEPARATOR LINE_SEPARATOR PARAGRAPH_SEPARATOR 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isSpaceChar(int)方法。
ch - 要测试的字符。
true如果字符是空格字符;
false否则。
isWhitespace(char)
public static boolean isSpaceChar(int codePoint)
codePoint - 要测试的字符(Unicode码点)。
true如果字符是空格字符;
false否则。
isWhitespace(int)
public static boolean isWhitespace(char ch)
SPACE_SEPARATOR , LINE_SEPARATOR ,或PARAGRAPH_SEPARATOR ),但不也是非打破空间( '\u00A0' , '\u2007' , '\u202F' )。 '\t' ,U + 0009水平仪。 '\n' ,U + 000A LINE FEED。 '\u000B' ,U + 000B垂直结构。 '\f' ,U + 000C FORM FEED。 '\r' ,U + 000D运输返回。 '\u001C' ,U + 001C文件分离器。 '\u001D' ,U + 001D集团分离器。 '\u001E' ,U + 001E RECORD分隔器。 '\u001F' ,U + 001F UNIT SEPARATOR。 注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isWhitespace(int)方法。
ch - 要测试的字符。
true如果字符是Java空格字符;
false否则。
isSpaceChar(char)
public static boolean isWhitespace(int codePoint)
SPACE_SEPARATOR , LINE_SEPARATOR ,或PARAGRAPH_SEPARATOR ),但不也是非打破空间( '\u00A0' , '\u2007' , '\u202F' )。 '\t' ,U + 0009水平仪。 '\n' ,U + 000A LINE FEED。 '\u000B' ,U + 000B垂直布置。 '\f' ,U + 000C FORM FEED。 '\r' ,U + 000D运输返回。 '\u001C' ,U + 001C文件分离器。 '\u001D' ,U + 001D集团分离器。 '\u001E' ,U + 001E RECORD分隔器。 '\u001F' ,U + 001F UNIT SEPARATOR。 codePoint - 要测试的字符(Unicode代码点)。
true如果字符是Java空格字符;
false否则。
isSpaceChar(int)
public static boolean isISOControl(char ch)
'\u0000'通过'\u001F' ,或在范围'\u007F'通过'\u009F' 。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isISOControl(int)方法。
ch - 要测试的字符。
true如果字符是ISO控制字符;
false否则。
isSpaceChar(char) ,
isWhitespace(char)
public static boolean isISOControl(int codePoint)
'\u0000'通过'\u001F' ,或在范围'\u007F'通过'\u009F' 。
codePoint - 要测试的字符(Unicode码点)。
true如果字符是ISO控制字符;
false否则。
isSpaceChar(int) ,
isWhitespace(int)
public static int getType(char ch)
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用getType(int)方法。
ch - 要测试的字符。
int int的值。
COMBINING_SPACING_MARK ,
CONNECTOR_PUNCTUATION ,
CONTROL ,
CURRENCY_SYMBOL ,
DASH_PUNCTUATION ,
DECIMAL_DIGIT_NUMBER ,
ENCLOSING_MARK ,
END_PUNCTUATION ,
FINAL_QUOTE_PUNCTUATION ,
FORMAT ,
INITIAL_QUOTE_PUNCTUATION ,
LETTER_NUMBER ,
LINE_SEPARATOR ,
LOWERCASE_LETTER ,
MATH_SYMBOL ,
MODIFIER_LETTER ,
MODIFIER_SYMBOL ,
NON_SPACING_MARK ,
OTHER_LETTER ,
OTHER_NUMBER ,
OTHER_PUNCTUATION ,
OTHER_SYMBOL ,
PARAGRAPH_SEPARATOR ,
PRIVATE_USE ,
SPACE_SEPARATOR ,
START_PUNCTUATION ,
SURROGATE ,
TITLECASE_LETTER ,
UNASSIGNED ,
UPPERCASE_LETTER
public static int getType(int codePoint)
codePoint - 要测试的字符(Unicode码点)。
int int的值。
COMBINING_SPACING_MARK ,
CONNECTOR_PUNCTUATION ,
CONTROL ,
CURRENCY_SYMBOL ,
DASH_PUNCTUATION ,
DECIMAL_DIGIT_NUMBER ,
ENCLOSING_MARK ,
END_PUNCTUATION ,
FINAL_QUOTE_PUNCTUATION ,
FORMAT ,
INITIAL_QUOTE_PUNCTUATION ,
LETTER_NUMBER ,
LINE_SEPARATOR ,
LOWERCASE_LETTER ,
MATH_SYMBOL ,
MODIFIER_LETTER ,
MODIFIER_SYMBOL ,
NON_SPACING_MARK ,
OTHER_LETTER ,
OTHER_NUMBER ,
OTHER_PUNCTUATION ,
OTHER_SYMBOL ,
PARAGRAPH_SEPARATOR ,
PRIVATE_USE ,
SPACE_SEPARATOR ,
START_PUNCTUATION ,
SURROGATE ,
TITLECASE_LETTER ,
UNASSIGNED ,
UPPERCASE_LETTER
public static char forDigit(int digit,
int radix)
radix的值不是有效的基数,或digit的值不是指定基数的有效数字,则返回空字符( '\u0000' )。
radix参数在大于等于MIN_RADIX且小于等于MAX_RADIX 。 digit参数有效,如果0 <= digit < radix 。
如果数字小于10,则返回'0' + digit 。 否则返回值'a' + digit - 10 。
digit - 转换为字符的数字。
radix - 基数。
char表示在指定基数指定的数字的。
MIN_RADIX ,
MAX_RADIX ,
digit(char, int)
public static byte getDirectionality(char ch)
char值为DIRECTIONALITY_UNDEFINED 。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用getDirectionality(int)方法。
ch -
char ,要求其方向性。
char值的
char 。
DIRECTIONALITY_UNDEFINED ,
DIRECTIONALITY_LEFT_TO_RIGHT ,
DIRECTIONALITY_RIGHT_TO_LEFT ,
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC ,
DIRECTIONALITY_EUROPEAN_NUMBER ,
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR ,
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR ,
DIRECTIONALITY_ARABIC_NUMBER ,
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR ,
DIRECTIONALITY_NONSPACING_MARK ,
DIRECTIONALITY_BOUNDARY_NEUTRAL ,
DIRECTIONALITY_PARAGRAPH_SEPARATOR ,
DIRECTIONALITY_SEGMENT_SEPARATOR ,
DIRECTIONALITY_WHITESPACE ,
DIRECTIONALITY_OTHER_NEUTRALS ,
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING ,
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE ,
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING ,
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE ,
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static byte getDirectionality(int codePoint)
codePoint - 请求方向属性的字符(Unicode代码点)。
DIRECTIONALITY_UNDEFINED ,
DIRECTIONALITY_LEFT_TO_RIGHT ,
DIRECTIONALITY_RIGHT_TO_LEFT ,
DIRECTIONALITY_RIGHT_TO_LEFT_ARABIC ,
DIRECTIONALITY_EUROPEAN_NUMBER ,
DIRECTIONALITY_EUROPEAN_NUMBER_SEPARATOR ,
DIRECTIONALITY_EUROPEAN_NUMBER_TERMINATOR ,
DIRECTIONALITY_ARABIC_NUMBER ,
DIRECTIONALITY_COMMON_NUMBER_SEPARATOR ,
DIRECTIONALITY_NONSPACING_MARK ,
DIRECTIONALITY_BOUNDARY_NEUTRAL ,
DIRECTIONALITY_PARAGRAPH_SEPARATOR ,
DIRECTIONALITY_SEGMENT_SEPARATOR ,
DIRECTIONALITY_WHITESPACE ,
DIRECTIONALITY_OTHER_NEUTRALS ,
DIRECTIONALITY_LEFT_TO_RIGHT_EMBEDDING ,
DIRECTIONALITY_LEFT_TO_RIGHT_OVERRIDE ,
DIRECTIONALITY_RIGHT_TO_LEFT_EMBEDDING ,
DIRECTIONALITY_RIGHT_TO_LEFT_OVERRIDE ,
DIRECTIONALITY_POP_DIRECTIONAL_FORMAT
public static boolean isMirrored(char ch)
'\u0028' LEFT PARENTHESIS在语义上被定义为开始括号 。
在右到左的文本中,这将显示为“(”在文本中是从左到右,但作为“)”。
注意:此方法无法处理supplementary characters 。 要支持所有Unicode字符,包括补充字符,请使用isMirrored(int)方法。
ch -
char ,请求镜像属性
true如果char被镜像,
false如果
char没有镜像或没有定义。
public static boolean isMirrored(int codePoint)
'\u0028' LEFT PARENTHESIS在语义上被定义为开始括号 。
在右到左的文本中,这将显示为“(”在文本中是从左到右,但作为“)”。
codePoint - 要测试的字符(Unicode码点)。
true如果字符被镜像,
false如果字符不镜像或未定义。
public int compareTo(Character anotherCharacter)
Character对象。
compareTo在接口
Comparable<Character>
anotherCharacter - 要比较的
Character 。
0如果参数Character等于此Character ;
的值小于0如果这Character在数值上比少Character参数;
和大于一个值0如果此Character在数值上比越大Character参数(无符号比较)。
请注意,这是严格的数值比较;
它不是区域设置相关的。
public static int compare(char x,
char y)
char数字值。
返回的值与以下内容相同:
Character.valueOf(x).compareTo(Character.valueOf(y))
x - 第一个
char进行比较
y - 第二个
char进行比较
0如果x == y ;
一个值小于0如果x < y ;
并且如果x > y大于0的值
public static char reverseBytes(char ch)
ch -
char其中的字节顺序反转。
public static String getName(int codePoint)
codePoint ,如果代码点为unassigned ,则返回null。
注意:如果指定的字符未由UnicodeData文件(Unicode Consortium维护的Unicode字符数据库的一部分)分配名称,则返回的名称与表达式的结果相同。
Character.UnicodeBlock.of(codePoint).toString().replace('_', ' ') + " " + Integer.toHexString(codePoint).toUpperCase(Locale.ENGLISH);
codePoint - 字符(Unicode码点)
IllegalArgumentException - 如果指定的
codePoint不是有效的Unicode代码点。
Submit a bug or feature
For further API reference and developer documentation, see Java SE Documentation. That documentation contains more detailed, developer-targeted descriptions, with conceptual overviews, definitions of terms, workarounds, and working code examples.
Copyright © 1993, 2014, Oracle and/or its affiliates. All rights reserved.