码迷,mamicode.com
首页 > 编程语言 > 详细

java 字符串截取类 区分中文、英文、数字、标点符号

时间:2015-01-14 14:05:20      阅读:211      评论:0      收藏:0      [点我收藏+]

标签:

package com.founder.fix.ims;

/**
* @author WANGYUTAO
* 操作字符串
*/

public class SubString {

// public static void main(String[] args) {
// String str = "我爱阿斯顿发生大法师大法上帝发誓地方时代发生大法师大法金";
// String str1 = "sdfdssfsfdsf把dsdafdafafdsfadas";
// System.out.println(MySubstring(str, 14));
// System.out.println(MySubstring(str1, 14));
// }

/**
* 判断一个字符是Ascill字符还是其它字符(如汉,日,韩文字符)
*
* @param c
* @return
*/
public static boolean isLetter(char c) {
int k = 0x80;
return (c / k) == 0 ? true : false;
}

/**
* 得到一个字符串的长度,显示的长度,一个汉字或日韩文长度为2,英文字符长度为1
*
* @param String
* s ,需要得到长度的字符串
* @return int, 得到的字符串长度
*/
public static int length(String s) {
if (s == null) {
return 0;
}
char[] c = s.toCharArray();
int len = 0;
for (int i = 0; i < c.length; i++) {
len++;
if (!isLetter(c[i])) {
len++;
}
}
return len;
}

/**
* 得到一个字符串的长度,显示的长度,一个汉字或日韩文长度为1,英文字符长度为0.5
*
* @param String s 需要得到长度的字符串
* @return int 得到的字符串长度
*/
public static double getLength(String s) {
double valueLength = 0;
String chinese = "[\u4e00-\u9fa5]";
// 获取字段值的长度,如果含中文字符,则每个中文字符长度为2,否则为1
for (int i = 0; i < s.length(); i++) {
// 获取一个字符
String temp = s.substring(i, i + 1);
// 判断是否为中文字符
if (temp.matches(chinese)) {
// 中文字符长度为1
valueLength += 1;
} else {
// 其他字符长度为0.5
valueLength += 0.5;
}
}
// 进位取整
return Math.ceil(valueLength);
}

/**
* 截取一段字符的长度,不区分中英文,如果数字不正好,则少取一个字符位
*
* @author patriotlml
* @param String
* origin, 原始字符串
* @param int
* len, 截取长度(一个汉字长度按2算的)
* @return String, 返回的字符串
*/
public static String getSubString(String origin, int len) {
if ((origin == null) || origin.equals("") || (len < 1)) {
return "";
}
byte[] strByte = new byte[len];
int reLen = 0;
if (len > length(origin)) {
return origin;
}
System.arraycopy(origin.getBytes(), 0, strByte, 0, len);
int count = 0;
for (int i = 0; i < len; i++) {
int value = strByte[i];
if (value < 0) {
count++;
}
}
if ((count % 2) != 0) {
reLen = (len == 1) ? ++len : --len;
}
return new String(strByte, 0, reLen);
}
}

java 字符串截取类 区分中文、英文、数字、标点符号

标签:

原文地址:http://www.cnblogs.com/wangyt223/p/4223666.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!