ansaurus

Question

Converting non-english latin characters to english equivilents

Answer 1

+4 A:

You can make use of java.text.Normalizer and a little regex to get rid of the diacritical marks.

public static String removeDiacriticalMarks(String string) {
    return Normalizer.normalize(string, Form.NFD)
        .replaceAll("\\p{InCombiningDiacriticalMarks}+", "");
}

Usage example:

String text = "mšk žilina";
String normalized = removeDiacriticalMarks(text);
System.out.println(normalized); // msk zilina

BalusC 2010-07-11 12:04:07

Perfect, thanks.

Oliver 2010-07-11 12:36:19

You're welcome.

BalusC 2010-07-11 13:58:38

ansaurus

tags:

views:

answers:

Converting non-english latin characters to english equivilents

related questions