我有一些字符串,里面有各种不同的表情/图像/符号。
并不是所有的字符串都用英语--其中一些是用其他非拉丁语言,例如:
▓ railway??
→ Cats and dogs
I'm on
Apples ⚛
✅ Vi sign
♛ I'm the king ♛
Corée ♦ du Nord ☁ (French)
gjør at både ◄╗ (Norwegian)
Star me ★
Star ⭐ once more
早上好 ♛ (Chinese)
Καλημέρα ✂ (Greek)
another ✓ sign ✓
добрай раніцы ✪ (Belarus)
◄ शुभ प्रभात ◄ (Hindi)
✪ ✰ ❈ ❧ Let's get together ★. We shall meet at 12/10/2018 10:00 AM at Tony's.❉...and还有很多这样的东西。
我想去掉所有这些符号/图像,只保留不同语言中的字母(和标点符号)。
我试着用EmojiParser库来清理标志
String withoutEmojis = EmojiParser.removeAllEmojis(input);问题是EmojiParser无法移除大部分的标志。♦标志是我发现的唯一一个,直到现在它已经被移除了。其他符号(如✪❉★✰❈❧✂❋r✿♛)不被移除。
是否有办法从输入字符串中删除所有这些符号,并仅保留不同语言中的字母和标点符号?
发布于 2018-11-02 05:54:19
https://stackoverflow.com/questions/49510006
复制相似问题