我试图从以下字符串中提取日期"25/01/2005“、公司名称"A One Investment company Limited大一投資有限公司”、中文名称"大一投資有限公司“和牌照号”大一投資有限公司“:
名称:A One Investment Company大一投資有限公司(大一投資有限公司)牌照日期: 25/01/2005备注
然而,我不知道如何将包括中文符号在内的所有数据提取到一个数组中。
我正在尝试标记一个文件中的所有拉丁字母组成,例如:
This is English. 这是中文。 This is more English.
这将被标记为:
\english{This is English.} 这是中文。 \english{This is more English.}
我尝试使用sed来标记这些单词:
sed 's/[A-Za-z0-9 ]*/\\english{&}/g' file
运行后,它基本上是正确的,但是,它也是在所有中文字符之间放置标记,例如:
\english{This is English.} 这\english{}是\english{
$str = "This is a string containing 中文 characters. Some more characters - 中华人民共和国 ";
如何从该字符串中检测中文字符,并打印以第一个字符开头、以"-“结尾的部分?(应该是"中文characters. Some more characters -")。
谢谢!