正则表达式收集

将文本中的单词和标点分开

re.findall(r"\w+|[^\w\s]", text)

输入:I’m a string!
输出:[‘I’, “‘”, ’m’, ‘a’, ‘string’, ‘!’]