• Unreal is funny !!!

python 正则表达式获取 div 内部html

python 站长 3年前 (2022-02-19) 1413次浏览 已收录 0个评论
文章目录[隐藏]

在做爬虫的html提取时,要获取一个div内部的所有内容,div如下

str = '<div class="nam"> \n\n <p>内容</p> 张三</div>'

我想要获取的内容是:

\n\n <p>内容</p> 张三

错误用法:

import re
re.findall(r'<div[^>]*>(.*?)</div>', str)

注意,div 中是有换行 \n 的, .*? 中的点号 只能匹配除换行之外的所有字符

正确用法:

import re
re.findall(r'<div[^>]*>([\s\S]*?)</div>', str)

\s\S 可以匹配所有字符。


本网站采用BY-NC-SA协议进行授权
转载请注明原文链接:python 正则表达式获取 div 内部html
喜欢 (4)
[]
分享 (0)
发表我的评论
取消评论
表情 贴图 加粗 删除线 居中 斜体 签到

Hi,您需要填写昵称和邮箱!

  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址