你是要只提取资金数值吗?比如“5000”还是说提取整个“5000万元人民币”
如果是后者,直接提取整个span标签的文本内容就行了,然后去掉空格。例如用jquery来提取(至于怎么准确获取到这个span就不说了,方式很多,看具体需求。我就直接写span了)
const value = $('span').text().trim();
如果是前者,在上面的基础上,通过正则去匹配,把不是数值的部分过滤掉就行了
----更新
不好意思,没有注意这个span标签里的内容,还有题主说的很多脏数据标签
如果脏数据标签是有规律的就这几种,那可以这样,已经测试过
先通过正则把这些标签都匹配出来,然后过滤掉
const reg = /<em[^>]*>(.|
)*</em>|<b[^>]*>(.|
)*</b>|<i[^>]*>(.|
)*</i>|<div[^>]*>(.|
)*</div>/gi;
const valWidthDom = $('span').html();
const realValue = valWidthDom.replace(reg, '');
测试结果如下
与恶龙缠斗过久,自身亦成为恶龙;凝视深渊过久,深渊将回以凝视…