php如何去掉html标签 nbsp

2023-05-23 php 标签 去掉

PHP中,如果我们要从文本中获取纯文本内容,而不想要html标记、实体以及其他标记的干扰,那么我们可以使用函数去掉html标签和实体,最终得到纯净的文本内容。

HTML标签和实体的存在,对于我们要处理的文本内容来说,是一种干扰。它们会使得我们处理文本内容的难度增加,降低处理的效率,因此,需要对它们进行过滤和处理。

php中处理HTML标记和实体,可以使用strip_tags()函数和html_entity_decode()函数。

strip_tags()函数的作用是去掉字符串中的HTML和PHP标记。可以通过设置第二个参数来保留一些标记,不被去掉。

下面是strip_tags()函数的基本用法:

$text = '<h1>这是一个标题</h1><p>这是一段正文&nbsp;&amp;其他标记</p>';
echo strip_tags($text);

输出结果为:

这是一个标题这是一段正文& 其他标记

可以看到,原字符串中的HTML标记和实体都被去掉了。

如果我们想要保留一些HTML标记,可以将这些标记作为第二个参数传递给strip_tags()函数。比如,下面的代码保留了b和i标记:

$text = '<b>加粗</b>文字<i>倾斜</i>等其他标记';
echo strip_tags($text, '<b><i>');

输出结果为:

<b>加粗</b>文字<i>倾斜</i>等其他标记

可以看到,b和i标记被保留了,其他标记都被去掉了。

接下来,我们再来看一下html_entity_decode()函数,这个函数的作用是将HTML实体转换为它们对应的字符。

下面是html_entity_decode()函数的基本用法:

$text = 'HTML 实体&nbsp;&amp;&lt;&gt;&copy;';
echo html_entity_decode($text);

输出结果为:

HTML 实体 &<>&copy;

可以看到,实体被转换成了它们对应的字符。

结合strip_tags()和html_entity_decode()两个函数的作用,我们可以得到纯净的文本内容,如下所示:

$text = '<h1>这是一个标题</h1><p>这是一段正文&nbsp;&amp;其他标记</p>';
$text = strip_tags($text); // 去掉HTML标记
$text = html_entity_decode($text); // 转换HTML实体

最后,得到的$text就是纯净的文本内容。

综上所述,利用strip_tags()和html_entity_decode()函数,我们可以很方便地去掉HTML标记和实体,得到纯净的文本内容。在处理文本时,这两个函数是非常有用的工具

以上就是php如何去掉html标签 nbsp的详细内容,更多请关注其它相关文章!

相关文章