Linux 拨号vps windows公众号手机端

如何用php提取网页所有文字

lewis 7年前 (2018-05-04) 阅读数 9 #程序编程
文章标签 PHP

要使用PHP提取网页上的所有文字,可以使用PHP的DOMDocument和XPath库来解析HTML页面并提取文本内容。

以下是一个示例代码:

<?php
// 网页地址
$url = 'http://example.com';
// 创建DOMDocument对象
$dom = new DOMDocument();
// 加载网页
$dom->loadHTMLFile($url);
// 创建XPath对象
$xpath = new DOMXPath($dom);
// 使用XPath查询所有文本节点
$textNodes = $xpath->query('//text()');
// 遍历文本节点并提取文本内容
foreach ($textNodes as $textNode) {
$text = trim($textNode->nodeValue);
// 输出文本内容
echo $text . "\n";
}
?>

在上述代码中,首先通过DOMDocument对象加载指定网页,然后使用DOMXPath对象查询所有的文本节点。接着使用foreach循环遍历文本节点,并通过nodeValue属性获取文本内容。

最后,可以将提取的文本内容输出到控制台或保存到文件中,根据自己的需求进行处理。

版权声明

本文仅代表作者观点,不代表米安网络立场。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

热门