我无法从 <h1>
打印简单文本元素:
require 'nokogiri'
doc = Nokogiri::HTML("<h1><em>Name</em>A Johnson </h1>")
puts doc.at_xpath("//h1").content
输出:
NameA Johnson
我只想要 A Johnson
在输出中。是否可以使用 XPath 或 CSS 选择器仅选择此文本?
请您参考如下方法:
如何使用 text()
XPath 函数?像这样(虽然未经测试):
require 'nokogiri'
doc = Nokogiri::HTML("<h1><em>Name</em>A Johnson </h1>")
puts doc.at_xpath("//h1/text()").content