Beautiful soup meta content tag(美丽的汤元内容标签)
本文介绍了美丽的汤元内容标签的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
<meta itemprop="streetAddress" content="4103 Beach Bluff Rd">
我必须得到‘4103海滩断崖路’的内容。我正在尝试使用BeautifulSoup完成此操作,因此,我尝试执行以下操作:
soup = BeautifulSoup('<meta itemprop="streetAddress" content="4103 Beach Bluff Rd"> ')
soup.find(itemprop="streetAddress").get_text()
但我得到的结果是一个空字符串,这在打印Soup对象时可能有意义
print soup
我得到的是This:
<html><head><meta content="4103 Beach Bluff Rd" itemprop="streetAddress"/> </head></html>
显然我需要的数据在‘meta content’标记中,我如何获取此数据?
推荐答案
您将获得匹配元素的文本。相反,获取"Content"属性值:
soup.find(itemprop="streetAddress").get_text()
soup.find(itemprop="streetAddress").get("content")
这是可能的,因为BeautifulSoup提供了dictionary-like interface to tag attributes:
您可以通过将标记视为词典来访问该标记的属性。
演示:
>>> from bs4 import BeautifulSoup
>>>
>>> soup = BeautifulSoup('<meta itemprop="streetAddress" content="4103 Beach Bluff Rd"> ')
>>> soup.find(itemprop="streetAddress").get_text()
u''
>>> soup.find(itemprop="streetAddress").get("content")
'4103 Beach Bluff Rd'
这篇关于美丽的汤元内容标签的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持编程学习网!
编程基础网
本文标题为:美丽的汤元内容标签
基础教程推荐
猜你喜欢
- 使用 jQuery 在悬停时交换 DIV 类 2022-01-01
- 当木偶师打开Chrome时,不能使用Chrome扩展 2022-01-01
- 最佳动态 JavaScript/JQuery 网格 2022-01-01
- 从快速中间件中排除路由 2022-01-01
- 逻辑运算符 ||在 javascript 中,0 代表 Boolean false? 2022-01-01
- CORS:当凭据标志为真时,无法在 Access-Control-Allow-Origin 中使用通配符 2022-01-01
- 即使每次插入第一个输入的值不同,第二个输入仍显示相同的输入值 2022-01-01
- HTML5 画布调整为父级 2022-01-01
- 在 Javascript 中使用 Fetch API 上传文件并显示进度 2022-01-01
- 带角度的选项卡:仅使用 $http 在单击时加载选项卡 2022-01-01
