网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
03月26日
漏签
0
天
python2吧
关注:
82
贴子:
200
看贴
图片
吧主推荐
游戏
5
回复贴,共
1
页
<返回python2吧
>0< 加载中...
如何使用Python来生成sitemap
只看楼主
收藏
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
在做网站项目时,经常会使用脚本生成sitemap, 便于爬虫爬取,有利于SEO。 那么如何使用Python来生成sitemap呢?下面我们来研究一番。
安装lxml
首先需要pip install lxml安装lxml库。
如果你在ubuntu上遇到了以下错误:
送TA礼物
IP属地:湖南
1楼
2017-06-13 22:23
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
请安装以下依赖:
sudo apt-get install libxml2-dev libxslt1-dev
IP属地:湖南
2楼
2017-06-13 22:29
回复
收起回复
济南威希信息科技
pythn环境搭建在线下载,一次下载长期使用;全系列版本都有,选择性下载,致力用户高效开发,支持远程协助安装,支持重置,使用便捷放心。
2025-03-26 12:44
广告
立即查看
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Python代码
下面是生成sitemap和sitemapindex索引的代码,可以按照需求传入需要的参数,或者增加字段:
IP属地:湖南
3楼
2017-06-13 22:30
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
效果
生成的效果应该是这种格式:
sitemap格式:
IP属地:湖南
4楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
lastmod时间格式的问题
格式是用ISO 8601的标准,如果是linux/unix系统,可以使用以下函数获取
IP属地:湖南
5楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
优化
一般来说,用lxml效率低并且内存占用比较大,可以直接用文件的write方法创建。
IP属地:湖南
6楼
2017-06-13 22:32
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
郑钦文不敌萨巴伦卡无缘四强
2789520
2
TES回来血洗C组难尝一败
2270062
3
国足0比2再输澳大利亚
1822940
4
订婚强奸案男方追讨转账有戏吗
1766151
5
风堇立绘已出大伙觉得怎么样?
1570036
6
哪些角色随着时间推移越来越可爱
1266950
7
甲亢哥中国行点名想见大张伟
921768
8
青瓦台魔咒还是没放过文在寅
708446
9
Mujica编剧甩锅剧情烂账谁买单
629222
10
F47标配鸭翼让美国军迷破防
503874
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示