网页
资讯
视频
图片
知道
文库
贴吧
地图
采购
进入贴吧
全吧搜索
吧内搜索
搜贴
搜人
进吧
搜标签
日
一
二
三
四
五
六
签到排名:今日本吧第
个签到,
本吧因你更精彩,明天继续来努力!
本吧签到人数:0
一键签到
可签
7
级以上的吧
50
个
一键签到
本月漏签
0
次!
0
成为超级会员,赠送8张补签卡
如何使用?
点击日历上漏签日期,即可进行
补签
。
连续签到:
天 累计签到:
天
0
超级会员单次开通12个月以上,赠送连续签到卡3张
使用连续签到卡
08月17日
漏签
0
天
python2吧
关注:
82
贴子:
200
看贴
图片
吧主推荐
游戏
5
回复贴,共
1
页
<返回python2吧
>0< 加载中...
如何使用Python来生成sitemap
取消只看楼主
收藏
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
在做网站项目时,经常会使用脚本生成sitemap, 便于爬虫爬取,有利于SEO。 那么如何使用Python来生成sitemap呢?下面我们来研究一番。
安装lxml
首先需要pip install lxml安装lxml库。
如果你在ubuntu上遇到了以下错误:
送TA礼物
IP属地:湖南
1楼
2017-06-13 22:23
回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
请安装以下依赖:
sudo apt-get install libxml2-dev libxslt1-dev
IP属地:湖南
2楼
2017-06-13 22:29
回复
收起回复
2025-08-17 12:07:00
广告
不感兴趣
开通SVIP免广告
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
Python代码
下面是生成sitemap和sitemapindex索引的代码,可以按照需求传入需要的参数,或者增加字段:
IP属地:湖南
3楼
2017-06-13 22:30
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
效果
生成的效果应该是这种格式:
sitemap格式:
IP属地:湖南
4楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
lastmod时间格式的问题
格式是用ISO 8601的标准,如果是linux/unix系统,可以使用以下函数获取
IP属地:湖南
5楼
2017-06-13 22:31
回复
收起回复
_人民万岁__
活跃吧友
5
该楼层疑似违规已被系统折叠
隐藏此楼
查看此楼
优化
一般来说,用lxml效率低并且内存占用比较大,可以直接用文件的write方法创建。
IP属地:湖南
6楼
2017-06-13 22:32
回复
收起回复
登录百度账号
扫二维码下载贴吧客户端
下载贴吧APP
看高清直播、视频!
贴吧热议榜
1
投降是对的,明末销量暴涨
2655360
2
亮证姐老公被处分,人狂必有祸
2583813
3
黑子说话!iG三打五赢下TES
2102156
4
靖国神社实拍!日本无耻篡改历史
2099952
5
8月16日乐子内容限定
1483482
6
普特会无果,美俄协议告吹?
1451300
7
鸣潮这一手禁飞又是什么操作
1428480
8
大的来了!《古剑奇谭》新作公布
1414431
9
曼城4比0大胜狼队取得开门红
1211782
10
网友曝无漾配音事件:关系户空降
1025913
贴吧页面意见反馈
违规贴吧举报反馈通道
贴吧违规信息处理公示