博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
解决爬虫时网站采用gb2312编码所遇到的乱码问题!
阅读量:6901 次
发布时间:2019-06-27

本文共 459 字,大约阅读时间需要 1 分钟。

import requestsfrom bs4 import BeautifulSoupall_url = 'http://www.7160.com/qingchunmeinv/'# 请求头header = {
'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/6.1.2107.204 Safari/537.36'}start_html = requests.get(all_url,headers = header)html = start_html.text.encode('iso-8859-1').decode('gbk') # 将gb2312转为UTF-8格式print(html)

 

转载于:https://www.cnblogs.com/zhuifeng-mayi/p/9707091.html

你可能感兴趣的文章
MySQL 5.5 新增SIGNAL异常处理
查看>>
回档|忠诚2|zkw线段树
查看>>
Away3D引擎学习笔记(二)CameraController相机控制的应用
查看>>
jq获取元素到底部的距离
查看>>
工作总结
查看>>
一个恶心的需求
查看>>
分类精度评价指标
查看>>
文件操作
查看>>
openssl编译时!遇见的问题
查看>>
Linux安全加固--精简启动项
查看>>
软件需求分析模板
查看>>
HDU - 5457 Hold Your Hand (Trie + 最小割)
查看>>
MySql 到 SQL Server(MSSQL)
查看>>
静态链表
查看>>
解决VS2005 VS2008 vs2010断点无效-源代码与原始版本不同
查看>>
NFS
查看>>
静电引发的悲剧
查看>>
在Angularjs中使用directive自定义指令实现attribute的继承
查看>>
新手学习编程的最佳方式是什么
查看>>
程序员零起步(四)——实习
查看>>