解决爬虫时网站采用gb2312编码所遇到的乱码问题！-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

解决爬虫时网站采用gb2312编码所遇到的乱码问题！

阅读量：6901 次

发布时间：2019-06-27

本文共 459 字，大约阅读时间需要 1 分钟。

import requestsfrom bs4 import BeautifulSoupall_url = 'http://www.7160.com/qingchunmeinv/'# 请求头header = {
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 UBrowser/6.1.2107.204 Safari/537.36'}start_html = requests.get(all_url,headers = header)html = start_html.text.encode('iso-8859-1').decode('gbk')  # 将gb2312转为UTF-8格式print(html)

转载于:https://www.cnblogs.com/zhuifeng-mayi/p/9707091.html

你可能感兴趣的文章

MySQL 5.5 新增SIGNAL异常处理

回档|忠诚2|zkw线段树

Away3D引擎学习笔记（二）CameraController相机控制的应用

jq获取元素到底部的距离

一个恶心的需求

分类精度评价指标

openssl编译时！遇见的问题

Linux安全加固--精简启动项

软件需求分析模板

HDU - 5457 Hold Your Hand （Trie + 最小割）

MySql 到 SQL Server（MSSQL）

解决VS2005 VS2008 vs2010断点无效-源代码与原始版本不同

静电引发的悲剧

在Angularjs中使用directive自定义指令实现attribute的继承

新手学习编程的最佳方式是什么

程序员零起步（四）——实习

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2025-02-02 22:02:19 当前IP: 18.189.143.150 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我