您好,欢迎来到梧忧教育。
搜索
您的当前位置:首页python3简单实现微信爬虫

python3简单实现微信爬虫

来源:梧忧教育


使用ghost.py 通过搜搜 的微信搜索来爬取微信公共账号的信息

# -*- coding: utf-8 -*-
import sys
reload(sys)
import datetime
import time
sys.setdefaultencoding("utf-8")
 
from ghost import Ghost
ghost = Ghost(wait_timeout=20)
 
url="http://weixin.sogou.com/gzh?openid=oIWsFt8JDv7xubXz5E3U41T0eFbk"
page,resources = ghost.open(url)
result, resources = ghost.wait_for_selector("#wxmore a")
 
from bs4 import BeautifulSoup
c=0
while True:
 if c>=30:
 break
 
 soup = BeautifulSoup(ghost.content)
 
 for wx in soup.find_all("h4"):
 print wx
 
 page, resources = ghost.evaluate(
 """
 var div1 = document.getElementById("wxbox");
 div1.innerHTML = '';
 """)
 ghost.click("#wxmore a")
 result, resources = ghost.wait_for_selector(".wx-rb3")
 
 c=c+1
 pass

以上所述就是本文的全部内容了,希望对大家学习Python能够有所帮助

Copyright © 2019- wycttc.cn 版权所有

违法及侵权请联系:TEL:199 18 7713 E-MAIL:2724546146@qq.com

本站由北京市万商天勤律师事务所王兴未律师提供法律服务