用 Python 获取百度搜索结果链接

worldkun 2020-04-21

前言

近期有许多项目需要这个功能，由于Python实现起来比较简单就这么做了，代码贴下来觉得好点个赞吧~

代码

# coding: utf-8
import os
import time
import requests
import urllib.parse
from bs4 import BeautifulSoup
from urllib.parse import urlparse
from fake_useragent import UserAgent
from multiprocessing.pool import ThreadPool

LOCATIONS = {}
GLOBAL_THREAD = 500
GLOBAL_TIMEOUT = 50


def get_links(keyword, generator, pages):
    links = []

    for page in range(int(pages.split("-")[0]), int(pages.split("-")[1]) + 1):
        for genera in range(int(generator.split("-")[0]), int(generator.split("-")[1]) + 1):
            links.append(
                "http://www.baidu.com.cn/s?wd=" + urllib.parse.quote(keyword + str(genera)) + "&pn=" + str(page * 10))

    return links


def get_page(url):
    headers = {"user-agent": UserAgent().chrome}
    req = requests.get(url, headers=headers)
    req.encoding = "utf-8"
    soup = BeautifulSoup(req.text, "lxml")

    for link in soup.select("div.result > h3.t > a"):
        req = requests.get(link.get("href"), headers=headers, allow_redirects=False)
        if "=" in req.headers["location"]:
            root = urlparse(req.headers["location"]).netloc
            LOCATIONS[root] = req.headers["location"]


def baidu_search():
    try:
        os.system("cls")
        print("-" * 56 + "\n")
        print("| BaiduSearch Engine By 美图博客[https://www.meitubk.com/] |\n")
        print("-" * 56 + "\n")

        keyword = input("Keyword: ")
        generator = input("Generator(1-10): ")
        pages = input("Pages(0-10): ")

        start = time.time()
        pool = ThreadPool(processes=GLOBAL_THREAD)
        pool.map(get_page, get_links(keyword, generator, pages))
        pool.close()
        pool.join()
        end = time.time()

        path = r"D:\Desktop\result.txt"
        save_result(path)
        print("\nSava in %s" % path)
        print("Result count: %d" % len(LOCATIONS.values()))
        print("Running time: %ds" % (end - start))
    except:
        print("\nInput Error!")
        exit(0)


def save_result(path):
    with open(path, "w") as file:
        for url in list(LOCATIONS.values()):
            file.write(url + "\n")


baidu_search()

使用

用 Python 获取百度搜索结果链接

: worldkun

相关推荐

用Python写Roboot Framework测试九：用Python写Roboot Framework测试

args=["测试教程网_百度搜索"]). # 生成日志、报告文件。进入到项目目录下，执行

rojyang 0喜欢 / 0评论 2020-05-20

用rod获取百度搜索结果的例子

// use css selector to get the search input element and input "git". // wait until css selector get the element then g

ELEMENTS爱乐小超 0喜欢 / 0评论 2020-05-07

Chrome 百度搜索热点过滤插件 - 开源软件

学习时，为了搜集最全的中文资料，有时候不得不使用Baidu搜索引擎。在你还是个小菜鸡的时候你可能会花费大量时间在百度上！但是，时间久了你会发现，你总会被网络上一些奇奇怪怪或者有趣的事情吸引过去而逐渐忘记自己曾经打开百度是要干什么？对于广告吧，还能使用广告清

baynkbtg 0喜欢 / 0评论 2019-11-02

百度熊掌号: 2018-2020年, 你不容错过的流量红利!

自百家官方号上线到熊掌号落地以来，百度搜索一直在颠覆原有的搜索生态，不断的推陈出新与改革，净化网络环境，扶植优质原创内容，让搜索回归本质，从而适应快速迭代移动互联网的发展，对于百度搜索而言，这是一种挑战，也是一种重生，对于SEO从业者，这也是千载难逢的机遇

ksjlhy 0喜欢 / 0评论 2019-10-28

实现百度搜索栏自动提示功能

<input type="text" id="down" value="e"></input><span style="font-weight:bold;f

geminihr 0喜欢 / 0评论 2015-03-19

仿百度搜索时的下拉列表（jQuery实现）

当我们使用百度或是谷歌进行搜索时，只要输入一个字母就可以产生一个下拉列表，并且可以通过键盘上下键来控制列表项的选择。最近在项目中也碰到了类似的情况，在文本框中输入某个字母就可以出现一个下拉列表，展现从数据库里搜索过来的结果。首先要使用ajax的话，就想到可

chang00 0喜欢 / 0评论 2015-06-17

python+selenium实现自动化百度搜索关键词

通过python配合爬虫接口利用selenium实现自动化打开chrome浏览器，进行百度关键词搜索。同时需要安装chromedriver,并放在python安装文件夹下，如下图所示。注册账号，点击爬虫代理，领取每日试用。

LinSeeker 0喜欢 / 0评论 2019-09-07

百度搜索结果跳转URL代码规律分析

实际上根本来说，是百度对于用户体验的加强!打击点击器就是为了更好地让优质的网站展现给用户，跟360综合搜索区别，禁止360抓取也是为了体现百度的品牌效应，从这两点来说对用户是有利的!

nextwhy 0喜欢 / 0评论 2012-09-09

网站百度快照不更新原因分析

要想找到原因我们要先了解一下什么时百度快照。简单的说，百度快照就是百度为每个网站做的备份信息，如果网站出现问题或打开很慢影响用户浏览时，快照内容就可以起到应急信息的作用。我们都知道百度是利用蜘蛛来获取网站信息的，而蜘蛛喜欢新的东西喜欢有价值有意义的东西。

tongjianru 0喜欢 / 0评论 2011-05-18

win10系统百度搜索重复自动刷新怎么办？win10系统网页无限刷新的两种解决方法

但是最近使用Win10系统的用户反应，在使用百度搜索东西的时候一直重复刷新页面，导致无法正常搜索的情况，但是在地址栏中输入其他网址又可以正常使用，这该怎么办？下面安科网的小编给大家分享下解决方法。出现这样的情况是由于浏览器出错或者被劫持导致。

Jarvan 0喜欢 / 0评论 2016-09-25

win7系统使用百度搜索资料时自动跳转到搜狗搜索的故障原因及解决方法

2、在打开的窗口中，点击左侧“更改适配器设置”，选中已连接的网络，右键打开属性；Win7禁止网络搜索驱动的方法

fadacai0 0喜欢 / 0评论 2016-04-18

如何删除百度搜索记录？

百度，全球最大的中文搜索引擎。方便网民便捷的搜索获取需要的信息。用户在搜索信息之后，百度会留下并显示搜索记录，有的用户觉得这样的方式对隐私保护不够，那么如何删除百度搜索记录呢，以下小编为大家介绍删除百度搜索记录方法。

deusrwvf 0喜欢 / 0评论 2017-06-21

千万别用百度搜索这些词：真吓一跳

　　下面是一些常见的带特效的关键词，你别说，小编第一次搜的时候，还真被吓一跳，不信你试试。　　ps.需PC浏览器，手机上还无法实现，如果你没看到特效，不妨换个浏览器试试。　　真的会出现打雷的声音，而且特别逼真。　　我去，屏幕上真会出现一个黑洞，把所有东西都

AIOps智能运维 0喜欢 / 0评论 2015-05-25

使用Java调用百度搜索

自己没搜索引擎，又想要大规模的数据源，怎么办？可以对百度搜索善加利用，以小搏大，站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索来实现，比如网站的新闻采集，比如技术、品牌的新闻跟踪，比如知识库的收集，比如人机问答系统等，我之前做的一个准确率达百分

magvwiz 0喜欢 / 0评论 2013-10-18

最好用的百度网盘搜索引擎，百度搜索【我要盘】

最好用的百度网盘搜索引擎，百度搜索

冯泰 0喜欢 / 0评论 2016-11-23

怎样把搜索引擎收录的网页记录删除呢？

我的个人博客的某些网页被百度的搜索记录了，现在这些网页已被我删除，但百度依然还有这些记录，我想把这些记录删除了，那应该怎么办呢？具体情况参看百度的说明：。百度会收录符合用户搜索体验的网站和网页。为促使百度Spider更快的发现您的站点，您也可以向我们提交一

AIOps智能运维 0喜欢 / 0评论 2010-08-17

当心搜索结果把自己埋进去

但在南山科技园工作的张小姐的搜索体验却成了“百度一下，你就被骗”。前日，她先是在百度搜索到的东方航空公司网站订机票。被骗汇款1758元，随后气愤之下在百度搜索“百度投诉中心电话”时，被百度置于第二位的一个百度投诉中心的电话竟然也是“假冒伪劣”，让她再去银行

linqiang 0喜欢 / 0评论 2010-02-04

如何全面的提升百度搜索排名？

但是，作用很有限！感觉很像是你很饥饿，但是锅里只有几粒米！一顿操作猛如虎，在看战绩0-5;那就拜托技术上的思维固化整体性的思考这个问题！百度是怎么确定一个网站是不是知名站点呢？百度已经很难收到这篇文章，前段时间很火！

XSxing 0喜欢 / 0评论 2019-06-30

Jsoup爬虫获取自己网站在百度搜索中的实时排名

一直有一个需求，希望看到自己网站在百度的实时的排名用过一些工具，要么反应迟钝，要么结果不准确或不实时于是打算用jsoup写一个小爬虫来实时百度看网站排名。public static int timeout = 30 * 1000;

XSxing 0喜欢 / 0评论 2019-06-30

使用Java调用百度搜索

自己没搜索引擎，又想要大规模的数据源，怎么办？可以对百度搜索善加利用，以小搏大，站在巨人的肩膀上。有很多的应用场景可以很巧妙地借助百度搜索来实现，比如网站的新闻采集，比如技术、品牌的新闻跟踪，比如知识库的收集，比如人机问答系统等，我之前做的一个准确率达百分

xiaoshe 0喜欢 / 0评论 2015-04-08

类似百度搜索提示

<metaname="Description"content="js/jQuery实现类似百度搜索功能,可用键盘控制">. "你是我最好的朋友",

chang00 0喜欢 / 0评论 2016-08-24

类百度搜索提示

<metaname="Description"content="js/jQuery实现类似百度搜索功能,可用键盘控制">. "你是我最好的朋友",

geminihr 0喜欢 / 0评论 2016-06-30

PHP 获取网站百度搜索和搜狗搜索收录量代码

获取网站百度搜索和搜狗搜索的收录量代码，可以用于获取网站域名在搜索引擎的收录数量，一直想找这个API但没找到，就在网上找了个例子，学习修改了下，可以正常获取百度搜索和搜狗搜索的收录量了；原理是获取搜索引擎site:domain的结果数量，然后再抓取这个数量

qiuqiang 0喜欢 / 0评论 2016-04-02

jsonp跨域获取数据实现百度搜索

本菜鸡最近在写某个页面请求数据时，报了如下的错误。什么是同源策略？同源策略/SOP是一种约定，由Netscape公司1995年引入浏览器，它是浏览器最核心也最基本的安全功能，如果缺少了同源策略，浏览器很容易受到XSS、CSFR等攻击。同源策略可以算是 we

adonislu 0喜欢 / 0评论 2019-06-27

仿百度搜索时的下拉列表（jQuery实现）

当我们使用百度或是谷歌进行搜索时，只要输入一个字母就可以产生一个下拉列表，并且可以通过键盘上下键来控制列表项的选择。最近在项目中也碰到了类似的情况，在文本框中输入某个字母就可以出现一个下拉列表，展现从数据库里搜索过来的结果。首先要使用ajax的话，就想到可

semjinghua 0喜欢 / 0评论 2015-06-17

实现百度搜索栏自动提示功能

<input type="text" id="down" value="e"></input><span style="font-weight:bold;f

chang00 0喜欢 / 0评论 2015-03-19

QTP往下拉IE的滚动条

Set pageobj = Browser.Page'//画面对象赋值

chang00 0喜欢 / 0评论 2015-01-18

老二牛车Axure夜话：中继器系列视频教程之中继器百度搜索提示

AxShare在线效果预览:

chang00 0喜欢 / 0评论 2014-12-04

js搜索提示仿百度搜索

仿百度搜索，用的基本的js事件和ajax请求，服务器后端返回xml类型，代码比较齐全，基本上可以直接使用。<div style="border-width:1px; background-color: white;" id=&qu

zmosquito 0喜欢 / 0评论 2014-11-21

在自己的项目里调用百度接口，实现百度搜索

一、原理百度使用的jsonp接口，按照jsonp的方法即可实现百度搜索的功能。

XSxing 0喜欢 / 0评论 2019-06-26

百度搜索框上下键效果

http://www.2cto.com/kf/201108/102260.html

geminihr 0喜欢 / 0评论 2013-06-28

嵌入百度搜索

<form action="http://www.baidu.com/baidu" target="_blank"><table bgcolor="#FFFFFF"><

chang00 0喜欢 / 0评论 2013-01-17

哪些站点命中算法?2016年百度搜索各大算法大盘点

用户在百度搜索中，会发现APP虚假下载、捆绑下载APP的现象，站点通过此方式对用户进行欺诈，诱导用户下载非目标app。该行为严重损害了广大搜索用户的体验，百度搜索将严厉打击此行为。

SongLynn 0喜欢 / 0评论 2017-01-04

内容质量、网站速度、用户体验决定了网站能否留住用户

2016年的互联网行业仿佛是用户体验年，各互联网入口都在强调内容质量、网站速度、用户体验。而搜索引擎作为网站的重要流量入口，对于这三者也有着越来越明确的要求：。在10月27日召开的百度站长平台VIP杭州沙龙中，百度搜索从网站内容质量和用户体验两方面，阐述了

小白的黑科技 0喜欢 / 0评论 2016-10-31

怎么提升关键词排名? 揭秘百度搜索关键词排名的七大技巧

百度是中文最大的搜索引擎，如果你的网站或者你的产品没有被百度收录，那么你将会失去百分之80的流量。由此可见百度在中国已经成为搜索引擎的代名词，经常听人说百度一下你就知道，可想我们已经习惯了百度搜索引擎。每收录百度旗下的一条信息关键词排名就会增加一次，按照收

randongjing 0喜欢 / 0评论 2016-08-27

站长怎么硬度百度快照取消日期的问题?

百度在算法上的稍微改变，都会对SEO优化产生最为直接的影响，就在前不久，百度针对快照算法进行了优化，取消了快照日期显示这个功能，这让很多网站依靠百度快照提升排名的做法难以取得效果，而且如果网站快照时间不能够显示，往往会让站长对该网站的更新频度以及权重产生怀

lovecloudpan 0喜欢 / 0评论 2016-07-21

百度搜索蜘蛛系统升级网站seo该如何做呢?

　　百度搜索大动作是时有的，近期，站长们应该都有所发现，百度除了对竞价排名规则进行了调整，同时对自然搜索的网站排名也有所调整，这一调整也是受百度spider升级的影响，蜘蛛的爬行规则变得越来越智能化，尤其体现在对网站内容的抓取收录以及内容质量的判断上，针对

小白的黑科技 0喜欢 / 0评论 2016-07-06

百度竞价悄然改版推广两字变为蓝色的商业推广

　　前段时间百度因为“魏则西事件”而被要求整改，百度的竞价排名也被推向了风口浪尖。最近有网友@闪电精灵SEO张扬爆料：百度竞价已改版，竞价显示4条，或许取消了右侧排名!但是在经过风波之后，百度的确有了一些变化，最明显的变化就是对推广的网站的标注，之前的对百

qrcwkt 0喜欢 / 0评论 2016-05-24

企业网站怎么利用百度竞价优化提升网站排名?

百度竞价和SEO是搜索引擎营销的两个分支，看似毫不相干，实则存在很多的关联，今天我们就来一起谈谈百度竞价对企业网站优化提升排名的重大作用。百度竞价是良方，当然开通百度竞价不是为了去做网站优化，而是如果企业有条件有需要去开通百度竞价，那无疑也能推动企业网

XSxing 0喜欢 / 0评论 2016-05-19

怎么样的关键词进行推广?百度推广竞价账户关键词选择策略

对于很多刚接触百度推广的客户来说，选择合适的关键词来为自己的企业进行宣传推广是尤其重要。一些客户在刚接触时，对于百度推广关键词选择的不重视、不了解、不管不问，直接导致了在后期推广费用快用完时才突然意识到，这钱白花了。而就目前国内各行各业的推广用户来说，拿出

seo爱好者 0喜欢 / 0评论 2016-05-11

关于网站内容如何快速被百度搜索收录的经验和技巧

一个网站，几分钟就被百度收录了，这能够反映什么问题呢？总结了四点：1、百度很看好这个站点，对这个网站有较高的信任度：一般新站是很难做到这点的（PS：快速消费品网却是新站，为什么也可以秒收？但是我们都知道，百度秒收后，并不代表内容一定有排名，有排名后，更不能

luyun0 0喜欢 / 0评论 2016-05-08

网站关键词百度快照排名最近浮动很大该怎么办?

比较细心的朋友最近几个月都会注意到，自己维护的网站或者注意到很多其他网站，在百度搜索结果内的网站关键词快照排名变的浮动起来。同时我们也注意到百度提高了自身产品的排名提升，比如贴吧、问答以及文库等信息的集体排名上升。事实上网站seo已经是当下网络推广的一种普

常德SEO小曹SEO 0喜欢 / 0评论 2016-03-30

百度的下拉框与相关搜索结果是怎么出来的？如何刷百度搜索下拉框进行营销引流？

百度下拉框主要被应用到的在搜索一个关键词的时候，百度会推荐一些和这个关键词相关联的长尾词出来让用户选择搜索，从而省去了打字的烦恼。百度下拉框的算法：一个关键词每天有多少搜索量，和它相关的词有多少搜索量，这些数据百度都会记录保存，如下图所示：

seo爱好者 0喜欢 / 0评论 2016-03-07

查询百度搜索的热词技巧百度热词搜索风云榜

感觉这些词汇很难写经验？这就离你的成功不大远了。有了关键词，我们写的经验就有更多的浏览量了。良性循环，生态圈越做越好。

seo爱好者 0喜欢 / 0评论 2015-09-16

怎么查看不同地区的人使用百度搜索词汇的排名？

根据不同的地区人的喜好，我们可以更好的做出营销，那么不同地区的人进行的搜索词汇也是不一样的，那么如何查看不同地区的人热搜的是什么呢，下面让我介绍一下查看方法。在搜索分类栏有一项为“更多”，点击打开更多

tingpurg 0喜欢 / 0评论 2015-04-06

百度快照取消时间显示不对排序产生任何影响

百度的一举一动，都会触动站长敏感的神经，在3月5日晚百度悄然取消掉了“快照日期”的显示。今日不少站长反应：快照时间不显示，链接都不好交换了，不过换句话来说，百度其实早在之前就给这样一个解释：“快照时间不会影响网站权重!”百度站长平台今日发布公告表示，百度搜

luyun0 0喜欢 / 0评论 2015-03-05

网站seo百度搜索语法详解

SEO是英文Search Engine Optimization的缩写，中文意译为“搜索引擎优化”。简单地说， SEO是指从自然搜索结果获得网站流量的技术和过程。Engine的意思为发动机，引擎。从而达成销售与建设的目标。

互联网 0喜欢 / 0评论 2015-02-01

怎么利用百度风云榜搜索热词？

能够上百度搜索风云榜是百度推出一个品牌词热度推荐的基础，能够被百度推荐，说明关注人数多，而想上百度风云榜并非是一件容易的事情，或许很多网络推广员做推广几年了还不如别人推广一次品牌上百度搜索风云榜的效果，相信很多推广员都认识到自己做了很多年，都没有一次上过风

randongjing 0喜欢 / 0评论 2015-01-06

一位SEOer做了四年百度竞价的一些经验感悟

笔者是09年毕得业，大学专业电子商务。毕业后进入了一家互联网公司从事网站开发，干了有一年多吧，感觉每天和代码打交道挺没劲的，于是干随辞了，11年初来到了一家生产太阳能的企业，开始从事百度竞价，一直做到现在。没几天，我的策划方案通过了，决定先尝试做百度竞价。

tongjianru 0喜欢 / 0评论 2014-12-02