震惊!中国地震台网数据爬取

2023-11-05

在这里插入图片描述

import scrapy
import re

from scrapy import Request
from urllib import parse

from SpiderDemo.items import SpiderdemoItem
class CeicSpider(scrapy.Spider):
    name = 'ceic'
    allowed_domains = ['www.ceic.ac.cn/speedsearch?time=6']
    start_urls = ['http://www.ceic.ac.cn/speedsearch?time=6/']

    def parse(self, response):
        post_nodes = response.xpath('//*[@align="left"]/a/@href').extract()
        for post_node in post_nodes:
            yield Request(url=parse.urljoin(response.url,post_node),callback=self.parse_detail,dont_filter=True)

        next_url = response.xpath('//*[@id="paging"]/div/div/ul/li[last()-1]/a/@href').extract()[0]
        if next_url:
            yield Request(url=parse.urljoin(response.url,next_url),callback=self.parse,dont_filter=True)


    def parse_detail(self,response):

        spider_item = SpiderdemoItem()


        time = response.xpath('//*[@valign="middle"]/text()').extract()[1].strip()
        latitude = response.xpath('//*[@valign="middle"]/text()').extract()[3].replace("°","")
        longitude = response.xpath('//*[@valign="middle"]/text()').extract()[5].replace("°","")
        depth = response.xpath('//*[@valign="middle"]/text()').extract()[7].replace("千米","")
        level = response.xpath('//*[@valign="middle"]/text()').extract()[9]
        area = response.xpath('//*[@valign="middle"]/text()').extract()[11]


        spider_item["time"] = time
        spider_item["latitude"] = latitude
        spider_item["longitude"] = longitude
        spider_item["depth"] = depth
        spider_item["level"] = level
        spider_item["area"] = area

        return spider_item

Name:Eamonze
Time : 2020/12/5

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

震惊!中国地震台网数据爬取 的相关文章

随机推荐

  • xshell5下载和安装教程

    1 xshell5的下载 首先到xshell的官网去下载 这里附上下载地址xshell5官网下载 点击链接进入官网后 下一步点击页面上的的Download 下载 按钮 然后点击页面上的下载图标进行下载 然后选择Evaluation user
  • numpy中的 numpy.c_ numpy.ravel numpy.mgrid的理解

    这三个函数一般用于绘制网格坐标点 自己在学习的时候也遇到了疑惑 现在做一个笔记整理一下 1 numpy中的mgrid 首先看一个例子 x y np mgrid 3 3 1 3 3 1 这里我要生成一个从 3到2的矩阵步长为1 结果为 3 2
  • kubernetes的使用五--安装heapster

    本文是kubernetes的使用的第五篇 我们安装heapster heapser是kubernetes体系的监控插件 能够使dashboard更加漂亮 如下图所示 在github下载heapster代码 代码地址https github
  • qtCreator安装make时报错cpuid.h没有那个文件或目录

    安装完qt之后 编译安装qtcreator 此时报错了 错误界面如下 不要慌 看到这个界面就稳了 因为这个问题已经被我成功解决 首先去下面这个网址下载源码叫60cc910的一个文件 https codereview qt project o
  • Blazor入门——第一个入门程序

    Blazor 是一个使用 NET 生成交互式客户端 Web UI 的框架 使用 C 代替 JavaScript 来创建丰富的交互式 UI 共享使用 NET 编写的服务器端和客户端应用逻辑 将 UI 呈现为 HTML 和 CSS 以支持众多浏
  • Dr. Memory检测内存泄露

    1 软件测试说明 vs2013里面可以很好的检测出来 vs2015的工程检测的不是很准 2 对win10系统的版本有要求 有些比较新的系统无法使用 3 Debug或者Release都行 包括win32和x64 4 使用 方法1 1 控制台里
  • MkDocs的使用-流程图、序列图

    标准Markdown语法并不支持流程图 序列图的绘制 好在MkDocs能够通过第三方插件pymdown extensions扩展来实现 在前篇中已经完成了pymdown extensions的安装 现在可以使用superfences来实现流
  • Android SHA加密实现

    同前篇博文的MD5加密 只要把加密文本转换为String就好了 package com tencent utils import java security MessageDigest import java security NoSuch
  • Numpy攻略系列:高级索引机制

    Numpy攻略系列 高级索引机制 所谓高级索引就是不使用整数或者切片作为索引值 在这一节重点介绍三类高级索引 常规的高级索引 位置列表型高级索引 布尔型高级索引的一类 常规的高级索引 给定一个矩阵 我们要求相关位置设置为特殊值 这里我们就假
  • C语言实现链表创建

    C语言实现链表的创建 链表 是一种物理存储单元上非连续 非顺序的存储结构 数据元素的逻辑顺序是通过链表中的指针链接次序实现的 链表由一系列结点链表中每一个元素称为结点 组成 结点可以在运行时动态生成 每个结点包括两个部分 一个是存储数据元素
  • docker 部署springboot项目

    1 CentOS环境下需要安装docker jdk maven docker安装好后 需要修改一下镜像源地址 vi etc docker daemon json 添加如下 registry mirrors https registry do
  • input autocomplete="off"属性的作用

    有过表单设计经验的朋友肯定知道 当我们在浏览器中输入表单信息的时候 往往input文本输入框会记录下之前提交表单的信息 以后每次只要双击 input文本输入框就会出现之前输入的文本 这样有时会觉得比较方便 但有时也会暴露用户的隐藏数据 那么
  • 解决[Vue warn]: Invalid prop: type check failed for prop “index“.问题

    Vue warn Invalid prop type check failed for prop index Expected String got Undefined Vue 警告 属性无效 属性 索引 的类型检查失败 预期字符串 未定义
  • tcp参数详解之tcp_fin_timeout

    tcp fin timeout INTEGER 默认值是 60 对于本端断开的socket连接 TCP保持在FIN WAIT 2状态的时间 对方可能会断开连接或一直不结束连接或不可预料的进程死亡 默认值为 60 秒 过去在2 2版本的内核中
  • 【Java-----IO流(一)之字节流详解】

    IO流概述和分类 IO流概述 IO 输入 输出 Input Output 流 是一种抽象概念 对数据传输的总称 也就是说数据在设备间的传输成为流 流的本质是数据传输 IO流 用来处理设备间数据传输问题的 常见的应用如 文件复制 文件上传 文
  • HTML+CSS+JS+node.js实现websocket聊天室

    本文实现如题所说 使用的websocket库是nodejs websocket库 可在网上直接下载安装 npm install nodejs websocket 使用是直接在文件中require即可 一开始想用PHP写后台实现服务器端web
  • 泊松分布近似正态分布的表达式_泊松分布的意义

    刚学的时候 脑子乱成浆糊 现在回过头来思考 总算有些澄清了 以下心得 主要参考了马同学的包子铺解答 以及 生物统计学基础 孙尚拱中文译版 泊松分布源于二项分布 而二项分布属于离散概率分布 二项分布 描述的是试验成功次数的概率分布 成功次数是
  • 使用两个队列实现一个栈

    问题分析 观察队列和栈的特点 队列是先进先出的 而栈是先进后出的 也就是说 要使用队列实现一个栈 就是利用队列实现先进后出的规律 当pop元素时 最后一个pop的元素为栈的栈顶元素 问题解决 利用两个队列实现一个栈 当push元素时 pus
  • android开发(36) Android WebView背景设置为透明

    xml布局
  • 震惊!中国地震台网数据爬取

    import scrapy import re from scrapy import Request from urllib import parse from SpiderDemo items import SpiderdemoItem