震惊！中国地震台网数据爬取

2023-11-05

在这里插入图片描述

import scrapy
import re

from scrapy import Request
from urllib import parse

from SpiderDemo.items import SpiderdemoItem
class CeicSpider(scrapy.Spider):
    name = 'ceic'
    allowed_domains = ['www.ceic.ac.cn/speedsearch?time=6']
    start_urls = ['http://www.ceic.ac.cn/speedsearch?time=6/']

    def parse(self, response):
        post_nodes = response.xpath('//*[@align="left"]/a/@href').extract()
        for post_node in post_nodes:
            yield Request(url=parse.urljoin(response.url,post_node),callback=self.parse_detail,dont_filter=True)

        next_url = response.xpath('//*[@id="paging"]/div/div/ul/li[last()-1]/a/@href').extract()[0]
        if next_url:
            yield Request(url=parse.urljoin(response.url,next_url),callback=self.parse,dont_filter=True)


    def parse_detail(self,response):

        spider_item = SpiderdemoItem()


        time = response.xpath('//*[@valign="middle"]/text()').extract()[1].strip()
        latitude = response.xpath('//*[@valign="middle"]/text()').extract()[3].replace("°","")
        longitude = response.xpath('//*[@valign="middle"]/text()').extract()[5].replace("°","")
        depth = response.xpath('//*[@valign="middle"]/text()').extract()[7].replace("千米","")
        level = response.xpath('//*[@valign="middle"]/text()').extract()[9]
        area = response.xpath('//*[@valign="middle"]/text()').extract()[11]


        spider_item["time"] = time
        spider_item["latitude"] = latitude
        spider_item["longitude"] = longitude
        spider_item["depth"] = depth
        spider_item["level"] = level
        spider_item["area"] = area

        return spider_item

Name：Eamonze
Time ： 2020/12/5

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pycharm

python基础

爬虫

python

大数据

震惊！中国地震台网数据爬取的相关文章

让 VoiceChannel.members 和 Guild.members 返回完整列表的问题

每当我尝试使用 VoiceChannel members 或 Guild members 时它都不会提供适用成员的完整列表我从文本命令的上下文中获取 VoiceChannel 和 Guild 如下所示 bot command name
计算另一个字符串中多个字符串的出现次数

在 Python 2 7 中给定以下字符串 Spot是一只棕色的狗斑点有棕色的头发斑点的头发是棕色的查找字符串中 Spot brown 和 hair 总数的最佳方法是什么在示例中它将返回 8 我正在寻找类似的东西string c
多输出堆叠回归器

一次性问题我正在尝试构建一个多输入堆叠回归器添加到 sklearn 0 22 据我了解我必须结合StackingRegressor and MultiOutputRegressor 经过多次尝试这似乎是正确的顺序 import nu
嵌套列表的重叠会产生不必要的间隙

我有一个包含三个列表的嵌套这些列表由 for 循环填充并且填充由 if 条件控制第一次迭代后它可能类似于以下示例 a 1 2 0 0 0 0 0 0 4 5 0 0 0 0 0 0 6 7 根据条件它们不重叠在第二次迭代之后新
如何从Python中的函数返回多个值？ [复制]

这个问题在这里已经有答案了如何从Python中的函数返回多个变量您可以用逗号分隔要返回的值 def get name you code return first name last name 逗号表示它是一个元组因此您可以用括号将值括
为什么 web2py 在启动时崩溃？

我正在尝试让 web2py 在 Ubuntu 机器上运行所有文档似乎都表明要在 nix 系统上运行它您需要下载源代码并执行以下操作蟒蛇 web2py py 我抓住了source http www web2py com examples
更好地相当于这个疯狂的嵌套 python for 循环

for a in map for b in map a for c in map b for d in map c for e in map d print a b c d e 上面的代码用于创建图中一定长度的所有路径 map a 表示从
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
矩形函数的数值傅里叶变换

本文的目的是通过一个众所周知的分析傅里叶变换示例来正确理解 Python 或 Matlab 上的数值傅里叶变换为此我选择矩形函数这里报告了它的解析表达式及其傅立叶变换https en wikipedia org wiki Rectan
打印包含字符串和其他 2 个变量的变量

var a 8 var b 3 var c hello my name is var a and var b bye print var c 当我运行程序时 var c 会像这样打印出来 hello my name is 8 and 3 b
为什么一旦我离开内置的运行服务器，Django 就无法找到我的管理媒体文件？

当我使用内置的简单服务器时一切正常管理界面很漂亮 python manage py runserver 但是当我尝试使用 wsgi 服务器为我的应用程序提供服务时django core handlers wsgi WSGIHandle
Java 和 Python 可以在同一个应用程序中共存吗？

我需要一个 Java 实例直接从 Python 实例数据存储中获取数据我不知道这是否可能数据存储是否透明唯一或者每个实例如果它们确实可以共存都有其单独的数据存储总结一下 Java 应用程序如何从 Python 应用程序的数据存
使用 python/numpy 重塑数组

我想重塑以下数组 gt gt gt test array 11 12 13 14 21 22 23 24 31 32 33 34 41 42 43 44 为了得到 gt gt gt test2 array 11 12 21 22 13 14
Spider 必须返回 Request、BaseItem、dict 或 None，已“设置”

我正在尝试从以下位置下载所有产品的图像我的蜘蛛看起来像 from shopclues items import ImgData import scrapy class multipleImages scrapy Spider name m
制作一份 Python 文档的 PDF 文件

Python 官方网站提供 PDF 文档下载但它们是按章节分隔的我下载了源代码并构建了 PDF 文档这些文档也是单独的 PDF 我怎么能够从源代码中的 Makefile 构建一个 PDF 文件我认为这样阅读起来会更方便如果连接单独
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
如何使用 PrimaryKeyRelatedField 更新多对多关系上的类别

Django Rest 框架有一个主键相关字段 http www django rest framework org api guide relations primarykeyrelatedfield其中列出了我的 IDmany to m
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
JSON：TypeError：Decimal（'34.3'）不是JSON可序列化的[重复]

这个问题在这里已经有答案了我正在运行一个 SQL 查询它返回一个小数列表当我尝试将其转换为 JSON 时出现类型错误查询 res db execute SELECT CAST SUM r SalesVolume 1000 0 AS

随机推荐

xshell5下载和安装教程

1 xshell5的下载首先到xshell的官网去下载这里附上下载地址xshell5官网下载点击链接进入官网后下一步点击页面上的的Download 下载按钮然后点击页面上的下载图标进行下载然后选择Evaluation user
numpy中的 numpy.c_ numpy.ravel numpy.mgrid的理解

这三个函数一般用于绘制网格坐标点自己在学习的时候也遇到了疑惑现在做一个笔记整理一下 1 numpy中的mgrid 首先看一个例子 x y np mgrid 3 3 1 3 3 1 这里我要生成一个从 3到2的矩阵步长为1 结果为 3 2
kubernetes的使用五--安装heapster

本文是kubernetes的使用的第五篇我们安装heapster heapser是kubernetes体系的监控插件能够使dashboard更加漂亮如下图所示在github下载heapster代码代码地址https github
qtCreator安装make时报错cpuid.h没有那个文件或目录

安装完qt之后编译安装qtcreator 此时报错了错误界面如下不要慌看到这个界面就稳了因为这个问题已经被我成功解决首先去下面这个网址下载源码叫60cc910的一个文件 https codereview qt project o
Blazor入门——第一个入门程序

Blazor 是一个使用 NET 生成交互式客户端 Web UI 的框架使用 C 代替 JavaScript 来创建丰富的交互式 UI 共享使用 NET 编写的服务器端和客户端应用逻辑将 UI 呈现为 HTML 和 CSS 以支持众多浏
Dr. Memory检测内存泄露

1 软件测试说明 vs2013里面可以很好的检测出来 vs2015的工程检测的不是很准 2 对win10系统的版本有要求有些比较新的系统无法使用 3 Debug或者Release都行包括win32和x64 4 使用方法1 1 控制台里
MkDocs的使用-流程图、序列图

标准Markdown语法并不支持流程图序列图的绘制好在MkDocs能够通过第三方插件pymdown extensions扩展来实现在前篇中已经完成了pymdown extensions的安装现在可以使用superfences来实现流
Android SHA加密实现

同前篇博文的MD5加密只要把加密文本转换为String就好了 package com tencent utils import java security MessageDigest import java security NoSuch
Numpy攻略系列：高级索引机制

Numpy攻略系列高级索引机制所谓高级索引就是不使用整数或者切片作为索引值在这一节重点介绍三类高级索引常规的高级索引位置列表型高级索引布尔型高级索引的一类常规的高级索引给定一个矩阵我们要求相关位置设置为特殊值这里我们就假
C语言实现链表创建

C语言实现链表的创建链表是一种物理存储单元上非连续非顺序的存储结构数据元素的逻辑顺序是通过链表中的指针链接次序实现的链表由一系列结点链表中每一个元素称为结点组成结点可以在运行时动态生成每个结点包括两个部分一个是存储数据元素
docker 部署springboot项目

1 CentOS环境下需要安装docker jdk maven docker安装好后需要修改一下镜像源地址 vi etc docker daemon json 添加如下 registry mirrors https registry do
input autocomplete="off"属性的作用

有过表单设计经验的朋友肯定知道当我们在浏览器中输入表单信息的时候往往input文本输入框会记录下之前提交表单的信息以后每次只要双击 input文本输入框就会出现之前输入的文本这样有时会觉得比较方便但有时也会暴露用户的隐藏数据那么
解决[Vue warn]: Invalid prop: type check failed for prop “index“.问题

Vue warn Invalid prop type check failed for prop index Expected String got Undefined Vue 警告属性无效属性索引的类型检查失败预期字符串未定义
tcp参数详解之tcp_fin_timeout

tcp fin timeout INTEGER 默认值是 60 对于本端断开的socket连接 TCP保持在FIN WAIT 2状态的时间对方可能会断开连接或一直不结束连接或不可预料的进程死亡默认值为 60 秒过去在2 2版本的内核中
【Java-----IO流（一）之字节流详解】

IO流概述和分类 IO流概述 IO 输入输出 Input Output 流是一种抽象概念对数据传输的总称也就是说数据在设备间的传输成为流流的本质是数据传输 IO流用来处理设备间数据传输问题的常见的应用如文件复制文件上传文
HTML+CSS+JS+node.js实现websocket聊天室

本文实现如题所说使用的websocket库是nodejs websocket库可在网上直接下载安装 npm install nodejs websocket 使用是直接在文件中require即可一开始想用PHP写后台实现服务器端web
泊松分布近似正态分布的表达式_泊松分布的意义

刚学的时候脑子乱成浆糊现在回过头来思考总算有些澄清了以下心得主要参考了马同学的包子铺解答以及生物统计学基础孙尚拱中文译版泊松分布源于二项分布而二项分布属于离散概率分布二项分布描述的是试验成功次数的概率分布成功次数是
使用两个队列实现一个栈

问题分析观察队列和栈的特点队列是先进先出的而栈是先进后出的也就是说要使用队列实现一个栈就是利用队列实现先进后出的规律当pop元素时最后一个pop的元素为栈的栈顶元素问题解决利用两个队列实现一个栈当push元素时 pus
android开发(36) Android WebView背景设置为透明

xml布局
震惊！中国地震台网数据爬取

import scrapy import re from scrapy import Request from urllib import parse from SpiderDemo items import SpiderdemoItem

震惊！中国地震台网数据爬取

震惊！中国地震台网数据爬取 的相关文章

随机推荐

热门标签

震惊！中国地震台网数据爬取的相关文章