Python构建ANN模型预测气温变化

2023-11-03

在利用爬虫模型得到了气温数据集后，具体参考上篇Python构建爬虫模型爬取天气数据，我们开始利用tensorflow自带的模块搭建一个简单的ANN模型预测气温变化，其实这个模型适用于预测很多数据变化趋势，这里以预测气温变化为例。

import requests
from bs4 import BeautifulSoup
def get_data(city_name,tim):
    url="http://www.tianqihoubao.com/lishi/"+city_name+"/month/"+tim+".html"
    re=requests.get(url)
    html = re.content.decode('gbk')#规范编码，避免乱码
    soup = BeautifulSoup(html,'html.parser')
    data=soup.find_all('tr')
    for i in range(1,len(data)):#因为data[0]没有气温数据
        temp=data[i].text.split()
        temp1=temp[3][:-1]
        temp2=temp[5][:-1]
        res=0
        if temp1=='' and temp2=='':#后来爬数据发现有某天的气温不存在
            continue
        elif temp1=='':
            res=int(temp2)
        elif temp2=='':
            res=int(temp1)
        else:
            res=(int(temp1)+int(temp2))/2.0#取平均值
        #print(tim,temp1,temp2)
        fp.writelines(str(res)+'\n')
fp=open('data.txt','w',encoding='utf-8')
city_name="shanghai"
for year in range(2015,2020):#时间从2015年到2019年
    for month in range(1,13):#时间从1月到12月
        tim=str(year)
        if month<10:
            tim+=("0"+str(month))
        else:
            tim+=str(month)
        get_data(city_name,tim)#获取数据

fp.close()

运行上面的代码得到上海从2015年到2019年的完整气温数据，文件名叫data.txt，如下：
在这里插入图片描述

然后我们展开，这里很简单，我们以7个（也可以是其他个）气温为单位进行数据预测，也就是把前7个气温作为特征值，第8个为结果，也就是

x=[temp[i],temp[i+1],temp[i+2],temp[i+3],temp[i+4],temp[i+5],temp[i+6]]
y=[temp[i+7]]

以此得到我们模型的训练数据集。

一、读取数据

利用pandas读取数据

import pandas as pd
import numpy as np
def read_data(N):
    df=pd.read_csv('data.txt',header=None)#没有列名，为None
    data=df.values#提取数据内容
    X=[]
    Y=[]
    for i in range(N,len(data)):
        s=[]
        for j in range(i-N,i):
            s.append(data[j][0])
        X.append(s)
        Y.append(data[i][0])
    return np.array(X),np.array(Y)

N=7#特征数目
X,Y=read_data(N)
print(X)
print(Y)

显示内容如下：
在这里插入图片描述
于是我们得到了模型的训练数据集。

二、数据归一化
这里直接利用sklearn框架里面的MinMaxScaler模块进行数据归一化，比较方便，不用自己手写归一化函数了。

from sklearn.preprocessing import MinMaxScaler
'''
读取数据
'''
min_max_scaler = MinMaxScaler()
min_max_scaler.fit(X)
x = min_max_scaler.transform(X)#均值化处理
x_ = min_max_scaler.transform([[24.5,25.0,24.0,25.0,21.0,20.5,21.0]])#这里随便取一组数据，作为后面预测用，注意数据维度
y=Y

显示x和y的内容如下,print(x),print(y)：

在这里插入图片描述特征数据得到了很好的归一化。

三、训练集和测试集的划分

这里同样调用sklearn框架里面的train_test_split模块进行数据集划分

from sklearn.model_selection import train_test_split
'''
数据读取+均值化处理
'''
#划分数据集,按训练集:测试集=8:2比例划分
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.2)

四、构建ANN模型
ANN模型为人工神经网络模型，共三层结构，输入层，隐含层，输出层，我们需要对中间的隐含层的参数（主要为隐含层中的神经元层数和每层的神经元个数进行调整），手工搭建模型比较麻烦，但是tensorflow框架里面提供了现成的模型框架，我们只需要对隐含层参数进行修改即可。

from tensorflow import keras#这里可能很多人报错没有keras模块，我直接在阿里云天池平台跑的数据，本地电脑的python需要调整下tensorflow版本等问题
'''
数据的读取+均值化+划分
'''
#模型结构，采用relu函数为激活函数，输入层为N个属性
#下面为4层隐含层，每层的神经元个数依次为500，500，250，250
#输入层对应N个属性
model = keras.Sequential([
        keras.layers.Dense(500,activation='relu',input_shape=[N]),
        keras.layers.Dense(500,activation='relu'),
        keras.layers.Dense(250,activation='relu'),
        keras.layers.Dense(250,activation='relu'),
        keras.layers.Dense(1)])#最后输出为一个结果，也就是预测的值
#定义损失函数loss，采用的优化器optimizer为Adam
model.compile(loss='mean_absolute_error',optimizer='Adam')
#开始训练模型
model.fit(x_train,y_train,batch_size = 126,epochs=1000)#训练1000个批次，每个批次数据量为126

至此，利用现成的模块构建一个简单的ANN模型完成。

五、模型的预测

#输出结果预测
y_=model.predict(x_)
print('预测结果为：',y_)

六、完整代码

import pandas as pd
import numpy as np
from sklearn.preprocessing import MinMaxScaler
from sklearn.model_selection import train_test_split
from tensorflow import keras#这里可能很多人报错没有keras模块，我直接在阿里云天池平台跑的数据，本地电脑的python需要调整下tensorflow版本等问题
def read_data(N):
    df=pd.read_csv('data.txt',header=None)#没有列名，为None
    data=df.values#提取数据内容
    X=[]
    Y=[]
    for i in range(N,len(data)):
        s=[]
        for j in range(i-N,i):
            s.append(data[j][0])
        X.append(s)
        Y.append(data[i][0])
    return np.array(X),np.array(Y)

N=7#特征数目
X,Y=read_data(N)
#数据均值化
min_max_scaler = MinMaxScaler()
min_max_scaler.fit(X)
x = min_max_scaler.transform(X)#均值化处理
x_ = min_max_scaler.transform([[24.5,25.0,24.0,25.0,21.0,20.5,21.0]])#这里随便取一组数据，作为后面预测用，注意数据维度
y=Y
#划分数据集,按训练集:测试集=8:2比例划分
x_train,x_test,y_train,y_test = train_test_split(x,y,test_size = 0.2)
#模型结构，采用relu函数为激活函数，输入层为N个属性
#下面为4层隐含层，每层的神经元个数依次为500，500，250，250
#输入层对应N个属性
model = keras.Sequential([
        keras.layers.Dense(500,activation='relu',input_shape=[N]),
        keras.layers.Dense(500,activation='relu'),
        keras.layers.Dense(250,activation='relu'),
        keras.layers.Dense(250,activation='relu'),
        keras.layers.Dense(1)])#最后输出为一个结果，也就是预测的值
#定义损失函数loss，采用的优化器optimizer为Adam
model.compile(loss='mean_absolute_error',optimizer='Adam')
#开始训练模型
model.fit(x_train,y_train,batch_size = 126,epochs=1000)#训练1000个批次，每个批次数据量为126
#输出结果预测
y_=model.predict(x_)
print('预测结果为：',y_)

运行情况：
在这里插入图片描述

最后误差停留在1.0左右，预测结果为21.177862。

希望我的分享对你的学习有所帮助，如果有错误请及时指出，谢谢~

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

Python构建ANN模型预测气温变化的相关文章

Python：在列表理解本身中引用列表理解？

这个想法刚刚出现在我的脑海中假设您出于某种原因想要通过 Python 中的列表理解来获取列表的唯一元素 i if i in created comprehension else 0 for i in 1 2 1 2 3 1 2 0 0 3
使用 pythonbrew 编译 Python 3.2 和 2.7 时出现问题

我正在尝试使用构建多个版本的 python蟒蛇酿造 http pypi python org pypi pythonbrew 0 7 3 但我遇到了一些测试失败这是在运行的虚拟机上 Ubuntu 8 04 32 位当我使用时会发生这种情
在 python 程序中合并第三方库的最佳实践是什么？

下午好我正在为我的工作编写一个中小型Python程序该任务需要我使用 Excel 库xlwt and xlrd 以及一个用于查询 Oracle 数据库的库称为CX Oracle 我正在通过版本控制系统即CVS 开发该项目我想知道围
Django 管理员在模型编辑时间歇性返回 404

我们使用 Django Admin 来维护导出到我们的一些站点的一些数据有时当单击标准更改列表视图来获取模型编辑表单而不是路由到正确的页面时我们会得到 Django 404 页面模板它是偶尔发生的我们可以通过重新加载三次来重现它
将 Matplotlib 误差线放置在不位于条形中心的位置

我正在 Matplotlib 中生成带有错误栏的堆积条形图不幸的是某些层相对较小且数据多样因此多个层的错误条可能重叠从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置即沿 x 轴移动它以便重叠的线显示在彼此
通过最小元素比较对 5 个元素进行排序

我必须在 python 中使用元素之间的最小比较次数来建模对 5 个元素的列表进行排序的执行计划除此之外复杂性是无关紧要的结果是一个对的列表表示在另一时间对列表进行排序所需的比较我知道有一种算法可以通过 7 次比较总是在元素之间
使用带有关键字参数的 map() 函数

这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
PyUSB 1.0：NotImplementedError：此平台不支持或未实现操作

我刚刚开始使用 pyusb 基本上我正在玩示例代码here https github com walac pyusb blob master docs tutorial rst 我使用的是 Windows 7 64 位并从以下地址下载 z
如何替换 pandas 数据框列中的重音符号

我有一个数据框dataSwiss其中包含瑞士城市的信息我想用普通字母替换带有重音符号的字母这就是我正在做的 dataSwiss Municipality dataSwiss Municipality str encode utf 8 d
是否可以忽略一行的pyright检查？

我需要忽略一行的pyright 检查有什么特别的评论吗 def create slog group SLogGroup data Optional dict None SLog insert one SLog group group da
以编程方式停止Python脚本的执行？ [复制]

这个问题在这里已经有答案了是否可以使用命令在任意行停止执行 python 脚本 Like some code quit quit at this point some more code that s not executed sys e
Flask如何获取请求的HTTP_ORIGIN

我想用我自己设置的 Access Control Allow Origin 标头做出响应而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
使用 \r 并打印一些文本后如何清除控制台中的一行？

对于我当前的项目有一些代码很慢并且我无法使其更快为了获得一些关于已完成必须完成多少的反馈我创建了一个进度片段您可以在下面看到当你看到最后一行时 sys stdout write r100 80 n I use 80覆盖最终剩余的
Pandas：merge_asof() 对多行求和/不重复

我正在处理两个数据集每个数据集具有不同的关联日期我想合并它们但因为日期不完全匹配我相信merge asof 是最好的方法然而有两件事发生merge asof 不理想的数字重复数字丢失以下代码是一个示例 df a pd Da
有没有办法检测正在运行的代码是否正在上下文管理器内执行？

正如标题所述有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
有人用过 Dabo 做过中型项目吗？ [关闭]

Closed 这个问题是基于意见的 help closed questions 目前不接受答案我们正处于一个新的 ERP 风格的客户端服务器应用程序的开始阶段该应用程序是作为 Python 富客户端开发的我们目前正在评估 Dabo
使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

我想用Python创建不同的图形matplotlib pyplot 然后我想将其中一些保存到文件中而另一些则应使用show 命令然而 show 显示all创建的数字我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
Python 类继承 - 诡异的动作

我观察到类继承有一个奇怪的效果对于我正在处理的项目我正在创建一个类来充当另一个模块的类的包装器我正在使用第 3 方 aeidon 模块用于操作字幕文件但问题可能不太具体以下是您通常如何使用该模块 project aeidon P
Python Selenium：如何在文本文件中打印网站上的值？

我正在尝试编写一个脚本该脚本将从 tulsaspca org 网站获取以下 6 个值并将其打印在 txt 文件中最终输出应该是 905 4896 7105 23194 1004 42000 放置的动物的 HTML span class
如何将输入读取为数字？

这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数注意在Python 2

随机推荐

C++中的map用法详解

目录 1 map的介绍 2 map的操作 1 定义map类型 2 输出map中的元素 3 添加数据 4 查找数据 5 删除数据 1 map的介绍 map是C 中STL中的一个关联容器以键值对来存储数据数据类型自己定义它的内部数据结构是
PaddleX入门教程2：搭建并配置Paddlex的推理环境（CPU版本）

上一个教程中同学们掌握了利用PaddleX完成训练并发布模型后接下来我们将通过Python脚本来调用该模型并做一些基础应用本节教程主要教同学们从零搭建调用PaddleX导出模型的运行环境 1 运行PaddleX推理需要安装Visua
springboot学习（十）web工程扩展

登录接口这里是基于演示代码写的登录接口实际肯定不会这么low 会出现get请求包括参数注解也会用的是 RequestBody而不是 RequestParam Controller public class LoginControlle
Mac下，在VirtualBox上创建一台虚拟机

1 Mac下在VirtualBox上创建一台虚拟机主机 Mac 32位内存8G 虚拟机 Oracle VM VirtualBox 版本软件 Linux安装软件版本6 2 ISO映像 rhel server 6 2 i386 dvd
【浅谈PC市场】

市场调研机构Canalys数据显示今年一季度中国市场整体PC出货量同比下降24 至890万台已是连续第五个季度下跌今年截至618结束都没有一家主要的PC厂商愿意发战报 PC市场怎样走出寒冬谈谈你的理解和看法 PC市场在近年来确实
基于VB脚本开发的机器人高级语言进行轨迹规划演示

采用VB基本语言在其中嵌入机器人运动控制指令扩展成机器人高级编程语言本例子演示的是高级螺旋线轨迹规划 movep 0 0 0 0 0 0 a 0 2 b 0 2 12 56 for i 0 to 12 56 step 0 01 x a
MNIST手写数字库格式转换(c++可用的格式)

static int ReverseInt int i 转换魔数读取数据库中的图片数行数列数等信息 unsigned char ch1 ch2 ch3 ch4 ch1 i 255 ch2 i gt gt 8 255 ch3 i gt
在Windows7环境下使用GIT BASH免输入密码

背景根据一路向北的教 Windows下TortoiseGit over Putty or Openssh提交项目到GitLab 安装了TortoiseGit客户端并完成在Gitlab上公钥的部署但是有些操作必须通过GITbash命令行
现代教育技术计算机网络试题及答案,《现代教育技术》期末复习题及答案

现代教育技术期末复习1 一填空题 1 教育技术就是人类在教育活动中所采用的一切和方法的总和它分为有形的技术物化形态和的技术智能形态两大类答案技术手段无形 2 学习资源主要包括教学材料和答案支持系统学习环境 3
UE4c++ Brush创建

前言 UE4常用的new FSlateBrush的方式与正常的SlateStyle的方式就不说了这类的文章很多这里主要仿照引擎源码加载图片的方式加加载参考源码 FTestStyle h class FMainStyle public
SpringBoot主程序运行及配置文件

主程序运行 SpringBootApplication public class SpringbootApplication public static void main String args SpringApplication run
5G 的未来

目录 5G流量 5G应用场景 VR AR MR 5G关键技术超密集组网 5G关键技术动态自组织网 SON 软件定义网络SDN SDN与NFV的深度融合 5G挑战频谱资源新业务的挑战新使用场景的挑战终端设备带来的挑战 5G面临的安
反射和多线程基础

Version 邢朋辉今日主播邢朋辉 QQ 345086739 一今日内容 1 1 课程回顾 1 2 反射是啥 1 3 进程和线程 1 4 线程的创建方式 1 5 线程的状态 1 6 线程的常用方法二课程回顾 Java的基本语法
R语言的常用的包

在学习R的时候 R的包众多很多时候对于初学者会造成很大的困扰就是不知道用什么样的包比较合适我会在不断使用R的过程中进行使用同时结合使用体验为大家推荐合适的R包避免重复学习以节约时间标了精的是需要重点研究和掌握的包 1 数据导
写CSDN博客时，调节字体、大小、颜色

字体颜色样式系列为了突出重点内容想设置不同颜色颜色挑选网址 https blog csdn net wo919191 article details 84249531 face设置字体文本内容使用font标签包裹可通过face设置
查询tomcat可用端口

步骤一 cmd输入输入 netstat ano 步骤二查询端口号是否被占用 netstat aon findstr 端口号步骤三查询占用端口的应用 tasklist findstr 查询出的 listening 步骤四 taskki
如果有多个异步函数需要保证同时执行并保证全部执行完毕后再进行下一步

array push api post array push api get Promise all array then resArr gt resArr forEach res gt console log res 在 then后面判断
python3 抖音短视频链接去水印下载视频到本地

基于近段时间对抖音快手秒拍等视频抓取一直想搞一下加了个QQ群里面全是自媒体就是抖音快手秒拍的视频搬运工把一个平台搬到另外一个平台上去除水印降低被干掉的危险经过半天的琢磨自己用python也搞出来一个根据抖音分享视频链
python用input输入列表_python怎么用input函数输入一个列表

在Python3 0以后键盘输入使用input函数 gt gt gt x input gt gt gt 123 123 在命令行没有任何显示输入123后直接赋值给x 并打印仅仅使用input是无法解决大部分数据处理的通常输入的字符串
Python构建ANN模型预测气温变化

在利用爬虫模型得到了气温数据集后具体参考上篇Python构建爬虫模型爬取天气数据我们开始利用tensorflow自带的模块搭建一个简单的ANN模型预测气温变化其实这个模型适用于预测很多数据变化趋势这里以预测气温变化为例 import

Python构建ANN模型预测气温变化

Python构建ANN模型预测气温变化 的相关文章

随机推荐

热门标签

Python构建ANN模型预测气温变化的相关文章