按小时将日期时间对象排序到 Pandas 数据框，然后使用 Matplotlib 可视化为直方图

2024-04-08

我需要按小时对观看者进行直方图排序。我有一些使用 Matplotlib 来做到这一点的经验，但是我不知道按小时对日期进行排序的最实用的方法是什么。

首先，我从 JSON 文件中读取数据，然后将两种相关的数据类型存储在 pandas Dataframe 中，如下所示：

data = pd.read_json('data/data.json')

session_duration = pd.to_datetime(data.session_duration, unit='s').dt.time
time = pd.to_datetime(data.time, format='%H:%M:%S').dt.time

viewers = []

for x, y in zip(time, session_duration):
    viewers.append({str(x):str(y)})

编辑：源文件看起来像这样，省略了不相关的部分。

{
    "time": "00:00:09",
    "session_duration": 91
},
{
    "time": "00:00:16",
    "session_duration": 29
},
{
    "time": "00:00:33",
    "session_duration": 102
},
{
    "time": "00:00:35",
    "session_duration": 203
}

请注意，session_duration 以秒为单位。

我必须区分两种类型的观众：

那些在直播中花费
那些在直播中花费 >= 1 分钟的人

为此，我这样做：

import datetime
for element in viewers:
    for time, session_duration in element.items():
        if datetime.strptime(session_duration, '%H:%M:%S').time() >= datetime.strptime('00:01:00', '%H:%M:%S').time():
            viewers_more_than_1min.append(element)
        else:
            viewers_less_than_1min.append(element)

因此，我的值在这样的字典中：{session_duration:time} 在哪里关键是会话结束的时间溪流和价值是观看所花费的时间.

[{'00:00:09': '00:01:31'},
 {'00:00:16': '00:00:29'},
 {'00:00:33': '00:01:42'},
 {'00:00:35': '00:03:23'},
 {'00:00:36': '00:00:32'},
 {'00:00:37': '00:04:47'},
 {'00:00:47': '00:00:42'},
 {'00:00:53': '00:00:44'},
 {'00:00:56': '00:00:28'},
 {'00:00:58': '00:01:17'},
 {'00:01:04': '00:01:16'},
 {'00:01:09': '00:00:46'},
 {'00:01:29': '00:01:07'},
 {'00:01:31': '00:01:02'},
 {'00:01:32': '00:01:01'},
 {'00:01:32': '00:00:36'},
 {'00:01:37': '00:03:03'},
 {'00:01:49': '00:00:57'},
 {'00:02:01': '00:02:15'},
 {'00:02:18': '00:01:16'}]

最后一步，我希望使用 Matplotlib 创建一个直方图，表示上述两种观众类型中每小时的观众数量。我想事情会是这样的：

import matplotlib.pyplot as plt
import datetime as dt
hours = [(dt.time(i).strftime('%H:00')) for i in range(24)]
plt.xlabel('Hour')
plt.ylabel('Viewer count')
plt.bar(hours, sorted_viewcount_byhour)

df = pd.read_json('data/data.json')

df['time'] = pd.to_datetime(df['time'])
#timedelta is a more appropriate data type for session_duration
df['session_duration'] = pd.to_timedelta(df['session_duration'], unit='s')

# Example filtering
df_short_duration = df[df['session_duration'].dt.total_seconds() <= 60]

# Example creating histogram
df_hist = df_short_duration.groupby(df['time'].dt.hour).count()
# Now just plot df_hist as a bar chart using matplotlib, might be something like plt.bar(df_hist.index, df_hist['count'])

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

python

pandas

matplotlib

datascience

dataanalysis

按小时将日期时间对象排序到 Pandas 数据框，然后使用 Matplotlib 可视化为直方图的相关文章

Gunicorn 工作人员无论如何都会超时

我正在尝试通过gunicorn运行一个简单的烧瓶应用程序但是无论我做什么我的工作人员都会超时无论是否有针对应用程序的活动工作人员在我设置任何内容后总是会超时timeout值到是什么导致它们超时当我发出请求时请求成功通过但工作
VSCode Settings.json 丢失

我正在遵循教程并尝试将 vscode 指向我为 Scrapy 设置的虚拟工作区但是当我在 VSCode 中打开设置时工作区设置选项卡不在用户设置选项卡旁边我还尝试通过以下方式手动转到文件 APPDATA Code User s
python multiprocessing 设置生成进程等待

是否可以生成一些进程并将生成进程设置为等待生成的进程完成下面是我用过的一个例子 import multiprocessing import time import sys def daemon p multiprocessing curr
PyQt 使用 ctrl+Enter 触发按钮

我正在尝试在我的应用程序中触发确定按钮我当前尝试的代码是这样的 self okPushButton setShortcut ctrl Enter 然而它不起作用这是有道理的我尝试查找一些按键序列here http ftp ics
Pycharm 在 os.path 连接上出现“未解析的引用”

将pycharm升级到2018 1 并将python升级到3 6 5后 pycharm报告未解析的引用 join 最新版本的 pycharm 不会显示以下行的任何警告 from os path import join expanduser
如何将特定范围内的标量添加到 numpy 数组？

有没有一种更简单更节省内存的方法可以单独在 numpy 中执行以下操作 import numpy as np ar np array a l r ar c a a 0 l ar tolist a r 它可能看起来很原始但它涉及获取给定数
Python 3：将字符串转换为变量[重复]

这个问题在这里已经有答案了我正在从 txt 文件读取文本并且需要使用我读取的数据之一作为类实例的变量 class Sports def init self players 0 location name self players pla
python的shutil.move()在linux上是原子的吗？

我想知道python的shutil move在linux上是否是原子的如果源文件和目标文件位于两个不同的分区上行为是否不同或者与它们存在于同一分区上时的行为相同吗我更关心的是如果源文件和目标文件位于同一分区上 shutil move
当字段是数字时怎么说...在 mongodb 中匹配？

所以我的结果中有一个名为城市的字段结果已损坏有时它是一个实际名称有时它是一个数字以下代码显示所有记录 db zips aggregate project city substr city 0 1 sort city 1 我需要修
Django 视图中的“请求”是什么

在 Django 第一个应用程序的 Django 教程中我们有 from django http import HttpResponse def index request return HttpResponse Hello world
Python - 如何确定解析的 XML 元素的层次结构级别？

我正在尝试使用 Python 解析 XML 文件中具有特定标记的元素并生成输出 excel 文档该文档将包含元素并保留其层次结构我的问题是我无法弄清楚每个元素解析器在其上迭代的嵌套深度 XML 示例摘录 3 个元素它们可以任意嵌套
Protobuf 如何编码 oneof 消息结构

对于这个 python 程序在编码时运行 protobuf 编码会给出以下输出 0a 10 08 7f8a 0104 08 02 10 0392 0104 08 02 10 03 18 01 我不明白的是为什么8a后面有一个01 为什么9
如何以正确的方式为独立的Python应用程序制作setup.py？

我读过几个类似的主题但还没有成功我觉得我错过或误解了一些基本的事情这就是我失败的原因我有一个用 python 编写的应用程序我想在标准 setup py 的帮助下进行部署由于功能复杂它由不同的 python 模块组成但单独
如何从pandas中的多列计算多列

我正在尝试使用函数从 pandas 数据框中的多个列计算多个列该函数采用三个参数 a b 和 c 并返回三个计算值 sum prod 和 quot 在我的 pandas 数据框中我有三个列 a b 和 c 我想从中计算列 sum pro
在virtualenv中下载sqlite3

我正在尝试使用命令创建应用程序python3 manage py startapp webapp但我收到一条错误消息 django core exceptions ImproperlyConfigured 加载时出错 pysqlite2 或
根据 Pandas 中的列表选择数据框行的子集

我有一个数据框df1并列出x In 22 import pandas as pd In 23 df1 pd DataFrame C range 5 B range 10 20 2 A list abcde In 24 df1 Out 24
pandas.read_csv 将列名移动一倍

我正在使用位于的 ALL zip 文件here http www fec gov disclosurep PDownload do 我的目标是用它创建一个 pandas DataFrame 但是如果我跑 data pd read csv
如何在 Flask 中的视图函数/会话之间传递复杂对象

我正在编写一个 Web 应用程序当且仅当用户登录时该应用程序从第三方服务器接收大量数据这些数据被解析为自定义对象并存储在list 现在用户在应用程序中使用这些数据调用不同的视图例如发送不同的请求我不确定什么是最好的模式在视
pytest找不到模块[重复]

这个问题在这里已经有答案了我正在关注pytest 良好实践 https docs pytest org en latest explanation goodpractices html test discovery或者至少我认为我是但是
如何在Python脚本中从youtube-dl中提取文件大小？

我是 python 编程新手我想在下载之前提取视频音频大小任何 YouTube 视频 gt gt gt from youtube dl import YoutubeDL gt gt gt url https www youtube c

随机推荐

有没有办法为 Swift 4.2 随机数生成器提供种子

我喜欢新的 Swift 4 2 RandomNumberGenerator 东西但我没有看到那里有种子的可能性我是否遗漏了一些东西或者有什么方法可以通过调用底层低级函数来为这些生成器提供种子我有很多代码它们在默认数字类型上使用默认
创建APK时Android应用程序图标变得模糊

创建 APK 时我的应用程序图标变得模糊我尝试下载一个具有非常尖锐图标的 Android 应用程序的 APK 并将其放入我的 APK 中但得到了相同的结果为什么我的图标变得模糊而我在使用相同图标的其他应用程序中看到它却非常清晰当然
转换时我得到 LINQ to Entities Int32 ToInt32(System.String)

当 Convert i 尝试 int Parse SqlFunction 和 EdmFunction 时我得到 LINQ to Entities Int32 ToInt32 System String 但问题仍然存在例外 System
`enforce_stop_tokens` 如何在 LangChain 中与 Huggingface 模型一起工作？

当我们查看 HuggingFaceHub 模型的使用情况时langchain有这部分作者不知道如何停止生成 https github com hwchase17 langchain blob master langchain llms hu
django-social-auth 中的 Django 错误

我是 Django 的新手我正在我的应用程序中实现 Facebook 身份验证我在终端输出中遇到的错误类似于 File manage py line 10 in
在 Flutter 中在 X 上旋转 3D

我一直在研究 Flutter 旋转 new Matrix4 identity rotateX degrees 3 1415927 180 但是问题是我希望它与下图类似我可以用 Flutter 在 x 轴上实现类似 3D 的旋转吗即使
Python中删除只读目录

shutil rmtree不会删除 Windows 上的只读文件有没有相当于 rm rf 的Python 为什么哦为什么这么痛苦 shutil rmtree可以采用一个错误处理函数当删除文件时遇到问题时将调用该函数您可以使用它来强制删
无法查询 ListField(EmbeddedDocumentField)

我有以下型号 class Skill EmbeddedDocument name StringField required True level IntField required True class Agent Document nam
iPhone版本兼容性扫描仪

好吧我开发 iPhone 应用程序已经一年多了但有一件事仍然很糟糕假设我想让我的应用程序与 iOS 3 0 兼容我将 sdk 设置为可用的最新版本并将部署目标设置为 3 0 但是如果您不小心调用了仅在 3 1 x 或更高版本中可
如何在 woocommerce 中检查产品是否有变化

有什么方法可以检查产品是否有变化例如请帮我这应该有效 if product gt is type simple No variations to product elseif product gt is type variable P
python 3.2: IOError: [Errno 22] 无效参数: '/home/pi/data/temp/file1\n.txt'

我是 python 编程的新手我有一个 counter txt 文件我从中读取计数器值使用此计数器值我必须在其他文件夹中创建新文件例如 home pi data temp file s txt line 例如 file1 txt
我的 Java 程序读取一个大文本文件时内存不足，有人能帮忙解释一下为什么吗？

我有一个包含 2000 万行文本的大型文本文件当我使用以下程序读取文件时它工作得很好事实上我可以读取更大的文件而不会出现内存问题 public static void main String args throws IOExcepti
SetWindowsHookEx 和 WH_KEYBOARD 对我不起作用，我错了什么？

include
检测“丢失视频”Youtube 图片

来自未来穴居人的问候我在我的页面上加载了很多 YouTube 缩略图它们从我的数据库中的缩略图网址加载 YouTube 上的相关视频有时会被作者更改或删除这给我留下了两个问题我正在从 youtube 加载空白图片在我的数据库中我
如何将 DI 与电子邮件和 SMS 类一起使用

我有这个界面 public interface IMessageSender Task SendMessageAsync parameters 还有这个类 public class EmailSender IMessageSender pu
尝试通过重新打开的套接字发送时出现 ObjectDisposeException

我在用着Socket Socket A new Socket 发送接收当发生某些事情断开连接时我尝试关闭处置旧对象然后实例化一个新套接字 A new Socket 同一主机端口 The connect 阶段检查正常远程主机
无法渲染多边形（无法保留索引：XX）：featureID：X key：XXXX

我有用Mac OS X 10 9 3 and Xcode 5 1 1 在我的应用程序中我必须使用MKMapView 一切都工作正常但在 iOS 6 1 中我在控制台中显示了奇怪的错误例如 Can t render polygon ca
使用 Dart 模拟 HTTP 响应

我一直在开发一个新的 API 包装器并且不想每次运行单元测试时都调用该 API 所以正如所描述的here https stackoverflow com questions 24208588 mocking with dart 我在嘲笑它
获取满足特定条件的数组项的计数

我有一个名为 friend comparisons 的数组其中填充了许多用户对象然后我使用以下命令对数组进行排序 friend comparisons sort a b b completions where list id gt li
按小时将日期时间对象排序到 Pandas 数据框，然后使用 Matplotlib 可视化为直方图

我需要按小时对观看者进行直方图排序我有一些使用 Matplotlib 来做到这一点的经验但是我不知道按小时对日期进行排序的最实用的方法是什么首先我从 JSON 文件中读取数据然后将两种相关的数据类型存储在 pandas Dataf

按小时将日期时间对象排序到 Pandas 数据框，然后使用 Matplotlib 可视化为直方图

按小时将日期时间对象排序到 Pandas 数据框，然后使用 Matplotlib 可视化为直方图 的相关文章

随机推荐

热门标签

按小时将日期时间对象排序到 Pandas 数据框，然后使用 Matplotlib 可视化为直方图的相关文章