基于Python+django短视频推荐系统

2023-12-20

1.1 研究背景和意义

社会经济水平的发展带动了网络技术的发展,网上的信息越来越多,在如今人们基本离不开互联网,人们在网上浏览各种信息,眼花缭乱,很难从这种背景下找到自己感兴趣的信息,既浪费人们的大量时间,也没有任何体验感,信息也越来越难展示给那些想要看这类信息的大众,而对于一些用户想要把自己的信息利用起来在大众的面前展示出来并且得到大众的喜爱从中获得一定的利润,也是一件很困难的事情[1],为了解决这种困难,推荐系统横空出世,解决了这些难题。推荐系统顾名思义就是面对海量的数据进行有效的推荐,解决用户的面临的各种难题。

目前推荐系统已经应用于社会中的诸多领域如电商、新闻、音乐短视频等等。短视频是大多数人娱乐生活中不可缺少的一部分,有了短视频需求,短视频推荐系统也是越做越好,越能满足用户的各种需求,受到广大用户的喜爱。短视频推荐系统为用户提供全方面的推荐,给大众的娱乐生活带来了非常便利的操作,节省了用户的时间以及提高了用户的体验感,给用户带来全身定制打造服务。

1.2 国内外研究现状

随着推荐系统越来越成熟,推荐算法越来越精确,推荐系统在各个领域都得到了很好的应用,在RecSys会议上谈到推荐系统应用的各个场景有很多,如视频网站、新闻广告、电子商务、音乐网站、社交网站等等,推荐系统在这些场景中都做得非常的出色,已经离不开推荐系统,推荐只会越来越完善。互联网大数据的崛起,为推荐系统提供了更多的数据,如移动电商数据、移动社交数据、地理数据等,变成了当今在社交推荐这块一个新的起点。随着推荐系统在各个领域内的成功应用,越来越多的人们把焦点聚集在推荐系统的推荐结果精准度和推荐算法的安全性、健壮性等问题。2015年,Alan Said等人在RecSys会议上发表论[2],阐述了一种清晰明了的推荐结果评价方式,同年,FrankHopfgartner 等人发表论文[3],讨论了基于流式数据的离线评价方式和对照试验,掀起了推荐算法评估的研究热潮。推荐系统首先在国外兴起,国内发现后,也进入大量的研究,起步相对于国外晚一些。2006年,当当网首当其冲先在推荐这方面做起了大量的研究,将各种东西推荐给大众,这个推荐方式一出来,立马受到大量用户的关注,因为这个服务首次出现,用户感到有一种新鲜感;2008年9月,淘宝网推出了自己的个性化推荐系统产品淘宝,该产品一上线就得到大众的喜欢,用户数量不断增加,它为用户推荐感兴趣的东西,精准度高,节省用户时间;2011年,百度强力推出个性化首页“一人一世界”[4],此版百度首页将基于大数据和机器学习积累的个性化数据,该产品根据每个用户的记录和信息推荐出符合自身的东西,非常有趣受用户喜爱;2014年阿里巴巴举办“天池”个性化推荐大赛,随着比赛的进行,算法也得到了很大的发展。

1.3 基于用户的协同过滤推荐技术简介

协同过滤推荐技术是目前应用范围最广的个性化推荐技术,其基本的思想是:收集用户的基本信息来挖掘用户与物品间潜在的关联关系,然后基于关联关系进行推荐。此算法的推荐模型相对比较简单,收集数据方面也非常方便,因此在应用方面也比较广泛。协同过滤在当今的互联网信息服务中有着十分广泛的应用,协同过滤算法主要可以分为三种。基于物品的协同过滤算法,基于用户的协同过滤算法和基于模型的协同过滤算法[5]。

基于用户的协同过滤算法以用户历史行为数据为基础,例如看影片列表,点击新闻列表和购买物品记录等都可视为用户感兴趣。基于所述行为指示所述用户对于所述特定商品的偏好,获取所述用户商品的评分矩阵。利用这些不同的用户对同一件商品的打分大小以此来计算出用户间的相似程度,并最终由相似用户行为列表推荐给用户。

如下图1.1所示,用户A、B、C和商品1、商品2、商品3、商品4。用户A喜欢商品1、商品2、商品3;用户B喜欢商品4;用户C喜欢商品2、商品3。现在需要给用户C推荐新闻:1)计算不同用户之间的相似度;2)找到相似用户喜欢但当前用户未点击的新闻。

图1.1 用户浏览图

根据上面的步骤计算用户之间的相似度,可以选用余弦相似度,如下公式(1- 1)所示,

(1-1)

上述式子中的参数为,���(���):用户���的历史浏览商品;���(���):用户���的历史浏览商品; ���(������):用户���和���的余弦相似度。使用这个公式从而得到和用户C最为相似的历史浏览商品记录是用户A,由于用户C中没有商品1的浏览记录,所以可以把商品1向用户C推荐。基于用户的协同过滤算法是一个基础的推荐算法,它的算法优势思路简单,运算速度比较快,可以实现较为准确的快速推荐功能。

【S2023047基于python+Django协同过滤的短视频推荐系统】 https://www.bilibili.com/video/BV1gP411M7Rr/?share_source=copy_web&vd_source=3d18b0a7b9486f50fe7f4dea4c24e2a4

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

基于Python+django短视频推荐系统 的相关文章

  • Python 的键盘中断不会中止 Rust 函数 (PyO3)

    我有一个使用 PyO3 用 Rust 编写的 Python 库 它涉及一些昂贵的计算 单个函数调用最多需要 10 分钟 从 Python 调用时如何中止执行 Ctrl C 好像只有执行结束后才会处理 所以本质上没什么用 最小可重现示例 Ca
  • SQLAlchemy 通过关联对象声明式多对多自连接

    我有一个用户表和一个朋友表 它将用户映射到其他用户 因为每个用户可以有很多朋友 这个关系显然是对称的 如果用户A是用户B的朋友 那么用户B也是用户A的朋友 我只存储这个关系一次 除了两个用户 ID 之外 Friends 表还有其他字段 因此
  • 将 Matplotlib 误差线放置在不位于条形中心的位置

    我正在 Matplotlib 中生成带有错误栏的堆积条形图 不幸的是 某些层相对较小且数据多样 因此多个层的错误条可能重叠 从而使它们难以或无法读取 Example 有没有办法设置每个误差条的位置 即沿 x 轴移动它 以便重叠的线显示在彼此
  • OpenCV Python cv2.mixChannels()

    我试图将其从 C 转换为 Python 但它给出了不同的色调结果 In C Transform it to HSV cvtColor src hsv CV BGR2HSV Use only the Hue value hue create
  • 使用带有关键字参数的 map() 函数

    这是我尝试使用的循环map功能于 volume ids 1 2 3 4 5 ip 172 12 13 122 for volume id in volume ids my function volume id ip ip 我有办法做到这一点
  • Django:按钮链接

    我是一名 Django 新手用户 尝试创建一个按钮 单击该按钮会链接到我网站中的另一个页面 我尝试了一些不同的例子 但似乎没有一个对我有用 举个例子 为什么这不起作用
  • Python - StatsModels、OLS 置信区间

    在 Statsmodels 中 我可以使用以下方法拟合我的模型 import statsmodels api as sm X np array 22000 13400 47600 7400 12000 32000 28000 31000 6
  • 如何使用 OpencV 从 Firebase 读取图像?

    有没有使用 OpenCV 从 Firebase 读取图像的想法 或者我必须先下载图片 然后从本地文件夹执行 cv imread 功能 有什么办法我可以使用cv imread link of picture from firebase 您可以
  • 绘制方程

    我正在尝试创建一个函数 它将绘制我告诉它的任何公式 import numpy as np import matplotlib pyplot as plt def graph formula x range x np array x rang
  • Flask如何获取请求的HTTP_ORIGIN

    我想用我自己设置的 Access Control Allow Origin 标头做出响应 而弄清楚请求中的 HTTP ORIGIN 参数在哪里似乎很混乱 我在用着烧瓶 0 10 1 以及HTTP ORIGIN似乎是这个的特点之一object
  • Jupyter Notebook 内核一直很忙

    我已经安装了 anaconda 并且 python 在 Spyder IPython 等中工作正常 但是我无法运行 python 笔记本 内核被创建 它也连接 但它始终显示黑圈忙碌符号 防火墙或防病毒软件没有问题 我尝试过禁用两者 我也无法
  • 每个 X 具有多个 Y 值的 Python 散点图

    我正在尝试使用 Python 创建一个散点图 其中包含两个 X 类别 cat1 cat2 每个类别都有多个 Y 值 如果每个 X 值的 Y 值的数量相同 我可以使用以下代码使其工作 import numpy as np import mat
  • 有没有办法检测正在运行的代码是否正在上下文管理器内执行?

    正如标题所述 有没有办法做到这样的事情 def call back if called inside context print running in context else print called outside context 这将
  • 类型错误:预期单个张量时的张量列表 - 将 const 与 tf.random_normal 一起使用时

    我有以下 TensorFlow 代码 tf constant tf random normal time step batch size 1 1 我正进入 状态TypeError List of Tensors when single Te
  • Python:如何将列表列表的元素转换为无向图?

    我有一个程序 可以检索 PubMed 出版物列表 并希望构建一个共同作者图 这意味着对于每篇文章 我想将每个作者 如果尚未存在 添加为顶点 并添加无向边 或增加每个合著者之间的权重 我设法编写了第一个程序 该程序检索每个出版物的作者列表 并
  • 使用 Python 的 matplotlib 选择在屏幕上显示哪些图形以及将哪些图形保存到文件中

    我想用Python创建不同的图形matplotlib pyplot 然后 我想将其中一些保存到文件中 而另一些则应使用show 命令 然而 show 显示all创建的数字 我可以通过调用来避免这种情况close 创建我不想在屏幕上显示的绘图
  • Python 类继承 - 诡异的动作

    我观察到类继承有一个奇怪的效果 对于我正在处理的项目 我正在创建一个类来充当另一个模块的类的包装器 我正在使用第 3 方 aeidon 模块 用于操作字幕文件 但问题可能不太具体 以下是您通常如何使用该模块 project aeidon P
  • 导入错误:没有名为 site 的模块 - mac

    我已经有这个问题几个月了 每次我想获取一个新的 python 包并使用它时 我都会在终端中收到此错误 ImportError No module named site 我不知道为什么会出现这个错误 实际上 我无法使用任何新软件包 因为每次我
  • 如何将输入读取为数字?

    这个问题的答案是社区努力 help privileges edit community wiki 编辑现有答案以改进这篇文章 目前不接受新的答案或互动 Why are x and y下面的代码中使用字符串而不是整数 注意 在Python 2
  • NotImplementedError:无法将符号张量 (lstm_2/strided_slice:0) 转换为 numpy 数组。时间

    张量流版本 2 3 1 numpy 版本 1 20 在代码下面 define model model Sequential model add LSTM 50 activation relu input shape n steps n fe

随机推荐

  • 3D可视化大屏:赋能行业数据可视化应用,让数据更鲜活

    互联网时代 各种数据信息充斥在我们的生活中 对于大量的数据 我们也需要大量的时间才能去分析理解 因此3D可视化大屏的展示无疑是令人兴奋的进步 3D数据大屏能够将数据以更加直观 更加生动的方式呈现出来 结合VR全景技术 将数据立体化 三维化
  • nuxt学习笔记

    主要看的课程1 课程1 课程2 上手简化版 初始化 1 创建项目 使用官方推荐的npx来安装 npm的5 2 x版本后默认安装了npx 首先 确保您已经安装了 yarn npx 默认包含在 npm v5 2 中 或 npm v6 1 使用
  • 性能测试:Jmeter压测过程中的短信验证码读取

    问题背景 现如今国内的大部分软件或者网站应用 普遍流行使用短信业务 比如登录 注册以及特定的业务通知等 对于这些业务 在使用Jmeter进行性能测试的过程中 就会需要自动获取和填入短信验证码 否则性能流程无法进行下去 由于绝大多数的系统其短
  • Python_Tkinter和OpenCV模拟行星凌日传输光度测定

    传输光度测定 在天文学中 当相对较小的天体直接经过较大天体的圆盘和观察者之间时 就会发生凌日 当小物体移过较大物体的表面时 较大物体会稍微变暗 最著名的凌日是水星和金星对太阳的凌日 借助当今的技术 天文学家可以在凌日事件期间探测到遥远恒星光
  • 异步FIFO设计之格雷码

    目录 二进制转格雷码 格雷码转二进制 相邻的格雷码只有1bit的差异 因此格雷码常常用于异步fifo设计中 保证afifo的读地址 或写地址 被写时钟 或读时钟 采样时最多只有1bit发生跳变 在不考虑路径延时的情况下 因为源数据 读写地址
  • JMeter 性能测试基本过程及示例

    jmeter 为性能测试提供了一下特色 jmeter 可以对测试静态资源 例如 js html 等 以及动态资源 例如 php jsp ajax 等等 进行性能测试 jmeter 可以挖掘出系统最大能处理的并发用户数 jmeter 提供了一
  • 【已解决】Redis序列化反序列化不一致 - String类型值多了双引号问题

    在项目中使用spring 的RedisTemplate从redis中获取数据的时候 发现字符串的value多了双引号 如下图所示 产生的原因可以分一下几个方面 一 采用的序列化对象不同 多服务之间调用时候 序列化服务A 向redis中写数据
  • 微服务常见的配置中心简介

    微服务架构中 常见的配置中心包括以下几种 Spring Cloud Config Spring Cloud Config是官方推荐的配置中心解决方案 它支持将配置文件存储在Git SVN等版本控制系统中 通过提供RESTful API 各个
  • 漏洞复现-亿赛通任意文件读取漏洞(附漏洞检测脚本)

    免责声明 文章中涉及的漏洞均已修复 敏感信息 均已做打码处理 文章仅做 经验分享 用途 切勿当真 未授权的攻击属于非法行为 文章中 敏感信息 均已做多层打马处理 传播 利用本文章所提供的信息而造成的任何直接或者间接的后果及损失 均由使用者本
  • 行业追踪,2023-12-20

    自动复盘 2023 12 20 凡所有相 皆是虚妄 若见诸相非相 即见如来 k 线图是最好的老师 每天持续发布板块的rps排名 追踪板块 板块来开仓 板块去清仓 丢弃自以为是的想法 板块去留让市场来告诉你 跟踪板块总结 成交额超过 100
  • 加速Scrum敏捷转型的必选培训机构

    针对敏捷转型培训 有一些知名的培训公司提供专业的敏捷培训课程和认证 以下是几家备受认可的敏捷转型培训公司 Leangoo领歌 Leangoo领歌是一款 永久免费的专业的敏捷开发管理工具 提供端到端敏捷研发管理解决方案 包括 小型团队敏捷开发
  • 【开题报告】基于SpringBoot的工资管理系统

    1 研究背景 基于SpringBoot的工资管理系统的选题背景主要可以从以下几个方面来考虑 1 企业运营管理需求 在现代企业中 薪资管理是人力资源管理的重要组成部分 直接影响到员工的工作积极性和企业的运营成本 随着企业规模的扩大和业务复杂性
  • Docker:容器化技术的革命者

    Docker介绍 随着云计算和虚拟化技术的不断发展 容器化技术逐渐成为了一种主流的部署和运行应用的方式 而在这个领域中 Docker无疑是最具影响力和最受欢迎的容器化技术之一 本文将介绍Docker的基本概念 优势以及应用场景 一 Dock
  • 基于SpringBoot的网上订餐系统的设计与实现

    一 选题背景 国内研究背景 互联网的发展为人们的生产 生活带来了许多便利 传统餐饮业和产业服务采用互联网技术 让整个餐饮业在转型过程中少走了弯路 取得了更好的发展 1 发达国家的 O2O 模式已经非常成熟 OpenTable 是美国目前市场
  • Temu诉讼为公关手段?出海警惕恶性竞争!

    在国内流量见顶 人口红利接近尾声时 国内企业出海谋发展 已是必然 因此 以Temu与Shein为代表的跨境电商平台 也成为这个赛道的新生力量 正在带领我国企业奔向星辰大海 不过 虽然各大巨头角逐的市场更为宽广 但是面临的市场竞争同样激烈 例
  • 如何有效获取APP新增用户

    在提升APP用户获取效果方面 有几个关键策略可以考虑 市场定位与目标用户明确 在推广过程中 确保清晰地了解你的目标用户是谁 以便有针对性地开展推广活动 对用户的需求和偏好有深入了解 可以更好地制定吸引用户的策略 引人入胜的营销策略 设计有吸
  • 【知识分享】Java实现“羊了个羊”的思路和代码

    羊了个羊 是一款近期流行的消除类游戏 其核心玩法是通过交换两张卡片来使三张相同的卡片连成一条线进行消除 以下是一个简单的Java实现思路和代码示例 首先 我们需要定义一个表示卡片的类 public class Card private St
  • 使用ASPOSE在一个word文件的自定义标记处插入另一个word

    package mycmf office import java io File import java io FileInputStream import java io IOException import java io InputS
  • 业界翘楚!百望云斩获钛媒体“年度最佳企业服务品牌”大奖

    近日 由钛媒体集团主办的2023 T EDGE全球创新大会暨EDGE AWARDS创新评选在北京隆重举办 会上 钛媒体重磅发布了2023 EDGE AWARDS全球创新评选榜单 百望云凭借 据全球知名咨询公司弗若斯特沙利文报告 百望云在20
  • 基于Python+django短视频推荐系统

    1 1 研究背景和意义 社会经济水平的发展带动了网络技术的发展 网上的信息越来越多 在如今人们基本离不开互联网 人们在网上浏览各种信息 眼花缭乱 很难从这种背景下找到自己感兴趣的信息 既浪费人们的大量时间 也没有任何体验感 信息也越来越难展