将 Spark 数据加载到 Mongo / Memcached 中以供 Web 服务使用

2024-01-07

我对 Spark 非常陌生，并且有一个特定的工作流程相关问题。虽然它并不是真正与编码相关的问题，但它更像是与 Spark 功能相关的问题，我认为它在这里是合适的。如果您认为这个问题不适合，请随时将我重定向到正确的网站。

所以这里是： 1. 我计划使用 Spark 的滑动窗口功能使用请求流并计算推荐模型。一旦计算出模型，Web 服务是否可以直接从 RDD 查询和使用这些数据？如果是这样，有人可以向我指出一些如何实现这一目标的示例代码吗？

如果没有，我想将数据存储在memcached中，因为我存储的数据目前不是太大，主要是为了内存中迭代计算和流支持目的，我正在使用Spark，那么是否可以将RDD数据加载到memcached中？我这么问是因为我只能找到 Spark 的 Mongo 连接器，而找不到 Memcached 连接器。

任何帮助，特别是具体的代码示例/链接将不胜感激。

提前致谢。

您不能以这种方式直接查询 RDD。将您的 Spark 作业视为流处理器。您可以做的是将更新后的模型推送到某个“存储”，例如数据库（使用自定义 API 或 JDBC）、文件系统或 memcached。您甚至可以从 Spark 代码中进行 Web 服务调用。

无论您做什么，请注意处理每批数据（包括 I/O）的时间远低于您指定的间隔时间。否则，您将面临可能最终崩溃的瓶颈风险。

另一件需要注意的事情是，您的模型数据分布在集群中的多个 RDD 分区中（当然这是默认情况）。如果“记录”的顺序并不重要，那么并行写出它们就可以了。如果您需要按顺序写出的特定总顺序（并且数据确实不大），请调用collect将它们放入驱动程序代码内的一个内存数据结构中（这意味着分布式作业中的网络流量），然后从那里写入。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

将 Spark 数据加载到 Mongo / Memcached 中以供 Web 服务使用的相关文章

WCF 服务引用从 WSDL 生成 void 方法

这是我第一次尝试使用 WCF 所以我猜我做错了什么我正在尝试访问 WSDL 定义的肥皂服务http confluence atlassian com rpc soap axis confluenceservice v1 wsdl http
如何在spark Streaming中定期更新rdd

我的代码是这样的 sc SparkContext ssc StreamingContext sc 30 initRDD sc parallelize path to data lines ssc socketTextStream local
将 JSON 集合发送到 ASMX Web 服务

我有这门课 public class DesignElements public List
如何在 Spring-data 中更改/定义 Mongodb 的默认数据库？

我有从 MongoRepository 扩展的接口他们使用默认数据库 mongodb 我想定义类的数据库名称 public interface CustomerRepository extends MongoRepository
默认情况下，Spark sql 模式中的可为空性是建议性的。严格执行的最佳方法是什么？

我正在开发一个简单的 ETL 项目它读取 CSV 文件执行对每列进行一些修改然后将结果以 JSON 格式写出我想要读取我的结果的下游进程确信我的输出符合一个商定的模式但我的问题是即使我定义我的输入模式的所有字段都为 nu
点击 Java Web 服务：curl 或 URLConnection

我使用的 Java 服务器在以下 URL 上公开 RESTful API http localhost 8080 my server 文档建议使用curl用于提交简单的PUT请求文件上传并强烈建议用户使用与示例中提供的完全相同的参数所
行类型 Spark 数据集的编码器

我想写一个编码器Row https spark apache org docs 2 0 0 api java index html org apache spark sql Row html输入 DataSet 用于我正在执行的地图操作本
如何在 Spark Dataframe 中显示完整的列内容？

我正在使用 Spark csv 将数据加载到 DataFrame 中我想做一个简单的查询并显示内容 val df sqlContext read format com databricks spark csv option header
如何更新 Laravel 编辑视图中的图像？

在 Laravel 中我的编辑视图中有一个名为个人资料图片的字段每当我单击编辑按钮时我都会在编辑视图中从数据库中获取所有值但没有获得图像并且如果每当我每次单击提交按钮时我都必须如果没有上传图像我无法进一步处理我想要
在 MongoDB 查询中，负限制是什么意思？

我正在使用 Mongoid ruby gem 与 MongoDB 进行交互当我尝试从查询中获取某些内容时它会添加 limit 1 即负数当我希望它只使用1 我尝试在控制台中执行相同的操作但它没有更改返回的文档负数限制是否意味着什么
什么可能会在一台服务器上导致此错误，而在另一台服务器上则不会？

我们有一个连接到外部 Web 服务的 ASP Net 网站几天前它突然停止工作基本代码是这样的 Try request New ExternalWebService ProcessRequestService Error occurs
如何在 Meteor 应用程序之间共享 MongoDB 集合？

我希望能够为我的项目提供一个管理应用程序和一个客户端应用程序理想情况下我希望能够拥有一个共享的 MongoDB 集合我怎样才能做到这一点我尝试在两个不同的应用程序中创建具有相同名称的集合但发现 Meteor 会将数据分开知道我能
MongoRepository动态查询

我有以下问题假设我有以下模型对象 class Person String id String firstName String lastName Map
我的 Reporting Services 2008 Web 服务 URL 仅显示目录列表

我的机器上设置了报告服务我可以访问http localhost 8080 Reports SQL2008 http localhost 8080 Reports SQL2008报告管理器工作正常当我尝试访问 Web 服务 URL htt
使用 Java 为 MongoDB 中的外部值分配权重

这就是我如何创建具有不同权重的索引蒙戈外壳 db blog ensureIndex content text keywords text about text weights content 10 keywords 5
如何减少使用 AWS Glue 将 parquet 文件写入 s3 所需的时间

我正在创建一个胶水作业需要处理来自 s3 路径的每日 4TB 数据量 s3
在这种情况下如何填充 Mongoose？

const userSchema new mongoose Schema email type String unique true password String notifications notifiId type Schema Ty
Spark SQL 中的 SQL LIKE

我正在尝试使用 LIKE 条件在 Spark SQL 中实现联接我正在执行连接的行看起来像这样称为修订 Table A 8NXDPVAE Table B 4 8 NXD V 在 SQL Server 上执行联接 A revision
Spark 3 KryoSerializer 问题 - 无法找到类：org.apache.spark.util.collection.OpenHashMap

我正在将 Spark 2 4 项目升级到 Spark 3 x 我们遇到了一些现有 Spark ml 代码的问题 var stringIndexers Array StringIndexer for featureColumn lt FEAT
PySpark groupByKey 返回 pyspark.resultiterable.ResultIterable

我试图找出为什么我的 groupByKey 返回以下内容 0

随机推荐

使用powershell脚本将文件名重命名为下一个增量号[重复]

这个问题在这里已经有答案了我对 powershell 脚本有疑问我有一个每日任务计划程序它导出名为 12122 000000 txt 的文件并将其存储在 C 驱动器上我还有另一个 Report 文件夹位于 C Report 在该报
如何找到二叉树中给定深度的节点值之和？

为了这个我已经挠了好几个小时了 problem Binary Tree 0 depth 0 10 20 depth 1 30 40 50 60 depth 2 我正在尝试编写一个函数该函数以深度为参数并返回给定深度的节点值的总和例如如
Google Calendar API：如何在没有 Google 密码的情况下创建/编辑/删除事件？

我有一个应用程序可以读取编辑删除 Google 日历中的事件现在需要输入 Google 用户名和密码才能执行此操作然而这是一个问题许多用户害怕泄露密码问题有没有办法访问 Google 日历中的活动without询问用户他
Komodo编辑自动完成JS对象文字

问题是 Komodo 智能感知看不到这样定义的对象方法 var App window App method function 输入应用程序没有给出任何结果但是定义如下所示的对象效果很好 var App method function
“SystemInfo.deviceUniqueIdentifier”在 Android 构建中使用什么？

The 文档 https docs unity3d com ScriptReference SystemInfo deviceUniqueIdentifier html记录 iOS Windows 版本中使用的标识符但 Android 版
使用 DownloadFileTaskAsync 一次下载所有文件

给定一个包含 URL 的输入文本文件我想一次性下载所有相应的文件我用这个问题的答案使用 WebClient 和 TaskAsync 从异步 CTP 下载 UserState https stackoverflow com questio
如何检查多个单元格的值是否相等？

假设我有 6 个不同的单元格并非全部排成一行我想检查这些单元格中的值是否相等我怎样才能用一个函数来做到这一点我希望该函数只是显示等于或不等于或者可能更改单元格背景颜色 6 个单元的一种选择是 IF AND A1 B2 B2
如何比较用 Java 和 Xamarin C# 编写的 Android 应用程序的性能？无论如何检查定量数据（代码和结果）[关闭]

Closed 这个问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南 help closed questions 目前不接受答案我发现 Xamarin 声称他们在 Android 上的 Mono 实现及其 C 编译的应用程序比 J
如何仅针对特定规则或一组规则运行 eslint - 仅命令行

我知道你可以在 eslintrc文件但如果我只想运行怎么办eslint并检查一项特定规则 E g eslint helpme js rule some important rule 我不知道这是否是最好的方法但我能够让它工作 eslin
如何修改这个缓动函数以减少弹跳？

我正在尝试修改 Flash CS3 提供的fl motion easing bounce函数使生成的动画弹跳更少我知道减少弹跳有点模糊但我希望能帮助您理解该功能 Thanks param t Specifies the curren
Django 模板中的外键关系

我知道这个问题已经被问过很多次了但我仍然无法解决 model py class Awb models Model awb id models CharField primary key True max length 50 awb shi
Android 截取 Surface View 的屏幕截图显示黑屏

我正在尝试通过代码截取我的游戏的屏幕截图并通过意图共享它我可以做这些事情但是屏幕截图总是显示为黑色这是与共享屏幕截图相关的代码 View view MainActivity getView view setDrawingCacheEn
iPhone：ubercab 又名 (uber) 地图坐标

谁能描述如何通过 MKMapView 在屏幕中心的位置获取其地图坐标查看 Uber 应用程序免费它们有一个静态的图钉位于屏幕中间您拖动地图但图钉仍保留在那里屏幕中间是他们找到您的位置非常非常快向您显示您附近的地址嘿嘿我是
临时反应组件中的样式组件

我在反应中的临时包装器中使用样式组件时遇到两个问题组件已渲染但不使用背景颜色 ComponentWithAddedColors 不是有效的打字稿不知道为什么有谁可以帮忙解决这个问题吗 interface IProps id stri
Numpy 一次将数组与多个标量进行比较

假设我有一个数组 a np array 1 2 3 我想将它与一些标量进行比较这工作得很好就像 a 2 False True False 有没有办法可以同时使用多个标量进行这样的比较比较两个数组时的默认行为是进行元素比较但我希望一个
Django如何访问抽象Base模型局部变量

我将这个抽象基本模型定义如下 class ActivityAbstractBaseModel models Model POOR PR FAIR FA MEDIOCRE ME GOOD ENOUGH GE GOOD GO VERY GOOD
ODBC 不断提示输入密码

我有一个在 Access 2003 中构建的应用程序它使用系统 DSN ODBC 连接到 SQL Server ODBC 使用 SQL 身份验证当应用程序启动时系统会提示用户在数据库中进行身份验证我在同一域中设置了另一台计算机并安
在 Hive 中获取系统日期 -1

有什么办法可以得到current date 1在 Hive 中的意思是yesterdays date总是并且以这种格式 20120805 我可以像这样运行查询来获取数据yesterday s date就像今天一样Aug 6th selec
防止xss攻击的更好方法

这两种方法中哪一种是更好的防止 xss 攻击的方法保存在数据库中时的 HTMLEntities 显示回显时的 HTMLEntities 我发现第一个更好因为您可能会在显示时忘记添加它两者中哪一个是更好的防止xss攻击的方法保存在数
将 Spark 数据加载到 Mongo / Memcached 中以供 Web 服务使用

我对 Spark 非常陌生并且有一个特定的工作流程相关问题虽然它并不是真正与编码相关的问题但它更像是与 Spark 功能相关的问题我认为它在这里是合适的如果您认为这个问题不适合请随时将我重定向到正确的网站所以这里是 1 我计划

将 Spark 数据加载到 Mongo / Memcached 中以供 Web 服务使用

将 Spark 数据加载到 Mongo / Memcached 中以供 Web 服务使用 的相关文章

随机推荐

热门标签

将 Spark 数据加载到 Mongo / Memcached 中以供 Web 服务使用的相关文章