如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？

2024-01-28

例如，如何执行以下等效的 SQL（插入到BINARY(16) field)

INSERT INTO Table1 (MD5) VALUES (X'6717f2823d3202449201145073ab871A'),(X'6717f2823d3202449301145073ab371A')

using dbWriteTable()? Doing

dbWriteTable(db, "Table1", data.frame(MD5 = "X'6717f2823d3202449201145073ab871A'", ...), append = T, row.names = F)

似乎不起作用 - 它将值写入文本。

最后，我将拥有一个我想要编写的哈希值的大 data.frame，并且非常适合使用dbWriteTable。但我就是不知道如何INSERT the data.frame into binary数据库字段。

所以这里有两种似乎可行的可能性。第一个用途dbSendQuery(...)循环（你可能已经想到了这一点......）。

db.WriteTable = function(con,table,df) {  # no error checking whatsoever...
  require(DBI)
  field <- colnames(df)[1] 
  for (i in 1:nrow(df)) {
    query <- sprintf("INSERT INTO %s (%s) VALUES (X'%s')",table,field,df[i,1])
    rs    <- dbSendQuery(con,statement=query)
  }
  return(nrow(df))
}

library(DBI)
drv <- dbDriver("SQLite")
con <- dbConnect(drv)
rs  <- dbSendQuery(con, statement="CREATE TABLE hash (MD5 BLOB)")

df  <- data.frame(MD5=c("6717f2823d3202449201145073ab871A",
                        "6717f2823d3202449301145073ab371A"))

rs       <- db.WriteTable(con,"hash",df)
result.1 <- dbReadTable(con,"hash")
result.1
#                                                              MD5
# 1 67, 17, f2, 82, 3d, 32, 02, 44, 92, 01, 14, 50, 73, ab, 87, 1a
# 2 67, 17, f2, 82, 3d, 32, 02, 44, 93, 01, 14, 50, 73, ab, 37, 1a

如果你的哈希数据框非常大，那么df.WriteFast(...)做同样的事情db.WriteTable(...)只是它应该更快。

db.WriteFast = function(con.table,df) {
  require(DBI)
  field <- colnames(df)[1]
  lapply(unlist(df[,1]),function(x){
         dbSendQuery(con,
                     statement=sprintf("INSERT INTO %s (%s) VALUES (X'%s')",
                                        table,field,x))})
}

注意result.1是一个数据框，如果我们在调用中使用它dbWriteTable(...)我们可以成功地将哈希值写入 BLOB。所以这是可能的。

str(result.1)
# 'data.frame': 2 obs. of  1 variable:
#  $ MD5:List of 2
#   ..$ : raw  67 17 f2 82 ...
#   ..$ : raw  67 17 f2 82 ...

第二种方法利用了 R 的优势raw数据类型来创建结构如下的数据框架result.1，并将其传递给dbWriteTable(...)。您可能认为这很容易，但事实并非如此。

h2r = function(x) {
  bytes <- substring(x, seq(1, nchar(x)-1, 2), seq(2, nchar(x), 2))
  return(list(as.raw(as.hexmode(bytes))))
}
hash2raw = Vectorize(h2r)

df.raw=data.frame(MD5=list(1:nrow(df)))
colnames(df.raw)="MD5"
df.raw$MD5 = unname(hash2raw(as.character(df$MD5)))
dbWriteTable(con, "newHash",df.raw)
result.2 <- dbReadTable(con,"newHash")
result.2

all.equal(result.1$MD5,result.2$MD5)
# [1] TRUE

在这种方法中，我们创建一个数据框df.raw其中有一列，MD5，其中每个元素是原始字节的列表。效用函数h2r(...)获取哈希的字符表示，将其分解为向量char(2)（字节），然后将每个字节解释为十六进制（as.hexmode(...))，将结果转换为原始 (as.raw(...)），最后以列表形式返回结果。Vectorize(...)是一个包装器，允许hash2raw(...)以向量作为其参数。

就个人而言，我认为您最好使用第一种方法：它利用 SQLite 的内部机制将十六进制写入 BLOB，并且更容易理解。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？的相关文章

如何用外部图像填充地图边界？

我正在创建一张带有州边界的巴西地图这可以直接使用ggplot2 and geom sf 然而这一次我不想用数据填充每个状态的颜色而是想用外部图像 png 填充每个状态的边界类似于this https online olivet e
我无法下载 R 中的 reshape2 包 [关闭]

Closed 这个问题是无法重现或由拼写错误引起 help closed questions 目前不接受答案我在尝试安装 R 包时收到此响应 gt installed packages reshape2 Package LibPath V
正则表达式字符串中第一个和最后一个非点的位置

我希望找到字符串的第一个和最后一个非点元素的位置理想情况下我想这样做regex在基地R 我已经写过R解决问题的代码不过我对一个感兴趣regex解决方案感谢您的任何建议这是一个示例数据集和R代码以获得所需的结果此代码拆分字符串并使
在 R 中向散点图添加线条

如何向图表添加线条我做了以下 dat lt data frame xvar 1 20 rnorm 20 sd 10 yvar 1 20 rnorm 20 sd 10 zvar 1 20 rnorm 20 sd 10 plot dat 1
对于数据库来说，选择正确的数据类型会影响性能吗？

如果是这样为什么我的意思是 tinyint 的搜索速度比 int 快吗如果是这样性能上的实际差异是什么是的根据数据类型它确实有所不同 int vs tinyint不会在速度上产生明显的差异但会在数据大小上产生差异假设tin
R - Plm 和 lm - 固定效应

我有一个平衡面板数据集 df 本质上由三个变量组成 A B and Y 对于一堆独特识别的区域来说它会随着时间的推移而变化我想运行一个回归其中包括区域下面等式中的区域和时间年份固定效应如果我没记错的话我可以通过不同的方式来
什么是数据库池？

我只是想了解数据库连接池的概念以及它是如何实现的数据库联系池是一种用于保持数据库连接打开的方法以便其他人可以重用它们通常打开数据库连接是一项昂贵的操作尤其是在数据库位于远程的情况下您必须打开网络会话进行身份验证检查授权等等
时间戳半小时窗口内字段的平均值

我的数据框有列名Timestamp es看起来像 Timestamp es 2015 04 01 09 07 42 31 2015 04 01 09 08 01 29 5 2015 04 01 09 15 03 18 5 2015 04 0
Scrapy - 持续从数据库中获取要爬取的url

我想不断地从数据库中获取要爬行的网址到目前为止我成功地从基地获取了 url 但我希望我的蜘蛛继续从该基地读取因为该表将由另一个线程填充我有一个管道一旦爬行工作就会从表中删除 url 换句话说我想使用我的数据库作为队列我尝试
绘制点之间的所有线

我有以下 R 代码 x lt c 0 01848598 0 08052353 0 06741172 0 11652034 y lt c 0 4177541 0 4042247 0 3964025 0 4074685 d lt data fr
将 Android 应用程序从 Lite 升级到 Pro 版本时保持相同的 SQLite 数据库

首先我已经进行了搜索但找不到我的问题的具体答案所以这里是我正在编写我的第一个 Android 应用程序并计划拥有 Lite 版本有限功能和付费版本完整功能 Lite 和 Pro 版本将使用相同的 SQLite 数据库结构如
Dendextend：关于如何根据定义的组为树状图的标签着色

我正在尝试使用一个名为 dendextend 的很棒的 R 包来绘制树状图并根据一组先前定义的组为其分支和标签着色我已阅读您在 Stack Overflow 中的答案以及 dendextend vignette 的常见问题解答但我仍然不
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
从命令行运行 R 代码 (Windows)

我在名为 analysis r 的文件中有一些 R 代码我希望能够从命令行 CMD 运行该文件中的代码而无需通过 R 终端并且我还希望能够传递参数并在我的代码中使用这些参数例如就像下面的伪代码 C gt execute r scri
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
在 R 中创建虚拟变量，排除某些情况为 NA

我的数据看起来像这样 V1 V2 A 0 B 1 C 2 D 3 E 4 F 5 G 9 我想创建一个虚拟变量R where 0 1 1 2 3 4 and NA 0 5 9 应该很简单有人可以帮忙吗我们可以转换V2 into a fa
如何在不运行 PostgreSQL 服务器的情况下初始化 PostgreSQL 数据库

在初始化脚本中我想初始化 PostgreSQL 目录但在此阶段不需要也不希望正在运行的 PostgreSQL 服务器如果我只是创建集群作为用户postgres initdb D 但是我还需要创建 PostgreSQL 角色创
将每列的值乘以 R 中另一个 data.frame 中的权重

我有两个data frames df and weights 代码如下 df看起来像这样 id a b d EE f 1 this 0 23421153 0 02324956 0 5457353 0 73068586 0 5642554 2
如何在 SQLite 中将时间戳转换为字符串？

我有一个表其中存储了时间戳以毫秒为单位我想将这些时间戳转换为人类可读的形式这是我的表的输出示例 SELECT date raw strftime d m Y date 1000 as string FROM my table raw
在sqlite SQL语句中与order by子句结合使用limit

下面的两条 SQL 语句总是会产生相同的结果集吗 1 SELECT FROM MyTable where Status 0 order by StartTime asc limit 10 2 SELECT FROM SELECT FROM

随机推荐

芝麻服务器对 SPIN 的支持

我是 SPIN 的新手我阅读了文档并查找了一些示例但我想开始使用它我看到了一些工具http topquadrant com http topquadrant com对于 SPIN 但我已经使用 openrdf sesame 服务器一段
Android 画布坐标系

我正在尝试查找有关如何更改画布坐标系的信息我有一些矢量数据想使用圆形和线条等绘制到画布上但数据的坐标系与画布坐标系不匹配有没有办法将我正在使用的单位映射到屏幕的单位我正在绘制一个不占用整个显示屏的 ImageView 如果我必须在
Tkinter Spinbox 小部件设置默认值

我有一个 tkinter spinbox sb Spinbox frame from 1 to 12 我想将 spinbox 的默认值设置为 4 我该怎么做我读过这个帖子布莱恩建议设置 Tkinter Spinbox values 1
实体控制边界（ECB）与模型视图控制器（MVC）[重复]

这个问题在这里已经有答案了我不确定我是否有正确的概念人们告诉我边界视图实体模型控制控制器然而基于我对 MVC 的了解胖模型瘦控制器不是 Boundary Controller Control Model 业务逻辑和
如何防止这个 jQuery 函数在每次页面加载时执行？

我相信我有办法解决我的问题但我想确定一下这就是我所拥有的
有图像和文本的按钮，图像下方有文本，怎么样？

第一次使用 xamarin 的跨平台应用程序我正在 Visual Studio 2017 社区中使用 xamarin 表单我有一个带有图像和文本的按钮但文本需要位于图像下方目前文本显示在图像的左侧我该怎么做 using Syste
将字符串转换为日期和日期时间

如果我有一个格式为的 PHP 字符串mm dd YYYY 例如 10 16 2003 我如何正确地将其转换为Date然后一个DateTime格式为YYYY mm dd 我要求两者的唯一原因Date and DateTime是因为我需要一个在
IE7 中的 CSS
- 间隙
我有一个CSS ul li 嵌套菜单在 IE 8 和 Firefox 中完美运行但在 IE7 中它会在元素之间产生一个小间隙这是我的CSS nav nav ul margin 0 padding 0 list style type no
Heroku sock=Flask SocketIO 应用程序的后端服务器请求中断

我有一个在heroku上托管的flask socketio应用程序其中包含以下Procfile web gunicorn worker class eventlet hello app 自从我切换到 socketio 以来该应用程序的行
在箱线图中绘制空组

我想以特定的风格绘制很多箱线图来比较它们但是当组为空时该组不会被绘制假设我有一个数据框 a b 1 1 5 2 1 4 3 1 6 4 1 4 5 2 9 6 2 8 7 2 9 8 3 NaN 9 3 NaN 10 3 NaN
为什么 ::first-letter 中的文本修饰不能级联 ::first-line 中的文本修饰？

看起来text decoration in first letter不能级联text decoration in first line 这是代码 p first line color orange font size 22px text d
从参数分配集合的首选方法是什么？

我有这门课 public MyClass public void initialize Collection
将会话数据存储在 cookie 中

最近我偶然发现一些文章建议使用 cookie 来存储会话数据我喜欢这个想法并通过添加一个运行良好的 CookieStorage 类来扩展我的会话存储请注意每个用户我使用唯一的哈希密钥来签名和加密数据然而还有很多其他文章建议不要在
如何在 VSTS nuget 还原中指定外部 nuget 源的凭据

我正在使用 VSTS 中内置的 nuget 任务来执行包恢复我们的提要托管在内部 Artifactory 服务器上并在我的 nuget config 中作为包源进行引用然后我使用 VSTS 中的 nuget 服务端点来存储访问该源的
如何将大整数从字符串转换为 uint64_t？

我有一个大整数存储为字符串我需要将其转换为整数 uint64 t 我试过stoi 但是在抛出一个实例后它崩溃了std out of range 该字符串的最大长度为 64 位整数值最大值为 18 446 744 073 709 551
Visual Studio 安装项目：以当前用户而非系统帐户身份运行 CustomActions/process

我正在 Visual Studio 2010 中使用 C Outlook 加载项 Office 2010 2013 和其他独立工具的安装项目在安装过程中我杀死了所有 Outlook 实例然后我想重新启动 Outlook 实例在我的插
删除R文件中重复两次的无序对

我在 R 中有一个这样的文件 0 1 0 2 0 3 0 4 0 5 0 6 0 7 0 8 0 9 0 10 1 0 1 11 1 12 1 13 1 14 1 15 1 16 1 17 1 18 1 19 3 0 正如我们所看到的其中
如何在 VBA 中将 GUID 分配给 DAO 参数

我有一段代码可以归结为 dim stmt as dao queryDef dim parId as dao parameter set stmt currentDB createQueryDef parameters id guid ins
编辑用作 Power BI 中的数据输入的 python 脚本

我有一个 python 脚本并用它在 Power BI 中创建一个数据框现在我想在 Power BI 中编辑该数据框但不要从头开始输入新数据因为我想将所有图表保留在我的 Power BI 模型中例如在我的旧数据框中我在脚本中指
如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？

例如如何执行以下等效的 SQL 插入到BINARY 16 field INSERT INTO Table1 MD5 VALUES X 6717f2823d3202449201145073ab871A X 6717f2823d3202449

如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？

如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？ 的相关文章

随机推荐

热门标签

如何使用 R DBI 的 dbWriteTable() 将二进制数据写入 SQLite？的相关文章