如何使用 R 搜索 PubMed 或其他数据库

2024-02-06

我最近一直在使用优秀的rplos package https://github.com/ropensci/rplos，这使得搜索公共科学图书馆 (PLOS) API 上托管的论文变得非常容易。我遇到了一个障碍，因为 API 本身似乎缺少一些信息 - 其中一个主要问题是至少有 2012 篇关于 API 的论文在“期刊”字段中没有任何信息。我有每篇论文的 DOI，因此很容易通过 Google 搜索 DOI 并显示这些是在真实期刊（通常是 PLoS ONE）上发表的真实论文。显然，重复 2000 次是很愚蠢的。

我想知道是否有人知道如何找到来源期刊，如果我有 DOI 列表？我调查了RISmed 包 http://cran.r-project.org/web/packages/RISmed/index.html，它显然可以从 R 中搜索 PubMed，但我无法弄清楚如何让它提供有用的信息（只是搜索命中的数量，以及一些可能导致我想要的信息的 PubMed ID）。

有人知道如何将 DOI 列表转换为来源期刊名称吗？

编辑：我只是想到了另一个简单的解决方案。 DOI 包含期刊名称的缩写，对于像这样只有少数期刊的情况，只需使用正则表达式来读取 DOI 并选择它们来自哪个期刊。示例：10.1371/期刊。pone.0046711 来自 PLoS ONE。

这是基于 Thomas 建议尝试 rpubmed 的答案。它从有问题的 DOI 列表开始，使用 RISmed 中的 EUtilsSummary 函数查找匹配的 PubMed ID 号，然后使用从rpubmed 的 Github https://github.com/rOpenHealth/rpubmed/blob/master/R/rpubmed_fetch.R并转载如下。抱歉编辑 rpubmed 代码，但第 44 行的对象似乎没有定义或必不可少，所以我把它们删除了。

library(RCurl); library(XML); library(RISmed); library(multicore)

# dummy list of 5 DOIs. I actually have 2012, hence all the multicoring below
dois <- c("10.1371/journal.pone.0046711", "10.1371/journal.pone.0046681", "10.1371/journal.pone.0046643", "10.1371/journal.pone.0041465", "10.1371/journal.pone.0044562")

# Get the PubMed IDs
res <- mclapply(1:length(dois), function(x) EUtilsSummary(dois[x]))
ids<-sapply(res,QueryId)


######## rpubmed functions from https://github.com/rOpenHealth/rpubmed/blob/master/R/rpubmed_fetch.R
fetch_in_chunks <- function(ids, chunk_size = 500, delay = 0, ...){
  Sys.sleep(delay * 3600) # Wait for appropriate time for the server.
  chunks <- chunker(ids, chunk_size)
  Reduce(append, lapply(chunks, function(x) pubmed_fetch(x, ...)))
}

pubmed_fetch <- function(ids, file_format = "xml", as_r_object = TRUE, ...){

  args <- c(id = paste(ids, collapse = ","), db = "pubmed", rettype = file_format, ...)

  url_args <- paste(paste(names(args), args, sep="="), collapse = "&")
  base_url <- "http://eutils.ncbi.nlm.nih.gov/entrez/eutils/efetch.fcgi?retmode=full"
  url_string <- paste(base_url, url_args, sep = "&")
  records <- getURL(url_string)
  #NCBI limits requests to three per second
  Sys.sleep(0.33)
  if(as_r_object){
    return(xmlToList(xmlTreeParse(records, useInternalNodes = TRUE)))
  } else return(records)
}

chunker <- function(v, chunk_size){
  split(v, ceiling(seq_along(v)/chunk_size))
}
###### End of rpubmed functions

d<-fetch_in_chunks(ids)
j<-character(0)
for(i in 1:2012) j[i]<-as.character(d[[i]][[1]][[5]][[1]][[3]]) # the tortuous path to the journal name

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 R 搜索 PubMed 或其他数据库的相关文章

在shiny中过滤传单地图数据

我在用传单地图设置这个闪亮的东西时遇到了麻烦我的原帖 https stackoverflow com questions 50111566 applying leaflet map bounds to filter data within
R中的一元加/减是什么？

来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面定义了以下一元和二元运算符他们被列出在优先级组中从最高
如何计算R中移动窗口内的平均斜率

我的数据集包含2个变量y 和 t 05s y 每 05 秒测量一次我正在尝试计算移动中的平均坡度20秒窗口即计算第一个 20 秒斜率值后窗口向前移动一个时间单位 05 秒并计算下一个 20 秒窗口在以下位置生成连续 20 秒斜率值
选择 R 中的数据表中隐藏时（在绿色加号下方）列的显示顺序

Context 使用 DataTables 库制作交互式表格时当屏幕宽度对于列的数量和宽度来说太窄时列将隐藏在绿色号下我有一个非常宽的表格有 20 多列其中一些内容非常冗长因此某些列在所有屏幕宽度下总是隐藏的每次隐藏新列时
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
在 R 中绘制 Likert 变量的堆积条形图

假设我有一个如下所示的数据框 P Q1 Q2 1 1 4 1 2 2 3 4 3 1 1 4 其中的列告诉我哪个人相应地回答了问题 q1 q2 中的哪一个这些问题需要按照 4 分李克特量表进行回答例如批准表示 1 稍微批准表示 2
在 R 中创建虚拟变量，排除某些情况为 NA

我的数据看起来像这样 V1 V2 A 0 B 1 C 2 D 3 E 4 F 5 G 9 我想创建一个虚拟变量R where 0 1 1 2 3 4 and NA 0 5 9 应该很简单有人可以帮忙吗我们可以转换V2 into a fa
以引用透明的方式从函数的省略号参数中提取符号

事情又发生了我正要按下发布答案按钮的问题被删除了我正在寻找一种方法来从函数的省略号参数中提取绑定到符号的对象的值以及符号也就是说我试图以引用透明的方式从省略号中提取符号我尝试过使用替代品和lazy dots 但没有成功 funct
将数据框中重叠的范围合并到唯一的组中

我有一个 n 行 3 的数据框 df lt data frame start c 178 400 983 1932 33653 end c 5025 5025 5535 6918 38197 group c 1 1 2 2 3 df sta
更改闪亮 R 中的默认浏览器

我在 RStudio 中使用 01 hello 虽然在 IE 中默认打开程序时它不会显示直方图但即使在 Chrome 中滑块也不起作用我无法滑动条形图并看到直方图中的变化如何更改 R 中的默认浏览器以便闪亮启动 Chrome 而不
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
旋转 Markdown 的表格 pdf 输出

我想将 pdf 上的表格输出旋转 90 度我正在使用 Markdown 生成报告并kable循环显示表格如果可以的话我想继续使用kable因为还有很多其他依赖于它的东西我没有包含在这个 MWE 中这是一个简单的例子使用iris数据集
如何从 R keras 中的类似生成器的数据中评估（）和预测（）

我有以下代码数据集可以下载here https www dropbox com s qjt5o31oyqj10m8 data tar gz dl 0 or here https www kaggle com c dogs vs cats
如何在 R 中匹配多个 ggplot2 图中的调色板？

自从被问到这个问题以来已经有一段时间了但我知道一个事实我很快就会提取新数据我想弄清楚如何用这种技术来绘制它看起来评论和答案中的人知道如何做到这一点但我无法完全弄清楚所给我的内容还有人想尝试一下吗我正在尝试使用具有多个级别的因子
ggplot2：如何标记事件发生的日期

我想从第二个情节中获取第一个情节的信息第二张图表示事件发生的天数它看起来更宽因为它没有图例但它是相同的时间尺度我选择在第一个图中手动分配颜色 I would like to overlay the second plot dots
纵向比较 R 中的值...并进行扭转

我有许多人在多达四个时间段进行的测试结果这是一个示例 dat lt structure list Participant ID c A A A A B B B B C C C C phase structure c 1L 2L 3L 4L
如何从 R 读取 PDF 元数据

我们很好奇有没有一种方法可以从 R 读取 PDF 元数据例如下面显示的信息通过搜索我对此无能为力 r pdf metadata在当前的问题库中非常欢迎任何指点我想不出纯 R 的方法来执行此操作但您可能可以安装您最喜欢的 PDF
read_html(url) 和 read_html(content(GET(url), "text")) 之间的区别

我正在看这个很棒的答案 https stackoverflow com a 58211397 3502164 https stackoverflow com a 58211397 3502164 解决方案的开头包括 library httr
删除极坐标图边缘的多余空间和圆环

我有一个极坐标图ggplot2我已经非常接近完成相当简单的情节我已经能够在删除矩形边框方面获得帮助但我不需要删除最后一个范围轮廓与带有方位角标签的绘图周围的环之间的额外空间我希望该图的边界为 15 000 而不是 15 214 我编
麦当劳 omega：R 中的警告

我正在计算几种不同尺度的欧米茄并在 R 中使用不同的 omega 函数获取不同比例的不同警告消息我的问题是如何解释这些警告以及报告检索到的 omega 统计数据是否安全当我使用从 alpha 到 omega 内部一致性估计普遍问题的

随机推荐

如何在 Xamarin Forms 中获取设备的 GPS 位置？

我想在输入框名为时获取我的设备的经度和纬度实体位置 is focused 我在用Xamarin Essential 地理定位为了获取我的设备的 GPS 位置我按照文档和教程进行操作但仍然无法获取 GPS 位置我已经在我的 Androi
如何在 Android webview 中打开 Microsoft Teams 会议

我正在尝试在 Web 视图中打开 Microsoft Teams 会议当我在 Web 视图中打开会议网址时它开始寻找 MS Teams 应用程序这是我不想要的我只想在 Web 视图中参加会议请帮助我在 Android 应用程序的
包括 ionic 2/Angular 2 的通用标题栏

我有一个 ionic 2 标题栏其中包含主页或注销按钮和公司标志这对于所有页面都是通用的我如何编写一个通用函数 Injectable 这样就可以很容易地包含在所有页面中而不是重复代码
Protractor + AngularJS + Jasmine 在xml文件上获取输出结果

我正在尝试将量角器结果导出到 xml 文件我在网上找到了这个很棒的链接 https github com angular protractor issues 60 https github com angular protractor i
QMessageBox 带有“不再显示”复选框

如何显示下面带有不再显示复选框的消息框我想象的东西看起来像这样 Qt 5 2 添加了添加QCheckBox to a QMessageBox 看一下QMessageBox setCheckbox http doc qt io qt 5
同时在 iPhone 和模拟器上进行多点连接测试

您好我正在论坛的所有主题中搜索有关如何测试使用多点连接框架的应用程序的信息有人可以告诉我如何同时使用 iPhone 设备和模拟器设备上的播放器一和模拟器上的播放器二来测试应用程序反之亦然我已经通过使用两个模拟器每个 mac 一
Stack (Haskell) 使用 GitHub Actions 构建源文件的缓存

当使用本地构建我的 Haskell 项目时stack build 仅重新编译更改的源文件不幸的是我无法让 Stack 在 GitHub Actions 上表现得像这样请问有什么建议吗 Example 我创建了一个简单的例子Lib hs
从根目录提供主页和静态内容

在 Golang 中如何在根目录之外提供静态内容同时仍然拥有用于提供主页的根目录处理程序使用以下简单的 Web 服务器作为示例 package main import fmt net http func main http Handl
AngularJS：观察尺寸的最佳方式？

因此我对此提出了一些解决方案但我仍然不太确定什么是最好的首先供参考我可以找到一个类似的问题尽管它有点旧了这是供稍后阅读本文的任何人使用的观察 Angular 中的尺寸变化 https stackoverflow com que
无法访问androidx.lifecycle.LifecycleOwner，Android中的错误是什么意思？

在什么情况下 android build android studio 显示这些错误无法访问 androidx lifecycle LifecycleOwner 和无法访问 androidx lifecycle ViewModelStor
iPhone：为什么我收到此错误 --- HTTP 错误 401--- Twitter

您好我正在 iPhone 上开发 Twitter 客户端这里我使用 MGTwitter 库和 OAuthentication 我正在进行身份验证登录并获取请求令牌我的问题是当我发送请求时我收到错误请求 8DC1F854 0F1
如何对四边形上的法线进行双线性插值？

我正在开发一个类似 Minecraft 的引擎作为一个业余爱好项目看看体素地形的概念在现代硬件和 OpenGL gt 3 上可以推广到什么程度因此我的所有几何体都由四边形准确地说是正方形组成我构建了一个光线投射器来估计环境光遮
如何将 CSS 类添加到 Zend_Form_Element_Select 选项

我正在尝试将 CSS 类添加到 Zend Form Element Select 选项但我找不到方法来做到这一点所需的输出将是这样的
“选择”总是按主键排序吗？

这是所有 DBA 面临的一个基本简单问题当我进行选择时是否始终保证我的结果将按主键排序或者我应该用 order by 指定它我使用 Oracle 作为我的数据库不如果您不使用 order by 则无法保证您能进行任何订购事实上
在 PHP 中向 $Date 添加天数

我有一个日期作为 MySQL 查询的一部分以表格形式返回2010 09 17 我想将变量 Date2 设置为 Date5 如下所示 Date2 Date 1 Date3 Date 2 等等以便它返回2010 09 18 2010 09 1
如何获取传递给调用该方法的方法的参数？

在Java中可以获取调用当前方法获取StackTrace的方法的类和方法我可以获得传递给调用此方法的方法的参数吗我需要这个来进行调试 Eg baseClass initialFunc input var modifiedInput
配置 grails 来创建数据库（如果数据库不存在）。

我在新的 grails 项目上有以下设置 dataSource pooled true driverClassName com mysql jdbc Driver dialect org hibernate dialect MySQL5In
如何从 Microsoft 获得适用于 Windows 10 的微型过滤器驱动程序的签名

我创建了自己的迷你过滤器驱动程序例如迷你间谍示例来自Windows 驱动程序示例 https github com Microsoft Windows driver samples tree master filesys miniFil
如何从 Jenkins docker 容器内部使用 docker

我面临以下问题我创建了一个 Jenkins docker 容器并将主机上的 docker 套接字与该容器链接起来像这样 docker run v var run docker sock var run docker sock p 80
如何使用 R 搜索 PubMed 或其他数据库

我最近一直在使用优秀的rplos package https github com ropensci rplos 这使得搜索公共科学图书馆 PLOS API 上托管的论文变得非常容易我遇到了一个障碍因为 API 本身似乎缺少一些信息其

如何使用 R 搜索 PubMed 或其他数据库

如何使用 R 搜索 PubMed 或其他数据库 的相关文章

随机推荐

热门标签

如何使用 R 搜索 PubMed 或其他数据库的相关文章