如何从文本文件中读取信息？

2024-03-16

我有数百个文本文件，每个文件中包含以下信息：

*****Auto-Corelation Results******
1     .09    -.19     .18     non-Significant

*****STATISTICS FOR MANN-KENDELL TEST******
S=  609
VAR(S)=      162409.70
Z=           1.51
Random : No trend at 95%

*****SENs STATISTICS ******
SEN SLOPE =  .24

现在，我想阅读所有这些文件，并“收集”森的统计从每个文件（例如.24）并与相应的文件名一起编译成一个文件。我必须用 R 来做。

我曾经使用过 CSV 文件，但不确定如何使用文本文件。

这是我现在使用的代码：

require(gtools)
GG <- grep("*.txt", list.files(), value = TRUE)
GG<-mixedsort(GG)
S <- sapply(seq(GG), function(i){
X <- readLines(GG[i])
grep("SEN SLOPE", X, value = TRUE)
})
spl <- unlist(strsplit(S, ".*[^.0-9]"))
SenStat <- as.numeric(spl[nzchar(spl)])
SenStat<-data.frame( SenStat,file = GG)
write.table(SenStat, "sen.csv",sep = ", ",row.names = FALSE)

当前代码无法正确读取所有值并给出以下错误：

Warning message:
NAs introduced by coercion

另外，我没有得到输出另一列的文件名。请帮忙！

诊断1

该代码也读取 = 符号。这是 print(spl) 的输出

 [1] ""       "5.55"   ""       "-.18"   ""       "3.08"   ""       "3.05"   ""       "1.19"   ""       "-.32"  
[13] ""       ".22"    ""       "-.22"   ""       ".65"    ""       "1.64"   ""       "2.68"   ""       ".10"   
[25] ""       ".42"    ""       "-.44"   ""       ".49"    ""       "1.44"   ""       "=-1.07" ""       ".38"   
[37] ""       ".14"    ""       "=-2.33" ""       "4.76"   ""       ".45"    ""       ".02"    ""       "-.11"  
[49] ""       "=-2.64" ""       "-.63"   ""       "=-3.44" ""       "2.77"   ""       "2.35"   ""       "6.29"  
[61] ""       "1.20"   ""       "=-1.80" ""       "-.63"   ""       "5.83"   ""       "6.33"   ""       "5.42"  
[73] ""       ".72"    ""       "-.57"   ""       "3.52"   ""       "=-2.44" ""       "3.92"   ""       "1.99"  
[85] ""       ".77"    ""       "3.01"

诊断2

发现了我认为的问题。负号有点棘手。在某些文件中是

SEN SLOPE =-1.07
SEN SLOPE = -.11

由于 = 之后的间隙，我得到第一个的 NA，但代码正在读取第二个。如何修改正则表达式来解决这个问题？谢谢！

Assume "text.txt"是您的文本文件之一。读入 RreadLines，您可以使用grep找到包含的行SEN SLOPE。没有进一步的争论，grep返回找到正则表达式的元素的索引号。这里我们发现是第11行。添加value = TRUE参数来获取该行所读取的内容。

x <- readLines("text.txt")
grep("SEN SLOPE", x)
## [1] 11
( gg <- grep("SEN SLOPE", x, value = TRUE) )
## [1] "SEN SLOPE =  .24"

为了找到所有的.txt我们可以使用工作目录中的文件list.files用正则表达式。

list.files(pattern = "*.txt")
## [1] "text.txt"

循环多个文件

我创建了第二个文本文件，text2.txt与不同的SEN SLOPE值来说明我如何在多个文件上应用此方法。我们可以用sapply，其次是strsplit，得到spl所需的值。

GG <- list.files(pattern = "*.txt")
S <- sapply(seq_along(GG), function(i){
    X <- readLines(GG[i])
    ifelse(length(X) > 0, grep("SEN SLOPE", X, value = TRUE), NA)
    ## added 04/23/14 to account for empty files (as per comment)
})
spl <- unlist(strsplit(S, split = ".*((=|(\\s=))|(=\\s|\\s=\\s))"))
## above regex changed to capture up to and including "=" and 
## surrounding space, if any - 04/23/14 (as per comment)
SenStat <- as.numeric(spl[nzchar(spl)])

然后我们可以将结果放入数据帧并将其发送到文件write.table

( SenStatDf <- data.frame(SenStat, file = GG) )
##   SenStat      file
## 1    0.46 text2.txt
## 2    0.24  text.txt

我们可以将其写入文件

write.table(SenStatDf, "myFile.csv", sep = ", ", row.names = FALSE)

2014 年 7 月 21 日更新：

由于结果被写入文件，因此可以使这变得更加简单（并且更快）

( SenStatDf <- cbind(
      SenSlope = c(lapply(GG, function(x){
          y <- readLines(x)
          z <- y[grepl("SEN SLOPE", y)]
          unlist(strsplit(z, split = ".*=\\s+"))[-1]
          }), recursive = TRUE),
      file = GG
 ) )
#      SenSlope file       
# [1,] ".46"   "test2.txt"
# [2,] ".24"   "test.txt"

然后写入并读入 R

write.table(SenStatDf, "myFile.txt", row.names = FALSE)
read.table("myFile.txt", header = TRUE)
#   SenSlope      file
# 1     1.24 test2.txt
# 2     0.24  test.txt

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

r

textfiles

textprocessing

logfileanalysis

如何从文本文件中读取信息？的相关文章

在shiny中过滤传单地图数据

我在用传单地图设置这个闪亮的东西时遇到了麻烦我的原帖 https stackoverflow com questions 50111566 applying leaflet map bounds to filter data within
R中的一元加/减是什么？

来自 R 的详细信息部分Syntax http stat ethz ch R manual R patched library base html Syntax html帮助页面定义了以下一元和二元运算符他们被列出在优先级组中从最高
R foreach问题（某些进程返回NULL）

我遇到了问题foreach我正在 R 中使用的程序的一部分该程序用于运行不同参数的模拟然后将结果返回到单个列表然后用于生成报告当并非所有分配的模拟运行都在报告上实际可见时就会出现问题从各方面来看似乎只有分配的运行的一个子集实际
如何删除箱线图上的刻度线

我试图从箱线图中删除 x 轴刻度线但保留与刻度线关联的标签这在基础 R 中可能吗 colors lt c lightskyblue3 gray78 gold1 wheat1 boxplot avgscore module data mi
将绘图调用拆分为多个块

我正在编写一个图的解释其中我基本上将在第一个块中创建图然后描述该输出并在第二个块中添加一个轴然而似乎每个块都会强制一个新的绘图环境因此当我们尝试使用以下命令运行块时会出现错误axis独自的观察 output html docu
为什么 dplyr filter() 不能在函数内工作（即使用变量作为列名）？

使用 dplyr 函数对数据进行过滤分组和变异的函数基本管道序列在函数之外工作得很好这就是我使用真实列名称的地方将其放入一个函数中其中列名称是一个变量并且某些函数可以工作但有些函数则不能尤其是 dplyr filter 例如
API 请求和curl::curl_fetch_memory(url, handle = handle) 中的错误：SSL 证书问题：证书已过期

几天前我运行了代码几个月没有任何问题 GET url myurl query 今天我遇到一个错误 Error in curl curl fetch memory url handle handle SSL certificate pro
R 中的列乘以子字符串

假设我有一个数据框其中包含多个组件及其在多个列中列出的属性并且我想对这些列运行多个函数我的方法是尝试将其基于每个列标题中的子字符串但我无法弄清楚如何做到这一点下面是数据框的示例 Basket F Type 1 F Qty 1 F
相当于 min() 的 rowMeans()

我在 R 邮件列表上多次看到这个问题但仍然找不到满意的答案假设我有一个矩阵m m lt matrix rnorm 10000000 ncol 10 我可以通过以下方式获得每行的平均值 system time rowMeans m use
如何获得所有大于x且有位置的数字？

V lt c 1 3 2 4 2 3 1 X lt 3 pos lt V V X pos is 3 3 我需要的是所有 3 个的位置 I need 2 and 6 哪些职位是3 in V Use which pos lt which V 3
计算 R 中各列的唯一值

我正在尝试创建一个新变量其中包含来自两个不同列的字符串值的唯一计数所以我有这样的东西例如 A tibble 4 x 2 names partners
所有 x 轴标签未以 45 度显示

I m having the code as like below But I m not getting all the x axis labels and it is not displaying in 45 degree when I
为什么 R 更新后 sim_slopes() 中会出现此错误？

我正在尝试使用交互包来创建简单斜率的约翰逊尼曼图但是当尝试运行 sim slopes 函数时出现以下错误直到我将R更新到4 2 2 我才没有遇到这个问题我使用的是 macOS Ventura 13 1 Error class
纵向比较 R 中的值...并进行扭转

我有许多人在多达四个时间段进行的测试结果这是一个示例 dat lt structure list Participant ID c A A A A B B B B C C C C phase structure c 1L 2L 3L 4L
read_html(url) 和 read_html(content(GET(url), "text")) 之间的区别

我正在看这个很棒的答案 https stackoverflow com a 58211397 3502164 https stackoverflow com a 58211397 3502164 解决方案的开头包括 library httr
R“错误：“}”中出现意外的“}”[重复]

这个问题在这里已经有答案了我有一个字符串变量对于缺少数据的情况它具有空值我想将空值重新编码为缺失而不是说空值我正在尝试编写一个循环来删除这些空值条目但我不断收到错误错误中出现意外的 for row in dat
python 相当于 R 中的 get() （= 使用字符串检索符号的值）

在 R 中 get s 函数检索名称存储在字符变量向量中的符号的值s e g X lt 10 r lt XVI s lt substr r 1 1 X get s 10 取罗马数字的第一个符号r并将其转换为其等效整数尽管花了一些时间翻
删除极坐标图边缘的多余空间和圆环

我有一个极坐标图ggplot2我已经非常接近完成相当简单的情节我已经能够在删除矩形边框方面获得帮助但我不需要删除最后一个范围轮廓与带有方位角标签的绘图周围的环之间的额外空间我希望该图的边界为 15 000 而不是 15 214 我编
闭包作为数据合并习惯的解决方案

我正在尝试解决闭包问题而且我think我发现了一个案例他们可能会有所帮助我有以下几部分需要处理一组正则表达式旨在清理状态名称位于函数中具有州名称上述函数创建的标准化形式和州 ID 代码的 data frame 用于链接两者
如何将plot中的单变量列表图表转换为ggplot2格式？

我正在搜索但仍然找不到一个非常简单的问题的答案我们如何使用 R 中的 ggplot2 生成一个变量的简单线图我正在分析时间序列数据并且想要对图表进行更复杂的操作我认为如果我使用 ggplot2 代替会更好plot It works

随机推荐

允许 VSTS 更新测试数据库

为了运行验收测试我需要在 SQL Azure 上运行的数据库上定义一个已知的良好状态我的测试在本地运行良好并设置了连接字符串来更新 Azure PaaS 上的 SQL 实例使用 VSTS 部署数据库后将运行测试为了让部署过程运行我
显示特定日期范围内的帖子

尝试显示特定日期范围的我的自定义帖子类型我只想显示某个月份内的帖子我知道我需要连接 posts where 过滤器但我不知道如何将参数传递给这个函数因为我需要传递日期范围我见过很多关于如何更改 WHERE 子句以获取日期范围的示例
iOS 8 Swift 读取 Plist

我想从 plist 文件中读取整数值我有以下代码 let path NSBundle mainBundle pathForResource savedState ofType plist let dict NSDictionary con
Modbus 错误：[无效消息] 收到的消息不完整，预计至少 2 个字节（收到 0 个字节）

Problem pymodbus 主站客户端可以向从站服务器发送请求从属服务器准备好返回的东西并等待主控客户端来接收它们尽管服务器从站已准备就绪但主站客户端仅返回错误 Modbus 错误输入输出 Modbus 错误
Symfony2：onKernelResponse 作为 MASTER_REQUEST 被调用两次

我正在使用事件监听器onKernelResponse I used if HttpKernelInterface MASTER REQUEST event gt getRequestType return 它有一个MASTER REQUES
Windows Phone 7 中的进度条？

任何人都可以提供有关如何在 Windows Phone 7 中使用进度栏的代码示例 Microsoft 的开发人员 Jeff Wilcox 发布了一个可能有用的进度条适用于 Windows Phone 的高性能 ProgressBar h
如何消除 html 页面中一行中元素之间的空格？

我显示的是3 img 像这样连续 div style width 100 img src UploadedImages 86 jpg alt style width 300px margin 0px padding 0px border 1
C#：从txt文件中读取数据

我有一个 EDF 文本文件该文件的内容如下 ConfigFile Sample Software v0 32 CP Version 0 32 123 Float 2 127 Number 0 039 Code 70 我想阅读这些项目并像
class A {...};模板 class A {...};' （如果有的话）？' aria-label='C++11 标准中哪里禁止 'template class A {...};模板 class A {...};' （如果有的话）？'> C++11 标准中哪里禁止 'template class A {...};模板 class A {...};' （如果有的话）？

我试图通过想象神秘的结构来更全面地掌握模板语法和语义我认为 C 11 标准不允许使用以下语法 template
集成测试时在AngularJS中使用$injector（不使用ngMock）

我需要使用 Karma Jasmine 在 AngularJS 中设置一些集成测试但遇到麻烦因为不使用 ngMock 时因为我想访问实际的 http 端点没有module or inject方法那么如何将服务注入到我的测试中呢我
Ubuntu + scala REPL，未在控制台上键入命令

我使用的是 Ubuntu 18 04 Scala 2 11 12 OpenJDK 64 位服务器虚拟机 Java 1 8 0 162 一旦我打开 scala shell 我就看不到我输入的任何内容但它会被输入下面是我打字时发生的情况pr
如何在两条直线android之间放置文本？

我需要在直线之间放置文本我尝试使用视图但文本视图位于该行下方怎么解决这个问题呢我的代码如下
Maven - 在当前项目和插件组中找不到前缀“tomcat7”的插件

我创建了一个 Maven 项目这是结构 parent core web 但是当我尝试使用命令进行部署时mvn tomcat7 deploy 我收到以下错误 No plugin found for prefix tomcat7 in the
链接维度的不同粒度级别的事实表

数据仓库设计新手我有一个代表地理位置例如郊区城市州的非规范化维度表这是一个缓慢变化的维度还有多个事实表每个事实表都有不同的粒度级别是否可以对此进行建模以便事实表使用代理键同时维护非规范化维度表如果您实际上拥有相同的维
类型错误：流未定义

无法向我的小型 React 应用程序添加数据库连接我尝试了一堆 npm 模块 sqlite sqlite3 realm 全部因类型错误而回退 TypeError stream is undefined 我什么也没做只是在我的组件中添加了
我如何找到启动我的进程的计划任务的实例ID/相关ID

如果我有一个运行我的 EXE 的 Windows 计划任务有没有办法从我的 EXE 内部找到触发我的计划任务实例简单的回答是不你能做的最好的事情是以编程方式访问任务调度程序库看看你所在的进程是否处于运行模式获取进程的 PID
检测两张图片之间的相似点然后将它们叠加（Python）

我有两张相同神经切口的照片深度略有不同每张切片使用不同的染料进行染色我想叠加这两个图像但它们在幻灯片照片上没有完美对齐因此无法简单地做到这一点我想要做的是编写代码来检测两个切片之间的相似形状即相同的单元格然后根据这些单元格
Django自定义装饰器重定向问题

我尝试在 Django 中编写一个自定义装饰器如果用户未通过该页面登录我想将用户重定向到自定义登录页面我已经编写了装饰器并调试了它虽然如果用户未登录它可以正常工作但在用户登录后它会给出错误 The view APPNAME v
Playwright locator.evaluateAll 如何返回使用节点 forEach 填充的地图

我想抢夺所有人的财产
如何从文本文件中读取信息？

我有数百个文本文件每个文件中包含以下信息 Auto Corelation Results 1 09 19 18 non Significant STATISTICS FOR MANN KENDELL TEST S 609 VAR S 16

如何从文本文件中读取信息？

诊断1

诊断2

如何从文本文件中读取信息？ 的相关文章

随机推荐

热门标签

如何从文本文件中读取信息？的相关文章