编辑巨大的sql数据文件

2024-01-04

我有一个 23GB 的文件,我想编辑第 23 行,但服务器上只有 200 MB 可用 RAM。我不想完全打开该文件,因为我只剩下 20GB 可用磁盘空间。

我怎样才能做到这一点。我尝试使用 head, tail sed 但它似乎创建了一个临时文件。是否可以在没有临时文件的情况下做到这一点?


解决方案是使用十六进制编辑器编辑该文件。十六进制编辑器旨在处理大文件,甚至整个磁盘和分区。

你可能会发现hexedit http://www.rogoyski.com/adam/programs/hexedit/(基于 ncurses)或ghex https://developer.gnome.org/ghex/(基于 Gnome/Gtk)有用。它们是常见的实用程序,因此您很可能会在发行版的存储库中找到它们。

我使用过的所有十六进制编辑器都使用双面板视图,左侧面板以十六进制显示文件的字节,右侧面板在可能的情况下尝试显示 Ascii 表示形式。

为了找到并编辑第 23 行:

sed -n '23p' my_huge_dump.sql:将打印这一行的内容
sed -n '23p' my_huge_dump.sql | od -A n -t x1:将以十六进制格式打印该行的内容。

或使用以下命令打开文件less -N my_huge_dump.sql并查看第23行的内容。(-N in less启用行编号)

现在,了解第23行的内容:

  • If the text of this line is somewhat unique and different from surrounding lines, you may find it from the right (ascii) panel and navigate to this line with the arrows. In hexedit you use the Tab key to move between the Hex and Ascii panels. In gHex you can use your mouse as well. You may also search for the string you're interested: Move to the Ascii panel and press / in hexedit or use the menu in gHex.
  • 如果你要编辑的行与其他行有相似的内容,而你在ascii面板中找不到它,那么你必须计算“换行符”分隔符才能找到第23行。新行(LF)表示为0A以十六进制表示。在 ASCII 面板中,新行表示为点.

然后假设您找到了要编辑的行,您有以下选项:

  • Hopefully, the new content of the 23rd line is shorter or equal in length to the existing content (so you won't need to grow and move the whole file). In this case, you have to enter the Fill-mode i.e. the mode in which you overwrite existing content typing over the old text. This is the default mode in both gHex and hexedit. Move to the location you want to edit and start typing. Pressing Backspace will undo your changes. If the new content is shorter than the existing, you may fill up the line with spaces to avoid truncating the file.
  • If the new content is longer than the existing one in this line, then you have to enter the Insert mode. You can do that using the Menu in gHex. In hexedit you have to use the EscI keybinding. Then start typing and the new characters will be appended in the current location.

在第一种情况下,可以保证文件的编辑和保存是即时的,因为将发生就地编辑。在后一种情况下,我不确定如何处理大小的增长和后续字节的移动,但我希望文件系统使用更大的非连续块来移动某些内容而不是移动整个文件。

如果您对更改感到满意,请保存文件:

  • 使用 gHex 中的菜单
  • Use Ctrlx in hexedit and answer (Y)es when questioned about whether to save the changes.

始终确保您有备份!

编辑:我发现gHex不适合您的情况,因为它尝试将整个文件加载到内存中。hexedit将为您服务。但是,如果您想要像这样的图形编辑器gHex,但具有部分文件加载功能,您可以尝试wxHex编辑器 http://www.wxhexeditor.org/home.php。还检查十六进制编辑器的比较 https://en.wikipedia.org/wiki/Comparison_of_hex_editors维基百科中的页面。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

编辑巨大的sql数据文件 的相关文章

随机推荐

  • 在哪里放置 Windows 窗体项目的中央错误处理程序

    在 ASP NET 中我可以使用Application Error在 global asax 中 以便处理任何未处理的错误 Windows 窗体中有等效的吗 是的 它的 AppDomain UnhandledException using
  • 将 Web 服务添加到已有的 Java 项目中

    我是 Java 新手 我有一个Java项目 它在我的 Windows 7 机器上完美运行 我想将该项目的一些功能用作 Web 服务 以便能够在我的 Silverlight 应用程序中使用它们 Silverlight 应用程序和这个 Java
  • Swift 从 NSDictionary 读取数据

    我正在使用这段代码来读取数据NSDictionary let itemsArray NSArray response objectForKey items as NSArray let nextPageToken String respon
  • 如何对多列进行逆透视 SQL Server

    在我的应用程序中 我使用了商店产品描述值 如下所示 ID BILLNO CUS NAME DATE TOT BAL S1 S2 S3 S4 D1 D2 D3 D4 Q1 Q2 Q3 Q4 U1 U2 U3 U4 T1 T2 T3 T4 TO
  • DFT 频率组件 Opencv

    我使用以下链接来了解如何在Opencv中使用DFT http docs opencv org doc tutorials core discrete fourier transform discrete fourier transform
  • Node Express 发送图像文件作为 API 响应

    我用谷歌搜索了这个但找不到答案 但这一定是一个常见问题 这是同样的问题节点请求 读取图像流 通过管道返回响应 https stackoverflow com questions 17004990 node request read imag
  • Python“if X == Y and Z”语法

    做这个 if key name and item 意思和这个一样 if key name and if key item 如果是这样 我完全困惑了深入 Python 中的示例 5 14 http diveintopython net obj
  • pandas 数据透视表 - 有序类别导致意外的边距

    使用 python 3 7 和 pandas 0 23 4 我正在尝试使用有序分类数据制作数据透视表 如果我包括边距 则小计的顺序似乎不正确 import pandas as pd m male f female data num 0 1
  • 如何在 Xcode 4 中使用 nib 创建自定义 UITableViewCell?

    在 Xcode 3 中 我可以选择在创建表视图单元格子类时创建笔尖 在 Xcode 4 中 它只生成 h m 文件 如何使用 xib 文件创建子类 编辑 参见下面的屏幕截图 EDIT 此外 是否有任何方法可以自动创建 UITableView
  • MySQL 嵌套 JSON 列搜索并提取子 JSON

    我有一个 MySQL 表authors有柱子id name and published books 在这之中 published books是一个 JSON 列 有了样本数据 id name published books 1 Tina 1
  • keydown 事件中的输入验证

    我正在尝试在以下过程中对用户文本输入进行信息验证keydown事件 我试图验证的原因是keydown事件是因为我不想显示那些被认为是非法的字符input开头的盒子 我写的验证是这样的 function validateUserInput v
  • 用于显式实例化一组固定类型的单行代码

    我有一组固定的四种类型A B C and D 以及大量使用这些类型的类和函数模板 为了减少编译时间 我想将这些模板的定义放入 cpp 文件中 并显式实例化这组固定类型的模板 然而 显式实例化引入了很多样板代码 我想减少这些代码 是否有一种优
  • 通过 Scala 中的解析器线程化额外状态

    我先给你讲讲 tl dr 我正在尝试使用状态单子变压器Scalaz 7 https github com scalaz scalaz通过解析器线程化额外的状态 如果不编写一个 我就很难做任何有用的事情lot of t m a gt t m
  • 从自定义 ListAdapter 创建并显示 AlertDialog

    我正在实现一个自定义 ListAdapter 它使用不同的列表项布局来显示某些项目 从该自定义 ListAdapter 中 我实际上想在单击特定按钮时显示 AlertDialog 我实现了 onCreateDialog int 方法 并尝试
  • Android:如何创建启动器

    我以前从未开发过 Android 所以当你回答时请认为我 100 愚蠢 我想创建一个应用程序启动器 它将打开默认的 Web 浏览器到给定的 URL 换句话说 我想用我的网站徽标制作一个图标 当您单击它时 它会在您的默认网络浏览器中打开该网站
  • Html Agility Pack/C#:如何创建/替换标签?

    任务很简单 但我找不到答案 使用 Node Remove 可以轻松删除标签 节点 但是如何替换它们呢 有一个 ReplaceChild 方法 但它需要创建一个新标签 如何设置标签的内容 InnerHtml 和 OuterHtml 是只读属性
  • EF Code First 中自引用外键的语法是什么?

    我正在尝试将外键从 SpouseId 引用到 Contact 表中的 Id 执行此操作的语法是什么 我似乎找不到例子 谢谢 我有一堂这样的课 public class Contact public int Id get set public
  • 在矩阵中查找从左上角到右下角的路径时遇到问题吗?

    我有一个20x30充满随机数的矩阵 0 1 2 我需要找到一条仅由 1 组成的路径 从左上角开始到右下角结束 我需要帮助找到 1 的路径 另外 如何打印我所踏过的每个数字的坐标 我可以显示我所踏过的数字 但在显示其坐标时遇到问题 这是我当前
  • 使用 tostring 聚合字符串并在 r 中对它们进行计数

    应用 dplyr 代码后我得到了以下数据框 Final df lt df gt group by clientID month gt summarise test toString Sector gt as data frame 这给了我以
  • 编辑巨大的sql数据文件

    我有一个 23GB 的文件 我想编辑第 23 行 但服务器上只有 200 MB 可用 RAM 我不想完全打开该文件 因为我只剩下 20GB 可用磁盘空间 我怎样才能做到这一点 我尝试使用 head tail sed 但它似乎创建了一个临时文