如何使用 bash 工具搜索非 ASCII 字符?

2024-02-09

我有一个大文本文件,其中包含一些导致 LaTeX 崩溃的 unicode 字符。如何在 Linux bash 中使用 sed 等查找文件中的非 ASCII 字符?


Try:

nonascii() { LANG=C grep --color=always '[^ -~]\+'; }

可以这样使用:

printf 'ŨTF8\n' | nonascii

Within [] ^意思是“不”。所以[^ -~]表示不在空格和~之间的字符。因此,排除控制字符,它匹配非 ASCII 字符,并且是一个更可移植但稍微不太准确的版本[^\x00-\x7f]以下。这\+ means 1 or more并使多字节字符在整个字符周围显示颜色,而不是散布在每个字节中,从而破坏多字节序列

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

如何使用 bash 工具搜索非 ASCII 字符? 的相关文章

  • 比较两个文件的单列

    我有两个文件 每个文件都有两列 并用空格分隔 我想找到两个文件中第 2 列不相同的行 并将它们输出到第三个文件 file A 1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 2 BBBBBBBBBBBBBBBBBBBBBB
  • bash 子 shell 中出现陷阱“kill 0”的分段错误

    我正在尝试编写一个并行构建多个 Dockerfile 的小脚本 但是如果我想取消该脚本 我也想杀死子进程 这样做的结果是segmentation fault 不知道为什么 为了澄清我正在杀死脚本 C trap kill 0 SIGINT S
  • Bash - 将键绑定到字符串(不是函数)

    如何获得键绑定以导致在命令行插入任意文本 在 zsh 中我这样做 bindkey s m myspecialscript 在 bash 中 有等效的吗 没有一个内置函数可以实现我想要的功能 bind e E home yourscript
  • 用于 UTF8 到 1252 的 Windows C API

    我熟悉 WideCharToMultiByte 和 MultiByteToWideChar 转换 可以使用它们来做类似的事情 UTF8 gt UTF16 gt 1252 我知道 iconv 会满足我的需要 但是有人知道任何 MS 库可以在一
  • linux下无法创建僵尸进程

    嗯 我有一个奇怪的问题 我无法在我的项目中创建僵尸进程 但我可以在其他文件中创建僵尸进程 有简单的说明 int main if fork 0 printf Some instructions n else sleep 10 wait 0 r
  • R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案:函数是否存在,我应该编写自己的函数,还是我错过了重点?

    最近 我发现了base files命令 与其他命令一起使用 例如getwd write lines file show dir等等 似乎有许多 bash 函数的 R 等价物 我还在 R 中编写了一些函数来简化对ssh and rsync通过
  • 如何在 Bash 中按自然顺序循环文件?

    我使用以下命令循环目录中的所有文件 for i in fas do some code done 不过 我按这个顺序得到它们 vvchr1 fas vvchr10 fas vvchr11 fas vvchr2 fas 代替 vvchr1 f
  • grep 通过彩色文本,例如海湾合作委员会 |颜色gcc | grep 正则表达式

    在 grep 管道输出时 如何使 grep 尊重 ANSI 颜色转义 我很高兴使用其他东西 perl 而不是 grep 我的用户案例 我想要 gcc foobar c colorgcc grep regexp ls color grep f
  • Python 3.4 十六进制转日语字符

    我目前正在编写一个脚本 从我的网站中提取包含日语字符的信息 到目前为止 我的脚本已从网站上提取数据 它以字符串形式返回 xe5 xb9 xb4 xe3 x81 xab xe4 xb8 x80 xe5 xba xa6 xe3 x81 xae
  • 在 Bash 中替换垂直线

    我很难完成我的脚本 因为这一部分没有按照我想要的方式运行 我的脚本中有这一行 cat home tmp temp1 txt awk gsub RS gsub RS print gt home tmp temp txt 效果很好 是的 但是当
  • PHP-将字符串转换为unicode

    我在做这个工作 source mb convert encoding test unicode utf 8 source unpack C source var dump source return array size 8 1 gt in
  • Bash - 在与当前终端分开的另一个终端中启动命令的新实例

    我有一个简单的 bash 脚本 test sh 设置如下 bin bash args if args 0 check capture then watch n 1 ls lag home user capture0 watch n 1 ls
  • 如何扩展路径中的波形符(~)[重复]

    这个问题在这里已经有答案了 我有一个 shell 脚本 可以从用户那里获取目录路径 但我需要检查目录是否为空 如果用户将他的主路径与 而不是绝对路径 所以我无法检查它ls echo Specify your project root dir
  • 如何在 *nix 中登录时运行脚本?

    我知道我曾经知道如何做到这一点 但是 如何在 unix 中登录时运行脚本 bash 可以 From 维基百科 Bash http en wikipedia org wiki Bash 28Unix shell 29 当 Bash 启动时 它
  • 如何使用 mediawiki 的 api、curl 和 bash 登录?

    我对流程的理解 来自 mediawikis 登录手册https www mediawiki org wiki API 登录 https www mediawiki org wiki API Login 使用 MediaWiki 的 Web
  • MySQL 与日语字符

    我试图弄清楚如何创建一个表 以便我可以在其中插入日语名字 现在我有 Type InnoDB Encoding UTF 8 Unicode utf8 Collation utf8 general ci 但是 当我插入字符时 它显示为 当我使用
  • 正则表达式匹配bash变量

    我正在尝试修改 bash 脚本 当前脚本包含 print div class 1 div Where 1可能看起来像 Apprentice Historian Level 1 Historian Level 4 Master Histori
  • Bash 中单行 while 循环的语法

    我无法找到分号和 或大括号的正确组合 我想这样做 但作为命令行中的一句 while 1 do foo sleep 2 done while true do foo sleep 2 done 顺便说一句 如果您在命令提示符下将其输入为多行 如
  • 从 bash 变量中删除空格

    假设一个变量包含空格 换行符和制表符 后跟一些文本 为什么会这样 var var space strip var of everything but whitespace then remove what s left i e the wh
  • 何时用引号将 shell 变量括起来?

    我应该或不应该在 shell 脚本中用引号括住变量吗 例如 下列说法正确的是 xdg open URL eq 2 or xdg open URL eq 2 如果是这样 为什么 一般规则 如果它可以为空或包含空格 或实际上任何空格 或特殊字符

随机推荐

  • 蓝牙 HC-05 发送错误 1F 仅适用于 INQ 命令

    我的新蓝牙 HC 05 模块有问题 在 AT 模式下 它可以与我需要的所有命令完美配合 除了 INQ 我已经尝试事先发送一大堆其他命令 AT INIT OK AT ORGL OK AT ROLE 1 OK AT CLASS 0 OK 他们都
  • 每个版本的 iOS 都附带什么版本的 mobile safari?

    我正在尝试找出可以使用哪些 Javascript API 来实现对 Mobile Safari 到 iOS2 的支持 我还没有在任何地方找到一个列表来显示每个新版本的 iOS 附带的 Mobile Safari 版本 我正在寻找一个可以追溯
  • Laravel,转储自动加载,无需 Shell 访问

    我有两个同名的控制器 app controllers CareersController php 供公众使用 app controllers Admin CareersController php 对于管理员 由于命名冲突 我添加了name
  • 将 String 转换为 Int 并添加特定值

    我有一根绳子ABC0001 我想添加 1对于数据库中的每个新条目 如果我采取SubString 3 myStr Length 3 它只给了我1 修剪所有 0 零 有没有其他方法可以为每个新条目添加 1 Thanks 让我们尝试下面的代码 我
  • python正则表达式获取所有文本直到(,并获取括号内的文本

    我需要两个正则表达式操作的帮助 获取左括号之前的所有文本 e g this is so cool 234 gt this is so cool 获取括号内的文本 即数字 234 直到父级 regex re compile s 在第一组括号内
  • 从 Google App Engine for PHP 加载远程 XML

    我想将第三方服务器的远程动态 XML 文件加载到我的 GAE PHP 应用程序中 itemId 5 uri http www myserver com getInfoItem php itemId itemId format xml 我尝试
  • 如何让atom更像WebStorm IDE?

    所以我喜欢 WebStorm 的一点是它可以在输入 后执行惊人的自动完成功能 我喜欢所有的代码完成和 linting Webstorm 资源消耗很大 而且相当丑陋 对于atom 我不知道如何做到这一点 我可以安装或自定义哪些插件才能使其满足
  • 获取最新的不同记录

    考虑下表 User CreatedDateTime Quantity Jim 2012 09 19 01 00 1 Jim 2012 09 19 02 00 5 Jim 2012 09 19 03 00 2 Bob 2012 09 19 0
  • 如何对谷歌云 git repo 进行代码审查

    我们在谷歌云平台上托管 git repo 我知道对于 github com 我们可以使用拉取请求进行代码审查 但谷歌云似乎没有提供这一点 如何对 Google 云平台上的存储库进行代码审查 一种可能性 我知道并不理想 但仍然有效 是将您的云
  • 适用于 Facebook 可玩广告的 SDK

    我想为 Facebook 平台制作 HTML 可播放广告并在其中显示用户头像 是否可以 根据文档 https developers facebook com docs app ads formats playable ad 可播放广告不得发
  • 如何在 Node Express 中像静态 HTML 页面一样提供渲染的 Jade 页面?

    通常你会在这样的路径中渲染 Jade 页面 app get page function req res next res render page jade 但我想提供所有 Jade 页面 自动呈现 就像提供静态 HTML 一样 app us
  • iOS 线性规划库

    我正在寻找一个 iOS 库 可以为我正在开发的应用程序解决 LP IP BIP MIP 问题 我找到了 GLPK 但不知道如何为 iOS 编译它 在网上搜索了一段时间后 我没有找到任何有趣的东西 如果有人可以帮助我如何编译适用于 iOS 的
  • 使用控制台应用程序 .NET Core 在并行 C# 中运行两个 dotnet 进程

    我有一个包含三个控制台的项目 一个控制台将并行打开其他两个进程来执行某些工作 独立 所有控制台都使用 dotnet core 框架 MultipleConsoleWindows主要应用程序如下所示 static void Main stri
  • 添加组条形图作为绘图中的子图

    我想创建分组 barmode 组 plotly 中的条形图子图 现在的问题是 plotly 不会创建条形图作为痕迹 相反 分组条形图被创建为条形轨迹列表 因此 我不知道如何创建一个包含分组条形图作为子图的图形 即使用添加分组条形图图 app
  • NHibernate HiLo - 所有实体的一张表

    我使用 NHibernate HiLo 作为我的身份生成器 目前 我的数据库中的每个实体表都有一个单独的表 例如 我有 Customer 和 CustomerKey 表 每个表都有一个 NextHiLo 列 如果有一张表能够保存所有其他表的
  • 重叠项目上的单击事件

    I have 带有点击事件的表格行 具有单击事件的按钮 该按钮位于表格行上 我有问题 当我点击按钮时 行单击事件也会执行 但我不希望出现这种行为 我只想单击按钮执行 而不单击行 使用 jQuery 由于问题标签 yourButton cli
  • 带有 mysql 变量的 Mysql 查询在 Zend Framework 1 中不起作用

    Zend 配置是 resources db adapter pdo mysql 得到的查询消息 SQLSTATE HY000 一般错误 db Zend Db Table getDefaultAdapter db gt setFetchMod
  • 为什么 while 循环会阻塞事件循环?

    Node js 书中给出了以下示例 var open false setTimeout function open true 1000 while open console log wait console log open sesame
  • 为什么我的 Cygwin 中的 Emacs 在 Windows 7 上运行时总是创建故障转储?

    我对 GNU 工具在 Windows 7 上的 Cygwin 中运行的方式非常满意 我认为使用 GNU Linux 更容易 但我公司的政策是使用 Windows 7 作为程序员编程环境 所以 解决方案是 Cygwin 我出于编程目的大量使用
  • 如何使用 bash 工具搜索非 ASCII 字符?

    我有一个大文本文件 其中包含一些导致 LaTeX 崩溃的 unicode 字符 如何在 Linux bash 中使用 sed 等查找文件中的非 ASCII 字符 Try nonascii LANG C grep color always 可