如何使用 bash 工具搜索非 ASCII 字符？

2024-02-09

我有一个大文本文件，其中包含一些导致 LaTeX 崩溃的 unicode 字符。如何在 Linux bash 中使用 sed 等查找文件中的非 ASCII 字符？

Try:

nonascii() { LANG=C grep --color=always '[^ -~]\+'; }

可以这样使用：

printf 'ŨTF8\n' | nonascii

Within [] ^意思是“不”。所以[^ -~]表示不在空格和~之间的字符。因此，排除控制字符，它匹配非 ASCII 字符，并且是一个更可移植但稍微不太准确的版本[^\x00-\x7f]以下。这\+ means 1 or more并使多字节字符在整个字符周围显示颜色，而不是散布在每个字节中，从而破坏多字节序列

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

bash

Unicode

grep

如何使用 bash 工具搜索非 ASCII 字符？的相关文章

比较两个文件的单列

我有两个文件每个文件都有两列并用空格分隔我想找到两个文件中第 2 列不相同的行并将它们输出到第三个文件 file A 1 AAAAAAAAAAAAAAAAAAAAAAAAAAAAAA 2 BBBBBBBBBBBBBBBBBBBBBB
bash 子 shell 中出现陷阱“kill 0”的分段错误

我正在尝试编写一个并行构建多个 Dockerfile 的小脚本但是如果我想取消该脚本我也想杀死子进程这样做的结果是segmentation fault 不知道为什么为了澄清我正在杀死脚本 C trap kill 0 SIGINT S
Bash - 将键绑定到字符串（不是函数）

如何获得键绑定以导致在命令行插入任意文本在 zsh 中我这样做 bindkey s m myspecialscript 在 bash 中有等效的吗没有一个内置函数可以实现我想要的功能 bind e E home yourscript
用于 UTF8 到 1252 的 Windows C API

我熟悉 WideCharToMultiByte 和 MultiByteToWideChar 转换可以使用它们来做类似的事情 UTF8 gt UTF16 gt 1252 我知道 iconv 会满足我的需要但是有人知道任何 MS 库可以在一
linux下无法创建僵尸进程

嗯我有一个奇怪的问题我无法在我的项目中创建僵尸进程但我可以在其他文件中创建僵尸进程有简单的说明 int main if fork 0 printf Some instructions n else sleep 10 wait 0 r
R 中用于调用 sed、rsync、ssh 等的 system() 的替代方案：函数是否存在，我应该编写自己的函数，还是我错过了重点？

最近我发现了base files命令与其他命令一起使用例如getwd write lines file show dir等等似乎有许多 bash 函数的 R 等价物我还在 R 中编写了一些函数来简化对ssh and rsync通过
如何在 Bash 中按自然顺序循环文件？

我使用以下命令循环目录中的所有文件 for i in fas do some code done 不过我按这个顺序得到它们 vvchr1 fas vvchr10 fas vvchr11 fas vvchr2 fas 代替 vvchr1 f
grep 通过彩色文本，例如海湾合作委员会 |颜色gcc | grep 正则表达式

在 grep 管道输出时如何使 grep 尊重 ANSI 颜色转义我很高兴使用其他东西 perl 而不是 grep 我的用户案例我想要 gcc foobar c colorgcc grep regexp ls color grep f
Python 3.4 十六进制转日语字符

我目前正在编写一个脚本从我的网站中提取包含日语字符的信息到目前为止我的脚本已从网站上提取数据它以字符串形式返回 xe5 xb9 xb4 xe3 x81 xab xe4 xb8 x80 xe5 xba xa6 xe3 x81 xae
在 Bash 中替换垂直线

我很难完成我的脚本因为这一部分没有按照我想要的方式运行我的脚本中有这一行 cat home tmp temp1 txt awk gsub RS gsub RS print gt home tmp temp txt 效果很好是的但是当
PHP-将字符串转换为unicode

我在做这个工作 source mb convert encoding test unicode utf 8 source unpack C source var dump source return array size 8 1 gt in
Bash - 在与当前终端分开的另一个终端中启动命令的新实例

我有一个简单的 bash 脚本 test sh 设置如下 bin bash args if args 0 check capture then watch n 1 ls lag home user capture0 watch n 1 ls
如何扩展路径中的波形符（~）[重复]

这个问题在这里已经有答案了我有一个 shell 脚本可以从用户那里获取目录路径但我需要检查目录是否为空如果用户将他的主路径与而不是绝对路径所以我无法检查它ls echo Specify your project root dir
如何在 *nix 中登录时运行脚本？

我知道我曾经知道如何做到这一点但是如何在 unix 中登录时运行脚本 bash 可以 From 维基百科 Bash http en wikipedia org wiki Bash 28Unix shell 29 当 Bash 启动时它
如何使用 mediawiki 的 api、curl 和 bash 登录？

我对流程的理解来自 mediawikis 登录手册https www mediawiki org wiki API 登录 https www mediawiki org wiki API Login 使用 MediaWiki 的 Web
MySQL 与日语字符

我试图弄清楚如何创建一个表以便我可以在其中插入日语名字现在我有 Type InnoDB Encoding UTF 8 Unicode utf8 Collation utf8 general ci 但是当我插入字符时它显示为当我使用
正则表达式匹配bash变量

我正在尝试修改 bash 脚本当前脚本包含 print div class 1 div Where 1可能看起来像 Apprentice Historian Level 1 Historian Level 4 Master Histori
Bash 中单行 while 循环的语法

我无法找到分号和或大括号的正确组合我想这样做但作为命令行中的一句 while 1 do foo sleep 2 done while true do foo sleep 2 done 顺便说一句如果您在命令提示符下将其输入为多行如
从 bash 变量中删除空格

假设一个变量包含空格换行符和制表符后跟一些文本为什么会这样 var var space strip var of everything but whitespace then remove what s left i e the wh
何时用引号将 shell 变量括起来？

我应该或不应该在 shell 脚本中用引号括住变量吗例如下列说法正确的是 xdg open URL eq 2 or xdg open URL eq 2 如果是这样为什么一般规则如果它可以为空或包含空格或实际上任何空格或特殊字符

随机推荐

蓝牙 HC-05 发送错误 1F 仅适用于 INQ 命令

我的新蓝牙 HC 05 模块有问题在 AT 模式下它可以与我需要的所有命令完美配合除了 INQ 我已经尝试事先发送一大堆其他命令 AT INIT OK AT ORGL OK AT ROLE 1 OK AT CLASS 0 OK 他们都
每个版本的 iOS 都附带什么版本的 mobile safari？

我正在尝试找出可以使用哪些 Javascript API 来实现对 Mobile Safari 到 iOS2 的支持我还没有在任何地方找到一个列表来显示每个新版本的 iOS 附带的 Mobile Safari 版本我正在寻找一个可以追溯
Laravel，转储自动加载，无需 Shell 访问

我有两个同名的控制器 app controllers CareersController php 供公众使用 app controllers Admin CareersController php 对于管理员由于命名冲突我添加了name
将 String 转换为 Int 并添加特定值

我有一根绳子ABC0001 我想添加 1对于数据库中的每个新条目如果我采取SubString 3 myStr Length 3 它只给了我1 修剪所有 0 零有没有其他方法可以为每个新条目添加 1 Thanks 让我们尝试下面的代码我
python正则表达式获取所有文本直到(，并获取括号内的文本

我需要两个正则表达式操作的帮助获取左括号之前的所有文本 e g this is so cool 234 gt this is so cool 获取括号内的文本即数字 234 直到父级 regex re compile s 在第一组括号内
从 Google App Engine for PHP 加载远程 XML

我想将第三方服务器的远程动态 XML 文件加载到我的 GAE PHP 应用程序中 itemId 5 uri http www myserver com getInfoItem php itemId itemId format xml 我尝试
如何让atom更像WebStorm IDE？

所以我喜欢 WebStorm 的一点是它可以在输入后执行惊人的自动完成功能我喜欢所有的代码完成和 linting Webstorm 资源消耗很大而且相当丑陋对于atom 我不知道如何做到这一点我可以安装或自定义哪些插件才能使其满足
获取最新的不同记录

考虑下表 User CreatedDateTime Quantity Jim 2012 09 19 01 00 1 Jim 2012 09 19 02 00 5 Jim 2012 09 19 03 00 2 Bob 2012 09 19 0
如何对谷歌云 git repo 进行代码审查

我们在谷歌云平台上托管 git repo 我知道对于 github com 我们可以使用拉取请求进行代码审查但谷歌云似乎没有提供这一点如何对 Google 云平台上的存储库进行代码审查一种可能性我知道并不理想但仍然有效是将您的云
适用于 Facebook 可玩广告的 SDK

我想为 Facebook 平台制作 HTML 可播放广告并在其中显示用户头像是否可以根据文档 https developers facebook com docs app ads formats playable ad 可播放广告不得发
如何在 Node Express 中像静态 HTML 页面一样提供渲染的 Jade 页面？

通常你会在这样的路径中渲染 Jade 页面 app get page function req res next res render page jade 但我想提供所有 Jade 页面自动呈现就像提供静态 HTML 一样 app us
iOS 线性规划库

我正在寻找一个 iOS 库可以为我正在开发的应用程序解决 LP IP BIP MIP 问题我找到了 GLPK 但不知道如何为 iOS 编译它在网上搜索了一段时间后我没有找到任何有趣的东西如果有人可以帮助我如何编译适用于 iOS 的
使用控制台应用程序 .NET Core 在并行 C# 中运行两个 dotnet 进程

我有一个包含三个控制台的项目一个控制台将并行打开其他两个进程来执行某些工作独立所有控制台都使用 dotnet core 框架 MultipleConsoleWindows主要应用程序如下所示 static void Main stri
添加组条形图作为绘图中的子图

我想创建分组 barmode 组 plotly 中的条形图子图现在的问题是 plotly 不会创建条形图作为痕迹相反分组条形图被创建为条形轨迹列表因此我不知道如何创建一个包含分组条形图作为子图的图形即使用添加分组条形图图 app
NHibernate HiLo - 所有实体的一张表

我使用 NHibernate HiLo 作为我的身份生成器目前我的数据库中的每个实体表都有一个单独的表例如我有 Customer 和 CustomerKey 表每个表都有一个 NextHiLo 列如果有一张表能够保存所有其他表的
重叠项目上的单击事件

I have 带有点击事件的表格行具有单击事件的按钮该按钮位于表格行上我有问题当我点击按钮时行单击事件也会执行但我不希望出现这种行为我只想单击按钮执行而不单击行使用 jQuery 由于问题标签 yourButton cli
带有 mysql 变量的 Mysql 查询在 Zend Framework 1 中不起作用

Zend 配置是 resources db adapter pdo mysql 得到的查询消息 SQLSTATE HY000 一般错误 db Zend Db Table getDefaultAdapter db gt setFetchMod
为什么 while 循环会阻塞事件循环？

Node js 书中给出了以下示例 var open false setTimeout function open true 1000 while open console log wait console log open sesame
为什么我的 Cygwin 中的 Emacs 在 Windows 7 上运行时总是创建故障转储？

我对 GNU 工具在 Windows 7 上的 Cygwin 中运行的方式非常满意我认为使用 GNU Linux 更容易但我公司的政策是使用 Windows 7 作为程序员编程环境所以解决方案是 Cygwin 我出于编程目的大量使用
如何使用 bash 工具搜索非 ASCII 字符？

我有一个大文本文件其中包含一些导致 LaTeX 崩溃的 unicode 字符如何在 Linux bash 中使用 sed 等查找文件中的非 ASCII 字符 Try nonascii LANG C grep color always 可

如何使用 bash 工具搜索非 ASCII 字符？

如何使用 bash 工具搜索非 ASCII 字符？ 的相关文章

随机推荐

热门标签

如何使用 bash 工具搜索非 ASCII 字符？的相关文章