首页 | 邮件资讯 | 技术教程 | 解决方案 | 产品评测 | 邮件人才 | 邮件博客 | 邮件系统论坛 | 软件下载 | 邮件周刊 | 热点专题 | 工具
网络技术 | 操作系统 | 邮件系统 | 客户端 | 电子邮箱 | 反垃圾邮件 | 邮件安全 | 邮件营销 | 移动电邮 | 邮件软件下载 | 电子书下载

操作系统

Windows 9X | Linux&Uinx | Windows Server | 其它操作系统 | Vista | FreeBSD | Windows 7 |
首页 > 操作系统 > Linux&Uinx > 在Linux下正则表达式和grep命令的使用 > 正文

在Linux下正则表达式和grep命令的使用

出处:赛迪网 作者:赛迪网 时间:2007-6-14 0:48:45
 正规表示法( Regular Exdivssion,RE )

  1 什么是正规表示法:

  什么是正规表示式 ( Regular Exdivssion, 底下简称 RE ) 呢?简单的说,在 Linux 的环境下,我们可以透过『字符串以及一些特殊字符的辅助』来进行文字的比对工作,好来让使用者筛选自己所需要数据。

  这些特殊的字符与搭配使用的工具,就构成了正规表示法的主轴!

  例如 /etc/rc.d/init.d 这个目录当中好了,如果你要找到一个文件内容含有 mail 这个字符串的文件名,要怎么搜寻呢?利用 grep 配合 mail 以及万用字符来搜寻所有的文件名『grep 'mail' /etc/rc.d/init.d/*』

  2 正规表示法对于系统管理员的用途:

  对于系统管理员来说,正规表示法则是一个『不可不学的好东西!』由于系统如果在繁忙的情况之下,每天产生的讯息信息会多到你无法想象的地步,而我们也都知道,系统的『错误讯息登录文件』 的内容记载了系统产生的所有讯息,当然,这包含你的系统是否被『入侵』的纪录数据。但是系统的数据量太大了,要系统管理员的 你每天去看这么多的讯息数据,想不疯掉都很难,这个时候,我们就可以透过『正规表示法』的功能,将这些登录的信息进行处理,仅取出『错误』的信息来进行分析。

  3 正规表示法的广泛用途:

  除了系统管理员之外,一大堆的软件与设定都是支持正规表示法的,最常见的例子就是『邮件服务器』!您是否有常常收到电子邮件里最让人诟病 的『广告信件』呢?那如果我在 Server 端就将广告信件给剔除的话,客户端就会减少很多不必要的频宽损耗了对吧!那么如何剔除广告信件呢?由于广告信件几乎都有一定的标题或者是内容,因此,只要 每次有来信时,都先将来信的标题与内容进行特殊字符串的比对,使用正规表示法发现有不良信件就予以剔除!目前两大服务器软件sendmail 与 postfix 都支持正规表示法的比对功能!很多的服务器软件、以及套件都支持正规表示法。

  4 grep

  语法:[root @test /root ]# grep [-acinv] '搜寻字符串' filenames-list

  参数说明:

  -a :将 binary 文件以 text 文件的方式搜寻数据

  -c :计算找到 '搜寻字符串' 的次数

  -i :忽略大小写的不同,所以大小写视为相同

  -n :顺便输出行号

  -v :反向选择,亦即显示出没有 '搜寻字符串' 内容的那一行!

  范例:

  [root @test /root]# grep 'root' /var/log/secure

  搜索 /var/log/secure 这个文件中包含 root 的行

  [root @test /root]# grep -v 'root' /var/log/secure

  搜索没有 root 的行

  [root @test /root]# grep [A-Z]ANPATH /etc/man.config

  说明:grep 是一个很常见的指令,最重要的功能就是进行字符串数据的比对了,需要说明的是『grep 在一个文件中查寻一个字符串时,他是以"整行"为单位来数据的撷取的!』

  grep 是最简单的正规表示法搜寻指令之一,他并不支持一些更严谨的正规表示法内容,不过,已经相当的好用。

  例题一:找出这个文件里面含有 know 这个字符,并将行号列出来:注意,大小写是不一样的

  [root @test /root ]# grep -n 'know' regexp.txt

  例题二:找出这个文件里面含有 * 这个字符,并将行号列出来:

  [root @test /root ]# grep -n '\*' regexp.txt

  例题三:我要将所有 know 不论大小写都列出来,并列出行号:

  [root @test /root]# grep -ni 'know' regexp.txt

  注意:类似的指令还有egrep、awk、gawk、sed等,将在后面详细说明

  5 正规表示法的特殊字符(charaters)与 egrep 指令

  特殊字符 表示意义

  ^word 待搜寻的字符在行首

  word$ 待搜寻的字符在行尾

  . 匹配任何一个可能的字符

  \ 跳脱符号将特殊字符变成普通字符

  ? 任何一个『单一』字符

  * 匹配模式中重复的字符

  [list] 列表中的字符

  [range] 列表中范围内的字符

  [^list] 反向选择,与 [list] 相反

  [^range] 反向选择,与 [range]相反

  \{n\} 与前一个相同字浮连续 n 个

  \{n,m\} 与前一个相同字浮连续 n-m 个

  请特别留意的是,『正规表示法的特殊字符』与一般在指令列输入指令的『万用字符』并不相同,例如,在万用字符当中, * 代表的是 0 ~ 无限多个字符的意思,但是在正规表示法当中, * 则是重复前一个字符的意思~使用的意义并不相同,不要搞混了!

  例题:在 /etc 底下,只要含有 XYZ 三个字符的任何一个字符的那一行就列出来

  grep [XYZ] /etc/*

  例题:我想要知道在 /etc 里面,只要句首是 w-z 的就将他印出来?

  grep ^[w-z] /etc/*

  6 diff比较两个文件内容是否有不一致的指令!

  语法:[root @test /root ]# diff file1 file2

  范例:[root @test /root]# diff index.htm index.html

  例子:ls –l   grep ‘^d’ 查询子目录

  注意:使用规则表达式要养成良好的习惯,就是在匹配模式的两端加上‘’。这样和shell的文件通配符号做区别

  7 充分规则表达式专用字符

  符号 执行

  pattern1   pattern2 逻辑或

  (patten) 对模式进行分组

  char+ 搜索前面字符的一个或者多个重复实例

  char? 搜索前面字符的一个或者0个实例

  例题:t+ 匹配一个或一个以上连续的t,如t tt ttt

  t? 匹配0个或1个t 如 t 或 ‘ ’

  “create   stream “ 和两种模式的任一种进行匹配

  重点回顾

  • shell文件匹配字符和规则表达式的区别

  shell文件匹配字符是用于匹配文件名

  正规表示法RE的用途主要是用来做为『搜寻』字符串之用,匹配的文件里面的内容和用来过滤特殊讯息等用途;

  • 由于严谨度的不同,正规表示法之上还有更严谨的延伸正规表示法;

  • 正规表示法的处理方式,经常是以『整行』或称为『整段』来进行处理的;

  • grep 与 egrep 在正规表示法里面是很常见的两支程序,其中, egrep 可以用不同的模式去匹配,以及支持更严谨的正规表示法的语法。
相关文章 热门文章
  • Linux启动 Sendmail速度慢的解决办法
  • Linux系统下防垃圾邮件基本功能
  • Linux启动sendmail速度慢的解决办法
  • Domino V8 在 UNIX/Linux 平台上的安装及其常见问题
  • IBM Lotus Domino,Linux,虚拟化,可伸缩性:不再是相互排斥的术语
  • 19.11 参 考 资 料
  • 19.10 课 后 练 习
  • 19.9 重 点 回 顾
  • 19.8.3 quota与目录转移
  • 19.8.2 关于备份
  • 19.8.1 问题检查
  • 19.7.8 其他设置技巧
  • linux的基本操作(上)
  • Linux系统下应用知识大荟萃
  • GNU GRUB启动管理器
  • 制作基于软盘的Linux系统
  • 网络配置文件快速解读
  • linux的基本操作(下)
  • 剖析Linux系统启动过程
  • DameWare让局域网管理不再繁琐
  • 在Redhat 9下实现双机热备和集群功能
  • LINUX守护进程介绍
  • Redhat advance server 2.1集群的安装与管理
  • Linux必须学会的60个命令-文件处理
  • 自由广告区
     
    最新软件下载
  • SharePoint Server 2010 部署文档
  • Exchange 2010 RTM升级至SP1 教程
  • Exchange 2010 OWA下RBAC实现的组功能...
  • Lync Server 2010 Standard Edition 标..
  • Lync Server 2010 Enterprise Edition...
  • Forefront Endpoint Protection 2010 ...
  • Lync Server 2010 Edge 服务器部署文档
  • 《Exchange 2003专家指南》
  • Mastering Hyper-V Deployment
  • Windows Server 2008 R2 Hyper-V
  • Microsoft Lync Server 2010 Unleashed
  • Windows Server 2008 R2 Unleashed
  • 今日邮件技术文章
  • 腾讯,在创新中演绎互联网“进化论”
  • 华科人 张小龙 (中国第二代程序员 QQ...
  • 微软推出新功能 提高Hotmail密码安全性
  • 快压技巧分享:秒传邮件超大附件
  • 不容忽视的邮件营销数据分析过程中的算..
  • 国内手机邮箱的现状与未来发展——访尚..
  • 易观数据:2011Q2中国手机邮箱市场收入..
  • 穿越时空的爱恋 QQ邮箱音视频及贺卡邮件
  • Hotmail新功能:“我的朋友可能被黑了”
  • 入侵邻居网络发骚扰邮件 美国男子被重..
  • 网易邮箱莫子睿:《非你莫属》招聘多过..
  • 中国电信推广189邮箱绿色账单
  • 最新专题
  • 鸟哥的Linux私房菜之Mail服务器
  • Exchange Server 2010技术专题
  • Windows 7 技术专题
  • Sendmail 邮件系统配置
  • 组建Exchange 2003邮件系统
  • Windows Server 2008 专题
  • ORF 反垃圾邮件系统
  • Exchange Server 2007 专题
  • ISA Server 2006 教程专题
  • Windows Vista 技术专题
  • “黑莓”(BlackBerry)专题
  • Apache James 专题
  • 分类导航
    邮件新闻资讯:
    IT业界 | 邮件服务器 | 邮件趣闻 | 移动电邮
    电子邮箱 | 反垃圾邮件|邮件客户端|网络安全
    行业数据 | 邮件人物 | 网站公告 | 行业法规
    网络技术:
    邮件原理 | 网络协议 | 网络管理 | 传输介质
    线路接入 | 路由接口 | 邮件存储 | 华为3Com
    CISCO技术 | 网络与服务器硬件
    操作系统:
    Windows 9X | Linux&Uinx | Windows NT
    Windows Vista | FreeBSD | 其它操作系统
    邮件服务器:
    程序与开发 | Exchange | Qmail | Postfix
    Sendmail | MDaemon | Domino | Foxmail
    KerioMail | JavaMail | Winwebmail |James
    Merak&VisNetic | CMailServer | WinMail
    金笛邮件系统 | 其它 |
    反垃圾邮件:
    综述| 客户端反垃圾邮件|服务器端反垃圾邮件
    邮件客户端软件:
    Outlook | Foxmail | DreamMail| KooMail
    The bat | 雷鸟 | Eudora |Becky! |Pegasus
    IncrediMail |其它
    电子邮箱: 个人邮箱 | 企业邮箱 |Gmail
    移动电子邮件:服务器 | 客户端 | 技术前沿
    邮件网络安全:
    软件漏洞 | 安全知识 | 病毒公告 |防火墙
    攻防技术 | 病毒查杀| ISA | 数字签名
    邮件营销:
    Email营销 | 网络营销 | 营销技巧 |营销案例
    邮件人才:招聘 | 职场 | 培训 | 指南 | 职场
    解决方案:
    邮件系统|反垃圾邮件 |安全 |移动电邮 |招标
    产品评测:
    邮件系统 |反垃圾邮件 |邮箱 |安全 |客户端
    广告联系 | 合作联系 | 关于我们 | 联系我们 | 繁體中文
    版权所有:邮件技术资讯网©2003-2010 www.5dmail.net, All Rights Reserved
    www.5Dmail.net Web Team   粤ICP备05009143号