Java 正则表达式教程展示了如何使用正则表达式解析 Java 中的文本。
正则表达式用于文本搜索和更高级的文本操作。 正则表达式内置在包括 grep 和 sed 的工具,包括 vi 和 emacs 的文本编辑器,包括 Perl,Java 和 C# 的编程语言中。
Java 具有用于处理正则表达式的内置 API。 它位于中。
正则表达式定义字符串的搜索模式。 是正则表达式的编译表示。 是一种引擎,可解释模式并针对输入字符串执行匹配操作。 匹配器具有诸如,和之类的方法来执行匹配操作。 如果存在解析正则表达式的异常,则 Java 会抛出。
下表显示了几个正则表达式字符串。
在第一个示例中,我们将单词匹配单词列表。
在示例中,列表中有五个单词。 我们检查哪些单词与正则表达式匹配。
我们编译模式。 点(。)元字符代表文本中的任何单个字符。
我们浏览一下单词表。 使用方法创建一个匹配器。 如果单词与正则表达式匹配,则方法返回 true。
这是输出。
锚点匹配给定文本内字符的位置。 在下一个示例中,我们查看字符串是否位于句子的开头。
我们有三个句子。 搜索模式为。 该模式检查“ Jane”字符串是否位于文本的开头。 会在句子结尾处查找“ Jane”。
交替运算符| 可以创建具有多种选择的正则表达式。
列表中有 9 个名字。
此正则表达式查找“ Jane”,“ Beky”或“ Robert”字符串。
捕获组技术是一种将多个字符视为一个单元的方法。 通过将字符放置在一组圆括号内来创建它们。 例如,(book)是包含’b’,’o’,’o’,’k’,字符的单个组。
捕获组技术使我们能够找出字符串中与常规模式匹配的那些部分。 Mather 的方法返回在先前的匹配操作期间给定组捕获的输入子序列。
本示例通过捕获一组字符来打印提供的字符串中的所有 HTML 标签。
This is the output.
可以用和方法替换字符串。 该方法返回修改后的字符串。
该示例读取网页的 HTML 数据,并使用正则表达式剥离其 HTML 标签。
此模式定义与 HTML 标签匹配的正则表达式。
我们使用方法删除所有标签。
可以使用 方法分割文本。
我们从文件中读取。
这些示例从 CSV 文件读取值并计算它们的总和。 它使用正则表达式读取数据。
一次拍摄,我们用将所有数据读入字符串列表。
正则表达式是逗号字符。
我们遍历行,并使用将它们拆分为字符串数组。 我们用分隔空格并计算总和值。
通过设置标志,我们可以实现不区分大小写的匹配。
该示例对正则表达式执行不区分大小写的匹配。
通过将作为第二个参数设置为来设置不区分大小写的匹配。
子模式是模式中的模式。 子模式使用字符创建。
该示例创建一个子模式。
正则表达式使用子模式。 它与书呆子,书签,簿记员和书本单词匹配。
在以下示例中,我们创建一个用于检查电子邮件地址的正则表达式模式。
本示例仅提供一种可能的解决方案。
前和后个字符提供精确的模式匹配。 模式前后不允许有字符。 电子邮件分为五个部分。 第一部分是本地部分。 这通常是公司,个人或昵称的名称。 列出了所有可能的字符,我们可以在本地使用。 它们可以使用一次或多次。
第二部分由文字字符组成。 第三部分是领域部分。 通常是电子邮件提供商的域名,例如 yahoo 或 gmail。 是一个字符集,提供了可在域名中使用的所有字符。 量词使用这些字符中的一个或多个。
第四部分是点字符。 它前面有转义字符()。 这是因为点字符是一个元字符,并且具有特殊含义。 通过转义,我们得到一个文字点。
最后一部分是顶级域:。 顶级域可以包含 2 到 18 个字符,例如 sk,net,信息,旅行,清洁,旅行保险。 最大长度可以为 63 个字符,但是今天大多数域都少于 18 个字符。 还有一个点字符。 这是因为某些顶级域包含两个部分: 例如 co.uk。
版权声明:
本文来源网络,所有图片文章版权属于原作者,如有侵权,联系删除。
本文网址:https://www.bianchenghao6.com/java-jiao-cheng/7165.html