字符串基础
定义
字符集
一个 字符集 \(\Sigma\) 是一个建立了全序关系的集合,也就是说,\(\Sigma\) 中的任意两个不同的元素 \(\alpha\) 和 \(\beta\) 都可以比较大小,要么 \(\alpha<\beta\),要么 \(\beta<\alpha\)。字符集 \(\Sigma\) 中的元素称为字符。
字符串
一个 字符串 \(S\) 是将 \(n\) 个字符顺次排列形成的序列,\(n\) 称为 \(S\) 的长度,表示为 \(|S|\)。
如果字符串下标从 \(1\) 开始计算,\(S\) 的第 \(i\) 个字符表示为 \(S[i]\);
如果字符串下标从 \(0\) 开始计算,\(S\) 的第 \(i\) 个字符表示为 \(S[i-1]\)。
子串
字符串 \(S\) 的 子串 \(S[i..j],i≤j\),表示 \(S\) 串中从 \(i\) 到 \(j\) 这一段,也就是顺次排列 \(S[i],S[i+1],\ldots,S[j]\) 形成的字符串。
有时也会用 \(S[i..j]\),\(i>j\) 来表示空串。
子序列
字符串 \(S\) 的 子序列 是从 \(S\) 中将若干元素提取出来并不改变相对位置形成的序列,即 \(S[p_1],S[p_2],\ldots,S[p_k]\),\(1\le p_1< p_2<\cdots< p_k\le|S|\)。
后缀
后缀 是指从某个位置 \(i\) 开始到整个串末尾结束的一个特殊子串。字符串 \(S\) 的从 \(i\) 开头的后缀表示为 \(\textit{Suffix(S,i)}\),也就是 \(\textit{Suffix(S,i)}=S[i..|S|-1]\)。
真后缀 指除了 \(S\) 本身的 \(S\) 的后缀。
举例来说,字符串 abcabcd
的所有后缀为 {d, cd, bcd, abcd, cabcd, bcabcd, abcabcd}
,而它的真后缀为 {d, cd, bcd, abcd, cabcd, bcabcd}
。
前缀
前缀 是指从串首开始到某个位置 \(i\) 结束的一个特殊子串。字符串 \(S\) 的以 \(i\) 结尾的前缀表示为 \(\textit{Prefix(S,i)}\),也就是 \(\textit{Prefix(S,i)}=S[0..i]\)。
真前缀 指除了 \(S\) 本身的 \(S\) 的前缀。
举例来说,字符串 abcabcd
的所有前缀为 {a, ab, abc, abca, abcab, abcabc, abcabcd}
, 而它的真前缀为 {a, ab, abc, abca, abcab, abcabc}
。
字典序
以第 \(i\) 个字符作为第 \(i\) 关键字进行大小比较,空字符小于字符集内任何字符(即:\(a< aa\))。
回文串
回文串 是正着写和倒着写相同的字符串,即满足 \(\forall 1\le i\le|s|, s[i]=s[|s|+1-i]\) 的 \(s\)。
字符串的存储
- 使用
char
数组存储,用空字符\0
表示字符串的结尾(C 风格字符串)。 - 使用 C++ 标准库提供的
string
类。 - 字符串常量可以用字符串字面量(用双引号括起来的字符串)表示。
参考资料与注释
本页面的全部内容在 小熊老师 - 莆田青少年编程俱乐部 0594codes.cn 协议之条款下提供,附加条款亦可能应用