-
Notifications
You must be signed in to change notification settings - Fork 2.3k
Expand file tree
/
Copy pathbuilder-buffer.md
More file actions
269 lines (199 loc) · 12.8 KB
/
builder-buffer.md
File metadata and controls
269 lines (199 loc) · 12.8 KB
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
---
title: 聊聊 Java StringBuilder和StringBuffer 两兄弟
shortTitle: StringBuilder和StringBuffer
category:
- Java核心
tag:
- 数组&字符串
description: 在本文中,我们将详细探讨 Java 中 String、StringBuilder 和 StringBuffer 的差异和使用场景。学习如何根据实际需求选择正确的字符串处理类,了解它们在性能、线程安全和内存开销方面的优缺点。本文还将解析它们的内部实现,帮助你更好地理解 Java 字符串处理的原理和最佳实践。
head:
- - meta
- name: keywords
content: Java,String,StringBuilder,StringBuffer
---
“哥,[上一篇深入理解 String.intern()](https://javabetter.cn/string/intern.html) 讲到了 StringBuilder,这一节我们就来聊聊吧!”三妹很期待。
“好啊,它们之间的关系还真的是挺和谐的。”看着三妹好奇的样子,我感到学技术就应该是这个样子才对。
### StringBuffer和StringBuilder的区别
由于[字符串是不可变的](https://javabetter.cn/string/immutable.html),所以当遇到[字符串拼接](https://javabetter.cn/string/join.html)(尤其是使用`+`号操作符)的时候,就需要考量性能的问题,你不能毫无顾虑地生产太多 String 对象,对珍贵的内存造成不必要的压力。
于是 Java 就设计了一个专门用来解决此问题的 StringBuffer 类。
```java
public final class StringBuffer extends AbstractStringBuilder implements Serializable, CharSequence {
public StringBuffer() {
super(16);
}
public synchronized StringBuffer append(String str) {
super.append(str);
return this;
}
public synchronized String toString() {
return new String(value, 0, count);
}
// 其他方法
}
```
不过,由于 StringBuffer 操作字符串的方法加了 [`synchronized` 关键字](https://javabetter.cn/thread/synchronized-1.html)进行了同步,主要是考虑到多线程环境下的安全问题,所以如果在非多线程环境下,执行效率就会比较低,因为加了没必要的锁。
于是 Java 就给 StringBuffer “生了个兄弟”,名叫 StringBuilder,说,“孩子,你别管线程安全了,你就在单线程环境下使用,这样效率会高得多,如果要在多线程环境下修改字符串,你到时候可以使用 [`ThreadLocal`](https://javabetter.cn/thread/ThreadLocal.html) 来避免多线程冲突。”
```java
public final class StringBuilder extends AbstractStringBuilder
implements java.io.Serializable, CharSequence
{
// ...
public StringBuilder append(String str) {
super.append(str);
return this;
}
public String toString() {
// Create a copy, don't share the array
return new String(value, 0, count);
}
// ...
}
```
除了类名不同,方法没有加 synchronized,基本上完全一样。
实际开发中,StringBuilder 的使用频率也是远高于 StringBuffer,甚至可以这么说,StringBuilder 完全取代了 StringBuffer。
### StringBuilder的使用
[之前我们也曾聊过](https://javabetter.cn/overview/what-is-java.html),Java 是一门解释型的编程语言,所以当编译器遇到 `+` 号这个操作符的时候,会将 `new String("二哥") + new String("三妹")` 这行代码解释为以下代码:
```java
new StringBuilder().append("二哥").append("三妹").toString();
```
这个过程是我们看不见的,但这正是 Java 的“智能”之处,它可以在编译的时候偷偷地帮我们做很多优化,这样既可以提高我们的开发效率(`+` 号写起来比创建 StringBuilder 对象便捷得多),也不会影响 JVM 的执行效率。
当然了,如果我们使用 [javap](https://javabetter.cn/jvm/bytecode.html) 反编译 `new String("二哥") + new String("三妹")` 的字节码的时候,也是能看出 StringBuilder 的影子的。
>[javap 和字节码](https://javabetter.cn/jvm/bytecode.html)会在后面讲 JVM 的时候详细讲解,戳链接了解详情。
```
0: new #2 // class java/lang/StringBuilder
3: dup
4: invokespecial #3 // Method java/lang/StringBuilder."<init>":()V
7: new #4 // class java/lang/String
10: dup
11: ldc #5 // String 二哥
13: invokespecial #6 // Method java/lang/String."<init>":(Ljava/lang/String;)V
16: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
19: new #4 // class java/lang/String
22: dup
23: ldc #8 // String 三妹
25: invokespecial #6 // Method java/lang/String."<init>":(Ljava/lang/String;)V
28: invokevirtual #7 // Method java/lang/StringBuilder.append:(Ljava/lang/String;)Ljava/lang/StringBuilder;
31: invokevirtual #9 // Method java/lang/StringBuilder.toString:()Ljava/lang/String;
34: areturn
```
可以看到 Java 编译器将字符串拼接操作(`+`)转换为了 StringBuilder 对象的 append 方法,然后再调用 StringBuilder 对象的 toString 方法返回拼接后的字符串。
### StringBuilder的内部实现
来看一下 StringBuilder 的 toString 方法:
```java
public String toString() {
return new String(value, 0, count);
}
```
value 是一个 char 类型的[数组](https://javabetter.cn/array/array.html):
```java
/**
* The value is used for character storage.
*/
char[] value;
```
在 StringBuilder 对象创建时,会为 value 分配一定的内存空间(初始容量 16),用于存储字符串。
```java
/**
* Constructs a string builder with no characters in it and an
* initial capacity of 16 characters.
*/
public StringBuilder() {
super(16);
}
```
随着字符串的拼接,value 数组的长度会不断增加,因此在 StringBuilder 对象的实现中,value 数组的长度是可以[动态扩展的,就像ArrayList那样](https://javabetter.cn/collection/arraylist.html)。
继续来看 StringBuilder 的 toString 方法:
```java
public String toString() {
return new String(value, 0, count);
}
```
value 用于存储 StringBuilder 对象中包含的字符序列。count 是一个 int 类型的变量,表示字符序列的长度。toString() 方法会调用 `new String(value, 0, count)`,使用 value 数组中从 0 开始的前 count 个元素创建一个新的字符串对象,并将其返回。
再来看一下 append 方法:
```java
public StringBuilder append(String str) {
super.append(str);
return this;
}
```
实际上是调用了 AbstractStringBuilder 中的 `append(String str)` 方法。在 AbstractStringBuilder 中,`append(String str)` 方法会检查当前字符序列中的字符是否够用,如果不够用则会进行扩容,并将指定字符串追加到字符序列的末尾。
```java
public AbstractStringBuilder append(String str) {
if (str == null)
return appendNull();
int len = str.length();
ensureCapacityInternal(count + len);
str.getChars(0, len, value, count);
count += len;
return this;
}
```
`append(String str)` 方法将指定字符串追加到当前字符序列中。如果指定字符串为 null,则追加字符串 "null";否则会检查指定字符串的长度,然后根据当前字符序列中的字符数和指定字符串的长度来判断是否需要扩容。
如果需要扩容,则会调用 `ensureCapacityInternal(int minimumCapacity) `方法。扩容之后,将指定字符串的字符拷贝到字符序列中。
来看一下 ensureCapacityInternal 方法:
```java
private void ensureCapacityInternal(int minimumCapacity) {
// 不够用了,扩容
if (minimumCapacity - value.length > 0)
expandCapacity(minimumCapacity);
}
void expandCapacity(int minimumCapacity) {
// 扩容策略:新容量为旧容量的两倍加上 2
int newCapacity = value.length * 2 + 2;
// 如果新容量小于指定的最小容量,则新容量为指定的最小容量
if (newCapacity - minimumCapacity < 0)
newCapacity = minimumCapacity;
// 如果新容量小于 0,则新容量为 Integer.MAX_VALUE
if (newCapacity < 0) {
if (minimumCapacity < 0) // overflow
throw new OutOfMemoryError();
newCapacity = Integer.MAX_VALUE;
}
// 将字符序列的容量扩容到新容量的大小
value = Arrays.copyOf(value, newCapacity);
}
```
`ensureCapacityInternal(int minimumCapacity)` 方法用于确保当前字符序列的容量至少等于指定的最小容量 minimumCapacity。如果当前容量小于指定的容量,就会为字符序列分配一个新的内部数组。新容量的计算方式如下:
- 如果指定的最小容量大于当前容量,则新容量为两倍的旧容量加上 2。为什么要加 2 呢?对于非常小的字符串(比如空的或只有一个字符的 StringBuilder),仅仅将容量加倍可能仍然不足以容纳更多的字符。在这种情况下,+ 2 提供了一个最小的增长量,确保即使对于很小的初始容量,扩容后也能至少添加一些字符而不需要立即再次扩容。
- 如果指定的最小容量小于等于当前容量,则不会进行扩容,直接返回当前对象。
在进行扩容之前,`ensureCapacityInternal(int minimumCapacity)` 方法会先检查当前字符序列的容量是否足够,如果不足就会调用 `expandCapacity(int minimumCapacity)` 方法进行扩容。`expandCapacity(int minimumCapacity)` 方法首先计算出新容量,然后使用 `Arrays.copyOf(char[] original, int newLength)` 方法将原字符数组扩容到新容量的大小。
> - [Arrays](https://javabetter.cn/common-tool/arrays.html) 是 Java 中用于操作数组的工具类,后面也会讲到。
> - 关于扩容,后面在讲[ArrayList](https://javabetter.cn/collection/arraylist.html)的时候会再次说明,到时候你可以回头对比来看一下,因为 ArrayList 底部实现也是数组。
### StringBuilder的 reverse 方法
StringBuilder 还提供了一个 reverse 方法,用于反转当前字符序列中的字符。
```java
public StringBuilder reverse() {
super.reverse();
return this;
}
```
也是调用了父类 AbstractStringBuilder 中的 `reverse()` 方法,我把一些非核心代码剔除掉了。
```java
public AbstractStringBuilder reverse() {
int n = count - 1; // 字符序列的最后一个字符的索引
// 遍历字符串的前半部分
for (int j = (n-1) >> 1; j >= 0; j--) {
int k = n - j; // 计算相对于 j 对称的字符的索引
char cj = value[j]; // 获取当前位置的字符
char ck = value[k]; // 获取对称位置的字符
value[j] = ck; // 交换字符
value[k] = cj; // 交换字符
}
return this; // 返回反转后的字符串构建器对象
}
```
1. **初始化**: `n` 是字符串中最后一个字符的索引。
2. **字符串反转**:
- 方法通过一个 `for` 循环遍历字符串的前半部分和后半部分,这是一个非常巧妙的点,比从头到尾遍历省了一半的时间。`(n-1) >> 1` 是 `(n-1) / 2` 的位运算表示,也就是字符串的前半部分的最后一个字符的索引。
- 在每次迭代中,计算出与当前索引 `j` 对称的索引 `k`,并交换这两个索引位置的字符。
LeetCode 的第 7 题《[007.整数反转](https://leetcode-cn.com/problems/reverse-integer/)》要求我们反转一个整数,其实就可以借助 StringBuilder 的 reverse 方法来实现。
>题解放在了[技术派](https://paicoding.com/column/7/7)上,可以参考。
### 小结
“我想,关于 StringBuilder、StringBuilder 之间的差别,你都搞清楚了吧?”我问。
“搞清楚的话,可以通过 LeetCode 的第六题《006.Z 字形变换》进行测试,我把题解放在了[技术派](https://paicoding.com/column/7/6)上,你可以作为参考。”
“哥,你真棒!区别我是搞清楚了,你后面讲的源码扩容还没消化,我一会去加个餐,再细看一下。”三妹说。
“可以的,实际上,你现在只需要知道 StringBuilder 的用法就可以了。”喝了一口右手边的可口可乐(无糖)后,我感觉好爽快啊。
---
GitHub 上标星 10000+ 的开源知识库《[二哥的 Java 进阶之路](https://github.com/itwanger/toBeBetterJavaer)》第一版 PDF 终于来了!包括Java基础语法、数组&字符串、OOP、集合框架、Java IO、异常处理、Java 新特性、网络编程、NIO、并发编程、JVM等等,共计 32 万余字,500+张手绘图,可以说是通俗易懂、风趣幽默……详情戳:[太赞了,GitHub 上标星 10000+ 的 Java 教程](https://javabetter.cn/overview/)
微信搜 **沉默王二** 或扫描下方二维码关注二哥的原创公众号沉默王二,回复 **222** 即可免费领取。
