Golang截取字符串方法示例讲解及对比
作者:raoxiaoya
1、使用 rune
func BenchmarkSubstr1(b *testing.B) { s := "bench基准测试,1212" for i := 0; i < b.N; i++ { s1 := []rune(s) s2 := s1[1:6] _ = string(s2) } }
2、使用utf包
在中英文混合字符串中,如果能知道每个字符占几个字节,我们也可以实现截取,于是我们可以从 utf8 编码的格式入手,实际上计算机能够识别出这些字节也是基于既定的编码格式,utf8.DecodeRuneInString()
方法也是依据这个原理,此方法会从输入的字符串开头处逐个字节读取,直到满足一个 utf8 字符。
func DecodeRuneInString(s string) (r rune, size int)
返回一个 rune 类型,以及此字符占用几个字节。
func BenchmarkSubstr2(b *testing.B) { s := "bench基准测试,1212" st := 1 en := 6 for i := 0; i < b.N; i++ { var start, end int var c int for i := 0; i <= en && c < len(s); i++ { _, size := utf8.DecodeRuneInString(s[c:]) if i == st { start = c } if i == en { end = c } c += size } _ = s[start:end] } }
3、使用range遍历
range
遍历字符串时,默认使用 字符
迭代,也就是 ASCII
和 中文
都算作一个 字符
,比如
func TestSubstr(t *testing.T) { s := "bench基准测试,1212" for k, v := range s { fmt.Println(k, string(v)) } }
打印输出
0 b
1 e
2 n
3 c
4 h
5 基
8 准
11 测
14 试
17 ,
20 1
21 2
22 1
23 2
可见 range 默认就支持 unicode,因此变量 k 不是连续的,找到 k 即可。
func TestSubstr(t *testing.T) { s := "bench基准测试,1212" var start, end int var c int for k := range s { if c == 1 { start = k } if c == 6 { end = k } c++ } fmt.Println(s[start:end]) // ench基 }
func BenchmarkSubstr3(b *testing.B) { s := "bench基准测试,1212" for i := 0; i < b.N; i++ { var start, end int var c int for k := range s { if c == 1 { start = k } if c == 6 { end = k } c++ } _ = s[start:end] } }
> go test -bench=BenchmarkSubstr -benchtime=100000x -benchmem
goos: windows
goarch: amd64
pkg: test
cpu: Intel(R) Core(TM) i7-4790 CPU @ 3.60GHz
BenchmarkSubstr1-8 100000 107.5 ns/op 0 B/op 0 allocs/op
BenchmarkSubstr2-8 100000 37.74 ns/op 0 B/op 0 allocs/op
BenchmarkSubstr3-8 100000 37.72 ns/op 0 B/op 0 allocs/op
到此这篇关于Golang截取字符串方法示例讲解及对比的文章就介绍到这了,更多相关Go截取字符串内容请搜索脚本之家以前的文章或继续浏览下面的相关文章希望大家以后多多支持脚本之家!