循环遍历字符串返回int32

问题描述 投票:0回答:1

为什么一个字符串的范围返回int32值而不是其他语言的原始字符?

例如:

func main() {

    var s string
    s = "Hello"
    for _, v := range s {
        fmt.Println(v)
    }

}

返回:

72
101
108
108
111

我们应该使用如下所示的转换来获取原始字符吗?

func main() {

    var s string
    s = "Hello"
    for _, v := range s {
        fmt.Println(string(v))
    }

}
loops go range
1个回答
7
投票

The Go Programming Language Specification

For statements

对于带有范围子句的语句

对于字符串值,“range”子句迭代从字节索引0开始的字符串中的Unicode代码点。在连续迭代中,索引值将是连续UTF-8编码的代码点的第一个字节的索引。字符串和rune类型的第二个值将是相应代码点的值。如果迭代遇到无效的UTF-8序列,则第二个值将是0xFFFD,即Unicode替换字符,下一次迭代将在字符串中前进一个字节。


在Go中,字符是Unicode代码点,Go类型runeint32的别名)。 Go strings用于存储UTF-8编码形式的Unicode代码点。


The Go Programming Language Specification

Conversions

转换为字符串类型的转换

将有符号或无符号整数值转换为字符串类型会生成包含整数的UTF-8表示形式的字符串。超出有效Unicode代码点范围的值将转换为“\ uFFFD”。

string('a')       // "a"
string(-1)        // "\ufffd" == "\xef\xbf\xbd"
string(0xf8)      // "\u00f8" == "ø" == "\xc3\xb8"
type MyString string
MyString(0x65e5)  // "\u65e5" == "日" == "\xe6\x97\xa5"

例如,

package main

import (
    "fmt"
)

func main() {
    helloworld := "Hello, 世界"
    fmt.Println(helloworld)
    for i, r := range helloworld {
        fmt.Println(i, r, string(r))
    }
}

游乐场:https://play.golang.org/p/R5sBeGiJzR4

输出:

Hello, 世界
0 72 H
1 101 e
2 108 l
3 108 l
4 111 o
5 44 ,
6 32  
7 19990 世
10 30028 界

参考文献:

The Go Blog: Strings, bytes, runes and characters in Go

The Unicode Consortium

© www.soinside.com 2019 - 2024. All rights reserved.