我有一个
test.csv
,我可以逐行读取并确定每行有多少字节。
这应该是 37 个字节以下,因为我在 Windows 上,前两行有
\r\n
总共添加了 4 个字节。
foo,bar,baz
100,200,300
400,500,600
我想简单地使用
csv.NewReader()
确定每行中有多少字节。但是,我知道在下面的代码中进行字节计数时,csv.Reader 不会计算每行中的逗号和\n
。
我是否应该为每行中的逗号数量+行数添加一些数学运算,为
\r\n
-1 最后一行添加 2 个字节,因为它没有
?这感觉有点老套,所以我宁愿看看是否有更好的解决方案来解决我的字节计数问题。
我的代码:
package main
import (
"encoding/csv"
"fmt"
"io"
"log"
"os"
)
func main() {
file, err := os.Open("test.csv")
if err != nil {
log.Fatal(err)
}
defer file.Close()
fileInfo, err := file.Stat()
if err != nil {
log.Fatal(err)
}
fmt.Printf("file total bytes is %d\n", fileInfo.Size())
// init reader
reader := csv.NewReader(file)
// extract the header
headers, err := reader.Read()
if err != nil {
log.Fatal(err)
}
fmt.Printf("headers are: %+v\n", headers)
byteCounter := 0
for {
// if we reached end of file, stop
if err == io.EOF {
break
}
// read a record
record, err := reader.Read()
if err != nil {
log.Fatal(err)
}
// loop through each record and count how many bytes
for _, item := range record {
byteCounter += len(item)
fmt.Printf("record is %d bytes\n", len(item))
}
fmt.Println("total bytes so far is: ", byteCounter)
}
}
使用 Reader.InputOffset 获取文件中的当前位置:
fmt.Println("total bytes so far is: ", reader.InputOffset())
https://go.dev/play/p/cgqq9woK02w
要获取每行的字节数,请从之前的偏移量中减去。
prevOffset := reader.InputOffset()
for {
...
// read a record
_, err := reader.Read()
...
fmt.Println("line length is: ", reader.InputOffset()-prevOffset)
prevOffset = reader.InputOffset()
}