解析C#字符串,表示具有不同大小字段的“固定长度”消息

问题描述 投票:-1回答:2

我有一个固定长度的字符串消息,如下所示:

"\0\0\0j\0\0\0\vT3A1111        2999BOSH                          2100021        399APV                           2100022  "

这条消息是从我读取一个byte []到StringBuilder来构建字符串的。

上面,字符串部分“\0\0\0j\0\0\0\v”应该是LENGTH和ID字段,都是4个字节长。但是,我不知道如何提取这两个值,但我可以看到HEX 0j是106(1 + 1 + 8 + 9 + 30 + 9 + 9 + 30 + 9 = 106总长度)。我不确定为什么“v”不是上面的“0v”,但我知道它应该是代表消息id的HEX值。

前两个长度为4的字段是HEX,其他都是ASCII。

这不是EDI消息(因此不能使用EDI解析器库),并且与具有某种字段标识符的EDI消息不同,我只有字节流,我只知道字段的长度。这些领域是:

4  byte long message length      ("\0\0\0j")
4  byte long message id          ("\0\0\0\v")
1  byte long message type        ("T")
1  byte long message sequence    ("3")
8  byte long car Id              ("A1111   ")  
9  byte long part-1 price        ("     2999")
30 byte long part-1 manufacturer ("BOSH                          ")
9  byte long part#               ("2100021  ")
9  byte long part-2 price        ("      399")
30 byte long part-2 manufacturer ("APV                           ")
9  byte long part#               ("2100022  ")

所以,上面我有两个制造商制造的2个零件,但在实例中,它可能比2个零件更多:

Part 1, 29.99, made by Bosh, part# 2100021
Part 2, 3.99, made by APV, part# 2100022

我想将这个平面文件字符串中的所有价格和制造商字段放入Part对象的List对象中

class Part
{
   public decimal Price {get; set}
   public string Manufacturer {get; set;}
   public string PartNumber {get; set;}
}

因此,我的清单将包含所有零件及其价格和制造商。

由于我有每个字段的长度,我知道我可以遍历此字符串并获取与部分相关的数据。但是,我想知道是否有更优雅,更简单的方法来做到这一点。

或者甚至更好,是否有一个开源库允许我解析这样的东西?

我使用此方法收到此消息

private TcpClient clientSocket;
private NetworkStream serverStream;

private async System.Threading.Tasks.Task ReadResponseAsync()
{
    if (serverStream.CanRead)
    {
        byte[] readBuffer = new byte[1024];
        StringBuilder receivedMessage = new StringBuilder();
        int readSoFar = 0;

        do
        {
            readSoFar = await serverStream.ReadAsync(readBuffer, 0, readBuffer.Length);
            receivedMessage.AppendFormat("{0}", Encoding.ASCII.GetString(readBuffer, 0, readSoFar));
        } 
        while (serverStream.DataAvailable);

        string msg = receivedMessage.ToString();
    }
    else
    {
        Log("Error", "Cannot read from NetworkStream");
    }
}

@Enigmativity - 我尝试发布你的答案并在LinqPad中运行它(从未使用它,只是下载并安装它)但我没有看到你在答案中发布的类似表格的结构。你怎么做到的?

这是我得到的enter image description here

c# string-parsing edi fixed-length-record
2个回答
0
投票

你说“byte []到StringBuilder来构建字符串”,所以我认为你有一个字符串。也许尝试使用SubString(..),类似于:

var length = int.Parse(message.SubString(0,4);
var id = int.Parse(message.SubString(4,4);

等等

编辑:如果有不需要的填充字符尝试

message.Replace('-', ' ');

不优雅,但它会起作用。


1
投票

也许尝试这样的事情:

void Main()
{
    var line = "00580011T3A1111        2999Bosh                                399APV                                2399MAG                           ";

    var lengths = new[] { 4, 4, 1, 1, 8, 9, 30, 9, 30, 9, 30 };
    var starts = lengths.Aggregate(new[] { 0 }.ToList(), (a, x) => { a.Add(a.Last() + x); return a; });

    var fields = starts.Zip(lengths, (p, l) => line.Substring(p, l).Trim()).ToArray();

    var message = new
    {
        message_length = int.Parse(fields[0]),
        message_id = int.Parse(fields[1]),
        message_type = fields[2],
        message_sequence = int.Parse(fields[3]),
        car_Id = fields[4],
        parts =
            Enumerable
                .Range(0, 3)
                .Select(x => x * 2 + 5)
                .Select(x => new Part
                {
                    Price = decimal.Parse(fields[x]),
                    Manufacturer = fields[x + 1]
                }).ToArray(),
    };
}

public class Part
{
    public decimal Price { get; set; }
    public string Manufacturer { get; set; }
}

在我使用的样本数据(我必须修复它,因为它似乎在您的问题中被破坏,即使我删除|并用空格替换-),我得到这个结果:

message

© www.soinside.com 2019 - 2024. All rights reserved.