我想用python或Java将文本文件转换为xml文件,
我的文字:
“咖啡馆是一个地方,咖啡馆有地址和营业时间”
我的目标是生成一个文件xml描述文本中的所有实体
您需要更加具体地了解xml的目标,以便为您的问题提供最佳帮助。您可以通过多种方式对其进行解释,并留下许多可能的解决方案。
无论出于何种目的,您都在寻找答案,文本在.txt文件中的结构方式非常重要。如果它的结构像一个句子(就像你的例子中那样),那么为它编写一个通用代码就很难了。如果它类似于这样的东西,或者你可以用这样的方式准备.txt文件:
1:
Make········Model····Year····Mileage
2:
BMW·········R1150RS··2004····14274··
3:
Kawasaki····GPz1100··1996····60234··
然后它实际上会相当容易。转换格式通常是调整数据结构的问题。以上示例我从Quora上的以下问题中获取。我相信这个链接对你的事业非常有帮助!
Wall of text on .txt to .xml on quora
祝你好运!
加斯帕
编辑:作为对您的评论的反应。实际上字符串很难转换成表格,除非字符串总是包含某些特征。 “咖啡馆是一个地方,咖啡馆有地址,营业时间”确实非常普遍。如果下一句话是:“游泳池是一个地方,游泳池有一个地址和营业时间”。您可以编写一个子字符串函数(http://www.xsltfunctions.com/xsl/fn_substring.html,用于xslt中的子字符串),它接受一个句子并删除它在字符串中重复出现的实体之后出现的可用信息。但是,最好使用上面的示例,并以比逗号分隔文件更容易转换的方式格式化.txt数据。
Cafe, Pool, Library, School, Gym, Work,
Place, Adress, Opening Hours,